TL;DR – 2021 年是文件格式终于跟上 web‑first、mobile‑first 世界的一年:免版税、HDR‑就绪、AI‑友好的标准取代了许多传统编解码器。PDF 2.0 与 DOCX/ODF 主导文档,AVIF/WebP 与 HEIF 主导图像,Opus 接管实时音频,AV1 开始取代 HEVC 用于视频,列式格式如 Parquet + Arrow 成为大数据管道的骨干。
1. 文档与出版 – 两大支柱,一个生态系统
| 格式 | 2021 状态 | 为什么你应该在意 |
|---|---|---|
| PDF 2.0 (ISO 32000‑2) | 成熟,仍是通用的静态文档格式。 | 支持嵌入 3‑D、丰富媒体、数字签名以及改进的可访问性标签。适用于合同、电子书和政府表格。 |
| PDF/A‑3 | 在受监管行业(金融、制药)中增长。 | 允许在 PDF 中捆绑任意文件(XML、CSV 等)用于审计追踪——非常适合附带数据的发票。 |
| DOCX / Office Open XML | 超过 85 % 的企业文档(Statista 2021)。 | 基于 ZIP 的容器将文本、样式和媒体分离;可通过自定义 XML 部分扩展。适合协作编辑。 |
| ODF (OpenDocument Format) | 小众,但在许多欧盟公共部门合同中是必需的。 | 完全开放、免版税,对电子表格和公式支持强大。 |
| EPUB 3 | 超过 30 % 的新出版物(Publishers Weekly)。 | 基于 HTML5/CSS3,支持音视频、MathML,以及适用于图形密集书籍的固定布局。 |
| MOBI / AZW3 | 仍是 Kindle 的主力,但正逐步淘汰。 | 专有 DRM,CSS 限制——适用于旧版 Kindle 电子书。 |
要点: 2021 年巩固了 静态 vs. 可编辑 的划分。PDF 2.0 处理安全、不可更改的分发,而 DOCX/ODF 保持就地编辑的工作流。与此同时,EPUB 3 成为需要在任何屏幕上重新排版的多媒体丰富出版的首选。
2. 图像 – 从 JPEG 到 AVIF、HDR 及更远
| 格式 | 2021 采用率 | 关键优势 |
|---|---|---|
| AVIF (AV1 Image File Format) | 在 Chrome 90+、Firefox 93+、Android 12 中受支持;约 15 % 的主流新闻站点使用。 | 比 WebP 小 50 %,支持 10‑/12‑bit HDR 与透明通道——免版税。 |
| WebP | 大约 30 % 的前十大网站提供的图像。 | 支持有损与无损、动画,在移动端 GPU 解码快速。 |
| HEIF/HEIC | 在 iOS 14 上占主导(≈60 % 的 iPhone 照片)。 | JPEG 压缩率的 2 倍,支持深度图和连拍模式。 |
| JPEG XL | 早期采用者浏览器(Chrome/Firefox Nightly)。 | 同时支持无损与有损,质量相同的 JPEG 可缩小 35 %,支持 HDR 与动画。 |
| PNG | 仍是无损 UI 资源的默认格式。 | 通用支持,无损透明。 |
| SVG | 100 % 浏览器支持;图标的事实标准。 | 矢量、可脚本化、可通过 CSS 样式化——文件大小随复杂度而变,而非分辨率。 |
| PSD | 创意工作流中的必备(约 1‑2 % 的网页图像)。 | 分层、调整图层、智能对象——通过库广泛可读。 |
转变的意义
有损 vs. 无损 已不再是二元选择。AVIF 提供的有损压缩可与 JPEG 相媲美,同时还提供用于归档的无损模式。HDR 与宽色域(10‑/12‑bit)已成为现代显示器的基线要求,AVIF 与 HEIF 在不带 JPEG‑XR 或专有格式许可负担的情况下实现了这一点。
3. 音频与视频 – 免版税的浪潮
音频
| 格式 | 2021 市场份额 | 为什么它在赢 |
|---|---|---|
| AAC | 大约 55 % 的流媒体(Spotify、Apple Music)。 | 在相同比特率下比 MP3 质量更好;设备支持普遍。 |
| Opus | 增长迅速;WebRTC、Discord、众多播客的默认。 | 语音‑音乐混合编解码器,6 kbps‑510 kbps,低延迟,自适应比特率——在低比特率下提供比 AAC 更高的感知质量。 |
| FLAC | 大约 12 % 的高保真流媒体(Tidal HiFi、Amazon Music HD)。 | 真正无损,元数据丰富,解码快速。 |
| MP3 | 仍占超过 30 % 的旧库,但在下降。 | 普及率高,但最高 320 kbps 且不支持环绕声。 |
| ALAC | Apple 生态系统的主要选择。 | 无损,原生 iOS/macOS 支持。 |
关键点: 2021 年 Opus 成为浏览器中实时通信的 标准(Chrome 89+、Firefox 86+)。其声学模型在 64 kbps 时即可提供“录音棚级”音质,对低带宽视频通话和播客是游戏规则的改变者。
视频
| 格式 | 2021 使用情况 | 为什么它重要 |
|---|---|---|
| AV1 | 大约 10 % 的 YouTube 流(首次大规模部署)。 | 免版税,压缩效率比 HEVC 高 30‑50 %,在 Intel Xe、Nvidia RTX 30、Apple A14 上实现硬件解码。 |
| HEVC (H.265) | 在 4K/8K OTT(Netflix、Prime)中仍占主导。 | 专利保护,压缩优秀,但许可费用限制了其在网页上的采用。 |
| H.264/AVC | 超过 80 % 的所有视频流量。 | 硬件加速普遍;“最低公共分母”。 |
| VP9 | YouTube 在 4K 中使用(约 30 % 的 4K 流)。 | 开源、免版税,正被 AV1 超越。 |
| WebM (VP9/AV1 + Opus) | Chrome/Firefox 上 HTML5 视频的默认。 | 容器避免了许可麻烦。 |
AV1 的意义——它是首个能够在主流移动 SoC 上实时解码的免版税编解码器,且在 4K HDR 内容上始终优于 HEVC。这也是 Google、Netflix 以及 Microsoft 投资其作为下一代流媒体标准的原因。
4. 数据、归档与压缩 – 速度、体积与安全
| 类别 | 2021 流行格式 | 亮点 |
|---|---|---|
| 文档容器 | PDF 2.0、DOCX、ODF | 加密(AES‑256)、数字签名、长期验证。 |
| 图像容器 | AVIF、WebP、HEIF | HDR、透明通道、无损‑有损双模式。 |
| 音频容器 | MP4 (AAC)、Ogg (Opus)、FLAC | 适合流媒体的包装(HLS/DASH)。 |
| 视频容器 | MP4 (AV1/HEVC)、WebM (AV1) | 自适应流媒体,支持 DRM。 |
| 归档与压缩 | ZIP、7z、tar.xz、Zstandard (zstd)、Brotli | 7z/LZMA2 追求最高压缩率;zstd 用于快速云端压缩;Brotli 用于 HTTP 文本资源。 |
| 大数据交换 | Parquet、Apache Arrow、JSON‑LD、CSV | 列式存储 + 字典编码将 1 TB 表从约 300 GB(CSV)压缩至约 45 GB(Parquet)。Arrow 实现 Python、Java、Rust 之间的零拷贝共享。 |
实用技巧: 对于在服务之间迁移数据的工作流(例如 ETL 管道),将 真相来源 存储为加密的 Parquet(Parquet 1.12,2021),并使用 Arrow 进行内存分析。对网页资产,使用 Brotli 对 HTML/CSS/JS 进行压缩,并以 AVIF 或 WebP 提供图像,可显著降低带宽消耗。
5. 新兴与小众格式值得关注
- JPEG XL – 仍属实验阶段,但承诺在同一文件中提供无损与有损以及动画。
- HEIC/HEIF – 已是 iOS 14 的默认,预计 Android 将跟进。
- GLTF 2.0 – “3‑D 的 JPEG”,现已成为基于 Web 的 AR/VR 与游戏资产交换的标准。
- USD (Universal Scene Description) – 被 Pixar 采用,正在进入 Unity 预览管线;适用于复杂、分层的场景。
- Zstandard – 快速、可调的压缩,在容器镜像(Docker)和 Linux 包管理器中获得关注。
- PDF 2.0 – 新的数字签名和可访问性特性使其成为安全、合规 PDF 的首选。
对你的 2021(及以后)工作流的快速要点
- 网页图像: 首先提供 AVIF,回退到 WebP,再到 JPEG。可期待 30‑50 % 的带宽下降。
- 音频流媒体: 对实时或播客内容使用 Opus;对传统音乐库保留 AAC。
- 视频交付: 开始尝试使用 AV1 编码的 MP4 文件;浏览器已在大多数现代设备上支持解码。
- 数据管道: 将原始分析数据存储为 Parquet + Arrow;使用 Zstandard 对中间文件进行快速压缩。
- 文档交换: 对需要签名的合同或表单采用 PDF 2.0,对协作草稿使用 DOCX/ODF。
最终思考 – 2021 不仅是一次增量更新的年份;它标志着业界集体宣告“够了,专有、占带宽的格式”。免版税、HDR‑就绪、AI‑友好的标准的崛起意味着更小的文件、更快的加载以及更安全的数据——而无需面对许可谈判的头疼。如果你的工具链与上述格式保持一致,你将为下一波 Web、移动和数据密集型应用做好准备。祝转换愉快!