TL;DR – 2021 年是文件格式终于跟上 web‑first、mobile‑first 世界的一年:免版税、HDR‑就绪、AI‑友好的标准取代了许多传统编解码器。PDF 2.0 与 DOCX/ODF 主导文档,AVIF/WebP 与 HEIF 主导图像,Opus 接管实时音频,AV1 开始取代 HEVC 用于视频,列式格式如 Parquet + Arrow 成为大数据管道的骨干。


1. 文档与出版 – 两大支柱,一个生态系统

格式2021 状态为什么你应该在意
PDF 2.0 (ISO 32000‑2)成熟,仍是通用的静态文档格式。支持嵌入 3‑D、丰富媒体、数字签名以及改进的可访问性标签。适用于合同、电子书和政府表格。
PDF/A‑3在受监管行业(金融、制药)中增长。允许在 PDF 中捆绑任意文件(XML、CSV 等)用于审计追踪——非常适合附带数据的发票。
DOCX / Office Open XML超过 85 % 的企业文档(Statista 2021)。基于 ZIP 的容器将文本、样式和媒体分离;可通过自定义 XML 部分扩展。适合协作编辑。
ODF (OpenDocument Format)小众,但在许多欧盟公共部门合同中是必需的。完全开放、免版税,对电子表格和公式支持强大。
EPUB 3超过 30 % 的新出版物(Publishers Weekly)。基于 HTML5/CSS3,支持音视频、MathML,以及适用于图形密集书籍的固定布局。
MOBI / AZW3仍是 Kindle 的主力,但正逐步淘汰。专有 DRM,CSS 限制——适用于旧版 Kindle 电子书。

要点: 2021 年巩固了 静态 vs. 可编辑 的划分。PDF 2.0 处理安全、不可更改的分发,而 DOCX/ODF 保持就地编辑的工作流。与此同时,EPUB 3 成为需要在任何屏幕上重新排版的多媒体丰富出版的首选。


2. 图像 – 从 JPEG 到 AVIF、HDR 及更远

格式2021 采用率关键优势
AVIF (AV1 Image File Format)在 Chrome 90+、Firefox 93+、Android 12 中受支持;约 15 % 的主流新闻站点使用。比 WebP 小 50 %,支持 10‑/12‑bit HDR 与透明通道——免版税。
WebP大约 30 % 的前十大网站提供的图像。支持有损与无损、动画,在移动端 GPU 解码快速。
HEIF/HEIC在 iOS 14 上占主导(≈60 % 的 iPhone 照片)。JPEG 压缩率的 2 倍,支持深度图和连拍模式。
JPEG XL早期采用者浏览器(Chrome/Firefox Nightly)。同时支持无损与有损,质量相同的 JPEG 可缩小 35 %,支持 HDR 与动画。
PNG仍是无损 UI 资源的默认格式。通用支持,无损透明。
SVG100 % 浏览器支持;图标的事实标准。矢量、可脚本化、可通过 CSS 样式化——文件大小随复杂度而变,而非分辨率。
PSD创意工作流中的必备(约 1‑2 % 的网页图像)。分层、调整图层、智能对象——通过库广泛可读。

转变的意义
有损 vs. 无损 已不再是二元选择。AVIF 提供的有损压缩可与 JPEG 相媲美,同时还提供用于归档的无损模式。HDR 与宽色域(10‑/12‑bit)已成为现代显示器的基线要求,AVIF 与 HEIF 在不带 JPEG‑XR 或专有格式许可负担的情况下实现了这一点。


3. 音频与视频 – 免版税的浪潮

音频

格式2021 市场份额为什么它在赢
AAC大约 55 % 的流媒体(Spotify、Apple Music)。在相同比特率下比 MP3 质量更好;设备支持普遍。
Opus增长迅速;WebRTC、Discord、众多播客的默认。语音‑音乐混合编解码器,6 kbps‑510 kbps,低延迟,自适应比特率——在低比特率下提供比 AAC 更高的感知质量。
FLAC大约 12 % 的高保真流媒体(Tidal HiFi、Amazon Music HD)。真正无损,元数据丰富,解码快速。
MP3仍占超过 30 % 的旧库,但在下降。普及率高,但最高 320 kbps 且不支持环绕声。
ALACApple 生态系统的主要选择。无损,原生 iOS/macOS 支持。

关键点: 2021 年 Opus 成为浏览器中实时通信的 标准(Chrome 89+、Firefox 86+)。其声学模型在 64 kbps 时即可提供“录音棚级”音质,对低带宽视频通话和播客是游戏规则的改变者。

视频

格式2021 使用情况为什么它重要
AV1大约 10 % 的 YouTube 流(首次大规模部署)。免版税,压缩效率比 HEVC 高 30‑50 %,在 Intel Xe、Nvidia RTX 30、Apple A14 上实现硬件解码。
HEVC (H.265)在 4K/8K OTT(Netflix、Prime)中仍占主导。专利保护,压缩优秀,但许可费用限制了其在网页上的采用。
H.264/AVC超过 80 % 的所有视频流量。硬件加速普遍;“最低公共分母”。
VP9YouTube 在 4K 中使用(约 30 % 的 4K 流)。开源、免版税,正被 AV1 超越。
WebM (VP9/AV1 + Opus)Chrome/Firefox 上 HTML5 视频的默认。容器避免了许可麻烦。

AV1 的意义——它是首个能够在主流移动 SoC 上实时解码的免版税编解码器,且在 4K HDR 内容上始终优于 HEVC。这也是 Google、Netflix 以及 Microsoft 投资其作为下一代流媒体标准的原因。


4. 数据、归档与压缩 – 速度、体积与安全

类别2021 流行格式亮点
文档容器PDF 2.0DOCXODF加密(AES‑256)、数字签名、长期验证。
图像容器AVIFWebPHEIFHDR、透明通道、无损‑有损双模式。
音频容器MP4 (AAC)Ogg (Opus)FLAC适合流媒体的包装(HLS/DASH)。
视频容器MP4 (AV1/HEVC)WebM (AV1)自适应流媒体,支持 DRM。
归档与压缩ZIP7ztar.xzZstandard (zstd)Brotli7z/LZMA2 追求最高压缩率;zstd 用于快速云端压缩;Brotli 用于 HTTP 文本资源。
大数据交换ParquetApache ArrowJSON‑LDCSV列式存储 + 字典编码将 1 TB 表从约 300 GB(CSV)压缩至约 45 GB(Parquet)。Arrow 实现 Python、Java、Rust 之间的零拷贝共享。

实用技巧: 对于在服务之间迁移数据的工作流(例如 ETL 管道),将 真相来源 存储为加密的 Parquet(Parquet 1.12,2021),并使用 Arrow 进行内存分析。对网页资产,使用 Brotli 对 HTML/CSS/JS 进行压缩,并以 AVIF 或 WebP 提供图像,可显著降低带宽消耗。


5. 新兴与小众格式值得关注

  • JPEG XL – 仍属实验阶段,但承诺在同一文件中提供无损与有损以及动画。
  • HEIC/HEIF – 已是 iOS 14 的默认,预计 Android 将跟进。
  • GLTF 2.0 – “3‑D 的 JPEG”,现已成为基于 Web 的 AR/VR 与游戏资产交换的标准。
  • USD (Universal Scene Description) – 被 Pixar 采用,正在进入 Unity 预览管线;适用于复杂、分层的场景。
  • Zstandard – 快速、可调的压缩,在容器镜像(Docker)和 Linux 包管理器中获得关注。
  • PDF 2.0 – 新的数字签名和可访问性特性使其成为安全、合规 PDF 的首选。

对你的 2021(及以后)工作流的快速要点

  1. 网页图像: 首先提供 AVIF,回退到 WebP,再到 JPEG。可期待 30‑50 % 的带宽下降。
  2. 音频流媒体: 对实时或播客内容使用 Opus;对传统音乐库保留 AAC。
  3. 视频交付: 开始尝试使用 AV1 编码的 MP4 文件;浏览器已在大多数现代设备上支持解码。
  4. 数据管道: 将原始分析数据存储为 Parquet + Arrow;使用 Zstandard 对中间文件进行快速压缩。
  5. 文档交换: 对需要签名的合同或表单采用 PDF 2.0,对协作草稿使用 DOCX/ODF。

最终思考 – 2021 不仅是一次增量更新的年份;它标志着业界集体宣告“够了,专有、占带宽的格式”。免版税、HDR‑就绪、AI‑友好的标准的崛起意味着更小的文件、更快的加载以及更安全的数据——而无需面对许可谈判的头疼。如果你的工具链与上述格式保持一致,你将为下一波 Web、移动和数据密集型应用做好准备。祝转换愉快!