TL;DR

自 2010 年以来,文件格式已从以桌面为中心的专有文件块转变为 开放、云原生且 AI 就绪的容器。最大的变化包括:

  • 云优先存储 – 现在的格式支持流式传输、部分读取以及实时协作(Google Docs,Office 365)。
  • 开放标准势头 – 免版税编解码器(AV1、AVIF、WebP)和数据格式(Parquet、Arrow)占据主导,以避免供应商锁定。
  • 压缩与带宽效率 – HEVC、AV1、JPEG‑XL、Zstandard 和 Brotli 将文件大小降低 30‑60 %,同时保持质量。
  • 元数据、安全性与溯源 – 更丰富的 XMP/EXIF、数字签名和加密容器保护完整性,并满足监管需求。
  • AI 就绪、自描述结构 – TFRecord、Parquet 和 Arrow 让机器无需自定义解析器即可读取数据,推动大数据管道和机器学习工作负载。

为什么过去十年重要

在 2010 年打开文件时,它通常是一个 静态、本地的工件:你打印的 PDF、通过电子邮件发送的 JPEG,或存放在硬盘上的 ZIP。快进到 2024 年,同一个文件可能位于 云存储桶 中,可被数十位用户同时编辑,并携带能够证明创建者的加密签名。这一转变由三大宏观趋势驱动:

趋势对格式的影响实际案例
桌面 → 云原生需要流式读取、部分更新以及协作元数据。Google Docs 将每个文档存储为基于 JSON 的容器,可被多位用户实时编辑。
开源与开放标准格式变为免版税、可互操作且面向未来。AV1 视频编解码器(免版税)现在为 YouTube 的 4K 流媒体提供动力,取代了昂贵的 H.264/HEVC 许可证。
压缩与带宽在 4K/8K 视频、HDR 图像和海量数据集方面实现更高效率。Apple 的 HEIC 照片大小约为 JPEG 的一半,延长了 iPhone 的存储寿命。

这些力量在文档、图像、音频、视频、归档和大数据容器等所有领域产生涟漪,迫使标准组织(ISO、W3C、IETF、AOM)加速迭代。


文档与数据格式:从 PDF 到 Parquet

文档变得 安全、可搜索且多媒体丰富

  • PDF 2.0(ISO 32000‑2,2021) 增强了加密强度、丰富了 XMP 元数据并提升了可访问性。它还引入了用于长期归档并嵌入溯源信息的 PDF/A‑4。
  • Office Open XML(OOXML) 与 Office 365 中的实时协同编辑保持同步,直接在文件包中嵌入云链接资产。
  • OpenDocument Format(ODF) 由于欧盟对开放、免版税标准的要求,在欧洲公共行政部门获得了广泛采用。
  • ePub 3.x 将电子书转变为完整的网页(HTML5、MathML、音频/视频),实现互动教材和有声书。

大数据管道迁移到 自描述、列式容器

  • Parquet 成为 Spark、Hive 和 Presto 的事实存储格式,提供谓词下推和高效压缩。
  • Apache Arrow 引入了语言无关的内存列式布局,实现了 Python、Java 和 Rust 之间的零拷贝数据交换。
  • AvroORC 仍然在流式(Kafka)和 Hive 工作负载中流行,因为它们将模式与数据一起存储,简化了演进。

最终结果是?文档或数据集可以跨云传输,被 AI 索引,并在没有专有锁定的情况下保留完整的审计轨迹。


图像、音频与视频:压缩军备竞赛

图像 – HDR、动画和渐进解码

  • HEIF/HEIC(2015) 利用 HEVC 压缩将 JPEG 文件大小减半,同时支持 16 位深度和 HDR。Apple 在 iOS 11 上将其设为默认,推动生态系统向更宽色域照片发展。
  • AVIF(2020‑2024) 基于 AV1 编解码器,现在相比 JPEG 可实现 50 % 的尺寸缩减,并支持无损和 HDR。Chrome、Firefox 和 Android 均内置原生解码器。
  • JPEG‑XL(2022) 提供无损与有损模式、渐进渲染,并在压缩效率上优于 WebP 和 AVIF,已被 Cloudflare 用于图像交付。
  • WebP 在 1.2 版中加入了动画、无损改进和 ICC 配置文件支持,成为 Chrome 和 Android 上网页图形的首选格式。

音频 – 低延迟和无损流媒体

  • Opus(RFC 6716,2012) 成为 WebRTC、Discord 和 Zoom 的默认编解码器,以低于 64 kbps 的比特率和低于 10 ms 的延迟提供高质量语音。
  • FLAC 随着高端服务(Tidal、Qobuz)增设无损层而重新流行,而 ALAC 在 2011 年被 Apple 开源后成为免版税。
  • 新兴的 MPEG‑H 3D AudioDolby Atmos ADM 正在为可与视频一起流式传输的空间音频文件奠定基础。

视频 – 从 H.264 主导到免版税的 AV1

  • HEVC/H.265(2013) 与 H.264 相比将比特率降低约 50 %,在带宽受限的情况下实现 4K 与 8K 流媒体。
  • VP9(2013)AV1(规格于 2018 年发布,2020 年起投入生产) 提供了免版税的替代方案;AV1 现已在 Intel Xe、Nvidia RTX 40 和 Apple Silicon 上获得硬件加速。
  • HEVC‑SCC(2023) 为远程桌面和云游戏优化了屏幕内容编码,降低了文本和 UI 元素的伪影。
  • 容器融合:ISO‑BMFF(MP4)和 WebM 现在都支持多种编解码器、字幕和 HDR 元数据,简化了自适应比特率流媒体(MPEG‑DASH、HLS)。

总体而言,对 更高压缩率、HDR 和免版税许可 的追求已经重塑了我们在移动网络上能够交付的内容以及设备能够原生解码的能力。


接下来会怎样?AI 嵌入、溯源优先与统一容器

  • AI 就绪格式 – 草案 PDF 3.0(2024)提出嵌入推理图,使得扫描文本可搜索而无需单独的 OCR 流程。
  • 区块链支持的溯源 – 像 IPFS CAR 文件这样的项目嵌入 Merkle 树哈希,实现对科学数据和数字艺术的防篡改分发。
  • 空间音频容器MPEG‑H 3D AudioDolby Atmos ADM 正从广播转向消费级流媒体,需要携带基于对象音频元数据的新文件封装。
  • 统一媒体容器(UMC)概念 – ISO‑BMFF 工作组的讨论旨在创建一种单一容器,可容纳视频、音频、字幕、3D 几何(glTF)和 AR 元数据,减少沉浸式体验中的“格式切换”。
  • 后量子签名 – 早期实验将 Dilithium 或 Falcon 签名嵌入 PDF/A‑4 和 ODF,为经典 RSA/ECDSA 可能受攻击的未来做好准备。

对于开发者和内容创作者来说,结论很明确:现在就选择开放、自描述的格式。它们更易于安全防护、授权成本更低,并且已为将在下个十年主导的 AI 驱动管道做好准备。


快速速查表(一目了然)

领域2010‑20152016‑20202021‑2024
图像JPEG、PNG、早期 WebPHEIF/HEIC、AVIF(测试版)AVIF 1.1、JPEG‑XL、WebP 1.2
视频H.264、VP8、早期 HEVCVP9、AV1(规格),HEVC 主流AV1 广泛、VVC 初期、HEVC‑SCC
音频AAC、MP3、FLACOpus、ALAC 开源、FLAC 增长Opus 1.3、MPEG‑H 3D Audio
文档PDF 1.7、ODF 1.2PDF 2.0、OOXML 2016、EPUB 3PDF 3.0 草案、ODF 1.4、EPUB 4(草案)
归档ZIP、RAR、7zZstandard、Brotli、LZ4Zstd 1.5+、Brotli 1.1
大数据CSV、JSON、XMLParquet、Arrow、AvroDelta Lake、Iceberg、Feather v2
3D/AROBJ、FBXglTF 2.0、USDZUSD v23、glTF‑KTX2(压缩纹理)

如果你仍然把所有内容都存放为普通 ZIP,那是时候升级了。选择与媒介(云、移动、AI)相匹配的格式,未来会感谢你的选择。

标签: #file-formats #tech-history #cloud-native
别名: file-formats-history-2010-2024