TL;DR

Od roku 2010 se formáty souborů posunuly od desktop‑centrických, proprietárních blobů k otevřeným, cloud‑nativním a AI‑připraveným kontejnerům. Největší posuny jsou:

  • Ukládání cloud‑first – formáty nyní podporují streamování, částečné čtení a spolupráci v reálném čase (Google Docs, Office 365).
  • Momentum otevřených standardů – bezlicenční kodeky (AV1, AVIF, WebP) a datové formáty (Parquet, Arrow) dominují, aby se předešlo vendor lock‑in.
  • Komprese a efektivita šířky pásma – HEVC, AV1, JPEG‑XL, Zstandard a Brotli zmenšují velikost souborů o 30‑60 % při zachování kvality.
  • Metadata, bezpečnost a provenance – bohatší XMP/EXIF, digitální podpisy a šifrované kontejnery chrání integritu a splňují regulatorní požadavky.
  • AI‑připravené, samopopisné struktury – TFRecord, Parquet a Arrow umožňují strojům číst data bez vlastních parserů, což pohání big‑data pipeline a ML úlohy.

Proč poslední desetiletí má význam

Když v roce 2010 otevřeli soubor, byl obvykle statickým, lokálním artefaktem: PDF, které jste vytiskli, JPEG, který jste poslali e‑mailem, nebo ZIP, který jste uložili na pevný disk. Přeskočte do roku 2024 a stejný soubor může žít v cloud bucketu, být upravován současně desítkami uživatelů a nést kryptografický podpis, který dokazuje, kdo jej vytvořil. Tato transformace je poháněna třemi makro‑trendy:

TrendDopad na formátyPříklad ze života
Desktop → Cloud‑NativePotřeba streamovaného čtení, částečných aktualizací a spolupracujících metadat.Google Docs ukládá každý dokument jako kontejner založený na JSON, který může být upravován více uživateli v reálném čase.
Open‑Source & Open‑StandardFormáty se stávají bezlicenčními, interoperabilními a odolnými vůči budoucím změnám.Video kodek AV1 (bezlicenční) nyní pohání 4K streamy na YouTube, nahrazujíc drahé licence H.264/HEVC.
Compression & BandwidthVyšší efektivita pro 4K/8K video, HDR obrázky a masivní datové sady.Fotky ve formátu HEIC od Apple jsou přibližně o polovinu menší než JPEG, prodlužují životnost úložiště iPhonu.

Formáty dokumentů a dat: Od PDF po Parquet

Dokumenty se stávají bezpečnými, prohledávatelnými a multimediálně bohatými

  • PDF 2.0 (ISO 32000‑2, 2021) přidal silnější kryptografii, bohatší XMP metadata a lepší přístupnost. Také zavedl PDF/A‑4 pro dlouhodobé archivování s vestavěnou provenance.
  • Office Open XML (OOXML) držel krok s koautorstvím v reálném čase v Office 365, vkládáním cloud‑spojených aktiv přímo do souborového balíčku.
  • OpenDocument Format (ODF) získal na popularitě v evropských veřejných správách díky nařízením EU pro otevřené, bezlicenční standardy.
  • ePub 3.x proměnil e‑knihy na plnohodnotné webové stránky (HTML5, MathML, audio/video), umožňující interaktivní učebnice a audioknihy.

Big‑data pipeline se přesunuly na samopopisné, sloupcové kontejnery

  • Parquet se stal de‑facto úložným formátem pro Spark, Hive a Presto, nabízejícím predicate push‑down a efektivní kompresi.
  • Apache Arrow představil jazykově agnostický, v‑paměti sloupcový layout, který umožňuje zero‑copy výměnu dat mezi Python, Java a Rust.
  • Avro a ORC zůstávají populární pro streamování (Kafka) a Hive úlohy, protože ukládají schéma spolu s daty, což usnadňuje evoluci.

Výsledek? Dokument nebo datová sada může cestovat napříč cloudy, být indexována AI a zachovat si kompletní auditní stopu bez proprietárního zamčení.


Obrázky, audio a video: Závod v kompresi

Obrázky – HDR, animace a progresivní dekódování

  • HEIF/HEIC (2015) využil HEVC kompresi ke zmenšení JPEG souborů na polovinu při podpoře 16‑bitové hloubky a HDR. Apple jej nastavil jako výchozí na iOS 11, posunul ekosystém k širšímu gamutu fotografií.
  • AVIF (2020‑2024), postavený na kodeku AV1, nyní nabízí 50 % zmenšení velikosti oproti JPEG s podporou lossless a HDR. Chrome, Firefox a Android všechny dodávají nativní dekodéry.
  • JPEG‑XL (2022) slibuje lossless i lossy režimy, progresivní renderování a lepší kompresi oproti WebP a AVIF a je již používán Cloudflare pro doručování obrázků.
  • WebP přidal animaci, vylepšení lossless a podporu ICC profilů ve verzi 1.2, čímž se stal preferovaným formátem pro webovou grafiku na Chrome a Android.

Audio – Nízká latence a lossless streamování

  • Opus (RFC 6716, 2012) se stal výchozím kodekem pro WebRTC, Discord a Zoom, poskytujícím vysoce kvalitní hlas pod 64 kbps s latencí pod 10 ms.
  • FLAC zaznamenal oživení, když prémiové služby (Tidal, Qobuz) přidaly lossless úrovně, zatímco ALAC se stal bezlicenční po otevřeném zdrojovém kódu od Apple v roce 2011.
  • Emerging MPEG‑H 3D Audio a Dolby Atmos ADM připravují základ pro prostorové audio soubory, které lze streamovat spolu s videem.

Video – Od dominance H.264 k bezlicenčnímu AV1

  • HEVC/H.265 (2013) snížil bitrate o ~50 % oproti H.264, umožňujíc streaming 4K a 8K při omezené šířce pásma.
  • VP9 (2013) a AV1 (specifikace vydána 2018, produkční použití 2020+) nabídly bezlicenční alternativy; AV1 nyní těží z hardwarové akcelerace na Intel Xe, Nvidia RTX 40 a Apple Silicon.
  • HEVC‑SCC (2023) optimalizoval kódování obrazovkového obsahu pro vzdálené desktopy a cloud gaming, snižujíc artefakty v textu a UI prvcích.
  • Koncergence kontejnerů: ISO‑BMFF (MP4) a WebM nyní oba podporují více kodeků, titulky a HDR metadata, zjednodušujíc adaptivní bitrate streaming (MPEG‑DASH, HLS).

Celkově posun k vyšší kompresi, HDR a bezlicenčnímu licencování přetvořil, co můžeme doručovat přes mobilní sítě a co zařízení dokážou dekódovat nativně.


Co bude dál? AI‑vložené, provenance‑první a sjednocené kontejnery

  • AI‑připravené formáty – Návrh PDF 3.0 (2024) navrhuje vložené inference grafy, umožňující prohledávat skenovaný text bez samostatných OCR pipeline.
  • Blockchain‑podporovaná provenance – Projekty jako IPFS CAR soubory vkládají Merkle‑tree hash, umožňující odolnou proti manipulaci distribuci vědeckých dat a digitálního umění.
  • Kontejnery prostorového audia – MPEG‑H 3D Audio a Dolby Atmos ADM přecházejí z vysílání na spotřebitelské streamování, vyžadujíc nové souborové obaly, které nesou objektově‑základní audio metadata.
  • Koncepty Unified Media Container (UMC) – Diskuse ve skupině ISO‑BMFF usilují o vytvoření jediného kontejneru, který může obsahovat video, audio, titulky, 3D geometrii (glTF) a AR metadata, snižujíc „žonglování formáty“ v imerzivních zážitcích.
  • Post‑kvantové podpisy – Rané experimenty vkládají Dilithium nebo Falcon podpisy do PDF/A‑4 a ODF, připravujíc na budoucnost, kde by klasické RSA/ECDSA mohly být zranitelné.

Pro vývojáře a tvůrce obsahu je závěr jasný: vyberte si otevřené, samopopisné formáty již nyní. Budou snazší zabezpečit, levnější licencovat a připravené pro AI‑řízené pipeline, které budou dominovat v následujícím desetiletí.


Rychlý přehled (Na první pohled)

Doména2010‑20152016‑20202021‑2024
ObrázkyJPEG, PNG, early WebPHEIF/HEIC, AVIF (beta)AVIF 1.1, JPEG‑XL, WebP 1.2
VideoH.264, VP8, early HEVCVP9, AV1 (spec), HEVC mainstreamAV1 wide, VVC early, HEVC‑SCC
AudioAAC, MP3, FLACOpus, ALAC open‑source, FLAC growthOpus 1.3, MPEG‑H 3D Audio
DokumentyPDF 1.7, ODF 1.2PDF 2.0, OOXML 2016, EPUB 3PDF 3.0 draft, ODF 1.4, EPUB 4 (draft)
ArchivyZIP, RAR, 7zZstandard, Brotli, LZ4Zstd 1.5+, Brotli 1.1
Big DataCSV, JSON, XMLParquet, Arrow, AvroDelta Lake, Iceberg, Feather v2
3D/AROBJ, FBXglTF 2.0, USDZUSD v23, glTF‑KTX2 (compressed textures)

Pokud stále ukládáte vše jako obyčejný ZIP, je čas na upgrade. Vyberte formát, který odpovídá médiu (cloud, mobil, AI) a budoucnost vám poděkuje.

Štítky: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024