Důležité formáty souborů v roce 2020: Co by měl vědět každý tvůrce, vývojář a datový vědec

TL;DR – Rok 2020 byl rokem, kdy se formáty souborů staly štíhlejšími, chytřejšími a otevřenějšími. Mobilní provoz, 5G a cloudová spolupráce posunuly nové kompresní standardy (WebP, AVIF, AV1) a sloupcové datové úložiště (Parquet, ORC). PDF zůstaly králem statických dokumentů, zatímco Markdown, JSON a ONNX se staly lingua franca pro vývojáře a AI pipeline.


Úvod

Pokud jste stále používali stejné typy souborů, které jste se naučili v roce 2010, pravděpodobně se vám rok 2020 zdál jako seismický posun. Více než 70 % webového provozu nyní pochází ze smartphonů, 5G umožnilo streamování ve vysokém rozlišení a cloudové balíky proměnily „živé úpravy“ ve výchozí pracovní postup. Veškerý tento tlak přiměl odvětví přijmout formáty, které jsou menší, rychlejší a interoperabilnější. Níže je rychlý přehled formátů, které definovaly rok, proč byly důležité a kde je pravděpodobně uvidíte znovu v letech 2021‑24.


1. Formáty dokumentů a textu – Od PDF po Markdown

FormátStav v 2020Proč byl důležitýTypické případy použití
PDF (ISO 32000‑2 / PDF 2.0)Stále de‑facto standard pro tisknutelné, statické dokumenty.Lepší přístupnost, digitální podpisy a podpora vložených 3‑D, videí a interaktivních formulářů.Kontrakty, e‑faktury, vládní formuláře, e‑knihy.
DOCX / ODTDOCX dominuje korporátním prostředím; ODT má ~5 % podíl na trhu.Open‑XML je ZIP‑kontejner XML + média, umožňující podrobnou sledování změn a bezpečnost bez maker. ODT je bez licenčních poplatků a upřednostňován open‑source balíky.Zpracování textu, spolupráce (OneDrive, Nextcloud).
EPUB 3.212 % nárůst prodeje e‑knih; EPUB 3.2 se stal doporučeným standardem.Znovu využívá HTML5, CSS3, SVG; podporuje audio, video, MathML; nezávislý na DRM.E‑knihy, digitální učebnice, interaktivní publikace.
Markdown (.md)Explozivní růst v dokumentaci vývojářů, generátorech statických stránek (Jekyll, Hugo).Čistý text, čitelný pro člověka, snadná konverze do HTML/PDF; rozšiřitelný pomocí GitHub‑Flavored Markdown (GFM).Soubory README, blogy, technická dokumentace.

Formáty pro živé úpravy (Google Docs, Office Online) stále existují jako proprietární JSON blob v cloudu, ale všechny exportují do PDF/DOCX pro dlouhodobé archivování.

Rychlá rada

Pokud potřebujete dokument, který přežije deset let změn softwaru, exportujte do PDF 2.0. Pro spolupráci udržujte zdroj v Google Docs nebo Office Online, a poté archivujte finální verzi jako PDF nebo DOCX.


2. Obrázky, video a audio – Závod v kompresi

Obrázky

FormátRelevance v 2020Klíčové výhody
JPEGvíce než 80 % webových obrázků.Základní ztrátová DCT komprese, univerzální podpora.
PNGPreferováno pro bezztrátová UI aktiva.Deflate komprese, alfa kanál, bez patentů.
WebPPoužití vzrostlo o ~30 % ročně (Chrome 86+).26 % menší než JPEG při srovnatelné kvalitě; podporuje animaci a průhlednost.
HEIF/HEICPřijato iOS 11+ a Android 9+.Až 50 % úspora velikosti oproti JPEG; založeno na intra‑frame kódování HEVC.
AVIF (emerging)Prohlížeče pro early adoptery (Firefox 78, Chrome 85) jej podporují.AV1‑založený, 30‑50 % lepší komprese než WebP, připravený pro HDR.

Závěr: Web se posouvá k royalty‑free, web‑optimalizovaným formátům—WebP je nyní mainstream a AVIF je připraven nahradit JPEG pro vysoce kvalitní obrázky s nízkou šířkou pásma.

Video a animace

FormátSituace v 2020Zvýraznění
MP4 (ISO Base Media File Format)≈ 95 % streamovacích dodávek.Podporuje H.264/AVC, H.265/HEVC, AAC; funguje s DASH a HLS.
MKV (Matroska)Získává popularitu pro 4K/HDR obsah.Neomezený počet stop, titulky, kapitoly; bez licenčních poplatků.
WebMVýchozí pro HTML5 <video> v Chrome/Firefox.VP9 video + Opus audio, royalty‑free, streamování s nízkým bitrate.
AV1 (inside .mkv/.mp4)Netflix a YouTube zahájily experimentální AV1 streamy.30‑50 % lepší komprese než HEVC; bez patentových poolů.
HEVC (H.265)Stále dominantní pro 4K/UHD Blu‑ray a některé OTT služby.50 % snížení bitrate oproti H.264; licenční složitost omezuje webové použití.

Příklad z praxe: Netflix v roce 2020 začal poskytovat tituly kódované AV1, čímž snížil šířku pásma pro 4K HDR streamy přibližně o třetinu.

Audio

FormátPozice v 2020Hlavní body
MP3více než 70 % spotřebitelských audio knihoven (legacy).128‑320 kbps, univerzální podpora hardwaru.
AACPreferováno pro on‑demand streaming (Spotify, Apple Music).Vyšší kvalita při stejném bitrate jako MP3.
OpusRychlá adopce v WebRTC, Discord, podcasty.Nízká latence, 6‑510 kbps proměnlivý bitrate; vyniká u řeči i hudby.
FLAC+ 15 % roční růst na trhu s vysokým rozlišením.Bezztrátový, open source, bohatá metadata.
ALACNiche, vázáno na ekosystém Apple.Stejná komprese jako FLAC, ale v kontejneru .m4a.

Bottom line: Opus je volba pro komunikaci v reálném čase, AAC pro streamování hudby a FLAC/ALAC pro archivaci audio v nejvyšší kvalitě.


3. Data a výměna – Od CSV k sloupcovým jezerům

FormátProč je důležitý v 2020Typické scénáře
CSVStále nejjednodušší formát pro výměnu dat; > 50 % importů/exportů.Výpisy z tabulek, rychlé ETL úlohy.
JSONDominuje veřejným webovým API (≈ 85 %).REST služby, konfigurační soubory, NoSQL (MongoDB).
XMLKlesá pro nové API, ale je zakořeněn v podnicích (SOAP, Office Open XML).Legacy systémy, průmyslové standardy (HL7, XBRL).
ParquetSloupcové úložiště pro big‑data; 30 % úspora velikosti oproti CSV.Data lakes, Spark/Hive analytické pipeline.
ORCSoutěží s Parquet; upřednostňováno Hive/Presto.Velké dávkové zpracování.
AvroPřátelský k evoluci schématu; používá se s Kafka.Streamování v reálném čase, event sourcing.
Protocol BuffersKompaktní binární formát pro gRPC.Vysoce výkonné mikroservisy.
GeoJSONStandard pro GIS data na webu.Mapové aplikace, služby založené na lokaci.

Klíčové koncepty k zapamatování

  • Evoluce schématu – Avro a Parquet vám umožní přidávat pole, aniž by se porušily downstream úlohy.
  • Samo‑popisné vs. binární – JSON/XML jsou čitelné pro člověka; Protobuf/Avro jsou kompaktní, ale vyžadují soubor se schématem.
  • Sloupcové uspořádání – Skvělé pro analytické dotazy, protože se z disku načtou jen potřebné sloupce.

Pro tip: Při budování datového jezera uložte raw ingest jako Parquet (nebo ORC) a uchovávejte JSON kopii pro rychlou kontrolu.


4. Vznikající a úzké formáty, které stojí za sledování

FormátZvýraznění v 2020
ONNXvíce než 30 % nových modelů deep‑learning exportovaných v roce 2020; umožňuje přenositelnost napříč frameworky.
Brotli (.br)70 % provozu Chrome komprimováno pomocí Brotli pro HTML/CSS/JS.
SVGPlná podpora v prohlížečích; ideální pro responzivní ikony a datové vizualizace.
GLTF/GLB„JPEG 3‑D“; získává na popularitě pro webové AR/VR (Sketchfab, Babylon.js).
Zstandard (zstd)Rychlá komprese s vysokým poměrem; adoptována pro kontejnerové obrazy a patche Linux kernelu.
HEVC‑based containers (HEIF/HEIC, MP4)Stále podléhají patentům, ale dominují mobilnímu zachytávání fotografií a 4K videu.

Tyto formáty ještě nejsou univerzální, ale jsou hrací pole pro early adopters, kde se objeví další velké standardy.


5. Přehledové trendy napříč všemi kategoriemi

  1. Open‑source a royalty‑free – WebP → AVIF, AV1, Opus, Brotli, Parquet.
  2. Efektivita komprese – 30‑50 % úspora velikosti je nyní konkurenční výhodou pro mobil a streamování.
  3. Metadata a přístupnost – PDF 2.0, EPUB 3.2 a HEIF přidávají bohatší tagy, titulky a barevné profily.
  4. Mezi‑platformní interoperabilita – Cloud‑native JSON blob (Google Docs) exportují do univerzálně čitelných formátů.
  5. Bezpečnost a provenance – Digitální podpisy (PDF‑DS), šifrovaný ZIP‑AES a podepsané JWT se stávají povinnými pro shodu.
  6. AI‑připravená data – Sloupcové, evoluční formáty schématu (Parquet, ORC) a výměna modelů (ONNX) jsou jádrem moderních datových pipeline.

Závěr

Rok 2020 přinutil ekosystém formátů souborů přejít od „prostě udělej práci“ k „udělej to efektivně, bezpečně a budoucnost‑zabezpečeně.“ Mobilní první spotřeba, šířka pásma 5G a cloudová spolupráce učinily velikost, rychlost a otevřenost novou svatou trojicí. Ať už jste marketér exportující PDF, vývojář píšící dokumentaci v Markdownu, datový inženýr budující datové jezero, nebo producent videa streamující 4K, formáty, které dnes zvolíte, určují, kolik zaplatíte za šířku pásma, jak snadná je spolupráce a zda vaše aktiva přežijí dalších pět let.

Závěrem: Přijměte royalty‑free a kompresně chytré formáty (WebP, AVIF, AV1, Parquet, Opus) pro novou práci, ale zachovejte spolehlivou exportní cestu k osvědčeným standardům (PDF, JPEG, MP4, CSV) pro archivaci a kompatibilitu.


Tags: file-formats 2020-tech-trends digital-media

Slug: important-file-formats-2020