Důležité formáty souborů v roce 2020: Co by měl vědět každý tvůrce, vývojář a datový vědec
TL;DR – Rok 2020 byl rokem, kdy se formáty souborů staly štíhlejšími, chytřejšími a otevřenějšími. Mobilní provoz, 5G a cloudová spolupráce posunuly nové kompresní standardy (WebP, AVIF, AV1) a sloupcové datové úložiště (Parquet, ORC). PDF zůstaly králem statických dokumentů, zatímco Markdown, JSON a ONNX se staly lingua franca pro vývojáře a AI pipeline.
Úvod
Pokud jste stále používali stejné typy souborů, které jste se naučili v roce 2010, pravděpodobně se vám rok 2020 zdál jako seismický posun. Více než 70 % webového provozu nyní pochází ze smartphonů, 5G umožnilo streamování ve vysokém rozlišení a cloudové balíky proměnily „živé úpravy“ ve výchozí pracovní postup. Veškerý tento tlak přiměl odvětví přijmout formáty, které jsou menší, rychlejší a interoperabilnější. Níže je rychlý přehled formátů, které definovaly rok, proč byly důležité a kde je pravděpodobně uvidíte znovu v letech 2021‑24.
1. Formáty dokumentů a textu – Od PDF po Markdown
| Formát | Stav v 2020 | Proč byl důležitý | Typické případy použití |
|---|---|---|---|
| PDF (ISO 32000‑2 / PDF 2.0) | Stále de‑facto standard pro tisknutelné, statické dokumenty. | Lepší přístupnost, digitální podpisy a podpora vložených 3‑D, videí a interaktivních formulářů. | Kontrakty, e‑faktury, vládní formuláře, e‑knihy. |
| DOCX / ODT | DOCX dominuje korporátním prostředím; ODT má ~5 % podíl na trhu. | Open‑XML je ZIP‑kontejner XML + média, umožňující podrobnou sledování změn a bezpečnost bez maker. ODT je bez licenčních poplatků a upřednostňován open‑source balíky. | Zpracování textu, spolupráce (OneDrive, Nextcloud). |
| EPUB 3.2 | 12 % nárůst prodeje e‑knih; EPUB 3.2 se stal doporučeným standardem. | Znovu využívá HTML5, CSS3, SVG; podporuje audio, video, MathML; nezávislý na DRM. | E‑knihy, digitální učebnice, interaktivní publikace. |
| Markdown (.md) | Explozivní růst v dokumentaci vývojářů, generátorech statických stránek (Jekyll, Hugo). | Čistý text, čitelný pro člověka, snadná konverze do HTML/PDF; rozšiřitelný pomocí GitHub‑Flavored Markdown (GFM). | Soubory README, blogy, technická dokumentace. |
Formáty pro živé úpravy (Google Docs, Office Online) stále existují jako proprietární JSON blob v cloudu, ale všechny exportují do PDF/DOCX pro dlouhodobé archivování.
Rychlá rada
Pokud potřebujete dokument, který přežije deset let změn softwaru, exportujte do PDF 2.0. Pro spolupráci udržujte zdroj v Google Docs nebo Office Online, a poté archivujte finální verzi jako PDF nebo DOCX.
2. Obrázky, video a audio – Závod v kompresi
Obrázky
| Formát | Relevance v 2020 | Klíčové výhody |
|---|---|---|
| JPEG | více než 80 % webových obrázků. | Základní ztrátová DCT komprese, univerzální podpora. |
| PNG | Preferováno pro bezztrátová UI aktiva. | Deflate komprese, alfa kanál, bez patentů. |
| WebP | Použití vzrostlo o ~30 % ročně (Chrome 86+). | 26 % menší než JPEG při srovnatelné kvalitě; podporuje animaci a průhlednost. |
| HEIF/HEIC | Přijato iOS 11+ a Android 9+. | Až 50 % úspora velikosti oproti JPEG; založeno na intra‑frame kódování HEVC. |
| AVIF (emerging) | Prohlížeče pro early adoptery (Firefox 78, Chrome 85) jej podporují. | AV1‑založený, 30‑50 % lepší komprese než WebP, připravený pro HDR. |
Závěr: Web se posouvá k royalty‑free, web‑optimalizovaným formátům—WebP je nyní mainstream a AVIF je připraven nahradit JPEG pro vysoce kvalitní obrázky s nízkou šířkou pásma.
Video a animace
| Formát | Situace v 2020 | Zvýraznění |
|---|---|---|
| MP4 (ISO Base Media File Format) | ≈ 95 % streamovacích dodávek. | Podporuje H.264/AVC, H.265/HEVC, AAC; funguje s DASH a HLS. |
| MKV (Matroska) | Získává popularitu pro 4K/HDR obsah. | Neomezený počet stop, titulky, kapitoly; bez licenčních poplatků. |
| WebM | Výchozí pro HTML5 <video> v Chrome/Firefox. | VP9 video + Opus audio, royalty‑free, streamování s nízkým bitrate. |
| AV1 (inside .mkv/.mp4) | Netflix a YouTube zahájily experimentální AV1 streamy. | 30‑50 % lepší komprese než HEVC; bez patentových poolů. |
| HEVC (H.265) | Stále dominantní pro 4K/UHD Blu‑ray a některé OTT služby. | 50 % snížení bitrate oproti H.264; licenční složitost omezuje webové použití. |
Příklad z praxe: Netflix v roce 2020 začal poskytovat tituly kódované AV1, čímž snížil šířku pásma pro 4K HDR streamy přibližně o třetinu.
Audio
| Formát | Pozice v 2020 | Hlavní body |
|---|---|---|
| MP3 | více než 70 % spotřebitelských audio knihoven (legacy). | 128‑320 kbps, univerzální podpora hardwaru. |
| AAC | Preferováno pro on‑demand streaming (Spotify, Apple Music). | Vyšší kvalita při stejném bitrate jako MP3. |
| Opus | Rychlá adopce v WebRTC, Discord, podcasty. | Nízká latence, 6‑510 kbps proměnlivý bitrate; vyniká u řeči i hudby. |
| FLAC | + 15 % roční růst na trhu s vysokým rozlišením. | Bezztrátový, open source, bohatá metadata. |
| ALAC | Niche, vázáno na ekosystém Apple. | Stejná komprese jako FLAC, ale v kontejneru .m4a. |
Bottom line: Opus je volba pro komunikaci v reálném čase, AAC pro streamování hudby a FLAC/ALAC pro archivaci audio v nejvyšší kvalitě.
3. Data a výměna – Od CSV k sloupcovým jezerům
| Formát | Proč je důležitý v 2020 | Typické scénáře |
|---|---|---|
| CSV | Stále nejjednodušší formát pro výměnu dat; > 50 % importů/exportů. | Výpisy z tabulek, rychlé ETL úlohy. |
| JSON | Dominuje veřejným webovým API (≈ 85 %). | REST služby, konfigurační soubory, NoSQL (MongoDB). |
| XML | Klesá pro nové API, ale je zakořeněn v podnicích (SOAP, Office Open XML). | Legacy systémy, průmyslové standardy (HL7, XBRL). |
| Parquet | Sloupcové úložiště pro big‑data; 30 % úspora velikosti oproti CSV. | Data lakes, Spark/Hive analytické pipeline. |
| ORC | Soutěží s Parquet; upřednostňováno Hive/Presto. | Velké dávkové zpracování. |
| Avro | Přátelský k evoluci schématu; používá se s Kafka. | Streamování v reálném čase, event sourcing. |
| Protocol Buffers | Kompaktní binární formát pro gRPC. | Vysoce výkonné mikroservisy. |
| GeoJSON | Standard pro GIS data na webu. | Mapové aplikace, služby založené na lokaci. |
Klíčové koncepty k zapamatování
- Evoluce schématu – Avro a Parquet vám umožní přidávat pole, aniž by se porušily downstream úlohy.
- Samo‑popisné vs. binární – JSON/XML jsou čitelné pro člověka; Protobuf/Avro jsou kompaktní, ale vyžadují soubor se schématem.
- Sloupcové uspořádání – Skvělé pro analytické dotazy, protože se z disku načtou jen potřebné sloupce.
Pro tip: Při budování datového jezera uložte raw ingest jako Parquet (nebo ORC) a uchovávejte JSON kopii pro rychlou kontrolu.
4. Vznikající a úzké formáty, které stojí za sledování
| Formát | Zvýraznění v 2020 |
|---|---|
| ONNX | více než 30 % nových modelů deep‑learning exportovaných v roce 2020; umožňuje přenositelnost napříč frameworky. |
| Brotli (.br) | 70 % provozu Chrome komprimováno pomocí Brotli pro HTML/CSS/JS. |
| SVG | Plná podpora v prohlížečích; ideální pro responzivní ikony a datové vizualizace. |
| GLTF/GLB | „JPEG 3‑D“; získává na popularitě pro webové AR/VR (Sketchfab, Babylon.js). |
| Zstandard (zstd) | Rychlá komprese s vysokým poměrem; adoptována pro kontejnerové obrazy a patche Linux kernelu. |
| HEVC‑based containers (HEIF/HEIC, MP4) | Stále podléhají patentům, ale dominují mobilnímu zachytávání fotografií a 4K videu. |
Tyto formáty ještě nejsou univerzální, ale jsou hrací pole pro early adopters, kde se objeví další velké standardy.
5. Přehledové trendy napříč všemi kategoriemi
- Open‑source a royalty‑free – WebP → AVIF, AV1, Opus, Brotli, Parquet.
- Efektivita komprese – 30‑50 % úspora velikosti je nyní konkurenční výhodou pro mobil a streamování.
- Metadata a přístupnost – PDF 2.0, EPUB 3.2 a HEIF přidávají bohatší tagy, titulky a barevné profily.
- Mezi‑platformní interoperabilita – Cloud‑native JSON blob (Google Docs) exportují do univerzálně čitelných formátů.
- Bezpečnost a provenance – Digitální podpisy (PDF‑DS), šifrovaný ZIP‑AES a podepsané JWT se stávají povinnými pro shodu.
- AI‑připravená data – Sloupcové, evoluční formáty schématu (Parquet, ORC) a výměna modelů (ONNX) jsou jádrem moderních datových pipeline.
Závěr
Rok 2020 přinutil ekosystém formátů souborů přejít od „prostě udělej práci“ k „udělej to efektivně, bezpečně a budoucnost‑zabezpečeně.“ Mobilní první spotřeba, šířka pásma 5G a cloudová spolupráce učinily velikost, rychlost a otevřenost novou svatou trojicí. Ať už jste marketér exportující PDF, vývojář píšící dokumentaci v Markdownu, datový inženýr budující datové jezero, nebo producent videa streamující 4K, formáty, které dnes zvolíte, určují, kolik zaplatíte za šířku pásma, jak snadná je spolupráce a zda vaše aktiva přežijí dalších pět let.
Závěrem: Přijměte royalty‑free a kompresně chytré formáty (WebP, AVIF, AV1, Parquet, Opus) pro novou práci, ale zachovejte spolehlivou exportní cestu k osvědčeným standardům (PDF, JPEG, MP4, CSV) pro archivaci a kompatibilitu.
Tags: file-formats 2020-tech-trends digital-media
Slug: important-file-formats-2020