TL;DR
Kopš 2010. gada failu formāti ir pārgājuši no darbvirsmas‑centrētiem, īpašnieku blokiem uz atvērtiem, mākoņ‑datoriem draudzīgiem un AI‑gataviem konteineriem. Lielākie pārmaiņu virzieni ir:
- Mākoņ‑pirmais glabāšana – formāti tagad atbalsta straumēšanu, daļēju nolasīšanu un reāllaika sadarbību (Google Docs, Office 365).
- Atvērtā standarta virzība – bezlicences kodeki (AV1, AVIF, WebP) un datu formāti (Parquet, Arrow) dominē, lai izvairītos no piegādātāja ieslēgšanas.
- Saspiešanas un joslas platuma efektivitāte – HEVC, AV1, JPEG‑XL, Zstandard un Brotli samazina failu izmērus par 30‑60 %, saglabājot kvalitāti.
- Metadati, drošība un izcelsme – bagātāki XMP/EXIF, digitālie paraksti un šifrēti konteineri aizsargā integritāti un atbilst regulatīvajām prasībām.
- AI‑gatavas, pašaprakstošas struktūras – TFRecord, Parquet un Arrow ļauj mašīnām lasīt datus bez pielāgotiem parsētājiem, barojot lielo datu cauruļvadu un ML darba slodzes.
Kāpēc pēdējais desmitgads ir svarīgs
Kad 2010. gadā atvērāt failu, tas parasti bija statisks, lokāls artefakts: PDF, ko izdrukājāt, JPEG, ko nosūtījāt pa e-pastu, vai ZIP, ko glabājāt uz cietā diska.
Ātrā pāreja uz 2024. gadu rāda, ka tas pats fails var atrasties mākoņa krātuvē, to var vienlaicīgi rediģēt desmitiem lietotāju, un tas var saturēt kriptogrāfisku parakstu, kas pierāda, kas to izveidoja.
Šo pārveidi virza trīs makro‑tendences:
| Tendence | Ietekme uz formātiem | Reāla piemērs |
|---|---|---|
| Darbvirsma → Mākoņ‑Dators | Ir nepieciešama straumējoša nolasīšana, daļējas atjaunināšanas un sadarbības metadati. | Google Docs saglabā katru dokumentu kā JSON‑bāzētu konteineru, ko var rediģēt vairāki lietotāji reāllaikā. |
| Atvērtā pirmkods & Atvērtais standarts | Formāti kļūst par bezlicences, savietojamiem un nākotnei drošiem. | AV1 video kodeks (bezlicences) tagad nodrošina YouTube 4K straumes, aizstājot dārgas H.264/HEVC licences. |
| Saspiešana & Joslas platums | Augstāka efektivitāte 4K/8K video, HDR attēlu un milzīgu datu kopu apstrādē. | Apple HEIC foto ir aptuveni puse no JPEG izmēra, pagarinot iPhone atmiņas dzīves ilgumu. |
Dokumentu un datu formāti: no PDF līdz Parquet
Dokumenti kļūst droši, meklējami un multivides bagāti
- PDF 2.0 (ISO 32000‑2, 2021) pievienoja spēcīgāku kriptogrāfiju, bagātāku XMP metadatu un uzlabotu pieejamību. Tā arī ieviesa PDF/A‑4 ilgtermiņa arhivēšanai ar iekļautu izcelsmi.
- Office Open XML (OOXML) turpina attīstību ar reāllaika kopautorēšanu Office 365, iekļaujot mākoņsaistītos resursus tieši faila paketē.
- OpenDocument Format (ODF) ieguva popularitāti Eiropas valsts pārvaldes iestādēs, pateicoties ES prasībām par atvērtiem, bezlicences standartiem.
- ePub 3.x pārvērta e‑grāmatas par pilnvērtīgām tīmekļa lapām (HTML5, MathML, audio/video), ļaujot izveidot interaktīvas mācību grāmatas un audio grāmatas.
Lielu datu cauruļvadi pārgāja uz pašaprakstošiem, kolonnu konteineriem
- Parquet kļuva par de‑facto glabāšanas formātu Spark, Hive un Presto, nodrošinot predikāta push‑down un efektīvu saspiešanu.
- Apache Arrow iepazīstināja ar valodai neatkarīgu, atmiņā esošu kolonnu izkārtojumu, kas ļauj veikt zero‑copy datu apmaiņu starp Python, Java un Rust.
- Avro un ORC joprojām ir populāri straumēšanai (Kafka) un Hive darba slodzei, attiecīgi, jo tie glabā shēmu kopā ar datiem, vienkāršojot evolūciju.
Attēli, audio un video: saspiešanas sacensības
Attēli – HDR, animācija un progresīvā dekodēšana
- HEIF/HEIC (2015) izmantoja HEVC saspiešanu, lai samazinātu JPEG failu izmērus uz pusi, vienlaikus atbalstot 16‑bit dziļumu un HDR. Apple padarīja to par noklusējumu iOS 11, virzot ekosistēmu uz plašāku krāsu gammu.
- AVIF (2020‑2024), balstīts uz AV1 kodeku, tagad piedāvā 50 % izmēru samazinājumu salīdzinājumā ar JPEG, ar bezzaudējumu un HDR atbalstu. Chrome, Firefox un Android visi nodrošina iebūvētos dekoderus.
- JPEG‑XL (2022) sola bezzaudējuma + zaudējuma režīmus, progresīvu renderēšanu un pārspējīgu saspiešanu salīdzinājumā ar WebP un AVIF, un jau tiek izmantots Cloudflare attēlu piegādē.
- WebP pievienoja animāciju, uzlabojumus bezzaudējuma režīmā un ICC profila atbalstu versijā 1.2, padarot to par galveno formātu tīmekļa grafikām Chrome un Android.
Audio – Zema latentuma un bezzaudējuma straumēšana
- Opus (RFC 6716, 2012) kļuva par noklusējuma kodeku WebRTC, Discord un Zoom, nodrošinot augstas kvalitātes balsi zem 64 kbps ar zemāku par 10 ms latentumu.
- FLAC piedzīvoja atdzimšanu, jo premium pakalpojumi (Tidal, Qobuz) pievienoja bezzaudējuma līmeņus, kamēr ALAC kļuva par bezlicences pēc tam, kad Apple to atvēra 2011. gadā.
- Jaunās MPEG‑H 3D Audio un Dolby Atmos ADM veido pamatus telpiskām audio failiem, kurus var straumēt kopā ar video.
Video – No H.264 dominances uz bezlicences AV1
- HEVC/H.265 (2013) samazināja bitreitu par ~50 % salīdzinājumā ar H.264, ļaujot 4K un 8K straumēšanu ierobežotā joslas platumā.
- VP9 (2013) un AV1 (specifikācija izlaista 2018., ražošanas lietošana 2020+) piedāvāja bezlicences alternatīvas; AV1 tagad gūst aparatūras paātrinājumu Intel Xe, Nvidia RTX 40 un Apple Silicon.
- HEVC‑SCC (2023) optimizēja ekrāna saturu kodēšanu attālinātām darbvirsmām un mākoņspēlēšanai, samazinot artefaktus tekstā un UI elementos.
- Konteinera konverģence: ISO‑BMFF (MP4) un WebM tagad abi atbalsta vairākus kodekus, subtitrus un HDR metadatus, vienkāršojot adaptīvās bitreitas straumēšanu (MPEG‑DASH, HLS).
Kas nākamais? AI‑iekļauti, izcelsmes‑pirmie un vienoti konteineri
- AI‑gatavi formāti – Projekta PDF 3.0 (2024) piedāvā iekļautus inferenču grafus, ļaujot meklējamu skenētu tekstu bez atsevišķām OCR cauruļvadiem.
- Blokķēdes atbalstīta izcelsme – Projekti kā IPFS CAR faili iekļauj Merkle‑koka hašus, ļaujot nodrošināt manipulācijas pierādāmu izplatīšanu zinātniskajiem datiem un digitālajam mākslas darbiem.
- Telpiski audio konteineri – MPEG‑H 3D Audio un Dolby Atmos ADM pāriet no pārraidēm uz patērētāju straumēšanu, pieprasot jaunus failu ietvarus, kas nes objektu balstītus audio metadatus.
- Vienota multivides konteineru (UMC) koncepcijas – Diskusijas ISO‑BMFF darba grupā mērķē izveidot vienu konteineru, kas var saturēt video, audio, subtitrus, 3D ģeometriju (glTF) un AR metadatus, samazinot “formātu pārslēgšanu” imersīvajās pieredzēs.
- Pēckvantu paraksti – Agrīnas eksperimentācijas iekļauj Dilithium vai Falcon parakstus PDF/A‑4 un ODF, sagatavojoties nākotnei, kur klasiskie RSA/ECDSA var būt neaizsargāti.
Izstrādātājiem un satura veidotājiem galvenā atziņa ir skaidra: izvēlieties atvērtus, pašaprakstošus formātus jau šodien. Tie būs vieglāk nodrošināmi, lētāki licencēšanai un gatavi AI‑vadītām cauruļvadiem, kas dominēs nākamajā desmitgadē.
Ātra pārskata lapa (Pārskats uz acu uzmetienu)
| Domēns | 2010‑2015 | 2016‑2020 | 2021‑2024 |
|---|---|---|---|
| Attēli | JPEG, PNG, agrīns WebP | HEIF/HEIC, AVIF (beta) | AVIF 1.1, JPEG‑XL, WebP 1.2 |
| Video | H.264, VP8, agrīns HEVC | VP9, AV1 (spec), HEVC plaši | AV1 plaši, VVC agrīni, HEVC‑SCC |
| Audio | AAC, MP3, FLAC | Opus, ALAC atvērtā pirmkods, FLAC pieaugums | Opus 1.3, MPEG‑H 3D Audio |
| Dokumenti | PDF 1.7, ODF 1.2 | PDF 2.0, OOXML 2016, EPUB 3 | PDF 3.0 draft, ODF 1.4, EPUB 4 (draft) |
| Arhīvi | ZIP, RAR, 7z | Zstandard, Brotli, LZ4 | Zstd 1.5+, Brotli 1.1 |
| Lieli dati | CSV, JSON, XML | Parquet, Arrow, Avro | Delta Lake, Iceberg, Feather v2 |
| 3D/AR | OBJ, FBX | glTF 2.0, USDZ | USD v23, glTF‑KTX2 (compressed textures) |
Ja jūs joprojām glabājat visu kā vienkāršu ZIP, ir laiks atjaunināt. Izvēlieties formātu, kas atbilst medijam (mākoņam, mobilajam, AI), un nākotne jums būs pateicīga.
Tags: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024