TL;DR

Since 2010 har filformater bevæget sig fra desktop‑centrerede, proprietære blob‑filer til åbne, cloud‑native og AI‑klare containere. De største skift er:

  • Cloud‑first lagring – formater understøtter nu streaming, delvise læsninger og real‑time samarbejde (Google Docs, Office 365).
  • Open‑standard momentum – royalty‑fri codecs (AV1, AVIF, WebP) og dataformater (Parquet, Arrow) dominerer for at undgå leverandørlås.
  • Kompression & båndbreddeeffektivitet – HEVC, AV1, JPEG‑XL, Zstandard og Brotli reducerer filstørrelser med 30‑60 % samtidig med at kvaliteten bevares.
  • Metadata, sikkerhed og oprindelse – rigere XMP/EXIF, digitale signaturer og krypterede containere beskytter integritet og opfylder regulatoriske krav.
  • AI‑klar, selv‑beskrivende strukturer – TFRecord, Parquet og Arrow gør det muligt for maskiner at læse data uden brugerdefinerede parserere, hvilket driver big‑data pipelines og ML‑arbejdsbelastninger.

Hvorfor det sidste årti betyder noget

When du åbnede en fil i 2010 var den typisk et statiskt, lokalt artefakt: en PDF du udskrev, en JPEG du sendte via e‑mail, eller en ZIP du gemte på en harddisk. Spol frem til 2024, og den samme fil kan nu ligge i en cloud‑bucket, redigeres samtidigt af dusinvis af brugere og bære en kryptografisk signatur, der beviser, hvem der har oprettet den. Denne transformation drives af tre makro‑trends:

TrendIndvirkning på formaterPraktisk eksempel
Desktop → Cloud‑NativeBehov for streaming‑læsninger, delvise opdateringer og samarbejds‑metadata.Google Docs gemmer hvert dokument som en JSON‑baseret container, der kan redigeres af flere brugere i realtid.
Open‑Source & Open‑StandardFormater bliver royalty‑fri, interoperable og fremtidssikrede.AV1‑videocodec (royalty‑fri) driver nu YouTubes 4K‑streams og erstatter dyre H.264/HEVC‑licenser.
Compression & BandwidthHøjere effektivitet for 4K/8K‑video, HDR‑billeder og massive datasæt.Apples HEIC‑fotos er cirka halvt så store som JPEG‑filer, hvilket forlænger iPhone‑lagringskapaciteten.

These forces ripple through every domain—documents, images, audio, video, archives, and big‑data containers—forcing standards bodies (ISO, W3C, IETF, AOM) to iterate faster than ever.


Dokument‑ og dataformater: Fra PDF’er til Parquet

Dokumenter bliver sikre, søgbare og multimedierige

  • PDF 2.0 (ISO 32000‑2, 2021) tilføjede stærkere kryptografi, rigere XMP‑metadata og bedre tilgængelighed. Den introducerede også PDF/A‑4 til langtidsarkivering med indlejret oprindelse.
  • Office Open XML (OOXML) holdt trit med real‑time medforfatterskab i Office 365 og indlejrede cloud‑linkede aktiver direkte i filpakken.
  • OpenDocument Format (ODF) fik gennemslag i europæiske offentlige administrationer takket være EU‑mandater for åbne, royalty‑fri standarder.
  • ePub 3.x gjorde e‑bøger til fulde websider (HTML5, MathML, lyd/video), hvilket muliggør interaktive lærebøger og lydbøger.

Big‑data‑pipelines migrerede til selv‑beskrivende, kolonnære containere

  • Parquet blev de‑facto lagringsformat for Spark, Hive og Presto og tilbyder predicate push‑down og effektiv kompression.
  • Apache Arrow introducerede et sprog‑agnostisk, in‑memory kolonnært layout, der muliggør zero‑copy dataudveksling mellem Python, Java og Rust.
  • Avro og ORC forbliver populære til streaming (Kafka) og Hive‑arbejdsbelastninger, henholdsvis, fordi de gemmer skemaet sammen med dataene, hvilket forenkler evolution.

The net result? A document or dataset can travel across clouds, be indexed by AI, and retain its full audit trail without a proprietary lock‑in.


Billeder, lyd & video: Kompressionskapløbet

Billeder – HDR, animation og progressiv dekodning

  • HEIF/HEIC (2015) udnyttede HEVC‑kompression til at halvere JPEG‑filstørrelser, mens den understøtter 16‑bit dybde og HDR. Apple gjorde den til standard på iOS 11, hvilket skubbede økosystemet mod bredere farvespektrum‑fotos.
  • AVIF (2020‑2024), bygget på AV1‑codec’en, giver nu 50 % størrelsesreduktion sammenlignet med JPEG med lossless‑ og HDR‑understøttelse. Chrome, Firefox og Android leverer alle native dekodere.
  • JPEG‑XL (2022) lover lossless‑ + lossy‑tilstande, progressiv rendering og overlegen kompression i forhold til WebP og AVIF, og bruges allerede af Cloudflare til billedlevering.
  • WebP tilføjede animation, lossless‑forbedringer og ICC‑profil‑understøttelse i version 1.2, hvilket gør den til foretrukket format for webgrafik på Chrome og Android.

Lyd – Lav latenstid og lossless streaming

  • Opus (RFC 6716, 2012) blev standardcodec’en for WebRTC, Discord og Zoom og leverer høj‑kvalitets stemme under 64 kbps med under 10 ms latenstid.
  • FLAC oplevede en genopblussen, da premium‑tjenester (Tidal, Qobuz) tilføjede lossless‑lag, mens ALAC blev royalty‑fri efter Apple open‑source’ede den i 2011.
  • Fremvoksende MPEG‑H 3D Audio og Dolby Atmos ADM lægger grundlaget for rumlige lyd‑filer, der kan streames sammen med video.

Video – Fra H.264‑dominans til royalty‑fri AV1

  • HEVC/H.265 (2013) reducerer bitrate med ca. 50 % i forhold til H.264, hvilket muliggør 4K‑ og 8K‑streaming på begrænset båndbredde.
  • VP9 (2013) og AV1 (spec udgivet 2018, produktionsbrug 2020+) tilbød royalty‑fri alternativer; AV1 nyder nu hardware‑acceleration på Intel Xe, Nvidia RTX 40 og Apple Silicon.
  • HEVC‑SCC (2023) optimerede screen‑content‑kodning for fjern‑desktop og cloud‑gaming, hvilket reducerer artefakter på tekst og UI‑elementer.
  • Container‑konvergens: ISO‑BMFF (MP4) og WebM understøtter nu begge flere codecs, undertekster og HDR‑metadata, hvilket forenkler adaptiv‑bitrate‑streaming (MPEG‑DASH, HLS).

Hvad er næste? AI‑indlejrede, provenance‑første og unified containere

  • AI‑klare formater – Udkast PDF 3.0 (2024) foreslår indlejrede inferens‑grafer, der muliggør søgbart scannet tekst uden separate OCR‑pipelines.
  • Blockchain‑baseret provenance – Projekter som IPFS CAR‑filer indlejrer Merkle‑tree‑hashes, hvilket muliggør manipulations‑evident distribution af videnskabelige data og digital kunst.
  • Rumlige‑lyd‑containereMPEG‑H 3D Audio og Dolby Atmos ADM bevæger sig fra broadcast til forbruger‑streaming og kræver nye fil‑wrappers, der bærer objekt‑baseret lyd‑metadata.
  • Unified Media Container (UMC)‑koncepter – Diskussioner i ISO‑BMFF‑arbejdsgruppen har til formål at skabe en enkelt container, der kan indeholde video, lyd, undertekster, 3D‑geometri (glTF) og AR‑metadata, hvilket reducerer “format‑jonglering” i immersive oplevelser.
  • Post‑kvante‑signaturer – Tidlige eksperimenter indlejrer Dilithium‑ eller Falcon‑signaturer i PDF/A‑4 og ODF, som forbereder på en fremtid, hvor klassisk RSA/ECDSA kan være sårbare.

For udviklere og indholdsskabere er konklusionen klar: vælg åbne, selv‑beskrivende formater nu. De bliver lettere at sikre, billigere at licensere og klar til de AI‑drevne pipelines, der vil dominere det næste årti.


Hurtig oversigt (på et øjeblik)

Domæne2010‑20152016‑20202021‑2024
BillederJPEG, PNG, tidlig WebPHEIF/HEIC, AVIF (beta)AVIF 1.1, JPEG‑XL, WebP 1.2
VideoH.264, VP8, tidlig HEVCVP9, AV1 (spec), HEVC mainstreamAV1 bred, VVC tidlig, HEVC‑SCC
LydAAC, MP3, FLACOpus, ALAC open‑source, FLAC vækstOpus 1.3, MPEG‑H 3D Audio
DokumenterPDF 1.7, ODF 1.2PDF 2.0, OOXML 2016, EPUB 3PDF 3.0 udkast, ODF 1.4, EPUB 4 (udkast)
ArkiverZIP, RAR, 7zZstandard, Brotli, LZ4Zstd 1.5+, Brotli 1.1
Big DataCSV, JSON, XMLParquet, Arrow, AvroDelta Lake, Iceberg, Feather v2
3D/AROBJ, FBXglTF 2.0, USDZUSD v23, glTF‑KTX2 (komprimerede teksturer)

Hvis du stadig gemmer alt som en simpel ZIP, er det på tide at opgradere. Vælg et format, der matcher mediet (cloud, mobil, AI), så vil fremtiden takke dig.

Tags: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024