TL;DR

Sedan 2010 har filformat gått från skrivbord‑centrerade, proprietära blobbar till öppna, molnbaserade och AI‑klara behållare. De största förändringarna är:

  • Molnbaserad först-lagring – format stödjer nu strömning, partiella läsningar och samarbete i realtid (Google Docs, Office 365).
  • Öppna standarder i framfart – royalty‑fria codecs (AV1, AVIF, WebP) och dataformat (Parquet, Arrow) dominerar för att undvika leverantörslåsning.
  • Komprimering och bandbreddseffektivitet – HEVC, AV1, JPEG‑XL, Zstandard och Brotli minskar filstorlekar 30‑60 % samtidigt som kvaliteten bevaras.
  • Metadata, säkerhet och proveniens – rikare XMP/EXIF, digitala signaturer och krypterade behållare skyddar integritet och uppfyller regulatoriska krav.
  • AI‑klara, självbeskrivande strukturer – TFRecord, Parquet och Arrow låter maskiner läsa data utan anpassade parsers, vilket driver big‑data‑pipelines och ML‑arbetsbelastningar.

Varför det senaste decenniet spelar roll

När du öppnade en fil 2010 var den vanligtvis ett statiskt, lokalt artefakt: en PDF du skrev ut, en JPEG du mejlade eller en ZIP du lagrade på en hårddisk. Spola fram till 2024 och samma fil kan ligga i en molnbucket, redigeras samtidigt av dussintals användare och bära en kryptografisk signatur som bevisar vem som skapade den. Denna omvandling drivs av tre makrotrender:

TrendPåverkan på formatExempel i verkligheten
Desktop → MolnbaseradBehov av strömmande läsningar, partiella uppdateringar och samarbetsmetadata.Google Docs lagrar varje dokument som en JSON‑baserad behållare som kan redigeras av flera användare i realtid.
Öppen källkod & öppna standarderFormat blir royalty‑fria, interoperabla och framtidssäkra.AV1‑videocodec (royalty‑fri) driver nu YouTubes 4K‑strömmar och ersätter dyra H.264/HEVC‑licenser.
Komprimering & bandbreddHögre effektivitet för 4K/8K‑video, HDR‑bilder och enorma datamängder.Apples HEIC‑foton är ungefär hälften så stora som JPEG‑filer, vilket förlänger iPhone‑lagringskapaciteten.

Dessa krafter ripple genom alla domäner—dokument, bilder, ljud, video, arkiv och big‑data‑behållare—och tvingar standardorgan (ISO, W3C, IETF, AOM) att iterera snabbare än någonsin.


Dokument‑ och dataformat: Från PDF till Parquet

Dokument blir säkra, sökbara och multimedia‑rika

  • PDF 2.0 (ISO 32000‑2, 2021) lade till starkare kryptografi, rikare XMP‑metadata och bättre tillgänglighet. Det introducerade också PDF/A‑4 för långsiktig arkivering med inbäddad proveniens.
  • Office Open XML (OOXML) höll jämna steg med realtids‑samskrivning i Office 365 och inbäddade molnlänkade resurser direkt i filpaketet.
  • OpenDocument Format (ODF) fick genomslag i europeiska offentliga förvaltningar tack vare EU‑mandat för öppna, royalty‑fria standarder.
  • ePub 3.x förvandlade e‑böcker till fullständiga webbsidor (HTML5, MathML, ljud/video), vilket möjliggör interaktiva läroböcker och ljudböcker.

Big‑data‑pipelines migrerade till självbeskrivande, kolumnära behållare

  • Parquet blev den de‑facto lagringsformatet för Spark, Hive och Presto, med stöd för predikat‑push‑down och effektiv komprimering.
  • Apache Arrow introducerade ett språkoberoende, minnes‑kolumnlayout som möjliggör noll‑kopierings‑datautbyte mellan Python, Java och Rust.
  • Avro och ORC förblir populära för strömning (Kafka) respektive Hive‑arbetsbelastningar, eftersom de lagrar schemat tillsammans med data, vilket förenklar utveckling.

Resultatet? Ett dokument eller dataset kan färdas över moln, indexeras av AI och behålla sin fulla revisionsspår utan proprietär låsning.


Bilder, ljud & video: Komprimeringskapprustningen

Bilder – HDR, animation och progressiv avkodning

  • HEIF/HEIC (2015) utnyttjade HEVC‑komprimering för att halvera JPEG‑filstorlekar samtidigt som den stödjer 16‑bits djup och HDR. Apple gjorde det till standard på iOS 11, vilket drev ekosystemet mot bredare färgomfång för foton.
  • AVIF (2020‑2024), byggd på AV1‑codec, erbjuder nu 50 % minskning av filstorlek jämfört med JPEG med förlustfri och HDR‑stöd. Chrome, Firefox och Android levererar alla inbyggda avkodare.
  • JPEG‑XL (2022) lovar förlustfria + förlustiga lägen, progressiv rendering och överlägsen komprimering jämfört med WebP och AVIF, och används redan av Cloudflare för bildleverans.
  • WebP lade till animation, förbättringar för förlustfri komprimering och ICC‑profilstöd i version 1.2, vilket gör det till föredragen format för webb‑grafik på Chrome och Android.

Ljud – Låg latens och förlustfri streaming

  • Opus (RFC 6716, 2012) blev standardcodec för WebRTC, Discord och Zoom, och levererar högkvalitativ röst under 64 kbps med mindre än 10 ms latens.
  • FLAC fick ett uppsving när premiumtjänster (Tidal, Qobuz) lade till förlustfria nivåer, medan ALAC blev royalty‑fri efter att Apple öppnade källkoden 2011.
  • Framväxande MPEG‑H 3D Audio och Dolby Atmos ADM lägger grunden för rumsliga ljudfiler som kan strömmas tillsammans med video.

Video – Från H.264‑dominans till royalty‑fri AV1

  • HEVC/H.265 (2013) minskar bithastigheten med ~50 % jämfört med H.264, vilket möjliggör 4K‑ och 8K‑streaming på begränsad bandbredd.
  • VP9 (2013) och AV1 (spec släppt 2018, produktionsanvändning 2020+) erbjöd royalty‑fria alternativ; AV1 har nu hårdvaruacceleration på Intel Xe, Nvidia RTX 40 och Apple Silicon.
  • HEVC‑SCC (2023) optimerade kodning av skärminnehåll för fjärrskrivbord och molnspel, vilket minskar artefakter på text och UI‑element.
  • Behållarkonvergens: ISO‑BMFF (MP4) och WebM stödjer nu båda flera codecs, undertexter och HDR‑metadata, vilket förenklar adaptiv bitrate‑streaming (MPEG‑DASH, HLS).

Vad blir nästa? AI‑inbäddade, provenance‑först och enhetliga behållare

  • AI‑klara format – Utkast PDF 3.0 (2024) föreslår inbäddade inferensgrafer, vilket möjliggör sökbar skannad text utan separata OCR‑pipelines.
  • Blockchain‑stödd proveniens – Projekt som IPFS CAR‑filer inbäddar Merkle‑träd‑hashar, vilket möjliggör manipulering‑evident distribution för vetenskapliga data och digital konst.
  • Rums‑ljudbehållareMPEG‑H 3D Audio och Dolby Atmos ADM övergår från sändning till konsumentstreaming, vilket kräver nya filomslag som bär objekt‑baserad ljudmetadata.
  • Unified Media Container (UMC)-koncept – Diskussioner i ISO‑BMFF‑arbetsgruppen syftar till att skapa en enda behållare som kan innehålla video, ljud, undertexter, 3D‑geometri (glTF) och AR‑metadata, vilket minskar “format‑jongleringen” i immersiva upplevelser.
  • Post‑kvantum‑signaturer – Tidiga experiment inbäddar Dilithium‑ eller Falcon‑signaturer i PDF/A‑4 och ODF, för att förbereda för en framtid där klassiska RSA/ECDSA kan vara sårbara.

För utvecklare och innehållsskapare är slutsatsen tydlig: välj öppna, självbeskrivande format redan nu. De blir enklare att säkra, billigare att licensiera och redo för de AI‑drivna pipelines som kommer att dominera nästa decennium.


Snabböversikt (på ett ögonblick)

Domän2010‑20152016‑20202021‑2024
BilderJPEG, PNG, early WebPHEIF/HEIC, AVIF (beta)AVIF 1.1, JPEG‑XL, WebP 1.2
VideoH.264, VP8, early HEVCVP9, AV1 (spec), HEVC mainstreamAV1 wide, VVC early, HEVC‑SCC
LjudAAC, MP3, FLACOpus, ALAC open‑source, FLAC growthOpus 1.3, MPEG‑H 3D Audio
DokumentPDF 1.7, ODF 1.2PDF 2.0, OOXML 2016, EPUB 3PDF 3.0 draft, ODF 1.4, EPUB 4 (draft)
ArkivZIP, RAR, 7zZstandard, Brotli, LZ4Zstd 1.5+, Brotli 1.1
StordataCSV, JSON, XMLParquet, Arrow, AvroDelta Lake, Iceberg, Feather v2
3D/AROBJ, FBXglTF 2.0, USDZUSD v23, glTF‑KTX2 (compressed textures)

Om du fortfarande lagrar allt som en vanlig ZIP, är det dags att uppgradera. Välj ett format som matchar mediet (moln, mobil, AI) så kommer framtiden att tacka dig.


Tags: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024