TL;DR
Sejak 2010 format fail telah berubah dari blok proprietari berpusat desktop kepada kontena terbuka, berasaskan awan, dan bersedia AI. Perubahan terbesar ialah:
- Penyimpanan berasaskan awan pertama – format kini menyokong penstriman, bacaan separa, dan kolaborasi masa nyata (Google Docs, Office 365).
- Momentum standard terbuka – codec tanpa royalti (AV1, AVIF, WebP) dan format data (Parquet, Arrow) mendominasi untuk mengelakkan kunci vendor.
- Pemampatan & kecekapan jalur lebar – HEVC, AV1, JPEG‑XL, Zstandard, dan Brotli mengurangkan saiz fail 30‑60 % sambil mengekalkan kualiti.
- Metadata, keselamatan, dan provenance – XMP/EXIF yang lebih kaya, tandatangan digital, dan kontena terenkripsi melindungi integriti dan memenuhi keperluan peraturan.
- Struktur bersedia AI, yang menerangkan diri – TFRecord, Parquet, dan Arrow membolehkan mesin membaca data tanpa parser khusus, memacu paip data besar dan beban kerja ML.
Mengapa Dekad Lalu Penting
Apabila anda membuka fail pada 2010, biasanya ia merupakan artefak statik, setempat: PDF yang anda cetak, JPEG yang anda e‑mel, atau ZIP yang anda simpan pada pemacu keras. Maju cepat ke 2024 dan fail yang sama mungkin berada dalam baldi awan, diedit secara serentak oleh puluhan pengguna, dan membawa tandatangan kriptografi yang membuktikan siapa yang menciptanya. Transformasi ini didorong oleh tiga makro‑trend:
| Trend | Impak pada Format | Contoh Dunia Sebenar |
|---|---|---|
| Desktop → Awan‑Asli | Keperluan untuk bacaan penstriman, kemas kini separa, dan metadata kolaboratif. | Google Docs menyimpan setiap dokumen sebagai kontena berasaskan JSON yang boleh diedit oleh banyak pengguna secara masa nyata. |
| Sumber Terbuka & Standard Terbuka | Format menjadi tanpa royalti, boleh berinteroperasi, dan tahan masa depan. | Codec video AV1 (tanpa royalti) kini menggerakkan penstriman 4K YouTube, menggantikan lesen H.264/HEVC yang mahal. |
| Pemampatan & Jalur Lebar | Kecekapan lebih tinggi untuk video 4K/8K, imej HDR, dan set data besar. | Foto HEIC Apple kira separuh saiz JPEG, memanjangkan hayat storan iPhone. |
Format Dokumen & Data: Dari PDF ke Parquet
Dokumen menjadi selamat, boleh dicari, dan kaya multimedia
- PDF 2.0 (ISO 32000‑2, 2021) menambah kriptografi yang lebih kuat, metadata XMP yang lebih kaya, dan kebolehcapaian yang lebih baik. Ia juga memperkenalkan PDF/A‑4 untuk arkib jangka panjang dengan provenance terbenam.
- Office Open XML (OOXML) menyesuaikan diri dengan penulisan bersama masa nyata dalam Office 365, menyematkan aset berhubung awan secara langsung dalam pakej fail.
- OpenDocument Format (ODF) mendapat perhatian dalam pentadbiran awam Eropah berkat mandat EU untuk standard terbuka, tanpa royalti.
- ePub 3.x menjadikan e‑book sebagai halaman web penuh (HTML5, MathML, audio/video), membolehkan buku teks interaktif dan buku audio.
Paip data‑besar berpindah ke kontena kolumnar yang menerangkan diri
- Parquet menjadi format storan de‑facto untuk Spark, Hive, dan Presto, menawarkan penurunan predikat dan pemampatan yang cekap.
- Apache Arrow memperkenalkan susun atur kolumnar dalam memori yang tidak bergantung pada bahasa, membolehkan pertukaran data tanpa salinan antara Python, Java, dan Rust.
- Avro dan ORC tetap popular untuk penstriman (Kafka) dan beban kerja Hive, masing‑masing, kerana mereka menyimpan skema bersama data, memudahkan evolusi.
Imej, Audio & Video: Perlumbaan Pemampatan
Imej – HDR, animasi, dan penyahkodan progresif
- HEIF/HEIC (2015) menggunakan pemampatan HEVC untuk mengurangkan saiz fail JPEG separuh sambil menyokong kedalaman 16‑bit dan HDR. Apple menjadikannya lalai pada iOS 11, mendorong ekosistem ke foto gamut lebih luas.
- AVIF (2020‑2024), dibina atas codec AV1, kini menawarkan pengurangan saiz 50 % berbanding JPEG dengan sokongan lossless dan HDR. Chrome, Firefox, dan Android semua menyediakan penyahkod asal.
- JPEG‑XL (2022) menjanjikan mod lossless + lossy, rendering progresif, dan pemampatan unggul berbanding WebP dan AVIF, dan sudah digunakan oleh Cloudflare untuk penghantaran imej.
- WebP menambah animasi, peningkatan lossless, dan sokongan profil ICC dalam versi 1.2, menjadikannya format pilihan untuk grafik web pada Chrome dan Android.
Audio – Penstriman rendah‑latensi dan lossless
- Opus (RFC 6716, 2012) menjadi codec lalai untuk WebRTC, Discord, dan Zoom, menyampaikan suara berkualiti tinggi pada kurang daripada 64 kbps dengan latensi kurang daripada 10 ms.
- FLAC mengalami kebangkitan semula apabila perkhidmatan premium (Tidal, Qobuz) menambah lapisan lossless, manakala ALAC menjadi tanpa royalti selepas Apple membuka sumbernya pada 2011.
- MPEG‑H 3D Audio dan Dolby Atmos ADM yang sedang muncul sedang meletakkan asas untuk fail audio spatial yang boleh ditstrim bersama video.
Video – Dari dominasi H.264 ke AV1 tanpa royalti
- HEVC/H.265 (2013) mengurangkan kadar bit kira‑kira 50 % berbanding H.264, membolehkan penstriman 4K dan 8K pada jalur lebar terhad.
- VP9 (2013) dan AV1 (spesifikasi dikeluarkan 2018, penggunaan produksi 2020+) menawarkan alternatif tanpa royalti; AV1 kini menikmati pecutan perkakasan pada Intel Xe, Nvidia RTX 40, dan Apple Silicon.
- HEVC‑SCC (2023) mengoptimumkan pengekodan kandungan skrin untuk desktop jauh dan permainan awan, mengurangkan artifak pada teks dan elemen UI.
- Penumpuan kontena: ISO‑BMFF (MP4) dan WebM kini kedua‑duanya menyokong pelbagai codec, sari kata, dan metadata HDR, memudahkan penstriman kadar bit adaptif (MPEG‑DASH, HLS).
Apa Seterusnya? Format Terbenam AI, Provenance‑Pertama, dan Kontena Bersatu
- Format bersedia AI – Draf PDF 3.0 (2024) mencadangkan graf inferens terbenam, membolehkan teks imbasan boleh dicari tanpa paip OCR berasingan.
- Provenance berasaskan blockchain – Projek seperti fail IPFS CAR menyematkan hash pokok Merkle, membolehkan pengedaran yang tahan tamper untuk data saintifik dan seni digital.
- Kontena audio spatial – MPEG‑H 3D Audio dan Dolby Atmos ADM berpindah dari siaran ke penstriman pengguna, menuntut pembungkus fail baru yang membawa metadata audio berasaskan objek.
- Konsep Kontena Media Bersatu (UMC) – Perbincangan dalam kumpulan kerja ISO‑BMFF bertujuan mencipta satu kontena yang dapat memuatkan video, audio, sari kata, geometri 3D (glTF), dan metadata AR, mengurangkan “permainan format” dalam pengalaman imersif.
- Tandatangan pasca‑kuantum – Eksperimen awal menyematkan tandatangan Dilithium atau Falcon ke dalam PDF/A‑4 dan ODF, bersedia untuk masa depan di mana RSA/ECDSA klasik mungkin terdedah.
Bagi pembangun dan pencipta kandungan, intipatinya jelas: pilih format terbuka, yang menerangkan diri sekarang. Ia akan lebih mudah untuk diamankan, lebih murah untuk dilisensikan, dan bersedia untuk paip AI yang akan mendominasi dekad akan datang.
Lembaran Cepat (Sekilas Pandang)
| Domain | 2010‑2015 | 2016‑2020 | 2021‑2024 |
|---|---|---|---|
| Imej | JPEG, PNG, WebP awal | HEIF/HEIC, AVIF (beta) | AVIF 1.1, JPEG‑XL, WebP 1.2 |
| Video | H.264, VP8, HEVC awal | VP9, AV1 (spes), HEVC utama | AV1 meluas, VVC awal, HEVC‑SCC |
| Audio | AAC, MP3, FLAC | Opus, ALAC sumber terbuka, pertumbuhan FLAC | Opus 1.3, MPEG‑H 3D Audio |
| Dokumen | PDF 1.7, ODF 1.2 | PDF 2.0, OOXML 2016, EPUB 3 | Draf PDF 3.0, ODF 1.4, EPUB 4 (draf) |
| Arkib | ZIP, RAR, 7z | Zstandard, Brotli, LZ4 | Zstd 1.5+, Brotli 1.1 |
| Data Besar | CSV, JSON, XML | Parquet, Arrow, Avro | Delta Lake, Iceberg, Feather v2 |
| 3D/AR | OBJ, FBX | glTF 2.0, USDZ | USD v23, glTF‑KTX2 (tekstur termampat) |
Jika anda masih menyimpan segala-galanya sebagai ZIP biasa, sudah tiba masanya untuk naik taraf. Pilih format yang sesuai dengan medium (awan, mudah alih, AI) dan masa depan akan berterima kasih.
Tag: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024