Formats de fichiers importants en 2020 : Ce que chaque créateur, développeur et data‑scientist doit savoir

TL;DR – 2020 a été l’année où les formats de fichiers sont devenus plus légers, plus intelligents et plus ouverts. Le trafic mobile‑first, la 5G et la collaboration cloud ont favorisé de nouvelles normes de compression (WebP, AVIF, AV1) et des magasins de données columnaires (Parquet, ORC). Les PDF sont restés rois pour les documents statiques, tandis que Markdown, JSON et ONNX sont devenus la lingua‑franca des développeurs et des pipelines d’IA.


Introduction

Si vous utilisiez encore les mêmes types de fichiers que vous avez appris en 2010, 2020 a probablement semblé un bouleversement sismique. Plus de 70 % du trafic web provenait alors des smartphones, la 5G a rendu le streaming haute résolution possible, et les suites cloud ont fait du « live‑edit » un flux de travail par défaut. Toute cette pression a contraint l’industrie à adopter des formats plus petits, plus rapides et plus interopérables. Voici un tour d’horizon éclair des formats qui ont défini l’année, pourquoi ils étaient importants, et où vous les reverrez probablement entre 2021‑24.


1. Formats de documents et de texte – Du PDF au Markdown

FormatStatut 2020Pourquoi c’était importantCas d’utilisation typiques
PDF (ISO 32000‑2 / PDF 2.0)Toujours le standard de facto pour les documents imprimables et statiques.Meilleure accessibilité, signatures numériques, et prise en charge du 3‑D intégré, de la vidéo et des formulaires interactifs.Contrats, factures électroniques, formulaires gouvernementaux, livres numériques.
DOCX / ODTDOCX domine les environnements d’entreprise ; ODT détient environ 5 % du marché.Open‑XML est un conteneur ZIP d’XML + médias, permettant un suivi granulaire des modifications et une sécurité sans macro. ODT est gratuit et privilégié par les suites open‑source.Traitement de texte, édition collaborative (OneDrive, Nextcloud).
EPUB 3.2Hausse de 12 % des ventes de livres numériques ; EPUB 3.2 est devenu le standard recommandé.Réutilise HTML5, CSS3, SVG ; prend en charge l’audio, la vidéo, MathML ; indépendant du DRM.Livres numériques, manuels numériques, publications interactives.
Markdown (.md)Croissance explosive des documents développeurs, générateurs de sites statiques (Jekyll, Hugo).Texte brut, lisible par l’homme, conversion facile en HTML/PDF ; extensible via GitHub‑Flavored Markdown (GFM).Fichiers README, blogs, documentation technique.

Formats d’édition en direct (Google Docs, Office Online) restent des blobs JSON propriétaires dans le cloud, mais ils exportent tous vers PDF/DOCX pour l’archivage à long terme.

Astuce rapide

Si vous avez besoin d’un document qui survivra à une décennie de changements logiciels, exportez-le au format PDF 2.0. Pour l’écriture collaborative, conservez la source dans Google Docs ou Office Online, puis archivez la version finale en PDF ou DOCX.


2. Images, vidéo et audio – La course à la compression

Images

FormatPertinence 2020Avantages clés
JPEGPlus de 80 % des images web.Compression DCT avec perte de base, prise en charge universelle.
PNGPréféré pour les actifs UI sans perte.Compression Deflate, canal alpha, aucun brevet.
WebPUtilisation en hausse d’environ 30 % d’une année sur l’autre (Chrome 86+).26 % plus petit que le JPEG à qualité comparable ; prend en charge l’animation et la transparence.
HEIF/HEICAdopté par iOS 11+ et Android 9+.Réduction de taille jusqu’à 50 % par rapport au JPEG ; basé sur le codage intra‑trame HEVC.
AVIF (emerging)Les navigateurs early‑adopter (Firefox 78, Chrome 85) le supportent.Basé sur AV1, 30‑50 % de compression supérieure à WebP, prêt HDR.

À retenir : Le web se dirige vers des formats libres de droits et optimisés pour le web—WebP est désormais courant, et AVIF est prêt à remplacer le JPEG pour des images haute qualité et à faible bande passante.

Video & Animation

FormatPaysage 2020Points forts
MP4 (ISO Base Media File Format)Environ 95 % des livraisons de streaming.Prend en charge H.264/AVC, H.265/HEVC, AAC ; fonctionne avec DASH & HLS.
MKV (Matroska)Gagne du terrain pour le contenu 4K/HDR.Pistes illimitées, sous‑titres, chapitres ; aucune redevance.
WebMPar défaut pour <video> HTML5 sur Chrome/Firefox.Vidéo VP9 + audio Opus, libre de droits, streaming à faible débit.
AV1 (inside .mkv/.mp4)Netflix et YouTube lancent des flux AV1 expérimentaux.30‑50 % de compression supérieure à HEVC ; sans pool de brevets.
HEVC (H.265)Toujours dominant pour le Blu‑ray 4K/UHD et certains services OTT.Réduction de débit de 50 % par rapport à H.264 ; la complexité des licences limite l’usage web.

Exemple réel : Netflix a commencé à diffuser des titres encodés en AV1 en 2020, réduisant la bande passante des flux 4K HDR d’environ un tiers.

Audio

FormatPosition 2020Points clés
MP3Plus de 70 % des bibliothèques audio grand public (héritage).128‑320 kbps, prise en charge matérielle universelle.
AACPréféré pour le streaming à la demande (Spotify, Apple Music).Meilleure qualité au même débit que le MP3.
OpusAdoption rapide dans WebRTC, Discord, podcasts.Faible latence, débit variable 6‑510 kbps ; excelle pour la parole et la musique.
FLACCroissance de + 15 % d’une année sur l’autre du marché audio haute résolution.Sans perte, open source, métadonnées riches.
ALACDe niche, lié à l’écosystème Apple.Même compression que FLAC, mais dans un conteneur .m4a.

En résumé : Opus est le choix pour la communication en temps réel, AAC pour le streaming musical, et FLAC/ALAC pour l’audio de niveau archivistique.


3. Données et échanges – Du CSV aux lacs columnaires

FormatPourquoi c’est important en 2020Scénarios typiques
CSVToujours le format d’échange de données le plus simple ; plus de 50 % des importations/exportations.Exportations de feuilles de calcul, jobs ETL rapides.
JSONDomine les API web publiques (≈ 85 %).Services RESTful, fichiers de configuration, NoSQL (MongoDB).
XMLEn déclin pour les nouvelles API mais ancré dans l’entreprise (SOAP, Office Open XML).Systèmes hérités, standards industriels (HL7, XBRL).
ParquetStockage columnaire pour le big data ; réduction de taille de 30 % par rapport au CSV.Lacs de données, pipelines analytiques Spark/Hive.
ORCConcurrence avec Parquet ; privilégié par Hive/Presto.Traitement batch à grande échelle.
AvroCompatible avec l’évolution de schéma ; utilisé avec Kafka.Streaming en temps réel, event sourcing.
Protocol BuffersFormat binaire compact pour gRPC.Micro‑services haute performance.
GeoJSONStandard pour les données SIG sur le web.Applications de cartographie, services basés sur la localisation.

Concepts clés à retenir

  • Évolution du schéma – Avro et Parquet vous permettent d’ajouter des champs sans casser les jobs en aval.
  • Auto‑descriptif vs binaire – JSON/XML sont lisibles par l’homme ; Protobuf/Avro sont compacts mais nécessitent un fichier de schéma.
  • Disposition columnaire – Idéale pour les requêtes analytiques car seules les colonnes nécessaires sont lues depuis le disque.

Astuce pro : Lors de la construction d’un lac de données, stockez l’ingestion brute en Parquet (ou ORC) et conservez une copie JSON pour une inspection rapide.


4. Formats émergents et de niche à surveiller

FormatPoint fort 2020
ONNXPlus de 30 % des nouveaux modèles d’apprentissage profond exportés en 2020 ; permet la portabilité inter‑framework.
Brotli (.br)70 % du trafic Chrome compressé avec Brotli pour HTML/CSS/JS.
SVGSupport complet dans les navigateurs ; le choix pour les icônes réactives et les visualisations de données.
GLTF/GLB« JPEG du 3‑D » ; gagne du terrain pour la RA/VR web (Sketchfab, Babylon.js).
Zstandard (zstd)Compression rapide et à haut ratio ; adoptée pour les images de conteneurs et les correctifs du noyau Linux.
HEVC‑based containers (HEIF/HEIC, MP4)Toujours soumis à des brevets, mais dominent la capture photo mobile et la vidéo 4K.

Ces formats ne sont pas encore universels, mais ils constituent les terrain de jeu des early adopters où les prochaines grandes normes émergeront.


5. Tendances générales à travers toutes les catégories

  1. Open‑source et libre de droits – WebP → AVIF, AV1, Opus, Brotli, Parquet.
  2. Efficacité de compression – Les réductions de taille de 30‑50 % sont désormais un avantage concurrentiel pour le mobile et le streaming.
  3. Métadonnées et accessibilité – PDF 2.0, EPUB 3.2 et HEIF ajoutent des balises, légendes et profils couleur plus riches.
  4. Interopérabilité multiplateforme – Les blobs JSON natifs du cloud (Google Docs) exportent vers des formats universellement lisibles.
  5. Sécurité et provenance – Signatures numériques (PDF‑DS), ZIP‑AES chiffré et JWT signés deviennent obligatoires pour la conformité.
  6. Données prêtes pour l’IA – Formats columnaires et évolutifs (Parquet, ORC) et échange de modèles (ONNX) sont au cœur des pipelines de data‑science modernes.

Conclusion

2020 a contraint l’écosystème des formats de fichiers à évoluer de « simplement faire le travail » à « le faire efficacement, en toute sécurité et pérenne ». La consommation mobile‑first, la bande passante 5G et la collaboration cloud ont fait de la taille, de la vitesse et de l’ouverture la nouvelle sainte trinité. Que vous soyez marketeur exportant un PDF, développeur rédigeant des documents Markdown, ingénieur data construisant un lakehouse, ou producteur vidéo diffusant en 4K, les formats que vous choisissez aujourd’hui détermineront le coût de la bande passante, la facilité de collaboration et la pérennité de vos actifs pendant les cinq prochaines années.

En résumé : Adoptez les formats libres de droits et intelligents en compression (WebP, AVIF, AV1, Parquet, Opus) pour les nouveaux travaux, mais conservez un chemin d’exportation fiable vers les standards éprouvés (PDF, JPEG, MP4, CSV) pour l’archivage et la compatibilité.


Tags: file-formats 2020-tech-trends digital-media

Slug: important-file-formats-2020