TL;DR

Desde 2010, los formatos de archivo han pasado de ser bloques propietarios centrados en el escritorio a contenedores abiertos, nativos en la nube y listos para IA. Los cambios más importantes son:

  • Almacenamiento primero en la nube – los formatos ahora admiten transmisión, lecturas parciales y colaboración en tiempo real (Google Docs, Office 365).
  • Impulso de estándares abiertos – los códecs libres de regalías (AV1, AVIF, WebP) y los formatos de datos (Parquet, Arrow) dominan para evitar el bloqueo del proveedor.
  • Compresión y eficiencia de ancho de banda – HEVC, AV1, JPEG‑XL, Zstandard y Brotli reducen el tamaño de los archivos entre un 30‑60 % manteniendo la calidad.
  • Metadatos, seguridad y procedencia – XMP/EXIF más ricos, firmas digitales y contenedores encriptados protegen la integridad y cumplen con las exigencias regulatorias.
  • Estructuras listas para IA y auto‑descriptivas – TFRecord, Parquet y Arrow permiten que las máquinas lean datos sin analizadores personalizados, impulsando pipelines de big data y cargas de trabajo de ML.

¿Por qué la última década importa?

Cuando abrías un archivo en 2010, normalmente era un artefacto estático y local: un PDF que imprimías, un JPEG que enviabas por correo o un ZIP que almacenabas en un disco duro. Avanzando rápidamente a 2024, el mismo archivo podría vivir en un bucket en la nube, ser editado simultáneamente por decenas de usuarios y llevar una firma criptográfica que demuestra quién lo creó. Esta transformación está impulsada por tres macro‑tendencias:

TendenciaImpacto en los formatosEjemplo del mundo real
Escritorio → Nativo en la nubeNecesidad de lecturas en streaming, actualizaciones parciales y metadatos colaborativos.Google Docs almacena cada documento como un contenedor basado en JSON que puede ser editado por varios usuarios en tiempo real.
Código abierto y estándar abiertoLos formatos se vuelven libres de regalías, interoperables y a prueba de futuro.El códec de video AV1 (libre de regalías) ahora impulsa las transmisiones 4K de YouTube, reemplazando costosas licencias de H.264/HEVC.
Compresión y ancho de bandaMayor eficiencia para video 4K/8K, imágenes HDR y conjuntos de datos masivos.Las fotos HEIC de Apple son aproximadamente la mitad del tamaño de los JPEG, extendiendo la vida del almacenamiento del iPhone.

Estas fuerzas se extienden a todos los dominios—documentos, imágenes, audio, video, archivos y contenedores de big data—obligando a los organismos de estándares (ISO, W3C, IETF, AOM) a iterar más rápido que nunca.


Formatos de documentos y datos: de PDF a Parquet

Los documentos se vuelven seguros, buscables y ricos en multimedia

  • PDF 2.0 (ISO 32000‑2, 2021) añadió criptografía más fuerte, metadatos XMP más ricos y mejor accesibilidad. También introdujo PDF/A‑4 para archivado a largo plazo con procedencia incrustada.
  • Office Open XML (OOXML) se mantuvo al día con la coautoría en tiempo real en Office 365, incrustando activos vinculados a la nube directamente en el paquete del archivo.
  • OpenDocument Format (ODF) ganó tracción en administraciones públicas europeas gracias a los mandatos de la UE para estándares abiertos y libres de regalías.
  • ePub 3.x convirtió los libros electrónicos en páginas web completas (HTML5, MathML, audio/video), permitiendo libros de texto interactivos y audiolibros.

Los pipelines de big data migraron a contenedores auto‑descriptivos y columnares

  • Parquet se convirtió en el formato de almacenamiento de facto para Spark, Hive y Presto, ofreciendo push‑down de predicados y compresión eficiente.
  • Apache Arrow introdujo un diseño columnar en memoria, independiente del lenguaje, que permite intercambio de datos sin copias entre Python, Java y Rust.
  • Avro y ORC siguen siendo populares para streaming (Kafka) y cargas de trabajo de Hive, respectivamente, porque almacenan el esquema junto con los datos, simplificando la evolución.

¿El resultado neto? Un documento o conjunto de datos puede viajar entre nubes, ser indexado por IA y conservar su historial de auditoría completo sin un bloqueo propietario.


Imágenes, audio y video: la carrera armamentista de la compresión

Imágenes – HDR, animación y decodificación progresiva

  • HEIF/HEIC (2015) aprovechó la compresión HEVC para reducir a la mitad el tamaño de los archivos JPEG mientras soportaba profundidad de 16 bits y HDR. Apple lo convirtió en predeterminado en iOS 11, impulsando el ecosistema hacia fotos de gama más amplia.
  • AVIF (2020‑2024), construido sobre el códec AV1, ahora ofrece una reducción del 50 % del tamaño frente a JPEG con soporte sin pérdidas y HDR. Chrome, Firefox y Android incluyen decodificadores nativos.
  • JPEG‑XL (2022) promete modos sin pérdida y con pérdida, renderizado progresivo y compresión superior frente a WebP y AVIF, y ya es usado por Cloudflare para la entrega de imágenes.
  • WebP añadió animación, mejoras sin pérdida y soporte de perfiles ICC en la versión 1.2, convirtiéndolo en el formato preferido para gráficos web en Chrome y Android.

Audio – Transmisión de baja latencia y sin pérdida

  • Opus (RFC 6716, 2012) se convirtió en el códec predeterminado para WebRTC, Discord y Zoom, ofreciendo voz de alta calidad a menos de 64 kbps con latencia inferior a 10 ms.
  • FLAC experimentó un resurgimiento cuando servicios premium (Tidal, Qobuz) añadieron niveles sin pérdida, mientras que ALAC se volvió libre de regalías después de que Apple lo hiciera de código abierto en 2011.
  • Los emergentes MPEG‑H 3D Audio y Dolby Atmos ADM están sentando las bases para archivos de audio espacial que pueden transmitirse junto con video.

Video – Del dominio de H.264 al AV1 libre de regalías

  • HEVC/H.265 (2013) redujo la tasa de bits en ~50 % frente a H.264, permitiendo transmisión 4K y 8K con ancho de banda limitado.
  • VP9 (2013) y AV1 (especificación publicada 2018, uso en producción 2020+) ofrecieron alternativas libres de regalías; AV1 ahora cuenta con aceleración por hardware en Intel Xe, Nvidia RTX 40 y Apple Silicon.
  • HEVC‑SCC (2023) optimizó la codificación de contenido de pantalla para escritorios remotos y juegos en la nube, reduciendo artefactos en texto y elementos de UI.
  • Convergencia de contenedores: ISO‑BMFF (MP4) y WebM ahora soportan múltiples códecs, subtítulos y metadatos HDR, simplificando la transmisión adaptativa (MPEG‑DASH, HLS).

¿Qué sigue? Formatos integrados con IA, con procedencia primero y contenedores unificados

  • Formatos listos para IA – El borrador PDF 3.0 (2024) propone gráficos de inferencia incrustados, permitiendo texto escaneado buscable sin pipelines de OCR separados.
  • Procedencia respaldada por blockchain – Proyectos como los archivos IPFS CAR incrustan hashes de árbol Merkle, permitiendo distribución a prueba de manipulaciones para datos científicos y arte digital.
  • Contenedores de audio espacialMPEG‑H 3D Audio y Dolby Atmos ADM están pasando de la radiodifusión al streaming de consumo, exigiendo nuevos envoltorios de archivo que transporten metadatos de audio basados en objetos.
  • Conceptos de Contenedor Multimedia Unificado (UMC) – Las discusiones en el grupo de trabajo ISO‑BMFF buscan crear un contenedor único que pueda contener video, audio, subtítulos, geometría 3D (glTF) y metadatos AR, reduciendo la “malabares de formatos” en experiencias inmersivas.
  • Firmas post‑cuánticas – Experimentos tempranos incrustan firmas Dilithium o Falcon en PDF/A‑4 y ODF, preparándose para un futuro donde RSA/ECDSA clásico pueda ser vulnerable.

Para desarrolladores y creadores de contenido, la conclusión es clara: elijan ahora formatos abiertos y auto‑descriptivos. Será más fácil asegurarlos, más barato licenciar y estarán listos para los pipelines impulsados por IA que dominarán la próxima década.


Hoja de referencia rápida (de un vistazo)

Dominio2010‑20152016‑20202021‑2024
ImágenesJPEG, PNG, WebP tempranoHEIF/HEIC, AVIF (beta)AVIF 1.1, JPEG‑XL, WebP 1.2
VideoH.264, VP8, HEVC tempranoVP9, AV1 (especificación), HEVC dominanteAV1 amplio, VVC temprano, HEVC‑SCC
AudioAAC, MP3, FLACOpus, ALAC de código abierto, crecimiento de FLACOpus 1.3, MPEG‑H 3D Audio
DocumentosPDF 1.7, ODF 1.2PDF 2.0, OOXML 2016, EPUB 3PDF 3.0 borrador, ODF 1.4, EPUB 4 (borrador)
ArchivosZIP, RAR, 7zZstandard, Brotli, LZ4Zstd 1.5+, Brotli 1.1
Big DataCSV, JSON, XMLParquet, Arrow, AvroDelta Lake, Iceberg, Feather v2
3D/AROBJ, FBXglTF 2.0, USDZUSD v23, glTF‑KTX2 (texturas comprimidas)

Si todavía almacenas todo como un ZIP simple, es hora de actualizar. Elige un formato que coincida con el medio (nube, móvil, IA) y el futuro te lo agradecerá.


Etiquetas: #file-formats #tech-history #cloud-native
Slug: file-formats-history-2010-2024