Formatos de archivo importantes en 2020: Lo que todo creador, desarrollador y científico de datos debe saber
TL;DR – 2020 fue el año en que los formatos de archivo se volvieron más ligeros, inteligentes y abiertos. El tráfico móvil‑first, 5G y la colaboración basada en la nube impulsaron nuevos estándares de compresión (WebP, AVIF, AV1) y almacenes de datos columnares (Parquet, ORC). Los PDF siguieron siendo el rey de los documentos estáticos, mientras que Markdown, JSON y ONNX se convirtieron en la lingua‑franca para desarrolladores y pipelines de IA.
Introducción
Si todavía usabas los mismos tipos de archivo que aprendiste en 2010, 2020 probablemente se sintió como un cambio sísmico. Más del 70 % del tráfico web provenía ahora de smartphones, 5G hizo realidad el streaming de alta resolución y las suites en la nube convirtieron la “edición en vivo” en un flujo de trabajo predeterminado. Toda esa presión obligó a la industria a adoptar formatos que son más pequeños, más rápidos y más interoperables. A continuación tienes un recorrido rápido por los formatos que definieron el año, por qué fueron importantes y dónde probablemente los volverás a ver en 2021‑24.
1. Formatos de documento y texto – De PDF a Markdown
| Formato | Estado 2020 | Por qué fue importante | Casos de uso típicos |
|---|---|---|---|
| PDF (ISO 32000‑2 / PDF 2.0) | Sigue siendo el estándar de facto para documentos imprimibles y estáticos. | Mejor accesibilidad, firmas digitales y soporte para 3‑D incrustado, video y formularios interactivos. | Contratos, facturas electrónicas, formularios gubernamentales, libros electrónicos. |
| DOCX / ODT | DOCX domina los entornos corporativos; ODT tiene aproximadamente el 5 % de cuota de mercado. | Open‑XML es un contenedor ZIP de XML + medios, que permite un seguimiento granular de cambios y seguridad sin macros. ODT es libre de royalties y favorecido por suites de código abierto. | Procesamiento de texto, edición colaborativa (OneDrive, Nextcloud). |
| EPUB 3.2 | Aumento del 12 % en ventas de libros electrónicos; EPUB 3.2 se convirtió en el estándar recomendado. | Reutiliza HTML5, CSS3, SVG; soporta audio, video, MathML; independiente de DRM. | Libros electrónicos, libros de texto digitales, publicaciones interactivas. |
| Markdown (.md) | Crecimiento explosivo en documentación de desarrolladores, generadores de sitios estáticos (Jekyll, Hugo). | Texto plano, legible por humanos, fácil conversión a HTML/PDF; extensible mediante GitHub‑Flavored Markdown (GFM). | Archivos README, blogs, documentación técnica. |
Los formatos de edición en vivo (Google Docs, Office Online) siguen existiendo como blobs JSON propietarios en la nube, pero todos exportan a PDF/DOCX para archivado a largo plazo.
Consejo rápido
Si necesitas un documento que sobreviva una década de cambios de software, exporta a PDF 2.0. Para escritura colaborativa, mantén la fuente en Google Docs o Office Online, y luego archiva la versión final como PDF o DOCX.
2. Imagen, vídeo y audio – La carrera de compresión
Imágenes
| Formato | Relevancia 2020 | Ventajas clave |
|---|---|---|
| JPEG | Más del 80 % de las imágenes web. | Compresión DCT con pérdida básica, soporte universal. |
| PNG | Preferido para recursos UI sin pérdida. | Compresión Deflate, canal alfa, sin patentes. |
| WebP | Uso incrementado ~30 % interanual (Chrome 86+). | 26 % más pequeño que JPEG con calidad comparable; soporta animación y transparencia. |
| HEIF/HEIC | Adoptado por iOS 11+ y Android 9+. | Reducción de tamaño de hasta el 50 % frente a JPEG; basado en codificación intra‑frame HEVC. |
| AVIF (emerging) | Navegadores adoptantes tempranos (Firefox 78, Chrome 85) lo soportan. | Basado en AV1, 30‑50 % mejor compresión que WebP, listo para HDR. |
Conclusión: La web se está moviendo hacia formatos libres de royalties y optimizados para la web—WebP ya es dominante, y AVIF está listo para reemplazar a JPEG en imágenes de alta calidad y bajo ancho de banda.
Vídeo y animación
| Formato | Panorama 2020 | Aspectos destacados |
|---|---|---|
| MP4 (ISO Base Media File Format) | ≈ 95 % de las entregas de streaming. | Soporta H.264/AVC, H.265/HEVC, AAC; funciona con DASH y HLS. |
| MKV (Matroska) | Ganando tracción para contenido 4K/HDR. | Pistas ilimitadas, subtítulos, capítulos; sin tarifas de licencia. |
| WebM | Predeterminado para <video> HTML5 en Chrome/Firefox. | Vídeo VP9 + audio Opus, libre de royalties, streaming de bajo bitrate. |
| AV1 (inside .mkv/.mp4) | Netflix y YouTube inician transmisiones experimentales AV1. | 30‑50 % mejor compresión que HEVC; libre de pools de patentes. |
| HEVC (H.265) | Sigue dominante para Blu‑ray 4K/UHD y algunos servicios OTT. | Reducción del bitrate del 50 % frente a H.264; la complejidad de licencias limita su uso en la web. |
Ejemplo del mundo real: Netflix comenzó a ofrecer títulos codificados en AV1 en 2020, reduciendo el ancho de banda de las transmisiones 4K HDR en aproximadamente un tercio.
Audio
| Formato | Posición 2020 | Puntos clave |
|---|---|---|
| MP3 | Más del 70 % de las bibliotecas de audio de los consumidores (legado). | 128‑320 kbps, soporte universal de hardware. |
| AAC | Preferido para streaming bajo demanda (Spotify, Apple Music). | Mejor calidad al mismo bitrate que MP3. |
| Opus | Adopción rápida en WebRTC, Discord, podcasts. | Baja latencia, bitrate variable 6‑510 kbps; sobresale en voz y música. |
| FLAC | Crecimiento del 15 % interanual en el mercado de audio de alta resolución. | Sin pérdida, código abierto, metadatos ricos. |
| ALAC | Nicho, ligado al ecosistema Apple. | Misma compresión que FLAC, pero en contenedor .m4a. |
Conclusión: Opus es la opción para comunicación en tiempo real, AAC para streaming de música, y FLAC/ALAC para audio de grado archivístico.
3. Datos e intercambio – De CSV a lagos columnares
| Formato | Por qué es importante en 2020 | Escenarios típicos |
|---|---|---|
| CSV | Sigue siendo el formato de intercambio de datos más simple; > 50 % de importaciones/exportaciones. | Volcados de hojas de cálculo, trabajos ETL rápidos. |
| JSON | Domina las API web públicas (≈ 85 %). | Servicios RESTful, archivos de configuración, NoSQL (MongoDB). |
| XML | En declive para nuevas API pero arraigado en la empresa (SOAP, Office Open XML). | Sistemas heredados, estándares de la industria (HL7, XBRL). |
| Parquet | Almacenamiento columnar para big data; reducción del 30 % del tamaño frente a CSV. | Lagos de datos, pipelines analíticos Spark/Hive. |
| ORC | Compite con Parquet; favorecido por Hive/Presto. | Procesamiento por lotes a gran escala. |
| Avro | Amigable con evolución de esquemas; usado con Kafka. | Streaming en tiempo real, event sourcing. |
| Protocol Buffers | Formato binario compacto para gRPC. | Microservicios de alto rendimiento. |
| GeoJSON | Estándar para datos GIS en la web. | Aplicaciones de mapeo, servicios basados en ubicación. |
Conceptos clave para recordar
- Evolución de esquemas – Avro y Parquet permiten agregar campos sin romper trabajos posteriores.
- Autodescriptivo vs. binario – JSON/XML son legibles por humanos; Protobuf/Avro son compactos pero requieren un archivo de esquema.
- Diseño columnar – Ideal para consultas analíticas porque solo se leen las columnas necesarias del disco.
Consejo profesional: Al construir un lago de datos, almacena la ingestión cruda como Parquet (o ORC) y conserva una copia JSON para inspección rápida.
4. Formatos emergentes y de nicho que vale la pena observar
| Formato | Aspecto destacado 2020 |
|---|---|
| ONNX | Más del 30 % de los nuevos modelos de deep learning exportados en 2020; permite portabilidad entre frameworks. |
| Brotli (.br) | 70 % del tráfico de Chrome comprimido con Brotli para HTML/CSS/JS. |
| SVG | Soporte completo en navegadores; la opción para íconos responsivos y visualizaciones de datos. |
| GLTF/GLB | “JPEG del 3‑D”; ganando tracción para AR/VR basados en web (Sketchfab, Babylon.js). |
| Zstandard (zstd) | Compresión rápida y de alta relación; adoptada para imágenes de contenedores y parches del kernel Linux. |
| Contenedores basados en HEVC (HEIF/HEIC, MP4) | Aún con patentes, pero dominan la captura de fotos móviles y video 4K. |
Estos formatos aún no son universales, pero son los espacios de adopción temprana donde surgirán los próximos grandes estándares.
5. Tendencias generales en todas las categorías
- Código abierto y libre de royalties – WebP → AVIF, AV1, Opus, Brotli, Parquet.
- Eficiencia de compresión – Reducciones de tamaño del 30‑50 % son ahora una ventaja competitiva para móvil y streaming.
- Metadatos y accesibilidad – PDF 2.0, EPUB 3.2 y HEIF añaden etiquetas más ricas, subtítulos y perfiles de color.
- Interoperabilidad multiplataforma – Blobs JSON nativos de la nube (Google Docs) exportan a formatos universalmente legibles.
- Seguridad y procedencia – Firmas digitales (PDF‑DS), ZIP‑AES encriptado y JWT firmados están convirtiéndose en obligatorios para el cumplimiento.
- Datos preparados para IA – Formatos columnares y de evolución de esquemas (Parquet, ORC) y intercambio de modelos (ONNX) son esenciales en pipelines modernos de ciencia de datos.
Conclusión
2020 obligó al ecosistema de formatos de archivo a evolucionar de “simplemente hacer el trabajo” a “hacerlo de manera eficiente, segura y a prueba de futuro.” El consumo móvil primero, el ancho de banda 5G y la colaboración en la nube convirtieron al tamaño, la velocidad y la apertura en la nueva trinidad sagrada. Ya seas un mercadólogo que exporta un PDF, un desarrollador que escribe documentación en Markdown, un ingeniero de datos que construye un lakehouse, o un productor de vídeo que transmite en 4K, los formatos que elijas hoy determinarán cuánto pagas por ancho de banda, cuán fácil es colaborar y si tus activos sobreviven los próximos cinco años.
Conclusión: Adopta los formatos libres de royalties y de compresión inteligente (WebP, AVIF, AV1, Parquet, Opus) para trabajos nuevos, pero mantén una ruta de exportación fiable a los estándares probados (PDF, JPEG, MP4, CSV) para archivado y compatibilidad.
Tags: file-formats 2020-tech-trends digital-media
Slug: important-file-formats-2020