2020년 중요한 파일 형식: 모든 크리에이터, 개발자 및 데이터 과학자가 알아야 할 내용
TL;DR – 2020년은 파일 형식이 더 가볍고, 더 똑똑하며, 더 개방적으로 변한 해였습니다. 모바일 우선 트래픽, 5G, 클라우드 기반 협업이 새로운 압축 표준(WebP, AVIF, AV1)과 컬럼형 데이터 저장소(Parquet, ORC)를 촉진했습니다. PDF는 정적 문서의 왕으로 남았으며, Markdown, JSON, ONNX는 개발자와 AI 파이프라인의 공통 언어가 되었습니다.
소개
2010년에 배운 파일 유형을 아직도 사용하고 있었다면, 2020년은 지진 같은 변화를 느꼈을 것입니다. 웹 트래픽의 70 % 이상이 스마트폰에서 발생했으며, 5G는 고해상도 스트리밍을 현실로 만들었고, 클라우드 스위트는 “실시간 편집”을 기본 워크플로우로 전환시켰습니다. 이러한 압력은 업계가 더 작고, 더 빠르고, 더 상호 운용 가능한 형식을 채택하도록 만들었습니다. 아래는 그 해를 정의한 형식들을 빠르게 살펴보는 투어이며, 왜 중요한지, 그리고 2021‑24년에 다시 보게 될 가능성이 높은 이유를 정리했습니다.
1. 문서 및 텍스트 형식 – PDF에서 Markdown까지
| 형식 | 2020 상태 | 왜 중요한가 | 일반적인 사용 사례 |
|---|---|---|---|
| PDF (ISO 32000‑2 / PDF 2.0) | 인쇄 가능한 정적 문서의 사실상 표준으로 여전히 사용됩니다. | 접근성 향상, 디지털 서명, 그리고 3‑D, 비디오, 인터랙티브 폼 삽입 지원이 개선되었습니다. | 계약서, 전자청구서, 정부 양식, 전자책. |
| DOCX / ODT | DOCX가 기업 환경을 장악하고 있으며, ODT는 약 5 %의 시장 점유율을 가지고 있습니다. | Open‑XML은 XML과 미디어를 포함한 ZIP 컨테이너로, 세밀한 변경 추적과 매크로 없는 보안을 가능하게 합니다. ODT는 로열티가 없으며 오픈소스 제품군에서 선호됩니다. | 워드 프로세싱, 협업 편집 (OneDrive, Nextcloud). |
| EPUB 3.2 | 전자책 판매가 12 % 증가했으며, EPUB 3.2가 권장 표준이 되었습니다. | HTML5, CSS3, SVG를 재사용하고, 오디오, 비디오, MathML을 지원하며 DRM에 구애받지 않습니다. | 전자책, 디지털 교과서, 인터랙티브 출판물. |
| Markdown (.md) | 개발자 문서와 정적 사이트 생성기(Jekyll, Hugo)에서 폭발적인 성장. | 플레인 텍스트이며 인간이 읽기 쉬우며 HTML/PDF로 손쉽게 변환됩니다; GitHub‑Flavored Markdown(GFM)을 통해 확장 가능합니다. | README 파일, 블로그, 기술 문서. |
실시간 편집 형식(Google Docs, Office Online)은 여전히 클라우드에 프로프라이어터리 JSON 블롭 형태로 존재하지만, 장기 보관을 위해 모두 PDF/DOCX로 내보낼 수 있습니다.
빠른 팁
소프트웨어 변화가 10년 이상 지속될 문서가 필요하다면 PDF 2.0으로 내보내세요. 협업 작성을 위해서는 Google Docs 또는 Office Online에 소스를 유지하고, 최종 버전을 PDF 또는 DOCX로 보관하십시오.
2. 이미지, 비디오 및 오디오 – 압축 무기 경쟁
이미지
| 형식 | 2020 관련성 | 주요 장점 |
|---|---|---|
| JPEG | 웹 이미지의 80 % 이상을 차지합니다. | 기본 손실 DCT 압축, 보편적 지원. |
| PNG | 무손실 UI 자산에 선호됩니다. | Deflate 압축, 알파 채널, 특허 없음. |
| WebP | 사용량이 연간 약 30 % 증가 (Chrome 86+). | 동일 품질에서 JPEG보다 26 % 작으며, 애니메이션 및 투명도 지원. |
| HEIF/HEIC | iOS 11+와 Android 9+에서 채택. | JPEG 대비 최대 50 % 크기 감소; HEVC intra‑frame 코딩 기반. |
| AVIF (신규) | Firefox 78, Chrome 85 등 초기 채택 브라우저에서 지원. | AV1 기반, WebP보다 30‑50 % 우수한 압축, HDR 지원. |
요점: 웹은 로열티 프리, 웹 최적화 형식으로 이동하고 있습니다—WebP는 현재 주류이며, AVIF는 고품질·저대역폭 이미지에서 JPEG를 대체할 준비가 되어 있습니다.
비디오 및 애니메이션
| 형식 | 2020 상황 | 주요 특징 |
|---|---|---|
| MP4 (ISO Base Media File Format) | 스트리밍 전달의 약 95 %를 차지합니다. | H.264/AVC, H.265/HEVC, AAC 지원; DASH·HLS와 호환. |
| MKV (Matroska) | 4K/HDR 콘텐츠에서 점차 주목받고 있습니다. | 트랙 무제한, 자막·챕터 지원, 라이선스 비용 없음. |
| WebM | Chrome·Firefox에서 HTML5 <video> 기본값. | VP9 비디오 + Opus 오디오, 로열티 프리, 저비트레이트 스트리밍. |
| AV1 (내부 .mkv/.mp4) | Netflix·YouTube가 실험적 AV1 스트림 시작. | HEVC 대비 30‑50 % 우수한 압축, 특허 풀 없음. |
| HEVC (H.265) | 4K/UHD 블루레이와 일부 OTT 서비스에서 여전히 우세. | H.264 대비 50 % 비트레이트 감소; 라이선스 복잡성으로 웹 사용 제한. |
실제 사례: Netflix는 2020년에 AV1 인코딩 타이틀을 제공하기 시작했으며, 4K HDR 스트리밍에 필요한 대역폭을 약 1/3 수준으로 줄였습니다.
오디오
| 형식 | 2020 위치 | 핵심 포인트 |
|---|---|---|
| MP3 | 소비자 오디오 라이브러리의 70 % 이상 (레거시). | 128‑320 kbps, 보편적 하드웨어 지원. |
| AAC | 주문형 스트리밍(Spotify, Apple Music)에서 선호. | MP3와 동일 비트레이트에서 더 나은 품질. |
| Opus | WebRTC, Discord, 팟캐스트에서 급속 채택. | 저지연, 6‑510 kbps 가변 비트레이트; 음성·음악 모두 우수. |
| FLAC | 고해상도 오디오 시장이 연간 15 % 성장. | 무손실, 오픈 소스, 풍부한 메타데이터. |
| ALAC | 애플 생태계에 한정된 틈새 시장. | FLAC과 동일 압축률이지만 .m4a 컨테이너 사용. |
핵심 요약: 실시간 통신에는 Opus, 스트리밍 음악에는 AAC, 보관용 고음질 오디오는 FLAC/ALAC가 최적 선택입니다.
3. 데이터 및 교환 – CSV에서 컬럼형 레이크까지
| 형식 | 2020에 중요한 이유 | 일반적인 시나리오 |
|---|---|---|
| CSV | 가장 단순한 데이터 교환 형식; 수입·수출의 50 % 이상을 차지. | 스프레드시트 덤프, 빠른 ETL 작업. |
| JSON | 공개 웹 API의 약 85 %를 장악. | RESTful 서비스, 설정 파일, NoSQL(MongoDB). |
| XML | 신규 API에서는 감소 추세지만, 엔터프라이즈(SOAP, Office Open XML)에서는 여전히 사용. | 레거시 시스템, 산업 표준(HL7, XBRL). |
| Parquet | 빅데이터용 컬럼형 저장소; CSV 대비 30 % 크기 감소. | 데이터 레이크, Spark·Hive 분석 파이프라인. |
| ORC | Parquet과 경쟁; Hive·Presto에서 선호. | 대규모 배치 처리. |
| Avro | 스키마 진화에 친화적; Kafka와 함께 사용. | 실시간 스트리밍, 이벤트 소싱. |
| Protocol Buffers | gRPC용 컴팩트 바이너리 형식. | 고성능 마이크로서비스. |
| GeoJSON | 웹 GIS 데이터 표준. | 지도 앱, 위치 기반 서비스. |
기억해야 할 핵심 개념
- 스키마 진화 – Avro와 Parquet은 필드를 추가해도 하위 작업을 깨뜨리지 않습니다.
- 자체 기술 vs. 바이너리 – JSON/XML은 사람이 읽을 수 있는 반면, Protobuf/Avro는 더 컴팩트하지만 스키마 파일이 필요합니다.
- 컬럼형 레이아웃 – 분석 쿼리 시 필요한 컬럼만 디스크에서 읽어들이므로 효율적입니다.
전문가 팁: 데이터 레이크를 구축할 때는 원시 수집 데이터를 Parquet(또는 ORC)로 저장하고, 빠른 검토를 위해 JSON 사본을 함께 유지하십시오.
4. 주목할 만한 신흥 및 틈새 형식
| 형식 | 2020 하이라이트 |
|---|---|
| ONNX | 2020년에 새로 출시된 딥러닝 모델의 30 % 이상이 ONNX로 내보내져 프레임워크 간 이동성을 확보. |
| Brotli (.br) | Chrome 트래픽의 70 %가 HTML/CSS/JS 압축에 Brotli 사용. |
| SVG | 브라우저 전면 지원; 반응형 아이콘 및 데이터 시각화에 최적. |
| GLTF/GLB | “3‑D의 JPEG”; 웹 기반 AR/VR(Sketchfab, Babylon.js)에서 급부상. |
| Zstandard (zstd) | 빠르고 고압축률; 컨테이너 이미지와 Linux 커널 패치에 채택. |
| HEVC‑based containers (HEIF/HEIC, MP4) | 특허 제약이 있지만 모바일 사진 촬영 및 4K 비디오에서 지배적. |
이 형식들은 아직 보편적이지 않지만, 차세대 표준이 탄생할 초기 채택자들의 놀이터 역할을 하고 있습니다.
5. 모든 카테고리를 아우르는 주요 트렌드
- 오픈소스·로열티 프리 – WebP → AVIF, AV1, Opus, Brotli, Parquet.
- 압축 효율성 – 30‑50 % 크기 감소가 모바일·스트리밍에서 경쟁력의 핵심이 됨.
- 메타데이터·접근성 – PDF 2.0, EPUB 3.2, HEIF가 풍부한 태그·캡션·색상 프로필 제공.
- 크로스 플랫폼 상호 운용성 – 클라우드 네이티브 JSON 블롭(Google Docs)에서 보편적인 형식으로 내보내기.
- 보안·출처 증명 – 디지털 서명(PDF‑DS), 암호화 ZIP‑AES, 서명된 JWT가 규정 준수에 필수.
- AI‑준비 데이터 – 컬럼형·스키마 진화 형식(Parquet, ORC)과 모델 교환(ONNX)이 현대 데이터 사이언스 파이프라인의 핵심.
결론
2020년은 파일 형식 생태계가 **“그냥 하면 된다”**에서 **“효율적이고, 안전하며, 미래 보장”**으로 진화하도록 강요했습니다. 모바일 중심 소비, 5G 대역폭, 클라우드 협업이 크기·속도·개방성을 새로운 성스러운 삼위일체로 만들었습니다. 마케터가 PDF를 내보내든, 개발자가 Markdown 문서를 작성하든, 데이터 엔지니어가 레이크하우스를 구축하든, 혹은 비디오 프로듀서가 4K 스트리밍을 하든, 오늘 선택하는 형식이 다음 5년간의 대역폭 비용, 협업 용이성, 자산 보존 여부를 좌우합니다.
핵심 요약: 새로운 작업에는 로열티 프리·압축 효율이 뛰어난 형식(WebP, AVIF, AV1, Parquet, Opus)을 적극 활용하되, 보관·호환성을 위해 검증된 표준(PDF, JPEG, MP4, CSV)으로 내보내는 경로를 유지하십시오.
태그: file-formats 2020-tech-trends digital-media
슬러그: important-file-formats-2020