OCR fayl formatlarını anlamaq: HOCR vs ALTO vs PDF/A izahı
Son yenilənmə: 05 Jan, 2026
Əgər sənədinizi skan edib mətnin şəkillərdən axtarıla bilən, redaktə edilə bilən məzmuna necə çevrildiyini düşündünüzsə, Optik Simvol Tanıma (OCR) dünyası ilə tanışsınız deməkdir. Lakin hekayə yalnız şəkillərdən mətn çıxarmaqla bitmir. Əsl sehr, bu məlumatın necə saxlanıldığı və strukturlaşdırıldığıdır.
Tarixi arxivləri rəqəmsallaşdırarkən, iş fakturalarını emal edərkən və ya çap olunmuş kitabları rəqəmsal kitabxanalara çevirmək üçün doğru OCR çıxış formatını seçmək kritik əhəmiyyət daşıyır. Bu sahədə üç format üstünlük təşkil edir: HOCR, ALTO və PDF/A.