PDF/A-3 – Hybridihai? Alkuperäisten tietojen upottaminen OCR:si sisään
Viimeksi päivitetty: 29 Dec, 2025
Dokumenttien digitalisoinnin maailmassa OCR (Optinen tekstintunnistus) nähdään usein viimeisenä askeleena — skannaa, tunnista teksti, arkistoi, valmis. Mutta nykyaikaiset vaatimustenmukaisuus-, automaatio- ja dataohjatut työnkulut vaativat enemmän kuin pelkkiä haettavia PDF-tiedostoja. Ne edellyttävät jäljitettävyyttä, koneellisesti luettavaa rakennetta ja pitkäaikaisia arkistointitakuita.
Tässä kohtaa PDF/A-3 astuu kuvaan — usein väärinymmärretty, joskus kiistanalainen ja kiistatta voimakas. Monet kehittäjät kutsuvat sitä “hybridihaiseksi”, koska se mahdollistaa sen, mitä aikaisemmat PDF/A -standardit tiukasti kielsivät: alkuperäisten lähdetiedostojen upottamisen suoraan arkistointiin tarkoitettuun PDF:ään.