Ultimo Aggiornamento: 15 Gen, 2025

Titolo - Estrai Testo da File PDF Usando Python

Estrai Testo da File PDF Usando Python

In questo articolo, ti faremo sapere come estrarre testo da un file PDF usando Python.

PDF sta per Portable Document Format, un formato digitale di documento molto popolare. Questo formato è progettato per permettere ai documenti di essere visualizzati o condivisi in modo semplice e affidabile, indipendentemente dal software, hardware o sistema operativo. I file PDF hanno l’estensione .pdf.

Per estrarre testo da un file PDF usando Python, queste librerie sono comunemente usate. Mostreremo come estrarre testo da un PDF usando entrambe.

  1. pypdf
  2. PyMuPDF

Come Estrarre Testo da un File PDF Usando pypdf in Python

Ecco i passaggi.

  1. Installa pypdf
  2. Esegui il codice fornito in questo articolo
  3. Guarda l’output

Installa pypdf

Puoi installare pypdf usando il seguente comando

pip install pypdf

Codice di Esempio per Estrarre Testo da PDF usando pypdf

sample.pdf - Link per il Download (Questo PDF di esempio verrà usato nel codice, ma puoi certamente usare il tuo PDF.)

screenshot di sample.pdf

Screenshot PDF di Esempio

Codice

Ecco un esempio completo di codice per estrarre testo da un PDF usando pypdf.

Output

Ecco l’output del codice di esempio fornito sopra.

Come Estrarre Testo da un File PDF Usando PyMuPDF in Python

Ecco i passaggi.

  1. Installa PyMuPDF
  2. Esegui il codice fornito in questo articolo
  3. Guarda l’output

Installa PyMuPDF

Installa PyMuPDF, noto anche come fitz, usando il seguente comando.

pip install pymupdf

Codice di Esempio per Estrarre Testo da PDF usando PyMuPDF

Abbiamo usato lo stesso pdf usato prima

sample.pdf - Link per il Download (Questo PDF di esempio verrà usato nel codice, ma puoi certamente usare il tuo PDF.)

Codice

Ecco un esempio completo di codice per estrarre testo da un PDF usando PyMuPDF.

Output

Ecco l’output del codice di esempio fornito sopra.

Conclusione

In questo articolo, forniamo un codice Python di esempio, un file di esempio, e il loro output per dimostrare come estrarre testo da un PDF usando due librerie: PyPDF e PyMuPDF.

Se hai domande o incontri problemi nell’eseguire il codice, sentiti libero di lasciare un commento nei nostri forum!

Vedi Anche