Last Updated: 08 Oct, 2025

Title - How Do I Convert a PDF to MS Word Documents via PHP APIs?

Lavorare con i PDF nelle applicazioni web è diventato un requisito comune in tutti i settori. Che si gestiscano fatture, contratti o contenuti accademici, essere in grado di convertire documenti PDF in formati modificabili come Microsoft Word (DOCX) è essenziale. Fortunatamente, con l’aiuto di potenti API PHP gratuite, gli sviluppatori possono automatizzare e semplificare questo processo con facilità.

Perché convertire PDF in Word in PHP?

I file PDF sono eccellenti per la distribuzione perché preservano layout e design. Tuttavia, modificarli non è sempre semplice. I documenti Word, d’altra parte, sono altamente modificabili, il che li rende ideali per attività che richiedono interazione con l’utente, aggiornamenti o collaborazione. Una soluzione basata su PHP consente agli sviluppatori di:

  • Abilita la conversione batch lato server da PDF a Word () 3
  • Integra flussi di lavoro di modifica dei documenti nelle app web
  • Automatizza la generazione di report e l’elaborazione dei documenti
  • Consenti agli utenti finali di scaricare versioni modificabili dei propri file

Ecco alcune delle API e librerie PHP più affidabili e gratuite che possono aiutarti a eseguire la conversione da PDF a Word con una configurazione minima.

PHPWord con un parser PDF

Per un maggiore controllo sul processo di conversione, è possibile combinare la potenza di PHPWord, una libreria per la creazione e la manipolazione di documenti Word, con una libreria di parsing PDF.

Spiegazione dell’esempio di codice:

Questo esempio utilizza innanzitutto la libreria PDFParser per leggere il PDF ed estrarre il testo da ogni pagina. Quindi, utilizza PHPWord per creare un nuovo documento Word e aggiungervi il testo estratto. Questo metodo offre un controllo preciso sull’output, consentendo di formattare il testo e aggiungere altri elementi secondo necessità.

require_once 'vendor/autoload.php';

// Crea un nuovo oggetto parser PDF
$parser = new \Smalot\PdfParser\Parser();

// Analizza il file PDF
$pdf = $parser->parseFile('percorso/del/tuo/documento.pdf');

// Recupera tutte le pagine dal PDF
$pages = $pdf->getPages();

// Crea un nuovo oggetto PHPWord
$phpWord = new \PhpOffice\PhpWord\PhpWord();

// Aggiungi una sezione al documento Word
$section = $phpWord->addSection();

// Esegue un ciclo su ogni pagina del PDF
foreach ($pages as $page) {
// Estrae il testo dalla pagina
$text = $page->getText();
// Aggiungi il testo al documento Word
$section->addText($text);
}

// Salva il documento Word
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2007');
$objWriter->save('output.docx');

echo "Estrazione del contenuto PDF e salvataggio in Word riusciti!";

Spatie PDF-to-Text + PHPWord (Conversione basata su testo)

Se i tuoi file PDF contengono principalmente testo semplice (non tabelle o immagini complesse), puoi combinare le librerie open source Spatie PDF-to-Text e PHPWord per una pipeline di conversione leggera.

Come funziona?

Questo è il metodo più semplice se hai accesso ad Adobe Acrobat Pro.

Passaggi:

  1. Per prima cosa, è necessario utilizzare l’API Spatie\PdfToText, che estrae il testo normale dai PDF.
  2. La libreria PHPWord viene utilizzata per generare un documento Word con il contenuto estratto.
  3. Ideale per PDF di solo testo senza formattazioni complesse.

Ecco un esempio di codice che mostra come estrarre il testo da un file PDF e quindi generare un documento Word con il contenuto estratto utilizzando la libreria PHPWord.

PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();

Gotenberg tramite PHP (microservizio Docker Open Source)

Gotenberg è un microservizio open source per la conversione di documenti che può essere integrato con PHP tramite richieste HTTP. È ideale per gli sviluppatori che preferiscono strumenti basati su Docker.

Come funziona?

  • Gotenberg utilizza LibreOffice nel backend per convertire i PDF.
  • Si invia una richiesta POST con il file PDF.
  • Il server restituisce il documento DOCX.
Code Snippet (PHP + Gotenberg)

Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);

$data = [
    [
        'name'     => 'files',
        'contents' => fopen('input.pdf', 'r'),
        'filename' => 'input.pdf'
    ]
];

curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);

echo "Conversion done via Gotenberg!";

Aspose.PDF Cloud per PHP (Livello Gratuito)

Aspose.PDF Cloud PHP SDK fornisce un potente SDK PHP che consente agli sviluppatori software di convertire file PDF in formato Word direttamente utilizzando la loro API cloud. Puoi iniziare gratuitamente con chiamate API limitate. Ecco un semplice esempio che mostra come gli sviluppatori software possono caricare e convertire un file PDF in documenti Microsoft Word DOCX utilizzando comandi PHP.

Esempio di codice:

use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);

Considerazioni finali

Convertire file PDF in documenti Word utilizzando PHP non deve essere complesso o costoso. Con gli strumenti e le librerie gratuiti giusti, gli sviluppatori possono offrire agli utenti esportazioni di documenti fluide e modificabili, potenziare l’automazione dei documenti e migliorare la produttività complessiva. Che tu preferisca wrapper PHP leggeri o API robuste basate sul cloud, c’è una soluzione adatta alle tue esigenze.

FAQ

D: Posso convertire PDF in Word in PHP senza utilizzare API a pagamento?

R: Sì, puoi utilizzare gratuitamente librerie open source come Spatie, PHPWord e LibreOffice CLI.

D: La conversione open source da PDF a Word supporta immagini e formattazione?

R: Gli strumenti di base non lo supportano, ma l’utilizzo di LibreOffice o Gotenberg preserva layout e immagini.

D: È possibile automatizzare la conversione da PDF a DOCX nelle app web PHP?

R: Assolutamente sì: queste librerie possono essere integrate in qualsiasi flusso di lavoro basato su PHP.

Vedi anche