Sidst opdateret: 24 Jul, 2025

Titel - Hvordan konverterer jeg en PDF til MS Word-dokumenter via PHP API'er

At arbejde med PDF-filer i webapplikationer er blevet et almindeligt krav på tværs af brancher. Uanset om du håndterer fakturaer, kontrakter eller akademisk indhold, er det essentielt at kunne konvertere PDF-dokumenter til redigerbare formater som Microsoft Word (DOCX). Heldigvis kan udviklere med hjælp fra kraftfulde og gratis PHP‑API’er automatisere og strømline denne proces med lethed.

Hvorfor konvertere PDF til Word i PHP?

PDF-filer er fremragende til distribution, fordi de bevarer layout og design. At redigere dem er dog ikke altid ligetil. Word-dokumenter derimod er meget redigerbare, hvilket gør dem ideelle til opgaver, der kræver brugerinteraktion, opdateringer eller samarbejde. En PHP‑baseret løsning giver udviklere mulighed for:

  • Muliggør server‑side batch PDF-til-Word konvertering
  • Integrer dokumentredigeringsarbejdsgange i webapps
  • Automatiser rapportgenerering og dokumentbehandling
  • Giv slutbrugere mulighed for at downloade redigerbare versioner af deres filer

Her er nogle af de mest pålidelige og gratis PHP‑API’er og biblioteker, der kan hjælpe dig med at udføre PDF‑til‑Word konvertering med minimal opsætning.

PHPWord med en PDF‑parser

For mere kontrol over konverteringsprocessen kan du kombinere kraften fra PHPWord, et bibliotek til at oprette og manipulere Word‑dokumenter, med et PDF‑parserbibliotek.

Code Example Explanation:

Dette eksempel bruger først PDFParser‑biblioteket til at læse PDF‑filen og udtrække teksten fra hver side. Derefter bruger det PHPWord til at oprette et nyt Word‑dokument og tilføje den udtrukne tekst. Metoden giver dig fin‑granulær kontrol over output, så du kan formatere teksten og tilføje andre elementer efter behov.

require_once 'vendor/autoload.php';

// Create a new PDF parser object
$parser = new \Smalot\PdfParser\Parser();

// Parse the PDF file
$pdf = $parser->parseFile('path/to/your/document.pdf');

// Retrieve all pages from the PDF
$pages = $pdf->getPages();

// Create a new PHPWord object
$phpWord = new \PhpOffice\PhpWord\PhpWord();

// Add a section to the Word document
$section = $phpWord->addSection();

// Loop through each page of the PDF
foreach ($pages as $page) {
    // Extract the text from the page
    $text = $page->getText();
    // Add the text to the Word document
    $section->addText($text);
}

// Save the Word document
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2008');
$objWriter->save('output.docx');

echo "PDF content extracted and saved to Word successfully!";

Spatie PDF-til-tekst + PHPWord (Tekstbaseret konvertering)

Hvis dine PDF‑filer hovedsageligt indeholder ren tekst (ikke komplekse tabeller eller billeder), kan du kombinere de open source‑biblioteker Spatie PDF-til-tekst og PHPWord for en letvægts‑konverteringspipeline.

Sådan fungerer det?

Dette er den mest ligefremme metode, hvis du har adgang til Adobe Acrobat Pro.

Trin:

  1. Først skal du bruge Spatie\PdfToText API, som udtrækker ren tekst fra PDF‑filer.
  2. PHPWord‑biblioteket bruges til at generere et Word‑dokument med det udtrukne indhold.
  3. Bedst egnet til kun‑tekst PDF‑filer uden kompliceret formatering.

Her er et kodeeksempel, der viser, hvordan du udtrækker tekst fra en PDF‑fil og derefter genererer et Word‑dokument med det udtrukne indhold ved hjælp af PHPWord‑biblioteket.

PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();

Gotenberg via PHP (Open Source Docker‑mikrotjeneste)

Gotenberg er en open source‑dokumentkonverterings‑mikrotjeneste, der kan integreres med PHP ved hjælp af HTTP‑anmodninger. Den er ideel for udviklere, der foretrækker Docker‑baserede værktøjer.

Sådan fungerer det?

  • Gotenberg bruger LibreOffice i baggrunden til at konvertere PDF‑filer.
  • Du sender en POST‑anmodning med PDF‑filen.
  • Serveren returnerer DOCX‑dokumentet.
Code Snippet (PHP + Gotenberg)

Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);

$data = [
    [
        'name'     => 'files',
        'contents' => fopen('input.pdf', 'r'),
        'filename' => 'input.pdf'
    ]
];

curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);

echo "Conversion done via Gotenberg!";

Aspose.PDF Cloud for PHP (Gratis niveau)

Aspose.PDF Cloud PHP SDK leverer et kraftfuldt PHP‑SDK, der gør det muligt for softwareudviklere at konvertere PDF‑filer til Word‑format direkte via deres cloud‑API. Du kan komme i gang gratis med et begrænset antal API‑kald. Her er et simpelt eksempel, der viser, hvordan udviklere kan indlæse og konvertere en PDF‑fil til Microsoft Word DOCX‑dokumenter ved hjælp af PHP‑kommandoer.

use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);

Afsluttende tanker

At konvertere PDF‑filer til Word‑dokumenter ved hjælp af PHP behøver ikke at være komplekst eller dyrt. Med de rette gratis værktøjer og biblioteker kan udviklere tilbyde problemfri, redigerbare dokument‑eksporter til brugere, øge dokumentautomatisering og forbedre den samlede produktivitet. Uanset om du foretrækker letvægts‑PHP‑wrappers eller robuste cloud‑baserede API’er, findes der en løsning, der passer til dine behov.

FAQ

Q: Kan jeg konvertere PDF til Word i PHP uden at bruge betalte API’er?

A: Ja, du kan bruge open source‑biblioteker som Spatie, PHPWord og LibreOffice CLI gratis.

Q: Understøtter open source PDF‑til‑Word‑konvertering billeder og formatering?

A: Grundlæggende værktøjer gør det ikke, men ved at bruge LibreOffice eller Gotenberg bevares layout og billeder.

Q: Er det muligt at automatisere PDF‑til‑DOCX‑konvertering i PHP‑webapps?

A: Absolut — disse biblioteker kan integreres i enhver PHP‑baseret arbejdsgang.

See Also