Viimeksi päivitetty: 24 Jul, 2025

PDF-tiedostojen käsittely verkkosovelluksissa on tullut yleiseksi vaatimukseksi eri toimialoilla. Olipa kyseessä laskujen, sopimusten tai akateemisen sisällön hallinta, PDF-dokumenttien muuntaminen muokattaviin formaatteihin, kuten Microsoft Word (DOCX), on olennaista. Onneksi tehokkaiden ja ilmaisten PHP-rajapintojen avulla kehittäjät voivat automatisoida ja virtaviivaistaa tämän prosessin helposti.
Miksi muuntaa PDF Wordiksi PHP:ssä?
PDF-tiedostot ovat erinomaisia jakeluun, koska ne säilyttävät asettelun ja muotoilun. Kuitenkin niiden muokkaaminen ei ole aina suoraviivaista. Word-dokumentit puolestaan ovat erittäin muokattavia, mikä tekee niistä ihanteellisia tehtäviin, jotka vaativat käyttäjän vuorovaikutusta, päivityksiä tai yhteistyötä. PHP-pohjainen ratkaisu antaa kehittäjille mahdollisuuden:
- Mahdollistaa palvelinpuolen eräajon PDF-Word-muunnos
- Integroi dokumenttien muokkausprosessit verkkosovelluksiin
- Automatisoi raporttien luonti ja dokumenttien käsittely
- Salli loppukäyttäjien ladata muokattavia versioita tiedostoistaan
Tässä on joitakin luotettavimpia ja ilmaisia PHP-rajapintoja ja kirjastoja, jotka auttavat PDF‑Word‑muunnoksessa minimaalisella käyttöönotolla.
PHPWord PDF-parsijalla
Saadaksesi enemmän hallintaa muunnosprosessiin, voit yhdistää PHPWord -kirjaston, jolla luodaan ja muokataan Word-dokumentteja, PDF-parsintakirjaston kanssa.
Koodiesimerkin selitys:
Esimerkki käyttää ensin PDFParser‑kirjastoa PDF:n lukemiseen ja tekstin poimimiseen jokaiselta sivulta. Sitten se käyttää PHPWordia uuden Word-dokumentin luomiseen ja poimitun tekstin lisäämiseen siihen. Tämä menetelmä antaa sinulle tarkkaa hallintaa tulosteeseen, mahdollistaen tekstin muotoilun ja muiden elementtien lisäämisen tarpeen mukaan.
require_once 'vendor/autoload.php';
// Create a new PDF parser object
$parser = new \Smalot\PdfParser\Parser();
// Parse the PDF file
$pdf = $parser->parseFile('path/to/your/document.pdf');
// Retrieve all pages from the PDF
$pages = $pdf->getPages();
// Create a new PHPWord object
$phpWord = new \PhpOffice\PhpWord\PhpWord();
// Add a section to the Word document
$section = $phpWord->addSection();
// Loop through each page of the PDF
foreach ($pages as $page) {
// Extract the text from the page
$text = $page->getText();
// Add the text to the Word document
$section->addText($text);
}
// Save the Word document
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2008');
$objWriter->save('output.docx');
echo "PDF content extracted and saved to Word successfully!";
Spatie PDF-to-Text + PHPWord (Tekstipohjainen muunnos)
Jos PDF-tiedostosi sisältävät pääasiassa pelkkää tekstiä (ei monimutkaisia taulukoita tai kuvia), voit yhdistää avoimen lähdekoodin kirjastot Spatie PDF-to-Text ja PHPWord kevyeksi muunnosputkeksi.
Miten se toimii?
Tämä on suoraviivaisin menetelmä, jos sinulla on pääsy Adobe Acrobat Pro:hon.
Vaiheet:
- Ensiksi sinun täytyy käyttää Spatie\PdfToText API:a, joka poimii pelkän tekstin PDF:istä.
- PHPWord-kirjasto käytetään luomaan Word-dokumentti poimitulla sisällöllä.
- Paras valinta vain-tekstipohjaisille PDF:eille ilman monimutkaista muotoilua.
Tässä on koodiesimerkki, joka näyttää, miten poimia teksti PDF‑tiedostosta ja sitten luoda Word‑dokumentti poimitulla sisällöllä PHPWord‑kirjaston avulla.
PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();
Gotenberg PHP:n kautta (Avoimen lähdekoodin Docker-mikropalvelu)
Gotenberg on avoimen lähdekoodin dokumenttimuuntausmikropalvelu, jonka voi integroida PHP:n kanssa HTTP-pyyntöjen avulla. Se on ihanteellinen kehittäjille, jotka suosivat Docker-pohjaisia työkaluja.
Miten se toimii?
- Gotenberg käyttää LibreOfficea taustalla PDF:ien muuntamiseen.
- Lähetät POST-pyynnön PDF-tiedoston kanssa.
- Palvelin palauttaa DOCX-dokumentin.
Code Snippet (PHP + Gotenberg)
Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
$data = [
[
'name' => 'files',
'contents' => fopen('input.pdf', 'r'),
'filename' => 'input.pdf'
]
];
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);
echo "Conversion done via Gotenberg!";
Aspose.PDF Cloud for PHP (Ilmainen taso)
Aspose.PDF Cloud PHP SDK tarjoaa tehokkaan PHP SDK:n, jonka avulla ohjelmistokehittäjät voivat muuntaa PDF-tiedostoja Word-muotoon suoraan pilvi‑API:n avulla. Voit aloittaa ilmaiseksi rajoitetuilla API‑kutsuilla. Tässä on yksinkertainen esimerkki, joka näyttää, miten kehittäjät voivat ladata ja muuntaa PDF‑tiedoston Microsoft Word DOCX -dokumenteiksi PHP‑komentojen avulla.
use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);
Loppupäätelmät
PDF-tiedostojen muuntaminen Word-dokumenteiksi PHP:n avulla ei tarvitse olla monimutkaista tai kallista. Oikeiden ilmaisten työkalujen ja kirjastojen avulla kehittäjät voivat tarjota saumattomia, muokattavia dokumenttivientivaihtoehtoja käyttäjille, tehostaa dokumenttien automaatiota ja parantaa kokonaistehokkuutta. Olipa mieltymyksesi kevyet PHP‑kääreet tai vahvat pilvipohjaiset API:t, löytyy ratkaisu tarpeisiisi.
Usein kysytyt kysymykset
K: Voinko muuntaa PDF:n Wordiksi PHP:ssä ilman maksullisia API:ita?
V: Kyllä, voit käyttää avoimen lähdekoodin kirjastoja kuten Spatie, PHPWord ja LibreOffice CLI ilmaiseksi.
K: Tukevatko avoimen lähdekoodin PDF Word -muunnokset kuvia ja muotoilua?
V: Perustyökalut eivät, mutta LibreOfficea tai Gotenbergiä käyttäessä säilyy asettelu ja kuvat.
K: Onko mahdollista automatisoida PDF:n DOCX-muunnos PHP‑verkkosovelluksissa?
V: Ehdottomasti — nämä kirjastot voidaan integroida mihin tahansa PHP‑pohjaiseen työnkulkuun.