Paskutinį kartą atnaujinta: 24 Jul, 2025

Darbas su PDF failai interneto programose tapo įprasta reikšme įvairiose pramonės šakose. Nesvarbu, ar tvarkote sąskaitas, sutartis, ar akademinį turinį, galimybė konvertuoti PDF dokumentus į redaguojamus formatus, pvz., Microsoft Word (DOCX), yra būtina. Laimei, naudojant galingus ir nemokamus PHP API, kūrėjai gali automatizuoti ir supaprastinti šį procesą.
Kodėl konvertuoti PDF į Word naudojant PHP?
PDF failai yra puikūs platinimui, nes išlaiko išdėstymą ir dizainą. Tačiau juos redaguoti ne visada paprasta. Word dokumentai, priešingai, yra labai redaguojami, todėl jie puikiai tinka užduotims, reikalaujančioms vartotojo sąveikos, atnaujinimų ar bendradarbiavimo. PHP pagrindu sukurtas sprendimas leidžia kūrėjams:
- Įjungti serverio pusės masinį PDF į Word konvertavimą
- Integruoti dokumentų redagavimo darbo srautus interneto programose
- Automatizuoti ataskaitų generavimą ir dokumentų apdorojimą
- Leisti galutiniams vartotojams atsisiųsti redaguojamas savo failų versijas
PHPWord su PDF analizatoriumi
Norėdami turėti daugiau kontrolės konvertavimo procesui, galite sujungti PHPWord – biblioteką, skirta kurti ir manipuliuoti Word dokumentais, su PDF analizės biblioteka.
Kodo pavyzdžio paaiškinimas:
Šiame pavyzdyje pirmiausia naudojama PDFParser biblioteka PDF skaitymui ir teksto išgavimui iš kiekvieno puslapio. Tada naudojamas PHPWord, kad sukurtų naują Word dokumentą ir į jį pridėtų išgautą tekstą. Šis metodas suteikia smulkią kontrolę išvesties rezultatams, leidžiant formatuoti tekstą ir pridėti kitus elementus pagal poreikį.
require_once 'vendor/autoload.php';
// Create a new PDF parser object
$parser = new \Smalot\PdfParser\Parser();
// Parse the PDF file
$pdf = $parser->parseFile('path/to/your/document.pdf');
// Retrieve all pages from the PDF
$pages = $pdf->getPages();
// Create a new PHPWord object
$phpWord = new \PhpOffice\PhpWord\PhpWord();
// Add a section to the Word document
$section = $phpWord->addSection();
// Loop through each page of the PDF
foreach ($pages as $page) {
// Extract the text from the page
$text = $page->getText();
// Add the text to the Word document
$section->addText($text);
}
// Save the Word document
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2008');
$objWriter->save('output.docx');
echo "PDF content extracted and saved to Word successfully!";
Spatie PDF-to-Text + PHPWord (Teksto pagrindu veikianti konversija)
Jei jūsų PDF failai daugiausia susideda iš paprasto teksto (ne sudėtingų lentelių ar vaizdų), galite sujungti atviro kodo bibliotekas Spatie PDF-to-Text ir PHPWord lengvai konvertavimo procesui.
Kaip tai veikia?
Tai paprasčiausias metodas, jei turite prieigą prie Adobe Acrobat Pro.
Žingsniai:
- Pirmiausia turite naudoti Spatie\PdfToText API, kuri išgauna paprastą tekstą iš PDF.
- PHPWord biblioteka naudojama sukurti Word dokumentą su išgautu turiniu.
- Geriausiai tinka tik teksto PDF be sudėtingo formatavimo.
Čia pateiktas kodo pavyzdys, kuris rodo, kaip išgauti tekstą iš PDF failo ir tada sukurti Word dokumentą su išgautu turiniu naudojant PHPWord biblioteką.
PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();
Gotenberg per PHP (Atviro kodo Docker mikroservisas)
Gotenberg yra atviro kodo dokumentų konvertavimo mikroservisas, kurį galima integruoti su PHP naudojant HTTP užklausas. Tai puikus pasirinkimas kūrėjams, kurie mėgsta Docker pagrindu įrankius.
Kaip tai veikia?
- Gotenberg naudoja LibreOffice fone, kad konvertuotų PDF.
- Jūs siunčiate POST užklausą su PDF failu.
- Serveris grąžina DOCX dokumentą.
Code Snippet (PHP + Gotenberg)
Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
$data = [
[
'name' => 'files',
'contents' => fopen('input.pdf', 'r'),
'filename' => 'input.pdf'
]
];
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);
echo "Conversion done via Gotenberg!";
Aspose.PDF Cloud for PHP (Nemokamas lygis)
Aspose.PDF Cloud PHP SDK suteikia galingą PHP SDK, leidžiantį programinės įrangos kūrėjams konvertuoti PDF failus į Word formatą tiesiogiai naudojant jų debesų API. Galite pradėti nemokamai su ribotu API kvietimų skaičiumi. Čia pateiktas paprastas pavyzdys, kuris rodo, kaip kūrėjai gali įkelti ir konvertuoti PDF failą į Microsoft Word DOCX dokumentus naudojant PHP komandas.
use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);
Pabaigos mintys
PDF failų konvertavimas į Word dokumentus naudojant PHP neturi būti sudėtingas ar brangus. Su tinkamais nemokamais įrankiais ir bibliotekomis kūrėjai gali pasiūlyti vartotojams sklandų, redaguojamą dokumentų eksportą, padidinti dokumentų automatizavimą ir pagerinti bendrą našumą. Nesvarbu, ar jums patinka lengvi PHP apvalkalai, ar patikimos debesų API, yra sprendimas, atitinkantis jūsų poreikius.
FAQ
K: Ar galiu konvertuoti PDF į Word PHP be mokamų API?
A: Taip, galite naudoti atviro kodo bibliotekas, tokias kaip Spatie, PHPWord ir LibreOffice CLI, nemokamai.
K: Ar atviro kodo PDF į Word konversija palaiko vaizdus ir formatavimą?
A: Pagrindiniai įrankiai to nepalaiko, tačiau naudojant LibreOffice arba Gotenberg išsaugomas išdėstymas ir vaizdai.
K: Ar įmanoma automatizuoti PDF į DOCX konversiją PHP interneto programose?
A: Be abejo – šias bibliotekas galima integruoti į bet kokį PHP pagrindu veikiančią darbo eigą.