Τελευταία ενημέρωση: 24 Jul, 2025

Τίτλος - Πώς μπορώ να μετατρέψω ένα PDF σε έγγραφα MS Word μέσω PHP API;

Η εργασία με αρχεία PDF σε διαδικτυακές εφαρμογές έχει γίνει κοινή απαίτηση σε διάφορους κλάδους. Είτε διαχειρίζεστε τιμολόγια, συμβόλαια ή ακαδημαϊκό περιεχόμενο, η δυνατότητα μετατροπής εγγράφων PDF σε επεξεργάσιμες μορφές όπως το Microsoft Word (DOCX) είναι απαραίτητη. Ευτυχώς, με τη βοήθεια ισχυρών και δωρεάν PHP API, οι προγραμματιστές μπορούν να αυτοματοποιήσουν και να βελτιώσουν αυτή τη διαδικασία με ευκολία.

Γιατί να μετατρέψετε PDF σε Word με PHP;

Τα αρχεία PDF είναι εξαιρετικά για διανομή επειδή διατηρούν τη διάταξη και το σχέδιο. Ωστόσο, η επεξεργασία τους δεν είναι πάντα απλή. Τα έγγραφα Word, από την άλλη, είναι πολύ επεξεργάσιμα, καθιστώντας τα ιδανικά για εργασίες που απαιτούν αλληλεπίδραση χρήστη, ενημερώσεις ή συνεργασία. Μια λύση βασισμένη σε PHP επιτρέπει στους προγραμματιστές να:

  • Ενεργοποιήσετε τη μαζική μετατροπή PDF σε Word από τον διακομιστή
  • Ενσωματώσετε ροές εργασίας επεξεργασίας εγγράφων σε διαδικτυακές εφαρμογές
  • Αυτοματοποιήσετε τη δημιουργία αναφορών και την επεξεργασία εγγράφων
  • Επιτρέψετε στους τελικούς χρήστες να κατεβάζουν επεξεργάσιμες εκδόσεις των αρχείων τους

Αυτές είναι μερικές από τις πιο αξιόπιστες και δωρεάν PHP API και βιβλιοθήκες που μπορούν να σας βοηθήσουν να εκτελέσετε μετατροπή PDF σε Word με ελάχιστη ρύθμιση.

PHPWord με έναν PDF Parser

Για μεγαλύτερο έλεγχο της διαδικασίας μετατροπής, μπορείτε να συνδυάσετε τη δύναμη του PHPWord2, μιας βιβλιοθήκης για δημιουργία και διαχείριση εγγράφων Word, με μια βιβλιοθήκη ανάλυσης PDF4.

Εξήγηση του παραδείγματος κώδικα:

Αυτό το παράδειγμα πρώτα χρησιμοποιεί τη βιβλιοθήκη PDFParser για να διαβάσει το PDF και να εξάγει το κείμενο από κάθε σελίδα. Στη συνέχεια, χρησιμοποιεί το PHPWord για να δημιουργήσει ένα νέο έγγραφο Word και να προσθέσει το εξαγόμενο κείμενο σε αυτό. Αυτή η μέθοδος σας δίνει λεπτομερή έλεγχο του αποτελέσματος, επιτρέποντάς σας να μορφοποιήσετε το κείμενο και να προσθέσετε άλλα στοιχεία όπως χρειάζεται.

require_once 'vendor/autoload.php';

// Create a new PDF parser object
$parser = new \Smalot\PdfParser\Parser();

// Parse the PDF file
$pdf = $parser->parseFile('path/to/your/document.pdf');

// Retrieve all pages from the PDF
$pages = $pdf->getPages();

// Create a new PHPWord object
$phpWord = new \PhpOffice\PhpWord\PhpWord();

// Add a section to the Word document
$section = $phpWord->addSection();

// Loop through each page of the PDF
foreach ($pages as $page) {
    // Extract the text from the page
    $text = $page->getText();
    // Add the text to the Word document
    $section->addText($text);
}

// Save the Word document
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2007');
$objWriter->save('output.docx');

echo "PDF content extracted and saved to Word successfully!";

Spatie PDF-to-Text + PHPWord (Μετατροπή βάσει κειμένου)

Εάν τα αρχεία PDF σας περιέχουν κυρίως απλό κείμενο (όχι πολύπλοκους πίνακες ή εικόνες), μπορείτε να συνδυάσετε τις ανοιχτού κώδικα βιβλιοθήκες Spatie PDF-to-Text3 και PHPWord2 για μια ελαφριά αλυσίδα μετατροπής.

Πώς λειτουργεί;

Αυτή είναι η πιο απλή μέθοδος εάν έχετε πρόσβαση στο Adobe Acrobat Pro.

Βήματα:

  1. Πρώτα πρέπει να χρησιμοποιήσετε το API Spatie\PdfToText, το οποίο εξάγει απλό κείμενο από PDF.
  2. Η βιβλιοθήκη PHPWord χρησιμοποιείται για τη δημιουργία ενός εγγράφου Word με το εξαγόμενο περιεχόμενο.
  3. Κατάλληλο κυρίως για PDF μόνο με κείμενο χωρίς πολύπλοκη μορφοποίηση.

Ακολουθεί ένα παράδειγμα κώδικα που δείχνει πώς να εξάγετε κείμενο από ένα αρχείο PDF και στη συνέχεια να δημιουργήσετε έγγραφα Word με το εξαγόμενο περιεχόμενο χρησιμοποιώντας τη βιβλιοθήκη PHPWord.

PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();

Gotenberg μέσω PHP (Ανοιχτού κώδικα Docker μικροϋπηρεσία)

Gotenberg11 είναι μια ανοιχτού κώδικα μικροϋπηρεσία μετατροπής εγγράφων που μπορεί να ενσωματωθεί με PHP μέσω HTTP αιτημάτων. Είναι ιδανική για προγραμματιστές που προτιμούν εργαλεία βασισμένα σε Docker.

Πώς λειτουργεί;

  • Το Gotenberg χρησιμοποιεί το LibreOffice στο παρασκήνιο για τη μετατροπή PDF.
  • Στέλνετε ένα αίτημα POST με το αρχείο PDF.
  • Ο διακομιστής επιστρέφει το έγγραφο DOCX.
Code Snippet (PHP + Gotenberg)

Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);

$data = [
    [
        'name'     => 'files',
        'contents' => fopen('input.pdf', 'r'),
        'filename' => 'input.pdf'
    ]
];

curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);

echo "Conversion done via Gotenberg!";

Aspose.PDF Cloud για PHP (Δωρεάν επίπεδο)

Aspose.PDF Cloud PHP SDK9 παρέχει μια ισχυρή PHP SDK που επιτρέπει στους προγραμματιστές λογισμικού να μετατρέπουν αρχεία PDF σε μορφή Word απευθείας χρησιμοποιώντας το cloud API τους. Μπορείτε να ξεκινήσετε δωρεάν με περιορισμένες κλήσεις API. Ακολουθεί ένα απλό παράδειγμα που δείχνει πώς οι προγραμματιστές μπορούν να φορτώσουν και να μετατρέψουν ένα αρχείο PDF σε έγγραφα Microsoft Word DOCX χρησιμοποιώντας εντολές PHP.

use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);

Τελικές Σκέψεις

Η μετατροπή αρχείων PDF σε έγγραφα Word χρησιμοποιώντας PHP δεν χρειάζεται να είναι πολύπλοκη ή δαπανηρή. Με τα κατάλληλα δωρεάν εργαλεία και βιβλιοθήκες, οι προγραμματιστές μπορούν να προσφέρουν απρόσκοπτες, επεξεργάσιμες εξαγωγές εγγράφων στους χρήστες, να ενισχύσουν την αυτοματοποίηση εγγράφων και να βελτιώσουν τη συνολική παραγωγικότητα. Είτε προτιμάτε ελαφριές PHP wrappers είτε ισχυρά cloud‑based API, υπάρχει λύση που ταιριάζει στις ανάγκες σας.

Συχνές Ερωτήσεις

Ε: Μπορώ να μετατρέψω PDF σε Word με PHP χωρίς τη χρήση πληρωμένων API;

Α: Ναι, μπορείτε να χρησιμοποιήσετε ανοιχτού κώδικα βιβλιοθήκες όπως το Spatie, το PHPWord και το LibreOffice CLI δωρεάν.

Ε: Υποστηρίζει η ανοιχτού κώδικα μετατροπή PDF σε Word εικόνες και μορφοποίηση;

Α: Τα βασικά εργαλεία δεν το κάνουν, αλλά η χρήση του LibreOffice ή του Gotenberg διατηρεί τη διάταξη και τις εικόνες.

Ε: Είναι δυνατόν να αυτοματοποιηθεί η μετατροπή PDF σε DOCX σε PHP web εφαρμογές;

Α: Απόλυτα—αυτές οι βιβλιοθήκες μπορούν να ενσωματωθούν σε οποιαδήποτε ροή εργασίας βασισμένη σε PHP.

Δείτε επίσης