अंतिम अपडेट: 24 जुलाई, 2025

वेब एप्लिकेशन में PDF फ़ाइलें के साथ काम करना विभिन्न उद्योगों में एक सामान्य आवश्यकता बन गया है। चाहे आप इनवॉइस, अनुबंध, या शैक्षणिक सामग्री का प्रबंधन कर रहे हों, PDF दस्तावेज़ों को Microsoft Word (DOCX) जैसे संपादन योग्य फ़ॉर्मेट में बदलना आवश्यक है। सौभाग्य से, शक्तिशाली और मुफ्त PHP APIs की मदद से डेवलपर्स इस प्रक्रिया को आसानी से स्वचालित और सुव्यवस्थित कर सकते हैं।
क्यों PDF को Word में PHP के माध्यम से बदलें?
PDF फ़ाइलें वितरण के लिए उत्कृष्ट हैं क्योंकि वे लेआउट और डिज़ाइन को संरक्षित रखती हैं। हालांकि, उन्हें संपादित करना हमेशा सीधा नहीं होता। दूसरी ओर, Word दस्तावेज़ अत्यधिक संपादन योग्य होते हैं, जिससे वे उपयोगकर्ता इंटरैक्शन, अपडेट या सहयोग की आवश्यकता वाले कार्यों के लिए आदर्श बनते हैं। एक PHP‑आधारित समाधान डेवलपर्स को सक्षम बनाता है:
- सर्वर‑साइड बैच PDF‑से‑Word रूपांतरण सक्षम करें
- वेब ऐप्स में दस्तावेज़ संपादन वर्कफ़्लो को एकीकृत करें
- रिपोर्ट जनरेशन और दस्तावेज़ प्रोसेसिंग को स्वचालित करें
- अंतिम उपयोगकर्ताओं को उनकी फ़ाइलों के संपादन योग्य संस्करण डाउनलोड करने की अनुमति दें
नीचे कुछ सबसे विश्वसनीय और मुफ्त PHP APIs और लाइब्रेरीज़ दी गई हैं जो न्यूनतम सेट‑अप के साथ PDF‑से‑Word रूपांतरण में मदद कर सकती हैं।
PHPWord with a PDF Parser
परिवर्तन प्रक्रिया पर अधिक नियंत्रण के लिए, आप PHPWord (Word दस्तावेज़ बनाने और संशोधित करने की लाइब्रेरी) को एक PDF पार्सिंग लाइब्रेरी के साथ संयोजित कर सकते हैं।
कोड उदाहरण की व्याख्या:
यह उदाहरण पहले PDFParser लाइब्रेरी का उपयोग करके PDF पढ़ता है और प्रत्येक पृष्ठ से टेक्स्ट निकालता है। फिर PHPWord का उपयोग करके एक नया Word दस्तावेज़ बनाया जाता है और निकाले गए टेक्स्ट को उसमें जोड़ा जाता है। यह विधि आउटपुट पर सूक्ष्म नियंत्रण देती है, जिससे आप टेक्स्ट को फ़ॉर्मेट कर सकते हैं और आवश्यकतानुसार अन्य तत्व जोड़ सकते हैं।
require_once 'vendor/autoload.php';
// Create a new PDF parser object
$parser = new \Smalot\PdfParser\Parser();
// Parse the PDF file
$pdf = $parser->parseFile('path/to/your/document.pdf');
// Retrieve all pages from the PDF
$pages = $pdf->getPages();
// Create a new PHPWord object
$phpWord = new \PhpOffice\PhpWord\PhpWord();
// Add a section to the Word document
$section = $phpWord->addSection();
// Loop through each page of the PDF
foreach ($pages as $page) {
// Extract the text from the page
$text = $page->getText();
// Add the text to the Word document
$section->addText($text);
}
// Save the Word document
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2008');
$objWriter->save('output.docx');
echo "PDF content extracted and saved to Word successfully!";
Spatie PDF‑to‑Text + PHPWord (टेक्स्ट‑आधारित रूपांतरण)
यदि आपके PDF फ़ाइलों में मुख्य रूप से साधारण टेक्स्ट (जटिल तालिकाएँ या छवियाँ नहीं) होता है, तो आप ओपन सोर्स लाइब्रेरीज़ Spatie PDF‑to‑Text और PHPWord को मिलाकर एक हल्का रूपांतरण पाइपलाइन बना सकते हैं।
यह कैसे काम करता है?
यह सबसे सीधा तरीका है यदि आपके पास Adobe Acrobat Pro की पहुँच है।
कदम:
- पहले आपको Spatie\PdfToText API का उपयोग करना होगा, जो PDFs से साधारण टेक्स्ट निकालता है।
- PHPWord लाइब्रेरी का उपयोग निकाले गए कंटेंट के साथ एक Word दस्तावेज़ बनाने के लिए किया जाता है।
- जटिल फ़ॉर्मेटिंग के बिना केवल टेक्स्ट वाले PDFs के लिए सबसे उपयुक्त।
यहाँ एक कोड उदाहरण है जो दिखाता है कि कैसे PDF फ़ाइल से टेक्स्ट निकाला जाए और फिर PHPWord लाइब्रेरी का उपयोग करके निकाले गए कंटेंट के साथ Word दस्तावेज़ बनाया जाए।
PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();
PHP के माध्यम से Gotenberg (ओपन सोर्स Docker माइक्रोसर्विस)
Gotenberg एक ओपन सोर्स दस्तावेज़ रूपांतरण माइक्रोसर्विस है जिसे HTTP अनुरोधों के माध्यम से PHP के साथ एकीकृत किया जा सकता है। यह उन डेवलपर्स के लिए आदर्श है जो Docker‑आधारित टूल्स को प्राथमिकता देते हैं।
यह कैसे काम करता है?
- Gotenberg बैकएंड में LibreOffice का उपयोग करके PDFs को बदलता है।
- आप PDF फ़ाइल के साथ एक POST अनुरोध भेजते हैं।
- सर्वर DOCX दस्तावेज़ लौटाता है।
Code Snippet (PHP + Gotenberg)
Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
$data = [
[
'name' => 'files',
'contents' => fopen('input.pdf', 'r'),
'filename' => 'input.pdf'
]
];
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);
echo "Conversion done via Gotenberg!";
Aspose.PDF क्लाउड फ़ॉर PHP (फ्री टियर)
Aspose.PDF Cloud PHP SDK एक शक्तिशाली PHP SDK प्रदान करता है जो सॉफ़्टवेयर डेवलपर्स को PDF फ़ाइलों को सीधे Word फ़ॉर्मेट में बदलने की अनुमति देता है, उनके क्लाउड API का उपयोग करके। आप सीमित API कॉल्स के साथ मुफ्त में शुरू कर सकते हैं। नीचे एक सरल उदाहरण है जो दिखाता है कि कैसे सॉफ़्टवेयर डेवलपर्स PHP कमांड्स का उपयोग करके PDF फ़ाइल को Microsoft Word DOCX दस्तावेज़ में लोड और बदल सकते हैं।
use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);
अंतिम विचार
PHP का उपयोग करके PDF फ़ाइलों को Word दस्तावेज़ों में बदलना जटिल या महंगा नहीं होना चाहिए। सही मुफ्त टूल्स और लाइब्रेरीज़ के साथ, डेवलपर्स उपयोगकर्ताओं को सहज, संपादन योग्य दस्तावेज़ निर्यात प्रदान कर सकते हैं, दस्तावेज़ स्वचालन को बढ़ा सकते हैं, और समग्र उत्पादकता में सुधार कर सकते हैं। चाहे आप हल्के PHP रैपर पसंद करें या मजबूत क्लाउड‑आधारित APIs, आपके लिए उपयुक्त समाधान मौजूद है।
FAQ
प्रश्न: क्या मैं भुगतान वाले APIs का उपयोग किए बिना PHP में PDF को Word में बदल सकता हूँ?
उत्तर: हाँ, आप Spatie, PHPWord, और LibreOffice CLI जैसी ओपन सोर्स लाइब्रेरीज़ का मुफ्त में उपयोग कर सकते हैं।
प्रश्न: क्या ओपन सोर्स PDF‑से‑Word रूपांतरण छवियों और फ़ॉर्मेटिंग को समर्थन देता है?
उत्तर: बुनियादी टूल्स नहीं देते, लेकिन LibreOffice या Gotenberg का उपयोग करने से लेआउट और छवियों को संरक्षित किया जा सकता है।
प्रश्न: क्या PHP वेब ऐप्स में PDF को DOCX में रूपांतरण स्वचालित करना संभव है?
उत्तर: बिल्कुल—इन लाइब्रेरीज़ को किसी भी PHP‑आधारित वर्कफ़्लो में एकीकृत किया जा सकता है।