<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/hi/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>hi</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/hi/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Python का उपयोग करके PDF फ़ाइल से टेक्स्ट निकालें</title>
      <link>https://blog.fileformat.com/hi/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/hi/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>यह लेख आपको दिखाएगा कि कैसे Python में लोकप्रिय लाइब्रेरीज़ जैसे PyPDF और PyMuPDF का उपयोग करके PDF से टेक्स्ट निकाला जाए। यह नमूना कोड, नमूना फ़ाइलें, और आउटपुट भी प्रदान करेगा।</description>
      <content:encoded><![CDATA[<p><strong>अंतिम अपडेट</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="शीर्षक - Python का उपयोग करके PDF फ़ाइल से टेक्स्ट निकालें"/> 
</figure>

<h2 id="pdf-फइल-स-टकसट-नकल-python-क-उपयग-करक">PDF फ़ाइल से टेक्स्ट निकालें Python का उपयोग करके</h2>
<p>इस लेख में, हम आपको <strong>Python का उपयोग करके PDF फ़ाइल से टेक्स्ट कैसे निकालें</strong> यह बताएँगे।</p>
<p>PDF का पूरा नाम <strong>Portable Document Format</strong> है और यह एक लोकप्रिय डिजिटल दस्तावेज़ फ़ॉर्मेट है। यह फ़ॉर्मेट इस तरह डिज़ाइन किया गया है कि दस्तावेज़ों को सॉफ़्टवेयर, हार्डवेयर या ऑपरेटिंग सिस्टम की परवाह किए बिना आसानी से देखा या साझा किया जा सके। PDF फ़ाइलों का एक्सटेंशन <strong>.pdf</strong> होता है।</p>
<p>Python में PDF फ़ाइल से टेक्स्ट निकालने के लिए ये लाइब्रेरीज़ आमतौर पर उपयोग की जाती हैं। हम आपको दोनों का उपयोग करके PDF से टेक्स्ट निकालना दिखाएँगे।</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="python-म-pypdf-क-उपयग-करक-pdf-फइल-स-टकसट-नकलन-क-तरक">Python में pypdf का उपयोग करके PDF फ़ाइल से टेक्स्ट निकालने का तरीका</h2>
<p>यहाँ चरण दिए गए हैं।</p>
<ol>
<li><strong>pypdf</strong> स्थापित करें</li>
<li>इस लेख में दिया गया कोड चलाएँ</li>
<li>आउटपुट देखें</li>
</ol>
<h3 id="pypdf-सथपत-कर">pypdf स्थापित करें</h3>
<p>आप नीचे दिए गए कमांड से <strong>pypdf</strong> स्थापित कर सकते हैं</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="pypdf-क-उपयग-करक-pdf-स-टकसट-नकलन-क-लए-नमन-कड">pypdf का उपयोग करके PDF से टेक्स्ट निकालने के लिए नमूना कोड</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">डाउनलोड लिंक</a> (यह नमूना PDF कोड में उपयोग किया जाएगा, लेकिन आप निश्चित रूप से अपना स्वयं का PDF उपयोग कर सकते हैं।)</p>
<p><strong>sample.pdf का स्क्रीनशॉट</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="नमूना इनपुट PDF स्क्रीनशॉट"  />
</p>
<h3 id="कड">कोड</h3>
<p>यहाँ <strong>pypdf</strong> का उपयोग करके PDF से टेक्स्ट निकालने का पूर्ण कोड उदाहरण है।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="आउटपट">आउटपुट</h3>
<p>ऊपर प्रदान किए गए नमूना कोड का आउटपुट यहाँ दिखाया गया है।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="python-म-pymupdf-क-उपयग-करक-pdf-फइल-स-टकसट-नकलन-क-तरक">Python में PyMuPDF का उपयोग करके PDF फ़ाइल से टेक्स्ट निकालने का तरीका</h2>
<p>यहाँ चरण दिए गए हैं।</p>
<ol>
<li><strong>PyMuPDF</strong> स्थापित करें</li>
<li>इस लेख में दिया गया कोड चलाएँ</li>
<li>आउटपुट देखें</li>
</ol>
<h3 id="pymupdf-सथपत-कर">PyMuPDF स्थापित करें</h3>
<p>नीचे दिए गए कमांड से <strong>PyMuPDF</strong>, जिसे <strong>fitz</strong> भी कहा जाता है, स्थापित करें।</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="pymupdf-क-उपयग-करक-pdf-स-टकसट-नकलन-क-लए-नमन-कड">PyMuPDF का उपयोग करके PDF से टेक्स्ट निकालने के लिए नमूना कोड</h3>
<p>हमने वही PDF उपयोग किया है जो पहले उपयोग किया गया था</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">डाउनलोड लिंक</a> (यह नमूना PDF कोड में उपयोग किया जाएगा, लेकिन आप निश्चित रूप से अपना स्वयं का PDF उपयोग कर सकते हैं।)</p>
<h3 id="कड-1">कोड</h3>
<p>यहाँ <strong>PyMuPDF</strong> का उपयोग करके PDF से टेक्स्ट निकालने का पूर्ण कोड उदाहरण है।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="आउटपट-1">आउटपुट</h3>
<p>ऊपर प्रदान किए गए नमूना कोड का आउटपुट यहाँ दिखाया गया है।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="नषकरष">निष्कर्ष</h2>
<p>इस लेख में, हमने एक नमूना Python कोड, एक नमूना फ़ाइल, और उनका आउटपुट प्रदान किया है ताकि यह प्रदर्शित किया जा सके कि दो लाइब्रेरीज़: PyPDF और PyMuPDF का उपयोग करके PDF से टेक्स्ट कैसे निकाला जाए।</p>
<p>यदि आपके कोई प्रश्न हैं या कोड चलाते समय कोई समस्या आती है, तो कृपया <a href="https://forum.fileformat.com/">हमारे फ़ोरम</a> में टिप्पणी छोड़ें!</p>
<h2 id="दख-भ">देखें भी</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python PDF को इमेज में बदलना: चरण-दर-चरण गाइड</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">फ़ाइल एन्कोडिंग को UTF-8 में बैच बदलें</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
