<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/bn/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>bn</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/bn/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা</title>
      <link>https://blog.fileformat.com/bn/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/bn/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>এই নিবন্ধে আমরা দেখাব কীভাবে Python-এ জনপ্রিয় লাইব্রেরি যেমন PyPDF এবং PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করা যায়। এছাড়াও নমুনা কোড, নমুনা ফাইল এবং আউটপুট প্রদান করা হবে।</description>
      <content:encoded><![CDATA[<p><strong>Last Updated</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="শিরোনাম - Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা"/> 
</figure>

<h2 id="python-বযবহর-কর-pdf-ফইল-থক-টকসট-বর-কর">Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা</h2>
<p>এই নিবন্ধে আমরা আপনাকে দেখাব <strong>কীভাবে Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা যায়</strong>।</p>
<p>PDF এর পূর্ণরূপ <strong>Portable Document Format</strong>, এটি একটি জনপ্রিয় ডিজিটাল ডকুমেন্ট ফরম্যাট। এই ফরম্যাটটি ডকুমেন্টগুলোকে সফটওয়্যার, হার্ডওয়্যার বা অপারেটিং সিস্টেম নির্বিশেষে সহজে এবং নির্ভরযোগ্যভাবে দেখা বা শেয়ার করা সম্ভব করে। PDF ফাইলের এক্সটেনশন হল <strong>.pdf</strong>।</p>
<p>Python দিয়ে PDF ফাইল থেকে টেক্সট বের করতে সাধারণত এই লাইব্রেরিগুলো ব্যবহার করা হয়। আমরা আপনাকে দেখাব কীভাবে উভয় লাইব্রেরি ব্যবহার করে PDF থেকে টেক্সট বের করা যায়।</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="pypdf-বযবহর-কর-python-এ-pdf-ফইল-থক-টকসট-বর-করর-পদধত">PyPDF ব্যবহার করে Python-এ PDF ফাইল থেকে টেক্সট বের করার পদ্ধতি</h2>
<p>এখানে ধাপগুলো দেওয়া হল।</p>
<ol>
<li><strong>pypdf</strong> ইনস্টল করুন</li>
<li>এই নিবন্ধে দেওয়া কোড চালান</li>
<li>আউটপুট দেখুন</li>
</ol>
<h3 id="pypdf-ইনসটল-করন">pypdf ইনস্টল করুন</h3>
<p>আপনি নিম্নলিখিত কমান্ড ব্যবহার করে <strong>pypdf</strong> ইনস্টল করতে পারেন</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="pypdf-বযবহর-কর-pdf-থক-টকসট-বর-করর-নমন-কড">pypdf ব্যবহার করে PDF থেকে টেক্সট বের করার নমুনা কোড</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">ডাউনলোড লিঙ্ক</a> (এই নমুনা PDF কোডে ব্যবহার করা হবে, তবে আপনি আপনার নিজের PDF-ও ব্যবহার করতে পারেন।)</p>
<p><strong>sample.pdf এর স্ক্রিনশট</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="নমুনা ইনপুট PDF স্ক্রিনশট"  />
</p>
<h3 id="কড">কোড</h3>
<p>এখানে <strong>pypdf</strong> ব্যবহার করে PDF থেকে টেক্সট বের করার সম্পূর্ণ কোড উদাহরণ দেওয়া হল।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="আউটপট">আউটপুট</h3>
<p>উপরের নমুনা কোডের আউটপুট এখানে দেওয়া হল।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="pymupdf-বযবহর-কর-python-এ-pdf-ফইল-থক-টকসট-বর-করর-পদধত">PyMuPDF ব্যবহার করে Python-এ PDF ফাইল থেকে টেক্সট বের করার পদ্ধতি</h2>
<p>এখানে ধাপগুলো দেওয়া হল।</p>
<ol>
<li><strong>PyMuPDF</strong> ইনস্টল করুন</li>
<li>এই নিবন্ধে দেওয়া কোড চালান</li>
<li>আউটপুট দেখুন</li>
</ol>
<h3 id="pymupdf-ইনসটল-করন">PyMuPDF ইনস্টল করুন</h3>
<p><strong>PyMuPDF</strong> (যা <strong>fitz</strong> নামেও পরিচিত) নিম্নলিখিত কমান্ড ব্যবহার করে ইনস্টল করুন।</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="pymupdf-বযবহর-কর-pdf-থক-টকসট-বর-করর-নমন-কড">PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করার নমুনা কোড</h3>
<p>আমরা পূর্বে ব্যবহৃত একই PDF ব্যবহার করেছি</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">ডাউনলোড লিঙ্ক</a> (এই নমুনা PDF কোডে ব্যবহার করা হবে, তবে আপনি আপনার নিজের PDF-ও ব্যবহার করতে পারেন।)</p>
<h3 id="কড-1">কোড</h3>
<p>এখানে <strong>PyMuPDF</strong> ব্যবহার করে PDF থেকে টেক্সট বের করার সম্পূর্ণ কোড উদাহরণ দেওয়া হল।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="আউটপট-1">আউটপুট</h3>
<p>উপরের নমুনা কোডের আউটপুট এখানে দেওয়া হল।</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="উপসহর">উপসংহার</h2>
<p>এই নিবন্ধে আমরা একটি নমুনা Python কোড, একটি নমুনা ফাইল এবং তাদের আউটপুট প্রদান করেছি, যা দেখায় কীভাবে দুটি লাইব্রেরি: PyPDF এবং PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করা যায়।</p>
<p>কোড চালানোর সময় যদি কোনো প্রশ্ন বা সমস্যার সম্মুখীন হন, তবে <a href="https://forum.fileformat.com/">আমাদের ফোরামগুলো</a> এ মন্তব্য করতে স্বাচ্ছন্দ্যবোধ করুন!</p>
<h2 id="সমপরকত">সম্পর্কিত</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python দিয়ে PDF থেকে ইমেজ রূপান্তর: ধাপে ধাপে গাইড</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">ফাইল এনকোডিং একসাথে UTF-8-এ পরিবর্তন</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
