Last Updated: 15 Jan, 2025

শিরোনাম - Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা

Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা

এই নিবন্ধে আমরা আপনাকে দেখাব কীভাবে Python ব্যবহার করে PDF ফাইল থেকে টেক্সট বের করা যায়

PDF এর পূর্ণরূপ Portable Document Format, এটি একটি জনপ্রিয় ডিজিটাল ডকুমেন্ট ফরম্যাট। এই ফরম্যাটটি ডকুমেন্টগুলোকে সফটওয়্যার, হার্ডওয়্যার বা অপারেটিং সিস্টেম নির্বিশেষে সহজে এবং নির্ভরযোগ্যভাবে দেখা বা শেয়ার করা সম্ভব করে। PDF ফাইলের এক্সটেনশন হল .pdf

Python দিয়ে PDF ফাইল থেকে টেক্সট বের করতে সাধারণত এই লাইব্রেরিগুলো ব্যবহার করা হয়। আমরা আপনাকে দেখাব কীভাবে উভয় লাইব্রেরি ব্যবহার করে PDF থেকে টেক্সট বের করা যায়।

  1. pypdf
  2. PyMuPDF

PyPDF ব্যবহার করে Python-এ PDF ফাইল থেকে টেক্সট বের করার পদ্ধতি

এখানে ধাপগুলো দেওয়া হল।

  1. pypdf ইনস্টল করুন
  2. এই নিবন্ধে দেওয়া কোড চালান
  3. আউটপুট দেখুন

pypdf ইনস্টল করুন

আপনি নিম্নলিখিত কমান্ড ব্যবহার করে pypdf ইনস্টল করতে পারেন

pip install pypdf

pypdf ব্যবহার করে PDF থেকে টেক্সট বের করার নমুনা কোড

sample.pdf - ডাউনলোড লিঙ্ক (এই নমুনা PDF কোডে ব্যবহার করা হবে, তবে আপনি আপনার নিজের PDF-ও ব্যবহার করতে পারেন।)

sample.pdf এর স্ক্রিনশট

নমুনা ইনপুট PDF স্ক্রিনশট

কোড

এখানে pypdf ব্যবহার করে PDF থেকে টেক্সট বের করার সম্পূর্ণ কোড উদাহরণ দেওয়া হল।

আউটপুট

উপরের নমুনা কোডের আউটপুট এখানে দেওয়া হল।

PyMuPDF ব্যবহার করে Python-এ PDF ফাইল থেকে টেক্সট বের করার পদ্ধতি

এখানে ধাপগুলো দেওয়া হল।

  1. PyMuPDF ইনস্টল করুন
  2. এই নিবন্ধে দেওয়া কোড চালান
  3. আউটপুট দেখুন

PyMuPDF ইনস্টল করুন

PyMuPDF (যা fitz নামেও পরিচিত) নিম্নলিখিত কমান্ড ব্যবহার করে ইনস্টল করুন।

pip install pymupdf

PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করার নমুনা কোড

আমরা পূর্বে ব্যবহৃত একই PDF ব্যবহার করেছি

sample.pdf - ডাউনলোড লিঙ্ক (এই নমুনা PDF কোডে ব্যবহার করা হবে, তবে আপনি আপনার নিজের PDF-ও ব্যবহার করতে পারেন।)

কোড

এখানে PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করার সম্পূর্ণ কোড উদাহরণ দেওয়া হল।

আউটপুট

উপরের নমুনা কোডের আউটপুট এখানে দেওয়া হল।

উপসংহার

এই নিবন্ধে আমরা একটি নমুনা Python কোড, একটি নমুনা ফাইল এবং তাদের আউটপুট প্রদান করেছি, যা দেখায় কীভাবে দুটি লাইব্রেরি: PyPDF এবং PyMuPDF ব্যবহার করে PDF থেকে টেক্সট বের করা যায়।

কোড চালানোর সময় যদি কোনো প্রশ্ন বা সমস্যার সম্মুখীন হন, তবে আমাদের ফোরামগুলো এ মন্তব্য করতে স্বাচ্ছন্দ্যবোধ করুন!

সম্পর্কিত