<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/ms/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>ms</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/ms/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Ekstrak Teks dari Fail PDF Menggunakan Python</title>
      <link>https://blog.fileformat.com/ms/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/ms/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Artikel ini akan menunjukkan cara mengekstrak teks dari PDF dalam Python menggunakan perpustakaan popular seperti PyPDF dan PyMuPDF. Ia juga akan menyediakan kod contoh, fail contoh, dan output.</description>
      <content:encoded><![CDATA[<p><strong>Kemas Kini Terakhir</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Tajuk - Ekstrak Teks dari Fail PDF Menggunakan Python"/> 
</figure>

<h2 id="ekstrak-teks-dari-fail-pdf-menggunakan-python">Ekstrak Teks dari Fail PDF Menggunakan Python</h2>
<p>Dalam artikel ini, kami akan memberitahu anda <strong>cara mengekstrak teks dari fail PDF menggunakan Python</strong>.</p>
<p>PDF merupakan singkatan <strong>Portable Document Format</strong>, ia adalah format dokumen digital yang popular. Format ini direka untuk membolehkan dokumen dilihat atau dikongsi dengan mudah dan boleh dipercayai, tanpa mengira perisian, perkakasan atau sistem operasi.  Fail PDF mempunyai sambungan <strong>.pdf</strong>.</p>
<p>Untuk mengekstrak teks dari fail PDF menggunakan Python, perpustakaan ini biasanya digunakan. Kami akan menunjukkan cara mengekstrak teks dari PDF menggunakan kedua-duanya.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="cara-mengekstrak-teks-dari-fail-pdf-menggunakan-pypdf-dalam-python">Cara Mengekstrak Teks dari Fail PDF Menggunakan pypdf dalam Python</h2>
<p>Berikut ialah langkah-langkah.</p>
<ol>
<li>Pasang <strong>pypdf</strong></li>
<li>Jalankan kod yang diberikan dalam artikel ini</li>
<li>Lihat output</li>
</ol>
<h3 id="pasang-pypdf">Pasang pypdf</h3>
<p>Anda boleh memasang <strong>pypdf</strong> menggunakan perintah berikut</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="kod-contoh-untuk-mengekstrak-teks-dari-pdf-menggunakan-pypdf">Kod Contoh untuk Mengekstrak Teks dari PDF menggunakan pypdf</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Muat Turun</a> (PDF contoh ini akan digunakan dalam kod, tetapi anda boleh menggunakan PDF anda sendiri.)</p>
<p><strong>tangkapan skrin sample.pdf</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Skrin Input PDF Sampel"  />
</p>
<h3 id="code">Code</h3>
<p>Berikut ialah contoh kod lengkap untuk <strong>mengekstrak teks dari PDF menggunakan pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="output">Output</h3>
<p>Berikut ialah output kod contoh yang diberikan di atas.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="cara-mengekstrak-teks-dari-fail-pdf-menggunakan-pymupdf-dalam-python">Cara Mengekstrak Teks dari Fail PDF Menggunakan PyMuPDF dalam Python</h2>
<p>Berikut ialah langkah-langkah.</p>
<ol>
<li>Pasang <strong>PyMuPDF</strong></li>
<li>Jalankan kod yang diberikan dalam artikel ini</li>
<li>Lihat output</li>
</ol>
<h3 id="pasang-pymupdf">Pasang PyMuPDF</h3>
<p>Anda boleh memasang <strong>PyMuPDF</strong>, juga dikenali sebagai <strong>fitz</strong>, menggunakan perintah berikut.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="kod-contoh-untuk-mengekstrak-teks-dari-pdf-menggunakan-pymupdf">Kod Contoh untuk Mengekstrak Teks dari PDF menggunakan PyMuPDF</h3>
<p>Kami menggunakan pdf yang sama seperti sebelumnya</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Muat Turun</a> (PDF contoh ini akan digunakan dalam kod, tetapi anda boleh menggunakan PDF anda sendiri.)</p>
<h3 id="code-1">Code</h3>
<p>Berikut ialah contoh kod lengkap untuk <strong>mengekstrak teks dari PDF menggunakan PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="output-1">Output</h3>
<p>Berikut ialah output kod contoh yang diberikan di atas.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="kesimpulan">Kesimpulan</h2>
<p>Dalam artikel ini, kami menyediakan kod Python contoh, fail contoh, dan outputnya untuk menunjukkan cara mengekstrak teks dari PDF menggunakan dua perpustakaan: PyPDF dan PyMuPDF.</p>
<p>Jika anda mempunyai sebarang pertanyaan atau menghadapi sebarang masalah semasa menjalankan kod, sila tinggalkan komen di <a href="https://forum.fileformat.com/">forum kami</a>!</p>
<h2 id="lihat-juga">Lihat Juga</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Penukaran PDF ke Imej dengan Python: Panduan Langkah demi Langkah</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Tukar Pengekodan Fail secara Pukal ke UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
