<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/nl/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>nl</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/nl/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Tekst extraheren uit PDF-bestand met Python</title>
      <link>https://blog.fileformat.com/nl/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/nl/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Dit artikel laat zien hoe je tekst uit een PDF kunt extraheren met Python, met behulp van populaire bibliotheken zoals PyPDF en PyMuPDF. Het biedt ook voorbeeldcode, voorbeeldbestanden en de output.</description>
      <content:encoded><![CDATA[<p><strong>Last Updated</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Titel - Tekst extraheren uit PDF-bestand met Python"/> 
</figure>

<h2 id="tekst-extraheren-uit-pdf-bestand-met-python">Tekst extraheren uit PDF-bestand met Python</h2>
<p>In dit artikel laten we je weten <strong>hoe je tekst uit een PDF-bestand kunt extraheren met Python</strong>.</p>
<p>PDF staat voor <strong>Portable Document Format</strong> en is een populair digitaal documentformaat. Dit formaat is ontworpen om documenten gemakkelijk en betrouwbaar te kunnen bekijken of delen, ongeacht software, hardware of besturingssysteem. PDF‑bestanden hebben de extensie <strong>.pdf</strong>.</p>
<p>Om tekst uit een PDF-bestand te extraheren met Python, worden deze bibliotheken vaak gebruikt. We laten je zien hoe je tekst uit een PDF kunt extraheren met beide.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="hoe-tekst-uit-een-pdf-bestand-extraheren-met-pypdf-in-python">Hoe tekst uit een PDF-bestand extraheren met pypdf in Python</h2>
<p>Hier zijn de stappen.</p>
<ol>
<li>Installeer <strong>pypdf</strong></li>
<li>Voer de code uit die in dit artikel wordt gegeven</li>
<li>Bekijk de output</li>
</ol>
<h3 id="installeer-pypdf">Installeer pypdf</h3>
<p>Je kunt <strong>pypdf</strong> installeren met het volgende commando</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="voorbeeldcode-om-tekst-uit-pdf-te-extraheren-met-pypdf">Voorbeeldcode om tekst uit PDF te extraheren met pypdf</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Downloadlink</a> (Deze voorbeeld‑PDF wordt in de code gebruikt, maar je kunt uiteraard je eigen PDF gebruiken.)</p>
<p><strong>screenshot van sample.pdf</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Voorbeeld PDF-invoerscreenshot"  />
</p>
<h3 id="code">Code</h3>
<p>Hier is een volledig code‑voorbeeld voor <strong>het extraheren van tekst uit een PDF met pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="output">Output</h3>
<p>Hier is de output van de voorbeeldcode hierboven.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="hoe-tekst-uit-een-pdf-bestand-extraheren-met-pymupdf-in-python">Hoe tekst uit een PDF-bestand extraheren met PyMuPDF in Python</h2>
<p>Hier zijn de stappen.</p>
<ol>
<li>Installeer <strong>PyMuPDF</strong></li>
<li>Voer de code uit die in dit artikel wordt gegeven</li>
<li>Bekijk de output</li>
</ol>
<h3 id="installeer-pymupdf">Installeer PyMuPDF</h3>
<p>Installeer <strong>PyMuPDF</strong>, ook bekend als <strong>fitz</strong>, met het volgende commando.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="voorbeeldcode-om-tekst-uit-pdf-te-extraheren-met-pymupdf">Voorbeeldcode om tekst uit PDF te extraheren met PyMuPDF</h3>
<p>We hebben dezelfde pdf gebruikt als eerder.</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Downloadlink</a> (Deze voorbeeld‑PDF wordt in de code gebruikt, maar je kunt uiteraard je eigen PDF gebruiken.)</p>
<h3 id="code-1">Code</h3>
<p>Hier is een volledig code‑voorbeeld voor <strong>het extraheren van tekst uit een PDF met PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="output-1">Output</h3>
<p>Hier is de output van de voorbeeldcode hierboven.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="conclusie">Conclusie</h2>
<p>In dit artikel bieden we een voorbeeld‑Python‑code, een voorbeeldbestand en de output om te demonstreren hoe je tekst uit een PDF kunt extraheren met twee bibliotheken: PyPDF en PyMuPDF.</p>
<p>Als je vragen hebt of problemen ondervindt bij het uitvoeren van de code, laat dan gerust een reactie achter in <a href="https://forum.fileformat.com/">onze forums</a>!</p>
<h2 id="zie-ook">Zie ook</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python PDF naar Afbeelding Conversie: Stapsgewijze Gids</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Batchwijzig bestandscodering naar UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
