<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/da/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>da</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/da/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Udtræk tekst fra PDF-fil ved hjælp af Python</title>
      <link>https://blog.fileformat.com/da/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/da/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Denne artikel viser dig, hvordan du udtrækker tekst fra en PDF i Python ved hjælp af populære biblioteker som PyPDF og PyMuPDF. Den indeholder også eksempel‑kode, eksempelfiler og output.</description>
      <content:encoded><![CDATA[<p><strong>Sidst opdateret</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Titel - Udtræk tekst fra PDF-fil ved hjælp af Python"/> 
</figure>

<h2 id="udtræk-tekst-fra-pdf-fil-ved-hjælp-af-python">Udtræk tekst fra PDF-fil ved hjælp af Python</h2>
<p>I denne artikel vil vi vise dig <strong>hvordan du kan udtrække tekst fra en PDF‑fil ved hjælp af Python</strong>.</p>
<p>PDF står for <strong>Portable Document Format</strong> og er et populært digitalt dokumentformat. Dette format er designet til at gøre det muligt at vise eller dele dokumenter nemt og pålideligt, uanset software, hardware eller operativsystem. PDF‑filer har filtypen <strong>.pdf</strong>.</p>
<p>For at udtrække tekst fra en PDF‑fil ved hjælp af Python, bruges disse biblioteker ofte. Vi vil vise dig, hvordan du kan udtrække tekst fra en PDF ved hjælp af begge.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="sådan-udtrækkes-tekst-fra-en-pdffil-ved-hjælp-af-pypdf-i-python">Sådan udtrækkes tekst fra en PDF‑fil ved hjælp af pypdf i Python</h2>
<p>Her er trinnene.</p>
<ol>
<li>Installer <strong>pypdf</strong></li>
<li>Kør koden givet i denne artikel</li>
<li>Se outputtet</li>
</ol>
<h3 id="installer-pypdf">Installer pypdf</h3>
<p>Du kan installere <strong>pypdf</strong> ved hjælp af følgende kommando</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="eksempelkode-til-at-udtrække-tekst-fra-pdf-ved-hjælp-af-pypdf">Eksempel‑kode til at udtrække tekst fra PDF ved hjælp af pypdf</h3>
<p><strong>sample.pdf</strong> – <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Download link</a> (Dette eksempel‑PDF vil blive brugt i koden, men du kan naturligvis bruge din egen PDF.)</p>
<p><strong>Skærmbillede af eksempel‑PDF</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Skærmbillede af eksempel‑PDF"  />
</p>
<h3 id="kode">Kode</h3>
<p>Her er et komplet kodeeksempel for <strong>udtrækning af tekst fra en PDF ved hjælp af pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="output">Output</h3>
<p>Her er outputtet fra den ovenstående eksempel‑kode.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="sådan-udtrækkes-tekst-fra-en-pdffil-ved-hjælp-af-pymupdf-i-python">Sådan udtrækkes tekst fra en PDF‑fil ved hjælp af PyMuPDF i Python</h2>
<p>Her er trinnene.</p>
<ol>
<li>Installer <strong>PyMuPDF</strong></li>
<li>Kør koden givet i denne artikel</li>
<li>Se outputtet</li>
</ol>
<h3 id="installer-pymupdf">Installer PyMuPDF</h3>
<p>Installer <strong>PyMuPDF</strong>, også kendt som <strong>fitz</strong>, ved hjælp af følgende kommando.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="eksempelkode-til-at-udtrække-tekst-fra-pdf-ved-hjælp-af-pymupdf">Eksempel‑kode til at udtrække tekst fra PDF ved hjælp af PyMuPDF</h3>
<p>Vi brugte den samme PDF som før</p>
<p><strong>sample.pdf</strong> – <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Download link</a> (Dette eksempel‑PDF vil blive brugt i koden, men du kan naturligvis bruge din egen PDF.)</p>
<h3 id="kode-1">Kode</h3>
<p>Her er et komplet kodeeksempel for <strong>udtrækning af tekst fra en PDF ved hjælp af PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="output-1">Output</h3>
<p>Her er outputtet fra den ovenstående eksempel‑kode.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="konklusion">Konklusion</h2>
<p>I denne artikel giver vi et eksempel på Python‑kode, en eksempelfil og deres output for at demonstrere, hvordan man udtrækker tekst fra en PDF ved hjælp af to biblioteker: PyPDF og PyMuPDF.</p>
<p>Hvis du har spørgsmål eller støder på problemer, mens du kører koden, er du velkommen til at efterlade en kommentar i <a href="https://forum.fileformat.com/">vores fora</a>!</p>
<h2 id="se-også">Se også</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python PDF til billedkonvertering: Trin-for-trin guide</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Batch‑ændring af filkodning til UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
