<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/hu/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>hu</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/hu/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Szöveg kinyerése PDF-fájlból Python segítségével</title>
      <link>https://blog.fileformat.com/hu/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/hu/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Ez a cikk megmutatja, hogyan lehet szöveget kinyerni egy PDF-ből Pythonban népszerű könyvtárak, például a PyPDF és a PyMuPDF használatával. Emellett minta kódot, mintafájlokat és a kimenetet is biztosítja.</description>
      <content:encoded><![CDATA[<p><strong>Legutóbb frissítve</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Cím - Szöveg kinyerése PDF-fájlból Python segítségével"/> 
</figure>

<h2 id="szöveg-kinyerése-pdf-fájlból-python-segítségével">Szöveg kinyerése PDF-fájlból Python segítségével</h2>
<p>Ebben a cikkben megmutatjuk, <strong>hogyan lehet szöveget kinyerni egy PDF-fájlból Python segítségével</strong>.</p>
<p>PDF a <strong>Portable Document Format</strong> rövidítése, egy népszerű digitális dokumentumformátum. Ez a formátum úgy lett tervezve, hogy a dokumentumok könnyen és megbízhatóan megtekinthetők vagy megoszthatók legyenek, függetlenül a szoftvertől, hardvertől vagy operációs rendszertől. A PDF-fájlok kiterjesztése <strong>.pdf</strong>.</p>
<p>PDF-fájlból szöveg kinyeréséhez Pythonban ezeket a könyvtárakat használják gyakran. Megmutatjuk, hogyan lehet szöveget kinyerni egy PDF-ből mindkettő segítségével.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="szöveg-kinyerése-pdf-fájlból-pypdf-használatával-pythonban">Szöveg kinyerése PDF-fájlból pypdf használatával Pythonban</h2>
<p>Itt vannak a lépések.</p>
<ol>
<li>Telepítsd a <strong>pypdf</strong>-t</li>
<li>Futtasd a cikkben megadott kódot</li>
<li>Nézd meg a kimenetet</li>
</ol>
<h3 id="pypdf-telepítése">pypdf telepítése</h3>
<p>A <strong>pypdf</strong> telepíthető a következő parancs használatával</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="minta-kód-a-szöveg-kinyeréséhez-pdf-ből-pypdf-használatával">Minta kód a szöveg kinyeréséhez PDF-ből pypdf használatával</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Letöltési hivatkozás</a> (Ez a minta PDF a kódban lesz használva, de természetesen saját PDF-et is használhatsz.)</p>
<p><strong>a sample.pdf képernyőképe</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Minta PDF bemeneti képernyőkép"  />
</p>
<h3 id="kód">Kód</h3>
<p>Itt egy teljes kódrészlet a <strong>PDF-ből szöveg kinyeréséhez pypdf használatával</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="kimenet">Kimenet</h3>
<p>Itt látható a fenti minta kód kimenete.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="szöveg-kinyerése-pdf-fájlból-pymupdf-használatával-pythonban">Szöveg kinyerése PDF-fájlból PyMuPDF használatával Pythonban</h2>
<p>Itt vannak a lépések.</p>
<ol>
<li>Telepítsd a <strong>PyMuPDF</strong>-t</li>
<li>Futtasd a cikkben megadott kódot</li>
<li>Nézd meg a kimenetet</li>
</ol>
<h3 id="pymupdf-telepítése">PyMuPDF telepítése</h3>
<p>A <strong>PyMuPDF</strong> (más néven <strong>fitz</strong>) telepíthető a következő parancs használatával.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="minta-kód-a-szöveg-kinyeréséhez-pdf-ből-pymupdf-használatával">Minta kód a szöveg kinyeréséhez PDF-ből PyMuPDF használatával</h3>
<p>Ugyanazt a PDF-et használtuk, mint korábban</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Letöltési hivatkozás</a> (Ez a minta PDF a kódban lesz használva, de természetesen saját PDF-et is használhatsz.)</p>
<h3 id="kód-1">Kód</h3>
<p>Itt egy teljes kódrészlet a <strong>PDF-ből szöveg kinyeréséhez PyMuPDF használatával</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="kimenet-1">Kimenet</h3>
<p>Itt látható a fenti minta kód kimenete.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="következtetés">Következtetés</h2>
<p>Ebben a cikkben egy minta Python kódot, egy mintafájlt és azok kimenetét mutatjuk be, hogy bemutassuk, hogyan lehet szöveget kinyerni egy PDF-ből két könyvtár, a PyPDF és a PyMuPDF segítségével.</p>
<p>Ha kérdésed van, vagy problémába ütközöl a kód futtatása közben, nyugodtan hagyj egy megjegyzést a <a href="https://forum.fileformat.com/">a fórumunkban</a>!</p>
<h2 id="lásd-még">Lásd még</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python PDF képpé konvertálása: lépésről lépésre útmutató</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Fájl kódolásának tömeges módosítása UTF-8-ra</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
