<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/lv/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>lv</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/lv/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Izvilkt tekstu no PDF faila, izmantojot Python</title>
      <link>https://blog.fileformat.com/lv/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/lv/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Šajā rakstā parādīsim, kā izvilkt tekstu no PDF faila, izmantojot Python, ar populārām bibliotēkām, piemēram, PyPDF un PyMuPDF. Tāpat tiks sniegti paraugkods, parauga faili un rezultāts.</description>
      <content:encoded><![CDATA[<p><strong>Pēdējoreiz atjaunināts</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Virsraksts - Izvilkt tekstu no PDF faila, izmantojot Python"/> 
</figure>

<h2 id="izvilkt-tekstu-no-pdf-faila-izmantojot-python">Izvilkt tekstu no PDF faila, izmantojot Python</h2>
<p>Šajā rakstā mēs pastāstīsim <strong>kā izvilkt tekstu no PDF faila, izmantojot Python</strong>.</p>
<p>PDF ir saīsinājums no <strong>Portable Document Format</strong> (Portāla Dokumenta Formāts) un ir populārs digitālais dokumentu formāts. Šis formāts ir izstrādāts, lai dokumentus varētu skatīt vai koplietot viegli un uzticami, neatkarīgi no programmatūras, aparatūras vai operētājsistēmas. PDF faili ir ar paplašinājumu <strong>.pdf</strong>.</p>
<p>Lai izvilktu tekstu no PDF faila, izmantojot Python, parasti tiek izmantotas šīs bibliotēkas. Mēs parādīsim, kā izvilkt tekstu no PDF, izmantojot abas.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="kā-izvilkt-tekstu-no-pdf-faila-izmantojot-pypdf-python">Kā izvilkt tekstu no PDF faila, izmantojot pypdf, Python</h2>
<p>Šeit ir soļi.</p>
<ol>
<li>Instalējiet <strong>pypdf</strong></li>
<li>Izpildiet šajā rakstā sniegto kodu</li>
<li>Apskatiet rezultātu</li>
</ol>
<h3 id="instalēt-pypdf">Instalēt pypdf</h3>
<p>Jūs varat instalēt <strong>pypdf</strong>, izmantojot šādu komandu</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="parauga-kods-lai-izvilktu-tekstu-no-pdf-izmantojot-pypdf">Parauga kods, lai izvilktu tekstu no PDF, izmantojot pypdf</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Lejupielādes saite</a> (Šis parauga PDF tiks izmantots kodā, bet jūs noteikti varat izmantot savu PDF.)</p>
<p><strong>sample.pdf ekrānattēls</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Parauga PDF ievades ekrānattēls"  />
</p>
<h3 id="kods">Kods</h3>
<p>Šeit ir pilns koda piemērs <strong>teksta izvilkšanai no PDF, izmantojot pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="izvade">Izvade</h3>
<p>Šeit ir iepriekš sniegtā parauga koda izvade.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="kā-izvilkt-tekstu-no-pdf-faila-izmantojot-pymupdf-python">Kā izvilkt tekstu no PDF faila, izmantojot PyMuPDF, Python</h2>
<p>Šeit ir soļi.</p>
<ol>
<li>Instalējiet <strong>PyMuPDF</strong></li>
<li>Izpildiet šajā rakstā sniegto kodu</li>
<li>Apskatiet rezultātu</li>
</ol>
<h3 id="instalēt-pymupdf">Instalēt PyMuPDF</h3>
<p>Instalējiet <strong>PyMuPDF</strong>, kas arī pazīstams kā <strong>fitz</strong>, izmantojot šādu komandu.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="parauga-kods-lai-izvilktu-tekstu-no-pdf-izmantojot-pymupdf">Parauga kods, lai izvilktu tekstu no PDF, izmantojot PyMuPDF</h3>
<p>Mēs izmantojām to pašu PDF kā iepriekš</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Lejupielādes saite</a> (Šis parauga PDF tiks izmantots kodā, bet jūs noteikti varat izmantot savu PDF.)</p>
<h3 id="kods-1">Kods</h3>
<p>Šeit ir pilns koda piemērs <strong>teksta izvilkšanai no PDF, izmantojot PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="izvade-1">Izvade</h3>
<p>Šeit ir iepriekš sniegtā parauga koda izvade.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="secinājums">Secinājums</h2>
<p>Šajā rakstā mēs piedāvājam parauga Python kodu, parauga failu un to izvadi, lai parādītu, kā izvilkt tekstu no PDF, izmantojot divas bibliotēkas: PyPDF un PyMuPDF.</p>
<p>Ja jums ir kādi jautājumi vai rodas kādas problēmas, izpildot kodu, droši atstājiet komentāru <a href="https://forum.fileformat.com/">mūsu forumos</a>!</p>
<h2 id="skatīt-arī">Skatīt arī</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Python PDF uz attēlu konvertēšana: soli pa solim ceļvedis</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Masveida failu kodējuma maiņa uz UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
