<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/el/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>el</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/el/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Εξαγωγή Κειμένου από Αρχείο PDF με Python</title>
      <link>https://blog.fileformat.com/el/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/el/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>Αυτό το άρθρο θα σας δείξει πώς να εξάγετε κείμενο από ένα PDF με Python χρησιμοποιώντας δημοφιλείς βιβλιοθήκες όπως PyPDF και PyMuPDF. Θα παρέχει επίσης δείγμα κώδικα, δείγματα αρχείων και το αποτέλεσμα.</description>
      <content:encoded><![CDATA[<p><strong>Last Updated</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="Τίτλος - Εξαγωγή Κειμένου από Αρχείο PDF με Python"/> 
</figure>

<h2 id="εξαγωγή-κειμένου-από-αρχείο-pdf-με-python">Εξαγωγή Κειμένου από Αρχείο PDF με Python</h2>
<p>Σε αυτό το άρθρο, θα σας δείξουμε <strong>πώς να εξάγετε κείμενο από αρχείο PDF χρησιμοποιώντας Python</strong>.</p>
<p>PDF σημαίνει <strong>Portable Document Format</strong> και είναι μια δημοφιλής ψηφιακή μορφή εγγράφου. Αυτή η μορφή έχει σχεδιαστεί ώστε τα έγγραφα να μπορούν να προβλήνονται ή να μοιράζονται εύκολα και αξιόπιστα, ανεξάρτητα από λογισμικό, υλικό ή λειτουργικό σύστημα. Τα αρχεία PDF έχουν την επέκταση <strong>.pdf</strong>.</p>
<p>Για την εξαγωγή κειμένου από αρχείο PDF με Python, χρησιμοποιούνται συνήθως οι παρακάτω βιβλιοθήκες. Θα σας δείξουμε πώς να εξάγετε κείμενο από PDF χρησιμοποιώντας και τις δύο.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="πώς-να-εξάγετε-κείμενο-από-αρχείο-pdf-χρησιμοποιώντας-pypdf-σε-python">Πώς να Εξάγετε Κείμενο από Αρχείο PDF Χρησιμοποιώντας pypdf σε Python</h2>
<p>Ακολουθούν τα βήματα.</p>
<ol>
<li>Εγκαταστήστε <strong>pypdf</strong></li>
<li>Εκτελέστε τον κώδικα που δίνεται σε αυτό το άρθρο</li>
<li>Δείτε το αποτέλεσμα</li>
</ol>
<h3 id="εγκατάσταση-pypdf">Εγκατάσταση pypdf</h3>
<p>Μπορείτε να εγκαταστήσετε το <strong>pypdf</strong> με την ακόλουθη εντολή</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="δείγμα-κώδικα-για-εξαγωγή-κειμένου-από-pdf-χρησιμοποιώντας-pypdf">Δείγμα Κώδικα για Εξαγωγή Κειμένου από PDF χρησιμοποιώντας pypdf</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Σύνδεσμος Λήψης</a> (Αυτό το δείγμα PDF θα χρησιμοποιηθεί στον κώδικα, αλλά μπορείτε σίγουρα να χρησιμοποιήσετε το δικό σας PDF.)</p>
<p><strong>σcreenshot του sample.pdf</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="Sample Input PDF Screenshot"  />
</p>
<h3 id="κώδικας">Κώδικας</h3>
<p>Ακολουθεί ένα πλήρες παράδειγμα κώδικα για <strong>εξαγωγή κειμένου από PDF χρησιμοποιώντας pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="αποτέλεσμα">Αποτέλεσμα</h3>
<p>Ακολουθεί το αποτέλεσμα του δείγματος κώδικα που δόθηκε παραπάνω.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="πώς-να-εξάγετε-κείμενο-από-αρχείο-pdf-χρησιμοποιώντας-pymupdf-σε-python">Πώς να Εξάγετε Κείμενο από Αρχείο PDF Χρησιμοποιώντας PyMuPDF σε Python</h2>
<p>Ακολουθούν τα βήματα.</p>
<ol>
<li>Εγκαταστήστε <strong>PyMuPDF</strong></li>
<li>Εκτελέστε τον κώδικα που δίνεται σε αυτό το άρθρο</li>
<li>Δείτε το αποτέλεσμα</li>
</ol>
<h3 id="εγκατάσταση-pymupdf">Εγκατάσταση PyMuPDF</h3>
<p>Εγκαταστήστε το <strong>PyMuPDF</strong>, επίσης γνωστό ως <strong>fitz</strong>, με την ακόλουθη εντολή.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="δείγμα-κώδικα-για-εξαγωγή-κειμένου-από-pdf-χρησιμοποιώντας-pymupdf">Δείγμα Κώδικα για Εξαγωγή Κειμένου από PDF χρησιμοποιώντας PyMuPDF</h3>
<p>Χρησιμοποιήσαμε το ίδιο PDF όπως προηγουμένως</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">Σύνδεσμος Λήψης</a> (Αυτό το δείγμα PDF θα χρησιμοποιηθεί στον κώδικα, αλλά μπορείτε σίγουρα να χρησιμοποιήσετε το δικό σας PDF.)</p>
<h3 id="κώδικας-1">Κώδικας</h3>
<p>Ακολουθεί ένα πλήρες παράδειγμα κώδικα για <strong>εξαγωγή κειμένου από PDF χρησιμοποιώντας PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="αποτέλεσμα-1">Αποτέλεσμα</h3>
<p>Ακολουθεί το αποτέλεσμα του δείγματος κώδικα που δόθηκε παραπάνω.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="συμπέρασμα">Συμπέρασμα</h2>
<p>Σε αυτό το άρθρο, παρέχουμε ένα δείγμα κώδικα Python, ένα δείγμα αρχείου και το αποτέλεσμα τους για να δείξουμε πώς να εξάγετε κείμενο από PDF χρησιμοποιώντας δύο βιβλιοθήκες: PyPDF και PyMuPDF.</p>
<p>Αν έχετε ερωτήσεις ή αντιμετωπίζετε προβλήματα κατά την εκτέλεση του κώδικα, αφήστε ένα σχόλιο στα <a href="https://forum.fileformat.com/">τα φόρουμ μας</a>!</p>
<h2 id="δείτε-επίσης">Δείτε επίσης</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">Μετατροπή PDF σε Εικόνα με Python: Οδηγός Βήμα-Βήμα</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">Μαζική αλλαγή κωδικοποίησης αρχείου σε UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
