<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Python on File Format Blog</title>
    <link>https://blog.fileformat.com/he/categories/python/</link>
    <description>Recent content in Python on File Format Blog</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>he</language>
    <lastBuildDate>Wed, 15 Jan 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.fileformat.com/he/categories/python/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>חילוץ טקסט מקובץ PDF באמצעות פייתון</title>
      <link>https://blog.fileformat.com/he/programming/extract-text-from-pdf-file-using-python/</link>
      <pubDate>Wed, 15 Jan 2025 00:00:00 +0000</pubDate>
      
      <guid>https://blog.fileformat.com/he/programming/extract-text-from-pdf-file-using-python/</guid>
      <description>מאמר זה יראה לכם כיצד לחלץ טקסט מ‑PDF בפייתון באמצעות ספריות פופולריות כמו PyPDF ו‑PyMuPDF. הוא גם יספק קוד לדוגמה, קבצים לדוגמה, ואת הפלט.</description>
      <content:encoded><![CDATA[<p><strong>עדכון אחרון</strong>: 15 Jan, 2025</p>
<figure class="align-center ">
    <img loading="lazy" src="images/extract-text-from-pdf-file-using-python.webp#center"
         alt="כותרת - חילוץ טקסט מקובץ PDF באמצעות פייתון"/> 
</figure>

<h2 id="חילוץ-טקסט-מקובץ-pdf-באמצעות-פייתון">חילוץ טקסט מקובץ PDF באמצעות פייתון</h2>
<p>במאמר זה נציג לכם <strong>איך לחלץ טקסט מקובץ PDF באמצעות פייתון</strong>.</p>
<p>PDF הוא קיצור של <strong>Portable Document Format</strong> והוא פורמט מסמכים דיגיטלי פופולרי. פורמט זה נועד לאפשר צפייה ושיתוף של מסמכים בקלות ובאמינות, ללא תלות בתוכנה, חומרה או מערכת הפעלה. קבצי PDF נושאים את הסיומת <strong>.pdf</strong>.</p>
<p>כדי לחלץ טקסט מקובץ PDF באמצעות פייתון, ספריות אלו משמשות בדרך כלל. נציג לכם כיצד לחלץ טקסט מ‑PDF באמצעות שתיהן.</p>
<ol>
<li><a href="https://pypi.org/project/pypdf/"><strong>pypdf</strong></a></li>
<li><a href="https://pypi.org/project/PyMuPDF/"><strong>PyMuPDF</strong></a></li>
</ol>
<h2 id="איך-לחלץ-טקסט-מקובץ-pdf-באמצעות-pypdf-בפייתון">איך לחלץ טקסט מקובץ PDF באמצעות pypdf בפייתון</h2>
<p>להלן הצעדים.</p>
<ol>
<li>התקנת <strong>pypdf</strong></li>
<li>הרצת הקוד המופיע במאמר זה</li>
<li>צפייה בתוצאה</li>
</ol>
<h3 id="התקנת-pypdf">התקנת pypdf</h3>
<p>ניתן להתקין את <strong>pypdf</strong> באמצעות הפקודה הבאה</p>
<pre tabindex="0"><code>pip install pypdf
</code></pre><h3 id="קוד-לדוגמה-לחילוץ-טקסט-מpdf-באמצעות-pypdf">קוד לדוגמה לחילוץ טקסט מ‑PDF באמצעות pypdf</h3>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">קישור להורדה</a> (קובץ PDF לדוגמה זה ישמש בקוד, אך אתם יכולים להשתמש ב‑PDF שלכם.)</p>
<p><strong>צילום מסך של sample.pdf</strong></p>
<p><img loading="lazy" src="https://raw.githubusercontent.com/shakeel-faiz/InputOutputDocs/master/python-convert-pdf-to-image/sample-input-pdf-screenshot.png" alt="צילום מסך של קובץ PDF קלט"  />
</p>
<h3 id="קוד">קוד</h3>
<p>להלן דוגמת קוד מלאה עבור <strong>חילוץ טקסט מ‑PDF באמצעות pypdf</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/50b8279dca1fa397849031e8d370cd95.js?file=extract-text-from-pdf-using-pypdf.py"></script>

<h3 id="פלט">פלט</h3>
<p>להלן הפלט של קוד הדוגמה שסופק למעלה.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/6870826ad3c40b67dfc3d4aef838328b.js?file=output-extract-text-from-pdf-using-pypdf"></script>

<h2 id="איך-לחלץ-טקסט-מקובץ-pdf-באמצעות-pymupdf-בפייתון">איך לחלץ טקסט מקובץ PDF באמצעות PyMuPDF בפייתון</h2>
<p>להלן הצעדים.</p>
<ol>
<li>התקנת <strong>PyMuPDF</strong></li>
<li>הרצת הקוד המופיע במאמר זה</li>
<li>צפייה בתוצאה</li>
</ol>
<h3 id="התקנת-pymupdf">התקנת PyMuPDF</h3>
<p>התקנת <strong>PyMuPDF</strong>, הידוע גם בשם <strong>fitz</strong>, באמצעות הפקודה הבאה.</p>
<pre tabindex="0"><code>pip install pymupdf
</code></pre><h3 id="קוד-לדוגמה-לחילוץ-טקסט-מpdf-באמצעות-pymupdf">קוד לדוגמה לחילוץ טקסט מ‑PDF באמצעות PyMuPDF</h3>
<p>השתמשנו באותו קובץ PDF כמו קודם</p>
<p><strong>sample.pdf</strong> - <a href="https://github.com/shakeel-faiz/InputOutputDocs/raw/master/python-convert-pdf-to-image/sample.pdf">קישור להורדה</a> (קובץ PDF לדוגמה זה ישמש בקוד, אך אתם יכולים להשתמש ב‑PDF שלכם.)</p>
<h3 id="קוד-1">קוד</h3>
<p>להלן דוגמת קוד מלאה עבור <strong>חילוץ טקסט מ‑PDF באמצעות PyMuPDF</strong>.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/799f8ecafe4d64feb803548b0d1db36d.js?file=extract-text-from-pdf-using-pymupdf.py"></script>

<h3 id="פלט-1">פלט</h3>
<p>להלן הפלט של קוד הדוגמה שסופק למעלה.</p>
<script type="application/javascript" src="https://gist.github.com/fileformat-blog-gists/cfda58da76b68dea4c5269b627901417.js?file=output-extract-text-from-pdf-using-pymupdf"></script>

<h2 id="סיכום">סיכום</h2>
<p>במאמר זה אנו מספקים קוד פייתון לדוגמה, קובץ לדוגמה, ואת הפלט שלהם כדי להדגים כיצד לחלץ טקסט מ‑PDF באמצעות שתי ספריות: PyPDF ו‑PyMuPDF.</p>
<p>אם יש לכם שאלות או נתקלתם בבעיות בעת הרצת הקוד, אל תהססו להשאיר תגובה ב<a href="https://forum.fileformat.com/">הפורומים שלנו</a>!</p>
<h2 id="ראה-גם">ראה גם</h2>
<ul>
<li><a href="https://blog.fileformat.com/programming/convert-pdf-to-image-in-python/">המרת PDF לתמונה בפייתון: מדריך שלב‑אחר‑שלב</a></li>
<li><a href="https://blog.fileformat.com/programming/batch-change-file-encoding-to-utf8/">שינוי קידוד קבצים במצב אצווה ל‑UTF-8</a></li>
</ul>
]]></content:encoded>
    </item>
    
  </channel>
</rss>
