Last Updated: 15 Jan, 2025

Başlıq - PDF Faylından Mətn Çıxarmaq Python ilə

PDF Faylından Mətn Çıxarmaq Python ilə

Bu məqalədə Python ilə PDF faylından mətn necə çıxarılır göstərəcəyik.

PDF, Portable Document Format deməkdir və geniş yayılmış rəqəmsal sənəd formatıdır. Bu format sənədlərin proqram, avadanlıq və ya əməliyyat sistemi fərq etmədən asanlıqla baxılmasını və paylaşılmasını təmin edir. PDF faylları .pdf uzantısına malikdir.

Python‑da PDF‑dən mətn çıxarmaq üçün bu kitabxanalar geniş istifadə olunur. Hər ikisi ilə mətn çıxarmağı göstərəcəyik.

  1. pypdf
  2. PyMuPDF

Python‑da pypdf ilə PDF Faylından Mətn Çıxarmaq

Addımlar bunlardır.

  1. pypdf quraşdırın
  2. Bu məqalədə verilən kodu icra edin
  3. Nəticəni görün

pypdf quraşdırın

Aşağıdakı əmrlə pypdf‑i quraşdıra bilərsiniz

pip install pypdf

pypdf ilə PDF‑dən Mətn Çıxarmaq üçün Nümunə Kodu

sample.pdf - Yükləmə Linki (Bu nümunə PDF kodda istifadə olunacaq, öz PDF‑inizi də istifadə edə bilərsiniz.)

sample.pdf‑nin ekran görüntüsü

Nümunə PDF Giriş Ekran Görüntüsü

Kod

pypdf ilə PDF‑dən mətn çıxarmaq üçün tam kod nümunəsi:

Nəticə

Yuxarıdakı nümunə kodun nəticəsi:

Python‑da PyMuPDF ilə PDF Faylından Mətn Çıxarmaq

Addımlar bunlardır.

  1. PyMuPDF quraşdırın
  2. Bu məqalədə verilən kodu icra edin
  3. Nəticəni görün

PyMuPDF quraşdırın

PyMuPDF, həmçinin fitz adı ilə tanınır, aşağıdakı əmrlə quraşdırılır.

pip install pymupdf

PyMuPDF ilə PDF‑dən Mətn Çıxarmaq üçün Nümunə Kodu

Əvvəlki nümunə PDF‑dən eyni fayl istifadə olunmuşdur.

sample.pdf - Yükləmə Linki (Bu nümunə PDF kodda istifadə olunacaq, öz PDF‑inizi də istifadə edə bilərsiniz.)

Kod

PyMuPDF ilə PDF‑dən mətn çıxarmaq üçün tam kod nümunəsi:

Nəticə

Yuxarıdakı nümunə kodun nəticəsi:

Nəticə

Bu məqalədə iki kitabxana – PyPDF və PyMuPDF – vasitəsilə PDF‑dən mətn çıxarmaq üçün nümunə Python kodu, nümunə fayl və nəticələr təqdim etdik.

Kod icra edərkən suallarınız və ya problemləriniz olarsa, bizim forumlarımız‑da şərh yazmaqdan çəkinməyin!

Əlaqədar Məqalələr