Last Updated: 15 Jan, 2025

PDF Faylından Mətn Çıxarmaq Python ilə
Bu məqalədə Python ilə PDF faylından mətn necə çıxarılır göstərəcəyik.
PDF, Portable Document Format deməkdir və geniş yayılmış rəqəmsal sənəd formatıdır. Bu format sənədlərin proqram, avadanlıq və ya əməliyyat sistemi fərq etmədən asanlıqla baxılmasını və paylaşılmasını təmin edir. PDF faylları .pdf uzantısına malikdir.
Python‑da PDF‑dən mətn çıxarmaq üçün bu kitabxanalar geniş istifadə olunur. Hər ikisi ilə mətn çıxarmağı göstərəcəyik.
Python‑da pypdf ilə PDF Faylından Mətn Çıxarmaq
Addımlar bunlardır.
- pypdf quraşdırın
- Bu məqalədə verilən kodu icra edin
- Nəticəni görün
pypdf quraşdırın
Aşağıdakı əmrlə pypdf‑i quraşdıra bilərsiniz
pip install pypdf
pypdf ilə PDF‑dən Mətn Çıxarmaq üçün Nümunə Kodu
sample.pdf - Yükləmə Linki (Bu nümunə PDF kodda istifadə olunacaq, öz PDF‑inizi də istifadə edə bilərsiniz.)
sample.pdf‑nin ekran görüntüsü

Kod
pypdf ilə PDF‑dən mətn çıxarmaq üçün tam kod nümunəsi:
Nəticə
Yuxarıdakı nümunə kodun nəticəsi:
Python‑da PyMuPDF ilə PDF Faylından Mətn Çıxarmaq
Addımlar bunlardır.
- PyMuPDF quraşdırın
- Bu məqalədə verilən kodu icra edin
- Nəticəni görün
PyMuPDF quraşdırın
PyMuPDF, həmçinin fitz adı ilə tanınır, aşağıdakı əmrlə quraşdırılır.
pip install pymupdf
PyMuPDF ilə PDF‑dən Mətn Çıxarmaq üçün Nümunə Kodu
Əvvəlki nümunə PDF‑dən eyni fayl istifadə olunmuşdur.
sample.pdf - Yükləmə Linki (Bu nümunə PDF kodda istifadə olunacaq, öz PDF‑inizi də istifadə edə bilərsiniz.)
Kod
PyMuPDF ilə PDF‑dən mətn çıxarmaq üçün tam kod nümunəsi:
Nəticə
Yuxarıdakı nümunə kodun nəticəsi:
Nəticə
Bu məqalədə iki kitabxana – PyPDF və PyMuPDF – vasitəsilə PDF‑dən mətn çıxarmaq üçün nümunə Python kodu, nümunə fayl və nəticələr təqdim etdik.
Kod icra edərkən suallarınız və ya problemləriniz olarsa, bizim forumlarımız‑da şərh yazmaqdan çəkinməyin!