Son Güncelleme: 15 Ocak, 2025

Başlık - Python Kullanarak PDF Dosyasından Metin Çıkarma

Python Kullanarak PDF Dosyasından Metin Çıkarma

Bu makalede, Python kullanarak PDF dosyasından nasıl metin çıkarılacağını size bildireceğiz.

PDF, Portable Document Format (Taşınabilir Belge Formatı) anlamına gelir ve popüler bir dijital belge formatıdır. Bu format, belgelerin yazılım, donanım veya işletim sisteminden bağımsız olarak kolay ve güvenilir bir şekilde görüntülenmesini veya paylaşılmasını sağlamak için tasarlanmıştır. PDF dosyalarının uzantısı .pdf‘dir.

Python kullanarak bir PDF dosyasından metin çıkarmak için bu kütüphaneler yaygın olarak kullanılır. Bu iki kütüphane kullanılarak bir PDF’den nasıl metin çıkarılacağını size göstereceğiz.

  1. pypdf
  2. PyMuPDF

Python’da pypdf Kullanarak PDF Dosyasından Metin Çıkarma

İşte adımlar.

  1. pypdf‘i yükleyin
  2. Bu makalede verilen kodu çalıştırın
  3. Çıktıyı görün

pypdf Yükleme

pypdf‘i aşağıdaki komutu kullanarak yükleyebilirsiniz.

pip install pypdf

pypdf Kullanarak PDF’ten Metin Çıkarmak İçin Örnek Kod

sample.pdf - İndirme Linki (Bu örnek PDF kodda kullanılacak, ancak kendi PDF’nizi de kullanabilirsiniz.)

sample.pdf’in ekran görüntüsü

Örnek Giriş PDF Ekran Görüntüsü

Kod

İşte pypdf kullanarak bir PDF’den metin çıkarmak için eksiksiz bir kod örneği.

Çıktı

İşte yukarıda sağlanan örnek kodun çıktısı.

Python’da PyMuPDF Kullanarak PDF Dosyasından Metin Çıkarma

İşte adımlar.

  1. PyMuPDF‘i yükleyin
  2. Bu makalede verilen kodu çalıştırın
  3. Çıktıyı görün

PyMuPDF Yükleme

PyMuPDF, diğer adıyla fitz, aşağıdaki komutla yükleyin.

pip install pymupdf

PyMuPDF Kullanarak PDF’ten Metin Çıkarmak İçin Örnek Kod

Daha önce kullanılan aynı pdf kullanıldı

sample.pdf - İndirme Linki (Bu örnek PDF kodda kullanılacak, ancak kendi PDF’nizi de kullanabilirsiniz.)

Kod

İşte PyMuPDF kullanarak bir PDF’den metin çıkarmak için eksiksiz bir kod örneği.

Çıktı

İşte yukarıda sağlanan örnek kodun çıktısı.

Sonuç

Bu makalede, iki kütüphaneyi kullanarak bir PDF’den nasıl metin çıkarılacağını göstermek için örnek Python kodu, örnek dosyalar ve bunların çıktıları sağladık: PyPDF ve PyMuPDF.

Kod çalıştırılırken herhangi bir sorunuz veya karşılaştığınız bir sorun olursa, forumlarımızda yorum bırakmaktan çekinmeyin!

Ayrıca Bakınız