ปรับปรุงล่าสุด: 29 ม.ค. 2025
ในบทความนี้ เราจะนำเสนอคำแนะนำเกี่ยวกับ วิธีการทำงานกับไฟล์ PDF ด้วย Python สำหรับการนี้เราจะใช้ไลบรารี pypdf
การใช้ไลบรารี pypdf เราจะแสดงวิธีการดำเนินการดังต่อไปนี้ใน Python:
การดึงข้อความจากไฟล์ PDF หมุนหน้าของ PDF รวมไฟล์ PDF หลายไฟล์ แยกไฟล์ PDF ออกเป็นไฟล์แยกต่างหาก เพิ่มลายน้ำลงบนหน้าของ PDF หมายเหตุ: บทความนี้ครอบคลุมรายละเอียดจำนวนมาก สามารถข้ามไปที่ส่วนที่คุณสนใจได้เลย! เนื้อหาได้รับการจัดระเบียบเพื่อให้สามารถนำทางได้ง่าย คุณจึงสามารถมุ่งเน้นไปที่ส่วนที่เกี่ยวข้องมากที่สุดได้อย่างรวดเร็ว
ตัวอย่างโค้ด คุณสามารถดาวน์โหลดโค้ดตัวอย่างทั้งหมดที่ใช้ในบทความนี้ได้จากลิงก์ด้านล่าง ซึ่งรวมถึงโค้ด ไฟล์นำเข้า และไฟล์ผลลัพธ์
ตัวอย่างโค้ดและไฟล์นำเข้าสำหรับการทำงานกับไฟล์ PDF ใน Python ติดตั้ง pypdf เพื่อที่จะติดตั้ง pypdf ให้รันคำสั่งต่อไปนี้ในเทอร์มินัลหรือคำสั่งพรอมต์:
pip install pypdf หมายเหตุ: คำสั่งข้างต้นจำเป็นต้องพิมพ์ตัวอักษรตรงตามกรณีที่ระบุ
1. การดึงข้อความจากไฟล์ PDF โดยใช้ Python คำอธิบายโค้ด 1. การสร้างวัตถุเครื่องอ่าน PDF
reader = PdfReader(pdf_file) PdfReader(pdf_file) โหลดไฟล์ PDF เข้าไปใน วัตถุเครื่องอ่าน วัตถุนี้อนุญาตให้เข้าถึงหน้าและเนื้อหาของพวกเขา 2.