ติดตั้ง FileFormat.words สำหรับ. NET, เรียนรู้วิธีอ่านไฟล์ docx ใน c# programmatically API นี้มีวิธีการสร้างตัวแสดงไฟล์คำ
ภาพรวม
ไม่ใช่เรื่องง่ายที่จะสร้างซอฟต์แวร์ธุรกิจที่เกี่ยวข้องกับการสร้างไฟล์และการจัดการอย่างมาก เวลาและชั่วโมงมนุษย์เป็นปัจจัยสำคัญ แต่การเลือกใช้ห้องสมุดบุคคลที่สามที่เกี่ยวข้องมีบทบาทสำคัญในขั้นตอนการพัฒนา ดังนั้นให้ผ่านไลบรารี. NET โอเพนซอร์ซที่มีวิธีการที่หลากหลายในการจัดการไฟล์ Word โดยทางโปรแกรม API นี้ไม่เพียง แต่ให้คุณสร้าง/แก้ไขไฟล์ Word แต่คุณยังสามารถอ่านไฟล์เอกสาร/เอกสารทางธุรกิจได้ เรากำลังพูดถึง fileFormat.words เป็นแพ็คเกจที่สมบูรณ์ของคุณสมบัติที่จำเป็นในการประมวลผลเอกสารคำโดยทางโปรแกรม อย่างไรก็ตามโพสต์บล็อกนี้จะตอบคำถามของคุณ (เช่น ฉันจะเปิดไฟล์ docx ใน C#ได้อย่างไร ) ยิ่งกว่านั้นคุณจะสามารถสร้างเครื่องอ่านไฟล์คำได้ในตอนท้ายของบทความนี้ เราจะครอบคลุมประเด็นต่อไปนี้ในคู่มือนี้:
คำดูไฟล์คำ - การติดตั้ง API
กรุณาเยี่ยมชม ลิงก์ เพื่อผ่านกระบวนการติดตั้งโดยละเอียด มิฉะนั้นจะติดตั้งได้ง่ายไม่ว่าคุณจะติดตั้งได้โดยใช้ Nuget Package หรือโดยใช้คำสั่งต่อไปนี้ใน Nuget Package Manager
Install-Package FileFormat.Words
ฉันจะเปิดไฟล์ docx ใน c# ได้อย่างไร
เมื่อติดตั้ง API โอเพ่นซอร์ส NET นี้แล้วคุณสามารถเริ่มเขียนรหัสได้ทันที มาสร้างส่วนประกอบตัวอ่านไฟล์ Word สำหรับซอฟต์แวร์ธุรกิจของคุณ มีหลายวิธีและคุณสมบัติในการอ่านไฟล์ docx/docs แต่เราจะใช้วิธี/คุณสมบัติที่โดดเด่นบางอย่าง คุณสามารถทำตามขั้นตอนต่อไปนี้และตัวอย่างรหัส:
- เริ่มต้นอินสแตนซ์ของ เอกสาร คลาสและโหลดไฟล์ docx/docs
- อินสแตนซ์วัตถุของ ร่างกาย คลาส
- เรียกใช้ getDocumentTables.count () วิธีที่ส่งคืนจำนวนตารางทั้งหมดในเอกสาร
- คุณสมบัติ getDocumentTables ส่งคืนคุณสมบัติของตาราง
- คุณสมบัติ ที่มีอยู่จริง ส่งคืนส่วนหัวของตาราง
- โทรไปที่คุณสมบัติ numberofrows เพื่อเข้าถึงแถวตาราง
- ใช้คุณสมบัติ NumberOfColumns เพื่อดึงจำนวนคอลัมน์
- เข้าถึงจำนวนเซลล์โดยใช้คุณสมบัติ numberofcells
- คุณสมบัติ TableBorder ใช้เพื่ออ่านสไตล์ชายแดน
- ใช้คุณสมบัติ tableposition เพื่อรับตำแหน่งของตาราง
- เรียกใช้ ExtractimagesFromDocument วิธีการรับภาพทั้งหมดจากเอกสาร Word
- เรียก getParagraphs วิธีการดึงย่อหน้าเอกสารทั้งหมด
- คุณสมบัติ Linesspacing ใช้เพื่อทราบระยะห่างระหว่างเส้น
- คุณสมบัติ เยื้อง ใช้เพื่อทราบถึงคุณค่าของการเยื้อง
- รับข้อความของย่อหน้าโดยเรียกคุณสมบัติ ข้อความ
using FileFormat.Words;
using FileFormat.Words.Table;
namespace Example
{
class Program
{
static void Main(string[] args)
{
// Initialize an instance of the Document class and load the Docx/Docs file.
using (Document doc1 = new Document("/Docs.docx"))
{
// Instantiate an object of the Body class.
Body body1 = new Body(doc1);
// Invoke the getDocumentTables method that returns the total number of tables in a document.
Console.WriteLine("Total Number of Tables " + body1.getDocumentTables.Count());
int i = 0;
// The getDocumentTables property returns the table properties.
foreach (Table props in body1.getDocumentTables)
{
// The ExistingTableHeaders property returns the table headers.
foreach (string tableHeader in props.ExistingTableHeaders)
{
i++;
Console.WriteLine("Header"+i+": "+tableHeader);
}
// Call NumberOfRows property to access the table rows.
Console.WriteLine("Number of rows "+props.NumberOfRows);
// Use NumberOfColumns property to fetch number of columns.
Console.WriteLine("Number of columns " + props.NumberOfColumns);
// Access the number of cells using NumberOfCells property.
Console.WriteLine("Number of cells " + props.NumberOfCells);
Console.WriteLine("Cell width " + props.CellWidth);
// The TableBorder property is used to read the border style.
Console.WriteLine("Border style " + props.TableBorder);
// Use the TablePosition property to get the position of the table.
Console.WriteLine("Table position " + props.TablePosition);
Console.WriteLine(" ");
}
// Invoke the ExtractImagesFromDocument method to get all the images from a Word document.
List<Stream> imageParts = Image.ExtractImagesFromDocument(doc1);
int imageCount = imageParts.Count;
Console.WriteLine($"Total number of images: {imageCount}");
// Call the GetParagraphs method to retrieve all the document paragraphs.
List<Paragraph> paras = body1.GetParagraphs();
Console.WriteLine("The number of Paragraphs " + paras.Count());
foreach (Paragraph p in paras)
{
// The LinesSpacing property is used to know the spacing between the lines.
Console.WriteLine("Line spacing "+p.LinesSpacing);
// The Indent property is used to know the value of indentation.
Console.WriteLine("Indent value "+p.Indent);
// Get the text of the paragraph by calling the Text property.
Console.WriteLine(p.Text);
}
}
}
}
}
ตัวอย่างโค้ดด้านบนอ่านไฟล์คำที่มีหนึ่งย่อหน้าหนึ่งตารางและรูปภาพ อย่างไรก็ตามคุณสามารถเห็นผลลัพธ์ในภาพด้านล่าง:
บทสรุป
เรากำลังสิ้นสุดโพสต์บล็อกนี้ที่นี่ เราหวังว่าคุณจะมีคำตอบสำหรับคำถามของคุณ (เช่น ฉันจะเปิดไฟล์ DOCX ใน C#ได้อย่างไร ) นอกจากนี้เราได้ผ่านตัวอย่างโค้ดที่อ่านเอกสาร Word ที่มีอยู่โดยทางโปรแกรม ตอนนี้คุณสามารถสร้างโมดูลที่ทำงานได้อย่างง่ายดายเช่นตัวดูไฟล์คำ****นอกจากนี้อย่าลืมไปที่ เอกสาร ของ fileFormat.words สำหรับ. NET ในที่สุด fileFormat.com ยังคงเขียนโพสต์บล็อกในหัวข้ออื่น ๆ ยิ่งกว่านั้นคุณสามารถติดตามเราบนแพลตฟอร์มโซเชียลมีเดียของเรารวมถึง Facebook, LinkedIn และ Twitter
มีส่วนร่วม
เนื่องจาก fileFormat.words สำหรับ. NET เป็นโครงการโอเพ่นซอร์สและมีอยู่ใน GitHub ดังนั้นการมีส่วนร่วมจากชุมชนจึงได้รับการชื่นชมอย่างมาก
ถามคำถาม
คุณสามารถแจ้งให้เราทราบเกี่ยวกับคำถามหรือคำถามของคุณเกี่ยวกับ [ฟอรัม] ของเรา 30
คำถามที่พบบ่อย-คำถามที่พบบ่อย
** ฉันจะเปิดไฟล์ docx ได้อย่างไรโดยไม่มีคำว่า** คุณสามารถเปิดไฟล์ docx/docs โดยใช้ไลบรารีโอเพนซอร์ซ. NET fileFormat.words นอกจากนี้คุณสามารถสร้างโมดูลตัวอ่านไฟล์คำสำหรับแอปพลิเคชันธุรกิจของคุณโดยใช้ ไลบรารี