Cài đặt tệp FileFormat.words nguồn mở cho .NET, tìm hiểu cách đọc tệp Docx trong C# theo chương trình. API này cung cấp các phương thức để xây dựng trình xem tệp Word.

Làm cách nào để mở tệp docx trong c#

Tổng quan

Không dễ để xây dựng phần mềm kinh doanh liên quan đến việc tạo tệp và thao tác vô cùng. Thời gian và giờ của con người là những yếu tố quan trọng nhưng chọn các thư viện bên thứ ba có liên quan đóng một vai trò quan trọng trong giai đoạn phát triển. Do đó, hãy để Lôi đi qua một thư viện .NET nguồn mở cung cấp một loạt các phương thức để thao tác các tệp Word được lập trình. API này không chỉ cho phép bạn tạo/chỉnh sửa các tệp Word mà bạn còn có thể đọc các tệp Docs/Docx doanh nghiệp. Chúng tôi đang nói về FileFormat.words là một gói hoàn chỉnh các tính năng cần thiết để xử lý các tài liệu từ được lập trình. Tuy nhiên, bài đăng trên blog này sẽ trả lời câu hỏi của bạn (tức là. Làm cách nào để mở tệp docx trong c#? ). Hơn nữa, bạn sẽ có thể xây dựng một trình đọc tệp Word vào cuối bài viết này. Chúng tôi sẽ trình bày các điểm sau trong hướng dẫn này:

Trình xem tệp Word - Cài đặt API

Vui lòng truy cập liên kết này để trải qua quá trình cài đặt một cách chi tiết. Mặt khác, khá dễ dàng để cài đặt, cho dù bạn có thể cài đặt nó bằng Gói Nuget hoặc bằng cách chạy lệnh sau trong Trình quản lý gói Nuget.

Install-Package FileFormat.Words

Làm cách nào để mở tệp docx trong c#

Khi API .NET nguồn mở này được cài đặt, bạn có thể bắt đầu viết mã ngay lập tức. Hãy để xây dựng một thành phần đầu đọc tệp Word cho phần mềm kinh doanh của bạn. Có nhiều phương thức và thuộc tính để đọc tệp DocX/Docs nhưng chúng tôi sẽ sử dụng một số phương thức/thuộc tính nổi bật. Bạn có thể làm theo các bước sau và đoạn mã:

  • Khởi tạo một thể hiện của lớp tài liệu và tải tệp Docx/Docs.
  • Khởi tạo một đối tượng của lớp cơ thể.
  • Gọi phương thức getDocumentTables.Count () trả về tổng số bảng trong một tài liệu.
  • Thuộc tính getDocumentTables trả về các thuộc tính bảng.
  • Thuộc tính Hiện tạiTableHeaders trả về các tiêu đề bảng.
  • Gọi thuộc tính NumberOfRows để truy cập các hàng bảng.
  • Sử dụng thuộc tính NumberOfColumn để tìm nạp số lượng cột.
  • Truy cập số lượng ô bằng thuộc tính numberOfCells.
  • Thuộc tính Taboreborder được sử dụng để đọc kiểu biên giới.
  • Sử dụng thuộc tính BẢO HÀNH để có được vị trí của bảng.
  • Gọi phương thức ExtractimagesFromDocument để lấy tất cả các hình ảnh từ một tài liệu Word.
  • Gọi phương thức GetParagraphs để truy xuất tất cả các đoạn tài liệu.
  • Thuộc tính Linesspaces được sử dụng để biết khoảng cách giữa các dòng.
  • Thuộc tính thụt lề được sử dụng để biết giá trị của thụt.
  • Nhận văn bản của đoạn văn bằng cách gọi thuộc tính văn bản.
using FileFormat.Words;
using FileFormat.Words.Table;
namespace Example
{
    class Program
    {
        static void Main(string[] args)
        {
            // Initialize an instance of the Document class and load the Docx/Docs file. 
            using (Document doc1 = new Document("/Docs.docx"))
            {
                // Instantiate an object of the Body class.
                Body body1 = new Body(doc1);
                // Invoke the getDocumentTables method that returns the total number of tables in a document.
                Console.WriteLine("Total Number of Tables " + body1.getDocumentTables.Count());
                int i = 0;
                // The getDocumentTables property returns the table properties.
                foreach (Table props in body1.getDocumentTables)
                {
                    // The ExistingTableHeaders property returns the table headers.
                    foreach (string tableHeader in props.ExistingTableHeaders)
                    {
                        i++;
                        Console.WriteLine("Header"+i+": "+tableHeader);
                    }
                    // Call NumberOfRows property to access the table rows.
                    Console.WriteLine("Number of rows "+props.NumberOfRows);
                    // Use NumberOfColumns property to fetch number of columns.
                    Console.WriteLine("Number of columns " + props.NumberOfColumns);
                    // Access the number of cells using NumberOfCells property.
                    Console.WriteLine("Number of cells " + props.NumberOfCells);
                    Console.WriteLine("Cell width " + props.CellWidth);
                    // The TableBorder property is used to read the border style.
                    Console.WriteLine("Border style " + props.TableBorder);
                    // Use the TablePosition property to get the position of the table.
                    Console.WriteLine("Table position " + props.TablePosition);
                    Console.WriteLine(" ");
                }

                // Invoke the ExtractImagesFromDocument method to get all the images from a Word document.
                List<Stream> imageParts = Image.ExtractImagesFromDocument(doc1);
                int imageCount = imageParts.Count;
                Console.WriteLine($"Total number of images: {imageCount}");
                // Call the GetParagraphs method to retrieve all the document paragraphs.
                List<Paragraph> paras = body1.GetParagraphs();

                Console.WriteLine("The number of Paragraphs " + paras.Count());
                foreach (Paragraph p in paras)
                {
                    // The LinesSpacing property is used to know the spacing between the lines.
                    Console.WriteLine("Line spacing "+p.LinesSpacing);
                    // The Indent property is used to know the value of indentation.
                    Console.WriteLine("Indent value "+p.Indent);
                    // Get the text of the paragraph by calling the Text property.
                    Console.WriteLine(p.Text);
                }

            }

        }

    }
}

Đoạn mã trên đọc một tệp Word có chứa một đoạn, một bảng và hình ảnh. Tuy nhiên, bạn có thể thấy đầu ra trong hình dưới đây:

đầu đọc tệp từ

Kết luận

Chúng tôi đang kết thúc bài viết trên blog này ở đây. Chúng tôi hy vọng rằng bạn có câu trả lời cho câu hỏi của bạn (tức là. Làm cách nào để mở tệp docx trong c#? ). Ngoài ra, chúng tôi đã trải qua đoạn mã đọc một tài liệu Word hiện có theo chương trình. Bây giờ, bạn có thể dễ dàng xây dựng một mô -đun hoạt động giống như trình xem tệp từ****. Hơn nữa, đừng quên truy cập tài liệu của fileformat.words cho .NET. Cuối cùng, FileFormat.com tiếp tục viết các bài đăng trên blog về các chủ đề khác. Hơn nữa, bạn có thể theo dõi chúng tôi trên các nền tảng truyền thông xã hội của chúng tôi, bao gồm Facebook, LinkedIn, và Twitter.

Đóng góp

FileFormat.words cho .NET là một dự án nguồn mở và có sẵn trên GitHub. Vì vậy, sự đóng góp từ cộng đồng được đánh giá cao.

Đặt câu hỏi

Bạn có thể cho chúng tôi biết về câu hỏi hoặc truy vấn của bạn trên [Diễn đàn] của chúng tôi 30.

Câu hỏi thường gặp-Câu hỏi thường gặp

** Làm cách nào để mở tệp docx mà không có từ? ​​** Bạn có thể mở các tệp Docx/Docs bằng thư viện .NET nguồn mở này FileFormat.words. Hơn nữa, bạn có thể xây dựng mô -đun đầu đọc tệp Word cho ứng dụng kinh doanh của mình bằng [Thư viện] này 23.

Xem thêm