为了自动化我们应用程序中文档的操纵,我们需要一些可靠的API。市场同时提供开源软件(OSS)和封闭源软件(CSS)来使用Word Processing文档。封闭的源API通常是昂贵的。基本功能和高级功能都有一堆免费的API,以下是其中一些:
打开XML SDK NPOI DOCX 以免费的API {.wp-block-neading}入门 让我们开始从API的安装和基本用法开始。
打开XML SDK 打开XML SDK需要.NET框架3.5或更高。您可以使用以下命令从Nuget安装库。
Install-Package DocumentFormat.OpenXml 完成安装后,您可以使用以下代码免费创建一个简单的DOCX文档。
// Open an existing word processing document using (WordprocessingDocument wordprocessingDocument = WordprocessingDocument.Open("fileformat.docx", true)) { Body body = wordprocessingDocument.MainDocumentPart.Document.Body; // Add paragraph Paragraph para = body.AppendChild(new Paragraph()); Run run = para.AppendChild(new Run()); run.AppendChild(new Text("File Format Developer Guide")); } 有关详细信息,请访问此链接。
npoi NPOI是POI Java项目的.NET版本。就像打开XML SDK一样,您可以在使用Nuget中安装。
Install-Package NPOI -Version 2.4.1 同样,使用NPOI创建文档也更简单。您可以使用几行代码创建DOCX文件。
using (FileStream sw = File.Create("fileformat.docx")) { XWPFDocument doc = new XWPFDocument(); doc.
使用phpword创建Word文档
phpword是一种功能强大的开源API,用PHP编写,用于创建和读取文件形式,包括doc,docx,odt,[4][rtf][rtf][rtf] 5],HTML和PDF。使用API,您可以创建文档,设置文档属性,插入图像,插入图表以及更多。让我们开始使用phpword创建一个简单的docx文件。
先决条件 要使用phpword创建Word文档,您需要在操作系统中安装以下资源:
PHP版本5.3.3+
作曲家
[XML解析器扩展10] ( This extension is enabled by default )
Zend Escaper Componen T(您可以使用以下命令安装它)
composer require zendframework/zend-escaper [Zend STDLIB Component12] (You can install it using the following command) composer require zendframework/zend-stdlib 如何安装phpword 之后,您准备就绪前提条件,可以使用简单的作曲家命令安装PHPWOWE:
composer require phpoffice/phpword 使用PHP创建Word文档 创建Word文档很简单。您需要使用 phpword() 方法创建一个新文档,使用 addSection() 方法创建一个新部分,然后使用 addtext() 方法在其中添加文本。以下是创建简单Word文档的代码片段。
addSection(); // Add Text element to the Section $section->addText( 'File Format Developer Guide - ' .
开始使用Apache POI - 文档Java API
通常,我们需要自动化流程并以编程方式操纵文档。我们需要批量创建文档,阅读,处理并保存结果文档。我们需要同时使用一堆不同的文件格式。幸运的是,对于Java开发人员而言,我们有一个开源API可以与Word,电子表格,Edracteration,email和图表55一起使用。 ]文件格式 - apache poi。该跨平台API旨在与基于Java虚拟机(JVM)语言一起使用。
如何安装 安装Apache POI毫不费力。您需要做的就是在基于Maven的项目中添加依赖关系。您可以在pom.xml中添加以下依赖关系,并开始使用Apache POI。 org.apache.poipoi4.1.0 创建一个Word文档 使用Apache POI,您可以使用 xwpfdocument 创建Word文档,并使用 XWPFParagraph 类插入段落。以下代码段显示了如何使用API创建Word文档。
// initialize a blank document XWPFDocument document = new XWPFDocument(); // create a new file FileOutputStream out = new FileOutputStream(new File("createdocument.docx")); // create a new paragraph paragraph XWPFParagraph paragraph = document.createParagraph(); XWPFRun run = paragraph.createRun(); run.setText("File Format Developer Guide - " + "Learn about computer files that you come across in " + "your daily work at: www.
XLS和XLSX之间的差异
XLS和XLSX扩展代表流行的Excel文件格式,由Microsoft在一段时间内作为其Office Suite的一部分引入。 XLS是最古老且使用广泛的文件类型,也已知是Excel97-2003文件格式。 XLSX文件格式是在Excel 2007的启动下引入XLS文件类型的替换。常见用户可能不知道两种文件格式之间的潜在差异,但是,XLS与XLSX文件格式不同,以几种方式详细介绍。
xls vs xlsx 那么XLS和XLSX之间实际上是什么不同的?以下是XLS和XLSX文件格式之间差异的列表。
文件格式差异 基础文件格式是XLS和XLSX文件之间的主要区别。 XLS文件基于二进制互换文件格式(BIFF),并根据XLS文件格式规格以二进制格式存储信息。如[MS-XLS]中所述,数据以二进制流的形式排列在XLS文件中。 相比之下,XLSX文件基于Office Open XML格式,该格式将数据存储在压缩XML文件中的ZIP格式。可以通过简单地解开.xlsx文件来检查基础结构和文件。示例XLSX文件将其重命名为.zip和提取时,可以在文件夹中观察到其内容作为其他任何文件夹。
支持宏 XLS文件是旧格式,为宏提供了支持,这些程序是由最终用户编写的程序,用于自动化任务,例如打开文件,数据比较等。一端的宏有助于用户自动化任务,但另一方面,由于您打开Excel文件时,它们直接运行。 相反,XLSX文件不支持宏。如果您需要嵌入和执行宏,则必须将文件保存为XLSM,这是Excel Open XML XML宏观启用的电子表格文件格式。
Excel支持性 由于向后兼容,可以使用所有版本的Excel打开XLS文件。但是,XLSX只能使用Excel 2007和横向版本打开。 还对XLS或XLSX文件格式的内部详细信息有进一步的疑问吗?您可以通过文件格式论坛与文件格式专家取得联系,以便为您的问题提供指导。
Excel文件格式:XLSX,XLSM,XLS,XLTX,XLTM
带有XLSX,XLSM,XLS,XLTX或XLTM扩展名的文件是使用特定标准文件格式的Microsoft Excel文件。您可以从文件夹选项上显示或显示文件扩展名。 MS Excel可让您使用 另存为 选项以任何这些文件格式保存文件。如本文所述,这些Excel文件格式用于处理电子表格文件的目的不同。 除了标准文件格式外,Excel还间接使用其他文件格式以及一组不同的操作。例如,当将Windows Metafile图片复制并粘贴到Excel工作表中时,它使用Windows Metafile格式(WMF)或Windows增强的Metafile格式(EMF)。
什么是XLSX文件? XLSX文件是Office 2007引入的Microsoft Excel的默认文件格式。它基于Office Open XML标准,可以由许多应用程序和API打开。可以通过将XLSX扩展名重命名为zip并使用任何归档软件打开,可以查看XLSX文件中的内容。
什么是XLS文件? XLS文件是一个电子表格文件,它是在Excel二进制互换文件格式(BIFF)中创建的,并且是Microsoft的专有。它可以使用Excel 2003和更早版本创建。可以在最新版本的Microsoft Excel中打开XLS文件,并可以保存为最新版本的电子表格文件格式,即XLSX。 Microsoft Excel Viewer提供了以仅阅读模式打开这些文件以进行阅读目的的功能。
什么是XLSM文件? XLSM文件是一个启用宏观的电子表格文件,可以存储指令以记录重复执行的步骤。宏从Excel工作簿中的Microsoft Visual Basic(VBA)中进行了编程。视觉基本编辑器用于在Excel中记录和运行宏。 XLSM文件类似于XLM文件格式,但基于Microsoft Office 2007中引入的开放XML格式。换句话说,XLSM是XLSX文件,但在宏的支持下。默认情况下,Excel本身为常用提供了几个宏。但是,您也可以通过所需的功能记录自己的宏。
什么是XLTX文件? XLTX文件是一个excel模板文件,可保留用户定义的设置。 Excel 2007及更高版本可以打开XLTX文件,用于创建新的XLSX文件,以保留模板的设置。 XLTX文件格式基于Office Open XML标准,可以通过将其扩展到ZIP来查看。 Excel还带有预定义的模板,可以使用电子表格数据打开和填充。
什么是XLTM文件? XLTM文件是使用Microsoft Excel创建的宏观启用模板文件。这些类似于XLTX,但具有宏的其他特征。此类模板文件用于生成和设置布局,格式和其他设置以及宏,以方便创建类似的XLSX文件。
标记语言文件格式 - 调查
标记语言是一种计算机语言,可以将文档的元素分开。与编程语言不同,它采用人类可读格式,几乎所有文本编辑器都可以打开。对于通过标签定义元素的性质,此类文件允许定义广泛的元素。这些标签与数据的图形表示无关,也不用于指定用户定义的设置,例如字体,尺寸等。 如今,有很多标记语言可供使用。其中一些在这里进行了讨论,以供一般意识。
html - 超文本标记语言 [HTML1] (Hyper Text Markup Language)是用于在浏览器中显示的网页的扩展名。 HTML被称为Web语言,随着新信息要求的要求,将作为网页的一部分显示。最新的变体称为HTML 5,它具有很大的灵活性来使用该语言。 HTML页面是从托管的服务器接收的,或者也可以从本地系统加载。每个HTML页面都由HTML元素组成,例如表单,文本,图像,动画,链接等。这些元素由标签(例如,和其他几个标签都启动和结束的标签)表示。它还可以嵌入用脚本语言编写的应用程序,例如JavaScript和样式表(CSS),以进行整体布局表示。
XML - 扩展标记语言 XML代表可扩展的标记语言,类似于html,但在使用标签定义对象方面有所不同。创建XML文件格式的整个想法是存储和运输数据,而无需依赖软件或硬件工具。它的受欢迎程度是由于它既是人类又是机器可读性。这使其能够以对象的形式创建常见的数据协议,并通过网络(例如WorldWide Web(www))共享并共享。 XML中的“ X”是可扩展的,这意味着可以根据用户要求将语言扩展到任意数量的符号。对于这些功能,许多标准文件格式都可以使用它,例如Microsoft Open XML,libreoffice opendocument,XHTML和SVG。
XHTML - 可扩展的超文本标记语言 XHTML是一种基于文本的文件格式,使用XML中的标记,使用HTML 4.0的重新制定。这些文件非常适合在Web浏览器中打开或查看。 XHTML设计为更结构化,脚本较少,通用;使用XML的所有现有设施和更多设备独立。 XHTML提供了一套值得的元素和属性集,并结合了样式表。属性从元数据属性集合中使用。 XHTML通过将所有HTML演示元素从属于样式表,从而提供灵活性和可访问性。样式表比这些表达元素更通用。 HTML 4.01,HTML5和XHTML的规格正在由万维网联盟(W3C)动态开发。
XAML - 基于XML的标记语言 XAML,可扩展应用标记语言,扩展文件描述了基于Windows Edractation Foundation(WPF)的软件应用程序的用户界面元素。尽管一种语言,但不需要对其进行编程,因为它基于XML的标准格式,该格式易于使用和理解。 XAML(发音为“ Zammel”)是由Microsoft开发的,其特定目的是创建用户界面。其首字母缩写词原始代表可扩展的Avalon标记语言,其中Avalon是WPF的代码名称。 XAML文件有时也可以使用XOML扩展名保存。 很少有其他标记语言包括MHTML,HTM和XOML使用上面讨论的基本标记语言以进行功能。相应的标记语言的使用取决于目的。如果要用于显示目的,则使用HTML,MHTML和HTM。但是,如果需要数据描述,则使用标记语言(例如XML和基于XML的语言)。