中文

通常使用哪些可执行文件类型?

可执行文件类型是特殊格式或简单的文本脚本,可以由计算机操作系统直接运行。这些文件通常是根据编程语言的源代码创建的,通常是不可读的,不可编辑的,并且由编译器以二进制格式创建。本文提供了有关现在使用的常见可执行文件格式的知识。 [BAT文件格式][2] [CGI文件格式][3] [com文件格式][4] [EXE文件格式][5] [MSI文件格式][6] 蝙蝠文件格式 BAT文件格式由包含的脚本组成,以自动化命令的迭代序列。 “ 批次” 术语是批处理处理的简短,被认为是“非相互作用执行”。但是,批处理文件可能不会处理一批多个数据。通过键入文件名和扩展名.bat,在命令行接口下的DOS(磁盘操作系统)中运行批处理文件。阅读更多详细信息[此处][7]。 CGI文件格式 CGI脚本促进Web服务器上的用户配置如何处理URL。通常,通过将一个新目录(在主要目录位置)标记为包含CGI脚本的新目录来完成。它的通常名称是“ CGI-bin”。例如, /usr/local/apache/htdocs/cgi-bin 可以在Web服务器上选择为CGI目录。您可以通过单击[此处][8]来阅读更多详细信息。 com文件格式 COM文件格式是Microsoft Windows或DOS操作系统中使用的著名二进制可执行格式。它的结构由一组说明组成,没有标题,也没有标准元数据。它仅将其所有数据和代码保存在一个细分市场中,其二进制规模最大64KB。操作系统将COM文件加载在预设地址,因为它在尝试重新运行时不会重新安置。通过单击[此处][9]来了解有关COM文件格式的更多信息。 EXE文件格式 EXE是 可执行 的缩写。 EXE文件由可以在Microsoft Windows操作系统上运行的可执行程序组成。而可执行文件在UNIX操作系统上没有扩展名。一般概念是在X86 CPU(CS,DS,ES,SS)中设置各种段寄存器,以参考不同或相同的段,因此允许许多不同程度的对内存访问。您可以通过阅读[本文][10]来了解更多信息。 MSI文件格式 MSI文件,也称为“ Windows Installer”,由Microsoft Windows的API和软件组件组成,用于安装,删除和维护软件。安装信息和其他可选文件被包装为安装软件包。单击[此处][11]查看更多详细信息 结论 在本文中,您了解了可执行文件格式以及常用的可执行文件类型。您可以使用[文档][12]了解有关各种文件格式的更多信息。如果您有任何疑问,请通过我们的[论坛][13]告诉我们。 [2]: #BAT-file-format [3]: #CGI-file-format [4]: #COM-file-format [5]: #EXE-file-format [6]: #MSI-file-format [7]: https://docs.fileformat.com/executable/bat/ [8]: https://docs.fileformat.com/executable/cgi/ [9]: https://docs.fileformat.com/executable/com/ [10]: https://docs.fileformat.com/executable/exe/ [11]: https://docs.fileformat.com/executable/msi/ [12]: https://docs.aspose.com/pdf/java [13]: https://forum.fileformat.com/
七月 3, 2021 · 1 分钟 · Muhammad Umar

C#中的情感分类(分析)

现在提供各种在线情感分类服务。诸如Google,Amazon或Microsoft之类的巨头为自然语言处理提供了云解决方案。但是,如果您不打算为1000个API呼叫支付1-2美元(当评论具有超过1000个字符时的价格上涨)和/或准备准备您的本地分类服务或程序,则可以使用离线分类器。本文将在本文中讨论一些脱机情况的.NET分类器。 以下主题将在此处介绍: [什么是情感分析?](#什么 - 句子 - 分析) 离线情感分析c 数据集 结果 结论 代码 什么是情感分类(分析)? 情感分类是一种强大的方法,可以更好地了解客户对您的产品或服务的感觉。它还可以帮助您完成品牌监控任务。情感分类使您可以对他们在社交媒体,博客或文章中发布的人们的情绪和反馈进行分类。有几种常见的分类法用于情感分类。 二进制: * 消极的; * 积极的; 3类: 消极的; 中性的; 积极的; 5堂课 从1到5星 在所有情况下,负面情绪是分析最重要的。因此,情感分类器应该解决的主要任务看起来像“文字是负面的?”和“这有多少负面?”。 度量 准确性是一个简单明显的指标。当课程不平衡时,它具有众所周知的缺点。但是,它可以用于我们的平衡课程。它也被广泛用于科学文献中。 下面列出的分类器只能在二进制分类任务中进行比较,因为其中一个没有“中性”类。 离线情感分类(C#) 有多个C#库可以通过Google,Nuget E.T.C.找到。但是应该手动检查它们,因为其中许多实际上只是云API的SDK。在手动验证情感分类c#库后,收集了下一个软件包: groupDocs.Classification; vadersharp; Stanfordnlp; sentermentanalyzer; wikiled; 他们都是离线情感分类C#库。让我们更详细地描述它们。 groupdocs.classification 许可证:许可证文件 安装的复杂性:简单 **准确性:**93.3(评估) / 96.3(许可){.wp-block-neading} groupDocs.classification是一个具有自己内置引擎的库,用于文本和文档分类。模型也是A Nuget软件包的一部分。安装很简单:您只需要安装Nuget软件包即可。评估版本和许可版本之间存在差异。对于评估版本,您应该将文本分为100个字符的块,然后平均结果。 GroupDocS.分类显示在评估模式中的精度为93.3%,使用许可证时为96.3%。 vadersharp 许可证:麻省理工学院 安装的复杂性:简单 准确性:77.6%{.WP-Block-neading} Vadersharp是C#情感分类的流行解决方案(分析)。它可以很快工作,并在普通的家用PC上每秒处理消息,而不是服务器机器。安装也很简单(只需安装Nuget软件包)。但是,还有一个重要的缺点:准确性不如处理时间那么完美。它在测试数据集上达到了78%的精度。 StanfordNLP 许可证:GPL V2 安装的复杂性:硬。 精度:70%{.WP-Block-neading} Stanford NLP是基于自然语言处理的相应Java库的C#库。安装有一些困难。有必要安装Stanford NLP的Java版本,并在必要时将模型复制到程序的当前目录。 .NET Core 3.0兼容性也存在问题。该库的准确性和处理时间不稳定,似乎取决于文本长度。对于SST-2数据集的简短文本,它可以通过示例处理时间秒实现80.2%的精度。对于跨域一的较长文本,精度降至70%。每个文本的处理时间增加到1分钟或更多。 MentimentAnalyzer 许可证:麻省理工学院 安装的复杂性:媒介 精度:79.1%{.WP-Block-neading} 该库为ml.net基于。在安装过程中,可能存在与ML.NET的工作有关的问题。这是一个不安全的库,它需要明确的配置(x86 / x64),并且您可能还需要安装一些依赖项。 MentimentAnalyzer返回正类别或负类和相应的分数。这就是将二进制分类任务用于该比较的原因。最好的结果可以通过精确选择的阈值来实现。优化阈值后,精度达到了79%。
十月 21, 2020 · 1 分钟 · Ivanmo Chalov

三个用于文字处理文档的开源.NET API

为了自动化我们应用程序中文档的操纵,我们需要一些可靠的API。市场同时提供开源软件(OSS)和封闭源软件(CSS)来使用Word Processing文档。封闭的源API通常是昂贵的。基本功能和高级功能都有一堆免费的API,以下是其中一些: 打开XML SDK NPOI DOCX 以免费的API {.wp-block-neading}入门 让我们开始从API的安装和基本用法开始。 打开XML SDK 打开XML SDK需要.NET框架3.5或更高。您可以使用以下命令从Nuget安装库。 Install-Package DocumentFormat.OpenXml 完成安装后,您可以使用以下代码免费创建一个简单的DOCX文档。 // Open an existing word processing document using (WordprocessingDocument wordprocessingDocument = WordprocessingDocument.Open("fileformat.docx", true)) { Body body = wordprocessingDocument.MainDocumentPart.Document.Body; // Add paragraph Paragraph para = body.AppendChild(new Paragraph()); Run run = para.AppendChild(new Run()); run.AppendChild(new Text("File Format Developer Guide")); } 有关详细信息,请访问此链接。 npoi NPOI是POI Java项目的.NET版本。就像打开XML SDK一样,您可以在使用Nuget中安装。 Install-Package NPOI -Version 2.4.1 同样,使用NPOI创建文档也更简单。您可以使用几行代码创建DOCX文件。 using (FileStream sw = File.Create("fileformat.docx")) { XWPFDocument doc = new XWPFDocument(); doc.
一月 11, 2020 · 1 分钟 · Ali Ahmad

使用phpword创建Word文档

phpword是一种功能强大的开源API,用PHP编写,用于创建和读取文件形式,包括doc,docx,odt,[4][rtf][rtf][rtf] 5],HTML和PDF。使用API​​,您可以创建文档,设置文档属性,插入图像,插入图表以及更多。让我们开始使用phpword创建一个简单的docx文件。 先决条件 要使用phpword创建Word文档,您需要在操作系统中安装以下资源: PHP版本5.3.3+ 作曲家 [XML解析器扩展10] ( This extension is enabled by default ) Zend Escaper Componen T(您可以使用以下命令安装它) composer require zendframework/zend-escaper [Zend STDLIB Component12] (You can install it using the following command) composer require zendframework/zend-stdlib 如何安装phpword 之后,您准备就绪前提条件,可以使用简单的作曲家命令安装PHPWOWE: composer require phpoffice/phpword 使用PHP创建Word文档 创建Word文档很简单。您需要使用 phpword() 方法创建一个新文档,使用 addSection() 方法创建一个新部分,然后使用 addtext() 方法在其中添加文本。以下是创建简单Word文档的代码片段。 addSection(); // Add Text element to the Section $section->addText( 'File Format Developer Guide - ' .
十月 11, 2019 · 1 分钟 · Ali Ahmad

开始使用Apache POI - 文档Java API

通常,我们需要自动化流程并以编程方式操纵文档。我们需要批量创建文档,阅读,处理并保存结果文档。我们需要同时使用一堆不同的文件格式。幸运的是,对于Java开发人员而言,我们有一个开源API可以与Word,电子表格,Edracteration,email和图表55一起使用。 ]文件格式 - apache poi。该跨平台API旨在与基于Java虚拟机(JVM)语言一起使用。 如何安装 安装Apache POI毫不费力。您需要做的就是在基于Maven的项目中添加依赖关系。您可以在pom.xml中添加以下依赖关系,并开始使用Apache POI。 org.apache.poi poi 4.1.0 创建一个Word文档 使用Apache POI,您可以使用 xwpfdocument 创建Word文档,并使用 XWPFParagraph 类插入段落。以下代码段显示了如何使用API​​创建Word文档。 // initialize a blank document XWPFDocument document = new XWPFDocument(); // create a new file FileOutputStream out = new FileOutputStream(new File("createdocument.docx")); // create a new paragraph paragraph XWPFParagraph paragraph = document.createParagraph(); XWPFRun run = paragraph.createRun(); run.setText("File Format Developer Guide - " + "Learn about computer files that you come across in " + "your daily work at: www.
十月 2, 2019 · 1 分钟 · Ali Ahmad

XLS和XLSX之间的差异

XLS和XLSX扩展代表流行的Excel文件格式,由Microsoft在一段时间内作为其Office Suite的一部分引入。 XLS是最古老且使用广泛的文件类型,也已知是Excel97-2003文件格式。 XLSX文件格式是在Excel 2007的启动下引入XLS文件类型的替换。常见用户可能不知道两种文件格式之间的潜在差异,但是,XLS与XLSX文件格式不同,以几种方式详细介绍。 xls vs xlsx 那么XLS和XLSX之间实际上是什么不同的?以下是XLS和XLSX文件格式之间差异的列表。 文件格式差异 基础文件格式是XLS和XLSX文件之间的主要区别。 XLS文件基于二进制互换文件格式(BIFF),并根据XLS文件格式规格以二进制格式存储信息。如[MS-XLS]中所述,数据以二进制流的形式排列在XLS文件中。 相比之下,XLSX文件基于Office Open XML格式,该格式将数据存储在压缩XML文件中的ZIP格式。可以通过简单地解开.xlsx文件来检查基础结构和文件。示例XLSX文件将其重命名为.zip和提取时,可以在文件夹中观察到其内容作为其他任何文件夹。 支持宏 XLS文件是旧格式,为宏提供了支持,这些程序是由最终用户编写的程序,用于自动化任务,例如打开文件,数据比较等。一端的宏有助于用户自动化任务,但另一方面,由于您打开Excel文件时,它们直接运行。 相反,XLSX文件不支持宏。如果您需要嵌入和执行宏,则必须将文件保存为XLSM,这是Excel Open XML XML宏观启用的电子表格文件格式。 Excel支持性 由于向后兼容,可以使用所有版本的Excel打开XLS文件。但是,XLSX只能使用Excel 2007和横向版本打开。 还对XLS或XLSX文件格式的内部详细信息有进一步的疑问吗?您可以通过文件格式论坛与文件格式专家取得联系,以便为您的问题提供指导。
九月 10, 2019 · 1 分钟 · Kashif Iqbal

Excel文件格式:XLSX,XLSM,XLS,XLTX,XLTM

带有XLSX,XLSM,XLS,XLTX或XLTM扩展名的文件是使用特定标准文件格式的Microsoft Excel文件。您可以从文件夹选项上显示或显示文件扩展名。 MS Excel可让您使用 另存为 选项以任何这些文件格式保存文件。如本文所述,这些Excel文件格式用于处理电子表格文件的目的不同。 除了标准文件格式外,Excel还间接使用其他文件格式以及一组不同的操作。例如,当将Windows Metafile图片复制并粘贴到Excel工作表中时,它使用Windows Metafile格式(WMF)或Windows增强的Metafile格式(EMF)。 什么是XLSX文件? XLSX文件是Office 2007引入的Microsoft Excel的默认文件格式。它基于Office Open XML标准,可以由许多应用程序和API打开。可以通过将XLSX扩展名重命名为zip并使用任何归档软件打开,可以查看XLSX文件中的内容。 什么是XLS文件? XLS文件是一个电子表格文件,它是在Excel二进制互换文件格式(BIFF)中创建的,并且是Microsoft的专有。它可以使用Excel 2003和更早版本创建。可以在最新版本的Microsoft Excel中打开XLS文件,并可以保存为最新版本的电子表格文件格式,即XLSX。 Microsoft Excel Viewer提供了以仅阅读模式打开这些文件以进行阅读目的的功能。 什么是XLSM文件? XLSM文件是一个启用宏观的电子表格文件,可以存储指令以记录重复执行的步骤。宏从Excel工作簿中的Microsoft Visual Basic(VBA)中进行了编程。视觉基本编辑器用于在Excel中记录和运行宏。 XLSM文件类似于XLM文件格式,但基于Microsoft Office 2007中引入的开放XML格式。换句话说,XLSM是XLSX文件,但在宏的支持下。默认情况下,Excel本身为常用提供了几个宏。但是,您也可以通过所需的功能记录自己的宏。 什么是XLTX文件? XLTX文件是一个excel模板文件,可保留用户定义的设置。 Excel 2007及更高版本可以打开XLTX文件,用于创建新的XLSX文件,以保留模板的设置。 XLTX文件格式基于Office Open XML标准,可以通过将其扩展到ZIP来查看。 Excel还带有预定义的模板,可以使用电子表格数据打开和填充。 什么是XLTM文件? XLTM文件是使用Microsoft Excel创建的宏观启用模板文件。这些类似于XLTX,但具有宏的其他特征。此类模板文件用于生成和设置布局,格式和其他设置以及宏,以方便创建类似的XLSX文件。
六月 18, 2019 · 1 分钟 · Kashif Iqbal

标记语言文件格式 - 调查

标记语言是一种计算机语言,可以将文档的元素分开。与编程语言不同,它采用人类可读格式,几乎所有文本编辑器都可以打开。对于通过标签定义元素的性质,此类文件允许定义广泛的元素。这些标签与数据的图形表示无关,也不用于指定用户定义的设置,例如字体,尺寸等。 如今,有很多标记语言可供使用。其中一些在这里进行了讨论,以供一般意识。 html - 超文本标记语言 [HTML1] (Hyper Text Markup Language)是用于在浏览器中显示的网页的扩展名。 HTML被称为Web语言,随着新信息要求的要求,将作为网页的一部分显示。最新的变体称为HTML 5,它具有很大的灵活性来使用该语言。 HTML页面是从托管的服务器接收的,或者也可以从本地系统加载。每个HTML页面都由HTML元素组成,例如表单,文本,图像,动画,链接等。这些元素由标签(例如,和其他几个标签都启动和结束的标签)表示。它还可以嵌入用脚本语言编写的应用程序,例如JavaScript和样式表(CSS),以进行整体布局表示。 XML - 扩展标记语言 XML代表可扩展的标记语言,类似于html,但在使用标签定义对象方面有所不同。创建XML文件格式的整个想法是存储和运输数据,而无需依赖软件或硬件工具。它的受欢迎程度是由于它既是人类又是机器可读性。这使其能够以对象的形式创建常见的数据协议,并通过网络(例如WorldWide Web(www))共享并共享。 XML中的“ X”是可扩展的,这意味着可以根据用户要求将语言扩展到任意数量的符号。对于这些功能,许多标准文件格式都可以使用它,例如Microsoft Open XML,libreoffice opendocument,XHTML和SVG。 XHTML - 可扩展的超文本标记语言 XHTML是一种基于文本的文件格式,使用XML中的标记,使用HTML 4.0的重新制定。这些文件非常适合在Web浏览器中打开或查看。 XHTML设计为更结构化,脚本较少,通用;使用XML的所有现有设施和更多设备独立。 XHTML提供了一套值得的元素和属性集,并结合了样式表。属性从元数据属性集合中使用。 XHTML通过将所有HTML演示元素从属于样式表,从而提供灵活性和可访问性。样式表比这些表达元素更通用。 HTML 4.01,HTML5和XHTML的规格正在由万维网联盟(W3C)动态开发。 XAML - 基于XML的标记语言 XAML,可扩展应用标记语言,扩展文件描述了基于Windows Edractation Foundation(WPF)的软件应用程序的用户界面元素。尽管一种语言,但不需要对其进行编程,因为它基于XML的标准格式,该格式易于使用和理解。 XAML(发音为“ Zammel”)是由Microsoft开发的,其特定目的是创建用户界面。其首字母缩写词原始代表可扩展的Avalon标记语言,其中Avalon是WPF的代码名称。 XAML文件有时也可以使用XOML扩展名保存。 很少有其他标记语言包括MHTML,HTM和XOML使用上面讨论的基本标记语言以进行功能。相应的标记语言的使用取决于目的。如果要用于显示目的,则使用HTML,MHTML和HTM。但是,如果需要数据描述,则使用标记语言(例如XML和基于XML的语言)。
五月 17, 2019 · 1 分钟 · Kashif Iqbal

epub vs pdf:电子发布文件格式

随着智能设备的使用的增加,数字文档正在替换相同的印刷副本。易于阅读智能手机或平板电脑上的内容的便利性,使您可以自由地携带各处的内容。可以使用几种数字文件读取格式,电子书发挥了重要作用。 PDF和EPUB是两种最受欢迎​​的电子书文件格式,用于读取数字内容。 在本文中,我们将尝试简要概述这两种类型,然后从几个不同的角度介绍一些比较。 pdf PDF(便携式文档格式)是数字文档表示形式的著名且广泛使用的标准。 Adobe在1993年推出了PDF,随后进行了一系列标准化,导致了PDF标准家族,包括PDF/A,PDF/E4,PDF/UA ,PDF/VT和PDF/X。实际上,PDF是具有固定布局的纸质文档的数字表示。拥有PDF就像通过屏幕持有文档的印刷副本。 epub 电子出版物或EPUB是文档的数字表示,以查看移动设备上的阅读。与PDF相比,EPUB文件在回流方面是灵活的,被认为是创建电子书的主要选择。该格式根据设备屏幕调整文档布局,使其更方便阅读。 epub vs pdf 公共性 EPUB与PDF的选择取决于许多因素。由于两种格式都用于文档的数字表示,因此在选择一个格式之前的差异以及这两种格式之间的共同点至关重要。这些之间的常见事物如下: 多平台支持: 这两种格式均可在多个平台上读取,并且可以使用各种读者打开。 安全: PDF通过在文件上应用密码,以便没有密码就可以打开它的内容。 EPUB通过数字版权管理(DRM)提供内容安全性,以保护工作免受生殖。 差异 随着共同点的差异,差异优先于一种格式。以下是这两种类型之间的区别。 丰富的媒体: 尽管使用广泛,但PDF不支持丰富的交互式媒体,例如视频和音频。相比之下,EPUB支持嵌入视频和音频链接,使内容富含这些媒体类型。 编辑性: 可以使用公开可用的应用程序以及APIS编辑PDF。 EPUB文件通常仅读取,无法编辑。 阅读经验: 与PDF相比,EPUB是可以回转的,这使它们成为移动设备和平板电脑上可读性的明显选择。自动调整内容物以适合屏幕和图像周围,这使其可以选择智能设备上的阅读。相比之下,PDF文件是固定的布局文件格式,不断需要您缩放,捏和滚动以获得可读性。但是,如果文本与图像之间的关系至关重要(就像在儿童故事书中一样),那么PDF就会主导。 开发人员的观点: 从应用程序开发人员的角度来看,EPUB比PDF更灵活。基于标准的XML和XHTML语言,EPUB易于与大多数类型的软件一起使用。相比之下,PDF基于严格的符合规则,开发人员发现很难编写用于编写PDF文件的应用程序。 epub或pdf:要使用哪种格式? EPUB或PDF的选择实际上取决于用户需求。如果目的是写和出版书籍,那么Epub是显而易见的选择。但是,如果您的业务需要需要打印的内容,则应优选PDF。
四月 8, 2019 · 1 分钟 · Kashif Iqbal

DOC到DOCX - 值得考虑的更改!

使用最新的Microsoft Word版本,用于保存文档的默认文件格式是DOCX。随着时间的流逝,即将到来的几代人在技术领域工作,甚至不知道如何替换doc文件格式,这是Word 2003及以前的默认格式。通过从DOC到DOCX,Microsoft履行了其对开放文件格式标准的承诺,该标准长期以来由提供Word文档支持的公司要求。 #doc vs docx {.wp-block-neading} 那些不知道技术细节的人,他们可能会问是否真的值得考虑从DOC转换为DOCX?答案就是是的!自开始以来,微软就一直支持DOC扩展文件,并且会不时添加新功能。但是,DOC文件格式的限制对新功能介绍的速度有很大影响。 将旧的办公文件格式(例如DOC和XLS)存储为二进制数据,这就是为什么存储和加载此类文件的速度很快的原因。但是,二进制文件格式有自己的局限性,因为随着时间的流逝,很难管理这些格式。下面对DOC与DOCX的简短比较表明,需要从旧文件格式切换到新的文件格式。 DOC文件格式将数据存储为二进制格式的数据,该格式更快,但会导致大量文件大小。另一方面,DOCX基于Office Open XML标准,并提供了基于XML并封装在ZIP存档中的结构化文件格式,从而产生了较小的文件大小。 DOC文件格式的二进制文件结构必须保留每个发布的新版本的接口,以避免崩溃。基于XML文件格式的DOCX文件格式通过具有结构化和有组织的文件格式来避免这种情况,该文件格式了解较旧的格式并支持向后兼容性,而后向兼容性,否则与DOC文件格式相比是困难和乏味的。 本质上是二进制的,如果嵌入式对象(例如XLS图表)的嵌入式对象与支持的对象不同,则管理对象链接和嵌入将遭受向后的不相容性,从而导致转换问题。另一方面,DOCX由于其XML结构和由于版本差异而引起的转换问题而可以轻松处理,因此可以支持向后和向前的兼容性。 旧格式(例如DOC和XLS)由于其文件结构的二进制性质而容易受到恶意软件的攻击,从而成为传播病毒的来源。 DOCX并非如此,因为恶意二进制代码无法注入文档中。 如何在旧的Microsoft Word版本上打开Docx Microsoft Word 2003或之前无法打开DOCX文件。但是,Microsoft提供了一个兼容性包,可以安装并用于在Microsoft Word的较旧版本上打开DOCX文件格式。此外,还有免费在线转换器可以帮助将文件从DOCX转换为DOC文件格式。
三月 23, 2019 · 1 分钟 · Kashif Iqbal