Apache POI (Implementación de Ofuscación de Poor) es una popular biblioteca Java de código abierto desarrollada por Apache Software Foundation. POI representa la “mala implementación de la ofuscación” que hace referencia a los formatos de archivo binario patentados de Microsoft. El objetivo principal de Apache POI es proporcionar a los desarrolladores de Java un conjunto de API que les permite leer, escribir y manipular varios formatos de archivo de Microsoft Office, como Hojas de cálculo de Excel (.xls y .xlsx), Word, Word), Word documentos (.doc y .docx) y presentaciones de PowerPoint (.ppt y .pptx).

Breve historia de Apache Poi

A principios de la década de 2000, cuando surgió la necesidad de que los desarrolladores de Java trabajen con los archivos de Microsoft Office sin ingresar a los detalles subyacentes de los formatos de archivo, Apache Foundation comenzó a trabajar en ingeniería inversa de los formatos de archivo de Microsoft. Esto dio como resultado hallazgos de que los formatos estaban mal ofuscados y tenían ingeniería inversa. Es por eso que el nombre POI, es decir, Popa implementación de la ofuscación . Con los años, la biblioteca ha sufrido un desarrollo significativo, agregando soporte para nuevas características y formatos de archivos, mejorando el rendimiento y mejorando la usabilidad.

Formatos de archivo compatibles

Apache POI admite trabajar con Microsoft Excel, Microsoft Word y los formatos de archivo de Microsoft Powerpoint.

Microsoft Excel

Apache POI tiene las siguientes API para trabajar con las hojas de cálculo de Microsoft Excel. ** HSSF:_Formato de hojas de cálculo Horables-Admite trabajar con 97-2003 y antes de la hoja de cálculo de Excel XLS Formato de archivo ** XSSF:XML Formato de hoja de cálculo - Admite formato de archivo XML de Office de la hoja de cálculo de Excel xlsx formatos de archivo

Microsoft Word

Apache POI tiene las siguientes API para trabajar con los documentos de Microsoft Word. ** HWPF:_ Formato de procesador de palabras Horrible-Leer y escribir Microsoft Word 97-2003 DOC Formato de archivo ** XWPF:XML Formato de palabras - Formato de características similares en HWPF, pero para Office Open XML DOCX Formato de archivo

Microsoft PowerPoint

Apache POI tiene las siguientes API para trabajar con Microsoft Powerpoint Presentations. ** HSLF:_ Formato de diseño de diapositivas Horrible-Implementación de Java para Microsoft PowerPoint 97-2003 Formato de archivo PPT ** XSLF:_XML Formato de diseño de diapositiva

Microsoft Outlook

** HSMF:**Corrible estúpido formato de correo -java implementación para Microsoft Outlook Formato de archivo MSG

Microsoft Publisher

** HPBF:**CRIVIR FORMATO DE PORTADOR HOMBRIO - Implementación de Java para Microsoft Publisher formato de archivo de pub

Microsoft Visio

** hdgf:**horrible Diagram Format - Implementación de Java para Microsoft Visio Formato de archivo VSD

Instale Apache POI para Java

Al escribir este artículo, el último lanzamiento estable de Apache POI es 5.2.3 que está disponible para descargar desde el sitio web de Apache POI, GitHub y Maven. Echaremos un vistazo a cómo puede instalar la API de Maven y descargarla desde el sitio web de Apache POI para su uso en su proyecto Java.

¿Cómo instalar Apache POI de Maven?

Apache ha publicado los artefactos Apache Poi Maven para la instalación automática en proyectos Maven utilizando los archivos POM.xml. Podemos establecer la dependencia en el proyecto Maven para que obtenga automáticamente los archivos JAR utilizados para ejecutar la aplicación. Los siguientes son los pasos para incluir la dependencia en el pom.xml de su proyecto Maven. ** Paso 1:**Abra su proyecto Maven en su IDE Java. Puede usar la idea NetBeans, Eclipse o IntelliJ según su propia elección. ** Paso 2:**Agregue la siguiente dependencia al archivo POM.

<dependency>  
    <groupId>org.apache.poi</groupId>  
    <artifactId>poi</artifactId>  
    <version>3.9</version>  
</dependency>

** Paso 3:**Agregue la dependencia del componente POI para los formatos de archivo XML de Office Open de la siguiente manera.

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.2.3</version>
</dependency>

** Paso 4:**Agregue la dependencia de los comunes-io de la siguiente manera.

<dependency>
    <groupId>commons-io</groupId>
    <artifactId>commons-io</artifactId>
    <version>2.7</version>
</dependency>

** Paso 5:**Agregue la dependencia log4j de la siguiente manera.

<dependency>
    <groupId>org.apache.logging.log4j</groupId>
    <artifactId>log4j-core</artifactId>
    <version>2.20.0</version>
</dependency>

En esta etapa, su proyecto obtendrá las dependencias mencionadas anteriormente en el archivo pom.xml e incluirá los respectivos archivos JAR en su proyecto para trabajar con los formatos de archivo de Microsoft Office.

Instale Apache POI de GitHub

Apache POI ha proporcionado una instancia de espejo en GitHub para acceder y descargar el código fuente. Puede acceder a estos desde Apache Poi Github Repositorio.

Apache Poi Descargar

También puede instalar Apache POI descargando la última versión de Apache POI de la página oficial Descargar Apache. Una vez descargado, descomprima el contenido del paquete en una carpeta e incluya los archivos JAR en su proyecto para comenzar con la API de Apache POI.

Apache Poi Resources

¿Qué sigue?

En nuestros próximos artículos, escribiremos artículos con ejemplos sobre: