Last Updated: 24 Jul, 2025

Title - How Do I Convert a PDF to MS Word Documents via PHP APIs?

Trabajar con archivos PDF en aplicaciones web se ha convertido en un requisito común en todos los sectores. Ya sea que gestiones facturas, contratos o contenido académico, poder convertir documentos PDF a formatos editables como Microsoft Word (DOCX) es esencial. Afortunadamente, con la ayuda de las potentes API gratuitas de PHP, los desarrolladores pueden automatizar y agilizar este proceso fácilmente.

¿Por qué convertir PDF a Word en PHP?

Los archivos PDF son excelentes para la distribución porque conservan la maquetación y el diseño. Sin embargo, editarlos no siempre es sencillo. Los documentos de Word, por otro lado, son altamente editables, lo que los hace ideales para tareas que requieren interacción, actualizaciones o colaboración del usuario. Una solución basada en PHP permite a los desarrolladores:

  • Habilite la conversión por lotes de PDF a Word desde el servidor]3
  • Integre flujos de trabajo de edición de documentos en aplicaciones web
  • Automatice la generación de informes y el procesamiento de documentos
  • Permita que los usuarios finales descarguen versiones editables de sus archivos

Aquí encontrará algunas de las API y bibliotecas PHP más confiables y gratuitas que le ayudarán a realizar la conversión de PDF a Word con una configuración mínima.

PHPWord con un analizador de PDF

Para un mayor control sobre el proceso de conversión, puede combinar la potencia de PHPWord, una biblioteca para crear y manipular documentos de Word, con una biblioteca de análisis de PDF.

Explicación del ejemplo de código:

Este ejemplo primero utiliza la biblioteca PDFParser para leer el PDF y extraer el texto de cada página. Luego, utiliza PHPWord para crear un nuevo documento de Word y añadirle el texto extraído. Este método le ofrece un control preciso sobre el resultado, permitiéndole formatear el texto y añadir otros elementos según sea necesario.

require_once 'vendor/autoload.php';

// Crear un nuevo objeto analizador de PDF
$parser = new \Smalot\PdfParser\Parser();

// Analizar el archivo PDF
$pdf = $parser->parseFile('path/to/your/document.pdf');

// Obtener todas las páginas del PDF
$pages = $pdf->getPages();

// Crear un nuevo objeto PHPWord
$phpWord = new \PhpOffice\PhpWord\PhpWord();

// Añadir una sección al documento de Word
$section = $phpWord->addSection();

// Recorrer cada página del PDF
foreach ($pages as $page) {
// Extraer el texto de la página
$text = $page->getText();
// Añadir el texto al documento de Word
$section->addText($text);
}

// Guardar el documento de Word
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'Word2007');
$objWriter->save('output.docx');

echo "¡Contenido del PDF extraído y guardado en Word correctamente!";

Spatie PDF-to-Text + PHPWord (Conversión basada en texto)

Si sus archivos PDF contienen principalmente texto sin formato (sin tablas ni imágenes complejas), puede combinar las bibliotecas de código abierto Spatie PDF-to-Text y PHPWord para una conversión sencilla.

¿Cómo funciona?

Este es el método más sencillo si tiene acceso a Adobe Acrobat Pro.

Pasos:

  1. Primero, debe usar la API Spatie\PdfToText, que extrae texto sin formato de archivos PDF.
  2. La biblioteca PHPWord se utiliza para generar un documento de Word con el contenido extraído.
  3. Ideal para PDF de solo texto sin formato complejo.

Aquí hay un ejemplo de código que muestra cómo extraer texto de un archivo PDF y luego generar un documento de Word con el contenido extraído usando la biblioteca PHPWord.

PdfReader reader = new PdfReader("form.pdf");
FileOutputStream out = new FileOutputStream("data.fdf");
FdfWriter writer = new FdfWriter();
writer.setField("name", "John Doe");
writer.writeTo(out);
reader.close();
out.close();

Gotenberg vía PHP (Microservicio Docker de Código Abierto)

Gotenberg es un microservicio de conversión de documentos de código abierto que se integra con PHP mediante solicitudes HTTP. Es ideal para desarrolladores que prefieren herramientas basadas en Docker.

¿Cómo funciona?

  • Gotenberg utiliza LibreOffice en el backend para convertir archivos PDF.
  • Se envía una solicitud POST con el archivo PDF.
  • El servidor devuelve el documento DOCX.
Code Snippet (PHP + Gotenberg)

Aspose.PDF Cloud for PHP (Free Tier)
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, 'http://localhost:3000/forms/libreoffice/convert');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);

$data = [
    [
        'name'     => 'files',
        'contents' => fopen('input.pdf', 'r'),
        'filename' => 'input.pdf'
    ]
];

curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$response = curl_exec($ch);
file_put_contents('output.docx', $response);
curl_close($ch);

echo "Conversion done via Gotenberg!";

Aspose.PDF Cloud para PHP (Gratis)

Aspose.PDF Cloud PHP SDK ofrece un potente SDK para PHP que permite a los desarrolladores de software convertir archivos PDF a formato Word directamente mediante su API en la nube. Puedes empezar gratis con llamadas API limitadas. Aquí tienes un ejemplo sencillo que muestra cómo los desarrolladores de software pueden cargar y convertir un archivo PDF a documentos DOCX de Microsoft Word mediante comandos PHP.

Ejemplo de código:

use Aspose\Pdf\Cloud\PdfApi;
$pdfApi = new PdfApi('YOUR_APP_KEY', 'YOUR_APP_SID');
$pdfApi->putConvertDocument('sample.pdf', ['format' => 'docx']);

Reflexiones finales

Convertir archivos PDF a documentos de Word con PHP no tiene por qué ser complejo ni costoso. Con las herramientas y bibliotecas gratuitas adecuadas, los desarrolladores pueden ofrecer exportaciones de documentos editables y fluidas a los usuarios, impulsar la automatización de documentos y mejorar la productividad general. Tanto si prefiere wrappers PHP ligeros como API robustas basadas en la nube, hay una solución que se adapta a sus necesidades.

Preguntas frecuentes

P: ¿Puedo convertir PDF a Word en PHP sin usar API de pago?

R: Sí, puedes usar bibliotecas de código abierto como Spatie, PHPWord y LibreOffice CLI de forma gratuita.

P: ¿La conversión de PDF a Word de código abierto admite imágenes y formato?

R: Las herramientas básicas no lo hacen, pero usar LibreOffice o Gotenberg conserva el diseño y las imágenes.

P: ¿Es posible automatizar la conversión de PDF a DOCX en aplicaciones web PHP?

R: Por supuesto. Estas bibliotecas se pueden integrar en cualquier flujo de trabajo basado en PHP.

Ver también