Convertir un archivo PDF en archivo de texto desde una terminal

sábado, septiembre 12, 2015 Publicado por: Oscar Meza


Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama "pdftotext" y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

~ $ sudo apt-get install poppler-utils

El paquete "poppler-utils" contiene entre otras herramientas a "pdftotext", ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

~ $ pdftotext archivopdf.pdf archivotxt.txt

El comando "pdftotext" tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro "-layout" como se muestra en el ejemplo siguiente.

~ $ pdftotext -layout archivopdf.pdf archivotxt.txt

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro "-opw" como se muestra en el ejemplo siguiente.

~ $ pdftotext -opw "password" archivopdf.pdf archivotxt.txt

Para mas información lee su manual de uso con el comando "man pdftotext".

1 comentario:

  1. necesito una mano urgente, tengo un profesor que dejo como tarea convertir un archivo texto en pdf por linea de comando en linux, quisiera una ayuda

    ResponderEliminar