Convertir un archivo PDF en archivo de texto desde una terminal

Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama "pdftotext" y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

~ $ sudo apt-get install poppler-utils

El paquete "poppler-utils" contiene entre otras herramientas a "pdftotext", ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

~ $ pdftotext archivopdf.pdf archivotxt.txt

El comando "pdftotext" tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro "-layout" como se muestra en el ejemplo siguiente.

~ $ pdftotext -layout archivopdf.pdf archivotxt.txt

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro "-opw" como se muestra en el ejemplo siguiente.

~ $ pdftotext -opw "password" archivopdf.pdf archivotxt.txt

Para mas información lee su manual de uso con el comando "man pdftotext".

Comentarios

  1. necesito una mano urgente, tengo un profesor que dejo como tarea convertir un archivo texto en pdf por linea de comando en linux, quisiera una ayuda

    ResponderEliminar

Publicar un comentario