Sign up with your email address to be the first to know about new products, VIP offers, blog features & more.

pdfchain y pdftk. Manipulación de ficheros PDF

Pdftk (PDF Toolkit) nos permite manipular ficheros PDF a través de la linea de comandos.

Existe una versión para interfaz gráfica llamada Pdf Chain. Esta da un acceso rápido a todas las funciones de pdftk (mas fácil si no se quiere tocar la linea de comandos). Las dos modalidades están disponibles en Linux, MS Windows, MacOS X y FreeBSD.

pdfchain

pdfchain

Con este flexible programa podemos unir, mezclar o dividir contenidos, editar permisos, cifrar, convertir, rotar, insertar una marca de agua, agregar o eliminar datos adjuntos, actualizar y exportar meta datos, exportar marcadores a un fichero de texto, reparar, extraer fotos, etc. de un fichero PDF.
En resumen, es un kit de herramientas de poco mas de 4MB para la manipulación de ficheros PDF.
Se puede instalar en todas las distribuciones linux (en su web dan instrucciones). Para Debian bastaría con:

[code]$ sudo apt-get install pdftk[/code]

Aunque he intentado incluir la mayor parte de las funciones de pdftk, se pueden conseguir más ejemplos de uso en un apartado de su pagina web.

O también leer las opciones del manual de referencia con los comandos:

[code]$ man pdftk[/code] [code]$ pdftk -h[/code]

– El comando pdfimages guarda las imágenes de un PDF (se guardan en formato jpg en el directorio de trabajo actual):

[code]$ pdfimages -j fichero.pdf exampleimage[/code]

– El comando pdftohtml convierte  un PDF en formato html (genera su salida en el directorio de trabajo actual).
[code]$ pdftohtml -c fichero.pdf fichero.html[/code]

Unir dos o mas ficheros PDF:
[code]$ pdftk fichero1.pdf fichero2.pdf fichero3.pdf cat output fichero_final.pdf[/code]

– Extraer por separado todas las páginas de un fichero PDF:
[code]$ pdftk fichero1.pdf burst[/code]

– Eliminar las páginas de la 5 a la 10 de un fichero PDF:
[code]$ pdftk fichero.pdf cat 1-4 21-end output ficheros_eliminados.pdf[/code]

– Extraer páginas de un fichero PDF (por ejemplo, extraer páginas 3, 4 y 5 en un nuevo PDF):
[code]$ pdftk fichero.pdf cat 3-5 output fichero_final.pdf[/code]

– Obtener un informe de los metadatos, marcadores y etiquetas de página de un fichero PDF, (resulta útil cuando se necesita organizar un índice de un conjunto de un PDF):
[code]$ pdftk fichero.pdf dump_data output informe.txt[/code]

– Reparar ficheros PDF corruptos:
[code]$ pdftk fichero_corrupto.pdf output fichero_resultante.pdf[/code]

– Adjuntar archivos a páginas de un fichero PDF:
[code]$ pdftk fichero.pdf attach_files adjunto1 adjunto2 output fichero_final.pdf[/code]

– Extraer los adjuntos de un fichero PDF:
[code]$ pdftk fichero.pdf unpack_files output directorio/de/salida[/code]

– Añadir una marca de agua a un fichero PDF:
[code]$ pdftk fichero.pdf background watermark.pdf output fichero_final.pdf[/code]

– Cifrar un PDF a 128-Bit y controlar los permisos (con la opción owner_pw <owner password | PROMPT>):
[code]$ pdftk fichero.pdf output fichero.128.pdf owner_pw foopass[/code]

– Descifrar un PDF:
[code]$ pdftk fichero_cifrado.pdf input_pw foopass output fichero_descifrado.pdf[/code]

– Aplicar una contraseña para leer el PDF (con la opción user_pw <user password | PROMPT>):
[code]$ pdftk fichero_normal.pdf output fichero_con_contraseña.pdf user_pw PROMPT[/code]

 

 

Leer entrada anterior
Brillo

Cerrar