Documente Academic
Documente Profesional
Documente Cultură
Aunque las impresoras virtuales (y conversores PDF) han facilitado mucho las tareas de
creación de documentos PDF, a veces se requiere un mayor grado de control sobre el
archivo PDF, que facilite más posibilidades e incluso ofrezca la posibilidad de automatizar
tareas para realizar sobre múltiples archivos.
The PDF Toolkit (a partir de ahora, Pdftk) es una utilidad con licencia GPL disponible
para entornos Windows y Linux, que permite realizar tareas sobre archivos PDF desde una
línea de comandos con un alto grado de control y posibilidades, como demostraré con las
siguientes 10 operaciones útiles con archivos PDF:
En este ejemplo, creamos un archivo libro.pdf que estará formado por la portada
(portada.pdf) y los dos primeros capítulos (capitulo1.pdf y capitulo2.pdf).
Es posible extraer las páginas impares de un documento haciendo uso del atributo odd (o
even si buscamos las pares). Veamos con un ejemplo:
Este ejemplo extrae las páginas impares (odd) de las primeras 15 páginas (1-15) del archivo
documento.pdf, guardándolas en paginas-impares.pdf.
Con Pdftk es posible rotar ciertas páginas de un documento PDF (o el documento íntegro,
es decir, todas sus páginas). Para ello, sólo tenemos que añadir una letra que representará
los grados de rotación:
En este ejemplo se rota el documento íntegro (1-end) realizando una rotación de 90 grados
(E). Todo ello se guarda en documento-rotado.pdf.
4. Invertir el orden de paginas de un documento PDF
También es posible invertir o alterar el orden de páginas de un documento PDF. Para ello
sólo hay que especificar el orden a seguir tras la opción cat, en este caso, creamos un
documento con orden inverso.
Esta opción separa el documento PDF, creando cada página en un documento individual.
Puede ser útil para ser sometido a una ordenación manual posterior.
Es posible indicar una página (se utilizaría siempre la primera del documento
marcadeagua.pdf) que se utilice de marca de agua en el fondo de documento.pdf,
guardándose en el fichero de salida documento-con-marcadeagua.pdf.
Del mismo modo que se puede establecer una marca de agua al fondo del documento,
puede utilizarse de imagen solapada al frente del documento. Para ello usaremos la opción
stamp en lugar de la anterior background.
Además, también tiene la opción análoga de utilizar multistamp con el mismo fin del
apartado anterior.
Ademas existen varias opciones de la misma familia como dump_data_utf-8 para realizar
la misma tarea con información con codificación UTF-8, o update_info para cambiar
metadatos.
Por último, vamos a poner un ejemplo (un poco más avanzado) de la combinación de varias
de estas tareas para realizar algo más complejo.
Tenemos un documento que incorpora varias páginas o diapositivas en una misma página
del documento. Nuestra intención es separarlas y recomponer un documento PDF
tradicional como se ve en la imagen. Para ello también haremos uso de GhostScript.
Parte 1
Con este primer comando, indicamos a GhostScript el tamaño del documento (3750x9210),
dividiendo las páginas de la izquierda y guardándolas en el documento left-pages.pdf (que
serían las páginas impares).
La parte del desplazamiento (PageOffset) en este caso no está realizando ninguna acción,
eso lo veremos ahora...
Realizamos la tarea análoga con respecto a las páginas de la derecha (las páginas pares).
Aquí si utilizamos un valor de desplazamiento -430, que moverá la región a recortar.
Parte 2
Llegados a este punto, tenemos dos documentos PDF, uno con las páginas impares y otro
con las páginas pares. Sólo necesitaríamos unirlos en un mismo documento.
Para ello hemos utilizado la opción shuffle, que en lugar de concatenar como lo hace cat
(documento íntegro A seguido del documento íntegro B), va haciéndolo página por página
(página 1 de A, página 1 de B, página 2 de A, página 2 de B...).
Escrito por José Román (a.k.a. Manz), estudiante de Ingeniería Informática en la ULL y
residente en Santa Cruz de Tenerife.
Relacionados
Pasar a PDF
8 comentarios
Una forma de reemplazar la parte 2 del último punto con operaciones análogas, podría ser
la siguiente:
En la primera línea, separamos cada página del documento de páginas impares con el
formato 001_L.pdf, 002_L.pdf, 003_L.pdf, etc... En la segunda, lo mismo con las páginas
pares: 001_R.pdf, 002_R.pdf, 003_R.pdf, etc...
Algunos de estos procesos tambien son posibles con pdfcreator poniendo la impresora
virtual en pausa y luego cambiando de orden las paginas.
Hay que reconocer que la herramienta que comentas es muy potente aunque se encuentra a
faltar un entorno grafico.
Responder Permalink
Motor WebKit 4.0 / Android 2.2 Froyo
@kutastre: Realmente, la potencia de esta herramienta (y todas las que proporcionan una
línea de comandos) es la posibilidad de automatizar y realizar tareas para un alto número
de archivos (por ejemplo, una colección de 150 archivos PDF).
@kutastre: Ese es el punto importante, algunos de los procesos, desconozco si existen todas
las opciones con pdf creator pero me imagino que eso no es todo lo que puede hacer pdftk,
y para quienes quieren saber como se usa, me parecen muy bien estos 10 puntos, sencillos
pero dan pie a quien desee aprender más a que experimente con ellos, además que son los
puntos concretos que más se suelen necesitar cuando trabajas con pdf, gracias por este muy
buen post
zurdo · hace 7 meses
Esta increíble su blog me gustan mucho como ha ordenado en el lateral izquierdo los
botones de compartir.
Interesante :D