sacar imágenes de un pdf

Extraer imágenes de un pdf sin perder calidad

De un tiempo a esta parte vengo haciendo “experimentos” con la digitalización de documentos y el procesamiento de sus contenidos.

En una de mis pruebas se me hacía necesaria la posibilidad de sacar todas las imágenes de un pdf resultante de escanear unos documentos.

Para este tipo de tareas, suelo utilizar el comando convert pero, a pesar de probar con varios valores del parámetro density no conseguía evitar (especialmente) los textos de las imágenes se viesen borrosos (cuando no ocurría así en el pdf original)

Por fortuna, he encontrado la herramienta que evita perder calidad al extraer imágenes de un documento pdf… pasa, pasa: te cuento cómo hacerlo.

Sigue leyendo

Obtener el número de páginas de un PDF

nullReciéntemente he estado procesando un alto volumen de documentos PDF mediante un script bash y, como el volumen de información era alto, tan bien lo era la posibilidad de que algo no fuese del todo bien 😦

A grandes rasgos se utilizaba el comando pdfimages (con el parámetro -j) para extraer las imágenes almacenadas en este formato puesto que el contenido de los mismos consistía en el resultado de escanear ciertos documentos.

Sigue leyendo