Los que lleváis un tiempo leyendo este blog sabéis que soy un enamorado del formato pdf al máximo (podéis echar un vistazo a los trucos para fichero pdf que he ido publicando durante este tiempo).
Mi amor por este formato se basa no solo en la posibilidad de incluir scripts en ellos sino que, al poder visualizarse casi en cualquier sistema operativo prácticamente sin instalar el lector (gracias a los navegadores web), me resulta muy útil a la hora de enviárselo a otras personas sin tener que preocuparme si tendrá el programa necesario para visualizarlo.
Hoy quiero centrarme en cómo reducir su tamaño para minimizar el tiempo de descarga y evitar el consumo innecesario del plan de datos del creciente número de personas que usan el móvil para absolutamente todo.
Aunque es posible realizar la compresión de ficheros pdf desde la línea de comandos gracias a
- ImageMagick interesante cuando el fichero contiene imágenes que impiden, por mucho que quieras, disminuir el tamaño del fichero
- Ghostscript el más utilizado habitualmente pero con una cantidad mayor de parámetros a recordar 😉
Resulta de gran utilidad contar con una herramienta online como SmallPDF
Que no sólo permite reducir el tamaño de tus documentos en pdf sino que incluye una amplia colección de herramientas adicionales
- desproteger pdfs
- imprimir de varios formatos Office (Word, Excel, PowerPoint) a PDF
- split y merge de pdfs
- …
Conclusión
Herramienta muy útil para sacarte de algún que otro apuro a la hora de manipular documentos en formato pdf con una cuidada estética y funcionalidad.
Y tu…
- ¿Conoces alguna herramienta similar?
- ¿Recuerdas el truco para extraer páginas de un pdf sin usar programas?
- ¿Conoces alguna interfaz gráfica para evitar la línea de comandos a la hora de gestionar pdfs?
- …
No conocía lo de comprimir el pdf en terminal, gracias. Tengo un PDF montado de escanear un libro que me ocupa 160 MiB y lo voy a usar ahí.
saludos
Me gustaMe gusta
Ante un pdf de ese tipo poco vas a poder hacer (sin perder excesiva calidad). Las imágenes son lo que son y, por lo general, suelen estar ya bastante comprimidas.
Si no es molestia compi, dinos cómo te va y así aprendemos todos con tu experiencia 😉
Me gustaMe gusta
Muchas gracias por tu compartición de sabiduría linuxera. Aunque este «truquillo» ya lo usaba, siempre aprendo algo con tus enseñanzas.
Pero aprovecho este comentario para plantear una duda acerca de los documentos PDF que llevan audio o vídeo incrustado en formato flash. Olvídate de Evince, Zathura o Xpdf, creo que solo se pueden abrir con la aplicación de Adobe desde la versión 9.
He tenido este problema en unos archivos de la universidad (UNED) que finalmente no pude abrir, pues resulta que, en el curso pasado al menos, la última versión disponible de Reader para linux era la 8 punto nosequé. Lo intenté aunque me daba mucha grima instalar algo de Adobe, pero sin éxito. También probé todas las herramientas para PDF que encontré en los repositorios (Debian Wheezy), incluso reproducirlo en otro ordenador con Win2 (prestado) y sí, se ve, pero no se puede extraer (al menos con Adobe Reader).
Ahora ya no tengo acceso al archivo pues afortunadamente aprobé la asignatura sin él (sin ellos, que eran varios) pero, ¿existe algún modo de extraer el audio o vídeo para reproducirlo aparte?
Perdón por el tostón y por ser una pregunta sin motivación práctica inmediata. De momento no me hace falta, pero visto el interés por los formatos estándar de la UNED, y más en una carrera de letras, pronto estaremos en las mismas.
Un saludo y gracias de nuevo, por todo.
Javier.
Me gustaMe gusta
Extraer el contenido (con pdftk o similar no debería ser un problema)
Si me mandas cualquier ejemplo que pilles en Internet me «invito» a trastearlo 😉
Me gustaMe gusta
Pues al final, después de mucho buscar, he encontrado la media docenita de archivos de marras. Adjunto uno para ver si puedes hacer algo con él y así aprendo algo, que nunca está de más.
http://lolabits.es/chonps/tema.3.3.-la.teoria.x-barra,11642135.pdf
Muchas gracias por atenderme y un saludo.
Me gustaMe gusta
Ha costado más de la cuenta (llevo como 2,5h probando cosas) pero ha quedado resuelto gracias al script en Python swf_mastah el cual te recomiendo «estudiar».
Si os parece interesante y/o necesario, publico artículo con unas instrucciones básicas sobre cómo conseguirlo 😉
Por cierto, son muy cutres en la UNED, la mayoría de los flash recuperados sirven para mostrar una única página que solo contiene texto y ni una mísera animación y/o transición (mal, muy mal el material enviado)
Salu2
Me gustaMe gusta
Pues tienes razón con lo de que la UNED es muy cutre. Sobre todo en las carreras de letras (estoy estudiando Filología Hispánica), donde te encuentras cosas como que los profesores te envíen un .docx con una url escrita, flash por doquier… Supongo que en informática la cosa cambiará, pero en las humanidades el ordenador es una cosa que se maneja «asín»:
«Para ver los vídeos de los temas, tenéis que instalar Adobe 9 o superior». Fin de las instrucciones. Después se monta un lío en el foro de estudiantes a ver quién es capaz de abrir el engendro en su no-Windows 7 o superior.
En fin, te agradezco mucho el que te hayas roto la cabeza de esta manera. Estoy estudiando la página que nos has mostrado y creo que tu ofrecimiento (el de publicar una manera de extraer SWF del PDF) será bien recibido por muchos.
Por si no lo había dicho ya, enhorabuena por el blog. Hace tiempo que estás en mi Liferea y no me pierdo ni uno solo de tus artículos.
Me gustaMe gusta
Me alegra (y anima) que encuentres de utilidad este rinconcillo de la web.
Dejo anotada la posibilidad de publicar un artículo (que detalle/amplíe el artículo indicado) y si veo que hay demanda, por supuesto que me ofrezco a redactarlo 😉
Me gustaMe gusta
Ya que hablas de tamaños de pdf, quiero comentar algo que ocurrió hace unas semanas con archivos en este formato.
Se enviaron los archivos correspondientes a una tesis doctoral en Artes (multitud de imágenes) a los miembros del tribunal. Los archivos en cuestión habían sido elaborados con Lyx tanto en sistemas operativos windows como linux y en ambos casos se leían sin problemas a pesar de su gran tamaño (superior a los 900 megas).
Pues bien, resultó que los componentes del tribunal no podían abrirlos. En principio pensamos que los discos que se grabaron y les pasamos podían estar corruptos por algún motivo, pero comprobamos que no. La dificultad estribaba en el hecho de que ellos usaban ordenadores Mac. Más tarde comprobé que, efectivamente, Mac abría sin problemas pdfs de tamaño reducido, pero se negaba a hacerlo cuando eran grandes; no sé dónde está el límite.
Quizá el tema es conocido y soy yo el despistado, pero si alguien puede aportarme detalles al respecto, quedaré agradecido.
Enhorabuena por el blog.
Saludos.
Me gustaMe gusta
Pues la verdad es que no he leído ningún caso como el tuyo (siento que te haya tocado en algo tan importante). No soy usuario de Mac pero es factible que se deba a algún fallo en la implementación del lector de pdfs para dicho sistema.
¿Sabrías la versión utilizada?
Salu2 y gracias por compartir la experiencia (aunque no haya sido todo lo satisfactoria que hubieses deseado)
Me gustaMe gusta
No puedo decirte. Sí puedo afirmar que les pasó a varios del tribunal y que yo mismo lo comprobé en el mac de un amigo, posteriormente, de modo que casi se podría asegurar que no depende de la versión del sistema operativo.
En el caso de la prueba que hice con mi amigo, puedo añadir que el sistema «veía» los archivos, aunque el icono correspondiente aparecía trasparente, no de colores nítidos, y no sólo era incapaz de abrirlos con el lector ligero por defecto de mac, sino con adobe acrobat (completo, no sólo reader).
Finalmente, el error no tuvo consecuencias, afortunadamente. La Tesis obtuvo un resultado excelente. Gracias.
Saludos.
Me gustaMe gusta
¿Sería mucho pedir una copia del fichero para ver qué podría estar pasando?
Aunque ya no tiene importancia (porque fue aprobada la Tesis) y es «echarme» trabajo encima, siento curiosidad por saber qué estaba pasando (generar Conocimiento)
Gracias y enhorabuena Luis.
Me gustaMe gusta
Te agradezco muchísimo tu interés. Yo también querría saber qué pasa.
Pero la tesis no es mía (es muy amable tu enhorabuena, pero no es, obviamente, para mí: la transmitiré a quien corresponde) y no dispongo de permiso para enviártela (yo sólo intervine en la elaboración de la maquetación a través de códigos latex con Lyx y sin Lyx).
De todos modos, ya sabemos que el problema existe y podemos estar atentos, por si se repite.
Gracias.
Me gustaMe gusta
Ok… nos mantendremos a la «escucha» por si cae otro caso similar 😉
Me gustaMe gusta
Hola de nuevo:
Tal y como profeticé, un nuevo y cutre archivo pdf con flash incrustado cortesía del profesorado de la UNED. Es este:
Haz clic para acceder a TEOR*c3*8dAS_LITERARIAS_XX_Orientaciones_sobre_el_comentario,15288467.pdf
El caso es que he estado peleándome (esta vez en serio porque me hace falta) con el script en python swf_mastah descargado de github (https://github.com/9b/pdfxray_public/blob/master/builder/swf_mastah.py) y lo que he conseguido es lo siguiente. Al ejecutar:
python swf_mastah.py descargas/TEORÍAS_LITERARIAS_XX_Orientaciones_sobre_el_comentario.pdf
la salida es:
File «swf_mastah.py», line 10
pdfParser = PDFParser()
^
IndentationError: expected an indented block
He instalado python-django como se dice en el wiki de github, pero no hay manera de sacar nada. ¿Hay algo mal hecho? Seguro que sí, por eso te suplico un mágico tutorial curalotodo de los que abundan en este blog. Espero que más necesitados se sumen a la petición.
Como siempre, muchas gracias por tu trabajo. Así da gusto, la verdad.
Me gustaMe gusta
Pues parece tratarse de un error de indentación y/o codificación (windows vs linux)
Siento ser escueto estoy en el móvil
Me gustaMe gusta
No te preocupes, muchas gracias por la información, seguiré investigando por ese camino. Si hay cambios, te lo comentaré.
Saludos.
Me gustaMe gusta