Recuperando lo que creías perdido para siempre…

recuperar versión anterior página web

… o lo que está muerto no puede morir (que dijo aquel 😜)

Una vez resuelto el problema con las imágenes del blog alojadas en Dropbox que podía haber provocado que el blog dejase de tener sentido (9 años de “ilustraciones” tiradas a la basura deprimer al más “pintado”) he retomado otra tarea que tengo pendiente desde hace años y que no es otra cosa que recuperar aquellas imágenes que los “simpáticos” de ImageShack me hicieron perder (primera etapa del blog).

Por delante me quedan otras tareas importantes (como corregir el problema de encoding que yo mismo he introducido al automatizar la solución a las imágenes de Dropbox y recuperar las imágenes que alojé en Dropbox para ilustar algunos comentarios y/o respuestas que os he ido dando)

Os cuento cómo pienso enfocarlo e igual, de paso, alguno descubre alguna herramienta cuya existencia desconocía y que le puede servir para otras cosas distintas a las que inicialmente planteo

¿Has encontrado la solución a algún problema y el enlace ha dejado de funcionar? ¡Te cuento cómo resolverlo!

Arqueología digital

El que más y el que menos ha oído hablar en alguna ocasión de The Internet Archive y, más concretamente de The WayBack Machine iniciativa que, desde hace más de 20 años viene registrando (y guardando copia) de la inmensa mayoría de contenido que se publica en la Web (¿imaginas el tamaño del contenido almacenado en todo este tiempo?)

Dicha herramienta te permitirá recuperar cualquier página web que haya desaparecido de Internet pero no sólo el texto de las páginas html sino cualquier contenido que estas pudiesen contener y/o enlazar (imágenes, pdfs, …).

Incluso existen extensiones (como la WayBack Machine para Google Chrome) que facilitan acceder a estos recursos desde el navegador y sin tener que visitar la web oficial de Archive.org (si pinchas un enlace y el servidor devuelve un error 404, la extensión automáticamente te mostrará la versión almacenada en los servidores de The WayBack Machine por lo que virtualmente, los recursos estarán disponibles de forma “indefinida”)

Uso particular

En mi caso me viene perfecto porque tengo la forma de recuperar cualquier imagen que se haya perdido para siempre.

Sea el siguiente artículo del 2008

cómo recuperar ficheros perdidos en internet

donde se observa que falta la imagen de 200x200px que solía ilustrar en aquella época todos los artículos.

Consultando en WayBack Machine observamos que se encuentra el artículo disponible con la imagen que lo acompañaba originalmente

recuperando contenidos protegidos de internet

Ya sólo queda descargar dicha imagen e incluirla en el artículo nuevamente.

Andaaa yaaa…

Con lo “cansado” que es ir, uno por uno

  1. recorriendo todos los artículos
  2. consultando la página en WayBack Machine
  3. descargando las imágenes que contenga el artículo
  4. subiéndolas a Dropbox
  5. obteniendo el enlace compartido
  6. sustituyendo el enlace a la imagen en WordPress por el que hemos obtenido

Sospecho que voy a terminar implementado un script en Python que reduzca todos los pasos anteriores a lanzarlo y esperar el resultado ¿no os parece? 😅

Conclusión

Herramienta muy útil para recuperar contenidos perdidos a lo largo del tiempo en la web o que han dejado de estar disponibles (como el enlace a alguna solución que ha dejado de estar disponible y que podría resolver tu problema fácil y rápidamente pero que el autor ha dejado de compartir)

Y tú…

  • ¿Conocías la posibilidad?
  • ¿Utilizas y/o conoces alguna extensión similar a la mencionada?
  • ¿Implementarías el script o te armarías de paciencia y reemplazarías manualmente las imágenes?
  • ¿Alguien estaría interesado en el script indicado?

2 comentarios en “Recuperando lo que creías perdido para siempre…

  1. Hola!
    Si que lo conocia. No se me ocurre ninguna más.
    Yo pensaría qué de urgente seria esta tarea. Después de obtener el resultado, pasaría a ver cuanto tardaría automatizandolo y haciéndolo a manubrio. También podrías hacerlo un par de veces y ver en que tardas mas e intentar automatizarlos. Ya tendrías 3 opciones: automático, semiautomatico, manual.
    Eso mezclado con el factor de antes de la prioridad junto con el tiempo disponible, te saldrá el resultado, jeje.
    Y por lo de interesado en el script… estaria bien echarle un ojo, pero solo mirar, ya que no lo necesito.
    Un saludo!

    • Más claro imposible pero sospecho que, en mi caso, tardaría más en evaluarlo que en impelementarlo 😅

      El motivo es que tengo ya casi todas las herramientas necesarias para hacerlo y sólo me quedaría escoger las que necesito y “parametrizar” al problema concreto. Como “sudoku” y/o “entrenamiento” no está del todo mal y, de paso, me ahorraría que estar mirando (uno a uno) los artículos a los que les falta las imágenes 😉

      Donde haya un script que se quiten los “torpes” humanos 😳

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s