Leía recientemente que Denis Shiryaev había utilizado las redes neuronales para aumentar la resolución de una de las primeras grabaciones de los hermanos Lumiere, «La llegada del tren» de 1895 a 4K y 60 fps y la verdad es que el resultado, como podéis observar en las siguientes capturas de pantalla, es francamente espectacular.
La grabación original (recordemos que es de finales del siglo XIX) es la que podéis observar en la siguiente captura de pantalla (pulsa sobre ella para ver el vídeo completo en Youtube)
mientras que la versión «remasterizada» con redes neuronales es la siguiente
Y sin ser un experto en la materia (estoy deseando conocer la opinión que le merece a Rafa Mar el invento 😅) creo que está francamente bien (incluso en la captura que os he subido se aprecia la pierna de un pasajero al fondo que estaba entre sombras y que, a todas «luces», se podría decir que prácticamente no existía en la película original)
Tras la impresión inicial, lo siguiente que pasó por mi cabeza es cuando me he tropezado con películas en DIVx de hace un tiempo con una calidad nefasta (pero que servían decentemente en los televisores de tubo que teníamos con los primeros reproductores de DIVx que salieron al mercado por un ojo de la cara) y que, a día de hoy, con televisores 1080p (y ni hablamos de 4K, 8K o lo que esté por venir en el corto y medio plazo) serían auténticas 💩
No sé (no he logrado encontrar información al respecto) el tiempo que habrá tardado en generarse dicha versión 4k de la película original pero sería espectacular si nuestro querido reproductor (no caja «tonta», tú no, que por muy «smart» que seas nunca podrás actualizarte a las novedades del mercado emergente en el que nos encontramos) VLC (o cualquier otro pero a mí me gusta éste) pudiese hacerlo en tiempo real gracias a un codec que mejorase la calidad del contenido de cualquier fichero de vídeo por muy malo que fuese.
Si fuese posible (en unos tiempos decentes) estaríamos ante un nuevo campo para mejorar los ratios de compresión de cualquier fichero de vídeo (hi Netflix!, fijo que ya puedes enviar tus contenidos a móviles sin malgastar innecesariamente los planes de datos de tus abonados) ya que no tendríamos que preocuparnos por la calidad (comprime «a saco» aunque baje drásticamente la calidad) al poder restaurarla posteriormente en el visionado 🤔
Conclusión
Pensamiento en voz alta que quería compartir con vosotros para conocer vuestra opinión respecto a la posibilidad de utilizar redes neuronales a la hora de redimensionar y restaurar películas de baja calidad y las posibilidades que abriría en la mejora de los ratios de compresión de los codecs de vídeo actuales
Y tú…
- ¿Conocías la noticia del «experimento» con la película de los hermanos Lumiere?
- ¿Ves factible su uso en tiempo real?
- ¿Crees que sería un medio de mejorar los ratios de compresión de los codecs actuales?
- …
De hecho, se está desarrollando un códec libre de audio que usando redes neuronales recurrentes y a modo vocoder sintetizavla voz para usar mucho menos ancho de banda. Lo está financiando Mozilla, así como también desarrolló un reductor de ruido de mejor calidad usando también la misma tenología de RNN para poder hacer conferencia con mayor calidad.
Me gustaMe gusta
Simplemente espectacular.
¿Conócenos el nombre de dicho codec (para expiar mi «ignorancia» documentandome al respecto)
Muchas gracias amigo tanto por la reseña como por abrir el hilo de los comentarios 😍👍🏻
Me gustaMe gusta
No conocía dicho experimento pero me parece algo muy interesante y que podría revolucionar la forma de comprimir los archivos de vídeo al permitir la compresión sin pérdida, con lo que la compresión con pérdida pasaría a ser cosa del pasado. Y si se extendiera a los archivos de sonido y los de imagen (como seguramente acabe pasando a largo plazo) la cosa sería mucho mejor.
Me gustaMe gusta
Oye, pues no sé me había pasado por la cabeza el tema del sonido 🤔😍
Respecto a los algoritmos con pérdida estoy encantado con las posibilidades que brinda esta tecnología.
Me alegra compartir opinión y agradezco la aportación sonora 👍🏻
Me gustaMe gusta
Es espectacular lo que se está haciendo hoy en día con lo que denominamos «inteligencia artificial». Y esto es sólo el principio. ¿podría un equipo de personas hacer esto mismo? por su puesto que sí, del mismo modo que un equipo de matemáticos pueden resolver cualquier ecuación, solo que algunas llevarían años resolverlas y los ordenadores pueden hacer el calculo en días, o horas. No sé que tardo este render de mejora, pero aunque fueran días, un acabado así hecho por una persona fotograma a fotograma llevaría mucho tiempo y trabajo. La inteligencia artificial de cada día está más presente en el campo del diseño, vídeo, 3D, efectos especiales… etc… y es una pasado por dos cosas, calidad del trabajo acabado y velocidad de realización. Quien sabe, quizás en unos años estamos viendo películas buenísimas hechas totalmente por ordenador, guión y producción incluido.
En cuanto a codecs de vídeo, supongo que debe estar al llegar algún reproductor que haga uso de estos recursos para mejorar la calidad de nuestros antiguos vídeos en pal o super8, etc.
Me gustaMe gusta
Gracias Rafa por aportar tú visión profesional del tema, me ayuda a valorar aún más, las calidad del trabajo realizado 👍
No termino de imaginarme (con sus implicaciones) viendo películas realizadas completamente por una IA 😅
Me gustaMe gusta