Herramienta OCR online [Google]

free ocr tool online¿Eres de los que siguen utilizando a día de hoy aplicaciones de escritorio para el reconocimiento de caracteres o eres de los que ha descubierto que el móvil, con Android, incluye una aplicación para procesar las fotos que realizas?

Cada cierto tiempo, los alumnos proponen algĂşn tema (fuera del “temario” oficial) que les interesa y dedicamos una sesiĂłn a su estudio. En esta ocasiĂłn (gracias Jose Antonio), uno de los alumnos de Bachillerato, preguntaba cĂłmo procesar unos documentos que tenĂ­a escaneados para poder editarlos.

Aunque en un primer momento sugerĂ­ el uso de tesseract, cuando me he parado a preparar la sesiĂłn he caĂ­do que es mĂĄs fĂĄcil (y Ăştil para ellos pues son pocos los que tienen Linux) recurrir a las herramientas en lĂ­nea y ÂĄhe aquĂ­ la opciĂłn que considero mĂĄs sencilla!

Por fortuna me acordĂŠ haber leĂ­do que habĂ­a sido implementado en Google Drive y es tan sencillo (una vez que lo tienes habilitado en la configuraciĂłn) como subir el pdf y/o imagen que queremos procesar a nuestro “disco” virtual.

Configurar OCR

Accede a la configuraciĂłn de tu Google Drive

Habilitar ocr google drive

Indica que te pregunte quĂŠ hacer cada vez que se suba un archivo (no creo que quieras procesar todas las imĂĄgenes que subas, Âżverdad?)

ÂĄY listo para procesar los documentos que tengas escaneados!

Reconocimiento de caracteres

Da igual que subas un pdf o una imagen con texto.

subir ficheros automĂĄticamente a google drive

En mi caso he optado por una captura de pantalla de un artĂ­culo previo del blog

Te preguntarĂĄ quĂŠ hacer con el contenido del fichero: indica que estĂĄs interesado en convertir el texto del archivo subido y el idioma del contenido (en mi caso espaĂąol)

reconocimiento caracteres google

ÂĄListo! Ya tenemos un documento “perfectamente” convertido y sin tener que teclearlo 😉

mejorar resultados ocr

ConclusiĂłn

SoluciĂłn muy sencilla que os va a permitir obtener el texto de cualquier pdf (sĂ­, esos que teĂłricamente no son editables) y/o documento escaneado sin tener que instalar software adicional en vuestro equipo.

Siendo bastante bueno el OCR que utiliza Google, los resultados no son del todo perfectos por lo que es mas que posible que encontrĂŠis algĂşn error (en el ejemplo que he usado yo, se ha “comido con patatas” las comillas dobles y algĂşn acento) por lo que nos vĂĄis a librar de tener que darle un “pequeĂąo” repaso al documento resultante.

Y tĂş…

  • ÂżQuĂŠ software utilizas para el reconocimiento de caracteres?
  • ÂżSabĂ­as que Google lo tenĂ­a implementado?
  • ÂżUtilizas algĂşn truco para mejorar los resultados?
  • ÂżEres de escanear o prefieres teclear?

16 comentarios en “Herramienta OCR online [Google]

  1. Pingback: Bitacoras.com
  2. Los OCR siempre me han fascinado. Tengo pendiente un proyecto, escanear la enoooorme biblioteca que tengo en papel y convertirlos en EPUB o PDF decentes para la lectura en e-reader. Pero siempre me he dado de bruces contra unos OCR terribles y ahora que me pintan algo bueno, resulta que no tengo escaner.

    Mi duda, a ver si me la podrías resolver, es si podrías comprobar que tal lee imágenes escaneadas de un libro. Como profesor, sabrás que los márgenes interiores siempre quedan menos definidos en un escaner debido a la encuadernación y ahí ha sido donde siempre me han fallado los demás programas OCR.

    Si lo haces, te debo una y me compro un escaner a la de YA!! 🙂

    • Sin problemas: mándame una “muestra” a través del soporte técnico y vemos qué tal queda 😉

      Además: siempre podemos hacer “magia” con ImageMagick y quitar los “churretes” de todas las imágenes de un directorio antes de escanear.

      En tu caso no recomendaría usar el OCR de Google (demasiado trabajo tener que ir subiendo los documentos a procesar) sino Tesseract por aquello de crear un script que quite el ruido de los márgenes y procese mediante OCR el resultado (sólo es una idea “peleona” a depurar)

  3. Pingback: OCR | Pearltrees

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s