Google Búsqueda de Libros acaba de anunciar la disponibilidad de todas sus obras para dispositivos móviles. A continuación, os traducimos la noticia publicada en su blog.
Una de las grandes cosas de un iPhone o un teléfono Android es poder jugar Pacman mientras haces la cola en la oficina de correos. Algunas veces, queremos algo más que sólo distraernos con juegos o con vídeos.
¿Qué pasaría si también pudieses acceder a grandes obras literarias como Emma y El libro de la Selva desde tu teléfono? ¿O a joyas más oscuras como el hilarante diario de viaje de Mark Twain, Roughing It? Hoy nos emociona anunciar el lanzamiento de una versión para móviles de Google Búsqueda de Libros, posibilitando la compra de 1.5 millones de obras de domino público en Estados Unidos (fuera Estados Unidos la cantidad de libros es de medio millón).
Estos libros ya estaban disponibles en Google Búsqueda de Libros, pero las nuevas ediciones para móvil están optimizadas para ser leídas en pantallas pequeñas. Para probarla y empezar a leer , abre el navegador de tu iPhone o teléfono Android y ve a: http://books.google.com/m.
Existe una interesante historia detrás del trabajo que implicó el preparar tantos libros para dispositivos móviles. Si usas Google Búsqueda de Libros, notarás que nuestras vistas previas están compuestas de imágenes de páginas hechas por medio de la digitalización de copias físicas de los libros. Estas imágenes funcionan bien cuando son vistas desde un ordenador, pero son poco manejables al ser vistas en la pequeña pantalla de un móvil.
Nuestra solución para hacer accesibles estos libros es extraer el texto de las imágenes de páginas y hacer que se mueva en el navegador de tu móvil al igual que cualquer página web. Este proceso de extracción es conocido como Optical Character Recognition ( OCR). El siguiente ejemplo demuestra la diferencia entre imágenes de página y el texto extraído:
=> «Because I made a blunder, my dear Watson— which is, I am afraid, a more common occurrence than anyone would think who only knew me through your memoirs. …La extracción del texto desde imágenes de páginas es una difícil tarea de ingeniería. Las manchas en los libros físicos, las fuentes elaboradas, fuentes antiguas, las páginas rotas, etc. pueden ocasionar errores en el texto extraído. El ejemplo abajo señalado muestra la imagen de una página del manuscrito original de Alice’s Adventures Under Ground (primera versión de Alicia en el País de las Maravillas). Este caso extremo, el texto extraído está plagado de errores:=> «lV~e.il!» .ÍAoHyU- AUte. U brstty/affc. su.it a. f o.tl as ~tk¿* , I s&O.IL .éfiiíjz tiotkun-) of-ttmlr1¿*y ¿i^n. sta¿rs ! Jfo» ura.ve …
Un OCR imperfecto es sólo el primer reto hacia la meta de ir de colecciones de imágenes de páginas a libros basados en la extracción de texto. Los algoritmos de nuestro ordenador también tienen que determinar automáticamente la estructura del libro (cuáles son los títulos y cuáles las notas al pie, dónde están colocadas las imágenes, si el texto está en verso, etc. ) Hacer esto nos permite procesar el libro de una forma en la que siga el formato del libro original.Los retos técnicos son de enormes proporciones, pero continuaremos realizando mejoras a nuestro OCR y a nuestra técnica para extraer la estructura de un libro. Con este lanzamiento, creemos que hemos dado un paso importante hacia el acceso universal de los libros.Para probar el servicio, dirige el navegador de tu móvil a: http://books.google.com/m y comienza a leer. ¡Oh!, y si te tropiezas con partes en las que el texto se vea, bueno, raro, puedes pulsar en el texto text para ver la imagen de página de esa sección.
¡Que tengas una feliz lectura móvil!
Deja una respuesta