Actualidad Editorial

Observatorio de tendencias sobre la industria editorial

  • Inicio
  • Artículos
  • Categorías
  • Acerca de Arantxa Mellado
Usted está aquí: Inicio / Tecnología aplicada al mundo del libro / reCaptcha, un sistema que te involucra en la digitalización de libros

reCaptcha, un sistema que te involucra en la digitalización de libros

Un CAPTCHA es una de esas imágenes de palabras distorsionadas que muchas webs y blogs nos piden que descifremos para registrarnos o escribir un comentario. Su finalidad es distinguir si el usuario es humano o una máquina, para evitar los “bots”, los programas que generan spam de forma automática.

reCaptcha

Cada día se “resuelven” unos 60 millones de CAPTCHAs. Si sumamos los segundos que cada uno de nosotros empleamos en ello, resulta que entre todos consumimos unas 150.000 horas diarias descifrando CAPTCHAs.

reCAPTCHA es un proyecto de la School of Computer Science (Carnegie Mellon University) que canaliza todo ese esfuerzo humano para corregir los errores de digitalización de los textos escaneados con OCR.

OCR (Optical Character Recognition) es un programa que convierte en texto lasimágenes escaneadas de las páginas de un libro. Pero no es perfecto, y muchas veces confunde los caracteres, introduciendo errores. En estos casos, el programa lanza una alerta cuando no puede leer una palabra, y es aquí cuando empieza la labor de corrección de reCAPTCHA.

ejemplo de lectura de OCR

ejemplo error de lectura de OCR

reCAPTCHA ayuda a a mejorar la digitalización de libros enviando a la web estas palabras ilegibles en forma de CAPTCHAs, para que los humanos las descifren.

Sin embargo, si OCR no sabe cómo leer las palabras que luego se convierten en CAPTCHAs, ¿cómo sabe el sistema si el usuario ha dado la respuesta acertada? Las palabras son dadas al usuario en conjunción con otras que el sistema sí conoce. Si el usuario descifra correctamente ésta, el programa asume que también es correcta la otra. Para verificarlo, esta imagen se envía de nuevo a un número indeterminado de personas, y si sus respuestas coinciden el sistema validará la palabra sobre la que OCR dudaba.

reCaptcha images

reCAPTCHA colabora habitualmente con Internet Archive, que lleva a cabo una importante tarea de digitalización de libros. La ayuda de los usuarios es fundamental para poder llevar a cabo su objetivo, por lo que pide a todos aquellos que estén interesados en colaborar que instalen sus plugins de reCAPTCHA en sus webs o que utilicen su sistema Mailhide como método para reducir el spam.

Trackbacks

  1. meneame.net dice:
    24 de julio de 2008 a las 11:44

    reCaptcha, un sistema que te involucra en la digitalización de libros…

    Un CAPTCHA es una de esas imágenes de palabras distorsionadas que muchas webs y blogs nos piden que descifremos para registrarnos o escribir un comentario. reCAPTCHA ayuda a a mejorar la digitalización de libros enviando a la web estas palabras ilegi…

    Responder

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Arantxa Mellado

Leer más…

Últimas entradas

  • Larga vida al fondo editorial y otras impresiones sobre el «Informe sobre el mercado del libro en 2022», de GFK 6 de marzo de 2023
  • La hiperedición sostenible, o cómo recuperar el fondo editorial y favorecer la bibliodiversidad imprimiendo sólo lo demandado 20 de septiembre de 2022
  • Hablemos de la distribución 1×1 de libros impresos, el modelo híbrido que se va a imponer en los próximos años 17 de mayo de 2022
  • ¿Debe subir el precio de los libros impresos? 14 de enero de 2022

Artículos por materias

  • Cadena de suministro del libro (563)
  • Comunicación y Marketing editorial (384)
  • Edición en digital (168)
  • Industria editorial (315)
  • Lectura (304)
  • Metadatos para libros (34)
  • Modelos de negocio editorial (65)
  • Periodismo y periódicos (77)
  • Sin categoría (169)
  • Tecnología aplicada al mundo del libro (673)

Síguenos en

  • twitter
  • rss
  • linkedin

Etiquetas

Actualidad editorial • Amazon • Aplicaciones • autoedición • Autopublicación • Bibliotecas • digitalización • distribución digital • Editoriales • educación • ereaders • Escritores • Estadísticas y estudios del sector editorial • iPad • Kindle • lectura en pantalla • Librerías y libreros • libro digital • libro electrónico • libros digitales • Libros electrónicos • marketing editorial • precio del libro digital • Redes sociales • venta de libros digitales

Más noticias sobre edición en digital en Scoop.it

Copyright © 2023 · Actualidad Editorial en Genesis Framework · WordPress · Acceder

Esta web utiliza cookies para mejorar la experiencia de navegación. Asumimos que está de acuerdo pero puede rechazarlas.AceptoNo acepto Más información
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Siempre activado
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
GUARDAR Y ACEPTAR