Vai al contenuto

Google acquista reCAPTCHA per migliorare la tecnologia OCR di scansione dei testi.

 google_reCAPTCHAMagari non sapete cosa sono i CAPTCHA, ma è molto probabile che ne avete utilizzato uno. I CAPTCHA sono quei moduli che si trovano nei form delle pagine web, dove immagini che raffigurano lettere o numeri, devono essere decifrate e digitate in modo corretto nella casella di testo sottostante. Questo sistema assicura che il form è stato compilato da un essere umano, e non da un bot che non potrebbe decifrare il contenuto del CAPTCHA.

Una delle società più famose che si occupa di fornire gratuitamente questo servizio ai webmaster dei siti web, si chiama reCAPTCHA, che oggi è stata acquistata da Google.

In verità, Google non è interessata a fornire il servizio in se, piuttosto è attratta dalla tecnologia di riconoscimento ottico dei caratteri (OCR) messa a punto dalla società.

sample-ocr

La tecnologia OCR di reCAPTCHA, potrebbe essere utile a Google nella digitalizzazione di giornali e libri che risultano difficili da acquisire con lo scanner.

E’ molto probabile che saremo noi utenti ad effettuare la digitalizzazione, decifrando i caratteri di un immagine che troveremo nel CAPTCHA di un modulo web, che Google metterà insieme per digitalizzare l’intero testo di un libro o giornale che poi andrà a finire su Google Books o Google News Archive.

endownedstrattongroupscarvingMolto astuta questa mossa da parte di BigG, che in questo modo ha acquistato una tecnologia e un servizio che gli permetterà di sfruttare milioni di utenti per digitalizzare i testi che un computer non può comprendere.

I moduli di reCAPTCHA non sono gli unici del web, e se volete vederne alcuni di veramente assurdi e bizzarri, raggiungete il post “I 10 CAPTCHA più strani della rete”.

Rispondi

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.