In passato ho già recensito più volte servizi web in grado di trasformare un immagine o un documento PDF, per convertirlo in testo grazie ad un applicazione OCR che lavora completamente dal browser.
Alle altre applicazioni web ora si aggiunge Free OCR, un servizio completamente gratuito che effettua la conversione in pochi secondi, e con risultati davvero ottimi.
Free OCR supporta file nei formati PDF, JPG, GIF, TIFF o BMP con una dimensione massima di 2 MB, e la scansione è ottimizzata per sei lingue: italiano, inglese, tedesco, spagnolo, francese, e olandese.
I migliori risultati si ottengono con immagini scandite ad almeno 150 dpi, e il testo convertito sarà subito visibile.
Free OCR può essere una buona soluzione se dobbiamo effettuare al volo la conversione di immagini in testo, ma se vogliamo qualche opzione supplementare come ad esempio la conversione da immagine a PDF, o Word, allora vi consiglio Synchronice, eccellente applicazione web gratuita, che può sostituire in tutto e per tutto applicazioni desktop. (via)
Non male… sarebbe anche non troppo complicato farlo avendo a disposizione un sistema linux accessibile da php…
non saprei sinceramente, ma a questo punto ti installi il programma sul sistema. Per Linux c’è addirittura un applicazione sviluppata dal team di Google, che BigG usa appunto per scandire i documenti web, purtroppo non ricordo il nome, ma credo che basti una ricerca per trovarlo.
Comunque ne trovi parecchi per Linux anche su questa pagina: http://www.thefreecountry.com/utilities/ocr.shtml
qualcuno gia ne conoscevo… gocr ocropus ocrad ocre… avevo fatto un programmino che riconosceva i captcha usando un po di risultati incrociati… 😛