Vai al contenuto

Convertire documenti cartacei e PDF in file di testo.

Può spesso capitare di aver bisogno di importare documenti cartacei per poterli modificare con un editor di testo. Per farlo ci occorre, oltre allo scanner, anche un programma OCR, in grado di analizzare l’immagine del documento importata con lo scanner, e convertirla in un file .doc.

Vi ho già proposto due applicazioni web in grado di svolgere questo compito (OCR Terminal e WeOCR), ora grazie a un commento di un utente (grazie Fra), voglio farvi conoscere un altro utile servizio web, molto accurato, ottimo per utenti che di rado hanno bisogno di digitalizzare documenti cartacei, gli utenti che invece hanno la necessità di compiere la stessa operazione, ma molto più frequentemente, per loro è disponibile un programma desktop, molto più pratico per svolgere diverse operazioni.

Il servizio web OCR gratuito, si chiama Synchronice, ed è possibile usarlo senza creare un account, solamente per un massimo di 10 operazioni al giorno.

09-03-2009 1.13 Synchronice accetta file TIF, JPG e PDF che potranno essere convertiti in documenti word o in file PDF, L’utilizzo è estremamente semplice, basta caricare il file, indicare la lingua del documento, scegliere il tipo di output, e inserire l’indirizzo mail dove verrà spedito il file una volta convertito.

09-03-2009 1.10 Come dicevo prima, il servizio è molto accurato, e gli errori sono veramente molto pochi, anzi come si può vedere dallo screenshot, la conversione non ha prodotto nessun errore, e il documento ha conservato la formattazione originale.

Passiamo ora all’applicazione desktop, utile per chi necessita spesso di questo tipo di conversione.

Il programma si chiama Image2OpenXML, si tratta di un progetto Open Source molto giovane. Come si intuisce, la conversione in questo caso, genera file .docx  che potranno essere modificati utilizzando Office 2007, o la suite di OpenOffice.org. I file di origine supportati possono essere JPG o TIFF.

Per poterlo installare, è necessario disporre di Visual Studio 2008, .NET Framework 3,5, OpenXML SDK 1,0 e Office 2007.

E’ inoltre necessario installare Microsoft Office Document Imaging 12.0 Type Library, uno strumento compreso in Office 2007, ma che non viene installato per impostazione predefinita. Per aggiungerlo alla suite, dovrete ripetere la procedura di setup di Office 2007, cliccare su Aggiungi o Rimuovi Strumenti, e assicurarvi di contrassegnare Microsoft Office Document Imaging 12.0 Type Library.

Image2OpenXML è ancora in versione Alpha, quindi può avere qualche difetto, quindi tra le due applicazioni, personalmente preferisco Synchronice, che offre veramente risultati ottimi, e non vi farà rimpiangere un software installato sul vostro PC, peccato che si possano convertire solo 10 documenti al giorno, tuttavia una scappatoia esiste, ed è quella di integrare più documenti in un unico file PDF che abbia come dimensione massima 3 MB, e farvelo restituire come file word una volta convertito.

10 commenti su “Convertire documenti cartacei e PDF in file di testo.”

  1. It’s the best time to make some plans for the future and it’s time to be
    happy. I’ve read this post and if I could I want
    to suggest you some interesting things or tips. Perhaps you can write next articles
    referring to this article. I wish to read more things about it!

Rispondi a www.geonatural.esAnnulla risposta

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.