Convertire documenti cartacei e PDF in file di testo.

Il contenuto è stato pubblicato oltre 360 giorni fa. Informazioni, collegamenti e elementi presenti nell’articolo potrebbero non essere aggiornati/raggiungibili.

Può spesso capitare di aver bisogno di importare documenti cartacei per poterli modificare con un editor di testo. Per farlo ci occorre, oltre allo scanner, anche un programma OCR, in grado di analizzare l’immagine del documento importata con lo scanner, e convertirla in un file .doc.

Vi ho già proposto due applicazioni web in grado di svolgere questo compito (OCR Terminal e WeOCR), ora grazie a un commento di un utente (grazie Fra), voglio farvi conoscere un altro utile servizio web, molto accurato, ottimo per utenti che di rado hanno bisogno di digitalizzare documenti cartacei, gli utenti che invece hanno la necessità di compiere la stessa operazione, ma molto più frequentemente, per loro è disponibile un programma desktop, molto più pratico per svolgere diverse operazioni.

Il servizio web OCR gratuito, si chiama Synchronice, ed è possibile usarlo senza creare un account, solamente per un massimo di 10 operazioni al giorno.

09-03-2009 1.13 Synchronice accetta file TIF, JPG e PDF che potranno essere convertiti in documenti word o in file PDF, L’utilizzo è estremamente semplice, basta caricare il file, indicare la lingua del documento, scegliere il tipo di output, e inserire l’indirizzo mail dove verrà spedito il file una volta convertito.

09-03-2009 1.10 Come dicevo prima, il servizio è molto accurato, e gli errori sono veramente molto pochi, anzi come si può vedere dallo screenshot, la conversione non ha prodotto nessun errore, e il documento ha conservato la formattazione originale.

Passiamo ora all’applicazione desktop, utile per chi necessita spesso di questo tipo di conversione.

Il programma si chiama Image2OpenXML, si tratta di un progetto Open Source molto giovane. Come si intuisce, la conversione in questo caso, genera file .docx  che potranno essere modificati utilizzando Office 2007, o la suite di OpenOffice.org. I file di origine supportati possono essere JPG o TIFF.

Per poterlo installare, è necessario disporre di Visual Studio 2008, .NET Framework 3,5, OpenXML SDK 1,0 e Office 2007.

E’ inoltre necessario installare Microsoft Office Document Imaging 12.0 Type Library, uno strumento compreso in Office 2007, ma che non viene installato per impostazione predefinita. Per aggiungerlo alla suite, dovrete ripetere la procedura di setup di Office 2007, cliccare su Aggiungi o Rimuovi Strumenti, e assicurarvi di contrassegnare Microsoft Office Document Imaging 12.0 Type Library.

Image2OpenXML è ancora in versione Alpha, quindi può avere qualche difetto, quindi tra le due applicazioni, personalmente preferisco Synchronice, che offre veramente risultati ottimi, e non vi farà rimpiangere un software installato sul vostro PC, peccato che si possano convertire solo 10 documenti al giorno, tuttavia una scappatoia esiste, ed è quella di integrare più documenti in un unico file PDF che abbia come dimensione massima 3 MB, e farvelo restituire come file word una volta convertito.

10 Comments

  1. […] è un servizio web in gradi di effettuare conversioni di numerosi formati di file. Permette di convertire file multimediali da un formato all’altro, […]

  2. […] è un servizio web in gradi di effettuare conversioni di numerosi formati di file. Permette di convertire file multimediali da un formato all’altro, […]

  3. […] di analizzare l’intero disco rigido alla ricerca dei file LIT archiviati, che alla fine potranno essere convertiti in […]

  4. […] per convertire file PDF in altri formati, ne abbiamo visto di tutte le forme, dimensioni, colori e licenze immaginabile. […]

  5. […] e anche scegliere il layout della pagina. Inoltre è anche possibile definire le proprietà del documento PDF come; titolo, soggetto, autore e […]

  6. […] modo semplice e veloce. L’operazione è molto adatta anche quando abbiamo uno scanner e vogliamo digitalizzare documenti cartacei sotto forma di file […]

  7. […] tanti gli strumenti in grado di convertire i documenti PDF in file di testo. Tuttavia, se siete alla ricerca di una soluzione che può aiutarvi ad estrarre solo il testo dal […]

  8. […] Guarda anche: Convertire documenti cartacei importati con lo scanner e PDF, in file di testo. […]

  9. […] servizi web per convertire un documento di testo, una pagina web o un immagine e scaricarlo in formato PDF ne abbiamo visti a decine, ma se abbiamo bisogno di poter editare il file in questione prima di […]

  10. www.geonatural.es ha detto:

    It’s the best time to make some plans for the future and it’s time to be
    happy. I’ve read this post and if I could I want
    to suggest you some interesting things or tips. Perhaps you can write next articles
    referring to this article. I wish to read more things about it!

Rispondi