In varie occasioni, qui su Geekissimo, abbiamo avuto modo di dare uno sguardo a risorse online che, sfruttando la tecnologia OCR, consentono di estrarre parti di testo da un’immagine o da un documento digitalizzato, un’operazione che, come di certo molti di voi lettori avranno avuto modo di constatare personalmente, si rileva utile in una gran varietà di circostanze, specie quando ci si ritrova ad operare in un ufficio.
Tuttavia, quest’oggi, piuttosto che prestare attenzione ad un ulteriore servizio web in grado di eseguire quanto appena accennato, diamo un’occhiata ad un efficiente e performante software freeware tutto dedicato agli OS Windows anch’esso adibito al riconoscimento ottico dei caratteri ma equipaggiato di alcune caratteristiche distintive.
Si tratta di FreeOCR.net, un programmino con supporto multilingua (italiano incluso) e dall’utilizzo estremamente semplice che, una volta entrato in azione, consentirà di convertire file PDF, TIF, BMP, JPG e PNG contenenti elementi testuali in file di testo effettivi, il tutto offrendo degli eccellenti risultati finali.
Ma cosa offre FreeOCR.net rispetto a tutte le altre risorse analoghe?
Bhe, innanzitutto vi è da sottolineare il fatto che quest’ottimo applicativo sfrutta Tesseract OCR, il motore di natura open source sviluppato direttamente da Google che, di per sé, costituirebbe giù un buon motivo per considerare questo programmino ancor più preciso ed affidabile rispetto alla massa.
In secondo luogo si deve poi tenere in considerazione la possibilità di scannerizzare i propri documenti andando dunque ben oltre l’estrazione di elementi testuali dai file allocati direttamente sul proprio PC.
Infine, FreeOCR.net integra il supporto multipagina permettendo duqnue di elaborare documenti piuttosto lunghi anche se non è proprio esattamente immediato (ma considerando che si tratta di una risorsa del tutto gratuita una pecca di questo tipo non è imputabile).
Allora, cosa ne dite, possono bastare queste info per convincervi ad utilizzare FreeOCR.net? Conoscete risorse migliori o preferite altri strumenti? A voi la parola!
#1spidy
l'ho già usato non è cosi affidabile sono dovuto andare a cercarmi uno a pagamento ma anche li non ho trovato un buon risultato
#2lordmax
Il problema è proprio nell’uso di tesseractOCR.
Per quanto la scansione sia ben fatta resta il problema che non viene riconosciuto il layout della pagina quindi se ho una pagina a colonne o con delle formattazioni particolari vengono perse,
#3nunzio
e mica tanto affidabile . l'ho provai circa 3 mesi fa e posso dire che fai prima a copiare il testo a mano e non a correggere i vari errori del programma 🙂