PDF OCR, come estrarre del testo da un documento pdf

Capita a tutti noi o quasi, di imbatterci in documenti PDF non editabili e quindi non modificabili secondo preferenza. Ciò ci crea un gran fastidio anche perchè magari i pdf che abbiamo sott’occhio ci servono per una ricerca, per prendere spunto da delle frasi che preventivamente sono state bloccate da chi ha eseguito la creazione del pdf stesso.

Questo è molto scomodo per chi rende sempre condivisibile il proprio sapere a tutti. La conseguenza è rendere modificabile il documento pdf per una successiva modifica e una più completa integrazione da chi al momento si occupa di quello stesso documento.


Senza però divagare un discorso verso l’etica, incentriamoci su PDF OCR, in grado di estrarre del testo da un documento pdf. Compatibile per sistemi Windows, effettuiamo il download del software che si dimostra freeware.

Una volta avviato, è necessario aprire il nostro pdf oggetto di test e verrano visualizzate due aree ben distinte. Una delle quali, quella a sinistra, presenta il documento pdf originale, mentre quella di destra, il documento pdf scansionato con l’algoritmo ocr.

Tuttavia, tramite il tasto Start OCR, è possibile scegliere se convertire tutte le pagine o una specifica. Secondo le prove effettuate è davvero un valido OCR editor. Ora la prova spetta a voi qualora foste interessati. Che ve ne pare?


PDF OCR | Download