Come preservare i libri con un software antispam
Un tool utilizzato per combattere lo spam aiuterà presto i ricercatori universitari a preservare dall’usura antichi testi e manoscritti. Molti siti web, come tutti noi sappiamo, utilizzano dei test automatici che chiedono all’utente, data una parola scritta in modo distorto o sfocato, di riscriverla in un campo di testo. Un “test” che serve principalmente per dare sicurezza al sito Web che colui che si sta iscrivendo a un determinato servizio o che sta facendo il login sia effettivamente una persona “umana” e non un sistema automatizzato.
Ebbene, non tutti lo sanno ma questo test, chiamato Captcha (Completely Automated Turing Test To Tell Computers and Humans Apart), è stato creato in origine dai ricercatori della Carnegie Mellon University per aiutare i computer a decifrare parole che i sistemi elettronici non possono leggere e permettendo ai diversi siti di utilizzarlo per combattere lo spam. Vediamo un po’ meglio in che modo.
Il lavoro dei ricercatori è quello di digitalizzare libri antichi e manoscritti (in modo da renderli “eterni”). Gli strumenti a disposizione sono il personale e il supporto di un’associazione no-profit, la “Internet Archive”, e un potente software Ocr (che esamina le pagine scannerizzate e le tramuta in testo). Purtroppo, però, il sistema Ocr non riconosce un decimo delle parole a causa della cattiva qualità dei documenti originali. Ecco che entra in scena il Captcha: le parole che il computer non riconosce vengono automaticamente distribuite nei siti affiliati in tutto il mondo – che li utilizzano come abbiamo visto per far autenticare le persone – che aderiscono al programma chiamato reCaptchas.
L’utente, quindi, registrandosi a un servizio pensa di riscrivere una parola apparentemente senza senso, ma in realtà sta aiutando i ricercatori a preservare antichi libri. Ovviamente, per evitare errori, ogni stringa di testo è sottoposta a due utenti: se le risposte sono uguali, allora la traduzione sarà accettata. I Captcha non sono molto popolari tra gli utenti internet: per molti sono una perdita di tempo e spesso sono difficili da decifrare. La prossima volta che vi imbattete in un Captcha, allora, non sbuffate: magari state aiutando la digitalizzazione di un testo del Trecento.
Via | Bbc News
Categorie:
Curiosità, Software Tags: biblioteche, Captcha, Curiosità, libri-antichi, login, Software, università, |
||
Potrebbe interessarti anche
Articoli Correlati
#1paoloc
mi chiedo una cosa: ma se l’ocr non riesce a distinguere la parola, come fa il Captcha a funzionare correttamente? Cioè: se nemmeno chi ti propone il Captcha sa che parola è scritta, come può consentire all’utente di accedere all’area protetta?
Scusate la forma, ma stanotte ho dormito poco!
#2matteomac
Se non sbaglio, delle due parole è solo la seconda quella che non viene identificata correttamente dall’ocr, quindi non influisce sul controllo anti-spam.
#3DvD
Che storia! Io proprio quella versione di Captcha mi stava un po’ antipatica perchè è veramente articolata! Adesso mi impegnerò un po’ meglio sapendo a cosa serve! 😀
#4SickByte
@paoloc:
trovi la spiegazione al tuo giusto interrogativo qui:
http://recaptcha.net/learnmore.html
(in pratica e’ come dice matteomac, solo spiegato in maniera piu’ esaustiva)
Bella idea.
#5Mangiucugna
Veramente utile come cosa, almeno i controlli antispam saranno più che utili..
#6Giuseppe1000
@paoloc
Le parole che non vengono riconosciute non vengono esposte agli utenti come parola formata da lettere, ma come “immagine” della parola..quindi poi l’utente che vede quell’immagine e che riesce a leggere la parola contenuta(basta una lettera scritta male o qualche segno sopra la parola che il computer non capisce più niente, a differenza degli umani).
Comunque credo che solo 2 utenti per parola sono pochi..minimo 4 o 5 per essere davvero sicuri
#7Marco Calatozzo
Comunque questo progetto è vecchio, ne ho già sentito parlare un paio di mesi fa.
#8Mark_Ttec
Wow! e’ l’uovo di colombo!! ora che lo so mi vien voglia di aiutare!… affrontero’ i Captcha in modo diverso d’ora in poi!
#9Goradan
Non la sapevo sta cosa ^_^ Mai avuto niente in contrario verso i software anti-spam…ma almeno da adesso so che forse sto facendo qualcosa di costruttivo!