Da Blogger a Blogger, Speech Recognition

Un’interessante articolo su Problogger ha trattato della Speech Recognition, un argomento molto sentito dai blogger come da tutti coloro che passano la maggior parte della loro giornata lavorativa a scrivere.

Il caso in questione è quello di Jon Morrow, blogger di fama mondiale, con gravi disabilità motorie che non gli permettono di utilizzare le mani per interfacciarsi con il proprio PC. L’articolo viene con un video autoprodotto da Jon Morrow in cui spiega nel dettaglio come funziona la Speech Recognition e da interessanti dati sull’evoluzione che questa ha avuto negli ultimi anni.

Il software che usa e consiglia è Dragon Naturally Speaking per Windows Vista o Windows 7 e Mac Speech Dicatate per Mac, entrambi i quali utilizzano lo stesso motore pe analizzare le parole. Secondo l’esperienza di Jon Morrow entrambi i software assicurano un’accuratezza del 99,5% e ne da una dimostrazione video dal minuto 14:27 e il minuto 19:00 del video embeddato in questo post.


Oltre a consigliare il software, Jon Morrow, consiglia anche un’hardware dedicato, niente di fantascientifico per i giorni nostri, ma che solo tre anni fa sarebbe costato un migliaio di dollari, mentre oggi può essere acquistato per meno di cento. Si tratta di una scheda audio USB, per semplicità di installazione e pulizia del segnale, e un headset, entrambi della VXI; inoltre è importante anche assicurarsi di avere un processore di qualità, dal momento che il lavoro di elaborazione è affidato a questo.

Dalla prova che da nel video quello che si nota ha dell’impressionante. Pur non essendo un linguaggio al quale siamo abituati, quello che si usa per scrivere parlando, è pur sempre un linguaggio e il cervello di Jon Morrow sembra aver convertito perfettamente la il device (la bocca) a questo nuovo tipo di funzione. Gli articoli di Morrow non sono sembrano la trascrizione di un discorso, ma seguono le forme della lingua scritta, probabilmente con più accuratezza di chi scrive con le mani.

Oltre ad essere entusiasmante vedere come la tecnologia può sollevare l’uomo dalle sue sfortune, c’è da pensare che la Speech Recognition, portata ad un livello di qualità ancora più alto, potrebbe costituire parte integrante del nostri modi di interfacciarci alla tecnologia, così come dal click e trascina si è passati al tap and swipe.