Google Gboard, riconoscimento vocale offline

Google ha annunciato un'importante novità per Gboard, la tastiera virtuale utilizzata da milioni di utenti Android. Grazie allo sviluppo di nuovi algoritmi di riconoscimento vocale è possibile effettuare la dettatura (speech-to-text) senza connessione Internet. Purtroppo la novità è al momento disponibile solo in lingua inglese e solo sui Pixel.

Il riconoscimento vocale è una tecnologia molto complessa che richiede l'uso di reti neurali. A causa della loro dimensione è necessario inviare i dati sul cloud, ma ciò comporta un ritardo nell'elaborazione ed errori nella conversione voce-testo. Utilizzando varie tecniche, l'azienda di Mountain View ha ridotto il modello a soli 80 MB, quindi lo "speech recognizer" può essere memorizzato direttamente sullo smartphone

Il modello, addestrato con una rete neurale ricorrente, lavora a livello di carattere. Ciò significa che le parole pronunciate dall'utente sono mostrate carattere per carattere sullo schermo, come se qualcuno stesse scrivendo sulla tastiera in tempo reale. Questo è esattamente il funzionamento di un sistema di dettatura vocale.

Oltre ad avere una trascrizione più accurata, l'operazione è molto più veloce perché la rete neurale è sul dispositivo. La funzionalità può essere dunque sfruttata in assenza di connessione WiFi o mobile. Il riconoscimento vocale offline è compatibile solo con gli smartphone Pixel. Google ha tuttavia promesso il supporto per altri device in futuro e la dettatura in altre lingue.

  • shares
  • Mail