“Hey Siri”: Apple spiega i segreti della rilevazione dei comandi vocali

siri.jpg

Apple continua ad aggiornare il suo “Machine Learning Journal”, un portale che raccoglie articoli di approfondimento degli ingegneri dell'azienda sul mondo dell'apprendimento automatico, esaminando da vicino la funzionalità principale di Siri: i comandi vocali.

La società di Cupertino affronta con sempre più dedizione ed attenzione la crescita della sua assistente virtuale, Siri, almeno abbastanza da aprirsi al pubblico su alcuni dei dettagli che ne riguardano lo sviluppo.

L'ultima aggiunta al “diario” spiega nel dettaglio come Siri sia in grado di rilevare con precisione la frase che avvia i comandi vocali: “Hey Siri”. Non si tratta di una funzionalità banale bensì di un sensore vocale specializzato che trasforma la voce in un flusso di campioni con forma d'onda.

Il flusso passa poi ad una cosiddetta rete neurale profonda, una delle architetture dell'apprendimento automatico, che vaglia i campioni esprimendo i risultati di un test sulla probabilità che si tratti effettivamente della frase di attivazione sopraccitata.

Se il risultato supera la soglia minima ma non quella superiore, Siri non verrà attivata ma entrerà in una fase di sensibilità aumentata, in attesa di un secondo comando di conferma. Questo, in unione ad una serie di parametri e specifiche fonetiche basate su vari linguaggi, idiomi ed accenti, integrati nello sviluppo di Siri, serve a ridurre le probabilità di falsi positivi.

Per migliorare ulteriormente l'esperienza di utilizzo, Apple invita anche gli utenti ad effettuare una breve calibratura ripetendo una serie di frasi in modo tale da evitare l'attivazione da parte di utenti estranei.

L'azienda esorta ingegneri, ricercatori, sviluppatori e studenti a contattare il programma del Machine Learning Journal, con domande, suggerimenti e impressioni, una necessità nata dall'esigenza di condividere informazioni e idee in una comunità aperta per migliorare la ricerca dell'apprendimento automatico.

hey-siri-schema.jpg

  • shares
  • Mail