L’articolo è stato redatto in collaborazione con Cristina Tabachetti

La ricerca nel campo delle tecnologie vocali, che ormai è prossima a compiere i suoi primi 50 anni, ha delineato un panorama particolarmente ricco di applicazioni, strumenti o più genericamente software, in grado di rendere possibile l’interazione tra uomo e computer attraverso la voce.

Possiamo fare una prima suddivisione di questi strumenti in due macro-categorie, ovvero i TTS (Text-to-speech) e i programmi di riconoscimento vocale (ASR: Automatic Speech Recognition): i primi si preoccupano di “far parlare” un personal computer, ed i secondi di “farlo ascoltare”.

Non è mia intenzione sottoporvi una fedele cronaca di questi 50 anni .. ne tanto meno esaminare in dettaglio quali siano le attuali proposte software nel mercato vocale.

L’oggetto di questo breve articolo, sarà invece, l’esame delle possibilità offerte dai nuovi linguaggi per “dare voce” alle nostre applicazioni, e più precisamente alle applicazioni web.

Cercheremo, inoltre, di capire quali possano essere i vantaggi derivante dalla introduzione della voce nel web.

Volendo schematizzare i livelli possibili di integrazione delle moderne tecnologie vocali possiamo tracciare tre macro-categorie:

  • Output vocale: ovvero tutta quella famiglia di strumenti che ci permette di dare voce alle nostre applicazioni web
  • Applicazioni vocali: ovvero servizi fruibili attraverso l’uso della nostra voce e di un telefono
  • Applicazioni multimodali: pagine web in grado di ricevere input vocali, gestuali, di testo etc..