ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-09082009-114728


Tipo di tesi
Tesi di laurea specialistica
Autore
FORMOSA, FABIO
URN
etd-09082009-114728
Titolo
VoiceXML Interpreter for J2ME: From Vocal to Visual Mobile Applications
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Dott. Vecchio, Alessio
relatore Prof. Avvenuti, Marco
Parole chiave
  • vocal services
  • Loquendo
  • tag
  • tag VXML
  • sistemi visuali
  • OTA
  • over the air
  • computer telephony
  • telefoni computerizzata
  • GUI interaction
  • interazione visuale
  • servizi telefonici automatici
  • espressioni ECMAScript
  • SRGS
  • ECMAScript expression
  • ECMAScript
  • XML parsing
  • CLDC
  • MIDP 2.0
  • MIDP
  • midlet
  • applicazioni vocali
  • J2ME
  • mobile devices
  • IVR system
  • GUI
  • TTS
  • ASR
  • dispositivi mobili
  • interprete
  • VXML interpreter
  • VXML
  • VoiceXML
  • mobile platform
  • vocal application
  • mobile application
Data inizio appello
08/10/2009
Consultabilità
Parziale
Data di rilascio
08/10/2049
Riassunto
I sistemi vocali telefonici, con cui l’uomo interagisce “a voce” dal proprio terminale con un computer remoto, sono oggi una realtà consolidata; si pensi, ad esempio, ai classici servizi di “assistenza clienti” messi a disposizione dagli operatori telefonici o ai servizi di prenotazione delle compagnie di trasporto.
A fronte di virtù che ne hanno determinato la diffusione, tali servizi soffrono tuttavia di alcuni limiti, insiti nella loro natura, che ne restringono l’uso e che non li rendono abbastanza pratici dal punto di vista dell’utente.
Grazie all'esplosione del mercato dei nuovi dispositivi mobili con elevate capacità di calcolo e memorizzazione, è possibile concepire un’estensione di suddetti sistemi vocali. L’idea si basa sull'uso di un interprete che traduce l’interazione con tali sistemi, da vocale a visuale; esso permetterà, ossia, di leggere sullo schermo del dispositivo le informazioni che nel paradigma di servizio vocale vengono pronunciate da un sintetizzatore vocale. Si assisterà così a un sensibile miglioramento dell’usabilità dei servizi telefonici a risposta automatica.
Muovendo dalla considerazione che i sistemi esistenti rappresentano una realtà consolidata, l’estensione proposta ha il vantaggio di non richiedere modifiche e aggiornamenti dell’architettura vocale già consolidata. Il fornitore dei servizi non è così costretto ad abbandonare la tecnologia sulla quale ha già investito e può inoltre offrire all’utenza una nuova, aggiuntiva, modalità d’accesso.

Today, telephone vocal systems, in which human can interact by voice with a computer, are a consolidate reality. Popular examples are helpdesks provided by telephone operators. These services, that are accessible by mobile or fixed phones, suffer from some drawbacks that limit their use.
Thanks to the explosion of market of new mobile devices with high processing capability and large memory, it is now possible to augment vocal systems with a graphical presentation. The idea is to design an interpreter that converts the interaction with such systems from vocal to visual and allows us to present the results onto a mobile device, thus improving the usability of services as well as their accessibility.
We achieved this without requiring any substantial modifications to the original legacy system, in order to avoid forcing the provider of the services to re-write the applications or even abandon the technology in which he had invested.
File