logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-11182007-190749


Tipo di tesi
Tesi di laurea specialistica
Autore
BONIN, FRANCESCA
URN
etd-11182007-190749
Titolo
Linguaggio Naturale e Ontologie. La Semplificazione Testuale come metodo per l'interazione tra uomo e macchina.
Dipartimento
INTERFACOLTA'
Corso di studi
INFORMATICA UMANISTICA
Relatori
Relatore Prof. Lenci, Alessandro
Relatore Prof.ssa Bernardi, Raffaella
Parole chiave
  • ontologia
  • parafrasi
  • semplificazione testuale
  • riscrittura automatica
  • logiche descrittive
  • linguistica
  • computazionale
  • ontology
  • paraphrase
  • text simplification
  • description logics
  • database
  • interaction
Data inizio appello
06/12/2007
Consultabilità
Completa
Riassunto
Il problema della rappresentazione della conoscenza e', al giorno d'oggi, una delle principali tematiche discusse nell'ambito delle scienze cognitive, linguistiche e di intelligenza artificiale. Il problema che questo lavoro si propone di affrontare e' studiare se, e come, sia possibile permettere all'utente di interagire in linguaggio naturale con tali sistemi descritti da linguaggi logici ad espressivita' ridotta per motivi computazionali. L'obiettivo e' quello di trovare un frammento di linguaggio che sia condiviso da entrambi, senza che l'uomo sia costretto ad interagire usando un linguaggio controllato. A questo fine si sono indagate, con analisi dei corpora, le percentuali di copertura, del linguaggio naturale, dei due tipi di linguaggi logici, quello di querying e quello di descrizione del sistema di rappresentazione della conoscenza. Nel primo caso, essendo emerso che i costrutti non gestibili dal frammento di logica analizzato non ricorrono ad alte frequenze nell'input naturale, si e' ritenuto opportuno gestire le rare situazioni problematiche con due sistemi di semplificazione testuale (senza affrontare una modifica dell'espressivita' del frammento logico): uno che coinvolge un indebolimento semantico della forma logica dei casi che presentano operatori logici particolari (Carbotta, 2007), e un secondo che invece riguarda la semplificazione sintattica di certi tipi di input problematici. Il trade off fra il linguaggio naturale e il linguaggio di descrizione dell'ontologia si e' rivelato piu' difficile da colmare. Data l'alta percentuale di casi non gestibili dal primo frammento di logica studiato, si e' pensato, prima di tutto, di utilizzare un frammento di logica, ancora computazionalmente poco costoso, ma piu' espressivo sul piano linguistico. Il passo successivo ha coinvolto ancora una volta la semplificazione testuale, per quanto riguarda, in questo caso, la parafrasi di quella porzione di input semanticamente compatibile con la logica, ma sintatticamente non gestibile. Per concludere, si puo' quindi affermare come lavorare contemporaneamente sul versante logico e su quello linguistico sia un approccio interessante per la ricerca di un frammento di linguaggio condiviso tra utente e ontologia.

Summary in english:


Nowadays, knowledge representation systems are one of the main topic in linguistic and cognitive science studies. The aim of this thesis is to focus on the problem of the human computer interaction through free natural language input. Is it possible to interface with a knowledge representation system through natural language? We address the question on which should be the natural language fragment to be used for such a purpose. To this aim, we analyze two different knid of linguistic corpora, in order to study the trade off : between query language supported by an the ontology (specifically CQs queries), and natural language queries, and the trade off between the fragment of description logic that describes the ontology and natural language utterances. In the former, it turns out a very low frequence of logics operator that can not be handled by the querying language; though rare, it is important to deal with those kind of questons; for this reason we describe textual simplification strategy based on semantic weakening strategy. On the other hand, we propose a syntactic text simplification algorithm in order to paraphrase problematics inputs, like indirect speech acts. In the former analysis, it turns out a more troublesome trade off between free natural language input and description language of the ontology. So, at first, we propose to expand the expressivity of logic fragment. Then we use again a text simplification strategy for dealing with cases that , though semantically accepted, need to be syntactically paraphrased in order to be understood by the ontology. We can conclude the aim of finding a suitable fragment is possible and is an interest merging point of linguistic and logic studies: both contributes are important to reach the task.
File