logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04172013-100302


Tipo di tesi
Tesi di laurea magistrale
Autore
RAFANELLI, DAVIDE
URN
etd-04172013-100302
Titolo
Progettazione e realizzazione di un algoritmo per l'analisi del linguaggio naturale basata su un approccio emergente e sul Web come corpus
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof.ssa Vaglini, Gigliola
relatore Dott. Cimino, Mario Giovanni Cosimo Antonio
Parole chiave
  • corpus
  • web
  • approccio emergente
  • linguaggio naturale
  • controllore testuale
  • clustering
Data inizio appello
09/05/2013
Consultabilità
Non consultabile
Data di rilascio
09/05/2053
Riassunto
Tesi sulla creazione di un controllore testuale multilingua basato su approccio emergente, scritto il linguaggio PHP. Il controllore verifica la correttezza di una frase senza avvalersi dell'uso di una grammatica precodificata, scompone la frase in parti più piccole (n-grammi) di cui verifica la correttezza attraverso il conteggio dei risultati (rate) che i motori di ricerca restituiscono per i vari n-grammi. Dopo aver collezionato i vari rate, il controllore associa dei pesi ai vari n-grammi, in modo da ricavare un grafo pesato in cui gli archi indicano i legami sintattici tra le parole; la correttezza di un legame sintattico è data dal valore del peso associato all'arco corrispondente.
File