ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-03092006-121326


Tipo di tesi
Tesi di laurea specialistica
Autore
Corsi, Claudio
Indirizzo email
claudio.corsi@gmail.com
URN
etd-03092006-121326
Titolo
Sviluppo ed integrazione di strategie di clustering in strumenti di ricerca per grandi banche dati biologiche
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
TECNOLOGIE INFORMATICHE
Relatori
relatore Marangoni, Roberto
relatore Ferragina, Paolo
Parole chiave
  • motori di ricerca
  • search engine
  • document clustering
  • bioinformatica
  • banche dati molecolari
  • generazione di etichette per clustering
  • motori di terza generazione
  • gene ontology
Data inizio appello
07/04/2006
Consultabilità
Completa
Riassunto
Il lavoro svolto indaga in merito allo sviluppo di un innovativo motore di ricerca in ambito biologico. Vengono presi a modello i motori di ricerca di terza generazione per il Web i quali affiancano alla lista dei risultati prodotti da una query maggiori informazioni circa il risultato ottenuto, mostrando utili feedback per operare un raffinamento della ricerca o per aumentare la comprensione del risultato stesso. A tal fine vengono impiegate strategie di document clustering. L'esperienza maturata in ambito web viene applicata in questo lavoro nel contesto delle banche dati biologiche i cui dati hanno il vantaggio di essere informazioni strutturate, controllate e dotate di riferimenti a tassonomie e ontologie come Gene Ontology. Il sistema sviluppato sfrutta queste informazioni per mostrare al biologo le relazioni che legano i documenti (entry) determinati da una query al fine di aumentarne la comprensione e facilitare il suo lavoro nello scoprire le relazioni caratteristiche dei risultati ottenuti.
File