ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-05182009-162501


Tipo di tesi
Tesi di laurea specialistica
Autore
CECCARELLI, DIEGO
URN
etd-05182009-162501
Titolo
Un dizionario per la ricerca efficiente di pattern biologici: analisi e sperimentazione su dati provenienti da PROSITE.
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
INFORMATICA
Relatori
Relatore Grossi, Roberto
Parole chiave
  • pattern_matching cbg regular_expression bit_parall
Data inizio appello
05/06/2009
Consultabilità
Non consultabile
Data di rilascio
05/06/2049
Riassunto
PROSITE è un database contenente pattern di famiglie proteiche, espresse attraverso CBG (Classes of characters and Bounded size Gaps). Data una proteina, espressa come una sequenza di amminoacidi, si vuole conoscere quali famiglie sono contenute al suo interno. L'oggetto di questa tesi è stato lo studio delle caratteristiche di questi pattern e delle sequenze di amminoacidi al fine di proporre un metodo efficiente di riconoscimento che permette la costruzione di un indice in cui le query hanno un tempo basso di esecuzione.
File