logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04132010-193800


Tipo di tesi
Tesi di laurea specialistica
Autore
LA POLLA, MARIANTONIETTA NOEMI
URN
etd-04132010-193800
Titolo
Estensioni e analisi di un algoritmo per l'individuazione di Tandem Repeat all'interno di sequenze di DNA
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Dott. Pellegrini, Marco
relatore Dott. Vecchio, Alessio
relatore Prof. Avvenuti, Marco
Parole chiave
  • DNA
  • Tandem Repeats
  • ATRHunter
  • TRF
  • algoritmo
  • analisi di stringhe
Data inizio appello
06/05/2010
Consultabilità
Non consultabile
Data di rilascio
06/05/2050
Riassunto
Le sequenze di DNA sono soggette ad una serie di mutazioni genetiche,
ossia a modificazioni stabili del materiale genetico, che modificano il
genotipo, quindi la costituzione genetica di un individuo e possono
eventualmente modificare il fenotipo, vale a dire la manifestazione
fisica dell’organismo. Le cause di queste mutazioni sono da ricercarsi
anche nella presenza all’interno della sequenza genomica di Tandem
Repeats (TRs).
Si definiscono Tandem Repeats sequenze di due o pi`u nucleotidi, indicate
come pattern, che si trovano ripetute in una sequenza in una
o pi`u copie contigue. Oltre ad essere implicati in molti meccanismi
di regolazione molecolare ed essere tra le cause di diverse malattie,
i TRs sono utilizzati in molte applicazioni genetiche (analitiche o di
laboratorio) finalizzate all’analisi e al confronto tra campioni di DNA.
Il problema pi`u importante che si incontra nello studio di queste ripetizioni
sta nel fatto che `e difficile individuarle all’interno della sequenza
genomica ed `e dunque poco realizzabile una loro descrizione esaustiva
in termini, ad esempio, di lunghezza del pattern e numero di copie
ripetute.
L’algoritmo TRStalker, oggetto di studio di questo lavoro, `e un algoritmo
euristico per la ricerca dei TRs in sequenze di DNA che,
rispetto ai tools esistenti (ad esempio, TRF o ATRHunter), si basa
su definizioni diverse di distanza tra i probes cercati, periodo del TR
e threshold sulla base della quale una sottostringa `e considerata un
possibile TR.
File