logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-10232011-145305


Tipo di tesi
Tesi di laurea specialistica
Autore
MURA, FRANCESCA
URN
etd-10232011-145305
Titolo
EVALUATION OF SOFTWARE TOOLS FOR THE SYSTEMATIC IDENTIFICATION AND LOCALISATION OF POST TRANSLATIONAL MODIFICATION FROM PROTEIN MASS SPECTRA
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA BIOMEDICA
Relatori
relatore Landini, Luigi
Parole chiave
  • Nessuna parola chiave trovata
Data inizio appello
06/12/2011
Consultabilità
Non consultabile
Data di rilascio
06/12/2051
Riassunto
La bioinformatica in Proteomica è un campo emergente e in continua crescita, il quale esige strumenti informatici costantemente adeguati ed in linea con le esigenze del momento. Per far fronte alla domanda costantemente in crescita, viene rilasciato un numero sempre maggiore di applicazioni software che necessitano di altrettanti costanti aggiornamenti. Oltre all’elevata numerosità e rapidità di rilascio, i software disponibili presentano delle differenze enormi in termini di data format e algoritmi utilizzati, nonché differenze in qualità dei dati di uscita e quelli richiesti in ingresso. Alcuni software vengono spesso rilasciati nel mercato ancora a livello di prototipo. In molti casi la situazione peggiora a causa dell’assenza di un’interfaccia utente e un’adeguata manualistica di installazione e utilizzo. Biologi e medici si scontrano quindi con tale complessità, in cui è enorme il divario tra due realtà distinte: quella degli scienziati e delle loro competenze/conoscenze da una parte, e il mondo informatico con il proprio linguaggio e leggi dall’altra. Mediatore tra questi due mondi è la figura del Bioinformatico. In tale contesto si inserisce questo lavoro di tesi, dove la valutazione di alcuni software ha lo scopo di trovare quelli più adatti -tra un numero sempre crescente- per effettuare analisi sistemiche.
Il lavoro di tesi ha richiesto lo studio delle tecniche utilizzate in Proteomica, la letture dei mass spectra, la comprensione degli algoritmi di identificazione e data matching, nonché la logica di archiviazione dei database. Le esigenze in questo studio hanno richiesto propensione e conoscenze -sia pregresse che sviluppate nel corso della tesi- in programmazione, informatica e biologia.
La tesi è stata inizialmente incentrata sullo studio dell’ Histone Code, teoria secondo la quale modificazioni post-translazionali (PTMs) degli istoni giocano un ruolo fondamentale nell’espressione genica. Gli istoni sono proteine strutturali della cromatina, correlate al processo di unfolding della stessa e quindi teoricamente determinanti alla replicazione del DNA. Modifiche nella sequenza amminoacidica degli istoni sono teorizzate essere coinvolte in prima linea nel processo di unfolding della cromatina, nonchè possibile origine di malattie genetiche. Gli esperimenti a riguardo si basano sull’analisi di mass spectra ottenuti da tecniche ormai note in Proteomica.. In questo contesto, per la tesi sono stati utilizzati dei mass spectra di istoni provenienti da esperimenti compiuti alla Oxford University; grazie ai dati forniti, sono stati valutati i differenti approcci analitici dei software esaminati, in termini di tecniche analitiche, databases e algoritmi di calcolo utilizzati. Lo studio si è poi rivelato essere utile per l’identificazione e la localizzazione delle PTMs in applicazioni molto più generiche.
L’analisi valutativa ha previsto due steps: il confronto degli output di tutti i software utilizzati – confronto non diretto a cause delle innumerevoli differenze presentate - , l’accertamento della capacità di questi software di essere realmente implementati e utilizzati per analisi sistematiche. Lo studio ha reso necessaria l’implementazione di un collegamento diretto tra uscite e ingressi dei vari software per l’ottimizzazione della qualità dei risultati. Tale pipeline è consista nello sviluppo di alcuni script in linguaggio Perl per consentire un flusso dati diretto che permettesse di ottenere una risposta adeguata sia alle conoscenze degli scienziati, sia alla domanda specifica posta.
Tra tutte le applicazioni software valutate, SLoMo and OMSSA hanno mostrato essere le più adatte per l’implementazione di pipeline. SLoMo è inoltre risultato essere un valido software per l’identificazione e localizzazione delle PTMs, oltre che essere adatto all’integrazione in più sofisticate pipelines. Risultati, conclusioni e struttura della pipeline sono descritti entro la tesi, così come sono riportati i database utilizzati e il contesto biologico e tecnologico di sviluppo.
File