logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-05222012-095701


Tipo di tesi
Tesi di laurea magistrale
Autore
ZAMBINI, LORENZO
URN
etd-05222012-095701
Titolo
Le proteine HMGA: analisi filogenetica
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
BIOLOGIA MOLECOLARE E CELLULARE
Relatori
relatore Prof. Vignali, Robert
Parole chiave
  • "alberi filogenetici"
  • "caratterizzazione delle HMGA"
  • "echinodermi"
  • "emicordati"
  • "HMGA"
  • "HMGA1"
  • "HMGA2"
  • "inferenza bayesiana"
Data inizio appello
14/06/2012
Consultabilità
Parziale
Data di rilascio
14/06/2052
Riassunto
RIASSUNTO

Le HMGA (High Mobility Group A) sono proteine coinvolte in numerose attività cellulari e
principalmente agiscono nel nucleo come rimodellatori della cromatina. Il loro studio è di significativa importanza in biologia cellulare, dato un loro coinvolgimento in eventi dello sviluppo embrionale, ed in processi neoplastici.
Le HMGA sono caratterizzate da dominii proteici altamente conservati, capaci di legare zone di DNA ricche in sequenze AT, denominati AT-hook; si distinguono sequenze HMGA tipiche (con 3-4 AT-hook) da sequenze atipiche (con molti AT-hook). Nei vertebrati esistono due proteine HMGA, HMGA1 e HMGA2, che differiscono tra di loro, principalmente per la porzione N-terminale della proteina e per la coda acida C-terminale, mentre i gruppi AT-hook risultano molto conservati.
Abbiamo realizzato una ricerca delle sequenze HMGA presenti in banche dati. Le HMGA2
sono probabilmente presenti in tutti i vertebrati, mentre sequenze HMGA1 sono state trovate in tutti i vertebrati con eccezione degli anfibi e dei ciclostomi. Negli invertebrati ci sono sequenze HMGA la cui classificazione non è chiara. Alcune, come le HMGA di Branchiostoma floridae e Saccoglossus kowalevskii, presentano l'amminoacido W (Triptofano) dopo il terzo AT-hook, caratteristica tipica delle HMGA2; altre non sono chiaramente ascrivibili a HMGA1 o HMGA2, pur essendo chiaramente delle HMGA, data la presenza di evidenti domini AT-hook e di una coda terminale acida.
Nel corso del mio internato di tesi mi sono occupato di collezionare sequenze proteiche e sequenze di DNA codificante per proteine HMGA di vertebrati e di invertebrati, attraverso ricerche nelle banche dati, allo scopo di effettuare un'analisi filogenetico-molecolare che dia indicazione sull'evoluzione di queste sequenze.
Le sequenze sono state scaricate dalle banche dati e selezionate; successivamente le sequenze proteiche sono state allineate con algoritmo MUSCLE e sono state quindi adattate manualmente per massimizzare l'allineamento. E' stato così possibile individuare alcuni caratteristici residui amminoacidici o motivi peptidici che, anche sulla base di dati in letteratura, possono essere proposti come diagnostici per le HMGA1 e HMGA2.
L’analisi filogenetica delle sequenze è stata inizialmente concentrata sulle HMGA2, dato che nel nostro laboratorio è in corso uno studio funzionale del gene corrispondente di Xenopus laevis.
Sono stati quindi creati alberi filogenetici in Maximum Likelihood (ML) con il programma Tree-PUZZLE 5.2, sia dall'allineamento proteico, che da quello nucleotidico, dopo un’analisi preventiva per il modello di sostituizione ottimale. L'analisi è proseguita con l'utilizzo del programma MrBayes 3.2 per creare alberi con Inferenza Bayesiana (BI).
Il mio studio si è concentrato in un primo tempo sulle sequenze proteiche e successivamente abbiamo considerato quelle nucleotidiche, allo scopo di completare e caratterizzare al meglio l’analisi filogenetica.
I miei risultati hanno mostrato una correlazione filogenetica tra le HMGA1 e HMGA2 dei vertebrati, ed hanno evidenziato la posizione basale sia delle sequenze HMGA degli echinodermi, che delle sequenze HMGA2 degli emicordati. Tali risultati, sommati alle ricerche effettuate nelle banche dati, mi hanno spinto a formulare un modello filogenetico delle proteine HMGA, nel quale le proteine HMGA2 hanno una posizione chiave nella direzione evolutiva che va da HMGA ad HMGA1. Si ritene, infatti, che le HMGA2 risultino più basali rispetto alle HMGA1 e che queste ultime siano comparse solo nei vertebrati, anche se per limitazioni delle sequenze disponibili nelle banche dati, non ci è attualmente possibile individuare con precisione in quali vertebrati siano comparse per prima sequenze geniche di tipo HMGA1.

ABSTRACT

HMGA (High Mobility Group) are proteins involved in many cellular activities that primarily act in the nucleous as chromatin remodellers. Their study is of significant importance in cell biology, because of their involment in embryonic development, or in neoplastic processes.
HMGA are characterized by highly conserved domains, able to bound AT-rich DNA regions, called AT-hooks and may be distinguished in typical HMGA (with 3-4 AT-hooks) and atypical HMGA (with more than 4 AT-hooks, also described as multi-AT-hooks). In vertebrates, we can find two types of HMGA: HMGA1 and HMGA2, which mainly differ for the N-terminal and the acid tail in the C-terminal, while AT-hooks are very conserved.
We made a search of HMGA sequences present in databases. The results of this search indicate that HMGA2 are probably present in all vertebrates, while HMGA1 are found in all vertebrates with the exception of amphibians and cyclostomes. In invertebrates there are HMGA sequences, whose classification is not clear. Some, such as the HMGA of Branchiostoma floridae and Saccoglossus kowalevskii have a W (Tryptophan) amino acid residue, immediately dowstream of the third AT-hook, which is typical of the HMGA2 proteins.
Others could not be considered belonging to either HMGA1 and HMGA2, even if they are clearly HMGA type, because of the presence of AT-hooks regions and an acidic C-terminal tail.
During my thesis project I collected from the database both protein and cDNA sequences for HMGA of vertebrates and invertebrates, through researches in databases, in order to perform a phylogenetic-molecular analysis, with the aim to have same indication of the HMGA evolution.
The sequences were downloaded, selected and subsequently aligned; we used the algorithm MUSCLE to align the amino acidic sequences and then manually adjusted to maximize the alignment. It was thus possible to identify, in protein sequences, some characteristic amino acid residues or peptide motifs that, also on the basis of data in the literature, can be proposed as diagnostic for HMGA1 and HMGA2.
The phylogenetic analysis of the sequences was initially focused on HMGA2, given that in our laboratory is in course a functional study of the corresponding gene of Xenopus laevis..
Then phylogenetic trees were created with the Maximum Likelihood (ML) method using the program Tree-PUZZLE 5.2, using both the protein and the nucleotide alignment of the dataset, after a preliminary analysis for the optimal substitution model. The analysis was continued with the use of the software MrBayes 3.2 to create trees with Bayesian Inference (BI).
The phylogenetic analysis was at first focused on protein sequence; then we considered the nucleotide sequences, in order to complete and characterize the phylogenetic analysis.
My results show a phylogenetic correlation between HMGA1 and HMGA2 of vertebrates, and highlight the basal position both of HMGA sequences of echinoderms and of HMGA2 sequences of Hemichordates and Cephalochordates. These results, together with the results of research carried out in the database, led me to propose a model for HMGA protein evolution, in which HMGA2 has a key position in the evolutionary process leading from invertebrate HMGA to vertebrate HMGA2 and HMGA1. We propose, in fact, that HMGA2 is more basal than HMGA1 and that HMGA1 have appeared only in gnathostome vertebrates; because of the incompleteness of the dataset, it is not possible to reconstruct, at present, in which vertebrates the HMGA1 gene sequences first appeared.
File