logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-03212017-115614


Thesis type
Tesi di laurea magistrale LM5
Author
LAGOMARSINI, ALICE
URN
etd-03212017-115614
Thesis title
Valutazione in silico di una piattaforma di target fishing basata su calcoli di docking: analisi dei dataset MUV e ChEMBL
Department
FARMACIA
Course of study
CHIMICA E TECNOLOGIA FARMACEUTICHE
Supervisors
relatore Prof. Tuccinardi, Tiziano
correlatore Dott.ssa Lapillo, Margherita
Keywords
  • target fishing
  • docking based
  • ChEMBL
  • MUV
Graduation session start date
27/04/2017
Availability
Full
Summary
L'identificazione dei possibili target di un composto chimico dotato di attività biologica rappresenta un motivo di notevole interesse nel processo di drug development, considerati gli ingenti sforzi compiuti per comprimere le prime fasi di studio dello sviluppo di un nuovo farmaco. In questo senso, l'avere a disposizione un modello in grado di prevedere target primari e secondari di una molecola sottoposta ad uno studio accurato può rivelarsi uno strumento molto utile. Oltre a costituire un valido supporto per altri campi di ricerca quali la proteomica e la biologia molecolare, la chimica computazionale offre tecniche utili ed imprescindibili nel condurre un approccio mirato alla costruzione di un protocollo in grado di scovare in partenza eventuali bersagli biologici per un qualsiasi composto chimico a struttura nota.
In quest’ambito si inserisce l’innovativa metodica del target fishing (o reverse screening). Questo metodo comporterebbe numerosi vantaggi tra cui la rivelazione della bioattività di un composto nonché delle sue modalità di azioneo predizione degli effetti collaterali. Rispetto al classico virtual screening che verte sull'individuazione di composti dotati di specifiche caratteristiche a partire da grandi database di molecole - disponendo delle informazioni necessarie sull’interazione ligando-recettore – il target fishing è ideato nell’ordine di identificare il target più probabile di una molecola in esame. Il fine di questo lavoro di tesi è stato comprendere se l’utilizzo del docking sia una buona strategia da utilizzare all’interno di una piattaforma di target fishing, in particolare capire quale dei programmi di docking a disposizione risulti essere migliore a questo scopo. Sono stati utilizzati due dataset riportati in letteratura: Maximum Unbiased Validation (MUV), implicato nella validazione di metodi LBVS e ChEMBL, che annovera informazioni prelevate manualmente dalla letteratura tra le quali: dati di binding e proprietà farmacocinetiche riferite a molteplici composti bioattivi. Questo studio è il proseguimento di un’analisi analoga effettuata sul dataset Directory of Useful Decoys (DUD). Tuttavia, DUD è composto da proteine più simili tra loro dal punto di vista biologico e funzionale, infatti è soggetto ai fenomeni di analogue bias e artificial enrichment. Ciò significa che gli scaffold potrebbero contenere errori nella struttura chimica o duplicati, essendo i vari composti attivi molto somiglianti.
Come punto di partenza sono state scaricate dal Protein Data Bank le strutture cristallografiche disponibili relative alle proteine target comprese nei due dataset, ognuna complessata con un ligando noto di riferimento. In totale sono stati selezionati 27 cristalli e 270 ligandi, in particolare sono stati scelti casualmente 10 fra i composti attivi indicati per ciascun target. I programmi di docking utilizzati sono stati: GLIDE (funzioni SP e XP),
GOLD (funzioni ASP , PLP , Goldscore e Chemscore), FRED, FLAP , PLANTS, AUTODOCK, VINA, GLAMDOCK, DOCK6 e rDOCK. Sono stati valutati i risultati del docking dei 270 ligandi sulla base di punteggi di score attribuiti dal programma stesso al termine del calcolo. I risultati raccolti sono stati analizzati servendosi di Excel. La prima analisi ha permesso di valutare, inizialmente, se a ciascun ligando fosse stato assegnato il corrispondente punteggio di score calcolato dal docking. In altre parole, è stato possibile in questo modo verificare se il calcolo di docking fosse stato eseguito correttamente o meno per tutti i ligandi dell’intero database in ogni proteina target. Successivamente, è stata vagliata l’abilità di ogni programma di docking di discriminare i ligandi attivi dai non attivi per ciascun target. Per ogni proteina, infatti, è stato calcolato l’enrichment factor al 10%, cioè la percentuale di composti attivi che rientrassero tra i primi 27 posti su 270 per ordine di valore di score. Infine, sommando i valori ottenuti e dividendoli per il numero di target selezionati, è stata calcolato l’enrichment factor medio al 10% totale di ciascun software. La seconda ed ultima analisi, questa volta condotta prendendo a riferimento ciascun ligando singolarmente, ha permesso di visualizzare immediatamente la posizione (rispetto alle altre proteine) di un target nei confronti del proprio ligando attivo. Anche in questo caso è stata calcolata la media totale dei valori ricavati per ciascun programma di docking. Tenendo conto di queste analisi – delle quali i punteggi migliori sono stati attribuiti al software GOLD_PLP – possiamo quindi affermare che risulta possibile utilizzare una procedura di docking all’interno di una piattaforma di target fishing come step iniziale o ausiliare per selezionare un primo insieme di molecole da vagliare; tuttavia questa deve essere affiancato da altre tipologie di procedure.
File