ANALISI CONFORMAZIONALE. Le proprietà chimiche, fisiche e biologiche di una molecola dipendono...
-
Upload
pasqualina-cuomo -
Category
Documents
-
view
223 -
download
2
Transcript of ANALISI CONFORMAZIONALE. Le proprietà chimiche, fisiche e biologiche di una molecola dipendono...
ANALISI CONFORMAZIONALE
Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso dalle strutture tridimensionali, o conformazioni, che questa può adottare. L’analisi conformazionale è lo studio delle conformazioni di una molecola e della loro influenza sulle sue proprietà.
Le conformazioni di una molecola sono tradizionalmente definite come arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro semplicemente con la rotazione attorno ad uno o più legami. Questa definizione è spesso utilizzata in maniera meno stringente perché piccole distorsioni negli angoli di legame e nelle lunghezze di legame spesso accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un ordine tra il primo e il secondo.
Un componente chiave dell’analisi conformazionale è la ricerca (search) conformazionale, che ha come obiettivo l’identificazione delle conformazioni “preferite” di una molecola, quelle conformazioni che ne determinano il comportamento. Questo di solito richiede l’individuazione delle conformazioni corrispondenti a punti di minimo della superficie d’energia.
Analisi conformazionale
I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il punto di minimo più vicino alla struttura iniziale. Per questa ragione è necessario avere un algoritmo separato che generi le strutture di partenza per le successive minimizzazioni.
Anche se teoricamente è possibile identificare tutte le conformazioni a minima energia sulla superficie, il numero dei minimi può essere così grande che è praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo il minimo globale?
Analisi conformazionale
Minimo globale
Minimo più popolato
Struttura attiva
In queste circostanze di solito si cerca di trovare il maggior numero di minimi accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può essere ulteriormente caratterizzato mediante metodi statistici. In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è
data dalla distribuzione di Boltzmanndistribuzione di Boltzmann:
Analisi conformazionale
N
j
j
i
ii
RT
E
RT
E
N
nx
1
exp
expR= costante dei gasni = numero di molecole aventi conformazione i-esimaN = numero totale di molecoleEi = energia molare della conformazione i-esimaT = temperatura
Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media in base alla distribuzione di Boltzmann delle proprietà delle conformazioni individuali. Se p è la proprietà che vogliamo:
i
n
ii pxp
1
Esempio: momento di dipolo
Conformero Energia relativa
(kJ/mol)%
momento di dipolo (debye)
1 0 41 1,42 1 28 2,73 2 19 3,84 3 12 1,9
28.29.112.0
8.319.0 7.228.04.141.0 dipolo di momento
Media di Boltzmann e ricerca conformazionale
La media di Boltzmann è esatta
Le approssimazioni vengono dal set di conformazioni che viene preso in considerazione
Per avere una buona analisi conformazionale dobbiamo prendere in considerazione almeno tutte le conformazioni energeticamente accessibili
I metodi di ricerca conformazionale possono essere divisi in varie categorie:
1. algoritmi di ricerca sistematica
2. metodi di costruzione di modelli (model-building)
3. approcci stocastici random
4. dinamica molecolare
Analisi conformazionale
Come suggerisce il nome, una ricerca sistematica esplora lo spazio conformazionale facendo regolari e prevedibili cambiamenti sulle conformazioni. La più semplice ricerca conformazionale sistematica, chiamata anche grid search (ricerca su griglia), consiste nei seguenti passi:
1. si identificano tutti i legami che possono ruotare nella molecola: le lunghezze di legame e gli angoli rimangono fissi.
2. ognuno di questi legami viene sistematicamente ruotato usando un incremento fisso fino a raggiungere i 360°.
3. tutte le conformazioni così generate sono soggette a minimizzazione dell’energia.
4. la ricerca termina quando tutte le possibili combinazioni degli angoli di torsione sono state generate e minimizzate
Analisi conformazionale
Metodi sistematici
Metodi sistematici: esempio
Alanina di-Peptide: Minimizzazione
vincolata
Analisi conformazionale: metodi sistematici
Analisi conformazionale: metodi sistematici
Il maggior inconveniente della ricerca su griglia è che il numero delle strutture generate e minimizzate cresce esponenzialmente con il numero dei legami che possono ruotare, un fenomeno conosciuto come esplosione combinatoriale. Il numero di strutture generate è dato da:
dove i è l’incremento del diedro che è scelto per i legami ed N è il
numero dei torsionali.
N
1i iθ
360nicombinazio di Numero
N
θ
360
Se l’incremento è lo stesso per ogni angolo
5 legami con 30° di incremento 248832 strutture 69 ore
7 legami con 30° di incremento circa 36 milioni di strutture 415 giorni
Eliminazione delle strutture ad alta energia
1
2 3 4Torsione 1
3 valori
5 6 7 8 109Torsione 2
2 valori
12 13 14 15 16 17 18 19 20 21 22 26 27 2823 24 25Torsione 3
3 valori11
Analisi conformazionale: metodi sistematici
Torsione 1
Torsione 2
Torsione 3
Eliminazione delle strutture ad alta energia
12 13
5
14 15 16
6
17 18 19
7
20 21 22
8
26 27 28
10
23 24 25
9
1
2 3 4Torsione 1
3 valori
Torsione 2 2 valori
Torsione 3 3 valori
11
Analisi conformazionale: metodi sistematici
Se, ad esempio, il secondo valore della torsione 1 combinato con il primo valore della torsione 2 porta a strutture con problemi (es. ad alta energia sterica), possiamo eliminare (“potare”) tutti i nodi corrispondenti a tale combinazione.
Esempio
Analisi conformazionale: metodi sistematici
Piperonil-butossido
13 torsioni: 11 nella catena lunga 2 nella catena corta
Consideriamo per ogni angolo un incremento di 120°
1.595.323 conformazioni
Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è maggiore di 1.5 Å e la distanza fra due atomi più pesanti (non legati) è 3 Å.
53.494 conformazioni
Eliminazione di alcune strutture in molecole cicliche
Analisi conformazionale: metodi sistematici
Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo una molecola “pseudo-aciclica” che può quindi essere trattata come una normale molecola aciclica. Quando si fa la ricerca conformazionale di molecole cicliche deve essere inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado di garantire che gli anelli siano correttamente costruiti.
Esempio: cicloesano
cis
trans
La chiusura ciclica non può avvenire
Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale della ricerca sistematica è di usare frammenti molecolari a partire dai quali costruire le conformazioni. Con gli approcci a “costruzione da modello” all’analisi conformazionale si costruiscono le conformazioni di una molecola unendo insieme strutture tridimensionali di frammenti molecolari.Tali metodi possono essere più efficaci poiché ci sono molte meno combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per frammenti ciclici che possono creare problemi nella ricerca conformazionale.
Per usare questi metodi vanno fatte alcune assunzioni:
1. Ogni frammento deve essere conformazionalmente indipendente dal resto della molecola.
2. Le conformazioni a disposizione per ogni frammento devono coprire il range di strutture osservate in molecole completamente costruite.
3. Ovviamente si possono solo analizzare molecole i cui frammenti siano disponibili.
Analisi conformazionale
Metodi model-building
Minimizzazione dell’energia
Eliminazione dei duplicati
Geometrie di partenza generate sistematicamente o casualmente
Scelta di una struttura rappresentativa per ogni minimo
Analisi conformazionale
Caratteristiche comuni ai metodi di analisi conformazionale
Analisi conformazionale
Confrontro tra diversi conformeri: RMSD
Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di diverse molecole sono orientate nello spazio in maniera che atomi o gruppi funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale.Un algoritmo di fitting molecolare richiede una misura numerica della “differenza” tra due strutture disposte nello spazio.La misura più usata è quella della root-mean-square-distance (RMSD) tra coppie di atomi:
atomi
N
ii
N
datomi
1
2
RMSD
dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate dell’atomo i nelle due strutture sovrapposte.
Occorre trovare l’orientazione relativa delle due conformazioni tale che la RMSD sia minima.
Analisi conformazionale
Confrontro tra diversi conformeri.
A volte occorre prendere in considerazione anche possibili strutture che apparentemente differiscono per ragioni di simmetria.
H2N CH C
CH2
OH
O
H2N CH C
CH2
OH
O
1
3
5
2
4
1
3 2
5 4
Analisi conformazionale
Raggruppamento di strutture simili: algoritmi di clustering
La ricerca conformazionale può generare un gran numero di dati che devono essere analizzati. Molte delle conformazioni generate sono molto simili, è quindi preferibile essere in grado di selezionare dal set di dati un set di conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi di cluster che raggruppa insieme oggetti simili da cui estrarre i più rappresentativi.
Raggruppare insieme oggetti simili
Selezionare un componente
Richiede una misura di similarità
Analisi conformazionale
Raggruppamento di strutture simili: algoritmi di clustering
Una misura di similarità può essere la RMSD vista prima.
In maniera alternativa si può misurare la distanza tra due conformazioni in termini di angoli di torsione.Questa distanza si può calcolare come distanza Euclidea
2,
1, )( jm
N
mimij
tors
d
I cluster prodotti usando la RMSD e la distanza Euclidea possono essere abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel centro della molecola possono dar luogo a grosse differenze nelle posizioni degli atomi terminali di una molecola. La RMSD produce cluster in cui le molecole hanno forma simile.
Analisi conformazionale
Metodi di clustering
Gerarchici
Non-Gerarchici
Agglomerative
Divisive
Single-pass
Relocation
Nearest neighbours
Altri
Analisi conformazionale
Cluster gerarchici
C’è un ordine preciso in base al quale i cluster sono formati e amalgamati. Sono semplici da programmare e sono indipendenti dall’ordine in cui le conformazioni vengono assegnate ad ogni cluster.
1. All’inizio ogni conformazione fa parte di un cluster diverso2. Si calcolano tutte le distanze fra ogni cluster.3. Si fondono i due cluster più simili in un unico cluster.4. Si ripete il punto 3 fino a che:
La distanza tra tutte le coppie di cluster è maggiore di un valore
prefissato. Tutti I cluster sono stati uniti in un unico cluster.
Metodi agglomerativi
Distanza minima (single linkage)
Distanza massima (Complete linkage)
Distanza media (Average linkage) – la più comune
Analisi conformazionale
Calcolo della distanza tra due cluster
1 2 3 4 5 6 7 81 0.0 7.2 19.3 21.4 26.9 6.6 19.4 14.22 7.2 0.0 24.6 26.3 31.1 5.3 23.6 17.93 19.3 24.6 0.0 2.7 8.8 19.9 4.5 8.14 21.4 26.3 2.7 0.0 6.1 21.4 3.7 8.95 26.9 31.1 8.8 6.1 0.0 26.0 7.6 13.26 6.6 5.3 19.9 21.4 26.0 0.0 18.5 12.87 19.4 23.6 4.5 3.7 7.6 18.5 0.0 5.78 14.2 17.9 8.1 8.9 13.2 12.8 5.7 0.0
175
180
185
190
195
200
205
210
285 290 295 300 305
12 6
87
5
43
Esempio
Analisi conformazionale
Esempio (cont.)
Analisi conformazionale
Step number Single linkage Complete linkage Average linkage
1 3-4 (2.7) 3-4 (2.7) 3-4 (2.7)2 3-4-7 (3.7) 3-4-7 (4.5) 3-4-7 (4.1)3 2-6 (5.3) 2-6 (5.3) 2-6 (5.3)4 3-4-7-8 (5.7) 2-6-1 (7.2) 2-6-1 (6.9)5 3-4-7-8-5 (6.1) 3-4-7-5 (8.8) 3-4-7-5 (7.5)6 2-6-1 (6.6) 3-4-7-5-8 (13.2) 3-4-7-5-8 (9.0)7 2-6-1-3-4-7-8-5 (12.8) 2-6-1-3-4-7-5-8 (31.1) 2-6-1-3-4-7-5-8 (21.3)
Sequenza di clustering(tra parentesi la distanza fra i cluster formati)
175
180
185
190
195
200
205
210
285 290 295 300 305
12 6
87
5
43
Esempio (cont.)
Analisi conformazionale
0
2
4
6
8
10
12
3 4 7 8 5 2 6 1
DendrogrammaNumero di cluster ad ogni livello di similarità Appartenenza a ciascun
cluster
175
180
185
190
195
200
205
210
285 290 295 300 305
12 6
87
5
43
5,8
Metodi di clustering non gerarchici: “nearest neighbours”
Analisi conformazionale
Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la matrice di similarità che ha dimensioni NxN, dove N è il numero di conformazioni trovate. Questo ne limita l’applicabilità per numeri di conformazioni molto grandi. I metodi non gerarchici superano questo problema.Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti:
Per ogni conformazione si genera una lista delle m conformazioni ad essa più simili.
Due conformazioni sono nello stesso cluster se:
1. Sono ognuno nella lista dei vicini dell’altro.2. Hanno p (p < m) conformazioni nella lista dei vicini in comune
175
180
185
190
195
200
205
210
285 290 295 300 305
12 6
87
5
43
EsempioAnalisi conformazionale
Conformazione Nearest neighbours1 2, 6, 82 1, 6, 83 4, 7, 84 3, 5, 75 3, 4, 76 1, 2, 87 3, 4, 88 3, 4, 7
Si
No
Si richiede che 2 (=p) su 3 (=m) della lista dei vicini siano comuni
Caratteristiche del metodo
Analisi conformazionale
ParametriNumero dei vicini nella lista.Numero dei vicini comuni.
VantaggiComputazionalmente poco pesante.
Svantaggi
Le conformazioni esterne in zone poco popolate tendono a raggrupparsi insieme anche se sono lontane. Cluster grandi compatti possono essere suddivisi in
maniera arbitraria.