AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik...
-
Upload
bathild-albus -
Category
Documents
-
view
103 -
download
0
Transcript of AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik...
![Page 1: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/1.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Proteinstrukturvorhersage mit Hilfe von CP(FD)
Seminar: BioinformatikWS 01/02
Martin Homik
![Page 2: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/2.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Vortrag
1. Motivation• Kriterien, Modelle, Bisherige Ansätze
2. Constraint Programmierung• Modellierung, Propagierung, Suche
3. CP Modell für HP(NX)• Naive, Fortgeschritten
4. Fazit, Ausblick und Literatur
![Page 3: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/3.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Motivation
Gegeben: Aminosäuresequenz Gesucht: Natürliche Struktur Ziele:
Funktion Medikamentenherstellung
NP vollständig (Berger, Leighton; Crescenzi 1998)
![Page 4: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/4.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Qualitätskriterien
Gittermodell Simplifikation Energiefunktion Algorithmus
![Page 5: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/5.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Gittermodell
Monomerplatzierung auf Gitterpositionen
Einheitliche Bindungsabständen
Monomere haben einheitliche Größe
![Page 6: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/6.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HP Modell
Dill, Lan (1989) teilen Monomere ein in: hydrophob hydrophil
Reduktion von 202
VAIAEQCGRQAGGKLCPNNLCCSQWGWCGSTDEYCSPDHNCQSNCK
HPHPPHPHPHPHHPHPPPPHPPHHPHPPHHPHPHPHPHHPPHHPPP
![Page 7: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/7.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Kontakt
Optimale Anordnung: Maximum von Kontakten zwischen H-Monomeren
HH-Kontakt
PH
![Page 8: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/8.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HP Modell: Energiefunktion
H = Hydrophob (wasserabweisend) P = Hydrophil (wasseranziehend)
H P
H -1 0
P 0 0
![Page 9: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/9.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HP Modell in 3D
H-Monomer
P-Monomer
![Page 10: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/10.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HP Modell: Nachteil
Hoher Degenerierungsgrad Viele Strukturen zu einer Sequenz mit min. Energie
Ungenaue Energiefunktion
Degenerierung
![Page 11: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/11.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HPNX Modell: Energiefunktion
Hydrophob H P N X
H -4 0 0 0
P 0 1 -1 0
N 0 -1 1 0
X 0 0 0 0
Positiv Negativ Neutral
Hydrophil:
Bornberg-Bauer (1997)
![Page 12: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/12.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
HPNX Modell in 3D
H-MonomerP-MonomerN-MonomerX-Monomer
![Page 13: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/13.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Bisherige Ansätze
Es existiert kein effizienter Algorithmus! Beschränkung auf 3x3x3 Kubus (Sali,
1994) Nur kurze Sequenzen (Teilsequenzen) Maximum Compact State (MCS)
Annahme: MCS = optimale KonformationWiederlegt von You 1995
Monte Carlo (50 000 000 Schritte)
![Page 14: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/14.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Warum CP? (Backofen, Will)
Gittermodelle bleiben skalierbar Längere Sequenzen Keine MCS Einschränkung Modellierung mit Higher Order
Alphabeten CP Modell bleibt für andere Gitter
anwendbar Reduzierung von Degenerierungen
![Page 15: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/15.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Constraint Programmierung
Modellierung Propagierung Problemzerlegung Explorierung (Suche)
![Page 16: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/16.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Constraintspeicher
CP Modellierung
x{3,4,5} y {3,4,5}
Problemvariablen Finite Domains
![Page 17: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/17.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
xy
y3
x{3,4,5} y {3,4,5}
Constraintspeicher Aufsetzen neuer Propagierer Propagierer filtern inkonsistente
Werte
Propagierer (Threads)
![Page 18: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/18.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
Propagierer y>3 im Betrieb
xy
y3
x{3,4,5} y {3,4,5}
![Page 19: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/19.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
Propagierer y>3 im Betrieb Einschränkung Constraintspeicher
xy
y3
x{3,4,5} y {4,5}
![Page 20: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/20.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
Propagierer xy im Betrieb
xy
y3
x{3,4,5} y {4,5}
![Page 21: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/21.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
Propagierer xy im Betrieb Einschränkung Constraintspeicher
xy
y3
x{4,5} y {4,5}
![Page 22: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/22.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung
Propagierer a) im Betrieb Einschränkung Constraintspeicher Fixpunkt erreicht
xy
y3
x{4,5} y {4,5}
![Page 23: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/23.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierung: Summe
x{3,4,5} y {3,4,5} z={1,...,100}
x+y=z
3+3=6 5+5=10
x{3,4,5} y {3,4,5} z={6,...,10}
Analog für
![Page 24: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/24.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Problemzerlegung
Propagierung reicht nicht! Zusätzliche Constraints
xy y3
x{4} y {4}
xy y3
x{5} y {5}
xy y3
x{4,5} y {4,5}
x=4 x4
![Page 25: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/25.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Heuristik
Kriterien Welche Variable wählen? Welchen Wert zuweisen?
Wissenseinwirkung Beispiele:
Naive: Wähle erstbeste nicht determinierte Variable und weise kleinsmöglichen Wert zu
First Fail: Wähle nicht determinierte Variable mit kleinstem Bereich und weise kleinsten Wert zu
![Page 26: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/26.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Explorierung
Iteration: Propagierung Zerlegung
Suchbaum:
Lösung
Fail Kriterium:
Anzahl der Zerlegungsknoten
![Page 27: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/27.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Branch & Bound
Sei f Zielfunktion Sei s eine Lösung Dann:
Vergleichswert: f(s) Nächste Lösung s
´: f(s´) < f(s)
s
f(s´) < f(s)
![Page 28: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/28.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Branch & Bound
Sei f Zielfunktion Sei s eine Lösung Dann:
Vergleichswert: f(s) Nächste Lösung s
´: f(s´) < f(s)
s
f(s´) < f(s)
![Page 29: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/29.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Modellierungstechniken
Symmetrien vermeiden Vermeidung gleicher Lösungen Ordnung
Redundante Constraints Gleiche Constraints Aber anderer Filteralgorithmus
Reifizierte Constraints rc(x1, ..., xn) b, b {0,1}
![Page 30: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/30.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Modell: HP
Sei s=(s1,..,sn) eine HP(NX)-Sequenz
Strukturfunktion (Konformation): c:{1,...,n} Z3
Koordinaten: Xi, Yi, Zi {1,...,2*n}, 1i n
![Page 31: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/31.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Modell: Propagierer
Distanz: 11)c(i-c(i) :ni1
Self-Avoiding:c(j)c(i) :ji
Kontaktstellen (i, j):
sonst0
1c(j)-c(i) 1Contact ji,
j1i wobei
![Page 32: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/32.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierer: HP
Energiefunktion:
HHCEnergy
ContactHHCHs(j)Hs(i)j1i
ji,
H P
H -1 0
P 0 0
![Page 33: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/33.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Suche: HP
Heuristik Wähle Variable aus {Xi, Yi, Zi | 1 i n
} Heuristik: First Fail
Branch & Bound Sei Ec der aktuell beste Energiewert Neuer Constraint: Energy < Ec
![Page 34: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/34.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Suche: HPNX
Energiefunktion:
NNCPPC
PNCHHC*4Energy
Strategie: Erst alle HP Lösungen suchen Dann: Beste HPNX Lösung filtern
H P N X
H -4 0 0 0
P 0 1 -1 0
N 0 -1 1 0
X 0 0 0 0
![Page 35: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/35.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Suche: HP (Besser)
Redundante Constraints Zielgerichtete Heuristik:
Fühzeitige Enumierung von Strukturen mit geringer Energie
![Page 36: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/36.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Redundante Constraints
Ebenen Constraints Position Constraints Typ Constraints
![Page 37: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/37.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Ebenen Constraints
X
Y
Z
1Elem cx,i
Ist Monomer i in X-Ebene c dann gilt:
![Page 38: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/38.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Ebenen Constraints
21icy,3i
cy,i YY1)Elem1(Elem i
1)(Elem1)Elem1(Elem cy,1i
cy,2i
cy,i
![Page 39: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/39.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Ebenen Constraints
Anzahl H-Monomere in der X- Ebene
Hs gerade i
cxicx
i
Elem.sehE
Hs ungerade i
cxicx
i
Elem.sohE
1.sohE
1.sehE
3x
3x
![Page 40: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/40.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Position Constraints
Eine beliebige Position sei: )p,p,(pp zyx
1)(Opi
Monomer i besetzt Positionp
1)Elem1Elem1(Elem zyx pz,i
py,i
px,i
![Page 41: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/41.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Position Constraints
Besetze jede Position höchstens einmal
1Oni1
pi
1OO
1OO
pn Nachbar voist p
p1i
pi
pn Nachbar voist p
p1i
pi
'
'
'
Nachbarpositionen
![Page 42: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/42.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Typ Constraints
Ein H-Monomer besetzt Position p
1O1)(HtypeHsni1
pip
i
p
pH Htype(s)n
Anzahl H-Monomere
Analog für P-,N- und X-Monomere
![Page 43: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/43.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Surface
Sei HSurfs(c) die Anzahl von Paaren benachbarter Positionen, wobei die erste Position durch ein H-Monomer besetzt ist und die zweite nicht
HSurfs(c)=10
![Page 44: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/44.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Neue Schranke (You, Dill)
Jedes Monomer hat 2*d Nachbarn in Zd
Anzahl von H-Monomeren in s:
(c)HSurf)HHBonds(s)(HHC*2nd*2 ssH
Maximierung von HHC
Minimierung von HSurfs(c)
sHn
![Page 45: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/45.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Surface Constraints
Definiere für alle Nachbarpositionen
sonst0
0HType 1HType1HSurf
''ppp
p
Und somit:
Nachbarn p,p
pps
'
'
HSurf)(HSurf
c
![Page 46: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/46.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Heuristik
.sohE.seh,E jjSchranken für Anzahl von H-Monomeren in Ebene j
cx,iElem Konkrete Ebene an
H-Monomere zuweisen
piO
Konkrete Position an H(P)-Monomere zuweisen
iii Z,Y,X Konkrete Position an N,X-Monomere zuweisen
![Page 47: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/47.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Sequenz Suchschritte Beste HPNX
Suchschritte Alle opt.HP
HPNX Degen.
HP Degen.
S1 (27) 14402 167662 61 37244
S2 (27) 733 2998 4 297
S3 (27) 411 155693 195 25554
S4 (31) 46 11036 1023 1114
S5 (36) 1629 55086 16 3528
Ergebnisse
Starke Reduzierung von Degenerierungen
Higher Order AlphabeteReduzeiren Suchraum
Max. Länge: 40 (Zeit?)
![Page 48: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/48.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Ergebnisse (2)
Effizienz nicht vergleichbar: You&Dill: Alg. für HP nicht frei
zugänglich Max. Länge 88 (Zeit?)
Keine weiteren Ansätze für HPNX bekannt
Monte Carlo (3x3x3) 50 000 000 Schritte
![Page 49: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/49.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Fazit
CP(FD) ist eine aussichtsreiche Technik
Skalierbare Gittermodelle Keine Beschränkung der
Sequenzlänge Differenzierte Gittermodelle Higher Order Alphabete Reduzierung von Degenerierungen
![Page 50: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/50.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Ausblick (Aktuell)
Weitere Gitternetze Face-centered cubic lattice (FCC) Sequenzlänge 160
Zeit: 5-15 Minuten
![Page 51: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/51.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Literatur
Backofen, Will, Bornberg-Bauer: Application of constraint programming
techniques for structure prediction of lattice proteins with extended alphabets
Backofen: The Protein Structure Prediction
Problem: A Constraint Optimization Approach using a New Lower Bound
![Page 52: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/52.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Literatur
Backofen, Will: A Brounch-and-Bound Constraint
Optimization. Approach to the HPNX Structure Prediction Problem
Mozart/Oz www.mozart-oz.org
![Page 53: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/53.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
Aminosäure
C-Atom
Aminogruppe
Carboxylgruppe
H
HH
C COH
O
R
N
Organischer Rest
Beispiel: Alanin
![Page 54: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/54.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierer: HP
Distanz benachbarter Monomere ist 1 Xdiffi = |Xi –Xi+1| Ydiffi = |Yi –Yi+1| Zdiffi = |Zi –Zi+1| Xdiffi + Ydiffi + Zdiffi = 1
![Page 55: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/55.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierer: HP
Self-avoiding 1 i,j n mit i j
Xdiffi,j = |Xi –Xj| Ydiffi,j = |Yi –Yj| Zdiffi,j = |Zi –Zj|
ri,j,{x,y,z} {0,1}
(Xdiffi,j = 0) (ri,j,x = 0)
(Ydiffi,j = 0) (ri,j,y = 0)
(Zdiffi,j = 0) (ri,j,z = 0)
ri,j,x + ri,j,y + ri,j,z > 0
![Page 56: AAGUCGGCCGAUUAGG UGACGCUGACGC Proteinstrukturvorhersage mit Hilfe von CP(FD) Seminar: Bioinformatik WS 01/02 Martin Homik.](https://reader035.fdocuments.net/reader035/viewer/2022081602/55204d6149795902118b4a6e/html5/thumbnails/56.jpg)
AAGUCGGCCGAUUAGG
UGA
CGC
CP Propagierer: HP
Kontaktstellen: Xdiffi,j = |Xi – Xj| Ydiffi,j = |Yi – Yj| Zdiffi,j = |Zi – Zj| Contacti,j {0,1}
(Contacti,j = 1) Xdiffi,j+Ydiffi,j+Zdiffi,j = 1