Ingo Rechenberg PowerPoint-Folien zur 8. Vorlesung „Evolutionsstrategie I“ Nichtlineare Theorie...
-
Upload
aldo-edler -
Category
Documents
-
view
246 -
download
3
Transcript of Ingo Rechenberg PowerPoint-Folien zur 8. Vorlesung „Evolutionsstrategie I“ Nichtlineare Theorie...
Ingo Rechenberg
PowerPoint-Folien zur 8. Vorlesung „Evolutionsstrategie I“
Nichtlineare Theorie der (1, ) - Evolutionsstrategie
Fortschritt und Erfolg am Kugelmodell
DARWINs Denkschema in maximaler Abstraktion
ES)1( 1
Genauere Nachahmung der biologischen Evolution
ES),( 1
0)18235()57223()42489()92322( 243
22
21
24
23
22
21
24
23
221
224
232
21 xxxxxxxxxxxxxxxx
018235057223042489092322
4322
21
423
22
21
423
221
24
232
21
xxxxxxxxxxxxxxxx
Basis-Algorithmus der (1, ) - Evolutionsstrategie
1E1N zxx gg
2E2N zxx gg
zxx ggEN
eiltnormalvert)1,0(,, /21 nzzz n
ggNBE
1 xx )(),(),()( NNNNB 21minmax/ gggg QQQQ xxxx
,1,1 c zzzc z d)erf(1e2
2 11,1
2
mit
Ergebnis der linearen Theorie
Tabelle der Fortschrittsbeiwerte
1 0
2 0,5642
3 0,8463
4 1,0294
5 1,1630
6 1,2672
7 1,3522
8 1,4236
9 1,4850
10 1,5388
,1c
11 1,5864
12 1,6292
13 1,6680
14 1,7034
15 1,7359
16 1,7660
17 1,7939
18 1,8200
19 1,8445
20 1,8675
,1c
21 1,8892
22 1,9097
23 1,9292
24 1,9477
25 1,9653
26 1.9822
27 1,9983
28 2,0137
29 2,0285
30 2,0428
,1c
35 2,1066
40 2,1608
45 2,2077
50 2,2491
55 2,2860
60 2,3193
65 2,3496
70 2,3774
80 2,4268
90 2,4697
,1c
100 2,5076
200 2,7460
300 2,8778
400 2,9682
500 3,0367
600 3,0917
700 3,1375
800 3,1768
900 3,2111
1000 3,2414
,1c
Fortschrittsbeiwertn
Zur Erinnerung
Von der linearen Theorie
zur nichtlinearen Theorie
lin
kug
Einfachste isotrope nichtlineare Funktion
Zur ErinnerungBergsteigen der Evolution
Qua
lität
/ Fitn
ess
Fittness-Landschaft
Kugelmodell
Er
.. .x x2 n
x1
q
N"'N
a
nnq 1
222 arqr
rarqa 2 2 für
2
a linKugel
rnc 2
2,1Kugel
a
"
Linien Fortschritt
N
Für q << r darf a auf x 1
projiziert werden
Mutation der Variablen x 2 bis x
n
Der bis auf x 1 mutierte
Nachkomme N‘ erleidet
den Rückschritt a
Eine geometrische Betrachtung für n >> 1
Wir drehen q um die x1-Achse so, dass q in der Bildschirmebene liegt
223
22 nxxxq
Wir sind frei in der Wahl des
Koordinatensystems. Deshalb
wählen wir die Koordinaten
so
Vergleich der theoretischen Ergebnisse am Kugelmodell
rn
rnr
n
882erf1
2
1) (18e
rnc 2
2,1) (1,
Die genauere Nachahmung der biologischen Evolution mit Nachkommen führt überraschend zu einer einfacheren Formel als die simple (1 + 1) -ES
rnc 2
2,1Kugel
Bestimmung von
022dd
,1
rnc n
rc ,1opt
opt
Bestimmung von max
nrc 2
2,1max
Dimensionsloser Fortschritt
22,1
maxmax*
crn
nrc ,1opt
Tabelle des maximalen Fortschritts 22,1
max*
c
2 0,15923 0,35814 0,52985 0,67626 0,8029
10 1,183920 1,743750 2,5292
100 3,14401000 5,2535
* max,1
parallel
Tabelle des maximalen Fortschritts 22,1
max*
c
2 0,1592 0,07963 0,3581 0,11944 0,5298 0,13255 0,6762 0,13526 0,8029 0,1338
10 1,1839 0,118420 1,7437 0,087250 2,5292 0,0506
100 3,1440 0,03141000 5,2535 0,0053
* max,1 /* max,1
parallel seriell
0,1352 Maximum
Optimale Erfolgswahrscheinlichkeit
8erf12
1 1,opt
cWe
2 0,1592 0,0796 0,3933 0,3581 0,1194 0,3414 0,5298 0,1325 0,3095 0,6762 0,1352 0,2866 0,8029 0,1338 0,269
10 1,1839 0,1184 0,22720 1,7437 0,0872 0,18150 2,5292 0,0506 0,135
100 3,1440 0,0314 0,1091000 5,2535 0,0053 0,053
* max,1 /* max,1 opt1,We
parallel seriell
0,1352
(1 + 1) - ES versus (1, ) - ES
Vergleich der maximalen Fortschrittsgeschwindigkeiten am Kugelmodell bei seriellem Arbeiten
nr 202,0max)11( n
r 513,0seriellmax)5,1(
max)11(seriellmax)5,1( 67,0
Das dimensionslose Fortschrittsgesetz
rnc 2
2,1Kugel
2,12 cr
n
2,1
2
22
,12,1 422
crn
crn
crn
mit
2
,12 crn
,12 crnund
folgt das zentrale Fortschrittsgesetz2
Dimensionslose Fortschrittsgeschwindigkeit
Dimensionslose Schrittweite
Text
-5 -3 -1 310
0,2
0,1
0,3
1 01 01 01 010
2
Evolutions Fenster
Text
Algorithmus der (1, ) – Evolutionsstrategie mit MSR
1g
1NE1N zxx gg
22NE2N zxx ggg
zxx gggNEN
eiltnormalvert)1,0(,, /21 nzzz n
ggNBE
1 xx )(),(),()( NN2N1NB minmax/ gggg QQQQ xxxx
ggNBE
1
1E1N gg
2E2N gg
ggEN
eiltnormalvert schlogarithmi
!
Die
Schr
ittwe
ite, d
ie m
ehr i
m Z
entru
m d
es E
volu
tions
fens
ters
lieg
t, üb
erle
bt!
1 2 31 2 1 3
w ( )
Logarithmische Normalverteilung
zew )(
z normalverteilt
Flächengleich
Methoden zur Erzeugung der Variationen
eiltnormalvertze
Für gerade (z. B. = 10)
521 /11076
Für durch 3 teilbar (z. B. = 9)
321 1654 /1987
Für beliebig (im Programmiermodus)
IF RND <.5 THEN i = ELSE i = 1/
Det
erm
inis
ieru
ng
Text
Determinisierte mutative Schrittweitenregelung am Kugelmodell
Computer-Demonstration
MATLAB-Programm der (1 + 1) ES
v=100; d=1; xe=ones(v,1); qe=sum(xe.^2);
for g=1:1000 xn=xe+d*randn(v,1)/sqrt(v); qn=sum(xn.^2); if qn < qe qe=qn; xe=xn; d=d*1.3; else d=d/(1.3^0.25); end semilogy(g,qe,'b.') hold on; drawnow;end
Zur Erinnerung
MATLAB-Programm der (1, ) ES
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
Variablenzahl, Nachkommenzahl,
Startschrittweite und
Variablen-werte des Start-
Elters
ones(m,n): Vektor/Matrix der Dimension m × n mit nur Einsen
Nur eine Spalte
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000
end
Erzeugen der Generationenschleif
e
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20;
end
Initialisierung der Qualität im
Bestwert-Zwischenspeicher
auf nicht verschlechterbaren
Wert
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk
end
end
Generierung der Nachkommenschlei
fe
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk if rand < 0.5 dn=de*1.3; else dn=de/1.3; end
end
end
Deterministische Variation der
Mutationsschrittweite
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk if rand < 0.5 dn=de*1.3; else dn=de/1.3; end xn=xe+dn*randn(v,1)/sqrt(v);
end
end
Erzeugung eines mutierten Nachkommen
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk if rand < 0.5 dn=de*1.3; else dn=de/1.3; end xn=xe+dn*randn(v,1)/sqrt(v); qn=sum(xn.^2);
end
end
Bestimmung der Qualität
des mutierten Nachkommen
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:10 if rand < 0.5 dn=de*1.3; else dn=de/1.3; end xn=xe+dn*randn(v,1)/sqrt(v); qn=sum(xn.^2); if qn < qb qb=qn; db=dn; xb=xn; end end
end
Bei Q -Verbesserung Zwischen-
speicherung der Qualität,
Schritt-weite und Variablenwerte
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk if rand < 0.5 dn=de*1.3; else dn=de/1.3; end xn=xe+dn*randn(v,1)/sqrt(v); qn=sum(xn.^2); if qn < qb qb=qn; db=dn; xb=xn; end end qe=qb; de=db; xe=xb;
end
Nachkomme aus dem
Bestwert-Zwischenspeicher
wird zum Elter der nächsten
Generation
MATLAB-Programm der (1, ) ES
v=100; kk=10; de=1; xe=ones(v,1);
for g=1:1000 qb=1e+20; for k=1:kk if rand < 0.5 dn=de*1.3; else dn=de/1.3; end xn=xe+dn*randn(v,1)/sqrt(v); qn=sum(xn.^2); if qn < qb qb=qn; db=dn; xb=xn; end end qe=qb; de=db; xe=xb; semilogy(kk*g,qe,'b.') hold on; drawnow;end
Darstellung der Qualität als
Funktion des seriellen
Aufwands Kinderzahl x
Generationen
Erproben des Programms in MATLAB
Kopieren Sie das Programm der vorangegangenen Folie. Öffnen Sie MATLAB und klicken Sie in der Taskleiste auf „File/New/Script“. Fügen Sie das Programm ein und klicken Sie auf das Symbol „Save and Run“ (Speichern).
Ändern Sie die Zahl der Kinder von 10 auf 5 [kk = 5] und die Zahl der Generationen von 1000 auf 2000 [g = 1 : 2000]. Ändern Sie die Kurvenfarbe von blau auf rot [semilogy(g,qe,′r.') ]. Sie werden mit der gleichen Zahl von Funktionsaufrufen g × kk = 10000 vielleicht etwas näher an das Optimum herankommen.
Wiederholen sie die Prozedur für:
[g = 1 : 3333], [kk = 3], [semilogy(g,qe,‚g.') ]
[g = 1 : 500], [kk = 20], [semilogy(g,qe,‚y.') ]
Das Ergebnis: Bei 5 Nachkommen [k = 1 : 5] sollten Sie bei der seriellen Arbeitsweise des Rechners dem Optimum (Nullpunkt) am nächsten kommen.
MATLAB R2010a
Drei Fragen zu Beginn eines ES-Experiments
1. Frage nach dem Startpunkt ?
2. Frage nach der Startschrittweite ?
3. Frage nach der Versuchsdauer ?
?)1( Ex
?)1( E
? g
Abgeschlossener Variablenraum
Abstand D zweier Zufallspunkte
im Quadrat im Hyperkubus
D sehr verschieden D nahezu konstant
Eine Zwischenbetrachtung
Theorie: Abstand zweier Zufallspunkte X und Y im Hyperkubus
6dd1 2
0
2
1 02
2 lnxyyxl
Dl
ykkkk
n
k
l
x
l
l
l
D
X
Y
2222
211 )()()( nn yxyxyxD
2222
211
2 )()()( nn yxyxyxD
6/nlD
Simulation im 600-dimensionalen Hyperwürfel der Kantenlänge l = 20
D1=198,23 D2=201,2
5 D3=199,61 D4=209,6
2 D5=205,05
Aus der Theorie „Abstand zweier Zufallspunkte und im Hyperkubus“ folgt
l
l
l
D
Wir wissen nicht wo das Ziel liegt, d. h. es kann an jeder Stelle mit gleicher Wahrscheinlichkeit liegen.
Start
Ziel
Wir nehmen eine isotrope Quadrik(= Kugelmodell) als Qualitätsfunktion im Suchraum des Hyperwürfels an
D = Start-Ziel -Entfernung
)((opt)Kugel Start Dr )()( (max)Kugel rr
Das Ziel kann dann als ein Zufallspunkt 1 aufgefasst werden.
Jeder Startpunkt ist gleich gut/schlecht. Wir starten deshalb auch an einem Zufallspunkt 2.
6/nl
Kantenlänge des Hyperwürfels = l
Zufallsstart
6,1)1( lcE
61ln2
2,1
c
ng
Dr mit
nrc ,1opt
ES-Suchschlauch im Kugelmodell
für n ≈ 900
rrn
ropt 25
190022412241 ,,
r
Die Geschwindigkeit ist an jeder Stelle bekannt, wenn die Schrittweitenregelung der Evolutionsstrategie richtig arbeitet.
Zur Ableitung der Generationsformel
gr
dd Es möge immer im Maximum laufen
nrcg
r2d
d 2,1 folgt
E
A
E
A
d121 2
,1g
g
r
r
gncrdr
)(2ln AEEA
2,1 ggn
crr
nllllr n 222
21 )()()(E
61ln2
2,1
c
ng
6/A nlr
Aus
Erlaubter relativer Fehler bezogen auf die Stelllänge
1)1()(
gg rr oder
Text
Genauigkeit
Ende
www.bionik.tu-berlin.de
In der Formel
ist die Fortschrittsgeschwindigkeit eine Funktion von der Variablenzahl n, dem Höhenlinien-Krümmungsradius r, der Mutationsstreuung und der Nachkommenzahl . Nur eine riesige Schar von Diagrammen könnte den Zusammenhang grafisch veranschaulichen.
In der dimensionslosen Form mit den universellen Parametern und ist der Zusammenhang in einem einzigen Diagramm darstellbar.
rnc 2
2,1Kugel
Das Fortschrittsfenster der Evolutionsstrategie am Kugelmodell hat eine allge-meinen Erkenntniswert. Man könnte, wenn auch politisch verdreht, wie folgt argumentieren: Rechts vom Evolutionsfenster sitzen die Revolutionäre und links davon die Erzkonservativen. Bei den Revolutionären gibt es Rückschritt, bei den Konservativen kommt es zu Stagnation. Sich für die richtige Schrittweite zu entscheiden; das ist die Kunst, die für den Politiker, Manager und Ingenieur gleichermaßen wichtig ist.
Die Verwendung von logarithmisch normalverteilten Zufallszahlen für die Schritt-weitenmutationen gewährleistet erstens, dass keine sinnlosen negativen Schritt-weiten entstehen können und dass zweitens multiplikative Symmetrie herrscht. Schrittweiten werden genauso häufig verdoppelt wie halbiert, genauso häufig verdreifacht wie gedrittelt usw.
Bei der Determinisierung der Schrittweitenmutationen wird diese multiplikative Symmetrie genau gleich auf die Nachkommen aufgeteilt.
Wer mit dem Auto von Berlin Frohnau zum Kurfürstendamm in Berlins Innenstadt fahren möchte und ausrechnen möchte, wie lange die Fahrt dauert, mussa) wissen, wie viele Kilometer es bis zum Kudamm sind undb) wissen, wie schnell auf jedem Streckenabschnitt gefahren werden kann.
Genauso ist es auch bei der Vorausberechnung der Generationszahl für eine ES-Optimierung. Die Entfernung zum Ziel ist bekannt: Es ist die Distanz zweier Zufallspunkte in einem Hyper-würfel als Suchraum, wenn voraussetzungsgemäß der Startpunkt zufällig gewählt wird, und wenn das Ziel - weil unbekannt - als zweiter Zufallspunkt interpretiert wird.
Es werde angenommen, dass der Suchraum durch eine isotrope Quadrikfunktion (Kugelmodell) ausgefüllt wird. Funktioniert die mutative Schrittweitenregelung, dann ist die Fortschrittsge-schwindigkeit der ES an jeder Position während der Zielannäherung bekannt ( = max).
Daraus folgt: Es lässt sich eine Mindestgenerationszahl für die Lösung des Optimierungspro-blems ausrechnen.