MODELE DE OPTIMIZARE PENTRU IDENTIFICAREA …digilib.utcb.ro/repository/ccn/pdf/jianu.pdf ·...
Transcript of MODELE DE OPTIMIZARE PENTRU IDENTIFICAREA …digilib.utcb.ro/repository/ccn/pdf/jianu.pdf ·...
UNIVERSITATEA TEHNICĂ DE CONSTRUCłII BUCUREŞTI
MODELE DE OPTIMIZARE
PENTRU IDENTIFICAREA PARAMETRILOR
HIDROGEOLOGICI
DOCTORAND:
MARILENA JIANU
CONDUCĂTOR ŞTIINłIFIC:
Prof. dr. ing. RADU DROBOT
BUCUREŞTI
2009
2
Doresc sa multumesc tuturor celor care, pe parcursul elaborarii tezei, m-au
sprijinit si m-au ajutat!
In mod special, doresc sa-i multumesc conducatorului meu stiintific, domnului
Profesor Radu Drobot, pentru entuziasmul si profesionalismul cu care m-a familiarizat
cu un domeniu nou pentru mine, pentru modul in care m-a indrumat si coordonat pe tot
parcursul acestor ani.
De asemenea, multumesc domnului Profesor Alain Dassargues si dr. Serge
Brouyère de la Universitatea din Liege, pentru sprijinul acordat in perioada petrecuta in
cadrul acestui laborator.
Multumesc colegilor din Catedra de Matematica a UTCB, in special domnului
Profesor Gavriil Paltineanu si domnului Profesor Ghiocel Groza, pentru toate sugestiile
la adresa elaborarii lucrarii şi pentru climatul de prietenie pe care l-am avut.
Multumesc, de asemenea, colegilor din Catedra de Constructii Hidrotehnice
pentru discutiile avute pe marginea lucrarii.
Multumesc familiei mele pentru sprijinul acordat si pentru rabdarea cu care au
suportat privatiunile perioadei de pregatire a doctoratului.
3
Cuprins
Introducere.....................................................................................................................5
1. Problema directa si problema inversa in hidrogeologie................................7
1.1. Ecuatiile curgerii subterane............................................................................7
1.2. Metode numerice de rezolvare.......................................................................10
1.3. Problema inversa. .........................................................................................14
1.4. Metode de parametrizare...............................................................................19
1.4.1. Zonarea...........................................................................................19
1.4.2. Interpolarea. Metoda punctelor pilot..............................................20
1.5. Metode de calibrare.......................................................................................27
1.5.1. Metode directe.................................................................................27
1.4.2. Metode indirecte..............................................................................29
2. Metode clasice de optimizare...............................................................................33
2.1. Introducere.....................................................................................................33
2.2. Metoda celei mai rapide descresteri..............................................................36
2.3. Metoda Gauss-Newton...................................................................................37
2.4. Metoda Levenberg-Marquardt......................................................................38
2.5. Metoda directiilor conjugate.........................................................................40
2.6. Metoda lui Newton.........................................................................................41
2.7. Metode cvasi-Newton.....................................................................................42
2.8. Calculul coeficientilor de senzitivitate..........................................................43
3. Tehnici de cautare globala...................................................................................45
3.1 Algoritmi genetici............................................................................................46
3.1.1. Introducere.......................................................................................46
3.1.2. Structura unui algoritm genetic.......................................................48
3.1.3. Reprezentarea cromozomiala..........................................................51
4
3.1.4. Operatorii genetici...........................................................................53
3.1.5. Parametrii de control ai unui algoritm genetic...............................60
3.2 Metoda calirii simulate...................................................................................62
3.2.1. Introducere.......................................................................................62
3.2.2. Structura algoritmului de calire simulata........................................63
3.2.3. Parametrii algoritmului de calire simulata.....................................65
4. Calibrarea unui acvifer sintetic (virtual) folosind tehnici de optimizare
neconventionale............................................................................................................66
4.1. Descrierea modelului.....................................................................................66
4.2. Structura algoritmilor utilizati......................................................................68
4.3. Calibrarea acviferului impartit in 2 zone.....................................................70
4.4. Calibrarea acviferului impartit in 4 zone.....................................................75
4.5. Concluzii........................................................................................................79
5. Identificarea parametrilor hidrogeologici pentru un acvifer real............80
5.1. Conul aluvionar al raului Somes. Modelul conceptual...............................80
5.2. Calibrarea acviferului folosind zonarea.......................................................88
5.3. Calibrarea acviferului folosind metoda punctelor pilot...............................93
5.4. Concluzii.......................................................................................................107
6. Concluzii. Contributii personale. Directii de cercetare..............................110
Bibliografie..................................................................................................................114
5
Introducere
Resursele de apa subterana constituie o sursa importanta de alimentare cu apa
necesara pentru consumul populatiei, sau pentru a fi utilizata in industrie si uneori si in
agricultura. Pentru estimarea acestor rezerve, dar si pentru a evalua corect raspunsul unui
acvifer la anumite solicitari sau la poluare este necesara crearea unor modele care sa
simuleze cat mai real procesele fizice din acvifer.
Curgerea apei subterane, ca si transportul substantelor poluante sunt procese ce
pot fi descrise prin intermediul unor ecuatii cu derivate partiale. Modelele matematice
utilizate pentru a descrie comportamentul acviferelor folosesc o serie de parametri,
variabili in spatiu, care au semnificatie fizica si care pot fi masurati doar local. Pentru
conductivitatea hidraulica, de exemplu, pot exista valori punctuale, calculate pe baza
testelor de pompare. Dar, intrucat aceste teste au o durata limitata si se bazeaza pe niste
supozitii simplificatoare (cum ar fi cea de omogenitate in jurul putului), rezultatele
testelor de pompare reflecta conditii locale si nu pot fi folosite cu succes in modelele
regionale.
De regula, parametrii hidrogeologici regionali sunt estimati pe baza valorilor
observate ale variabilei de stare, rezolvand problema inversa: mai precis, se cauta acea
distributie a parametrilor astfel incat valorile variabilei de stare calculate de modelul
matematic sa fie cat mai apropiate de cele observate. Tehnica de calcul a avansat extrem
de rapid si, in consecinta, s-au facut mari progrese in rezolvarea problemei directe, chiar
si in conditiile unui nivel ridicat de eterogenitate. Problema inversa ramane, insa, o
provocare din cauza complexitatii sistemelor hidrogeologice, precum si a insuficientei
datelor masurate.
Aceasta teza aduce o contributie la cunoasterea si aplicarea unor metode
matematice pentru identificarea parametrilor hidrogeologici.
6
Primul capitol contine formularea matematica a problemei inverse in
hidrogeologie. Sunt descrise principalele metode de parametrizare (zonarea si
interpolarea), precum si metodele de calibrare utilizate pana in prezent in hidrogeologie.
Identificarea parametrilor hidrogeologici revine la o problema de minimizare a unei
functii eroare. Aceasta problema de optimizare poate fi rezolvata fie prin metode clasice
de programare neliniara, fie prin metode neconventionale, cum ar fi metoda calirii
simulate sau algoritmii genetici.
In al doilea capitol sunt prezentate pe scurt cele mai importante metode clasice de
optimizare. Dintre acestea, metoda Levenberg - Marquardt a fost utilizata in realizarea
studiului de caz descris in capitolul 5.
Metodele de optimizare neconventionale au devenit foarte populare in ultimii ani
datorita capacitatii lor de a identifica minimul global al unei functii fara a utiliza
derivatele acesteia. In capitolul 3 sunt descrise doua dintre aceste metode – metoda calirii
simulate si algoritmii genetici – metode ce au fost aplicate pentru calibrarea unui acvifer
sintetic prezentat in capitolul 4.
Identificarea parametrilor hidrogeologici ai unui acvifer real, de mare
complexitate si avand un caracter transfrontalier – conul aluvionar al raului Somes – este
descrisa in capitolul 5. S-au utilizat doua metode de parametrizare: zonarea si metoda
punctelor pilot. Metoda punctelor pilot a fost aplicata crescand treptat dimensiunea
parametrizarii (numarul de puncte pilot) si s-a dovedit a furniza rezultate mai bune decat
zonarea. Totodata, este si mai naturala, deoarece se evita salturile bruste, neverosimile,
dintre doua celule alaturate.
Ultimul capitol contine concluziile generale ale lucrarii, contibutiile tezei la
problematica abordata, precum si propuneri pentru directiile viitoare de cercetare.
7
1. Problema directa si problema inversa in hidrogeologie
1.1 Ecuatiile curgerii subterane
Procesul de curgere al apei subterane, ca si procesul de transport al poluantilor,
pot fi descrise printr-o ecuatie cu derivate partiale in care necunoscuta (variabila de stare)
este sarcina hidraulica, ( )thh x,= , respectiv concentratia, ( )tCC x,= iar coeficientii sunt
parametri ai acviferului, distribuiti spatial. Aceasta ecuatie cu derivate partiale impreuna
cu conditiile de margine si conditia initiala (in problemele dependente de timp), formeaza
modelul matematic al procesului respectiv.
Ecuatiile ce modeleaza curgerea si, respectiv, transportul poluantilor in acvifere
pot fi formulate astfel:
( ) 01 =−∇⋅∇−∂∂≡ QhK
t
hSL s in [ ]Tt ,0×Ω (1.1)
( ) ( ) 02 =−−∇⋅∇−∂
∂≡ se
e QCCqCDnt
CnL in [ ]Tt ,0×Ω (1.2)
cu conditiile initiale:
( ) ( )x,x 00 hth = in Ω (1.3)
( ) ( )x,x 00 CtC = in Ω (1.4)
si conditiile la limita:
( ) hbhh hHnhK γξβ +−=⋅∇⋅ pe [ ]Tt ,0×Γ (1.5)
( ) ( ) CbCeC CCnCqCDn γξβ +−=⋅−∇⋅ pe [ ]Tt ,0×Γ (1.6)
unde: ( )thh x,= este sarcina hidraulica (cota piezometrica) [L]
( )tQQ x,= reprezinta termenul sursa/put (fluxul schimbat de acvifer cu exteriorul
(alimentarea din precipitatii, debitele exploatate) [T-1]
( )xss SS = este coeficientul de inmagazinare specifica [L-1].
( )xDD = este tensorul dispersiei hidrodinamice [L2/T]
( )tCC x,= este concentratia [M/L3]
8
( )xee nn = este porozitatea efectiva [-]
( ) hKtqq ∇−== x, este fluxul Darcy (viteza aparenta)[L/T]
( )tCC ss x,= reprezinta concentratia termenului sursa/put [M/L3]
3ℜ⊂Ω este domeniul spatial , avand frontiera Γ
[ ]Tt ,0 este domeniul temporal
( ) Ω∈= zyx ,,x este variabila spatiala
( )xKK = este tensorul conductivitatii hidraulice. De obicei se considera ca
directiile principale de anizotropie corespund axelor de coordonate :
=
z
y
x
K
K
K
K
00
00
00
.
O forma mai generala (dar mai putin utilizata) este:
=
zzzyzx
yzyyyx
xzxyxx
KKK
KKK
KKK
K .
Coeficientii γξβ ,, din ecuatiile (1.5) si (1.6) variaza de-a lungul frontierei, in
functie de tipul conditiilor de margine. Intr-un punct x de pe frontiera aceste conditii pot
fi:
a) de tip Dirichlet (cota hidraulica impusa), cand 0,0 == γβ
b) de tip Neumann (flux impus), cand 0=ξ
c) de tip Cauchy (Fourier, mixte), cand toti coeficientii sunt nenuli. Sunt folosite
pentru a simula curgerea printr-o limita semipermeabila (de ex. stratul
semipermeabil dintre un rau si acvifer):
( ) ( ) ( )d
tHthKtq r
bn
−−= ,x,x
unde ( )tH r reprezinta nivelul raului, bK este conductivitatea hidraulica a stratului
semipermeabil dintre rau si acvifer, d reprezinta grosimea stratului semipermeabil.
9
Observatie. Ecuatia de curgere (1.1) poate fi scrisa intr-o forma simplificata daca se
admit anumite ipoteze, cum ar fi cea de stationaritate sau Ipoteza Dupuit-Forcheimer,
care transfera problema intr-un domeniu bi-dimensional .
Curgerea in regim permanent (stationara)
Daca variatiile in timp ale sarcinii hidraulice sunt reduse, regimul de miscare se
poate considera independent de timp, sau permanent: ( )xhh = . Din modelul matematic
dispare conditia initiala, iar ecuatia de curgere se scrie tinand cont de faptul ca derivata in
raport cu timpul este nula 0=∂∂
t
h:
( ) 0=+∇⋅∇ QhK
sau, echivalent,
0=+
∂∂
∂∂+
∂∂
∂∂+
∂∂
∂∂
Qz
hK
zy
hK
yx
hK
x zyx (1.7)
Ipoteza Dupuit – Forcheimer
Atunci cand dimensiunile orizontale ale acviferului sunt mult mai mari decat
grosimea acestuia, curgerea poate fi considerata orizontala (adica 0=∂∂z
h). Integrand pe
verticala pentru acvifere captive ecuatia (1.1) se obtine ecuatia bidimensionala (1.8) (care
poate fi folosita si pentru acvifere cu nivel liber daca variatia nivelului in raport cu
inaltimea zonei saturate este redusa):
t
hSq
y
hT
yx
hT
x yx ∂∂=+
∂∂
∂∂+
∂∂
∂∂
(1.8)
pentru regimul tranzitoriu, respectiv,
0=+
∂∂
∂∂+
∂∂
∂∂
qy
hT
yx
hT
x yx (1.9)
pentru regimul permanent, unde:
Tx , Ty reprezinta transmisivitatea pe directia x si, respectiv, y [L2T-1]
S reprezinta coeficientul de inmagazinare [-].
10
1.2. Metode numerice de rezolvare
Aceste ecuatii cu derivate partiale pot fi rezolvate analitic sau numeric. Avantajul
rezolvarii analitice este ca furnizeaza o solutie exacta, relativ simplu de obtinut. Dar,
pentru o rezolvare analitica, este necesar ca proprietatile hidrogeologice ale acviferului,
ca si geometria acestuia, sa fie mult idealizate / simplificate. Pentru cele mai multe cazuri
reale beneficiul obtinerii unei solutii analitice exacte este anulat de erorile introduse prin
ipotezele ce simplifica in mod nerealist conditiile hidrogeologice deosebit de complexe.
Problemele in care metodele analitice sunt inadecvate pot fi rezolvate numeric,
obtinandu-se o solutie aproximativa. Principalele metode numerice folosite in
hidrogeologie sunt metoda diferentelor finite si metoda elementului finit. Acestea
discretizeaza domeniul impartindu-l intr-un numar de subdomenii numite celule,
respectiv, elemente. Parametrii acviferului se considera constanti in interiorul unei celule
(element). Variabila de stare continua, este aproximata prin intermediul unor valori
discrete, definite in anumite puncte (numite noduri). Astfel, ecuatia cu derivate partiale ce
defineste sarcina hidraulica / concentratia in fiecare punct al domeniului spatio-temporal
este transformata intr-un numar finit de ecuatii algebrice in care necunoscutele sunt
valorile variabilei de stare in noduri, la diferite momente de timp. Evident, aproximarea
solutiei reale este cu atat mai exacta cu cat discretizarea este mai fina, deci cu cat
numarul de noduri este mai mare, altfel spus, cu cat dimensiunea sistemului de ecuatii
liniare rezultat este mai mare. In general, aceste sisteme se rezolva prin aplicarea unor
metode numerice iterative.
Ambele metode prezinta avantaje si dezavantaje. Metoda diferentelor finite este
mai simpla (din punct de vedere matematic) si mai usor de transcris intr-un cod de
programare. Metoda elementului finit are avantajul ca reteaua de discretizare este mai
flexibila (decat cea rectangulara din MDF), putand aproxima mai exact limita
domeniului, ca si zonele cu gradient hidraulic ridicat.
Deosebirea fundamentala intre cele doua metode este aceea ca metoda
elementelor finite se bazeaza pe aproximarea functiei necunoscute (sarcina hidraulica sau
concentratia), in timp ce metoda diferentelor finite este bazata pe aproximarea derivatelor
acestei functii. Metoda diferentelor finite calculeaza valoarea variabilei de stare in fiecare
11
nod de calcul, aceasta reprezentand o valoare medie pentru celula respectiva. Nu se face
nici o ipoteza privind variatia variabilei de stare in cadrul celulei. Metoda elementului
finit calculeaza, de asemenea, valorile variabilei de stare in noduri (care sunt varfurile
elementelor), dar, pe baza acestor valori, defineste o aproximare a variabilei de stare
continua pe intreg domeniul spatial Ω.
Metoda diferentelor finite (utilizata de programul utilizat in studiul de caz,
MODFLOW (Mc Donald & Harbaugh, 1988)) foloseste o discretizare spatiala regulata:
celulele sunt paralelipipede / cuburi (in cazul tridimensional). Centrele paralelipipedelor
reprezinta nodurile de calcul. Metoda diferentelor finite calculeaza valoarea variabilei de
stare in fiecare nod, aceasta reprezentand o valoare medie pentru celula respectiva.
Dimensiunile celulei de calcul pot varia de la o celula la alta (de exemplu, discretizarea
poate fi mai fina in regiunea puturilor de exploatare). Parametrii acviferului se considera
constanti in interiorul unei celule.
Prezentam, in cele ce urmeaza, metoda diferentelor finite aplicata ecuatiei de
curgere in regim permanent (1.7), pentru o retea rectangulara in care dimensiunea
celulelor pe directia x, y, si respectiv, z este constanta: x∆ , y∆ , z∆ .
Fig.1.1. Celula (i,j,k) impreuna cu celulele invecinate (Mc Donald & Harbaugh, 1988)
12
Pentru fiecare nod de calcul (i,j,k) din domeniu, ecuatia (1.7) se scrie aproximand
derivatele partiale prin diferente finite (centrate) dupa formula:
x
xxf
xxf
dx
df
∆
∆−−
∆+≈ 22
Aplicand (de doua ori) formula de mai sus pentru derivatele in raport cu x, y si z,
se obtine:
( ) xx
hhK
x
hhK
x
hK
x
kjikjikji
kjikjikji
kji
x ∆∆−
⋅−∆
−⋅
≈
∂∂
∂∂
−−
++
,,1,,,,21
,,,,1,,21
,,
( ) yy
hhK
y
hhK
y
hK
y
kjikjikji
kjikjikji
kji
y ∆∆−
⋅−∆
−⋅
≈
∂∂
∂∂
−−
++
,1,,,,21,
,,,1,,21,
,,
( ) zz
hhK
z
hhK
z
hK
z
kjikjikji
kjikjikji
kji
z ∆∆−
⋅−∆
−⋅
≈
∂∂
∂∂
−−
++
1,,,,21,,
,,1,,21,,
,,
In relatiile de mai sus, ( )kjikji zyxhh ,,,, = reprezinta valoarea sarcinii hidraulice in
nodul de calcul (i,j,k), iar kjiK ,21, + reprezinta conductivitatea de legatura intre celulele
(i,j,k) si (i,j+1,k) (calculata de obicei ca o medie armonica a conductivitatilor in celulele
respective invecinate). Revenind la ecuatia (1.7) si inlocuind derivatele partiale prin
formulele de aproximare se obtine o ecuatie liniara in care necunoscutele sunt valorile
sarcinii hidraulice in nodul de calcul (i,j,k) si in nodurile invecinate:
,..,,,, ,1,,1,,,1,,1,, kjikjikjikjikji hhhhh +−+− :
( ) ( ) ( ) ( )
( ) ( ) kjikjikjikji
kjikjikji
kjikjikji
kjikjikji
kjikjikji
kjikjikji
qhhz
Khh
z
K
hhy
Khh
y
Khh
x
Khh
x
K
,,,,1,,2
21,,,,1,,2
21,,
,,,1,2
,21,,,,1,2
,21,,,,,12
,,21,,,,12
,,21
−=−∆
+−∆
+−∆
+−∆
+−∆
+−∆
−−
++
−−
++
−−
++
De unde rezulta:
13
kjikjikji
kjikji
kjikji
kjikji
kjikji
kjikji
kjikjikjikjikjikjikji
qhz
Kh
z
Kh
y
Kh
y
Kh
x
K
hx
Kh
z
K
z
K
y
K
y
K
x
K
x
K
,,1,,2
21,,1,,2
21,,,1,2
,21,,1,2
,21,,,12
,,21
,,12
,,21,,2
21,,
2
21,,
2
,21,
2
,21,
2
,,21
2
,,21
=⋅∆
−⋅∆
−⋅∆
−⋅∆
−⋅∆
−
−⋅∆
−⋅
∆+
∆+
∆+
∆+
∆+
∆
−−
++
−−
++
−−
++−+−+−+
Scriind aceasta ecuatie pentru fiecare nod (i,j,k) (in care nu sunt definite conditii
de margine) si renumerotand celulele "interne" ale domeniului cu un singur indice:
N,,m K21= , se obtine un sistem de N ecuatii cu N necunoscute:
mNmNmm qhahaha =++ K2211 , N,m 1=
in care coeficientii mna care sunt nenuli se calculeaza pe baza conductivitatilor celulare,
iar termenii liberi, mnq , reprezinta schimbul celulei k cu exteriorul (incluzand si conditii
de margine, daca este cazul). Sistemul se scrie in forma matriceala:
[ ] QhA =
[ ] ( ) N,n,mmnaA 1== este o matrice rara, simetrica, de tip banda: termenii sai nenuli se
afla pe diagonala principala si pe inca 6 diagonale paralele cu aceasta.
( )TNh,h,hh K21= este vectorul sarcinilor hidraulice in fiecare nod
( )TNq,q,qQ K21= reprezinta vectorul debitelor schimbate de fiecare celula cu
exteriorul.
Rezolvarea acestui sistem liniar se poate face prin metode directe (cum ar fi
descompunerea LU) sau prin metode iterative (Jacobi, Gauss-Seidel, metoda gradientilor
conjugati). Solutia gasita prin metodele directe ar trebui sa fie, teoretic, solutia exacta a
sistemului. Practic insa, pentru sisteme „mari” (peste 50 de necunoscute), erorile de
rotunjire se acumuleaza si altereaza substantial solutia. De aceea, se prefera utilizarea
metodelor iterative de rezolvare. Aceste metode pornesc de la o aproximare initiala, 0h ,
care este „imbunatatita” printr-o relatie de recurenta, la fiecare iteratie, pentru a se
apropia cat mai mult de solutia exacta, ∗h . Programul MODFLOW utilizeaza o varianta
a Metodei gradientilor conjugati: "Preconditioned Conjugate Gradient" (Hill, 1990).
14
1.3 Problema inversa
Presupunem ca problema depinde de parametrul ( )xθθ = (in cazul in care exista
mai multi parametri necunoscuti, θ va reprezenta un vector de functii spatiale). Se
noteaza cu ( )tuu x,= variabila de stare (sarcina hidraulica h, pentru ecuatia (1.1),
respectiv, concentratia C, in cazul ecuatiei de transport (1.2)).
Problema directa consta in rezolvarea ecuatiei cu derivate partiale (1.1) sau (1.2)
cunoscand conditiile de margine. Relatia de dependenta dintre solutia problemei directe
u si parametrul θ poate fi descrisa cu ajutorul unui operator sub forma: ( )θF=u .
Rezolvarea analitica este posibila numai in cazuri foarte simple, cum ar fi
curgerea unidimensionala in regim stationar (Mc Laughlin & Townley, 1996) :
( ) [ ]Lxdx
dhxK
dx
d,0 , 0 ∈=
(1.10)
cu conditiile la limita: ( ) 00 hh = si ( ) Qdx
dhxK
Lx
==
(1.11)
Solutia problemei (1.10) – (1.11) este functia ( ) ( )∫+=x
K
dQhxh
0
0 ξξ
Problema inversa
In cazul simplu discutat mai sus, se observa ca operatorul F,
[ ]( ) [ ]( ) ( ) [ ] LxxhLhL ,0 ,0' ,0C,0L:F 12 ∈∀≠∈→ , ( ) hK =F , este inversabil: adica,
cunoscand sarcina hidraulica in fiecare punct, ( )xh , se poate calcula parametrul ( )xK a.i.
sa se verifice (1.10) – (1.11): ( ) ( ) [ ]Lxxh
QxK ,0 , ∈∀
′= .
Acesta este, insa, doar un exemplu teoretic, nu poate fi un caz real. In cele mai
multe cazuri, rezolvarea analitica este practic imposibila si se impune folosirea metodelor
numerice ce transforma ecuatia cu derivate partiale (1.1) sau (1.2) intr-un sistem de
ecuatii liniare (modelul direct, de simulare). Solutia acestui sistem furnizeaza o
aproximare convenabila a variabilei de stare, ( )tuu x,= .
15
Variabila de stare ( )tuu x,= nu este cunoscuta pe intreg domeniul. Practic, numai
un numar finit de valori pot fi cunoscute (masurate). Se noteaza cu ( )Tnuuuu ,,, 21 K=
vectorul valorilor variabilei de stare care pot fi masurate in diferite puncte, la diferite
momente ( ) [ ]Ttnobs ,,, 021 ×Ω∈= ξξξξ K .
Solutia aproximativa data de modelul direct poate fi evaluata comparand valorile
calculate ale variabilei de stare, ( ) ( )( )obsobscalc uu ξθξ F== , cu cele observate, obsu . In
cazul ideal, cand proprietatile sistemului se cunosc cu exactitate, ar trebui ca valorile
calculate sa coincida cu cele observate. In realitate acest lucru este imposibil deoarece:
-ecuatiile liniare la care se ajunge in urma discretizarii sunt doar aproximari ale
fenomenului fizic real;
-caracteristicile sistemului (geometria acviferului, conditiile la limita, debitele
schimbate cu exteriorul, parametrii hidrogeologici) nu se cunosc cu exactitate si/sau au
un grad de complexitate prea ridicat, care nu poate fi reprodus de model; in cele mai
multe cazuri, se recurge la idealizari care simplifica realitatea;
-valorile observate, obsu , contin, inevitabil, erori de masurare.
Deoarece functia ( )tu x, nu este cunoscuta, ci se cunosc doar un numar finit de
valori observate, este convenabila introducerea unui alt operator, F~
, care exprima
vectorul ( )Tn
calc uuuu ,,, 21 K= in functie de parametrul (vectorul de parametri) θ :
( ) ( )( ) ( )θξθξ F~
F === obsobscalc uu , Uad →Θ:F~
,
unde adΘ reprezinta spatiul functiilor parametrice admisibile, ( )xθ , iar nU ℜ⊂ este
spatiul valorilor observate ale variabilei de stare.
Problema inversa (calibrarea modelului) consta in inversarea acestui operator, mai
precis, in identificarea parametrilor hidrogeologici (a distributiei lor spatiale pe domeniul
studiat), cunoscand conditiile pe frontiera si dispunand de un set de valori masurate ale
variabilei de stare, obsu . In cazul ideal, cand modelul matematic reproduce cu exactitate
fenomenul fizic, iar valorile observate sunt masurate exact, solutia problemei inverse este
functia ( ) adΘ∈= θθθ ,x a.i.
16
( )θF~=obsu (1.12).
Pentru ca o problema inversa sa fie „corect-pusa” (in sensul lui Hadamard) aceasta
trebuie sa satisfaca urmatoarele cerinte (Mc Laughlin & Townley,1996):
1) Pentru orice vector de valori observate ale variabilei de stare ( )Tn
obs uuuu ,,, 21 K=
exista o solutie parametrica ( ) adΘ∈= xθθ .
2) Solutia respectiva este unica.
3) Problema inversa este stabila: perturbatii mici in vectorul observatiilor determina
schimbari nesemnificative asupra solutiei parametrice.
O problema „incorect-pusa” poate fi transformata intr-o problema „corect-pusa”
prin restrictionarea multimii functiilor parametrice admisibile, adΘ , adica prin
parametrizare.
Folosirea metodelor numerice pentru rezolvarea problemei directe impune ca
parametrul ( )xθ sa ia numai valori discrete. Cel mai simplu ar fi sa consideram adΘ ca
fiind multimea functiilor de forma ℜ→Ω:θ , ( ) iθθ =x pentru Niei ,1 , x =∈ (unde N
este numarul elementelor de discretizare, ie ). Problema inversa se reduce astfel la
identificarea necunoscutelor Nii ,1 , =θ . Din cauza numarului relativ mic de valori
observate ale variabilei de stare, problema inversa formulata astfel nu este „corect-pusa” :
este instabila (variatii mici ale datelor de intrare modifica substantial solutia) si nu are
solutie unica. Se impune, deci, reducerea numarului de necunoscute (numarul gradelor de
libertate ale parametrului necunoscut ( )xθ ) astfel incat acesta sa nu depaseasca numarul
observatiilor. Procesul de exprimare a proprietatilor hidraulice ale acviferului printr-un
numar relativ mic de parametri („parametrii modelului” – necunoscutele care trebuie
identificate rezolvand problema inversa) se numeste parametrizare (Carrera et al, 2005).
Exista mai multe metode de a reduce numarul parametrilor, dar acestea pot fi grupate in
doua categorii: zonarea si interpolarea.
17
O formula generalizata de parametrizare pentru caracterizarea unui parametru
distribuit ( ) Ω∈= x,xθθ este (Mc Laughlin & Townley,1996):
( ) ( )∑=
=m
jjjp
1
xx φθ (1.13)
unde: m reprezinta dimensiunea parametrizarii (gradul de complexitate);
mjjp,1=
este un set de coeficienti (parametrii modelului). De exemplu, in cazul
zonarii, jp este valoarea parametrului in regiunea jΩ ; in cazul interpolarii, jp este
valoarea parametrului in punctul jx ;
( ) mjj ,1
x,=
φ este un set de functii de baza.
Formula (1.13) poate fi scrisa in urmatoarea forma discreta:
pG ⋅=θ (1.14)
unde: Nℜ∈θ reprezinta vectorul valorilor parametrului θ in cele N noduri de calcul ;
mp ℜ∈ reprezinta vectorul coeficientilor jp (parametrii modelului);
( )mjniijgG,1,1
=== reprezinta o matrice mn× ce defineste structura parametrizarii:
( )ixjijg φ= , (xi reprezinta locatia nodului i.) Ni ,,1K= .
De exemplu, in cazul in care se foloseste zonarea, vom avea:
Ω∉Ω∈
=j
j
ij ,
,g
i
i
xdaca 0
xdaca 1
Fie nmadP ℜ→ℜ⊂:ϕ ( )mn ≥ functia care modeleaza dependenta dintre
vectorul parametrilor modelului, p si vectorul valorilor variabilei de stare in punctele de
observatie, u:
( ) ( )pGp ⋅= F~ϕ (1.15)
In urma parametrizarii, problema inversa (1.12) se scrie in forma:
( ) obsup =ϕ (1.16)
18
Hidrogeologii nu isi propun rezolvarea exacta a ecuatiei (1.16) (ar fi un scop
nerealist, avand in vedere aproximarile / simplificarile facute pentru realizarea modelului
matematic, precum si numarul relativ mic si distributia neadecvata a valorilor observate),
ci gasirea unei aproximari convenabile a solutiei. Calibrarea consta, deci, in aflarea unui
set de parametri mp ℜ∈∗ care, o data introdusi in modelul direct, furnizeaza valori ale
variabilei de stare ( )∗= pucalc ϕ cat mai apropiate de cele observate, obsu . Altfel spus,
ecuatia (1.16) se scrie intr-o forma „realista” astfel:
( ) εϕ += puobs (1.17),
iar scopul calibrarii este minimizarea componentelor vectorului eroare, ε .
Aceasta este problema inversa clasica, in care atat dimensiunea (m) cat si
structura parametrizarii (data de matricea G) se presupun cunoscute (pe baza
informatiilor a priori asupra parametrului distribuit) si se cere identificarea vectorului
necunoscut, mp ℜ∈∗ pentru care diferentele intre valorile calculate si cele masurate ale
variabilei de stare sa fie minime.
Problema inversa extinsa (Sun & Sun, 2002) isi propune sa identifice, pe baza
datelor observate, nu numai vectorul optim al parametrilor modelului, p, ci si
dimensiunea m si structura G optime. Pentru aceasta, pentru fiecare K,2,1=m se
determina perechea optima ( )mm pG , , crescand treptat gradul de complexitate
( ) ( ) ( ) KK →→→→ mm pGpGpG ,,, 2
21
1
Procesul este oprit atunci cand se observa ca nu se mai pot extrage noi informatii
din datele observate existente: marirea dimensiunii parametrizarii nu mai reduce in mod
semnificativ eroarea, determinand, in schimb cresterea incertitudinii parametrilor
(masurata prin urma matricei de covarianta).
19
1.4. Metode de parametrizare
1.4.1. Zonarea
Zonarea este cea mai simpla si cea mai folosita metoda de parametrizare.
Domeniul Ω este impartit intr-un numar de zone (regiuni) jΩ considerate omogene, iar
functia ( )xθ se considera constanta pe portiuni. Dimensiunea parametrizarii, m, este
egala cu numarul de zone. Coeficientii jp reprezinta valoarea parametrului in regiunea
jΩ . Functiile de baza se definesc astfel:
( )
Ω∉Ω∈
=j
jj x,0
x,1xφ
Foarte simpla si usor de aplicat, zonarea are, totusi, un neajuns: numarul si forma
zonelor sunt greu de stabilit. In ultimii ani s-au facut cateva incercari de gasire a unor
tehnici de zonare automata.
Astfel, Sun & Sun [2002] au descris o procedura simpla de tip ″arbore de
regresie″, in care structura zonarii este imbunatatita in mod gradat :
KK →→→ mSSS 21 ,
unde 1S este o structura omogena, 2S este formata din doua zone, etc. Structura 1+mS se
obtine din mS impartind o zona din mS in doua subzone (se alege zona j cea mai
„senzitiva” la datele observate: zona in care jp
E
∂∂
este max.). Procedeul se repeta pana la
indeplinirea unui criteriu de oprire.
Tsai et al [2003] au dezvoltat o metoda de zonare automata cu ajutorul
poligoanelor Voronoi (Thiessen) determinate (in mod unic) de o multime de puncte,
numite puncte de baza. Poligonul Voronoi asociat punctului de baza nx , m,n 1= se
defineste astfel :
( ) ( ) ( ) m,l,nl,x,xdx,xdxxVo lnn 1 =≠∀<Ω∈=
20
Problema determinarii zonelor se reduce astfel la gasirea coordonatelor punctelor de baza
si poate fi rezolvata prin includerea acestora in vectorul variabilelor de decizie.
Fig. 1.2. Poligoane Voronoi
1.4.2. Interpolarea. Metoda punctelor pilot
Metoda punctelor pilot (de Marsily et al, 1984) este o metoda de parametrizare
bazata pe interpolare. Parametrii modelului (necunoscutele ce trebuie determinate in
cadrul procesului de optimizare) sunt valorile parametrului hidrogeologic θ intr-un
numar de puncte stabilite de utilizator, numite „puncte pilot”. Pentru restul domeniului,
parametrii hidrogeologici sunt calculati prin interpolare. Exista doua variante de
interpolare utilizate de PEST (programul Parameter ESTimation (Doherty et al, 2002)
utilizat in studiul de caz): Kriging si Inverse distance weighted.
Metoda de interpolare Inverse distance weighted (IDW), sau metoda lui Shepard
(1968), se bazeaza pe supozitia ca valoarea functiei intr-un punct este influentata mai ales
de nodurile de interpolare mai apropiate, si mai putin de cele mai indepartate. Valoarea
interpolata este o medie ponderata a valorilor functiei in nodurile de interpolare, iar
ponderea unui nod este cu atat mai mare cu cat acesta este mai apropiat de punctul
respectiv.
21
Daca m21 x,...,x,x sunt nodurile de interpolare ( ( )iii yx ,x = , mi ,1= ) si
( )ixθ=ip , mi ,1= reprezinta valorile parametrului hidrogeologic θ in aceste puncte (θ
poate fi conductivitatea hidraulica, K(x), sau alimentarea prin percolare, R(x) ), atunci
valoarea lui θ intr-un punct oarecare, ( )xθ , se calculeaza ca o medie ponderata a
valorilor ( ) ( ) ( ) m21 x,...,x,x θθθ , astfel :
( ) ∑=
=m
iii pw
1
xθ , unde
∑=
−
−
= m
j
kj
ki
i
d
dw
1
,
iar id reprezinta distanta de la x la ix : ( ) ( )22x-x iiii yyxxd −+−== . De obicei se
ia k = 2:
∑=
=m
j j
ii
d
dw
1
2
2
1
1
In GMS se foloseste pentru ponderile iw o formula care s-a dovedit ca furnizeaza
rezultate mai bune (Franke & Nielson, 1980):
∑=
−
−
=m
j j
j
i
i
i
Rd
dR
Rd
dR
w
1
2
2
,
unde R reprezinta distanta de la punctul x la cel mai indepartat nod de interpolare.
Interpolarea Kriging (Matheron, 1971, de Marsily et al, 1984) considera
parametrul hidrogeologic ( )xθ un camp aleator care trebuie estimat in fiecare punct al
domeniului plecand de la datele “observate” ( ) ( ) ( ) m21 xxx θθθ ,...,, in punctele pilot x1,
22
x2,…,xm . Valorile ( ) m,jp j 1 , x j == θ reprezinta parametrii modelului, care trebuie
determinati in cadrul procesului de calibrare.
Se porneste de la urmatoarele ipoteze:
• Media se presupune constanta: ( )[ ] µθ =xE ("ordinary kriging")
• Covarianta depinde numai de distanta intre puncte:
( ) ( )( ) ( )( )[ ] ( ) 212121 x-xh unde ,hxxx,x ==−−= CECov µθµθθ
Mai intai trebuie determinata structura acestei functii astfel incat corelatia dintre
( )1xθ si ( )2xθ este cu atat mai mica cu cat distanta dintre cele doua puncte 21 x-xh =
este mai mare. De obicei se lucreaza cu (semi)variograma ( )hγ in locul functiei de
covarianta:
( ) ( ) ( )( )[ ]2xhx2 θθγ −+= Eh
Legatura dintre cele doua functii este data de formula (1.18):
( ) ( )( )[ ]( )
( )( )[ ]( )
( )( ) ( )( )[ ]( )
⇒
−−+−−+−+=4444 34444 214434421444 3444 21
hCCC
EEEh µθµθµθµθγ xhx2xhx21
0
2
0
2
( ) ( ) ( )hCCh −=⇒ 0γ (1.18)
unde ( ) ( )( )[ ] ( )θµθ VarEC =−+= 2hx0 reprezinta varianta.
Cele mai folosite tipuri de variograma sunt :
1) Variograma exponentiala: ( ) ( )heh αλγ −−= 1
2) Variograma Gaussiana: ( ) ( )( )2
1 heh αλγ −−=
3) Variograma sferica: ( )
>
≤
−=αλ
αλλ
λγh
hhh
h
,
,3
2
13
23
a) b)
c)
Fig. 1.3. Tipuri de variograme: a) exponentiala; b) gaussiana; c) sferica
(de Marsily et al, 1984)
Pentru a alege modelul cel mai potrivit de variograma se construieste mai intai
variograma experimentala, discreta, pe baza valorilor ce urmeaza a fi interpolate:
( ) ( ) ( ) m21 xxx θθθ ,...,, :
( ) ( ) ( ) ( )( )( )
∑≤<≤
−=hNji
jihNh
1
2xx1
2 θθγ
unde ,...2,1,0 , =⋅= klkh , iar ( )hN reprezinta numarul perechilor de puncte ( )ji x,x cu
proprietatea ca distanta dintre ele este in intervalul [ ]lhh +, .
24
Fig. 1.4. Exemplu de variograma experimentala (de Marsily et al, 1984)
Valoarea estimata a parametrului intr-un punct din domeniu, x0 se calculeaza ca o
combinatie liniara a valorilor « observate » ( ) ( ) ( ) m21 x,...,x,x θθθ :
( ) ( )∑=
=m
iii
10 xxˆ θλθ (1.19)
unde ( ) miii ,1,x0 == λλ reprezinta un set de ponderi care se determina astfel incat sa fie
indeplinite urmatoarele conditii:
• 11
=∑=
m
iiλ
• Eroarea ( ) ( ) ( )000 xxˆx θθ −=e sa aiba media 0 si varianta minima:
( )[ ] 0x0 =eE
( )( ) ( ) ( )( ) minxxˆxvar2
000 →
−= θθEe
De aici rezulta ca estimatorul kriging ( )xθ este "cel mai bun estimator liniar nedeplasat"
(Best Linear Unbiesed Estimator) (Kitanidis & Vomvoris, 1983).
Ponderile mii ,1 , =λ in punctul 0x se determina rezolvand o problema de
extrem conditionat:
h
( )hγ
25
( ) ( )
=
−
∑
∑
=
=
m
ii
m
iiiE
1
2
01
1
xxmin
λ
θθλλ
Utilizand definitia lui ( )0xθ (1.19) si conditia ∑=
=m
ii
1
1λ , se obtine:
( )( ) ( ) ( )( ) ( ) ( )
( )( ) ( )( ) ( )( )[ ]
( )( ) ( )( )[ ] ( )( ) ( )( )[ ] ( )( )[ ]20
10
1
1
222
01
2
01
2
000
xxx2xx2
xxx
xxxxˆxvar
µθµθµθλµθµθλλ
µθλµθµθλ
θθλθθ
−+−−−−−+
+−=
−−−=
=
−=
−=
∑∑
∑∑
∑
=≤<≤
==
=
EEE
EE
EEe
m
iii
mjijiji
m
iii
m
iii
m
iii
Folosind functia de covarianta, ( )hC , rezulta:
( )( ) ( ) ( ) ( ) ( ) min0xx2xx20xvar1
011
20 →+−−−+= ∑∑∑
=≤<≤=
CCCCem
iii
mjijiji
m
ii λλλλ
Introducand multiplicatorul Lagrange, λ , problema revine la determinarea
punctului de extrem pentru functia
( ) ( ) ( ) ( ) ( )
−+−−−+= ∑∑∑∑==≤<≤=
12xx2xx20,,,min11
011
21
m
ii
m
iii
mjijiji
m
iim CCCF λλλλλλλλλ K
Pentru a determina punctul de minim al acestei functii, derivatele partiale de
ordinul I se egaleaza cu 0:
( ) ( )
012
1
0xxxx21
1
01
=−=∂∂⋅
=+−−−=∂∂⋅
∑
∑
=
=
m
ii
iji
m
jj
i
F
CCF
λλ
λλλ
Rezulta ca mλλλ ,,, 21 K , ponderile combinatiei liniare (1.19), se determina rezolvand
un sistem de ecuatii liniare (“sistemul kriging”):
26
=+++=+++
=+++=+++
121
2211
22222121
11212111
m
mmmmmm
mm
mm
CCCC
CCCC
CCCC
λλλλλλλ
λλλλλλλλ
KKKKK
K
KKKKKKKKKKKKK
K
K
(1.20)
unde ( ) mjiCC jiij ,1, ,xx =−= si ( ) miCC ii ,1 ,xx 0 =−= .
Acest sistem poate fi scris utilizand variograma in locul functiei de covarianta. Utilizand
relatia (1.18) rezulta:
( ) ( ) ( )( ) ( ) ( ) miCCC
mjiCCC
i
not
iii
ij
not
jijiij
,1 ,xx0xx
,1, ,xx0xx
00 ==−−=−=
==−−=−=
γγ
γγ
Iar sistemul kriging (1.20) se poate scrie in forma matriceala astfel:
=
−
−−−
101111
10
10
10
10
3
2
1
3
2
1
321
33231
22321
11312
mmmmm
m
m
m
γ
γγγ
λλ
λλλ
γγγ
γγγγγγγγγ
KK
K
K
KKKKKK
K
K
K
Metoda punctelor pilot este mai naturala decat zonarea (deoarece parametrii
hidrogeologici nu au salturi bruste de la o celula la alta) si este mai putin subiectiva (nu
necesita stabilirea zonelor de catre utilizator). Flexibilitatea si acuratetea acestei metode a
fost pusa in evidenta de LaVenue & Pickens [1992], RamaRao et al [1995], Hernandez
et al [2003].
27
1.5. Metode de calibrare
Calibrarea manuala („Trial and error”)
Calibrarea manuala este metoda „traditionala” de calibrare si consta in ajustarea
succesiva a vectorului parametrilor pana cand diferentele intre valorile calculate calch si
cele observate obsh devin nesemnificative. Avantajul acestei metode (simpla si foarte
mult utilizata, mai ales in problemele cu un numar mic de parametri) este ca procesul de
calibrare este in permanenta controlat si directionat de experienta hidrogeologica.
Dezavantajul este ca necesita foarte mult timp, mai ales in cazul problemelor cu un
numar mare de parametri, si nu ofera nici o garantie ca solutia gasita reprezinta cea mai
buna aproximare.
Calibrarea automata
Consta in folosirea unor procedee matematice (transcrise intr-un cod de
programare) pentru a calcula solutia problemei inverse (1.17). Neuman [1973] a impartit
metodele de calibrare automata in doua categorii: metode directe si metode indirecte.
1.5.1. Metode directe
Metodele directe sunt primele tehnici de calibrare automata folosite pentru
rezolvarea problemei inverse in hidrogeologie. Sarcina hidraulica se presupune cunoscuta
pe intreg domeniul (fiind obtinuta pe baza hartii cu hidroizohipse), iar ecuatia curgerii se
transforma intr-o ecuatie cu derivate partiale de ordinul I in transmisivitate. Prin
discretizarea domeniului, se ajunge la un sistem de ecuatii liniare din care parametrii
modelului (valorile parametrului in fiecare element de discretizare) se pot afla direct, fara
a folosi un proces iterativ. Dezavantajul acestei metode este ca necesita interpolari si
chiar extrapolari (bazate pe „expert judgement”) pentru a estima valorile sarcinii
hidraulice in nodurile retelei, introducandu-se astfel aproximatii care dau un anumit grad
de incertitudine solutiei gasite. De asemenea, solutia este instabila: mici modificari ale
28
datelor de intrare obsh provoaca perturbatii importante in vectorul solutiei calculate, ∗p
(Carrera & Neuman, 1986).
Pentru a evita instabilitatea, Drobot [1983, 1990] a folosit o metoda directa
transformand problema inversa intr-o problema de programare liniara, minimizand o
functie eroare. Domeniul (bidimensional) este discretizat folosind metoda diferentelor
finite si se presupun cunoscute valorile sarcinii hidraulice, jH , in centrele celulelor.
Considerand regimul de curgere permanent, se scrie bilantul (intrari – iesiri) pentru
fiecare celula Nj ,1= si se pune conditia ca neinchiderea de debit sa fie minima:
( ) ∑=
−=N
jjj bAZ
1
min (1.21)
unde jA reprezinta schimbul celulei j cu celulele invecinate (si este termenul ce contine
necunoscutele: ijT , - transmisivitatile de legatura intre celule), iar jb (constant) reprezinta
schimbul cu exteriorul. Introducand variabilele suplimentare 0≥jy a.i. jjj ybA ≤− se
obtine o problema de programare liniara:
( )
≤−≥+
=∑×
=
jjj
jjj
nm
jj
byA
byA
yZ1
min
(1.22)
Yeh et al [1983] au dezvoltat o metoda directa pentru identificarea transmisivitatii
intr-un acvifer sintetic, considerand regimul de curgere nepermanent. Parametrul
necunoscut a fost aproximat prin metoda elementelor finite : ( ) ( )∑=
=m
iii yxvTyxT
1
,, , unde
miTi ,1 , = reprezinta valorile nodale ale transmisivitatii (necunocutele care trebuie
determinate), iar ( ) miyxvi ,1 , , = reprezinta un set de functii de baza bilineare pe
elemente rectangulare. Valorile nodale ale sarcinii hidraulice (este vorba de nodurile de
calcul pentru modelul de simulare – realizat cu metoda diferentelor finite) sunt estimate
folosind metoda geostatistica ( interpolarea kriging).
29
1.5.2. Metode indirecte
Metodele indirecte se bazeaza pe minimizarea unei functii obiectiv, cea mai
utilizata fiind suma patratelor diferentelor intre valorile calculate si cele observate ale
variabilei de stare, u:
( ) ( ) ( ) ( ) ( )( ) ( )( )obsTobsobsn
i
obsi
calci upupupuupE −−=−=−=∑
=
ϕϕϕ1
2min (1.23)
Se numesc „metode indirecte” deoarece problema inversa formulata astfel devine o
problema de optimizare ce trebuie rezolvata iterativ, prin simulari repetate. In esenta,
metodele indirecte sunt o versiune automata a procedurii de calibrare manuala.
Observatii:
1. In cazul in care calitatea observatiilor difera, trebuie folosita o suma ponderata,
observatiile mai „sigure” (mai exact masurate) primind o pondere mai mare. De
asemenea, se impune folosirea ponderilor in cazul in care se folosesc observatii de
diferite tipuri (de ex: debite / sarcini hidraulice), pentru ca observatiile cu ordin de
magnitudine mai mare sa nu domine procesul de optimizare:
( ) ( ) ( ) ( )( ) ( )( )obsTobsn
i
obsi
calcii upWupuuwpE −−=−=∑
=
ϕϕ1
2min (1.24)
unde W este o matrice diagonala ce contine ponderile, wj .
2. Folosind o functie obiectiv de forma (1.23) sau (1.24) problema devine
adesea „gresit pusa”: solutia nu este unica, seturi diferite de parametri genereaza valori
aproape similare ale functiei obiectiv (Carrera et al, 2005). Pentru a depasi aceste
probleme, Neuman (1973) a adaugat functiei obiectiv un „termen de plauzibilitate”, pE :
( ) pu EEE λ+=min (1.25)
unde ( ) ( )( ) ( )( )obsu
Tobsu upWuppE −−= ϕϕ , ( ) ( ) ( )00 ppWpppE p
T
p −−= (1.26)
30
3. Ecuatiile (1.23) – (1.25) pot fi obtinute si prin metode statistice, matricea
ponderilor reprezentand in acest caz inversa matricei de covarianta a erorilor (Carrera &
Neumann, 1986; Sun & Sun, 2002).
Metode statistice pentru estimarea parametrilor
Reluam ecuatia (1.17) care descrie relatia intre vectorul observatiilor, obsu , si
vectorul parametrilor modelului madPp ℜ⊂∈ :
( ) εϕ += puobs
Unde vectorul ε inglobeaza atat eroarea de masurare, cat si cea de modelare.
Considerand variabile aleatoare atat parametrii modelului, cat si valorile variabilei
de stare in punctele de observatie, pot fi aplicate cateva principii statistice de baza.
Se vor folosi urmatoarele notatii :
• ( )pf0 este densitatea de repartitie a priori a lui p (considerata fie omogena, fie
normala).
• ( ) ( )obsupfpf =∗ este densitatea de repartitie a posteriori a lui p , dandu-se
valorile observate ale variabilei de stare, obsu .
• ( ) ( )pufpL obs= este functia de verosimilitate a observatiilor (densitatea de
repartitie a lui obsu dandu-se vectorul parametrilor estimati, p ).
Din teorema lui Bayes avem :
( ) ( ) ( ) ( )( ) ( )
( ) ( )pfpcLdppfpuf
pfpufupfpf
obs
obsobs
0
0
0 ===∫Ω
∗ (1.27)
unde c este o constanta:
( ) ( )∫Ω
=dppfpuf
cobs
0
1 (1.28)
Considerand vectorul erorilor normal distribuit cu media 0 si matricea de covarianta εV ,
functia de verosimilitate se scrie :
31
( ) ( ) ( ) ( )( ) ( )( )
−−−= −−− obsTobsn upVupVpL ϕϕπ εε1212
2
1expdet 2 (1.29)
Estimatorul maxim a posteriori (MAP) este
( )( ) ( )( ) ( ) ( )( )pfpLpfpfp 0lnlnmin arglnmin argmax arg −−=−== ∗∗ˆ (1.30)
a) Daca distributia a priori este omogena,
( ) ( )
∈=
restin ,0
1
0UL PPp
Vpf ,, (1.31)
atunci estimatorul dat de (1.30) este, de fapt, estimatorul de verosimilitate maxima :
( )( ) ( )( ) ( )( )obsTobs upVuppLp −−=−= − ϕϕ ε1min arglnmin arg ˆ (1.32)
(termenul ( )pf0ln− din (1.30) este constant).
Daca componentele lui ε (erorile) sunt independente unele de altele, atunci
obtinem urmatorul estimator (cele mai mici patrate ponderate):
( )( ) ( )( )obsTobs upWupp −−= ϕϕmin arg ˆ (1.33)
unde W e o matrice diagonala avand elementele 22
221
1,
1,
1
nσσσK .
Iar daca toate variantele 2iσ sunt egale, atunci putem folosi estimatorul uzual « cele mai
mici patrate » :
( )( ) ( )( )obsTobs upupp −−= ϕϕmin arg ˆ (1.34)
b) Daca se presupune ca vectorulp are o distributie a priori gaussiana m-
dimensionala, de medie 0p si matrice de covarianta pV (se pot aplica, eventual, o serie
de transformari : de exemplu, se stie ca logarimul conductivitatii hidraulice, lnk este
normal distribuit), densitatea de repartitie a priori se scrie astfel :
( ) ( ) ( ) ( ) ( )
−−−= −−− 0102120 2
1expdet 2 ppVppVpf p
T
pmπ (1.35)
In acest caz, trebuie adaugat functiei obiectiv termenul ( )pf0ln− (« termen de
regularizare »), iar estimatorul din (1.30) se scrie sub forma:
32
( )( ) ( )( ) ( ) ( ) 0101min arg ppVppupVupp p
TobsTobs −−+−−= −− ϕϕ ε (1.36)
Daca IV 2σε = si IVp2τ= (erorile sunt independente si de variante egale) atunci :
( )( ) ( )( ) ( ) ( ) 00min arg ppppupuppTobsTobs −−+−−= λϕϕ (1.37),
unde 2
2
στλ = se numeste factor de regularizare.
Problema de optimizare propusa de metoda celor mai mici patrate (clasica,
ponderata sau regularizata) poate fi rezolvata folosind fie metode « traditionale » de
programare neliniara, fie tehnici de cautare globala care sunt mai robuste (avand
capacitatea de a evita oprirea la un optim local) si nu necesita calculul derivatelor functiei
obiectiv. Dezavantajul metodelor de cautare globala este ca au nevoie de un numar mare
de evaluari ale functiei obiectiv, adica de rulari ale modelului de simulare, fiind destul de
“costisitoare” din punctul de vedere al timpului de calcul.
33
2. Metode clasice de optimizare folosite in rezolvarea problemei
inverse
2.1. Introducere
Problema de optimizare considerata este de forma (1.23). (Pentru a scrie mai usor
derivatele functiei obiectiv s-a introdus factorul suplimentar ½, care nu schimba cu nimic
natura problemei) :
( ) ( ) ( ) ( ) ( ) ( )pFpFpFuupE Tn
i
obsi
calci 2
1
2
1
2
1min
2
1
2 ==−= ∑=
(2.1)
unde nmadPF ℜ→ℜ⊂: ,
( ) ( ) ( ) obsobscalc upupupF −=−= ϕ (2.2)
Metodele clasice de cautare a optimului folosesc un proces iterativ: plecand de la
o solutie initiala (un set initial de parametri, p0 ) se construieste, prin iteratii succesive, un
sir de vectori ( ) 0≥kkp care tinde catre un punct de optim local,∗p (fara a avea garantia ca
acesta este un optim global). Procesul iterativ este definit de o relatie de forma :
0 , 1 ≥+=+ kdpp kk
kk α (2.3)
unde : mkd ℜ∈ este un vector care reprezinta directia deplasarii
ℜ∈kα este un scalar care determina « lungimea pasului » in directia kd .
Atunci cand un anumit criteriu de convergenta este respectat, cautarea inceteaza si
ultimul punct gasit este considerat ca fiind setul optim de parametri. Directia deplasarii
la fiecare iteratie, kd , se calculeaza folosind gradientul functiei obiectiv, motiv pentru
care aceste metode se mai numesc « metode de gradient ». Metodele care necesita si
matricea hessiana pentru a calcula kd (putin utilizate deoarece sunt laborioase) se
numesc metode de ordinul II.
Gradientul functiei E in punctul p este calculat cu formula:
( ) ( ) ( )pFpJpE T=∇ (2.4)
34
unde ( )mjnij
i
p
upJ
,1,1
==
∂∂= reprezinta matricea Jacobiana a functiei ϕ (evident, si a functiei
F definita de relatia (2.2)). Derivatele partiale ale variabilei de stare in raport cu
parametrii modelului, j
i
p
u
∂∂
, se numesc coeficienti de senzitivitate. In cele ce urmeaza se
vor folosi urmatoarele notatii :
( )kk pFF = , ( )k
k pJJ = , ( )kk pEG ∇=
Fig. 2.1. Schema unei metode de programare neliniara
Initializare 0: pp = , 0:=k
Se rezolva problema directa folosind codul de simulare
( )kcalc pfu =:
Se calculeaza functia obiectiv 2
2
1 obscalc uuE −= si E∇
Se verifica un criteriu de oprire
Nu
Se actualizeaza parametrii k
kkk dp:p α+=+1
1+= k:k
Solutia optima kpp =*
Se calculeaza kd si kα
Da
35
Algoritmul general al unei metode de programare neliniara :
1. Se alege o solutie initiala 0p ; 0:=k .
2. Se rezolva problema directa pentru setul de parametri curent kp , apeland
programul de simulare. Se calculeaza vectorul valorilor variabilei de stare in
punctele de observatie, ( )kk pu ϕ= , functia obiectiv ( )kpE , matricea Jacobiana
( )kk pJJ = si gradientul functiei obiectiv, ( ) k
Tk
kk FJpEG =∇= .
3. Se calculeaza directia deplasarii, kd , precum si scalarul kα si se actualizeaza
parametrii cu formula (2.3)
4. Se verifica daca este indeplinit un anumit criteriu de oprire. Daca se indeplineste
criteriul de convergenta, procesul se opreste si se considera ca setul optim de
parametrii este 1: +∗ = kpp ; daca nu, atunci 1: += kk si se continua cu pasul 2.
Criteriul de oprire este de obicei reprezentat de una din conditiile:
( ) ( )( ) 1
1
ε<−+
k
kk
pE
pEpE sau/ si 2
1
ε<−+
k
kk
p
pp (Drobot, 1990)
sau 3ε<kG
Metodele clasice de optimizare difera intre ele prin modul de alegere a directiei
deplasarii kd . In urmatoarele subcapitole sunt prezentate cateva din metodele folosite in
prezent pentru rezolvarea problemei inverse in hidrogeologie.
36
2.2. Metoda celei mai rapide descresteri (Metoda gradientului optimal)
Se stie ca gradientul unei functii intr-un punct reprezinta un vector normal
hipersuprafetei f(x)=const. si orientat in sensul celei mai rapide cresteri a functiei.
Antigradientul (gradientul cu semn schimbat) este orientat in sensul celei mai rapide
descresteri, deci poate fi folosit in procesul de minimizare. Metoda celei mai rapide
descresteri foloseste antigradientul ca directie a deplasarii ( )kk
k pEGd −∇=−= , iar
procesul iterativ este definit de relatia:
kkkk Gpp α−=+1 , 0≥k (2.5)
unde kα minimizeaza functia (de o singura variabila) ( ) ( )kk GpE ααϕ −= :
( )αϕαα
min arg0≥
=k
Daca se foloseste formula lui Taylor (pastrand termenii de grad < 2) pentru a
aproxima functia F intr-o vecinatate a punctului kp :
( ) kkkkk GJFGpF αα −≈− , (2.6)
atunci ( )αϕ este aproximata printr-o functie de gradul II :
( ) ( ) ( ) kkTk
Tkkk
Tkk
Tkk
kT
kk GJJGGJFFFGpFGpF
22
1
2
1 2αααααϕ +−≈−−= (2.7)
Punctul in care ( )αϕ isi atinge minimul este ( ) kTkk
Tk
kTkk
Tk
kFJJF
FJJF2
=α .
Convergenta acestei metode poate fi extrem de lenta, mai ales in problemele in
care parametrii sunt foarte corelati. In astfel de situatii suprafata functiei obiectiv prezinta
in regiunea optimului o “vale” ingusta, iar aplicarea metodei celei mai rapide descresteri
duce la fenomenul “hem-stitching”: in cadrul procesului iterativ, vectorul parametrilor
face “salturi” dintr-o parte in alta a “vaii” ( Doherty et al, 2002).
37
2.3. Metoda Gauss-Newton
Meoda Gauss-Newton se bazeaza pe aproximarea liniara a functiei F intr-o
vecinatate a punctului curent,kp :
( ) ( ) ( ) ( )ττττ kkkkkk lJFpJpFpF ≡+=+≈+ (2.8)
Astfel, functia obiectiv ( )pE poate fi aproximata in vecinatatea lui kp printr-o
forma patratica:
( ) ( ) ( ) ( )ττττ kkkT
kkk LJFJFpE ≡++≈+
2
1 (2.9)
( ) ττττ kTk
Tk
Tkk
Tkk JJJFFFL
2
1
2
1 ++= (2.10)
Gradientul formei patratice ( )τkL este:
( ) kT
kkTkk JFJJL +=∇ ττ (2.11)
Observam ca hessiana lui ( )τkL , ( ) kTkL JJH
k=τ este simetrica, independenta de
τ. Daca mJk = rang ( nm ≤ ) atunci kTk JJ este pozitiv definita. In consecinta, kL are
un unic punct de minim, kτ , care se afla rezolvand sistemul de ecuatii normale 0=∇ kL :
kkTk
kk
Tk GFJJJ −=−=τ (2.12)
Directia deplasarii la iteratia k este data de vectorul
( ) kTkk
Tk
k FJJJ1−−=τ (2.13)
iar procesul iterativ este descris de relatia
kk
kk pp τα+=+1 , 0≥k (2.14)
In metoda Gauss-Newton originala se ia 1=kα la fiecare iteratie. O alta varianta
este de a alege scalarul kα care minimizeaza functia de o variabila ( ) ( )kkpE αταϕ += .
38
2.4. Metoda Levenberg-Marquardt
Metoda Levenberg-Marquardt poate fi privita ca o combinatie intre metoda
Gauss-Newton si metoda celei mai rapide descresteri. Este cunoscuta si ca metoda Gauss-
Newton-Marquardt, sau metoda Gauss-Newton modificata. Atunci cand solutia curenta
kp este departe de punctul de optim, Metoda Levenberg-Marquardt se comporta ca
metoda gradientului optimal : este lenta, dar converge garantat. Cand vectorul kp se
apropie de solutia exacta, ea devine o metoda Gauss-Newton.
In cazul in care mJk < rang matricea kTk JJ nu mai este pozitiv definita si atunci
sistemul (2.12) poate avea o solutie kτ a .i. 0, <− kk Gτ , solutie care va directiona
procesul iterativ in sensul cresterii functiei: ( ) ( )kkk pEpE >+τ .
In ciuda faptului ca antigradientul kG− defineste directia celei mai rapide
descresteri, se poate arata ca metoda Gauss-Newton da rezultate mai bune, mai ales in
situatiile in care parametrii sunt foarte corelati. Totusi, cele mai multe probleme au de
castigat din ajustarea deplasarii kτ astfel incat sa fie mai aproape de directia celei mai
rapide descresteri in stadiile initiale ale procesului iterativ. Matematic, acest lucru se
poate realiza printr-o strategie de alterare a elementelor de pe diagonala principala a
sistemului de ecuatii normale (2.12) sugerata de Levenberg (1944) si Marquardt (1963).
Procesul iterativ este de forma :
kkk pp τ+=+1 (2.15),
unde kτ este solutia sistemului de ecuatii normale augmentate :
( ) kkTk
kk
Tk GFJIJJ −=−=+ τλ (2.16)
Marquardt (1963) a inlocuit matricea identica, I, cu o matrice diagonala:
( )( ) kkTk
kk
Tkk
Tk GFJJJdiagJJ −=−=⋅+ τλ (2.17)
Parametrul λ se numeste parametru Marquardt si introducerea lui are urmatoarele
efecte:
39
a) Matricea coeficientilor sistemului (2.16) este pozitiv definita pentru orice
0>λ , deci vom avea 0<− kk G,τ , ceea ce ne asigura ca solutia sistemului este o
directie in care functia descreste.
b) Pentru valori mari ale lui λ vom avea un pas (de lungime mica) in directia
celei mai rapide descresteri :
kk G
λτ 1−≈ .
c) Pentru valori mici ale lui λ , pasul deplasarii, kτ , va avea o directie foarte
apropiata de cea din Metoda Gauss Newton, o directie adecvata in ultimele iteratii.
Valoarea parametrului λ variaza in cursul procesului itereativ. Alegerea valorii
initiale 0: λλ = e legata de magnitudinea elementelor matricei 00 JJT (de ex. se poate lua
iiamax0 ελ = unde 1..10 3−=ε ).
La fiecare iteratie se rezolva sistemul (2.16) sau (2.17), se actualizeaza vectorul
parametrilor cu formula (2.15) si se calculeaza functia obiectiv, E.
a) Daca functia obiectiv descreste, atunci actualizarea parametrilor este
acceptata si se reduce parametrul λ impartindu-l cu 1>ν : νλλ =: .
b) Daca actualizarea parametrilor determina o crestere a functiei obiectiv,
atunci se mareste parametrul λ pentru ca directia deplasarii sa se
apropie mai mult de directia celei mai rapide descresteri. Acest lucru
are loc prin inmultiri repetate cu acelasi factor, ν : kλνλ ⋅=: , pana cand
se obtine o descrestere a functiei obiectiv.
Datorita faptului ca este deosebit de robusta, Metoda Levenberg-Marquardt este
folosita de majoritatea codurilor de calibrare : PEST, UCODE, MODFLOWP.
40
2.5. Metoda directiilor conjugate
Metoda directiilor conjugate necesita doar o modificare simpla a metodei
gradientului optimal, avand o crestere spectaculoasa a ratei de convergenta datorita
faptului ca utilizeaza atat gradientul functiei obiectiv in punctul curent, ( )kk pEG ∇= cat
si directia precedenta de cautare, kd .
Procesul iterativ este cel obisnuit:
0 , 1 ≥+=+ kdpp kk
kk α
Directia initiala, 0d , este directia celei mai rapide descresteri:
( ) 000 GpEd −=−∇=
Scalarii pozitivi kα se aleg, la fiecare iteratie, astfel incat sa minimizeze functia in
directia kd :
( ) ( ) ( )kkk dpEα ααϕαϕ +== unde ,min arg
Directia deplasarii la iteratia k, kd , este o combinatie liniara a gradientului in
punctul respectiv, ( ) ( )kkk pEpGG ∇== , si a directiei precedente, 1−kd :
11
−−+−= k
kkk dGd β (2.18)
Metoda Fletcher - Reeves foloseste pentru scalarul kβ formula :
2
1
2
11 −−−
==k
k
kTk
kTk
kG
G
GG
GGβ
Se poate arata ca, daca functia obiectiv este o forma patratica, atunci vectorii
110 −≤ mk,d,...,d,d k sunt liniar independenti, iar punctul de minim este determinat cu
exactitate in cel mult m iteratii.
41
2.6. Metoda lui Newton
Metoda lui Newton este o metoda de ordinul II care se bazeaza pe aproximarea
patratica a functiei obiectiv ( )pE in vecinatatea punctului curent,kp , folosind formula
lui Taylor:
( ) ( ) ( ) ( ) ( ) ( )kk
TkkTk
kk ppHppppGpEpqpE −−+−+=≈
2
1 (2.19)
unde ( ) ( )mji
k
ji
kk p
pp
EpHH
,1,
2
=
∂∂∂== reprezinta matricea hessiana a functiei ( )pE ,
calculata in punctul curent, kp .
Daca kH este pozitiv definita, atunci forma patratica ( )pqk isi atinge minimul in
punctul
kkkk GHpp 11 −+ −= (2.20)
Directia deplasarii, kkk GHd 1−−= se calculeaza de obicei rezolvand sistemul
kkk GdH −= (2.21)
In metoda lui Newton modificata se foloseste un scalar pozitiv, kα , care ajusteaza
lungimea pasului a.i. sa minimizeze functia ( )pE in directia deplasarii, kd :
kkkk dpp α+=+1
cu ( )αk ϕα min arg= , unde ( ) ( )kkk dpE ααϕ +=
Metoda lui Newton converge foarte rapid, dar este si foarte laborioasa deoarece la
fiecare iteratie trebuie calculate nu numai derivatele partiale de ordinul I, ci si cele de
ordinul II.
42
2.7. Metode cvasi-Newton
Aceste metode sunt algoritmi care folosesc schema iterativa din Metoda lui
Newton, dar fara a calcula efectiv matricea hessiana. Aceasta este aproximata, folosind
derivatele partiale de ordinul I, printr-o matrice simetrica pozitiv definita, kH~
.
Metoda Broyden-Fletcher-Goldfarb-Shano este una din cele mai cunoscute
metode cvasi-Newton. Procesul iteratriv este definit de formula :
kkkk dpp α+=+1 ,
unde directia deplasarii, kd se determina rezolvand sistemul
kkk GdH −=~ (2.22).
Sirul de matrice kH~
se construieste cu urmatoarea formula de recurenta :
kkTk
kkTk
Tk
kTk
Tkk
kksHs
HssH
sy
yyHH ~
~~~~
1 −+=+ (2.23)
Matricea initiala 0
~H este o matrice simetrica pozitiv definita, de obicei se alege IH =0
~.
Scalarii 0≥kα se determina dupa metoda de mai sus, astfel incat sa minimizeze functia
in directia deplasarii : ( )αk ϕα min arg= , unde ( ) ( )kkk dpE ααϕ += .
43
2.8. Calculul coeficientilor de senzitivitate
Functia obiectiv ( )pE ce trebuie minimizata pentru rezolvarea problemei inverse
nu are o expresie analitica ; ea este calculata la fiecare iteratie ruland modelul de simulare
cu setul de parametri curent. Metodele de programare neliniara descrise mai sus necesita,
la fiecare iteratie, calculul gradientului ( )pE∇ in punctul curent, kpp = , ceea ce este
echivalent (conform relatiei (2.4)) cu a calcula matricea Jacobiana : ( )mjnij
i
p
upJ
,1,1
==
∂∂= .
Pentru a determina coeficientii de senzitivitate j
i
p
u
∂∂
putem folosi urmatoarele metode :
a) Aproximarea prin diferente finite (metoda folosita de PEST)
Derivatele partiale pot fi aproximate folosind diferente finite astfel :
( ) ( )j
ijji
j
i
h
puehpu
p
u −+≈
∂∂
, mjni ,1,,1 == (2.24)
unde incrementul (perturbatia) jh este proportionala cu valoarea lui jp :
jj ph λ= , 1.0..01.0=λ .
Pentru a obtine coeficientii de senzitivitate sunt necesare 1+m rulari ale modelului de
simulare (independent de numarul de observatii).
Aproximarea prin diferente finite introduce, in mod inevitabil, anumite erori
care pot fi micsorate (dar nu evitate) prin folosirea diferentelor finite centrate (dar in acest
caz sunt necesare 12 +m rulari ale modelului de simulare).
b) Metoda ecuatiilor de senzitivitate
Prin derivarea ecuatiei (1.1) (respectiv, (1.2)) in raport cu parametrul jp se
ajunge la o ecuatie in care functia necunoscuta este derivata variabilei de stare in raport
cu jp . Aceasta ecuatie se numeste „ecuatie de senzitivitate” si are aceeasi structura cu
ecuatia originala, deci poate fi rezolvata folosind aceeasi rutina. De exemplu, derivand
ecuatia de curgere (1.1), se obtine:
44
01 =+
∂∂∇⋅∇−
∂∂
∂∂=
∂∂
jjj
sj
Qp
hK
p
h
tS
p
L ~ [ ]Tt ,0×Ω (2.25)
unde jjj
sj p
Qh
p
K
t
h
p
SQ
∂∂+
∇
∂∂⋅∇−
∂∂
∂∂=~ .
Conditiile initiale si pe frontiera se obtin si ele derivand conditiile de margine
(1.3) , (1.4).
Pentru a obtine coeficientii de senzitivitate trebuie rulat modelul de simulare de
1+m ori (o data pt rezolvarea problemei originale). Aproximarea coeficientilor de
senzitivitate prin aceasta metoda este mai exacta decat aproximarea prin diferente finite,
unde rezultatul depinde, in mare masura, de alegerea perturbatiilor hj.
45
3. Tehnici de cautare globala
Solid fundamentate matematic, metodele de programare neliniara prezentate in
capitolul anterior pot fi aplicate unor functii obiectiv „ideale” – adica derivabile, cu
derivatele continue (care, insa, se intalnesc rareori in problemele practice de optimizare).
Principiul de functionare este acelasi: se porneste de la o solutie initiala admisibila si, la
fiecare iteratie, se cauta o noua solutie in vecinatatea solutiei curente, pana la indeplinirea
unui criteriu de oprire. Pentru a stabili directia si lungimea pasului deplasarii la fiecare
iteratie, trebuie calculat gradientul functiei obiectiv (ceea ce duce la cresterea timpului de
calcul), dar principalul dezavantaj al metodelor traditionale de optimizare este faptul ca
nu asigura decat convergenta la un optim local. Pentru a mari sansele de gasire a
optimului global (fara a avea garantia obtinerii lui), procesul iterativ trebuie executat de
mai multe ori, plecand din diferite puncte initiale.
Functia eroare ce trebuie minimizata pentru a calibra un model hidrogeologic este,
de cele mai multe ori, multimodala: aflarea minimului global implica realizarea unui
compromis intre doua obiective contradictorii: exploatarea celor mai bune solutii
disponibile la un moment dat (cautarea locala) si explorarea robusta a spatiului
solutiilor posibile (cautarea globala). Daca accentul cade pe exploatarea celor mai bune
solutii (ca in cazul metodelor de tip gradient) se atinge o convergenta prematura (procesul
se opreste la un minim local). Dimpotriva, daca procesul de cautare se bazeaza doar pe
explorarea aleatoare a spatiului solutiilor, neglijand exploatarea informatiei obtinuta
anterior (cazul cautarii pur aleatoare), timpul de calcul creste foarte mult, facand practic
imposibila aflarea optimului global.
Tehnicile de optimizare globale („neconventionale”), prin accentul pus pe
explorarea spatiului solutiilor, reprezinta o buna alternativa la metodele clasice de
programare neliniara pentru rezolvarea problemei inverse in hidrogeologie. In acest
capitol sunt prezentate doua din cele mai utilizate tehnici neconventionale: algoritmii
genetici si metoda calirii simulate.
46
3.1. Algoritmii genetici
3.1.1. Introducere
Algoritmii genetici (AG) sunt strategii de cautare bazate pe mecanismul selectiei
naturale si ereditatii, care realizeaza un echilibru aproape optimal intre explorarea si
exploatarea spatiului solutiilor (Holland, 1975, Goldberg, 1989). Un algoritm genetic
construieste, la fiecare iteratie, nu o singura solutie, ci o "populatie" de solutii posibile
("indivizi"), explorand spatiul din mai multe puncte simultan. In general, cei mai buni
indivizi au tendinta sa se reproduca si sa supravietuiasca in generatia urmatoare, dar si
indivizi inferiori pot supravietui, evitandu-se in acest fel convergenta prematura la un
optim local. Cu succesiunea generatiilor, se poate spera ca populatia va contine indivizi
din ce in ce mai "performanti" (mai apropiati de solutia optima).
Folosirea algoritmilor genetici in problemele de optimizare prezinta urmatoarele
avantaje (fata de metodele clasice de programare neliniara):
• spatiul de cautare poate fi continuu, dar si discret
• nu este necesar ca functia obiectiv sa fie derivabila, nici macar continua si
poate fi oricat de complexa (multimodala)
• nu necesita calculul gradientului functiei obiectiv
• datorita faptului ca la fiecare iteratie lucreaza cu o populatie de solutii
posibile (in loc de o singura solutie, ca metodele traditionale), pot furniza
o multime de puncte „aproape-optimale” in locul unei solutii unice
Principalul lor dezavantaj este faptul ca sunt relativ „costisitori” din punct de
vedere al timpului de calcul, deoarece necesita un numar mare de evaluari ale functiei
obiectiv, evaluare care, in cazul problemei estimarii parametrilor hidrogeologici, se face
prin rularea modelului direct de curgere si / sau transport de poluanti. In ultimul deceniu
au aparut numeroase studii care demonstreaza posibilitatea de a depasi acest dezavantaj,
evitand apelarea codului de simulare pentru calculul functiei directe ( )pϕ (functia care
calculeaza valorile variabilei de stare in functie de vectorul parametrilor p). O aproximare
robusta a functiei directe poate fi realizata cu ajutorul retelelor neuronale artificiale
(Rogers & Dowla, 1994; Yan & Minsker, 2004).
47
Primele aplicatii in hidrogeologie ale algoritmilor genetici au fost in domeniul
gospodaririi, remedierii si monitorizarii apelor subterane, acest lucru datorandu-se in
parte abilitatii AG de a trata problemele multiobiectiv. Remedierea unui acvifer
contaminat se poate face cu ajutorul unui sistem de puturi de extractie si de injectie prin
care apa subterana poluata este extrasa apoi re-introdusa in acvifer dupa ce a fost tratata.
Problema este de a gasi configuratia de puturi de cost minim care sa asigure remedierea
acviferului (sau de a gasi solutii optime de compromis intre costul si eficienta sistemului),
folosind ca variabile de decizie debitele puturilor (de extractie sau de injectie) si,
eventual, locatia acestor puturi (intr-o forma discreta sau continua). Algoritmii genetici s-
au dovedit deosebit de eficienti in abordarea acestei probleme de optimizare cu restrictii
(Rogers & Dowla, 1994; Huang & Mayer, 1997; Guan & Aral, 1999, Aly & Peralta,
1999).
O alta problema imortanta in care AG si-au demonstrat eficienta este cea a
monitorizarii apelor subterane: este vorba de gasirea unui sistem de puturi de cost minim
care sa detecteze cu precizie prezenta substantei poluante in apa (in timp ce aria
contaminata este minima) (Cieniawski et al, 1995; Reed et al, 2000).
Recent, algoritmii genetici au inceput sa fie folositi pentru calibrarea modelelor de
curgere si/sau transport, dovedindu-se, si in acest caz, foarte robusti si eficienti: Mayer &
Huang [1999], Takeshita et al [2000], Prasad & Rastogi [2001]. Tsai et al [2003] au
folosit o metoda de cautare global-locala (un algoritm genetic urmat de un algoritm
BFGS care utilizeaza solutia data de AG ca solutie initiala) pentru a determina atat
valorile parametrilor, cat si structura optima a parametrizarii, intr-o problema de curgere
bi-dimensionala.
48
3.1.2. Structura unui algoritm genetic
Algoritmii genetici au fost introdusi de J. Holland si echipa lui de la Universitatea
din Michigan si reprezinta strategii de cautare care se bazeaza pe analogia dintre
optimizare si selectia naturala. O solutie posibila din spatiul de cautare este privita ca un
individ a carui capacitate de adaptare la mediu poate fi evaluata prin intermediul unei
functii (numita functie de performanta sau de evaluare), aflata in stransa legatura cu
functia obiectiv a problemei de optimizare. Fiecare individ (vector de variabile de
decizie) se poate reprezenta (codifica) ca un „cromozom”: un sir de „gene” de lungime
fixata. Notam cu X multimea cromozomilor si +ℜ→X:f p functia de performanta.
Structura unui algoritm genetic difera de metodele traditionale in urmatoarele aspecte
(Goldberg, 1989):
• AG foloseste o varianta codificata a vectorului variabilelor de decizie
• AG mentine, la fiecare iteratie, o populatie de solutii, nu o singura solutie
• AG utilizeaza doar functia obiectiv insasi, nu si derivatele ei
• AG foloseste reguli de cautare probabiliste, nu deterministe.
Un algoritm genetic debuteaza prin generarea aleatoare a unei populatii initiale de
dimensiune data, n: ( ) 002
01 xxx0 n,,P K=
La fiecare iteratie t se construieste o noua populatie (o noua generatie)
( ) tn
tt ,,tP xxx 21 K= selectand indivizii cei mai performanti din vechea generatie si
aplicandu-le operatorii genetici de incrucisare si mutatie. Mecanismul de selectie ca si cel
de aplicare a operatorilor genetici se bazeaza pe reguli probabiliste, nu deterministe. Este
de asteptat ca indivizii noii generatii sa fie mai performanti decat predecesorii lor. O noua
generatie se obtine in 4 etape:
1. Evaluarea: Se calculeaza functia de performanta a fiecarui individ din
populatia curenta, ( ) tn
tt ,,tP xxx 21 K= : ( ) ( ) ( )tnp
tp
tp f,f,f xxx 21 K . In cazul folosirii
codificarii binare, evaluarea propriu-zisa este precedata de decodificarea cromozomilor
(transformarea lor in vectori de necunoscute reale).
2. Selectia: Pe baza valorilor calculate ale functiei de performanta, se selecteaza
din ( )tP n indivizi care formeaza o populatie intermediara ( )t'P - baza genetica pentru
49
generatia urmatoare ( )1+tP . Un individ mai „performant” are sanse sa fie selectat de mai
multe ori (adica sa aiba mai multe còpii in populatia intermediara).
3.Incrucisarea: Se aleg aleator perechi de indivizi din populatia intermediara
( )t'P . In cadrul fiecarei perechi, cu o anumita probabilitate, cp , are loc un schimb de
gene intre cei doi cromozomi. Perechea initiala va fi inlocuita de o pereche de
descendenti care pastreaza caracteristicile ambilor „parinti”. In urma incrucisarii va
rezulta o noua populatie intermediara, ( )tP ′′ care contine atat „descendenti” (aproximativ
cpn ⋅ ) cat si cromozomi nemodificati din ( )t'P .
4. Mutatia: Se selecteaza, cu o anumita probabilitate, mp , gene ale cromozomilor
din ( )tP ′′ care sunt „alterate” (de exemplu, in cazul codificarii binare, sunt inlocuite cu
valorile complematare). La sfarsitul acestei etape va rezulta noua generatie, ( )1+tP .
In ciuda simplitatii lor, algoritmii genetici au un fundament matematic. Holland
(1975) prin „Teorema schemelor” si Goldberg [1989] prin „Ipoteza blocurilor
constructive” au pus bazele teoriei generale care descrie felul in care populatiile
evolueaza spre solutii tot mai performante sub actiunea operatorilor genetici.
Cromozomii performanti sunt alcatuiti din fragmente de informatie („blocuri
constructive”) relevante pentru solutia problemei. Presiunea de selectie permite
indivizilor performanti sa aiba descendenti ce combina blocuri constructive de la ambii
parinti, ceea ce face ca „noua generatie” rezultata sa aiba o performanta medie
superioara celei anterioare.
Convergenta are loc atunci cand o singura solutie domina populatia (cand un
anumit procent din cromozomii unei generatii sunt identici (Reed et al, 2000). De obicei,
insa, conditia de oprire se refera la atingerea numarului maxim de generatii, iar solutia
optima este reprezentata de individul cel mai performant din ultima generatie (sau din
intreaga istorie a procesului).
50
Fig. 3.1. Schema unui AG „clasic”.
Un algoritm genetic este definit de urmatoarele elemente :
1. Reprezentarea cromozomiala (sau codificarea) spatiului de cautare
2. Functia de evaluare a performantei indivizilor
3. Alegerea operatorilor genetici (de selectie, incrucisare, mutatie)
4. Valorile parametrilor de control: dimensiunea populatiei, numarul maxim de generatii,
probabilitatile de incrucisare si mutatie, cp si mp .
START
Generarea populatiei initiale
Selectie
Incrucisare
Mutatie
C.O.?
STOP
Da
Nu
Decodificare + Evaluare
51
3.1.3. Reprezentarea cromozomiala.
Exista doua tipuri principale de reprezentari ale spatiului de cautare:
• Codificarea binara, „traditionala”, care este si cadrul in care a fost formulat
fundamentul teoretic al AG (Holland, 1975).
• Codificarea reala, care este mai naturala: nu necesita practic nici un fel de
transformare a variabilelor de decizie.
Goldberg [1989] a sugerat ca performanta unui algoritm genetic este optima
atunci cand se foloseste codificarea binara; alti autori (de ex. Michalewicz,1994) au ajuns
la concluzia ca reprezentarea reala da rezultate cel putin la fel de bune ca si cea binara si,
in plus, este mai usor de implementat. Este cert ca alegerea tipului optim de reprezentare
trebuie facuta in functie de natura problemei. Pana in prezent, majoritatea aplicatiilor AG
in hidrogeologie au folosit codificarea binara. In capitolul 4 al tezei, care prezinta
calibrarea unui acvifer sintetic prin algoritmi genetici, au fost aplicate ambele tipuri de
codificare, realizandu-se o comparatie intre rezultatele obtinute.
Tipul de codificare folosit determina si alegerea operatorilor de incrucisare si
mutatie (dar nu exercita nici o influenta asupra selectiei).
In reprezentarea reala cromozomii sunt chiar vectorii variabilelor de decizie
(fiecare variabila de decizie reprezinta o gena a cromozomului respectiv).
In reprezentarea binara cromozomii sunt alcatuiti din gene care pot lua valorile 0
si 1 si se formeaza prin concatenarea unor subsiruri binare ce corespund variabilelor de
decizie.
Se considera o problema in care vectorul variabilelor de decizie are k
componente: ( )kx,,x,xx K
21= , si fiecare variabila ia valori intr-un anumit interval:
[ ]iii b,ax ∈ . Presupunand ca variabila ix trebuie determinata cu precizia iα−10 (cu iα
zecimale exacte), rezulta ca fiecare interval [ ]ii b,a trebuie divizat in cel putin
( )ii abi −α10 subintervale.
52
Codificarea binara pe r biti furnizeaza r2 cromozomi (deci 12 −r subintervale).
Deci, pentru k,i 1= , se alege ir minim a.i. i
irii ab α−≤
−−
1012
. Un cromozom se obtine prin
concatenarea a k subsiruri binare de diferite lungimi,ir :
)(x
21
2
222
21
1
112
11 21
44 344 2144 344 2144 344 21
KKKKK
k
kr
kkrr
x
bbb
x
bbb
x
bbbk
=
Decodificarea. Pentru fiecare subsir ( )ir
ii
ibbb K21 se calculeaza valoarea zecimala
ir
ririi
i
ii bbbd K+⋅+⋅= −− 22
11 22 , si apoi valoarea reala corespunzatoare a variabilei de
decizie ix : ir
iii
i dab
axi
⋅−
−+=12
.
Daca krrrX +++= K211,0 este multimea cromozomilor si kS ℜ⊂ este spatiul de
cautare, atunci decodificarea este o functie SX →:d care transforma cromozomii in
vectori de variabile de decizie: ( ) ( )kx,x,x K
21xd =
Functia de performanta (de evaluare, de adcvare) este o functie ce ia numai
valori pozitive, aflata in stransa legatura cu functia obiectiv. Intr-o problema de
maximizare, functia de performanta pf poate fi chiar functia obiectiv, of ,eventual
deplasata cu o constanta pentru a se indeplini conditia de nenegativitate:
( ) ( ) Cff op += d(x)x
In cazul problemelor de minimizare se poate face transformarea:
( ) ( ) Cff
op +
=d(x)
1x
In problemele de optimizare cu restrictii acestea pot fi inglobate in functia
obiectiv cu ajutorul unor termeni de penalitate.
53
3.1.4. Operatorii genetici
3.1.4.1. Selectia
Scopul selectiei este valorificarea informatiei continute de indivizii performanti.
Mecanismul selectiei trebuie sa asigure un echilibru intre presiunea de selectie (numarul
mediu de còpii pe care le poate avea cel mai performant individ in populatia
intermediara) si necesitatea mentinerii diversitatii populatiei. O presiune de selectie
ridicata poate determina convergenta la un optim local, in timp ce o presiune de selectie
scazuta duce la o cautare pur aleatoare, ineficienta. Descriem in continuare cele mai
folosite metode de selectie:
a) Selectia proportionala (metoda ruletei)
Avand populatia la momentul t, ( ) tn
tt ,,tP xxx 21 K= , cromozomul tx i este
selectat sa faca parte din populatia intermediara cu probabilitatea
( )( )
( )( )∑
=
=⋅
=n
j
tjp
tip
p
tip
i
f
f
tfn
fp
1
x
xx.
unde ( ) ( )∑=
=n
i
tipp f
ntf
1
x1
reprezinta performanta medie a populatiei.
Operatorul de selectie se aplica de n ori, deci cromozomul tx i va avea, in medie,
( )( )tf
fnpn
p
tip
ii
x== còpii in populatia intermediara, ( )t'P . Este ca si cum o roata de ruleta
impartita in n sectoare (dimensiunea sectorului i fiind proportionala cu ip ) este invartita
de n ori si, de fiecare data, cromozomul „ales” de acul ruletei este selectat sa faca parte
din „baza genetica”.
54
Algoritmul ruletei:
1) Se calculeaza probabilitatile cumulate ii pppq +++= K21 , n,i 1= . (Obs 1=nq ).
2) Pentru fiecare n,i 1= se genereaza aleator un numar [ )1,0∈rand .
• Daca 10 qrand <≤ atunci este selectat cromozomul t0x
• Daca jj qrandq <≤−1 atunci este selectat cromozomul tjx .
Dezavantajele selectiei proportionale apar in cele doua cazuri extreme:
• Atunci cand exista un individ cu o performanta mult peste media populatiei
( ) ( )tff ptip >>x , el va avea un mare numar de còpii, ceea ce duce la uniformizarea
populatiei si aparitia riscului de convergenta prematura.
• Dimpotriva, atunci cand populatia este foarte omogena (performantele indivizilor
au valori foarte apropiate), probabilitatile de selectie devin aproape egale si , in
consecinta, nu mai are loc o selectie propriu-zisa, ci o cautare aleatoare.
b) Selectia bazata pe ordonare
Indivizii populatiei curente sunt ordonati in ordinea descrescatoare a valorilor
functiei de performanta si se noteaza cu ir rangul cromozomului i in acest sir ordonat
(cromozomul cel mai performant are rangul 1). Pentru fiecare n,i 1= probabilitatea de
selectie a cromozomului tix , ip , se defineste in functie de rangul sau ir , independent de
valoarea functiei de performanta , ( )tipf x .
Daca presupunem ca probabilitatea de selectie variaza liniar cu rangul r de la
( )n
p2
1 = pentru cel mai bun individ (presiunea de selectie este 2), la ( ) 0=np , pentru cel
mai putin performant, atunci vom avea:
( ) ( )( )1
2
−−==
nn
rnrpp iii
55
Mai general, daca se alege presiunea de selectie [ ]21,q∈ , atunci, ip variaza
liniar de la ( )n
qp =1 la ( )
n
qnp
−= 2, iar probabilitatea individului i de a fi selectat este:
( ) ( )( )
−−−−==
1
1121
n
rqq
nrpp iii
Pentru a descrie variatia cu rangul a probabilitatii de selectie poate fi
considerata si o alta functie descrescatoare (nu neaparat liniara).
Selectia prin ordonare geometrica normalizata utilizeaza o functie de forma:
( ) ( )( )n
r
h
hhrp
−−−=
−
11
1 1
,
unde h este un parametru in intervalul (0,1).
Dupa stabilirea probabilitatii de selectie pentru fiecare cromozom, nipi ,1 , = ,
procedeul de selectie se desfasoara dupa acelasi mecanism descris mai sus (algoritmul
ruletei).
c) Selectia prin concurs (metoda turnirului)
In cazul „turnirului clasic”, binar, se aleg 2 indivizi din populatia curenta, iar cel
mai performant dintre ei este selectat sa faca parte din populatia intermediara.
Mecanismul se aplica de n ori, pentru obtinerea unei „baze genetice” de dimensiune n.
Se poate imagina si un turnir cu s participanti ( )2≥s . In acest caz, probabilitatea
unui individ de a fi selectat pentru turnir este n
s si, deoarece cel mai performant
cromozom „castiga” cu siguranta, aceasta este si probabilitatea de a fi selectat in
populatia intermediara. Aplicand mecanismul de n ori, va rezulta ca numarul asteptat de
còpii ale celui mai bun in populatia intermediara (presiunea de selectie) este s.
Un avantaj al acestei metode de selectie este ca nu necesita nici un fel de
transformare a functiei obiectiv pentru a evalua performanta indivizilor. Totodata,
selectia prin metoda turnirului este mai eficienta si mai putin predispusa la convergenta
prematura (Goldberg & Deb, 1991). Metoda turnirului este preferata in majoritatea
aplicatiilor algoritmilor genetici in hidrogeologie.
56
3.1.4.2. Incrucisarea
Daca selectia orienteaza cautarea spre regiunile „promitatoare” ale spatiului prin
exploatarea indivizilor performanti, incrucisarea si mutatia asigura explorarea spatiului
solutiilor.
Incrucisarea consta intr-un schimb de „informatie genetica” intre 2 cromozomi
din populatia intermediara selectati aleator. Descendentii rezultati pastreaza
caracteristicile ambilor parinti, dar pot fi mult mai performanti (sau dimpotriva: mai slab
adaptati la mediu; in acest caz, insa, au sanse mari sa fie eliminati la urmatoarea selectie).
Operatorul de incrucisare (crossover) modifica o pereche de cromozomi cu o anumita
probabilitate, cp . In urma aplicarii acestui operator de 2n ori va rezulta o noua
populatie intermediara, ( )tP ′′ , formata din descendenti ai indivizilor care au participat la
incrucisare (in medie, cnp ) si indivizi nemodificati din vechea populatie, ( )tP′ .
Prezentam in cele ce urmeaza cele mai folosite metode de incrucisare. Dupa cum
se poate observa, exista mari deosebiri intre operatorii de incrucisare ce pot fi aplicati in
cazul reprezentarii binare si cei utilizati pentru reprezentarea reala.
a) Incrucisarea binara
a1) Incrucisarea cu un punct de taietura
Consta in „ruperea” cromozomilor-parinti intr-un punct ales arbitrar (intre 1 si r – 1, unde
r este lungimea cromozomilor) si schimbarea intre cei doi a subsirurilor din dreapta
punctului de taietura. Daca k este punctul de taietura, atunci din parintii
==
+
+
r1kk21
r1kk21
yyyyyy
xxxxxx
KK
KK
vor rezulta descendentii
==
+
+
r1kk21
r1kk21
xxyyyy'
yyxxxx'
KK
KK
57
Algoritmul de incrucisare binara:
1. Se selecteaza 2 cromozomi x, y din populatia intermediara ( )tP′ .
2. Se genereaza aleator un numar [ )1,0∈rand .
3. Daca cprand < atunci:
Se genereaza aleator un nr 121 −∈ r,,,k K .
Se executa incrucisarea cu punctul de taietura k, rezultand x’,y’.
altfel, x’:=x si y’:=y.
4. Cromozomii x’ si y’ sunt copiati in noua populatie intermediara, ( )tP ′′ .
Se executa pasii 1 - 4 de 2n ori (pana cand populatia ( )tP ′′ are aceeasi dimensiune cu
populatia initiala, n).
a2) Incrucisarea cu mai multe puncte de taietura
Ca si in cazul cromozomilor din natura, incrucisarea se poate face si cu doua sau
mai multe puncte de taietura: cele doua siruri de gene alese pentru incrucisare se „taie” in
doua sau mai multe puncte, iar cei doi descendenti se obtin prin recombinarea
fragmentelor rezultate.
a3) Incrucisarea uniforma
Este o generalizare a incrucisarii cu mai multe puncte de taietura: fiecare gena a
unui descendent este imprumutata de la un parinte sau altul, in mod aleator.
b) Incrucisarea reala
b1) Incrucisarea aritmetica (convexa)
Cei doi descendenti (x’,y’) sunt combinatii liniare (complementare) ale
cromozomilor-parinti (x , y):
( )( )
+=+=
y
y
αααα
x-1y'
-1xx'
unde α este fie un parametru constant (incrucisare aritmetica uniforma), fie este generat
aleator in intervalul [0,1).
58
b2) Incrucisarea euristica
Consta intr-o extrapolare liniara a doi indivizi (x,y). Acest tip de incrucisare
utilizeaza valorile functiei de performanta si produce un singur descendent,
( ) xy-xx' += α
unde cromozomul x este mai performant decat y, iar α este un numar generat aleator in
intervalul [0,1). Daca „urmasul” rezultat nu e o solutie „fezabila” (nu este o solutie
admisibila) atunci se genereaza un nou nr aleator [ )1,0∈α , pana cand se obtine un
descendent admisibil, sau pana cand se atinge un numar maxim de incercari.
Incrucisarea aritmetica Incrucisarea euristica
Fig. 3.2. Incrucisarea reala (aritmetica si euristica)
3.1.4.3. Mutatia
Reprezinta un mod de a reintroduce diversitatea intr-o populatie in care, din
intamplare, o anumita gena are aceeasi valoare la toti indivizii, prevenindu-se astfel
convergenta la un optim local. Consta in „alterarea” unei gene din populatia ( )tP ′′ cu o
anumita probabilitate, mp . Un cromozom poate suferi mai multe mutatii. Numarul mediu
de mutatii intr-o generatie este mprn ⋅⋅ . Ca si in cazul incrucisarii, exista operatori de
mutatie diferiti pentru codificarea binara , respectiv pentru codificarea reala.
a) Mutatia binara
In cazul reprezentarii binare, mutatia consta in selectarea unei gene (cu
probabilitatea mp ) si complementarea acesteia.
X
X’ Y’
Y
X’
X
Y
59
Algoritmul de mutatie binara:
Pentru fiecare cromozom xi al populatiei ( )tP ′′ ( n,i 1= )
Pentru fiecare gena, ikx , a cromozomului xi ( r,k 1= ):
Se genereaza aleator un numar [ )1,0∈rand .
Daca mprand < atunci se complementeaza gena respectiva.
Daca mprand ≥ atunci gena ramane neschimbata.
In mod obisnuit, se considera ca probabilitatea de mutatie, mp este constanta.
Se poate construi si un algoritm („mutatie neuniforma”) in care mp descreste cu indicele
generatiei:
( ) ( )βtmm eptp −⋅= 1
unde: mp reprezinta probabilitatea de mutatie la prima generatie.
( )tpm reprezinta probabilitatea de mutatie la generatia t.
β este un parametru real (cu cat β e mai mare, cu atat descresterea e mai rapida)
b) Mutatia reala
b1) Mutatia uniforma inlocuieste o gena (selectata aleator cu probabilitatea mp )
cu un numar uniform generat in intervalul de variatie al genei respective:
( )kk b,aU :x ik =
b2) Mutatia la frontiera permite saltul unei gene intr-unul din capetele
intervalului. In cazul in care o gena ikx este selectata pentru mutatie, se genereaza aleator
inca un numar [ )1,01 ∈rand si gena respectiva se modifica astfel:
≥<
=50 daca
50 daca :x
1
1ik .rand,b
.rand,a
k
k
60
b3) Mutatia neuniforma
Este caracterizata de o descrestere a amplitudinii mutatiei cu indicele generatiei, t.
Astfel, genele pot suferi schimbari importante in primele etape ale cautarii, in timp ce in
fazele avansate, in vecinatatea punctului de optim, cautarea devine mai „fina”. La fiecare
generatie t se genereaza doua numere aleatoare, 21 r,r , uniform distribuite in intervalul
[0,1). In cazul in care gena ikx este selectata pentru mutatie, valoarea ei se modifica
astfel:
( ) ( )( ) ( )
≥−−<−+
=50 daca xx
50 daca xx :x
1ik
ik
1ik
iki
k.r,ta
.r,tb
k
k
δδ
unde ( )tδ este o functie ce tinde la 0 atunci cand Tt → ( numarul maxim de generatii):
( )b
T
trt
−= 12δ (Houck et al, 1995) sau ( )b
T
t
rt
−−= 121δ (Michalewicz, 1994)
(b este un parametru de forma, real)
3.1.5. Parametrii de control ai unui algoritm genetic
Alegerea parametrilor care definesc structura unui algoritm genetic este o sarcina
dificila, care depinde foarte mult de problema de optimizare respectiva, de tipul de
codificare ales, de operatorii genetici utilizati. Exista insa niste linii directoare generale si
chiar o serie de indicatii referitoare la aplicatiile algoritmilor genetici in hidrogeologie
(Reed et al, 2000).
1) Lungimea cromozomilor, r
In cazul codificarii reale lungimea cromozomilor este egala cu numarul
variabilelor de decizie (numarul de parametri ai modelului).
Daca se foloseste codificarea binara, lungimea cromozomilor este determinata de
numarul variabilelor de decizie, de amplitudinea domeniului in care acestea variaza si de
precizia dorita.
61
2) Dimensiunea populatiei, n
In cazul problemelor complexe, multimodale, cu cat dimensiunea populatiei este
mai mare, cu atat cresc sansele gasirii optimului global. In cazul folosirii unui algoritm
genetic pentru calibrarea modelelor hidrogeologice, trebuie tinut cont de faptul ca o
populatie numeroasa implica un numar mare de evaluari ale functiei obiectiv (care se fac
prin rularea modelului de simulare), deci algoritmul devine ineficient din punct de vedere
al timpului de calcul. O recomandare generala pentru algoritmul genetic binar este ca
populatia sa fie de ordinul lungimii cromozomilor: ( )rOn ≈ (Deb, 1998).
3) Numarul maxim de generatii, T
Numarul maxim de generatii depinde de lungimea cromozomilor; in cazul
algoritmilor genetici care folosesc selectia prin metoda turnirului, se poate folosi o relatie
de forma: rT 2≈ (Thierens et al, 1998).
4) Probabilitatea de incrucisare, pc
Avand in vedere forta inovativa a operatorului de incrucisare, Goldberg [1989] a
recomandat o probabilitate de incrucisare ridicata: 60.pc ≥ .
In cazul selectiei prin metoda turnirului (cu s concurenti), probabilitatea de
incrucisare trebuie sa respecte o relatie de forma (Reed et al, 2000):
s
spc
1−≤
5) Probabilitatea de mutatie
Goldberg [1989] a sugerat ca probabilitatea de mutatie (a unui bit) trebuie sa aiba
o valoare relativ mica, aproximativ egala cu inversul populatiei:
npm
1≈ .
62
3.2. Metoda calirii simulate
3.2.1. Introducere
Metoda calirii simulate se bazeaza pe analogia cu un proces termodinamic, si
anume cu modul in care se racesc si se calesc metalele. Daca temperatura unei substante
in stare lichida (un metal topit) se reduce incet, atunci natura poate gasi starea de energie
minima a sistemului, in care atomii formeaza o structura ordonata numita retea cristalina.
Daca metalul lichid este racit rapid, nu se atinge aceasta stare finala, de energie minima,
ci se obtine o structura amorfa, avand o energie mai ridicata decat cea a structurii
cristaline.
Se considera ca energia unui sistem aflat in echilibru termic la temperatura T este
distribuita probabilist intre diferite stari energetice, E, avand distributia de probabilitate
Boltzmann:
( )
−=kT
EexpEp
unde k este o constanta (constanta Boltzmann).
In cadrul procesului de calire, sistemul poate trece, deci, dintr-o stare de energie
mai scazuta intr-o stare de energie mai ridicata, dar probabilitatea ca acest lucru sa se
intample scade cu temperatura T.
Considerand ca energia sistemului corespunde functiei obiectiv, iar configuratia
cristalina reprezinta punctul de minim global, se poate imagina un proces iterativ de
cautare a minimului care, in mod asemanator procesului de calire, permite si cresterea, nu
doar descresterea functiei obiectiv (asa cum fac metodele traditionale), evitandu-se astfel
oprirea la un minim local.
Metropolis et al. (1953) au transpus aceste principii intr-un algoritm care
simuleaza evolutia spre echilibru termic la o valoare data a temperaturii, T. Ideea este de
folosi un criteriu probabilistic bazat pe functia Boltmann (in care k=1) care sa accepte cu
probabilitatea 1 pasii in sensul descresterii functiei, dar sa permita, cu o anumita
probabilitate p , si pasi in sensul cresterii functiei.
63
In domeniul hidrogeologiei, Metoda calirii simulate a fost folosita de Dougherty
& Marryot (1991), Marryot et al. (1993) in probleme de optimizarea gospodaririi apelor
subterane. Rogers et al. (1995) au folosit un algoritm de calire simulata pentru a
determina strategia optima de remediere a unui acvifer contaminat. Efstratiadis (2001) a
realizat un algoritm ce combina metoda globala a calirii simulate cu algoritmul Simplex
(Nelder & Mead) de cautare locala si l-a aplicat in probleme de gospodarirea resurselor
de apa subterana.
3.2.2. Structura algoritmului de calire simulata
Metoda calirii simulate reprezinta, practic, o succesiune de algoritmi Metropolis
aplicati pentru valori din ce in ce mai scazute ale temperaturii. Se porneste cu o solutie
admisibila, cx : un vector de variabile de decizie, iar in cazul calibrarii, o configuratie
posibila de parametri. Se noteaza cu ( )cc xEE = valoarea functiei obiectiv (functia
eroare) in punctul cx . Se genereaza o noua solutie px (perturband configuratia curenta,
cx ) si se calculeaza ( )pp xEE = .
1. Daca cp EE ≤ atunci noua solutie este, evident, cel putin la fel de buna ca
precedenta, deci este acceptata si procesul este reluat din acest punct.
2. Daca cp EE > atunci, cu toate ca solutia perturbata px este mai „slaba” decat
solutia curenta cx , ea poate fi totusi acceptata, cu probabilitatea
−−=
T
EEexpp cp ,
unde T este un numar pozitiv care are acelasi rol ca si temperatura in procesul de calire.
Se observa ca:
• pentru T fixat, probabilitatea de acceptare este cu atat mai mare cu cat diferenta
cp EEE −=∆ este mai mica;
64
• atunci cand „temperatura” T este ridicata, probabilitatea de acceptare a unei noi
solutii este foarte aproape de 1, chiar daca diferenta cp EEE −=∆ este mare, iar
procesul de cautare are un caracter pur aleator;
• daca „temperatura” T este scazuta, noile solutii mai „slabe” sunt aproape sigur
respinse, chiar daca diferenta cp EEE −=∆ este relativ mica.
Pentru a decide daca solutia px este sau nu acceptata, se genereaza aleator un
numar r in intervalul [0,1). Daca pr < atunci solutia px este acceptata; daca nu, solutia
curenta ramane cx si se genereaza o noua solutie perturbata, px .
Pentru fiecare valoare a parametrului T se genereaza un numar fixat de solutii
perturbate, n , dupa care se reduce temperatura printr-un un factor 1<λ : T:T λ= si
procesul este reluat. Conditia de oprire este de obicei atingerea numarului maxim de
trepte de temperatura, N. Se observa ca procesul de cautare prin metoda calirii simulate
este alcatuit dintr-un numar de iteratii globale (N), fiecare iteratie globala avand un numar
de subiteratii (n) efectuate la temperatura constanta.
Algoritmul de calire simulata:
Pasul 1. Se initializeaza temperatura: 0TT = si se selecteaza o solutie initiala, 0xxc = .
Se calculeaza ( )cc xEE =
Pasul 2. Pentru N,i 1= se repeta pasii 3 si 4
Pasul 3. Pentru n,j 1= se executa 3.1 si 3.2
3.1 Se genereaza o noua solutie, px si se calculeaza ( )pp xEE =
3.2 Daca cp EE ≤ atunci px este acceptata ca solutie curenta: pc x:x =
Daca cp EE > atunci se genereaza un nr aleator r uniform distribuit [0,1)
Daca
−−=<
T
EEexppr cp atunci se accepta solutia perturbata px
pc x:x = .
Pasul 4. Se reduce temperatura: T:T λ=
65
3.2.3. Parametrii algoritmului de calire simulata
Alegerea parametrilor care controleaza procesul iterativ, 0T , n si λ , este deosebit
de importanta .
Temperatura initiala, 0T se poate alege in functie de valoarea functiei obiectiv in
punctul initial, ( )00 xEE = , printr-o relatie de forma (Popa, 2003):
aln
E,T
10 00
⋅−=
unde a este un parametru ce reprezinta proportia de solutii care sunt acceptate din
multimea configuratiilor avand functia obiectiv cu 10% mai mare decat 0E .
Parametrul n, ce reprezinta numarul de perturbatii efectuate la un nivel de
temperatura constant, trebuie sa fie suficient de mare. O valoare prea ridicata duce insa la
cresterea exagerata a timpului de calcul. In general, se admite ca n poate fi de 10 ori mai
mare decat dimensiunea vectorului variabilelor de decizie.
Factorul de reducere a temperaturii, λ , se ia de obicei in intervalul [0,8 , 1). O
valoare mica a lui λ determina scaderea rapida a temperaturii, ceea ce poate face ca
procesul sa se opreasca la un optim local, in timp ce, daca temperatura scade foarte lent,
timpul de calcul creste considerabil.
Criteriul de oprire poate fi reprezentat de:
• atingerea numarului maxim de trepte de temperatura, N
• atingerea unei temperaturi finale minime prestabilite, finalT
• realizarea unui numar specificat de iteratii globale succesive fara nici o
modificare a functiei obiectiv.
66
4. Calibrarea unui acvifer sintetic (virtual) folosind
tehnici de optimizare neconventionale.
4.1. Descrierea modelului
Pentru a investiga performantele algoritmilor genetici si metodei calirii simulate
in calibrarea modelelor hidrogeologice, se considera un acvifer sintetic bi-dimensional
sub presiune, in regim de curgere permanent. Considerand, in plus, mediul de curgere
izotrop, ecuatia care guverneaza curgerea se scrie:
0=+
∂∂
∂∂+
∂∂
∂∂
qy
hT
yx
hT
x (4.1)
Se considera doua cazuri, diferentiate de conditiile de margine.
Cazul 1. Conditiile de margine:
• de tip Dirichlet (cota hidraulica impusa) la V (H1=100m) si E (H2=80m)
• de tip Neumann (limita impermeabila) la N si S (Q=0)
Cazul 2. Conditiile de margine:
• de tip Dirichlet (cota hidraulica impusa) la N (H=100m)
• de tip Neumann : limita impermeabila la E si S (Q=0)
flux impus la V (Q=0,08 m/zi)
In acvifer exista doua puturi de extractie avand debitele :
P1=10000 m3/zi
P2=20000 m3/zi
67
(a) (b)
Fig. 4.1. Acviferul sintetic : cazul 1 (a) si cazul 2 (b)
Acviferul se considera impartit intr-un numar de m zone omogene, de
transmisivitati mT,...,T,T 21 .
Problema directa este rezolvata pentru transmisivitatile « reale » mT,...,T,T 21 prin
metoda diferentelor finite (utilizand programul MODFLOW) si se calculeaza valorile
« reale » ale sarcinii hidraulice in nodurile de calcul, obsih . Folosind aceste valori, se
rezolva problema inversa
( ) ( ) ( )∑ −=i
obsi
calcim hhT,...,T,TE
2
21min (4.2)
P1=10000 m3/zi
P2=20000 m3/zi
Q=0
,08
m/z
i
H=
100
m
P1=10000 m3/zi
P2=20000 m3/zi
H=
80
m
H=100 m
68
4.2. Structura algoritmilor utilizati
Pentru rezolvarea problemei inverse s-au folosit 3 algoritmi:
1) un algoritm genetic real
2) un algoritm genetic binar
3) metoda calirii simulate.
Functia de performanta utilizata de algoritmii genetici este chiar functia eroare.
Un « individ » ( )mT,...,T,T 21 T = este considerat cu atat mai « performant » cu cat eroarea
asociata este mai mica.
Ca metoda de selectie s-a folosit metoda turnirului (binar) : se aleg din populatia
curenta (in mod aleator) doi indivizi T1 si T2 ; daca E(Ti) ≤ E(Tj) atunci Ti intra in
populatia intermediara (baza genetica pentru populatia urmatoare). Procedeul se repeta de
n ori (pana cand populatia intermediara are aceeasi dimensiune ca si populatia curenta).
Atat operatorii de incrucisare si mutatie utilizati, cat si parametrii pc si pm sunt
prezentati in tabelul 4.1 :
Tabelul 4.1. Operatorii genetici utilizati
Metoda de
incrucisare
Metoda de
mutatie
pc (probabilitatea
de incrucisare)
pm(probabilitatea
de mutatie)
AG real euristica neuniforma 0.5 0.1
AG binar uniforma binara 0.5 0.01
In algoritmul genetic binar, fiecare variabila iT a fost codificata pe 13 biti
(limitele de variatie ale parametrilor: 8291100 ≤≤ iT , iar precizia dorita: h=1), ceea ce
inseamna ca lungimea unui cromozom este m×13 .
Pentru fiecare generatie T,k 1= se noteaza :
69
• kn
kkk T,...,T,TP 21= populatia curenta (unde fiecare individ, kjT este un
vector de dimensiune m )
• kbT cel mai performant individ din populatie si ( ) ( )k
jn,j
kb
kb TEminTEE
1===
• ( )∑=
=n
i
kj
k TEn
E1
1 performanta medie a populatiei kP
S-au considerat doua structuri ale acviferului, cu grade de complexitate diferite:
m=2 si m=4. Dimensiunea populatiei, n, si numarul de generatii, T, au fost stabilite,
pentru fiecare caz, printr-un proces de tip « trial & error », dupa mai multe rulari.
Tabelul 4.2 Dimensiunea populatiei si numarul de generatii.
n (dimensiunea populatiei) T (numarul de generatii)
AG real 30 30 m = 2
AG binar 30 40
AG real 50 40 m = 4
AG binar 50 60
70
4.3. Calibrarea acviferului impartit in 2 zone (m=2)
Pentru inceput, se considera ca acviferul este impartit in doua zone: una in
jumatatea de nord, avand transmisivitatea « reala » realT1 =2000 m2/zi, cealalta in
jumatatea de sud, realT2 =1000 m2/zi.
Fig. 4.2. Suprafata piezometrica “reala” (cazul 1, m=2)
Fig. 4.3. Suprafata piezometrica “reala” (cazul 2, m=2)
71
Problema inversa se reduce la minimizarea unei functii de doua variabile :
( ) ( ) ( )∑ −=i
obsi
calci hhT,TE
2
21min
02468101214161820222426283032343638404244464850
F
Fig. 4.4. Reprezentarea grafica a functiei eroare ( )21,TTE (cazul 1)
0
20
40
60
80
100
120
140
160
180
200
220
240
260
280
300
320
Fig. 4.5. Reprezentarea grafica a functiei eroare ( )21 T,TE (cazul 2)
72
Algoritmul genetic real converge foarte rapid: in cel mult 30 de generatii eroarea
asociata celui mai bun individ, ( )kb
kb TEE = , devine de ordinul 10-3 ; media populatiei ,
kE converge si ea la 0. In primul caz, functia eroare are o zona de minim relativ
« plata », motiv pentru care punctul de minim gasit aproximeaza transmisivitatile
« reale » cu o marja de eroare de 1%. In cel de-al doilea caz minimul este gasit cu
exactitate. Algoritmul genetic binar converge mai lent si mai « nesigur » : eroarea
asociata celui mai performant individ dupa 40 de generatii este de ordinul 10-2 in primul
caz, si 10-3 in cazul 2, iar valorile calculate ale transmisivitatilor zonale le aproximeaza
pe cele « reale » cu o marja de eroare de 2%, respectiv 1%.
In metoda calirii simulate numarul de subiteratii (efectuate la temperatura
constanta) este n=20 iar numarul maxim de iteratii principale : N=70. Rezultatele
obtinute prin MCS sunt comparabile cu cele obtinute de AG binar.
Tabelul 4.3. Transmisivitatile zonale rezultate din calibrare (cate doua exemple pentru
fiecare caz si pentru fiecare algoritm). m=2
T1 (m2/zi) T2 (m
2/zi) ( )21 T,TE
Valori reale 2000 1000
1991.2 1009.0 0.0001 AG real
2001.5 995.1 0.002
2031 1009 0.038 AG binar
2042 987 0.014
2028.7 984.4 0.002
Cazul 1
Calire simulata
2038.1 975.8 0.0042
2000 1000 0 AG real
1997.8 1001.5 0.001
2016 995 0.026 AG binar
1994 1003 0.0037
2014.2 1000.2 0.0232
Cazul 2
Calire simulata
2001.2 1010.1 0.007
73
0
1
2
3
4
5
6
7
8
1 4 7 10 13 16 19 22 25 28 31 34 37 40
Generatia
Ero
area
min
ima
AG real
AG binar
Fig. 4.6. Algoritmul genetic : variatia celei mai bune performante ( )kb
kb TEE =
cu generatia, k ( m=2)
0
20
40
60
80
100
120
140
1 4 7 10 13 16 19 22 25 28 31 34 37 40Generatia
Ero
are
a m
edi
e
AG realAG binar
Fig. 4.7. Algoritmul genetic : variatia performantei medii kE cu generatia, k ( m=2)
Se observa ca in algoritmul genetic real si performanta medie a populatiei converge la 0.
74
0
5
10
15
20
25
30
35
40
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69
Iteratia
Ero
area
Fig. 4.8. Metoda calirii simulate: variatia functiei obiectiv cu iteratia (m=2)
75
4.4. Calibrarea acviferului impartit in 4 zone ( m=4)
Se mareste gradul de complexitate al problemei, crescand dimensiunea parametrizarii de
la m=2 la m=4 : se considera acviferul impartit in 4 zone (egale ca suprafata), valorile
« reale » ale transmisivitatilor zonale fiind cele din tabelul de mai jos :
Tabelul 4.4. Transmisivitatile zonale « reale » in cazul m=4
T1=4000 T2=500
T3=2000 T4=8000
In acest caz problema calibrarii consta in minimizarea unei functii de 4 variabile:
( ) ( )4321min T,T,T,TE
AG real ajunge la rezultate apropiate de cele reale, cu conditia ajustarii
parametrilor: trebuie marita atat dimensiunea populatiei (la 50 de indivizi), cat si numarul
de generatii (la 40). AG binar este mai lent si mai putin precis (pentru a obtine o precizie
de 10% au fost necesare cel putin 50 de generatii). O mai buna acuratete se poate obtine
ruland inca o data programul cu o populatie initiala formata din cei mai buni indivizi
gasiti in prima rulare. Metoda calirii simulate (in care se utilizeaza n=40 de subiteratii
efectuate la temperatura constanta) ajunge si ea la rezultate apropiate de cele reale :
76
Tabelul 4.5. Transmisivitatile zonale rezultate din calibrare (m=4)
T1 T2 T3 T4 ( )41 T,...,TE
Valori reale 4000 500 2000 8000 -
AG real 4163.5 537.2 2030.9 8289.1 0.006
AG binar 4366 613 1956 8109 0.0437 Cazul 1
MCS 4303.6 607.1 1945.0 7693.2 0.1032
AG real 4009.7 494.7 2003.1 8005.0 0.0007
AG binar 4071 459 2123 7691 0.032 Cazul2
MCS 3985.1 506.3 1988.7 7980.9 0.0006
0
2
4
6
8
10
12
14
16
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Generatia
Ero
area
min
ima
AG realAG binar
Fig. 4.9 Algoritmul genetic : variatia celei mai bune performante ( )kb
kb TEE =
cu generatia, k (m=4)
77
0
50
100
150
200
250
300
350
400
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Generatia
Ero
are
a m
edi
e
AG realAG binar
Fig. 4.10 Algoritmul genetic: variatia performantei medii kE cu generatia, k ( m=4)
0
2
4
6
8
10
12
14
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69
Iteratia
Ero
area
Fig. 4.11. Metoda calirii simulate: variatia functiei obiectiv cu iteratia ( m=4)
78
Pentru a verifica performantele celor 3 algoritmi, valorile « reale » ale sarcinii
hidraulice in nodurile de calcul au fost perturbate de un zgomot gaussian (de medie 0 si
dispersie 0.2) care sa simuleze « erorile de masurare ». Transmisivitatile calculate de AG
real si MCS pe baza acestor valori aproximeaza destul de exact valorile reale (eroarea
fata de transmisivitatile « reale » este sub 10%) :
Tabelul 4.6 Transmisivitatile « reale » si cele calibrate pe baza unor observatii cu « erori
de masurare » (m=2)
T1 T2 ( )21 T,TE
Valori reale 2000 1000 0.8702
AG real 1964.0 1016 0.8277
AG binar 1632 1131 1.3 Cazul 1
MCS 2064.5 1002.3 0.94
AG real 2001.2 1018.5 0.983
AG binar 2108 1035 2.3 Cazul 2
MCS 2037.3 1057.0 1.3
Tabelul 4.7 Transmisivitatile « reale » si cele calibrate pe baza unor observatii cu « erori
de masurare » (m=4)
T1 T2 T3 T4 ( )41 T,...,TE
Valori reale 4000 500 2000 8000 0.87
AG real 3892 553 1927 7905 0.975
AG binar 4052 572 2065 7192 1.02 Cazul 1
MCS 4112 524 2065 7883 0.907
AG real 3988.1 379.8 2421.5 6886.2 1.22
AG binar 4192 359 2404 6418 0.83 Cazul 2
MCS 3599.5 597 1880.8 7764.6 1.5
79
4.5. Concluzii
Cele doua tehnici de optimizare neconventionale prezentate in capitolul 3 –
algoritmii genetici si metoda calirii simulate – au fost utilizate in calibrarea
transmisivitatilor zonale pentru doua acvifere virtuale bi-dimensionale, in regim
permanent. Diferenta intre cele doua acvifere este data de conditiile de margine.
Atat algoritmii genetici, cat si metoda calirii simulate s-au dovedit deosebit de
eficienti in minimizarea functiei eroare in cazul unei structuri simple, bizonale, dar si
pentru o structura mai complexa, caracterizata de 4 parametri. Algoritmul genetic care
utilizeaza codificarea reala converge mai rapid si este, evident, mai natural si mai usor de
implementat. Solutia gasita de acesta este, in general, mai apropiata de cea reala decat
solutia furnizata de algoritmul genetic binar.
Eficienta algoritmilor prezentati a fost verificata prin utilizarea lor pe un set de
date perturbate de un zgomot gaussian (care simuleaza erorile de observatie ce pot aparea
intr-un caz real), constatandu-se ca transmisivitatile « reale » sunt aproximate suficient de
bine si in aceasta situatie.
Exemplele numerice considerate demonstreaza faptul ca algoritmii genetici si
metoda calirii simulate sunt metode de optimizare deosebit de robuste, care pot fi aplicate
cu succes in calibrarea unor acvifere reale.
80
5. Identificarea parametrilor hidrogeologici ai unui acvifer real
5.1. Conul aluvionar al raului Somes. Modelul conceptual
Cu o suprafata totala de aproximativ 3000 km2, conul aluvionar al Somesului este
situat pe teritoriul Romaniei si Ungariei, fiind alcatuit din nisip si pietris, dar si din
formatiuni argiloase. Probele obtinute din mai multe foraje sugereaza un grad ridicat de
heterogenitate. Conditiile reale, deosebit de complexe, trebuie schematizate/ simplificate,
astfel incat aceasta simplificare sa afecteze cat mai putin gradul de incredere in model
(Drobot et al, 2004). Modelul conceptual a fost realizat in cadrul proiectului SQUASH
(Somes/Szamos Quantitative/Qualitative Study of the Hydrogeology).
Fig. 5.1. (a) Conul aluvionar al raului Somes
(SQUASH Report, 2001)
81
Fig. 5.1. (b) Conul aluvionar al raului Somes. Sectiunea principala.
(SQUASH Report, 2001)
Un compromis rezonabil intre complexitatea conditiilor reale si necesitatea
reprezentarii simplificate s-a considerat ca este o reprezentare tri-strat a acviferului:
Astfel, exista un acvifer de suprafata (pana la o adancime de 30-60 m), un strat
semipermeabil argilos (avand o grosime maxima de 34 m) si un acvifer de adancime, sub
presiune, care se intinde pana la o adancime de 200 m. In partea de est exista un singur
acvifer (freatic). Hartile piezometrice alcatuite pe baza unor date observate in puturi de
suprafata si de adancime indica o diferenta de 1-5 m intre cele doua acvifere: acviferul
freatic (cu o cota piezometrica mai ridicata) alimenteaza, prin stratul semipermeabil,
acviferul de adancime care constituie principala sursa de apa pentru aceasta regiune.
82
Fig 5.2. Modelul conceptual (SQUASH Report, 2001)
Conditiile de margine
a) Conditii de tip Dirichlet (sarcina hidraulica impusa) s-au utilizat pe limita nordica
(raul Tisa) si vestica (raul Crasna) pentru primul strat si in partea estica, unde
exista numai acviferul freatic, pentru a descrie contactul intre zona inalta (de unde
se alimenteaza acviferul prin scurgerea de suprafata) si zona de campie.
b) Conditii de tip Neumann (flux impus) s-au folosit in partea sud-vestica pentru
acviferul de adancime (care se considera ca este alimentat din zona Nyirseg cu un
flux de 0.002 m/zi) si in partea de sud si nord-est (unde limita acviferului s-a
considerat impermeabila pentru cele trei strate) datorita contactului cu formatiuni
geologice cu permeabilitate scazuta.
c) Conditii de tip Cauchy (mixte : sarcina hidraulica dependenta de flux) s-au utilizat
pe limita de nord a acviferului, pentru a modela legatura dintre al doilea si al
treilea strat si raul Tisa
Dupa cum se poate observa, cele de mai sus se refera numai la frontierele
“laterale” ale modelului. Fiind un model tridimensional, frontiera include si suprafata
reprezentata de “culcusul” acviferului, considerata impermeabila (conditie de tip
83
Neumann), si suprafata freatica – o limita variabila (se stie ca grosimea acviferelor
freatice variaza cu sarcina hidraulica) unde conditiile de margine sunt de tip Cauchy:
sarcina hidraulica depinde de fluxul schimbat de acvifer cu cele doua rauri importante –
Somes si Tur – , dar si de alimentarea din precipitatii.
Fig. 5.3.(a) Conditiile de margine in stratul 1
Fig. 5.3. (b) Conditiile de margine in stratul 3
Cota hidraulica impusa (Dirichlet)
Limita impermeabila (Q = 0 : Neumann)
Flux impus (Neumann)
Conditii mixte (Cauchy)
84
Debitele exploatate. Cotele piezometrice masurate
Exista in zona mai multe puturi de exploatare, atat din acviferul de suprafata, cat
si din cel de adancime. Datele utilizate provin din baza de date comuna (Ro – Hu)
realizata in cadrul proiectului SQUASH (Somes/Szamos Quantitative/Qualitative Study
of the Hydrogeology). In aceasta baza de date sunt inregistrate cote piezometrice si debite
medii lunare din perioada 1978 – 2001. Modelul a fost calibrat in regim permanent,
utilizand valorile medii pentru cote piezometrice si debite.
In partea romana a acviferului exista doua sisteme de captare importante:
Martinesti (care alimenteaza orasul Satu Mare) si Doba (care alimenteaza orasul Carei).
Un numar de 32 puturi la Doba si 64 la Martinesti extrag, in medie, din acviferul de
adancime debite de aproximativ 13000 m3/zi (la Doba) si, respectiv, 65000 m3/zi (la
Martinesti). In afara acestor captari mai exista (in zona romaneasca) un numar de 55 de
puturi, care pompeaza un debit de aproximativ 20000 m3/zi.
Partea aflata pe teritoriul Ungariei este o regiune putin populata, fara orase
importante. In aceasta zona exista date inregistrate pentru 33 de puturi prin care se
extrage, in medie, un debit de aproximativ 13000 m3/zi.
Transpunerea in ecuatii matematice a modelului conceptual considerat s-a realizat
cu ajutorul pachetului de programe GMS 4.0. (Groundwater Modeling System). Pentru
rezolvarea ecuatiei de curgere tridimensionale s-a utilizat programul de diferente finite
MODFLOW. Reteaua de discretizare construita este formata din aproximativ 19000 de
celule, repartizate in 3 straturi.
Intr-o prima varianta s-a considerat un model cu 3 parametri:
• Conductivitatea hidraulica orizontala in stratul 1, [ ]300,101 ∈hK m/zi
• Conductivitatea hidraulica orizontala in stratul 3, [ ]200,53 ∈hK m/zi
• Alimentarea din precipitatii, [ ]53 10,10 −−∈R m/zi
Raportul de anizotropie vh KK a fost luat egal cu 10 in stratele 1 si 3. Pentru
stratul de mijloc (semipermeabil) s-au considerat 3 variante:
85
• 22vh KK = = 0.1 m/zi
• 22vh KK = = 1 m/zi
• 22vh KK = =10 m/zi
Minimizarea functiei eroare ( ) ( )∑=
−=n
k
obsk
calckhh hhRKKE
1
231 ,, s-a facut cu ajutorul
programului PEST. Pentru evaluarea modelului (in afara functiei eroare, E ) s-au utilizat
si functiile:
∑=
−=n
k
obsk
calck hh
nMAE
1
1
( )∑=
−=n
k
obsk
calck hh
nRMSE
1
21
unde: n reprezinta numarul punctelor de observatie
obskh reprezinta valoarea sarcinii hidraulice observata in punctul n,..,k,k 1=
calckh reprezinta valoarea sarcinii hidraulice calculata in punctul k.
Valoarea minima gasita a fost aceeasi in toate cele 3 variante, diferentele dintre
cele 3 solutii optime fiind nesemnificative:
E=271, MAE = 1.428 si RMSE = 1.765, si:
( ) ( )( )
( )4
4
4321
1017.1 , 21 10, , 041
1021.1 , 27 1, , 85
102.1 , 27 0.1, , 89,,,
−
−
−
⋅⋅⋅=RKKK hhh
Evident, si hartile piezometrice sunt foarte asemanatoare. In figura 5.4. este
prezentata harta piezometrica (si puturile de observatie) in varianta 1:
86
Fig. 5.4. Cotele piezometrice calculate. Erorile in punctele de observatie.
Fig. 5.5. Diferenta intre valoarea calculata si cea masurata intr-un put de obs.
Daca se considera si conductivitatea hidraulica in stratul 2 ca parametru
[ ]50,05.022 ∈= vh KK m/zi, valoarea minima gasita de PEST pentru functia obiectiv este
aceeasi, E = 271, (MAE = 1.428 si RMSE = 1.765), valori ce se ating pentru seturi
optime de parametri apropiate de cele gasite mai sus:
( ) ( )( )( )4
4
4321
1018.1 , 22 17, , 88
1024.1 , 23 , 13 , 82
1019.1 , 23 8, , 39,,
−
−
−
⋅⋅⋅=RKKK hhh
Eroarea
hobs+1m
hobs-1m
hobs
hcalc
87
Valorile gasite mai sus pentru RKKK hhh ,,, 321 reprezinta valori medii ale
parametrilor respectivi. Pentru ca modelul sa reflecte mai bine situatia reala (caracterizata
de un grad ridicat de heterogenitate), acesti parametrii au fost considerati functii (in loc
de constante). S-au studiat doua variante: zonarea (in care parametrii sunt, practic, functii
constante pe portiuni) si interpolarea (utilizata de metoda punctelor pilot).
88
5.2. Calibrarea acviferului folosind zonarea
Zonarea acviferului de suprafata si a celui de adancime s-a facut mai intai
utilizand informatiile (hidro)geologice existente. Acviferul de suprafata (stratul 1) a fost
impartit in 5 zone, iar acviferul de adancime (stratul 3) a fost impartit in 4 zone. S-a
stabilit acelasi raport de anizotropie vh KK = 10 in toate zonele, mai putin stratul de
mijloc (semipermeabil) pentru care s-au considerat (din nou) cele 3 variante.
In startele 1 si 3 s-a considerat ca parametrul hK (conductivitatea hidaulica in
plan orizontal) variaza in intervalul 10..300 m/zi, respectiv in intervalul 10..200 m/zi.
Valoarea initiala, in toate zonele, a fost de 200 m/zi.
Pentru alimentarea din precipitatii s-au stabilit 6 zone in care acest parametru
variaza in intervalul 10-5..10-3 m/zi. Valoarea initiala, in toate zonele a fost 0.0003 m/zi.
Modelul depinde, deci, de 15 parametri.
Valorile optime ale parametrilor (aproximativ aceleasi in toate cele 3 variante)
sunt prezentate in fig. 5.6. Intre solutiile optime gasite in cele 3 variante diferentele sunt
nesemnificative. La fel si diferentele intre valorile minime gasite de PEST pentru
functia obiectiv:
• 22vh KK = = 0.1 m/zi ⇒E = 173, MAE = 1.122 si RMSE = 1.409
• 22vh KK = = 1 m/zi ⇒ E = 174, MAE = 1.133 si RMSE = 1.413
• 22vh KK = =10 m/zi ⇒ E = 173, MAE = 1.133 si RMSE = 1.411
Pentru comparatie, cea mai mica valoare a erorii obtinuta prin calibrare manuala a fost
E = 257, MAE = 1.302 si RMSE = 1.719
89
a) b)
c)
Fig 5.6. Conductivitatea hidraulica orizontala pentru zonele din stratele 1(a) si 3(b)
c) Alimentarea din precipitatii
90
Fig. 5.7. Harta piezometrica rezultata cu parametrii optimi
Pentru a imbunatati rezultatele s-a considerat o zonare mai "fina": Fiecare zona a
fost impartita in doua-trei zone, in speranta unei descrieri mai exacte a situatiei reale. A
rezultat un model cu 31 de parametri: 11 zone pentru conductivitatea hidraulica in stratul
1, 8 zone in stratul 3, 12 zone pentru alimentarea din precipitatii. Conductivitatea
hidraulica in stratul 2 a fost luata 22vh KK = = 10 m/zi. Valoarea minima a functiei
obiectiv a fost: E = 140, iar MAE = 1.003 si RMSE = 1.268.
In figura 5.8. sunt prezentati parametrii optimi (conductivitatea hidraulica) pentru
fiecare zona (din stratele 1 si 3).
91
a) b)
c)
Fig 5.8. Conductivitatea hidraulica orizontala pentru zonele din stratele 1(a) si 3(b)
c) Alimentarea din precipitatii
Desi eroarea este mai mica decat in cazul primei zonari (mai “grosiera”), acest
model nu poate fi acceptat deoarece exista contraste prea mari intre zone alaturate. De
aceea, s-au stabilit niste limite mai stricte pentru conductivitati, modelul rezultat fiind mai
"plauzibil", in ciuda faptului ca eroarea asociata este mai ridicata: E=150; MAE=1.034,
RMSE=1.312.
92
(a) (b)
Fig 5.9. Conductivitatea hidraulica orizontala pentru zonele din stratele 1(a) si 3(b)
In afara de suma patratelor reziduurilor, o buna estimare a validitatii modelului
este data de coeficientul de corelatie definit astfel:
( )( )( ) ( )∑∑
∑
==
=
−⋅−
−−=
n
i
calccalci
n
i
calccalci
n
i
obsobsi
calccalci
hhhh
hhhhr
1
2
1
2
1
unde: obs
h reprezinta media cotelor piezometrice observate
calch reprezinta media cotelor piezometrice calculate
In general, coeficientul de corelatie trebuie sa fie peste 0.9 pentru ca modelul sa
poata fi validat (Hill, 1998). In primul caz (cu zone mai putine) coeficientul de corelatie
este r = 0.969, iar in modelul cu zonarea mai fina (ultimul caz), valoarea lui creste la r =
0.984.
93
5.3. Calibrarea acviferului folosind metoda punctelor pilot
In metoda punctelor pilot, spre deosebire de zonare, parametrii fizici nu
inregistreaza salturi bruste, nenaturale, de la o celula la alta. Un alt avantaj este acela ca
pozitia punctelor pilot nu este atat de determinanta pentru model, asa cum este stabilirea
zonelor. In general, aceste puncte pilot sunt uniform raspandite in intregul domeniu.
S-au luat in calcul doua variante:
A) Considerand acviferul tri-strat, ca mai sus. Numarul de puncte pilot a fost
crescut treptat (plecand de la un model cu 5 puncte pilot pentru 1hK , 5 pentru 3
hK , 5
pentru alimentarea din precipitatii).
B) Considerand acviferul monostrat (varianta in care timpul de calcul, dar si
eroarea rezultata, sunt mai mici). Si aici au fost construite mai multe modele, crescand
treptat numarul de puncte pilot (plecand de la un model cu 8 puncte pilot pentru hK si 8
pentru R).
94
A) Reprezentare tri-strat
A1) Model 5x5x5 (5 puncte pilot pentru 1hK , 5 pentru 3
hK , 5 pentru R).
Este un model cu 17 parametri (in afara celor 15 valori in punctele pilot, mai sunt
2 parametri: conductivitatea hidraulica verticala in stratul 1 si in stratul 3). Pentru
conductivitatea hidraulica in stratul 2 s-au luat din nou 3 variante, dar diferentele intre
parametrii optimi au fost nesemnificative. Valoarea minima a functiei obiectiv a fost:
E=194, MAE = 1.211 si RMSE = 1.495
a) b)
c)
Fig. 5.10. Model 5x5x5. Conductivitatea hidraulica pentru zonele din stratele 1(a) si 3(b)
c) Alimentarea din precipitatii
95
A2) Model 10x8x10 (10 puncte pilot pentru 1hK , 8 pentru 3
hK , 10 pentru R)
Este un model cu 28 de parametri (conductivitatea hidraulica verticala in stratele
1 si 3 a fost considerata constanta: 5,10 31 == vv KK ). In stratul 2 s-a luat 22vh KK = = 1
m/zi. Valoarea minima a functiei obiectiv a fost:
E=162, MAE = 1.096 si RMSE = 1.365
a) b)
c)
Fig. 5.11. Model 10x8x10. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)
c)Alimentarea din precipitatii
96
A3) Model 15x10x10
Model cu 35 de parametri.
5,10 31 == vv KK , 22vh KK = = 1 m/zi.
E=148, MAE = 1.019 si RMSE = 1.306
a) b)
c)
Fig. 5.12. Model 15x10x10. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)
c)Alimentarea din precipitatii
97
A4) Model 20x15x15
Model cu 50 de parametri.
5,10 31 == vv KK , 22vh KK = = 1 m/zi.
E=143, MAE = 0.985 si RMSE = 1.281
a) b)
c)
Fig. 5.13. Model 20x15x15. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)
c)Alimentarea din precipitatii
98
A5) Model 26x20x20
Model cu 66 de parametri.
5,10 31 == vv KK , 22vh KK = = 1 m/zi.
E=119, MAE = 0.927 si RMSE = 1.168
a) b)
c)
Fig. 5.14. Model 26x20x20. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)
c)Alimentarea din precipitatii
99
A6) Model 30x25x25
Model cu 80 de parametri.
5,10 31 == vv KK , 22vh KK = = 1 m/zi.
E=111, MAE = 0.888 si RMSE = 1.129
a) b)
c)
Fig. 5.15. Model 30x25x25. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)
c) Alimentarea din precipitatii
In figura 5.16 este reprezentata grafic variatia minimului gasit de PEST, minE , cu
numarul de parametri. Se observa o tendinta de descrestere de forma:
BAxy −=
100
Dupa cum se stie, insa, numarul de parametri nu poate depasi numarul
observatiilor (au fost considerate 87 puturi de observatie), in caz contrar, solutia devine
instabila.
Tabel 5.1 : Modele tristrat
Nr parametri Puncte pilot pt K, stratul 1
Puncte pilot pt K, stratul 3
Puncte pilot pt Recharge minE RMSE
Nr. apelari MODFLOW
/ iteratie 1 3 271 1.765 7 2 17 5 5 5 194 1.495 28 3 28 10 8 10 162 1.365 51 4 35 15 10 10 148 1.306 72 5 50 20 15 15 143 1.281 75 6 66 26 20 20 119 1.168 128 7 80 30 25 25 111 1.129 135 8 87 35 20 32 111 1.129 172
y = 386 x-0.27
0
50
100
150
200
250
300
350
0 20 40 60 80 100
Numar de parametri
E m
in
Fig. 5.16. Variatia minimului functiei eroare, minE , cu numarul de parametri,
pentru reprezentarea tristrat
101
B) Reprezentare monostrat
B1) Model omogen
Considerand un model cu 2 parametri (conductivitatea hidraulica si alimentarea
din precipitatii), minimul gasit de PEST a fost: E = 325.4, MAE = 1.595, RMSE = 1.938,
iar parametrii optimi: K = 200 m/zi (limita superioara considerata in acest caz) si R =
0.0003 m/zi.
In figura de mai jos este prezentata harta piezometrica obtinuta cu acesti parametri
(precum si erorile in punctele de observatie).
Fig. 5.17. Harta piezometrica pentru modelul monostrat omogen
Ca si in cazul modelului tristrat, s-au considerat mai multe variante, crescand
treptat numarul punctelor pilot, observand descresterea valorii minime a functiei obiectiv,
minE , odata cu cresterea gradului de complexitate.
102
B2 ) Model 8x8
Model cu 16 parametri (8 puncte pilot pentru conductivitatea hidraulica, 8 pentru
alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 158, iar
MAE = 1.081 , RMSE = 1.345
a) b)
Fig.5.18. Model 8x8: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
B3) Model 10x10
Model cu 20 de parametri (10 puncte pilot pentru conductivitatea hidraulica, 10
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 139.
MAE = 1.031 , RMSE = 1.266.
a) b)
Fig.5.19. Model 10x10: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
103
B4) Model 15x8
Model cu 23 de parametri (15 puncte pilot pentru conductivitatea hidraulica, 8
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 131;
MAE = 0.934 , RMSE = 1.23.
a) b)
Fig.5.20. Model 15x8: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
B5) Model 15x15
Model cu 30 de parametri (15 puncte pilot pentru conductivitatea hidraulica, 15
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 111;
MAE = 0.870 , RMSE = 1.127.
a) b)
Fig.5.21. Model 15x15: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
104
B6) Model 20x20
Model cu 40 de parametri (20 puncte pilot pentru conductivitatea hidraulica, 20
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost mai mare
decat cea gasita in modelul cu 15 parametri: E = 122; MAE = 0.922 , RMSE = 1.184.
a) b)
Fig.5.22. Model 20x20: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
B7) Model 40x35
Model cu 75 de parametri (40 puncte pilot pentru conductivitatea hidraulica, 35
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 73;
MAE = 0.727 , RMSE = 0.916.
a) b)
Fig.5.23. Model 40x35: a) Conductivitatea hidraulica; b) Alimentarea din
precipitatii
105
B8) Model 47x40
Model cu 87 de parametri (47 puncte pilot pentru conductivitatea hidraulica, 40
pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost (aceeasi ca
mai sus): E = 73, MAE = 0.727 , RMSE = 0.916
a) b)
c)
Fig.5.24. Model 47x40: a) Conductivitatea hidraulica; b) Alimentarea din precipitatii
c) Cotele piezometrice calculate
106
Tabel 5.2: Modele monostrat
Numar
parametri Puncte pilot
pentru K Puncte pilot
pentru R minE RMSE
1 2 omogen omogen 331 1.95 2 16 8 8 157 1.345 3 20 10 10 139 1.265 4 22 15 7 131 1.23 5 30 15 15 111 1.127 6 35 20 15 123 1.188 7 40 20 20 122 1.184 8 45 25 20 109 1.117 9 50 25 25 106 1.102 10 60 30 30 96 1.049 11 75 40 35 73 0.915 12 82 47 35 77 0.941 13 87 47 40 73 0.915
y = 452.5 x-0.4
0
50
100
150
200
250
300
350
400
0 20 40 60 80 100
Numar de parametri
E m
in
Fig.5.25. Variatia minimului functiei eroare, minE , cu numarul de parametri,
pentru reprezentarea monostrat
107
5.4. Concluzii
In studiul de caz prezentat in acest capitol s-a aplicat metoda diferentelor finite
pentru modelarea curgerii apei subterane in conul aluvionar al raului Somes. S-a
considerat curgerea in regim stationar, luand ca date de intrare valori medii ale debitelor
si cotelor piezometrice inregistrate pe o perioada de 10 ani. Parametrii hidrogeologici
(conductivitatea hidraulica, alimentarea acviferului) au fost ajustati printr-un proces de
calibrare automata prin metoda Levenberg-Marquardt (metoda utilizata de programul
PEST).
S-au utilizat doua variante de parametrizare:
• zonarea
• interpolarea (metoda punctelor pilot)
Zonele au fost stabilite pe baza datelor existente privind parametrii hidrogeologici
(teste de pompare, etc). Anterior, s-a realizat o calibrare manuala, cea mai mica valoare
obtinuta pentru functia eroare (suma patratelor reziduurilor) fiind E=257. In modelul
rezultat prin calibrare automata (model cu 15 parametri) eroarea a scazut la E=173.
Crescand numarul zonelor (la 31 parametri), eroarea minima a scazut la E=140, dar
modelul rezultat nu este plauzibil, intrucat exista mari contraste (inexistente in realitate)
intre zone adiacente. Pentru a atenua aceste contraste, s-a efectuat o noua calibrare
automata, stabilind, de aceasta data, limite mai stricte pentru conductivitati. Minimul
gasit de PEST a fost E=150.
Metoda punctelor pilot este mai naturala decat zonarea (deoarece parametrii
hidrogeologici nu au salturi bruste de la o celula la alta), mai putin subiectiva (nu necesita
stabilirea zonelor de catre utilizator) si mai usor de implementat. Faptul ca trebuie
calculate, la fiecare iteratie, valorile parametrilor hidrogeologici (pentru celulele care nu
sunt "puncte pilot") nu mareste in mod semnificativ timpul de calcul.
Metoda punctelor pilot a fost aplicata in doua variante:
108
A) Considerand acviferul tri-strat. Numarul de puncte pilot a fost crescut treptat,
plecand de la un model cu 17 parametri (5 puncte pilot pentru 1hK , 5 pentru 3hK , 5 pentru
alimentarea din precipitatii, si, in plus, 1vK si 3vK ), pana la unul cu 87 de parametri.
Minimul functiei eroare (obtinut de PEST) a scazut de la 194 la 111, in timp ce numarul
mediu de apelari per iteratie ale modelului direct (si, implicit, timpul de calcul) a crescut
de la 28 la 172.
B) Considerand acviferul monostrat (varianta in care timpul de calcul, dar si
eroarea rezultata, sunt mai mici). Si aici au fost construite mai multe modele, crescand
treptat numarul de puncte pilot, plecand de la un model cu 16 parametri (8 puncte pilot
pentru hK si 8 pentru R), pana la un model cu 87 de parametri. Minimul functiei eroare a
scazut, in acest caz, de la 157 la 73, iar numarul de apelari ale modelului direct a crescut
de la 30 la 197.
Crescand numarul de parametri (numarul de puncte pilot), descreste minimul
functiei eroare gasit de PEST. Totusi, de la un punct incolo cresterea numarului de
parametri nu mai imbunatateste semnificativ valoarea minima a erorii.
In figura 5.26 este reprezentata grafic variatia minimului functiei eroare, minE , cu
numarul de parametri in cele doua variante. Se observa ca reprezentarea monostrat
furnizeaza rezultate mai bune, conducand la ideea ca exista o foarte buna comunicare
intre strate si ca aceasta schematizare nu afecteaza validitatea modelului.
109
0
50
100
150
200
250
300
350
400
0 20 40 60 80 100
Numar de parametri
E m
in Modele tri-strat
Modele monostrat
Fig.5.26. Variatia minimului functiei eroare, minE , cu numarul de parametri.
Comparatie intre reprezentarea tristrat si cea monostrat
110
6. Concluzii. Contributii personale. Directii de cercetare
Se stie ca procesul de curgere al apei subterane poate fi descris printr-o ecuatie cu
derivate partiale in care necunoscuta (variabila de stare) este sarcina hidraulica, iar
coeficientii sunt parametrii hidrogeologici ai acviferului, distribuiti spatial. Dar, pentru a
construi un model matematic care sa simuleze procesul de curgere, trebuie mai intai
stabilite urmatoarele elemente:
- regimul de curgere (stationar sau tranzitoriu)
- schematizarea acviferului (2D, multistrat, 3D) si alegerea corespunzatoare a
tipului de ecuatie care modeleaza curgerea
- tipul acviferului (cu nivel liber sau sub presiune)
- conditiile de margine
- metoda numerica folosita (diferente finite sau element finit)
Dupa stabilirea acestor elemente, urmatorul pas il constituie identificarea
parametrilor hidrogeologici ai acviferului (conductivitatea hidraulica, alimentarea din
precipitatii, etc), mai precis, determinarea acelor parametri pentru care diferentele dintre
sarcinile hidraulice calculate si cele observate sunt minime. Identificarea parametrilor
(sau rezolvarea problemei inverse) presupune doua etape:
1. Alegerea metodei de parametrizare (zonare / interpolare) si stabilirea
zonelor (respectiv, a punctelor pilot)
2. Alegerea metodei de rezolvare a problemei de optimizare si aplicarea
acesteia pentru minimizarea functiei eroare.
Aceste doua etape au constituit obiectul tezei, atat sub aspect teoretic, cat si
practic. Astfel, daca in prima parte a tezei (primele trei capitole) se defineste matematic
problema inversa in hidrogeologie si sunt descrise principalele metode folosite pentru
rezolvarea acesteia, in a doua parte sunt prezentate rezultatele aplicarii lor in calibrarea
unui acvifer sintetic (capitolul 4), respectiv, real (capitolul 5).
111
Problema de optimizare propusa de metoda celor mai mici patrate poate fi
rezolvata folosind fie metode clasice, traditionale, de programare neliniara, fie tehnici de
cautare globala care sunt mai robuste (avand capacitatea de a evita oprirea la un optim
local) si nu necesita calculul derivatelor functiei obiectiv. Aceste tehnici de optimizare
neconventionale (din care fac parte algoritmii genetici si metoda calirii simulate) incep
sa castige teren si in domeniul calibrarii parametrilor hidrogeologici.
In capitolul 4 am realizat o comparatie intre un algoritm genetic real, un algoritm
genetic binar si metoda calirii simulate. Aplicarea acestor metode pentru calibrarea unui
acvifer sintetic s-a realizat prin programe de calcul personale. Concluzia desprinsa in
urma rezultatelor este ca algoritmul genetic real converge mai rapid decat algoritmul
genetic binar, fiind si mai natural, mai usor de implementat decat acesta. Solutiile gasite
de algoritmul genetic real (care exploreaza spatiul utilizand mai multe puncte simultan)
aproximeaza mai exact valorile reale decat cele obtinute prin metoda calirii simulate
(pentru acelasi numar de evaluari ale functiei obiectiv).
In prezent, cea mai utilizata metoda de parametrizare este zonarea. Dar aplicarea
acestei metode presupune un grad ridicat de subiectivitate rezultata din stabilirea
numarului si formei zonelor. Un alt neajuns al zonarii este aparitia unor contraste mari,
neverosimile, intre celule / elemente alaturate (situate in zone diferite). Aceste neajunsuri
sunt depasite daca se utilizeaza o metoda de interpolare. De aceea, pentru calibrarea
acviferului real – conul aluvionar al raului Somes – am utilizat ambele metode: atat
zonarea, cat si metoda punctelor pilot, realizand o comparatie intre rezultatele obtinute.
Metoda punctelor pilot este mai naturala si mai putin subiectiva decat zonarea, dar
si mai usor de implementat: astfel, am putut realiza mai multe variante ale modelului,
crescand treptat numarul punctelor pilot si observand descresterea erorii (mult sub
valoarea obtinuta utilizand zonarea).
Datele hidrogeologice existente au condus la o reprezentare tri-strat a acviferului,
realizata in cadrul proiectului SQUASH (Somes/Szamos Quantitative/Qualitative Study
of the Hydrogeology). Conul aluvionar al raului Somes se considera format din trei
112
unitati hidrogeologice: un acvifer de suprafata, un strat semipermeabil argilos si un
acvifer de adancime, sub presiune.
Cu toate acestea, am considerat utila si realizarea unui model simplu, mono-strat,
parametrizat tot prin metoda punctelor pilot, crescand treptat dimensiunea parametrizarii
(numarul punctelor pilot). Un rezultat interesant a fost faptul ca eroarea este mai mica in
cazul modelului monostrat decat pentru cel tri-strat, ceea ce inseamna ca exista o buna
comunicare intre acviferul de suprafata si cel de adancime prin stratul semi-permeabil, iar
o reprezentare simpificata mono-strat nu afecteaza validitatea modelului.
Contributii personale
Contributiile personale pot fi rezumate in cele ce urmeaza:
- Sinteza documentara cu privire la problema inversa in hidrogeologie si
metodele de optimizare (clasice si neconventionale) utilizate pentru rezolvarea
acesteia.
- Aplicarea a doua metode de optimizare neconventionale - algoritmii genetici
(in codificare reala si binara) si metodei calirii simulate - pentru calibrarea
unui acvifer sintetic. Pentru aceasta s-au realizat programe proprii de calcul.
- Calibrarea unui acvifer real utilizand doua metode de parametrizare: zonarea
si metoda punctelor pilot.
- Metoda punctelor pilot a fost aplicata crescand, treptat, dimensiunea
parametrizarii si observand descresterea functiei eroare.
- Realizarea unei comparatii intre modelul tristrat (format dintr-un acvifer de
adancime, unul freatic si un strat semipermeabil) si modelul monostrat,
demonstrand comunicarea buna intre acviferul freatic si cel de adancime.
113
Directii de cercetare
O parte din directiile in care se pot dezvolta cercetari ulterioare sunt:
- Identificarea parametrilor hidrogeologici ai acviferului considerand regimul
de curgere nepermanent
- Utilizarea metodei calirii simulate si algoritmilor genetici, dar si a altor tehnici
de optimizare neconventionale (cum ar fi: retelele neurale artificiale,
algoritmul roiului de particule, algoritmul musuroiului de furnici, etc) pentru
calibrarea acviferului real
- Realizarea unei comparatii intre rezultatele obtinute aplicand metode clasice
de optimizare si cele obtinute prin tehnici neconventionale.
114
Bibliografie
Aly, A., Peralta, R. C. (1999). "Comparison of a genetic algorithm and mathematical
programming to the design of groundwater cleanup systems." Water Resources Research,
35(8), 2415-2425.
Anderson, M.P., Woessner, W.W. (1992) Applied groundwater modeling: Simulation of
flow and advective transport. Academic Press, San Diego, California.
Brouyère, S. (2002) Modelling in Hydrogeology. SQASH Project, Training Course,
Liège, May – August 2002.
Carrera J, Alcolea A, Medina A, Hidalgo J, Slooten LJ (2005) Inverse problem in
hydrogeology. Hydrogeol. J., 13(2): 206 – 222.
Carrera, J., Neuman, S. P. (1986), Estimation of aquifer parameters under transient and
steady state conditions: 1. Maximum likelihood method incorporating prior information.
Water Resources Research, 22(2), 199– 210.
Cieniawski, S.E., Eheart, J.W., Ranjithan, S. (1995) Using genetic algorithms to solve a
multiobjective groundwater monitoring problem. Water Resour. Res., 31(2): 399 - 409.
Cooley, R.L. and Naff, R.L. (1990) Regression modeling of ground-water flow.
U.S.Geological Survey Techniques in Water-Resources Investigations, book 3.
Danchiv, A., Stematiu, D. (1997) Metode numerice in hidrogeologie. Editura didactica si
pedagogica, Bucuresti.
Dassargues, A. (1995) Modèles mathématiques en hydrogeologie. Editura didactica si
pedagogica, Bucuresti.
115
Dassargues, A., Brouyère, S., Lenart, L., Szucs, P., Virag, M, Miko, L., Szabo, A.,
Madarasz, T., Drobot, R., Bretotean, M., Minciuna, M., Filip, A., Popescu, I.C. (2001)
SQASH Project. Intermediate Report.
de Marsily GH, Lavedan G, Boucher M, Fasanino G (1984) Interpretation of interference
tests in a well field using geostatistical techniques to fit the permeability distribution in a
reservoir model. Verly et al (ed) Proc Geostatistics for natural resources
characterization. Part 2. D. Reidel Pub. Co. : 831–849.
Deb, K. (1998) Genetic Algorithm in Search and Optimization: The Technique and
Application. Proceedings of International Workshop on Soft Computing and Intelligent
Systems, Calcutta, India: Machine Intelligence Unit, Indian Statistical Institute, 58-87
Doherty, J., L. Brebber & P. Whyte. (2002) PEST – Model-independent parameter
estimation. User's manual. Watermark Numerical Computing, Australia.
Dougherty, D.E., R.A. Marryott, Optimal groundwater management 1. Simulated
Annealing, Water Resour. Res., 27(10), 2493-2508, 1991
Dragota, I. (1998) Metode de calcul numeric. Editura didactica si pedagogica, Bucuresti.
Drobot, R. (1983) Model matematic de programare liniara pentru evaluarea
transmisivitatilor unui mediu permeabil omogen. Hidrotehnica, vol. 28, nr.12: 353-384.
Drobot, R. (1990) Hidrologie. Teoria sistemelor si modelare matematica. Institutul de
Constructii, Bucuresti.
Drobot, R., Toma, C. (1991) Modèle mathématique pour calibrer les paramètres
hydrogéologique dans le cas du mouvement permanent plan-horizontal. XXIe Journées de
l’Hydraulique Sophia Antipolis.
116
Drobot, R., Sarbu, N. (2003) Improvement of the ALSUBTR model for evaluating
natural recharge. Conferinta anuala INHGA, Bucuresti.
Drobot, R., Jianu, M., Sarbu, N., Minciuna, M., Filip, A., Bretotean, M., Brouyère, S.,
Dassargues, A., Popescu, I.C., Szucs, P., Karsai, M., Toth, A., Faur, K., Virag, M. (2004)
Regional Model of the Somes – Szamos Aquifer. Hidrotehnica, vol. 49, no. 9 - 10, 2004.
Dumitrescu, D. (2000) Algoritmi genetici si strategii evolutive - aplicatii in Inteligenta
Artificiala si in domenii conexe, Editura Albastra, Cluj Napoca.
Efstratiadis, A. (2001) Investigation of global optimum seeking methods in water
resources problems. M. Sc. Thesis, Technical University of Athens.
Franke, R. & G. Nielson (1980) Smooth interpolation of large sets of scattered data,
International Journal for Numerical Methods in Engineering, Vol. 15, pp. 1691-1704.
Goldberg, D. E. (1989) Genetic Algorithms in Search, Optimization, and Machine
Learning. Addison-Wesley: New York, NY.
Goldberg, D. E., K. Deb (1991) A comparative analysis of selection schemes used in
genetic algorithms. Foundations of Genetic Algorithms, pp. 69-93, Morgan Kaufman,
San Mateo, CA.
Groza, G. (2005) Analiza numerica. Editura Matrix Rom, Bucuresti.
Guan, J., Aral, M.M. (1999) Optimal remediation with well locations and pumping rates
selected as continuous decision variables. Journal of Hydrology 221: 20 – 42.
Hernandez A.F., Neuman S.P., Guadagnini A, Carrera J. (2003) Conditioning mean
steady state flow on hydraulic head and conductivity through geostatistical inversion.
Stochastic Environmental Research and Risk Assessement, 17 (5):329-338.
117
Hill, M.C. (1990) Preconditioned Conjugate Gradient 2 (PCG2), a computer program for
solving groundwater flow equations, U.S. Geological Survey. Water-resources
investigations report 98-4048, Denver, Colorado
Holland, J. H. (1975) Adaptation in Natural and Artificial Systems. Univ. of Mich. Press,
Ann Arbor.
Houck, C.R., Joines, J.A., Kay, M.G. (1995) A genetic algorithm for function
optimization: a MATLAB implementation. NCSU-IE Technical Report 95-09, North
Carolina State University, Raleigh, NC.
Huang, C., Mayer, A.S. (1997) Pump-and-treat optimization using well locations and
pumping rates as decision variables. Water Resources Research, 33(5): 1001 – 1012
Jianu, M., Drobot, R. (2007) Application of Simulated Annealing for Solving a
Groundwater Flow Inverse Problem. International Conference "Trends and Challenges in
Applied Mathematics” - ICTCAM 2007
Jianu, M. (2008) The Pilot Point Method for Solving a Groundwater Flow Inverse
Problem (I). Mathematical Modelling in Civil Engineering, Bucuresti, No. 1.
Jianu, M., Drobot, R. (2008) The Pilot Point Method for Solving a Groundwater Flow
Inverse Problem (II). Case Study: The Alluvial Fan of Somes River. Mathematical
Modelling in Civil Engineering, Bucuresti, No. 2.
Kirkpatrick S., Gelatt C. D., Vecchi M. P. (1983) Optimization by simulated annealing.
Science 220: 671–680.
Kitanidis, P.K. , Vomvoris, E.G. (1983) A geostatistical approach to the inverse problem
in groundwater modelling (steady state) and one dimensional simulations. Water
Resources Research, 19(3): 677-690.
118
Lavenue A.M., Pickens J.F. (1992). Application of a coupled adjoint sensitivity and
kriging approach to calibrate a groundwater flow model. Water Resources Research,
28(6): 1543-1569.
Levenberg (1944). "A Method for the Solution of Certain Non-Linear Problems in Least
Squares". The Quarterly of Applied Mathematics 2: 164–168
Marquardt, D.W. (1963) An algorithm for least-squares estimation of non-linear
parameters. SIAM Journal on Applied Mathematics, vol. 11 (2): 431 - 441
Marryot, R.A., Dougherty,D.E., Stollar, R.L. (1993) Optimal groundwater management
2. Application of Simulated Annealing to a field-scale contamination site. Water
Resources Research, 29 (4): 847 – 860.
Matheron, G., (1971) The theory of regionalised variables and its applications, Cahiers
du Centre de Morphologie Mathematique, No. 5, Fontainebleau, France.
Mayer, A. S., C. Huang (1999) Development and application of a coupled process
parameter inversion model based on the maximum likelihood estimation method. Adv.
Water Resour., 22(8), 841– 853.
McDonald, M.G., Harbaugh A.W. (1988). MODFLOW, a modular, three-dimensional
finite-difference groundwater flow model. Techniques of the Water-Resources
Investigations of the U.S. Geological Survey, Book 6.
McLaughlin, D., L. R. Townley (1996), A reassessment of the groundwater inverse
problem. Water Resources Research., 32(5), 1131– 1161.
Michalewicz, Z. (1994) Genetic Algorithms + Data Structures = Evolution Programs,
Springer-Verlag, New York.
119
Neuman, S. P. (1973). Calibration of distributed parameter groundwater flow models
viewed as a multiple-objective decision process under uncertainty. Water Resources
Research, 9 (4): 1006-1021.
Nicolau, A. (1982) Analiza numerica. Institutul de Constructii, Bucuresti.
Paltineanu, G., Matei, P., Trandafir, R. (2001) Bazele analizei numerice, Editura
Printech, Bucuresti.
Popa, R., Popa, B. (2003) Optimizarea exploatarii amenajarilor hidroenergetice. Editura
Tehnica, Bucuresti.
Prasad, K.L., Rasogi, A.K. (2001) Estimating net aquifer recharge and zonal hydraulic
conductivity values for Mahi Right Bank Canal project area, India by genetic algorithm.
Journal of Hydrology, 243: 149 – 161.
RamaRao, B.S., LaVenue, A.M., de Marsily Gh, Marietta, M.G. (1995) Pilot point
methodology for automated calibration of an ensemble of conditionally simulated
transmissivity fields. 1. Theory and computational experiments . Water Resources
Research, 31(3): 475 – 494.
Reed, P., Minsker, B., Goldberg, D.E. (2000) Designining a competent simple algorithm
for search and optimization. Water Resources Research 36 (12): 3757 – 3761.
Rogers, L.L., Dowla, F.U. (1994) Optimization of groundwater remediation using
artificial neural networks with parallel solute transport modeling. Water Resources
Research, 30 (2): 457 – 481.
120
Rogers, L. L., F. U. Dowla, V. M. Johnson. (1995). Optimal Field-Scale Groundwater
Remediation Using Neural Networks and the Genetic Algorithm, Environ. Sci. Technol.
29, 1145-1155.
Sun, N.-Z., A. Y. Sun (2002) Parameter identification of environmental systems.
Environmental Fluid Mechanics: Theories and Applications, cap. 9, 297– 337, ASCE
Takeshita, Y., Kohno, I., Yasui, K. (2000) Determination of the hydraulic properties of a
multilayered aquifer from pumping test data using genetic algorithms. Calibration and
Reliability in Groundwater Modelling (Proceedings of the ModelCARE’99 Conference)
IAHS Publ. No. 265, 229 – 235.
Thierens, D., Goldberg, D. E., Pereira, A. G. (1998) Domino Convergence, Drift, and the
Temporal-Salience Structure of Problems. The 1998 IEEE International Conference on
Evolutionary Computation Proceedings, pp. 535-540, IEEE Press: New York, NY.
Tsai, F.T.-C., N.-Z. Sun, W.W.-G. Yeh (2003) A combinatorial optimization scheme for
parameter structure identification in groundwater modeling. Ground Water, 41(2).
Wang, H., Anderson, M. (1982) Introduction to groundwater modeling: finite difference
and finite element methods. Academic Press, San Diego, California.
Yan, S. , Minsker, B. S. (2004). A Dynamic Meta-Model Approach to Genetic Algorithm
Solution of a Risk-Based Groundwater Remediation Design Model. ASCE. EWRI. 2004,
Salt Lake City, UT.
Yeh, W. W.-G. (1986), Review of parameter identification procedures in groundwater
hydrology: The inverse problem. Water Resources Research, 22(2), 95– 108.
Yeh, W. W.-G., Y. S. Yoon, L. S. Lee (1983) Aquifer parameter identification with
kriging and optimum parameterization. Water Resources Research, 19(1): 225- 233.