MODELE DE OPTIMIZARE PENTRU IDENTIFICAREA …digilib.utcb.ro/repository/ccn/pdf/jianu.pdf ·...

UNIVERSITATEA TEHNICĂ DE CONSTRUCłII BUCUREŞTI

MODELE DE OPTIMIZARE

PENTRU IDENTIFICAREA PARAMETRILOR

HIDROGEOLOGICI

DOCTORAND:

MARILENA JIANU

CONDUCĂTOR ŞTIINłIFIC:

Prof. dr. ing. RADU DROBOT

BUCUREŞTI

2009

2

Doresc sa multumesc tuturor celor care, pe parcursul elaborarii tezei, m-au

sprijinit si m-au ajutat!

In mod special, doresc sa-i multumesc conducatorului meu stiintific, domnului

Profesor Radu Drobot, pentru entuziasmul si profesionalismul cu care m-a familiarizat

cu un domeniu nou pentru mine, pentru modul in care m-a indrumat si coordonat pe tot

parcursul acestor ani.

De asemenea, multumesc domnului Profesor Alain Dassargues si dr. Serge

Brouyère de la Universitatea din Liege, pentru sprijinul acordat in perioada petrecuta in

cadrul acestui laborator.

Multumesc colegilor din Catedra de Matematica a UTCB, in special domnului

Profesor Gavriil Paltineanu si domnului Profesor Ghiocel Groza, pentru toate sugestiile

la adresa elaborarii lucrarii şi pentru climatul de prietenie pe care l-am avut.

Multumesc, de asemenea, colegilor din Catedra de Constructii Hidrotehnice

pentru discutiile avute pe marginea lucrarii.

Multumesc familiei mele pentru sprijinul acordat si pentru rabdarea cu care au

suportat privatiunile perioadei de pregatire a doctoratului.

3

Cuprins

Introducere.....................................................................................................................5

1. Problema directa si problema inversa in hidrogeologie................................7

1.1. Ecuatiile curgerii subterane............................................................................7

1.2. Metode numerice de rezolvare.......................................................................10

1.3. Problema inversa. .........................................................................................14

1.4. Metode de parametrizare...............................................................................19

1.4.1. Zonarea...........................................................................................19

1.4.2. Interpolarea. Metoda punctelor pilot..............................................20

1.5. Metode de calibrare.......................................................................................27

1.5.1. Metode directe.................................................................................27

1.4.2. Metode indirecte..............................................................................29

2. Metode clasice de optimizare...............................................................................33

2.1. Introducere.....................................................................................................33

2.2. Metoda celei mai rapide descresteri..............................................................36

2.3. Metoda Gauss-Newton...................................................................................37

2.4. Metoda Levenberg-Marquardt......................................................................38

2.5. Metoda directiilor conjugate.........................................................................40

2.6. Metoda lui Newton.........................................................................................41

2.7. Metode cvasi-Newton.....................................................................................42

2.8. Calculul coeficientilor de senzitivitate..........................................................43

3. Tehnici de cautare globala...................................................................................45

3.1 Algoritmi genetici............................................................................................46

3.1.1. Introducere.......................................................................................46

3.1.2. Structura unui algoritm genetic.......................................................48

3.1.3. Reprezentarea cromozomiala..........................................................51

4

3.1.4. Operatorii genetici...........................................................................53

3.1.5. Parametrii de control ai unui algoritm genetic...............................60

3.2 Metoda calirii simulate...................................................................................62

3.2.1. Introducere.......................................................................................62

3.2.2. Structura algoritmului de calire simulata........................................63

3.2.3. Parametrii algoritmului de calire simulata.....................................65

4. Calibrarea unui acvifer sintetic (virtual) folosind tehnici de optimizare

neconventionale............................................................................................................66

4.1. Descrierea modelului.....................................................................................66

4.2. Structura algoritmilor utilizati......................................................................68

4.3. Calibrarea acviferului impartit in 2 zone.....................................................70

4.4. Calibrarea acviferului impartit in 4 zone.....................................................75

4.5. Concluzii........................................................................................................79

5. Identificarea parametrilor hidrogeologici pentru un acvifer real............80

5.1. Conul aluvionar al raului Somes. Modelul conceptual...............................80

5.2. Calibrarea acviferului folosind zonarea.......................................................88

5.3. Calibrarea acviferului folosind metoda punctelor pilot...............................93

5.4. Concluzii.......................................................................................................107

6. Concluzii. Contributii personale. Directii de cercetare..............................110

Bibliografie..................................................................................................................114

5

Introducere

Resursele de apa subterana constituie o sursa importanta de alimentare cu apa

necesara pentru consumul populatiei, sau pentru a fi utilizata in industrie si uneori si in

agricultura. Pentru estimarea acestor rezerve, dar si pentru a evalua corect raspunsul unui

acvifer la anumite solicitari sau la poluare este necesara crearea unor modele care sa

simuleze cat mai real procesele fizice din acvifer.

Curgerea apei subterane, ca si transportul substantelor poluante sunt procese ce

pot fi descrise prin intermediul unor ecuatii cu derivate partiale. Modelele matematice

utilizate pentru a descrie comportamentul acviferelor folosesc o serie de parametri,

variabili in spatiu, care au semnificatie fizica si care pot fi masurati doar local. Pentru

conductivitatea hidraulica, de exemplu, pot exista valori punctuale, calculate pe baza

testelor de pompare. Dar, intrucat aceste teste au o durata limitata si se bazeaza pe niste

supozitii simplificatoare (cum ar fi cea de omogenitate in jurul putului), rezultatele

testelor de pompare reflecta conditii locale si nu pot fi folosite cu succes in modelele

regionale.

De regula, parametrii hidrogeologici regionali sunt estimati pe baza valorilor

observate ale variabilei de stare, rezolvand problema inversa: mai precis, se cauta acea

distributie a parametrilor astfel incat valorile variabilei de stare calculate de modelul

matematic sa fie cat mai apropiate de cele observate. Tehnica de calcul a avansat extrem

de rapid si, in consecinta, s-au facut mari progrese in rezolvarea problemei directe, chiar

si in conditiile unui nivel ridicat de eterogenitate. Problema inversa ramane, insa, o

provocare din cauza complexitatii sistemelor hidrogeologice, precum si a insuficientei

datelor masurate.

Aceasta teza aduce o contributie la cunoasterea si aplicarea unor metode

matematice pentru identificarea parametrilor hidrogeologici.

6

Primul capitol contine formularea matematica a problemei inverse in

hidrogeologie. Sunt descrise principalele metode de parametrizare (zonarea si

interpolarea), precum si metodele de calibrare utilizate pana in prezent in hidrogeologie.

Identificarea parametrilor hidrogeologici revine la o problema de minimizare a unei

functii eroare. Aceasta problema de optimizare poate fi rezolvata fie prin metode clasice

de programare neliniara, fie prin metode neconventionale, cum ar fi metoda calirii

simulate sau algoritmii genetici.

In al doilea capitol sunt prezentate pe scurt cele mai importante metode clasice de

optimizare. Dintre acestea, metoda Levenberg - Marquardt a fost utilizata in realizarea

studiului de caz descris in capitolul 5.

Metodele de optimizare neconventionale au devenit foarte populare in ultimii ani

datorita capacitatii lor de a identifica minimul global al unei functii fara a utiliza

derivatele acesteia. In capitolul 3 sunt descrise doua dintre aceste metode – metoda calirii

simulate si algoritmii genetici – metode ce au fost aplicate pentru calibrarea unui acvifer

sintetic prezentat in capitolul 4.

Identificarea parametrilor hidrogeologici ai unui acvifer real, de mare

complexitate si avand un caracter transfrontalier – conul aluvionar al raului Somes – este

descrisa in capitolul 5. S-au utilizat doua metode de parametrizare: zonarea si metoda

punctelor pilot. Metoda punctelor pilot a fost aplicata crescand treptat dimensiunea

parametrizarii (numarul de puncte pilot) si s-a dovedit a furniza rezultate mai bune decat

zonarea. Totodata, este si mai naturala, deoarece se evita salturile bruste, neverosimile,

dintre doua celule alaturate.

Ultimul capitol contine concluziile generale ale lucrarii, contibutiile tezei la

problematica abordata, precum si propuneri pentru directiile viitoare de cercetare.

7

1. Problema directa si problema inversa in hidrogeologie

1.1 Ecuatiile curgerii subterane

Procesul de curgere al apei subterane, ca si procesul de transport al poluantilor,

pot fi descrise printr-o ecuatie cu derivate partiale in care necunoscuta (variabila de stare)

este sarcina hidraulica, ( )thh x,= , respectiv concentratia, ( )tCC x,= iar coeficientii sunt

parametri ai acviferului, distribuiti spatial. Aceasta ecuatie cu derivate partiale impreuna

cu conditiile de margine si conditia initiala (in problemele dependente de timp), formeaza

modelul matematic al procesului respectiv.

Ecuatiile ce modeleaza curgerea si, respectiv, transportul poluantilor in acvifere

pot fi formulate astfel:

( ) 01 =−∇⋅∇−∂∂≡ QhK

t

hSL s in [ ]Tt ,0×Ω (1.1)

( ) ( ) 02 =−−∇⋅∇−∂

∂≡ se

e QCCqCDnt

CnL in [ ]Tt ,0×Ω (1.2)

cu conditiile initiale:

( ) ( )x,x 00 hth = in Ω (1.3)

( ) ( )x,x 00 CtC = in Ω (1.4)

si conditiile la limita:

( ) hbhh hHnhK γξβ +−=⋅∇⋅ pe [ ]Tt ,0×Γ (1.5)

( ) ( ) CbCeC CCnCqCDn γξβ +−=⋅−∇⋅ pe [ ]Tt ,0×Γ (1.6)

unde: ( )thh x,= este sarcina hidraulica (cota piezometrica) [L]

( )tQQ x,= reprezinta termenul sursa/put (fluxul schimbat de acvifer cu exteriorul

(alimentarea din precipitatii, debitele exploatate) [T-1]

( )xss SS = este coeficientul de inmagazinare specifica [L-1].

( )xDD = este tensorul dispersiei hidrodinamice [L2/T]

( )tCC x,= este concentratia [M/L3]

8

( )xee nn = este porozitatea efectiva [-]

( ) hKtqq ∇−== x, este fluxul Darcy (viteza aparenta)[L/T]

( )tCC ss x,= reprezinta concentratia termenului sursa/put [M/L3]

3ℜ⊂Ω este domeniul spatial , avand frontiera Γ

[ ]Tt ,0 este domeniul temporal

( ) Ω∈= zyx ,,x este variabila spatiala

( )xKK = este tensorul conductivitatii hidraulice. De obicei se considera ca

directiile principale de anizotropie corespund axelor de coordonate :

=

z

y

x

K

K

K

K

00

00

00

.

O forma mai generala (dar mai putin utilizata) este:

=

zzzyzx

yzyyyx

xzxyxx

KKK

KKK

KKK

K .

Coeficientii γξβ ,, din ecuatiile (1.5) si (1.6) variaza de-a lungul frontierei, in

functie de tipul conditiilor de margine. Intr-un punct x de pe frontiera aceste conditii pot

fi:

a) de tip Dirichlet (cota hidraulica impusa), cand 0,0 == γβ

b) de tip Neumann (flux impus), cand 0=ξ

c) de tip Cauchy (Fourier, mixte), cand toti coeficientii sunt nenuli. Sunt folosite

pentru a simula curgerea printr-o limita semipermeabila (de ex. stratul

semipermeabil dintre un rau si acvifer):

( ) ( ) ( )d

tHthKtq r

bn

−−= ,x,x

unde ( )tH r reprezinta nivelul raului, bK este conductivitatea hidraulica a stratului

semipermeabil dintre rau si acvifer, d reprezinta grosimea stratului semipermeabil.

9

Observatie. Ecuatia de curgere (1.1) poate fi scrisa intr-o forma simplificata daca se

admit anumite ipoteze, cum ar fi cea de stationaritate sau Ipoteza Dupuit-Forcheimer,

care transfera problema intr-un domeniu bi-dimensional .

Curgerea in regim permanent (stationara)

Daca variatiile in timp ale sarcinii hidraulice sunt reduse, regimul de miscare se

poate considera independent de timp, sau permanent: ( )xhh = . Din modelul matematic

dispare conditia initiala, iar ecuatia de curgere se scrie tinand cont de faptul ca derivata in

raport cu timpul este nula 0=∂∂

t

h:

( ) 0=+∇⋅∇ QhK

sau, echivalent,

0=+

∂∂

∂∂+

∂∂

∂∂+

∂∂

∂∂

Qz

hK

zy

hK

yx

hK

x zyx (1.7)

Ipoteza Dupuit – Forcheimer

Atunci cand dimensiunile orizontale ale acviferului sunt mult mai mari decat

grosimea acestuia, curgerea poate fi considerata orizontala (adica 0=∂∂z

h). Integrand pe

verticala pentru acvifere captive ecuatia (1.1) se obtine ecuatia bidimensionala (1.8) (care

poate fi folosita si pentru acvifere cu nivel liber daca variatia nivelului in raport cu

inaltimea zonei saturate este redusa):

t

hSq

y

hT

yx

hT

x yx ∂∂=+

∂∂

∂∂+

∂∂

∂∂

(1.8)

pentru regimul tranzitoriu, respectiv,

0=+

∂∂

∂∂+

∂∂

∂∂

qy

hT

yx

hT

x yx (1.9)

pentru regimul permanent, unde:

Tx , Ty reprezinta transmisivitatea pe directia x si, respectiv, y [L2T-1]

S reprezinta coeficientul de inmagazinare [-].

10

1.2. Metode numerice de rezolvare

Aceste ecuatii cu derivate partiale pot fi rezolvate analitic sau numeric. Avantajul

rezolvarii analitice este ca furnizeaza o solutie exacta, relativ simplu de obtinut. Dar,

pentru o rezolvare analitica, este necesar ca proprietatile hidrogeologice ale acviferului,

ca si geometria acestuia, sa fie mult idealizate / simplificate. Pentru cele mai multe cazuri

reale beneficiul obtinerii unei solutii analitice exacte este anulat de erorile introduse prin

ipotezele ce simplifica in mod nerealist conditiile hidrogeologice deosebit de complexe.

Problemele in care metodele analitice sunt inadecvate pot fi rezolvate numeric,

obtinandu-se o solutie aproximativa. Principalele metode numerice folosite in

hidrogeologie sunt metoda diferentelor finite si metoda elementului finit. Acestea

discretizeaza domeniul impartindu-l intr-un numar de subdomenii numite celule,

respectiv, elemente. Parametrii acviferului se considera constanti in interiorul unei celule

(element). Variabila de stare continua, este aproximata prin intermediul unor valori

discrete, definite in anumite puncte (numite noduri). Astfel, ecuatia cu derivate partiale ce

defineste sarcina hidraulica / concentratia in fiecare punct al domeniului spatio-temporal

este transformata intr-un numar finit de ecuatii algebrice in care necunoscutele sunt

valorile variabilei de stare in noduri, la diferite momente de timp. Evident, aproximarea

solutiei reale este cu atat mai exacta cu cat discretizarea este mai fina, deci cu cat

numarul de noduri este mai mare, altfel spus, cu cat dimensiunea sistemului de ecuatii

liniare rezultat este mai mare. In general, aceste sisteme se rezolva prin aplicarea unor

metode numerice iterative.

Ambele metode prezinta avantaje si dezavantaje. Metoda diferentelor finite este

mai simpla (din punct de vedere matematic) si mai usor de transcris intr-un cod de

programare. Metoda elementului finit are avantajul ca reteaua de discretizare este mai

flexibila (decat cea rectangulara din MDF), putand aproxima mai exact limita

domeniului, ca si zonele cu gradient hidraulic ridicat.

Deosebirea fundamentala intre cele doua metode este aceea ca metoda

elementelor finite se bazeaza pe aproximarea functiei necunoscute (sarcina hidraulica sau

concentratia), in timp ce metoda diferentelor finite este bazata pe aproximarea derivatelor

acestei functii. Metoda diferentelor finite calculeaza valoarea variabilei de stare in fiecare

11

nod de calcul, aceasta reprezentand o valoare medie pentru celula respectiva. Nu se face

nici o ipoteza privind variatia variabilei de stare in cadrul celulei. Metoda elementului

finit calculeaza, de asemenea, valorile variabilei de stare in noduri (care sunt varfurile

elementelor), dar, pe baza acestor valori, defineste o aproximare a variabilei de stare

continua pe intreg domeniul spatial Ω.

Metoda diferentelor finite (utilizata de programul utilizat in studiul de caz,

MODFLOW (Mc Donald & Harbaugh, 1988)) foloseste o discretizare spatiala regulata:

celulele sunt paralelipipede / cuburi (in cazul tridimensional). Centrele paralelipipedelor

reprezinta nodurile de calcul. Metoda diferentelor finite calculeaza valoarea variabilei de

stare in fiecare nod, aceasta reprezentand o valoare medie pentru celula respectiva.

Dimensiunile celulei de calcul pot varia de la o celula la alta (de exemplu, discretizarea

poate fi mai fina in regiunea puturilor de exploatare). Parametrii acviferului se considera

constanti in interiorul unei celule.

Prezentam, in cele ce urmeaza, metoda diferentelor finite aplicata ecuatiei de

curgere in regim permanent (1.7), pentru o retea rectangulara in care dimensiunea

celulelor pe directia x, y, si respectiv, z este constanta: x∆ , y∆ , z∆ .

Fig.1.1. Celula (i,j,k) impreuna cu celulele invecinate (Mc Donald & Harbaugh, 1988)

12

Pentru fiecare nod de calcul (i,j,k) din domeniu, ecuatia (1.7) se scrie aproximand

derivatele partiale prin diferente finite (centrate) dupa formula:

x

xxf

xxf

dx

df

∆

∆−−

∆+≈ 22

Aplicand (de doua ori) formula de mai sus pentru derivatele in raport cu x, y si z,

se obtine:

( ) xx

hhK

x

hhK

x

hK

x

kjikjikji

kjikjikji

kji

x ∆∆−

⋅−∆

−⋅

≈

∂∂

∂∂

−−

++

,,1,,,,21

,,,,1,,21

,,

( ) yy

hhK

y

hhK

y

hK

y

kjikjikji

kjikjikji

kji

y ∆∆−

⋅−∆

−⋅

≈

∂∂

∂∂

−−

++

,1,,,,21,

,,,1,,21,

,,

( ) zz

hhK

z

hhK

z

hK

z

kjikjikji

kjikjikji

kji

z ∆∆−

⋅−∆

−⋅

≈

∂∂

∂∂

−−

++

1,,,,21,,

,,1,,21,,

,,

In relatiile de mai sus, ( )kjikji zyxhh ,,,, = reprezinta valoarea sarcinii hidraulice in

nodul de calcul (i,j,k), iar kjiK ,21, + reprezinta conductivitatea de legatura intre celulele

(i,j,k) si (i,j+1,k) (calculata de obicei ca o medie armonica a conductivitatilor in celulele

respective invecinate). Revenind la ecuatia (1.7) si inlocuind derivatele partiale prin

formulele de aproximare se obtine o ecuatie liniara in care necunoscutele sunt valorile

sarcinii hidraulice in nodul de calcul (i,j,k) si in nodurile invecinate:

,..,,,, ,1,,1,,,1,,1,, kjikjikjikjikji hhhhh +−+− :

( ) ( ) ( ) ( )

( ) ( ) kjikjikjikji

kjikjikji

kjikjikji

kjikjikji

kjikjikji

kjikjikji

qhhz

Khh

z

K

hhy

Khh

y

Khh

x

Khh

x

K

,,,,1,,2

21,,,,1,,2

21,,

,,,1,2

,21,,,,1,2

,21,,,,,12

,,21,,,,12

,,21

−=−∆

+−∆

+−∆

+−∆

+−∆

+−∆

−−

++

−−

++

−−

++

De unde rezulta:

13

kjikjikji

kjikji

kjikji

kjikji

kjikji

kjikji

kjikjikjikjikjikjikji

qhz

Kh

z

Kh

y

Kh

y

Kh

x

K

hx

Kh

z

K

z

K

y

K

y

K

x

K

x

K

,,1,,2

21,,1,,2

21,,,1,2

,21,,1,2

,21,,,12

,,21

,,12

,,21,,2

21,,

2

21,,

2

,21,

2

,21,

2

,,21

2

,,21

=⋅∆

−⋅∆

−⋅∆

−⋅∆

−⋅∆

−

−⋅∆

−⋅

∆+

∆+

∆+

∆+

∆+

∆

−−

++

−−

++

−−

++−+−+−+

Scriind aceasta ecuatie pentru fiecare nod (i,j,k) (in care nu sunt definite conditii

de margine) si renumerotand celulele "interne" ale domeniului cu un singur indice:

N,,m K21= , se obtine un sistem de N ecuatii cu N necunoscute:

mNmNmm qhahaha =++ K2211 , N,m 1=

in care coeficientii mna care sunt nenuli se calculeaza pe baza conductivitatilor celulare,

iar termenii liberi, mnq , reprezinta schimbul celulei k cu exteriorul (incluzand si conditii

de margine, daca este cazul). Sistemul se scrie in forma matriceala:

[ ] QhA =

[ ] ( ) N,n,mmnaA 1== este o matrice rara, simetrica, de tip banda: termenii sai nenuli se

afla pe diagonala principala si pe inca 6 diagonale paralele cu aceasta.

( )TNh,h,hh K21= este vectorul sarcinilor hidraulice in fiecare nod

( )TNq,q,qQ K21= reprezinta vectorul debitelor schimbate de fiecare celula cu

exteriorul.

Rezolvarea acestui sistem liniar se poate face prin metode directe (cum ar fi

descompunerea LU) sau prin metode iterative (Jacobi, Gauss-Seidel, metoda gradientilor

conjugati). Solutia gasita prin metodele directe ar trebui sa fie, teoretic, solutia exacta a

sistemului. Practic insa, pentru sisteme „mari” (peste 50 de necunoscute), erorile de

rotunjire se acumuleaza si altereaza substantial solutia. De aceea, se prefera utilizarea

metodelor iterative de rezolvare. Aceste metode pornesc de la o aproximare initiala, 0h ,

care este „imbunatatita” printr-o relatie de recurenta, la fiecare iteratie, pentru a se

apropia cat mai mult de solutia exacta, ∗h . Programul MODFLOW utilizeaza o varianta

a Metodei gradientilor conjugati: "Preconditioned Conjugate Gradient" (Hill, 1990).

14

1.3 Problema inversa

Presupunem ca problema depinde de parametrul ( )xθθ = (in cazul in care exista

mai multi parametri necunoscuti, θ va reprezenta un vector de functii spatiale). Se

noteaza cu ( )tuu x,= variabila de stare (sarcina hidraulica h, pentru ecuatia (1.1),

respectiv, concentratia C, in cazul ecuatiei de transport (1.2)).

Problema directa consta in rezolvarea ecuatiei cu derivate partiale (1.1) sau (1.2)

cunoscand conditiile de margine. Relatia de dependenta dintre solutia problemei directe

u si parametrul θ poate fi descrisa cu ajutorul unui operator sub forma: ( )θF=u .

Rezolvarea analitica este posibila numai in cazuri foarte simple, cum ar fi

curgerea unidimensionala in regim stationar (Mc Laughlin & Townley, 1996) :

( ) [ ]Lxdx

dhxK

dx

d,0 , 0 ∈=

(1.10)

cu conditiile la limita: ( ) 00 hh = si ( ) Qdx

dhxK

Lx

==

(1.11)

Solutia problemei (1.10) – (1.11) este functia ( ) ( )∫+=x

K

dQhxh

0

0 ξξ

Problema inversa

In cazul simplu discutat mai sus, se observa ca operatorul F,

[ ]( ) [ ]( ) ( ) [ ] LxxhLhL ,0 ,0' ,0C,0L:F 12 ∈∀≠∈→ , ( ) hK =F , este inversabil: adica,

cunoscand sarcina hidraulica in fiecare punct, ( )xh , se poate calcula parametrul ( )xK a.i.

sa se verifice (1.10) – (1.11): ( ) ( ) [ ]Lxxh

QxK ,0 , ∈∀

′= .

Acesta este, insa, doar un exemplu teoretic, nu poate fi un caz real. In cele mai

multe cazuri, rezolvarea analitica este practic imposibila si se impune folosirea metodelor

numerice ce transforma ecuatia cu derivate partiale (1.1) sau (1.2) intr-un sistem de

ecuatii liniare (modelul direct, de simulare). Solutia acestui sistem furnizeaza o

aproximare convenabila a variabilei de stare, ( )tuu x,= .

15

Variabila de stare ( )tuu x,= nu este cunoscuta pe intreg domeniul. Practic, numai

un numar finit de valori pot fi cunoscute (masurate). Se noteaza cu ( )Tnuuuu ,,, 21 K=

vectorul valorilor variabilei de stare care pot fi masurate in diferite puncte, la diferite

momente ( ) [ ]Ttnobs ,,, 021 ×Ω∈= ξξξξ K .

Solutia aproximativa data de modelul direct poate fi evaluata comparand valorile

calculate ale variabilei de stare, ( ) ( )( )obsobscalc uu ξθξ F== , cu cele observate, obsu . In

cazul ideal, cand proprietatile sistemului se cunosc cu exactitate, ar trebui ca valorile

calculate sa coincida cu cele observate. In realitate acest lucru este imposibil deoarece:

-ecuatiile liniare la care se ajunge in urma discretizarii sunt doar aproximari ale

fenomenului fizic real;

-caracteristicile sistemului (geometria acviferului, conditiile la limita, debitele

schimbate cu exteriorul, parametrii hidrogeologici) nu se cunosc cu exactitate si/sau au

un grad de complexitate prea ridicat, care nu poate fi reprodus de model; in cele mai

multe cazuri, se recurge la idealizari care simplifica realitatea;

-valorile observate, obsu , contin, inevitabil, erori de masurare.

Deoarece functia ( )tu x, nu este cunoscuta, ci se cunosc doar un numar finit de

valori observate, este convenabila introducerea unui alt operator, F~

, care exprima

vectorul ( )Tn

calc uuuu ,,, 21 K= in functie de parametrul (vectorul de parametri) θ :

( ) ( )( ) ( )θξθξ F~

F === obsobscalc uu , Uad →Θ:F~

,

unde adΘ reprezinta spatiul functiilor parametrice admisibile, ( )xθ , iar nU ℜ⊂ este

spatiul valorilor observate ale variabilei de stare.

Problema inversa (calibrarea modelului) consta in inversarea acestui operator, mai

precis, in identificarea parametrilor hidrogeologici (a distributiei lor spatiale pe domeniul

studiat), cunoscand conditiile pe frontiera si dispunand de un set de valori masurate ale

variabilei de stare, obsu . In cazul ideal, cand modelul matematic reproduce cu exactitate

fenomenul fizic, iar valorile observate sunt masurate exact, solutia problemei inverse este

functia ( ) adΘ∈= θθθ ,x a.i.

16

( )θF~=obsu (1.12).

Pentru ca o problema inversa sa fie „corect-pusa” (in sensul lui Hadamard) aceasta

trebuie sa satisfaca urmatoarele cerinte (Mc Laughlin & Townley,1996):

1) Pentru orice vector de valori observate ale variabilei de stare ( )Tn

obs uuuu ,,, 21 K=

exista o solutie parametrica ( ) adΘ∈= xθθ .

2) Solutia respectiva este unica.

3) Problema inversa este stabila: perturbatii mici in vectorul observatiilor determina

schimbari nesemnificative asupra solutiei parametrice.

O problema „incorect-pusa” poate fi transformata intr-o problema „corect-pusa”

prin restrictionarea multimii functiilor parametrice admisibile, adΘ , adica prin

parametrizare.

Folosirea metodelor numerice pentru rezolvarea problemei directe impune ca

parametrul ( )xθ sa ia numai valori discrete. Cel mai simplu ar fi sa consideram adΘ ca

fiind multimea functiilor de forma ℜ→Ω:θ , ( ) iθθ =x pentru Niei ,1 , x =∈ (unde N

este numarul elementelor de discretizare, ie ). Problema inversa se reduce astfel la

identificarea necunoscutelor Nii ,1 , =θ . Din cauza numarului relativ mic de valori

observate ale variabilei de stare, problema inversa formulata astfel nu este „corect-pusa” :

este instabila (variatii mici ale datelor de intrare modifica substantial solutia) si nu are

solutie unica. Se impune, deci, reducerea numarului de necunoscute (numarul gradelor de

libertate ale parametrului necunoscut ( )xθ ) astfel incat acesta sa nu depaseasca numarul

observatiilor. Procesul de exprimare a proprietatilor hidraulice ale acviferului printr-un

numar relativ mic de parametri („parametrii modelului” – necunoscutele care trebuie

identificate rezolvand problema inversa) se numeste parametrizare (Carrera et al, 2005).

Exista mai multe metode de a reduce numarul parametrilor, dar acestea pot fi grupate in

doua categorii: zonarea si interpolarea.

17

O formula generalizata de parametrizare pentru caracterizarea unui parametru

distribuit ( ) Ω∈= x,xθθ este (Mc Laughlin & Townley,1996):

( ) ( )∑=

=m

jjjp

1

xx φθ (1.13)

unde: m reprezinta dimensiunea parametrizarii (gradul de complexitate);

mjjp,1=

este un set de coeficienti (parametrii modelului). De exemplu, in cazul

zonarii, jp este valoarea parametrului in regiunea jΩ ; in cazul interpolarii, jp este

valoarea parametrului in punctul jx ;

( ) mjj ,1

x,=

φ este un set de functii de baza.

Formula (1.13) poate fi scrisa in urmatoarea forma discreta:

pG ⋅=θ (1.14)

unde: Nℜ∈θ reprezinta vectorul valorilor parametrului θ in cele N noduri de calcul ;

mp ℜ∈ reprezinta vectorul coeficientilor jp (parametrii modelului);

( )mjniijgG,1,1

=== reprezinta o matrice mn× ce defineste structura parametrizarii:

( )ixjijg φ= , (xi reprezinta locatia nodului i.) Ni ,,1K= .

De exemplu, in cazul in care se foloseste zonarea, vom avea:

Ω∉Ω∈

=j

j

ij ,

,g

i

i

xdaca 0

xdaca 1

Fie nmadP ℜ→ℜ⊂:ϕ ( )mn ≥ functia care modeleaza dependenta dintre

vectorul parametrilor modelului, p si vectorul valorilor variabilei de stare in punctele de

observatie, u:

( ) ( )pGp ⋅= F~ϕ (1.15)

In urma parametrizarii, problema inversa (1.12) se scrie in forma:

( ) obsup =ϕ (1.16)

18

Hidrogeologii nu isi propun rezolvarea exacta a ecuatiei (1.16) (ar fi un scop

nerealist, avand in vedere aproximarile / simplificarile facute pentru realizarea modelului

matematic, precum si numarul relativ mic si distributia neadecvata a valorilor observate),

ci gasirea unei aproximari convenabile a solutiei. Calibrarea consta, deci, in aflarea unui

set de parametri mp ℜ∈∗ care, o data introdusi in modelul direct, furnizeaza valori ale

variabilei de stare ( )∗= pucalc ϕ cat mai apropiate de cele observate, obsu . Altfel spus,

ecuatia (1.16) se scrie intr-o forma „realista” astfel:

( ) εϕ += puobs (1.17),

iar scopul calibrarii este minimizarea componentelor vectorului eroare, ε .

Aceasta este problema inversa clasica, in care atat dimensiunea (m) cat si

structura parametrizarii (data de matricea G) se presupun cunoscute (pe baza

informatiilor a priori asupra parametrului distribuit) si se cere identificarea vectorului

necunoscut, mp ℜ∈∗ pentru care diferentele intre valorile calculate si cele masurate ale

variabilei de stare sa fie minime.

Problema inversa extinsa (Sun & Sun, 2002) isi propune sa identifice, pe baza

datelor observate, nu numai vectorul optim al parametrilor modelului, p, ci si

dimensiunea m si structura G optime. Pentru aceasta, pentru fiecare K,2,1=m se

determina perechea optima ( )mm pG , , crescand treptat gradul de complexitate

( ) ( ) ( ) KK →→→→ mm pGpGpG ,,, 2

21

1

Procesul este oprit atunci cand se observa ca nu se mai pot extrage noi informatii

din datele observate existente: marirea dimensiunii parametrizarii nu mai reduce in mod

semnificativ eroarea, determinand, in schimb cresterea incertitudinii parametrilor

(masurata prin urma matricei de covarianta).

19

1.4. Metode de parametrizare

1.4.1. Zonarea

Zonarea este cea mai simpla si cea mai folosita metoda de parametrizare.

Domeniul Ω este impartit intr-un numar de zone (regiuni) jΩ considerate omogene, iar

functia ( )xθ se considera constanta pe portiuni. Dimensiunea parametrizarii, m, este

egala cu numarul de zone. Coeficientii jp reprezinta valoarea parametrului in regiunea

jΩ . Functiile de baza se definesc astfel:

( )

Ω∉Ω∈

=j

jj x,0

x,1xφ

Foarte simpla si usor de aplicat, zonarea are, totusi, un neajuns: numarul si forma

zonelor sunt greu de stabilit. In ultimii ani s-au facut cateva incercari de gasire a unor

tehnici de zonare automata.

Astfel, Sun & Sun [2002] au descris o procedura simpla de tip ″arbore de

regresie″, in care structura zonarii este imbunatatita in mod gradat :

KK →→→ mSSS 21 ,

unde 1S este o structura omogena, 2S este formata din doua zone, etc. Structura 1+mS se

obtine din mS impartind o zona din mS in doua subzone (se alege zona j cea mai

„senzitiva” la datele observate: zona in care jp

E

∂∂

este max.). Procedeul se repeta pana la

indeplinirea unui criteriu de oprire.

Tsai et al [2003] au dezvoltat o metoda de zonare automata cu ajutorul

poligoanelor Voronoi (Thiessen) determinate (in mod unic) de o multime de puncte,

numite puncte de baza. Poligonul Voronoi asociat punctului de baza nx , m,n 1= se

defineste astfel :

( ) ( ) ( ) m,l,nl,x,xdx,xdxxVo lnn 1 =≠∀<Ω∈=

20

Problema determinarii zonelor se reduce astfel la gasirea coordonatelor punctelor de baza

si poate fi rezolvata prin includerea acestora in vectorul variabilelor de decizie.

Fig. 1.2. Poligoane Voronoi

1.4.2. Interpolarea. Metoda punctelor pilot

Metoda punctelor pilot (de Marsily et al, 1984) este o metoda de parametrizare

bazata pe interpolare. Parametrii modelului (necunoscutele ce trebuie determinate in

cadrul procesului de optimizare) sunt valorile parametrului hidrogeologic θ intr-un

numar de puncte stabilite de utilizator, numite „puncte pilot”. Pentru restul domeniului,

parametrii hidrogeologici sunt calculati prin interpolare. Exista doua variante de

interpolare utilizate de PEST (programul Parameter ESTimation (Doherty et al, 2002)

utilizat in studiul de caz): Kriging si Inverse distance weighted.

Metoda de interpolare Inverse distance weighted (IDW), sau metoda lui Shepard

(1968), se bazeaza pe supozitia ca valoarea functiei intr-un punct este influentata mai ales

de nodurile de interpolare mai apropiate, si mai putin de cele mai indepartate. Valoarea

interpolata este o medie ponderata a valorilor functiei in nodurile de interpolare, iar

ponderea unui nod este cu atat mai mare cu cat acesta este mai apropiat de punctul

respectiv.

21

Daca m21 x,...,x,x sunt nodurile de interpolare ( ( )iii yx ,x = , mi ,1= ) si

( )ixθ=ip , mi ,1= reprezinta valorile parametrului hidrogeologic θ in aceste puncte (θ

poate fi conductivitatea hidraulica, K(x), sau alimentarea prin percolare, R(x) ), atunci

valoarea lui θ intr-un punct oarecare, ( )xθ , se calculeaza ca o medie ponderata a

valorilor ( ) ( ) ( ) m21 x,...,x,x θθθ , astfel :

( ) ∑=

=m

iii pw

1

xθ , unde

∑=

−

−

= m

j

kj

ki

i

d

dw

1

,

iar id reprezinta distanta de la x la ix : ( ) ( )22x-x iiii yyxxd −+−== . De obicei se

ia k = 2:

∑=

=m

j j

ii

d

dw

1

2

2

1

1

In GMS se foloseste pentru ponderile iw o formula care s-a dovedit ca furnizeaza

rezultate mai bune (Franke & Nielson, 1980):

∑=

−

−

=m

j j

j

i

i

i

Rd

dR

Rd

dR

w

1

2

2

,

unde R reprezinta distanta de la punctul x la cel mai indepartat nod de interpolare.

Interpolarea Kriging (Matheron, 1971, de Marsily et al, 1984) considera

parametrul hidrogeologic ( )xθ un camp aleator care trebuie estimat in fiecare punct al

domeniului plecand de la datele “observate” ( ) ( ) ( ) m21 xxx θθθ ,...,, in punctele pilot x1,

22

x2,…,xm . Valorile ( ) m,jp j 1 , x j == θ reprezinta parametrii modelului, care trebuie

determinati in cadrul procesului de calibrare.

Se porneste de la urmatoarele ipoteze:

• Media se presupune constanta: ( )[ ] µθ =xE ("ordinary kriging")

• Covarianta depinde numai de distanta intre puncte:

( ) ( )( ) ( )( )[ ] ( ) 212121 x-xh unde ,hxxx,x ==−−= CECov µθµθθ

Mai intai trebuie determinata structura acestei functii astfel incat corelatia dintre

( )1xθ si ( )2xθ este cu atat mai mica cu cat distanta dintre cele doua puncte 21 x-xh =

este mai mare. De obicei se lucreaza cu (semi)variograma ( )hγ in locul functiei de

covarianta:

( ) ( ) ( )( )[ ]2xhx2 θθγ −+= Eh

Legatura dintre cele doua functii este data de formula (1.18):

( ) ( )( )[ ]( )

( )( )[ ]( )

( )( ) ( )( )[ ]( )

⇒

−−+−−+−+=4444 34444 214434421444 3444 21

hCCC

EEEh µθµθµθµθγ xhx2xhx21

0

2

0

2

( ) ( ) ( )hCCh −=⇒ 0γ (1.18)

unde ( ) ( )( )[ ] ( )θµθ VarEC =−+= 2hx0 reprezinta varianta.

Cele mai folosite tipuri de variograma sunt :

1) Variograma exponentiala: ( ) ( )heh αλγ −−= 1

2) Variograma Gaussiana: ( ) ( )( )2

1 heh αλγ −−=

3) Variograma sferica: ( )

>

≤

−=αλ

αλλ

λγh

hhh

h

,

,3

2

13

23

a) b)

c)

Fig. 1.3. Tipuri de variograme: a) exponentiala; b) gaussiana; c) sferica

(de Marsily et al, 1984)

Pentru a alege modelul cel mai potrivit de variograma se construieste mai intai

variograma experimentala, discreta, pe baza valorilor ce urmeaza a fi interpolate:

( ) ( ) ( ) m21 xxx θθθ ,...,, :

( ) ( ) ( ) ( )( )( )

∑≤<≤

−=hNji

jihNh

1

2xx1

2 θθγ

unde ,...2,1,0 , =⋅= klkh , iar ( )hN reprezinta numarul perechilor de puncte ( )ji x,x cu

proprietatea ca distanta dintre ele este in intervalul [ ]lhh +, .

24

Fig. 1.4. Exemplu de variograma experimentala (de Marsily et al, 1984)

Valoarea estimata a parametrului intr-un punct din domeniu, x0 se calculeaza ca o

combinatie liniara a valorilor « observate » ( ) ( ) ( ) m21 x,...,x,x θθθ :

( ) ( )∑=

=m

iii

10 xxˆ θλθ (1.19)

unde ( ) miii ,1,x0 == λλ reprezinta un set de ponderi care se determina astfel incat sa fie

indeplinite urmatoarele conditii:

• 11

=∑=

m

iiλ

• Eroarea ( ) ( ) ( )000 xxˆx θθ −=e sa aiba media 0 si varianta minima:

( )[ ] 0x0 =eE

( )( ) ( ) ( )( ) minxxˆxvar2

000 →

−= θθEe

De aici rezulta ca estimatorul kriging ( )xθ este "cel mai bun estimator liniar nedeplasat"

(Best Linear Unbiesed Estimator) (Kitanidis & Vomvoris, 1983).

Ponderile mii ,1 , =λ in punctul 0x se determina rezolvand o problema de

extrem conditionat:

h

( )hγ

25

( ) ( )

=

−

∑

∑

=

=

m

ii

m

iiiE

1

2

01

1

xxmin

λ

θθλλ

Utilizand definitia lui ( )0xθ (1.19) si conditia ∑=

=m

ii

1

1λ , se obtine:

( )( ) ( ) ( )( ) ( ) ( )

( )( ) ( )( ) ( )( )[ ]

( )( ) ( )( )[ ] ( )( ) ( )( )[ ] ( )( )[ ]20

10

1

1

222

01

2

01

2

000

xxx2xx2

xxx

xxxxˆxvar

µθµθµθλµθµθλλ

µθλµθµθλ

θθλθθ

−+−−−−−+

+−=

−−−=

=

−=

−=

∑∑

∑∑

∑

=≤<≤

==

=

EEE

EE

EEe

m

iii

mjijiji

m

iii

m

iii

m

iii

Folosind functia de covarianta, ( )hC , rezulta:

( )( ) ( ) ( ) ( ) ( ) min0xx2xx20xvar1

011

20 →+−−−+= ∑∑∑

=≤<≤=

CCCCem

iii

mjijiji

m

ii λλλλ

Introducand multiplicatorul Lagrange, λ , problema revine la determinarea

punctului de extrem pentru functia

( ) ( ) ( ) ( ) ( )

−+−−−+= ∑∑∑∑==≤<≤=

12xx2xx20,,,min11

011

21

m

ii

m

iii

mjijiji

m

iim CCCF λλλλλλλλλ K

Pentru a determina punctul de minim al acestei functii, derivatele partiale de

ordinul I se egaleaza cu 0:

( ) ( )

012

1

0xxxx21

1

01

=−=∂∂⋅

=+−−−=∂∂⋅

∑

∑

=

=

m

ii

iji

m

jj

i

F

CCF

λλ

λλλ

Rezulta ca mλλλ ,,, 21 K , ponderile combinatiei liniare (1.19), se determina rezolvand

un sistem de ecuatii liniare (“sistemul kriging”):

26

=+++=+++

=+++=+++

121

2211

22222121

11212111

m

mmmmmm

mm

mm

CCCC

CCCC

CCCC

λλλλλλλ

λλλλλλλλ

KKKKK

K

KKKKKKKKKKKKK

K

K

(1.20)

unde ( ) mjiCC jiij ,1, ,xx =−= si ( ) miCC ii ,1 ,xx 0 =−= .

Acest sistem poate fi scris utilizand variograma in locul functiei de covarianta. Utilizand

relatia (1.18) rezulta:

( ) ( ) ( )( ) ( ) ( ) miCCC

mjiCCC

i

not

iii

ij

not

jijiij

,1 ,xx0xx

,1, ,xx0xx

00 ==−−=−=

==−−=−=

γγ

γγ

Iar sistemul kriging (1.20) se poate scrie in forma matriceala astfel:

=

−

−−−

101111

10

10

10

10

3

2

1

3

2

1

321

33231

22321

11312

mmmmm

m

m

m

γ

γγγ

λλ

λλλ

γγγ

γγγγγγγγγ

KK

K

K

KKKKKK

K

K

K

Metoda punctelor pilot este mai naturala decat zonarea (deoarece parametrii

hidrogeologici nu au salturi bruste de la o celula la alta) si este mai putin subiectiva (nu

necesita stabilirea zonelor de catre utilizator). Flexibilitatea si acuratetea acestei metode a

fost pusa in evidenta de LaVenue & Pickens [1992], RamaRao et al [1995], Hernandez

et al [2003].

27

1.5. Metode de calibrare

Calibrarea manuala („Trial and error”)

Calibrarea manuala este metoda „traditionala” de calibrare si consta in ajustarea

succesiva a vectorului parametrilor pana cand diferentele intre valorile calculate calch si

cele observate obsh devin nesemnificative. Avantajul acestei metode (simpla si foarte

mult utilizata, mai ales in problemele cu un numar mic de parametri) este ca procesul de

calibrare este in permanenta controlat si directionat de experienta hidrogeologica.

Dezavantajul este ca necesita foarte mult timp, mai ales in cazul problemelor cu un

numar mare de parametri, si nu ofera nici o garantie ca solutia gasita reprezinta cea mai

buna aproximare.

Calibrarea automata

Consta in folosirea unor procedee matematice (transcrise intr-un cod de

programare) pentru a calcula solutia problemei inverse (1.17). Neuman [1973] a impartit

metodele de calibrare automata in doua categorii: metode directe si metode indirecte.

1.5.1. Metode directe

Metodele directe sunt primele tehnici de calibrare automata folosite pentru

rezolvarea problemei inverse in hidrogeologie. Sarcina hidraulica se presupune cunoscuta

pe intreg domeniul (fiind obtinuta pe baza hartii cu hidroizohipse), iar ecuatia curgerii se

transforma intr-o ecuatie cu derivate partiale de ordinul I in transmisivitate. Prin

discretizarea domeniului, se ajunge la un sistem de ecuatii liniare din care parametrii

modelului (valorile parametrului in fiecare element de discretizare) se pot afla direct, fara

a folosi un proces iterativ. Dezavantajul acestei metode este ca necesita interpolari si

chiar extrapolari (bazate pe „expert judgement”) pentru a estima valorile sarcinii

hidraulice in nodurile retelei, introducandu-se astfel aproximatii care dau un anumit grad

de incertitudine solutiei gasite. De asemenea, solutia este instabila: mici modificari ale

28

datelor de intrare obsh provoaca perturbatii importante in vectorul solutiei calculate, ∗p

(Carrera & Neuman, 1986).

Pentru a evita instabilitatea, Drobot [1983, 1990] a folosit o metoda directa

transformand problema inversa intr-o problema de programare liniara, minimizand o

functie eroare. Domeniul (bidimensional) este discretizat folosind metoda diferentelor

finite si se presupun cunoscute valorile sarcinii hidraulice, jH , in centrele celulelor.

Considerand regimul de curgere permanent, se scrie bilantul (intrari – iesiri) pentru

fiecare celula Nj ,1= si se pune conditia ca neinchiderea de debit sa fie minima:

( ) ∑=

−=N

jjj bAZ

1

min (1.21)

unde jA reprezinta schimbul celulei j cu celulele invecinate (si este termenul ce contine

necunoscutele: ijT , - transmisivitatile de legatura intre celule), iar jb (constant) reprezinta

schimbul cu exteriorul. Introducand variabilele suplimentare 0≥jy a.i. jjj ybA ≤− se

obtine o problema de programare liniara:

( )

≤−≥+

=∑×

=

jjj

jjj

nm

jj

byA

byA

yZ1

min

(1.22)

Yeh et al [1983] au dezvoltat o metoda directa pentru identificarea transmisivitatii

intr-un acvifer sintetic, considerand regimul de curgere nepermanent. Parametrul

necunoscut a fost aproximat prin metoda elementelor finite : ( ) ( )∑=

=m

iii yxvTyxT

1

,, , unde

miTi ,1 , = reprezinta valorile nodale ale transmisivitatii (necunocutele care trebuie

determinate), iar ( ) miyxvi ,1 , , = reprezinta un set de functii de baza bilineare pe

elemente rectangulare. Valorile nodale ale sarcinii hidraulice (este vorba de nodurile de

calcul pentru modelul de simulare – realizat cu metoda diferentelor finite) sunt estimate

folosind metoda geostatistica ( interpolarea kriging).

29

1.5.2. Metode indirecte

Metodele indirecte se bazeaza pe minimizarea unei functii obiectiv, cea mai

utilizata fiind suma patratelor diferentelor intre valorile calculate si cele observate ale

variabilei de stare, u:

( ) ( ) ( ) ( ) ( )( ) ( )( )obsTobsobsn

i

obsi

calci upupupuupE −−=−=−=∑

=

ϕϕϕ1

2min (1.23)

Se numesc „metode indirecte” deoarece problema inversa formulata astfel devine o

problema de optimizare ce trebuie rezolvata iterativ, prin simulari repetate. In esenta,

metodele indirecte sunt o versiune automata a procedurii de calibrare manuala.

Observatii:

1. In cazul in care calitatea observatiilor difera, trebuie folosita o suma ponderata,

observatiile mai „sigure” (mai exact masurate) primind o pondere mai mare. De

asemenea, se impune folosirea ponderilor in cazul in care se folosesc observatii de

diferite tipuri (de ex: debite / sarcini hidraulice), pentru ca observatiile cu ordin de

magnitudine mai mare sa nu domine procesul de optimizare:

( ) ( ) ( ) ( )( ) ( )( )obsTobsn

i

obsi

calcii upWupuuwpE −−=−=∑

=

ϕϕ1

2min (1.24)

unde W este o matrice diagonala ce contine ponderile, wj .

2. Folosind o functie obiectiv de forma (1.23) sau (1.24) problema devine

adesea „gresit pusa”: solutia nu este unica, seturi diferite de parametri genereaza valori

aproape similare ale functiei obiectiv (Carrera et al, 2005). Pentru a depasi aceste

probleme, Neuman (1973) a adaugat functiei obiectiv un „termen de plauzibilitate”, pE :

( ) pu EEE λ+=min (1.25)

unde ( ) ( )( ) ( )( )obsu

Tobsu upWuppE −−= ϕϕ , ( ) ( ) ( )00 ppWpppE p

T

p −−= (1.26)

30

3. Ecuatiile (1.23) – (1.25) pot fi obtinute si prin metode statistice, matricea

ponderilor reprezentand in acest caz inversa matricei de covarianta a erorilor (Carrera &

Neumann, 1986; Sun & Sun, 2002).

Metode statistice pentru estimarea parametrilor

Reluam ecuatia (1.17) care descrie relatia intre vectorul observatiilor, obsu , si

vectorul parametrilor modelului madPp ℜ⊂∈ :

( ) εϕ += puobs

Unde vectorul ε inglobeaza atat eroarea de masurare, cat si cea de modelare.

Considerand variabile aleatoare atat parametrii modelului, cat si valorile variabilei

de stare in punctele de observatie, pot fi aplicate cateva principii statistice de baza.

Se vor folosi urmatoarele notatii :

• ( )pf0 este densitatea de repartitie a priori a lui p (considerata fie omogena, fie

normala).

• ( ) ( )obsupfpf =∗ este densitatea de repartitie a posteriori a lui p , dandu-se

valorile observate ale variabilei de stare, obsu .

• ( ) ( )pufpL obs= este functia de verosimilitate a observatiilor (densitatea de

repartitie a lui obsu dandu-se vectorul parametrilor estimati, p ).

Din teorema lui Bayes avem :

( ) ( ) ( ) ( )( ) ( )

( ) ( )pfpcLdppfpuf

pfpufupfpf

obs

obsobs

0

0

0 ===∫Ω

∗ (1.27)

unde c este o constanta:

( ) ( )∫Ω

=dppfpuf

cobs

0

1 (1.28)

Considerand vectorul erorilor normal distribuit cu media 0 si matricea de covarianta εV ,

functia de verosimilitate se scrie :

31

( ) ( ) ( ) ( )( ) ( )( )

−−−= −−− obsTobsn upVupVpL ϕϕπ εε1212

2

1expdet 2 (1.29)

Estimatorul maxim a posteriori (MAP) este

( )( ) ( )( ) ( ) ( )( )pfpLpfpfp 0lnlnmin arglnmin argmax arg −−=−== ∗∗ˆ (1.30)

a) Daca distributia a priori este omogena,

( ) ( )

∈=

restin ,0

1

0UL PPp

Vpf ,, (1.31)

atunci estimatorul dat de (1.30) este, de fapt, estimatorul de verosimilitate maxima :

( )( ) ( )( ) ( )( )obsTobs upVuppLp −−=−= − ϕϕ ε1min arglnmin arg ˆ (1.32)

(termenul ( )pf0ln− din (1.30) este constant).

Daca componentele lui ε (erorile) sunt independente unele de altele, atunci

obtinem urmatorul estimator (cele mai mici patrate ponderate):

( )( ) ( )( )obsTobs upWupp −−= ϕϕmin arg ˆ (1.33)

unde W e o matrice diagonala avand elementele 22

221

1,

1,

1

nσσσK .

Iar daca toate variantele 2iσ sunt egale, atunci putem folosi estimatorul uzual « cele mai

mici patrate » :

( )( ) ( )( )obsTobs upupp −−= ϕϕmin arg ˆ (1.34)

b) Daca se presupune ca vectorulp are o distributie a priori gaussiana m-

dimensionala, de medie 0p si matrice de covarianta pV (se pot aplica, eventual, o serie

de transformari : de exemplu, se stie ca logarimul conductivitatii hidraulice, lnk este

normal distribuit), densitatea de repartitie a priori se scrie astfel :

( ) ( ) ( ) ( ) ( )

−−−= −−− 0102120 2

1expdet 2 ppVppVpf p

T

pmπ (1.35)

In acest caz, trebuie adaugat functiei obiectiv termenul ( )pf0ln− (« termen de

regularizare »), iar estimatorul din (1.30) se scrie sub forma:

32

( )( ) ( )( ) ( ) ( ) 0101min arg ppVppupVupp p

TobsTobs −−+−−= −− ϕϕ ε (1.36)

Daca IV 2σε = si IVp2τ= (erorile sunt independente si de variante egale) atunci :

( )( ) ( )( ) ( ) ( ) 00min arg ppppupuppTobsTobs −−+−−= λϕϕ (1.37),

unde 2

2

στλ = se numeste factor de regularizare.

Problema de optimizare propusa de metoda celor mai mici patrate (clasica,

ponderata sau regularizata) poate fi rezolvata folosind fie metode « traditionale » de

programare neliniara, fie tehnici de cautare globala care sunt mai robuste (avand

capacitatea de a evita oprirea la un optim local) si nu necesita calculul derivatelor functiei

obiectiv. Dezavantajul metodelor de cautare globala este ca au nevoie de un numar mare

de evaluari ale functiei obiectiv, adica de rulari ale modelului de simulare, fiind destul de

“costisitoare” din punctul de vedere al timpului de calcul.

33

2. Metode clasice de optimizare folosite in rezolvarea problemei

inverse

2.1. Introducere

Problema de optimizare considerata este de forma (1.23). (Pentru a scrie mai usor

derivatele functiei obiectiv s-a introdus factorul suplimentar ½, care nu schimba cu nimic

natura problemei) :

( ) ( ) ( ) ( ) ( ) ( )pFpFpFuupE Tn

i

obsi

calci 2

1

2

1

2

1min

2

1

2 ==−= ∑=

(2.1)

unde nmadPF ℜ→ℜ⊂: ,

( ) ( ) ( ) obsobscalc upupupF −=−= ϕ (2.2)

Metodele clasice de cautare a optimului folosesc un proces iterativ: plecand de la

o solutie initiala (un set initial de parametri, p0 ) se construieste, prin iteratii succesive, un

sir de vectori ( ) 0≥kkp care tinde catre un punct de optim local,∗p (fara a avea garantia ca

acesta este un optim global). Procesul iterativ este definit de o relatie de forma :

0 , 1 ≥+=+ kdpp kk

kk α (2.3)

unde : mkd ℜ∈ este un vector care reprezinta directia deplasarii

ℜ∈kα este un scalar care determina « lungimea pasului » in directia kd .

Atunci cand un anumit criteriu de convergenta este respectat, cautarea inceteaza si

ultimul punct gasit este considerat ca fiind setul optim de parametri. Directia deplasarii

la fiecare iteratie, kd , se calculeaza folosind gradientul functiei obiectiv, motiv pentru

care aceste metode se mai numesc « metode de gradient ». Metodele care necesita si

matricea hessiana pentru a calcula kd (putin utilizate deoarece sunt laborioase) se

numesc metode de ordinul II.

Gradientul functiei E in punctul p este calculat cu formula:

( ) ( ) ( )pFpJpE T=∇ (2.4)

34

unde ( )mjnij

i

p

upJ

,1,1

==

∂∂= reprezinta matricea Jacobiana a functiei ϕ (evident, si a functiei

F definita de relatia (2.2)). Derivatele partiale ale variabilei de stare in raport cu

parametrii modelului, j

i

p

u

∂∂

, se numesc coeficienti de senzitivitate. In cele ce urmeaza se

vor folosi urmatoarele notatii :

( )kk pFF = , ( )k

k pJJ = , ( )kk pEG ∇=

Fig. 2.1. Schema unei metode de programare neliniara

Initializare 0: pp = , 0:=k

Se rezolva problema directa folosind codul de simulare

( )kcalc pfu =:

Se calculeaza functia obiectiv 2

2

1 obscalc uuE −= si E∇

Se verifica un criteriu de oprire

Nu

Se actualizeaza parametrii k

kkk dp:p α+=+1

1+= k:k

Solutia optima kpp =*

Se calculeaza kd si kα

Da

35

Algoritmul general al unei metode de programare neliniara :

1. Se alege o solutie initiala 0p ; 0:=k .

2. Se rezolva problema directa pentru setul de parametri curent kp , apeland

programul de simulare. Se calculeaza vectorul valorilor variabilei de stare in

punctele de observatie, ( )kk pu ϕ= , functia obiectiv ( )kpE , matricea Jacobiana

( )kk pJJ = si gradientul functiei obiectiv, ( ) k

Tk

kk FJpEG =∇= .

3. Se calculeaza directia deplasarii, kd , precum si scalarul kα si se actualizeaza

parametrii cu formula (2.3)

4. Se verifica daca este indeplinit un anumit criteriu de oprire. Daca se indeplineste

criteriul de convergenta, procesul se opreste si se considera ca setul optim de

parametrii este 1: +∗ = kpp ; daca nu, atunci 1: += kk si se continua cu pasul 2.

Criteriul de oprire este de obicei reprezentat de una din conditiile:

( ) ( )( ) 1

1

ε<−+

k

kk

pE

pEpE sau/ si 2

1

ε<−+

k

kk

p

pp (Drobot, 1990)

sau 3ε<kG

Metodele clasice de optimizare difera intre ele prin modul de alegere a directiei

deplasarii kd . In urmatoarele subcapitole sunt prezentate cateva din metodele folosite in

prezent pentru rezolvarea problemei inverse in hidrogeologie.

36

2.2. Metoda celei mai rapide descresteri (Metoda gradientului optimal)

Se stie ca gradientul unei functii intr-un punct reprezinta un vector normal

hipersuprafetei f(x)=const. si orientat in sensul celei mai rapide cresteri a functiei.

Antigradientul (gradientul cu semn schimbat) este orientat in sensul celei mai rapide

descresteri, deci poate fi folosit in procesul de minimizare. Metoda celei mai rapide

descresteri foloseste antigradientul ca directie a deplasarii ( )kk

k pEGd −∇=−= , iar

procesul iterativ este definit de relatia:

kkkk Gpp α−=+1 , 0≥k (2.5)

unde kα minimizeaza functia (de o singura variabila) ( ) ( )kk GpE ααϕ −= :

( )αϕαα

min arg0≥

=k

Daca se foloseste formula lui Taylor (pastrand termenii de grad < 2) pentru a

aproxima functia F intr-o vecinatate a punctului kp :

( ) kkkkk GJFGpF αα −≈− , (2.6)

atunci ( )αϕ este aproximata printr-o functie de gradul II :

( ) ( ) ( ) kkTk

Tkkk

Tkk

Tkk

kT

kk GJJGGJFFFGpFGpF

22

1

2

1 2αααααϕ +−≈−−= (2.7)

Punctul in care ( )αϕ isi atinge minimul este ( ) kTkk

Tk

kTkk

Tk

kFJJF

FJJF2

=α .

Convergenta acestei metode poate fi extrem de lenta, mai ales in problemele in

care parametrii sunt foarte corelati. In astfel de situatii suprafata functiei obiectiv prezinta

in regiunea optimului o “vale” ingusta, iar aplicarea metodei celei mai rapide descresteri

duce la fenomenul “hem-stitching”: in cadrul procesului iterativ, vectorul parametrilor

face “salturi” dintr-o parte in alta a “vaii” ( Doherty et al, 2002).

37

2.3. Metoda Gauss-Newton

Meoda Gauss-Newton se bazeaza pe aproximarea liniara a functiei F intr-o

vecinatate a punctului curent,kp :

( ) ( ) ( ) ( )ττττ kkkkkk lJFpJpFpF ≡+=+≈+ (2.8)

Astfel, functia obiectiv ( )pE poate fi aproximata in vecinatatea lui kp printr-o

forma patratica:

( ) ( ) ( ) ( )ττττ kkkT

kkk LJFJFpE ≡++≈+

2

1 (2.9)

( ) ττττ kTk

Tk

Tkk

Tkk JJJFFFL

2

1

2

1 ++= (2.10)

Gradientul formei patratice ( )τkL este:

( ) kT

kkTkk JFJJL +=∇ ττ (2.11)

Observam ca hessiana lui ( )τkL , ( ) kTkL JJH

k=τ este simetrica, independenta de

τ. Daca mJk = rang ( nm ≤ ) atunci kTk JJ este pozitiv definita. In consecinta, kL are

un unic punct de minim, kτ , care se afla rezolvand sistemul de ecuatii normale 0=∇ kL :

kkTk

kk

Tk GFJJJ −=−=τ (2.12)

Directia deplasarii la iteratia k este data de vectorul

( ) kTkk

Tk

k FJJJ1−−=τ (2.13)

iar procesul iterativ este descris de relatia

kk

kk pp τα+=+1 , 0≥k (2.14)

In metoda Gauss-Newton originala se ia 1=kα la fiecare iteratie. O alta varianta

este de a alege scalarul kα care minimizeaza functia de o variabila ( ) ( )kkpE αταϕ += .

38

2.4. Metoda Levenberg-Marquardt

Metoda Levenberg-Marquardt poate fi privita ca o combinatie intre metoda

Gauss-Newton si metoda celei mai rapide descresteri. Este cunoscuta si ca metoda Gauss-

Newton-Marquardt, sau metoda Gauss-Newton modificata. Atunci cand solutia curenta

kp este departe de punctul de optim, Metoda Levenberg-Marquardt se comporta ca

metoda gradientului optimal : este lenta, dar converge garantat. Cand vectorul kp se

apropie de solutia exacta, ea devine o metoda Gauss-Newton.

In cazul in care mJk < rang matricea kTk JJ nu mai este pozitiv definita si atunci

sistemul (2.12) poate avea o solutie kτ a .i. 0, <− kk Gτ , solutie care va directiona

procesul iterativ in sensul cresterii functiei: ( ) ( )kkk pEpE >+τ .

In ciuda faptului ca antigradientul kG− defineste directia celei mai rapide

descresteri, se poate arata ca metoda Gauss-Newton da rezultate mai bune, mai ales in

situatiile in care parametrii sunt foarte corelati. Totusi, cele mai multe probleme au de

castigat din ajustarea deplasarii kτ astfel incat sa fie mai aproape de directia celei mai

rapide descresteri in stadiile initiale ale procesului iterativ. Matematic, acest lucru se

poate realiza printr-o strategie de alterare a elementelor de pe diagonala principala a

sistemului de ecuatii normale (2.12) sugerata de Levenberg (1944) si Marquardt (1963).

Procesul iterativ este de forma :

kkk pp τ+=+1 (2.15),

unde kτ este solutia sistemului de ecuatii normale augmentate :

( ) kkTk

kk

Tk GFJIJJ −=−=+ τλ (2.16)

Marquardt (1963) a inlocuit matricea identica, I, cu o matrice diagonala:

( )( ) kkTk

kk

Tkk

Tk GFJJJdiagJJ −=−=⋅+ τλ (2.17)

Parametrul λ se numeste parametru Marquardt si introducerea lui are urmatoarele

efecte:

39

a) Matricea coeficientilor sistemului (2.16) este pozitiv definita pentru orice

0>λ , deci vom avea 0<− kk G,τ , ceea ce ne asigura ca solutia sistemului este o

directie in care functia descreste.

b) Pentru valori mari ale lui λ vom avea un pas (de lungime mica) in directia

celei mai rapide descresteri :

kk G

λτ 1−≈ .

c) Pentru valori mici ale lui λ , pasul deplasarii, kτ , va avea o directie foarte

apropiata de cea din Metoda Gauss Newton, o directie adecvata in ultimele iteratii.

Valoarea parametrului λ variaza in cursul procesului itereativ. Alegerea valorii

initiale 0: λλ = e legata de magnitudinea elementelor matricei 00 JJT (de ex. se poate lua

iiamax0 ελ = unde 1..10 3−=ε ).

La fiecare iteratie se rezolva sistemul (2.16) sau (2.17), se actualizeaza vectorul

parametrilor cu formula (2.15) si se calculeaza functia obiectiv, E.

a) Daca functia obiectiv descreste, atunci actualizarea parametrilor este

acceptata si se reduce parametrul λ impartindu-l cu 1>ν : νλλ =: .

b) Daca actualizarea parametrilor determina o crestere a functiei obiectiv,

atunci se mareste parametrul λ pentru ca directia deplasarii sa se

apropie mai mult de directia celei mai rapide descresteri. Acest lucru

are loc prin inmultiri repetate cu acelasi factor, ν : kλνλ ⋅=: , pana cand

se obtine o descrestere a functiei obiectiv.

Datorita faptului ca este deosebit de robusta, Metoda Levenberg-Marquardt este

folosita de majoritatea codurilor de calibrare : PEST, UCODE, MODFLOWP.

40

2.5. Metoda directiilor conjugate

Metoda directiilor conjugate necesita doar o modificare simpla a metodei

gradientului optimal, avand o crestere spectaculoasa a ratei de convergenta datorita

faptului ca utilizeaza atat gradientul functiei obiectiv in punctul curent, ( )kk pEG ∇= cat

si directia precedenta de cautare, kd .

Procesul iterativ este cel obisnuit:

0 , 1 ≥+=+ kdpp kk

kk α

Directia initiala, 0d , este directia celei mai rapide descresteri:

( ) 000 GpEd −=−∇=

Scalarii pozitivi kα se aleg, la fiecare iteratie, astfel incat sa minimizeze functia in

directia kd :

( ) ( ) ( )kkk dpEα ααϕαϕ +== unde ,min arg

Directia deplasarii la iteratia k, kd , este o combinatie liniara a gradientului in

punctul respectiv, ( ) ( )kkk pEpGG ∇== , si a directiei precedente, 1−kd :

11

−−+−= k

kkk dGd β (2.18)

Metoda Fletcher - Reeves foloseste pentru scalarul kβ formula :

2

1

2

11 −−−

==k

k

kTk

kTk

kG

G

GG

GGβ

Se poate arata ca, daca functia obiectiv este o forma patratica, atunci vectorii

110 −≤ mk,d,...,d,d k sunt liniar independenti, iar punctul de minim este determinat cu

exactitate in cel mult m iteratii.

41

2.6. Metoda lui Newton

Metoda lui Newton este o metoda de ordinul II care se bazeaza pe aproximarea

patratica a functiei obiectiv ( )pE in vecinatatea punctului curent,kp , folosind formula

lui Taylor:

( ) ( ) ( ) ( ) ( ) ( )kk

TkkTk

kk ppHppppGpEpqpE −−+−+=≈

2

1 (2.19)

unde ( ) ( )mji

k

ji

kk p

pp

EpHH

,1,

2

=

∂∂∂== reprezinta matricea hessiana a functiei ( )pE ,

calculata in punctul curent, kp .

Daca kH este pozitiv definita, atunci forma patratica ( )pqk isi atinge minimul in

punctul

kkkk GHpp 11 −+ −= (2.20)

Directia deplasarii, kkk GHd 1−−= se calculeaza de obicei rezolvand sistemul

kkk GdH −= (2.21)

In metoda lui Newton modificata se foloseste un scalar pozitiv, kα , care ajusteaza

lungimea pasului a.i. sa minimizeze functia ( )pE in directia deplasarii, kd :

kkkk dpp α+=+1

cu ( )αk ϕα min arg= , unde ( ) ( )kkk dpE ααϕ +=

Metoda lui Newton converge foarte rapid, dar este si foarte laborioasa deoarece la

fiecare iteratie trebuie calculate nu numai derivatele partiale de ordinul I, ci si cele de

ordinul II.

42

2.7. Metode cvasi-Newton

Aceste metode sunt algoritmi care folosesc schema iterativa din Metoda lui

Newton, dar fara a calcula efectiv matricea hessiana. Aceasta este aproximata, folosind

derivatele partiale de ordinul I, printr-o matrice simetrica pozitiv definita, kH~

.

Metoda Broyden-Fletcher-Goldfarb-Shano este una din cele mai cunoscute

metode cvasi-Newton. Procesul iteratriv este definit de formula :

kkkk dpp α+=+1 ,

unde directia deplasarii, kd se determina rezolvand sistemul

kkk GdH −=~ (2.22).

Sirul de matrice kH~

se construieste cu urmatoarea formula de recurenta :

kkTk

kkTk

Tk

kTk

Tkk

kksHs

HssH

sy

yyHH ~

~~~~

1 −+=+ (2.23)

Matricea initiala 0

~H este o matrice simetrica pozitiv definita, de obicei se alege IH =0

~.

Scalarii 0≥kα se determina dupa metoda de mai sus, astfel incat sa minimizeze functia

in directia deplasarii : ( )αk ϕα min arg= , unde ( ) ( )kkk dpE ααϕ += .

43

2.8. Calculul coeficientilor de senzitivitate

Functia obiectiv ( )pE ce trebuie minimizata pentru rezolvarea problemei inverse

nu are o expresie analitica ; ea este calculata la fiecare iteratie ruland modelul de simulare

cu setul de parametri curent. Metodele de programare neliniara descrise mai sus necesita,

la fiecare iteratie, calculul gradientului ( )pE∇ in punctul curent, kpp = , ceea ce este

echivalent (conform relatiei (2.4)) cu a calcula matricea Jacobiana : ( )mjnij

i

p

upJ

,1,1

==

∂∂= .

Pentru a determina coeficientii de senzitivitate j

i

p

u

∂∂

putem folosi urmatoarele metode :

a) Aproximarea prin diferente finite (metoda folosita de PEST)

Derivatele partiale pot fi aproximate folosind diferente finite astfel :

( ) ( )j

ijji

j

i

h

puehpu

p

u −+≈

∂∂

, mjni ,1,,1 == (2.24)

unde incrementul (perturbatia) jh este proportionala cu valoarea lui jp :

jj ph λ= , 1.0..01.0=λ .

Pentru a obtine coeficientii de senzitivitate sunt necesare 1+m rulari ale modelului de

simulare (independent de numarul de observatii).

Aproximarea prin diferente finite introduce, in mod inevitabil, anumite erori

care pot fi micsorate (dar nu evitate) prin folosirea diferentelor finite centrate (dar in acest

caz sunt necesare 12 +m rulari ale modelului de simulare).

b) Metoda ecuatiilor de senzitivitate

Prin derivarea ecuatiei (1.1) (respectiv, (1.2)) in raport cu parametrul jp se

ajunge la o ecuatie in care functia necunoscuta este derivata variabilei de stare in raport

cu jp . Aceasta ecuatie se numeste „ecuatie de senzitivitate” si are aceeasi structura cu

ecuatia originala, deci poate fi rezolvata folosind aceeasi rutina. De exemplu, derivand

ecuatia de curgere (1.1), se obtine:

44

01 =+

∂∂∇⋅∇−

∂∂

∂∂=

∂∂

jjj

sj

Qp

hK

p

h

tS

p

L ~ [ ]Tt ,0×Ω (2.25)

unde jjj

sj p

Qh

p

K

t

h

p

SQ

∂∂+

∇

∂∂⋅∇−

∂∂

∂∂=~ .

Conditiile initiale si pe frontiera se obtin si ele derivand conditiile de margine

(1.3) , (1.4).

Pentru a obtine coeficientii de senzitivitate trebuie rulat modelul de simulare de

1+m ori (o data pt rezolvarea problemei originale). Aproximarea coeficientilor de

senzitivitate prin aceasta metoda este mai exacta decat aproximarea prin diferente finite,

unde rezultatul depinde, in mare masura, de alegerea perturbatiilor hj.

45

3. Tehnici de cautare globala

Solid fundamentate matematic, metodele de programare neliniara prezentate in

capitolul anterior pot fi aplicate unor functii obiectiv „ideale” – adica derivabile, cu

derivatele continue (care, insa, se intalnesc rareori in problemele practice de optimizare).

Principiul de functionare este acelasi: se porneste de la o solutie initiala admisibila si, la

fiecare iteratie, se cauta o noua solutie in vecinatatea solutiei curente, pana la indeplinirea

unui criteriu de oprire. Pentru a stabili directia si lungimea pasului deplasarii la fiecare

iteratie, trebuie calculat gradientul functiei obiectiv (ceea ce duce la cresterea timpului de

calcul), dar principalul dezavantaj al metodelor traditionale de optimizare este faptul ca

nu asigura decat convergenta la un optim local. Pentru a mari sansele de gasire a

optimului global (fara a avea garantia obtinerii lui), procesul iterativ trebuie executat de

mai multe ori, plecand din diferite puncte initiale.

Functia eroare ce trebuie minimizata pentru a calibra un model hidrogeologic este,

de cele mai multe ori, multimodala: aflarea minimului global implica realizarea unui

compromis intre doua obiective contradictorii: exploatarea celor mai bune solutii

disponibile la un moment dat (cautarea locala) si explorarea robusta a spatiului

solutiilor posibile (cautarea globala). Daca accentul cade pe exploatarea celor mai bune

solutii (ca in cazul metodelor de tip gradient) se atinge o convergenta prematura (procesul

se opreste la un minim local). Dimpotriva, daca procesul de cautare se bazeaza doar pe

explorarea aleatoare a spatiului solutiilor, neglijand exploatarea informatiei obtinuta

anterior (cazul cautarii pur aleatoare), timpul de calcul creste foarte mult, facand practic

imposibila aflarea optimului global.

Tehnicile de optimizare globale („neconventionale”), prin accentul pus pe

explorarea spatiului solutiilor, reprezinta o buna alternativa la metodele clasice de

programare neliniara pentru rezolvarea problemei inverse in hidrogeologie. In acest

capitol sunt prezentate doua din cele mai utilizate tehnici neconventionale: algoritmii

genetici si metoda calirii simulate.

46

3.1. Algoritmii genetici

3.1.1. Introducere

Algoritmii genetici (AG) sunt strategii de cautare bazate pe mecanismul selectiei

naturale si ereditatii, care realizeaza un echilibru aproape optimal intre explorarea si

exploatarea spatiului solutiilor (Holland, 1975, Goldberg, 1989). Un algoritm genetic

construieste, la fiecare iteratie, nu o singura solutie, ci o "populatie" de solutii posibile

("indivizi"), explorand spatiul din mai multe puncte simultan. In general, cei mai buni

indivizi au tendinta sa se reproduca si sa supravietuiasca in generatia urmatoare, dar si

indivizi inferiori pot supravietui, evitandu-se in acest fel convergenta prematura la un

optim local. Cu succesiunea generatiilor, se poate spera ca populatia va contine indivizi

din ce in ce mai "performanti" (mai apropiati de solutia optima).

Folosirea algoritmilor genetici in problemele de optimizare prezinta urmatoarele

avantaje (fata de metodele clasice de programare neliniara):

• spatiul de cautare poate fi continuu, dar si discret

• nu este necesar ca functia obiectiv sa fie derivabila, nici macar continua si

poate fi oricat de complexa (multimodala)

• nu necesita calculul gradientului functiei obiectiv

• datorita faptului ca la fiecare iteratie lucreaza cu o populatie de solutii

posibile (in loc de o singura solutie, ca metodele traditionale), pot furniza

o multime de puncte „aproape-optimale” in locul unei solutii unice

Principalul lor dezavantaj este faptul ca sunt relativ „costisitori” din punct de

vedere al timpului de calcul, deoarece necesita un numar mare de evaluari ale functiei

obiectiv, evaluare care, in cazul problemei estimarii parametrilor hidrogeologici, se face

prin rularea modelului direct de curgere si / sau transport de poluanti. In ultimul deceniu

au aparut numeroase studii care demonstreaza posibilitatea de a depasi acest dezavantaj,

evitand apelarea codului de simulare pentru calculul functiei directe ( )pϕ (functia care

calculeaza valorile variabilei de stare in functie de vectorul parametrilor p). O aproximare

robusta a functiei directe poate fi realizata cu ajutorul retelelor neuronale artificiale

(Rogers & Dowla, 1994; Yan & Minsker, 2004).

47

Primele aplicatii in hidrogeologie ale algoritmilor genetici au fost in domeniul

gospodaririi, remedierii si monitorizarii apelor subterane, acest lucru datorandu-se in

parte abilitatii AG de a trata problemele multiobiectiv. Remedierea unui acvifer

contaminat se poate face cu ajutorul unui sistem de puturi de extractie si de injectie prin

care apa subterana poluata este extrasa apoi re-introdusa in acvifer dupa ce a fost tratata.

Problema este de a gasi configuratia de puturi de cost minim care sa asigure remedierea

acviferului (sau de a gasi solutii optime de compromis intre costul si eficienta sistemului),

folosind ca variabile de decizie debitele puturilor (de extractie sau de injectie) si,

eventual, locatia acestor puturi (intr-o forma discreta sau continua). Algoritmii genetici s-

au dovedit deosebit de eficienti in abordarea acestei probleme de optimizare cu restrictii

(Rogers & Dowla, 1994; Huang & Mayer, 1997; Guan & Aral, 1999, Aly & Peralta,

1999).

O alta problema imortanta in care AG si-au demonstrat eficienta este cea a

monitorizarii apelor subterane: este vorba de gasirea unui sistem de puturi de cost minim

care sa detecteze cu precizie prezenta substantei poluante in apa (in timp ce aria

contaminata este minima) (Cieniawski et al, 1995; Reed et al, 2000).

Recent, algoritmii genetici au inceput sa fie folositi pentru calibrarea modelelor de

curgere si/sau transport, dovedindu-se, si in acest caz, foarte robusti si eficienti: Mayer &

Huang [1999], Takeshita et al [2000], Prasad & Rastogi [2001]. Tsai et al [2003] au

folosit o metoda de cautare global-locala (un algoritm genetic urmat de un algoritm

BFGS care utilizeaza solutia data de AG ca solutie initiala) pentru a determina atat

valorile parametrilor, cat si structura optima a parametrizarii, intr-o problema de curgere

bi-dimensionala.

48

3.1.2. Structura unui algoritm genetic

Algoritmii genetici au fost introdusi de J. Holland si echipa lui de la Universitatea

din Michigan si reprezinta strategii de cautare care se bazeaza pe analogia dintre

optimizare si selectia naturala. O solutie posibila din spatiul de cautare este privita ca un

individ a carui capacitate de adaptare la mediu poate fi evaluata prin intermediul unei

functii (numita functie de performanta sau de evaluare), aflata in stransa legatura cu

functia obiectiv a problemei de optimizare. Fiecare individ (vector de variabile de

decizie) se poate reprezenta (codifica) ca un „cromozom”: un sir de „gene” de lungime

fixata. Notam cu X multimea cromozomilor si +ℜ→X:f p functia de performanta.

Structura unui algoritm genetic difera de metodele traditionale in urmatoarele aspecte

(Goldberg, 1989):

• AG foloseste o varianta codificata a vectorului variabilelor de decizie

• AG mentine, la fiecare iteratie, o populatie de solutii, nu o singura solutie

• AG utilizeaza doar functia obiectiv insasi, nu si derivatele ei

• AG foloseste reguli de cautare probabiliste, nu deterministe.

Un algoritm genetic debuteaza prin generarea aleatoare a unei populatii initiale de

dimensiune data, n: ( ) 002

01 xxx0 n,,P K=

La fiecare iteratie t se construieste o noua populatie (o noua generatie)

( ) tn

tt ,,tP xxx 21 K= selectand indivizii cei mai performanti din vechea generatie si

aplicandu-le operatorii genetici de incrucisare si mutatie. Mecanismul de selectie ca si cel

de aplicare a operatorilor genetici se bazeaza pe reguli probabiliste, nu deterministe. Este

de asteptat ca indivizii noii generatii sa fie mai performanti decat predecesorii lor. O noua

generatie se obtine in 4 etape:

1. Evaluarea: Se calculeaza functia de performanta a fiecarui individ din

populatia curenta, ( ) tn

tt ,,tP xxx 21 K= : ( ) ( ) ( )tnp

tp

tp f,f,f xxx 21 K . In cazul folosirii

codificarii binare, evaluarea propriu-zisa este precedata de decodificarea cromozomilor

(transformarea lor in vectori de necunoscute reale).

2. Selectia: Pe baza valorilor calculate ale functiei de performanta, se selecteaza

din ( )tP n indivizi care formeaza o populatie intermediara ( )t'P - baza genetica pentru

49

generatia urmatoare ( )1+tP . Un individ mai „performant” are sanse sa fie selectat de mai

multe ori (adica sa aiba mai multe còpii in populatia intermediara).

3.Incrucisarea: Se aleg aleator perechi de indivizi din populatia intermediara

( )t'P . In cadrul fiecarei perechi, cu o anumita probabilitate, cp , are loc un schimb de

gene intre cei doi cromozomi. Perechea initiala va fi inlocuita de o pereche de

descendenti care pastreaza caracteristicile ambilor „parinti”. In urma incrucisarii va

rezulta o noua populatie intermediara, ( )tP ′′ care contine atat „descendenti” (aproximativ

cpn ⋅ ) cat si cromozomi nemodificati din ( )t'P .

4. Mutatia: Se selecteaza, cu o anumita probabilitate, mp , gene ale cromozomilor

din ( )tP ′′ care sunt „alterate” (de exemplu, in cazul codificarii binare, sunt inlocuite cu

valorile complematare). La sfarsitul acestei etape va rezulta noua generatie, ( )1+tP .

In ciuda simplitatii lor, algoritmii genetici au un fundament matematic. Holland

(1975) prin „Teorema schemelor” si Goldberg [1989] prin „Ipoteza blocurilor

constructive” au pus bazele teoriei generale care descrie felul in care populatiile

evolueaza spre solutii tot mai performante sub actiunea operatorilor genetici.

Cromozomii performanti sunt alcatuiti din fragmente de informatie („blocuri

constructive”) relevante pentru solutia problemei. Presiunea de selectie permite

indivizilor performanti sa aiba descendenti ce combina blocuri constructive de la ambii

parinti, ceea ce face ca „noua generatie” rezultata sa aiba o performanta medie

superioara celei anterioare.

Convergenta are loc atunci cand o singura solutie domina populatia (cand un

anumit procent din cromozomii unei generatii sunt identici (Reed et al, 2000). De obicei,

insa, conditia de oprire se refera la atingerea numarului maxim de generatii, iar solutia

optima este reprezentata de individul cel mai performant din ultima generatie (sau din

intreaga istorie a procesului).

50

Fig. 3.1. Schema unui AG „clasic”.

Un algoritm genetic este definit de urmatoarele elemente :

1. Reprezentarea cromozomiala (sau codificarea) spatiului de cautare

2. Functia de evaluare a performantei indivizilor

3. Alegerea operatorilor genetici (de selectie, incrucisare, mutatie)

4. Valorile parametrilor de control: dimensiunea populatiei, numarul maxim de generatii,

probabilitatile de incrucisare si mutatie, cp si mp .

START

Generarea populatiei initiale

Selectie

Incrucisare

Mutatie

C.O.?

STOP

Da

Nu

Decodificare + Evaluare

51

3.1.3. Reprezentarea cromozomiala.

Exista doua tipuri principale de reprezentari ale spatiului de cautare:

• Codificarea binara, „traditionala”, care este si cadrul in care a fost formulat

fundamentul teoretic al AG (Holland, 1975).

• Codificarea reala, care este mai naturala: nu necesita practic nici un fel de

transformare a variabilelor de decizie.

Goldberg [1989] a sugerat ca performanta unui algoritm genetic este optima

atunci cand se foloseste codificarea binara; alti autori (de ex. Michalewicz,1994) au ajuns

la concluzia ca reprezentarea reala da rezultate cel putin la fel de bune ca si cea binara si,

in plus, este mai usor de implementat. Este cert ca alegerea tipului optim de reprezentare

trebuie facuta in functie de natura problemei. Pana in prezent, majoritatea aplicatiilor AG

in hidrogeologie au folosit codificarea binara. In capitolul 4 al tezei, care prezinta

calibrarea unui acvifer sintetic prin algoritmi genetici, au fost aplicate ambele tipuri de

codificare, realizandu-se o comparatie intre rezultatele obtinute.

Tipul de codificare folosit determina si alegerea operatorilor de incrucisare si

mutatie (dar nu exercita nici o influenta asupra selectiei).

In reprezentarea reala cromozomii sunt chiar vectorii variabilelor de decizie

(fiecare variabila de decizie reprezinta o gena a cromozomului respectiv).

In reprezentarea binara cromozomii sunt alcatuiti din gene care pot lua valorile 0

si 1 si se formeaza prin concatenarea unor subsiruri binare ce corespund variabilelor de

decizie.

Se considera o problema in care vectorul variabilelor de decizie are k

componente: ( )kx,,x,xx K

21= , si fiecare variabila ia valori intr-un anumit interval:

[ ]iii b,ax ∈ . Presupunand ca variabila ix trebuie determinata cu precizia iα−10 (cu iα

zecimale exacte), rezulta ca fiecare interval [ ]ii b,a trebuie divizat in cel putin

( )ii abi −α10 subintervale.

52

Codificarea binara pe r biti furnizeaza r2 cromozomi (deci 12 −r subintervale).

Deci, pentru k,i 1= , se alege ir minim a.i. i

irii ab α−≤

−−

1012

. Un cromozom se obtine prin

concatenarea a k subsiruri binare de diferite lungimi,ir :

)(x

21

2

222

21

1

112

11 21

44 344 2144 344 2144 344 21

KKKKK

k

kr

kkrr

x

bbb

x

bbb

x

bbbk

=

Decodificarea. Pentru fiecare subsir ( )ir

ii

ibbb K21 se calculeaza valoarea zecimala

ir

ririi

i

ii bbbd K+⋅+⋅= −− 22

11 22 , si apoi valoarea reala corespunzatoare a variabilei de

decizie ix : ir

iii

i dab

axi

⋅−

−+=12

.

Daca krrrX +++= K211,0 este multimea cromozomilor si kS ℜ⊂ este spatiul de

cautare, atunci decodificarea este o functie SX →:d care transforma cromozomii in

vectori de variabile de decizie: ( ) ( )kx,x,x K

21xd =

Functia de performanta (de evaluare, de adcvare) este o functie ce ia numai

valori pozitive, aflata in stransa legatura cu functia obiectiv. Intr-o problema de

maximizare, functia de performanta pf poate fi chiar functia obiectiv, of ,eventual

deplasata cu o constanta pentru a se indeplini conditia de nenegativitate:

( ) ( ) Cff op += d(x)x

In cazul problemelor de minimizare se poate face transformarea:

( ) ( ) Cff

op +

=d(x)

1x

In problemele de optimizare cu restrictii acestea pot fi inglobate in functia

obiectiv cu ajutorul unor termeni de penalitate.

53

3.1.4. Operatorii genetici

3.1.4.1. Selectia

Scopul selectiei este valorificarea informatiei continute de indivizii performanti.

Mecanismul selectiei trebuie sa asigure un echilibru intre presiunea de selectie (numarul

mediu de còpii pe care le poate avea cel mai performant individ in populatia

intermediara) si necesitatea mentinerii diversitatii populatiei. O presiune de selectie

ridicata poate determina convergenta la un optim local, in timp ce o presiune de selectie

scazuta duce la o cautare pur aleatoare, ineficienta. Descriem in continuare cele mai

folosite metode de selectie:

a) Selectia proportionala (metoda ruletei)

Avand populatia la momentul t, ( ) tn

tt ,,tP xxx 21 K= , cromozomul tx i este

selectat sa faca parte din populatia intermediara cu probabilitatea

( )( )

( )( )∑

=

=⋅

=n

j

tjp

tip

p

tip

i

f

f

tfn

fp

1

x

xx.

unde ( ) ( )∑=

=n

i

tipp f

ntf

1

x1

reprezinta performanta medie a populatiei.

Operatorul de selectie se aplica de n ori, deci cromozomul tx i va avea, in medie,

( )( )tf

fnpn

p

tip

ii

x== còpii in populatia intermediara, ( )t'P . Este ca si cum o roata de ruleta

impartita in n sectoare (dimensiunea sectorului i fiind proportionala cu ip ) este invartita

de n ori si, de fiecare data, cromozomul „ales” de acul ruletei este selectat sa faca parte

din „baza genetica”.

54

Algoritmul ruletei:

1) Se calculeaza probabilitatile cumulate ii pppq +++= K21 , n,i 1= . (Obs 1=nq ).

2) Pentru fiecare n,i 1= se genereaza aleator un numar [ )1,0∈rand .

• Daca 10 qrand <≤ atunci este selectat cromozomul t0x

• Daca jj qrandq <≤−1 atunci este selectat cromozomul tjx .

Dezavantajele selectiei proportionale apar in cele doua cazuri extreme:

• Atunci cand exista un individ cu o performanta mult peste media populatiei

( ) ( )tff ptip >>x , el va avea un mare numar de còpii, ceea ce duce la uniformizarea

populatiei si aparitia riscului de convergenta prematura.

• Dimpotriva, atunci cand populatia este foarte omogena (performantele indivizilor

au valori foarte apropiate), probabilitatile de selectie devin aproape egale si , in

consecinta, nu mai are loc o selectie propriu-zisa, ci o cautare aleatoare.

b) Selectia bazata pe ordonare

Indivizii populatiei curente sunt ordonati in ordinea descrescatoare a valorilor

functiei de performanta si se noteaza cu ir rangul cromozomului i in acest sir ordonat

(cromozomul cel mai performant are rangul 1). Pentru fiecare n,i 1= probabilitatea de

selectie a cromozomului tix , ip , se defineste in functie de rangul sau ir , independent de

valoarea functiei de performanta , ( )tipf x .

Daca presupunem ca probabilitatea de selectie variaza liniar cu rangul r de la

( )n

p2

1 = pentru cel mai bun individ (presiunea de selectie este 2), la ( ) 0=np , pentru cel

mai putin performant, atunci vom avea:

( ) ( )( )1

2

−−==

nn

rnrpp iii

55

Mai general, daca se alege presiunea de selectie [ ]21,q∈ , atunci, ip variaza

liniar de la ( )n

qp =1 la ( )

n

qnp

−= 2, iar probabilitatea individului i de a fi selectat este:

( ) ( )( )

−−−−==

1

1121

n

rqq

nrpp iii

Pentru a descrie variatia cu rangul a probabilitatii de selectie poate fi

considerata si o alta functie descrescatoare (nu neaparat liniara).

Selectia prin ordonare geometrica normalizata utilizeaza o functie de forma:

( ) ( )( )n

r

h

hhrp

−−−=

−

11

1 1

,

unde h este un parametru in intervalul (0,1).

Dupa stabilirea probabilitatii de selectie pentru fiecare cromozom, nipi ,1 , = ,

procedeul de selectie se desfasoara dupa acelasi mecanism descris mai sus (algoritmul

ruletei).

c) Selectia prin concurs (metoda turnirului)

In cazul „turnirului clasic”, binar, se aleg 2 indivizi din populatia curenta, iar cel

mai performant dintre ei este selectat sa faca parte din populatia intermediara.

Mecanismul se aplica de n ori, pentru obtinerea unei „baze genetice” de dimensiune n.

Se poate imagina si un turnir cu s participanti ( )2≥s . In acest caz, probabilitatea

unui individ de a fi selectat pentru turnir este n

s si, deoarece cel mai performant

cromozom „castiga” cu siguranta, aceasta este si probabilitatea de a fi selectat in

populatia intermediara. Aplicand mecanismul de n ori, va rezulta ca numarul asteptat de

còpii ale celui mai bun in populatia intermediara (presiunea de selectie) este s.

Un avantaj al acestei metode de selectie este ca nu necesita nici un fel de

transformare a functiei obiectiv pentru a evalua performanta indivizilor. Totodata,

selectia prin metoda turnirului este mai eficienta si mai putin predispusa la convergenta

prematura (Goldberg & Deb, 1991). Metoda turnirului este preferata in majoritatea

aplicatiilor algoritmilor genetici in hidrogeologie.

56

3.1.4.2. Incrucisarea

Daca selectia orienteaza cautarea spre regiunile „promitatoare” ale spatiului prin

exploatarea indivizilor performanti, incrucisarea si mutatia asigura explorarea spatiului

solutiilor.

Incrucisarea consta intr-un schimb de „informatie genetica” intre 2 cromozomi

din populatia intermediara selectati aleator. Descendentii rezultati pastreaza

caracteristicile ambilor parinti, dar pot fi mult mai performanti (sau dimpotriva: mai slab

adaptati la mediu; in acest caz, insa, au sanse mari sa fie eliminati la urmatoarea selectie).

Operatorul de incrucisare (crossover) modifica o pereche de cromozomi cu o anumita

probabilitate, cp . In urma aplicarii acestui operator de 2n ori va rezulta o noua

populatie intermediara, ( )tP ′′ , formata din descendenti ai indivizilor care au participat la

incrucisare (in medie, cnp ) si indivizi nemodificati din vechea populatie, ( )tP′ .

Prezentam in cele ce urmeaza cele mai folosite metode de incrucisare. Dupa cum

se poate observa, exista mari deosebiri intre operatorii de incrucisare ce pot fi aplicati in

cazul reprezentarii binare si cei utilizati pentru reprezentarea reala.

a) Incrucisarea binara

a1) Incrucisarea cu un punct de taietura

Consta in „ruperea” cromozomilor-parinti intr-un punct ales arbitrar (intre 1 si r – 1, unde

r este lungimea cromozomilor) si schimbarea intre cei doi a subsirurilor din dreapta

punctului de taietura. Daca k este punctul de taietura, atunci din parintii

==

+

+

r1kk21

r1kk21

yyyyyy

xxxxxx

KK

KK

vor rezulta descendentii

==

+

+

r1kk21

r1kk21

xxyyyy'

yyxxxx'

KK

KK

57

Algoritmul de incrucisare binara:

1. Se selecteaza 2 cromozomi x, y din populatia intermediara ( )tP′ .

2. Se genereaza aleator un numar [ )1,0∈rand .

3. Daca cprand < atunci:

Se genereaza aleator un nr 121 −∈ r,,,k K .

Se executa incrucisarea cu punctul de taietura k, rezultand x’,y’.

altfel, x’:=x si y’:=y.

4. Cromozomii x’ si y’ sunt copiati in noua populatie intermediara, ( )tP ′′ .

Se executa pasii 1 - 4 de 2n ori (pana cand populatia ( )tP ′′ are aceeasi dimensiune cu

populatia initiala, n).

a2) Incrucisarea cu mai multe puncte de taietura

Ca si in cazul cromozomilor din natura, incrucisarea se poate face si cu doua sau

mai multe puncte de taietura: cele doua siruri de gene alese pentru incrucisare se „taie” in

doua sau mai multe puncte, iar cei doi descendenti se obtin prin recombinarea

fragmentelor rezultate.

a3) Incrucisarea uniforma

Este o generalizare a incrucisarii cu mai multe puncte de taietura: fiecare gena a

unui descendent este imprumutata de la un parinte sau altul, in mod aleator.

b) Incrucisarea reala

b1) Incrucisarea aritmetica (convexa)

Cei doi descendenti (x’,y’) sunt combinatii liniare (complementare) ale

cromozomilor-parinti (x , y):

( )( )

+=+=

y

y

αααα

x-1y'

-1xx'

unde α este fie un parametru constant (incrucisare aritmetica uniforma), fie este generat

aleator in intervalul [0,1).

58

b2) Incrucisarea euristica

Consta intr-o extrapolare liniara a doi indivizi (x,y). Acest tip de incrucisare

utilizeaza valorile functiei de performanta si produce un singur descendent,

( ) xy-xx' += α

unde cromozomul x este mai performant decat y, iar α este un numar generat aleator in

intervalul [0,1). Daca „urmasul” rezultat nu e o solutie „fezabila” (nu este o solutie

admisibila) atunci se genereaza un nou nr aleator [ )1,0∈α , pana cand se obtine un

descendent admisibil, sau pana cand se atinge un numar maxim de incercari.

Incrucisarea aritmetica Incrucisarea euristica

Fig. 3.2. Incrucisarea reala (aritmetica si euristica)

3.1.4.3. Mutatia

Reprezinta un mod de a reintroduce diversitatea intr-o populatie in care, din

intamplare, o anumita gena are aceeasi valoare la toti indivizii, prevenindu-se astfel

convergenta la un optim local. Consta in „alterarea” unei gene din populatia ( )tP ′′ cu o

anumita probabilitate, mp . Un cromozom poate suferi mai multe mutatii. Numarul mediu

de mutatii intr-o generatie este mprn ⋅⋅ . Ca si in cazul incrucisarii, exista operatori de

mutatie diferiti pentru codificarea binara , respectiv pentru codificarea reala.

a) Mutatia binara

In cazul reprezentarii binare, mutatia consta in selectarea unei gene (cu

probabilitatea mp ) si complementarea acesteia.

X

X’ Y’

Y

X’

X

Y

59

Algoritmul de mutatie binara:

Pentru fiecare cromozom xi al populatiei ( )tP ′′ ( n,i 1= )

Pentru fiecare gena, ikx , a cromozomului xi ( r,k 1= ):

Se genereaza aleator un numar [ )1,0∈rand .

Daca mprand < atunci se complementeaza gena respectiva.

Daca mprand ≥ atunci gena ramane neschimbata.

In mod obisnuit, se considera ca probabilitatea de mutatie, mp este constanta.

Se poate construi si un algoritm („mutatie neuniforma”) in care mp descreste cu indicele

generatiei:

( ) ( )βtmm eptp −⋅= 1

unde: mp reprezinta probabilitatea de mutatie la prima generatie.

( )tpm reprezinta probabilitatea de mutatie la generatia t.

β este un parametru real (cu cat β e mai mare, cu atat descresterea e mai rapida)

b) Mutatia reala

b1) Mutatia uniforma inlocuieste o gena (selectata aleator cu probabilitatea mp )

cu un numar uniform generat in intervalul de variatie al genei respective:

( )kk b,aU :x ik =

b2) Mutatia la frontiera permite saltul unei gene intr-unul din capetele

intervalului. In cazul in care o gena ikx este selectata pentru mutatie, se genereaza aleator

inca un numar [ )1,01 ∈rand si gena respectiva se modifica astfel:

≥<

=50 daca

50 daca :x

1

1ik .rand,b

.rand,a

k

k

60

b3) Mutatia neuniforma

Este caracterizata de o descrestere a amplitudinii mutatiei cu indicele generatiei, t.

Astfel, genele pot suferi schimbari importante in primele etape ale cautarii, in timp ce in

fazele avansate, in vecinatatea punctului de optim, cautarea devine mai „fina”. La fiecare

generatie t se genereaza doua numere aleatoare, 21 r,r , uniform distribuite in intervalul

[0,1). In cazul in care gena ikx este selectata pentru mutatie, valoarea ei se modifica

astfel:

( ) ( )( ) ( )

≥−−<−+

=50 daca xx

50 daca xx :x

1ik

ik

1ik

iki

k.r,ta

.r,tb

k

k

δδ

unde ( )tδ este o functie ce tinde la 0 atunci cand Tt → ( numarul maxim de generatii):

( )b

T

trt

−= 12δ (Houck et al, 1995) sau ( )b

T

t

rt

−−= 121δ (Michalewicz, 1994)

(b este un parametru de forma, real)

3.1.5. Parametrii de control ai unui algoritm genetic

Alegerea parametrilor care definesc structura unui algoritm genetic este o sarcina

dificila, care depinde foarte mult de problema de optimizare respectiva, de tipul de

codificare ales, de operatorii genetici utilizati. Exista insa niste linii directoare generale si

chiar o serie de indicatii referitoare la aplicatiile algoritmilor genetici in hidrogeologie

(Reed et al, 2000).

1) Lungimea cromozomilor, r

In cazul codificarii reale lungimea cromozomilor este egala cu numarul

variabilelor de decizie (numarul de parametri ai modelului).

Daca se foloseste codificarea binara, lungimea cromozomilor este determinata de

numarul variabilelor de decizie, de amplitudinea domeniului in care acestea variaza si de

precizia dorita.

61

2) Dimensiunea populatiei, n

In cazul problemelor complexe, multimodale, cu cat dimensiunea populatiei este

mai mare, cu atat cresc sansele gasirii optimului global. In cazul folosirii unui algoritm

genetic pentru calibrarea modelelor hidrogeologice, trebuie tinut cont de faptul ca o

populatie numeroasa implica un numar mare de evaluari ale functiei obiectiv (care se fac

prin rularea modelului de simulare), deci algoritmul devine ineficient din punct de vedere

al timpului de calcul. O recomandare generala pentru algoritmul genetic binar este ca

populatia sa fie de ordinul lungimii cromozomilor: ( )rOn ≈ (Deb, 1998).

3) Numarul maxim de generatii, T

Numarul maxim de generatii depinde de lungimea cromozomilor; in cazul

algoritmilor genetici care folosesc selectia prin metoda turnirului, se poate folosi o relatie

de forma: rT 2≈ (Thierens et al, 1998).

4) Probabilitatea de incrucisare, pc

Avand in vedere forta inovativa a operatorului de incrucisare, Goldberg [1989] a

recomandat o probabilitate de incrucisare ridicata: 60.pc ≥ .

In cazul selectiei prin metoda turnirului (cu s concurenti), probabilitatea de

incrucisare trebuie sa respecte o relatie de forma (Reed et al, 2000):

s

spc

1−≤

5) Probabilitatea de mutatie

Goldberg [1989] a sugerat ca probabilitatea de mutatie (a unui bit) trebuie sa aiba

o valoare relativ mica, aproximativ egala cu inversul populatiei:

npm

1≈ .

62

3.2. Metoda calirii simulate

3.2.1. Introducere

Metoda calirii simulate se bazeaza pe analogia cu un proces termodinamic, si

anume cu modul in care se racesc si se calesc metalele. Daca temperatura unei substante

in stare lichida (un metal topit) se reduce incet, atunci natura poate gasi starea de energie

minima a sistemului, in care atomii formeaza o structura ordonata numita retea cristalina.

Daca metalul lichid este racit rapid, nu se atinge aceasta stare finala, de energie minima,

ci se obtine o structura amorfa, avand o energie mai ridicata decat cea a structurii

cristaline.

Se considera ca energia unui sistem aflat in echilibru termic la temperatura T este

distribuita probabilist intre diferite stari energetice, E, avand distributia de probabilitate

Boltzmann:

( )

−=kT

EexpEp

unde k este o constanta (constanta Boltzmann).

In cadrul procesului de calire, sistemul poate trece, deci, dintr-o stare de energie

mai scazuta intr-o stare de energie mai ridicata, dar probabilitatea ca acest lucru sa se

intample scade cu temperatura T.

Considerand ca energia sistemului corespunde functiei obiectiv, iar configuratia

cristalina reprezinta punctul de minim global, se poate imagina un proces iterativ de

cautare a minimului care, in mod asemanator procesului de calire, permite si cresterea, nu

doar descresterea functiei obiectiv (asa cum fac metodele traditionale), evitandu-se astfel

oprirea la un minim local.

Metropolis et al. (1953) au transpus aceste principii intr-un algoritm care

simuleaza evolutia spre echilibru termic la o valoare data a temperaturii, T. Ideea este de

folosi un criteriu probabilistic bazat pe functia Boltmann (in care k=1) care sa accepte cu

probabilitatea 1 pasii in sensul descresterii functiei, dar sa permita, cu o anumita

probabilitate p , si pasi in sensul cresterii functiei.

63

In domeniul hidrogeologiei, Metoda calirii simulate a fost folosita de Dougherty

& Marryot (1991), Marryot et al. (1993) in probleme de optimizarea gospodaririi apelor

subterane. Rogers et al. (1995) au folosit un algoritm de calire simulata pentru a

determina strategia optima de remediere a unui acvifer contaminat. Efstratiadis (2001) a

realizat un algoritm ce combina metoda globala a calirii simulate cu algoritmul Simplex

(Nelder & Mead) de cautare locala si l-a aplicat in probleme de gospodarirea resurselor

de apa subterana.

3.2.2. Structura algoritmului de calire simulata

Metoda calirii simulate reprezinta, practic, o succesiune de algoritmi Metropolis

aplicati pentru valori din ce in ce mai scazute ale temperaturii. Se porneste cu o solutie

admisibila, cx : un vector de variabile de decizie, iar in cazul calibrarii, o configuratie

posibila de parametri. Se noteaza cu ( )cc xEE = valoarea functiei obiectiv (functia

eroare) in punctul cx . Se genereaza o noua solutie px (perturband configuratia curenta,

cx ) si se calculeaza ( )pp xEE = .

1. Daca cp EE ≤ atunci noua solutie este, evident, cel putin la fel de buna ca

precedenta, deci este acceptata si procesul este reluat din acest punct.

2. Daca cp EE > atunci, cu toate ca solutia perturbata px este mai „slaba” decat

solutia curenta cx , ea poate fi totusi acceptata, cu probabilitatea

−−=

T

EEexpp cp ,

unde T este un numar pozitiv care are acelasi rol ca si temperatura in procesul de calire.

Se observa ca:

• pentru T fixat, probabilitatea de acceptare este cu atat mai mare cu cat diferenta

cp EEE −=∆ este mai mica;

64

• atunci cand „temperatura” T este ridicata, probabilitatea de acceptare a unei noi

solutii este foarte aproape de 1, chiar daca diferenta cp EEE −=∆ este mare, iar

procesul de cautare are un caracter pur aleator;

• daca „temperatura” T este scazuta, noile solutii mai „slabe” sunt aproape sigur

respinse, chiar daca diferenta cp EEE −=∆ este relativ mica.

Pentru a decide daca solutia px este sau nu acceptata, se genereaza aleator un

numar r in intervalul [0,1). Daca pr < atunci solutia px este acceptata; daca nu, solutia

curenta ramane cx si se genereaza o noua solutie perturbata, px .

Pentru fiecare valoare a parametrului T se genereaza un numar fixat de solutii

perturbate, n , dupa care se reduce temperatura printr-un un factor 1<λ : T:T λ= si

procesul este reluat. Conditia de oprire este de obicei atingerea numarului maxim de

trepte de temperatura, N. Se observa ca procesul de cautare prin metoda calirii simulate

este alcatuit dintr-un numar de iteratii globale (N), fiecare iteratie globala avand un numar

de subiteratii (n) efectuate la temperatura constanta.

Algoritmul de calire simulata:

Pasul 1. Se initializeaza temperatura: 0TT = si se selecteaza o solutie initiala, 0xxc = .

Se calculeaza ( )cc xEE =

Pasul 2. Pentru N,i 1= se repeta pasii 3 si 4

Pasul 3. Pentru n,j 1= se executa 3.1 si 3.2

3.1 Se genereaza o noua solutie, px si se calculeaza ( )pp xEE =

3.2 Daca cp EE ≤ atunci px este acceptata ca solutie curenta: pc x:x =

Daca cp EE > atunci se genereaza un nr aleator r uniform distribuit [0,1)

Daca

−−=<

T

EEexppr cp atunci se accepta solutia perturbata px

pc x:x = .

Pasul 4. Se reduce temperatura: T:T λ=

65

3.2.3. Parametrii algoritmului de calire simulata

Alegerea parametrilor care controleaza procesul iterativ, 0T , n si λ , este deosebit

de importanta .

Temperatura initiala, 0T se poate alege in functie de valoarea functiei obiectiv in

punctul initial, ( )00 xEE = , printr-o relatie de forma (Popa, 2003):

aln

E,T

10 00

⋅−=

unde a este un parametru ce reprezinta proportia de solutii care sunt acceptate din

multimea configuratiilor avand functia obiectiv cu 10% mai mare decat 0E .

Parametrul n, ce reprezinta numarul de perturbatii efectuate la un nivel de

temperatura constant, trebuie sa fie suficient de mare. O valoare prea ridicata duce insa la

cresterea exagerata a timpului de calcul. In general, se admite ca n poate fi de 10 ori mai

mare decat dimensiunea vectorului variabilelor de decizie.

Factorul de reducere a temperaturii, λ , se ia de obicei in intervalul [0,8 , 1). O

valoare mica a lui λ determina scaderea rapida a temperaturii, ceea ce poate face ca

procesul sa se opreasca la un optim local, in timp ce, daca temperatura scade foarte lent,

timpul de calcul creste considerabil.

Criteriul de oprire poate fi reprezentat de:

• atingerea numarului maxim de trepte de temperatura, N

• atingerea unei temperaturi finale minime prestabilite, finalT

• realizarea unui numar specificat de iteratii globale succesive fara nici o

modificare a functiei obiectiv.

66

4. Calibrarea unui acvifer sintetic (virtual) folosind

tehnici de optimizare neconventionale.

4.1. Descrierea modelului

Pentru a investiga performantele algoritmilor genetici si metodei calirii simulate

in calibrarea modelelor hidrogeologice, se considera un acvifer sintetic bi-dimensional

sub presiune, in regim de curgere permanent. Considerand, in plus, mediul de curgere

izotrop, ecuatia care guverneaza curgerea se scrie:

0=+

∂∂

∂∂+

∂∂

∂∂

qy

hT

yx

hT

x (4.1)

Se considera doua cazuri, diferentiate de conditiile de margine.

Cazul 1. Conditiile de margine:

• de tip Dirichlet (cota hidraulica impusa) la V (H1=100m) si E (H2=80m)

• de tip Neumann (limita impermeabila) la N si S (Q=0)

Cazul 2. Conditiile de margine:

• de tip Dirichlet (cota hidraulica impusa) la N (H=100m)

• de tip Neumann : limita impermeabila la E si S (Q=0)

flux impus la V (Q=0,08 m/zi)

In acvifer exista doua puturi de extractie avand debitele :

P1=10000 m3/zi

P2=20000 m3/zi

67

(a) (b)

Fig. 4.1. Acviferul sintetic : cazul 1 (a) si cazul 2 (b)

Acviferul se considera impartit intr-un numar de m zone omogene, de

transmisivitati mT,...,T,T 21 .

Problema directa este rezolvata pentru transmisivitatile « reale » mT,...,T,T 21 prin

metoda diferentelor finite (utilizand programul MODFLOW) si se calculeaza valorile

« reale » ale sarcinii hidraulice in nodurile de calcul, obsih . Folosind aceste valori, se

rezolva problema inversa

( ) ( ) ( )∑ −=i

obsi

calcim hhT,...,T,TE

2

21min (4.2)

P1=10000 m3/zi

P2=20000 m3/zi

Q=0

,08

m/z

i

H=

100

m

P1=10000 m3/zi

P2=20000 m3/zi

H=

80

m

H=100 m

68

4.2. Structura algoritmilor utilizati

Pentru rezolvarea problemei inverse s-au folosit 3 algoritmi:

1) un algoritm genetic real

2) un algoritm genetic binar

3) metoda calirii simulate.

Functia de performanta utilizata de algoritmii genetici este chiar functia eroare.

Un « individ » ( )mT,...,T,T 21 T = este considerat cu atat mai « performant » cu cat eroarea

asociata este mai mica.

Ca metoda de selectie s-a folosit metoda turnirului (binar) : se aleg din populatia

curenta (in mod aleator) doi indivizi T1 si T2 ; daca E(Ti) ≤ E(Tj) atunci Ti intra in

populatia intermediara (baza genetica pentru populatia urmatoare). Procedeul se repeta de

n ori (pana cand populatia intermediara are aceeasi dimensiune ca si populatia curenta).

Atat operatorii de incrucisare si mutatie utilizati, cat si parametrii pc si pm sunt

prezentati in tabelul 4.1 :

Tabelul 4.1. Operatorii genetici utilizati

Metoda de

incrucisare

Metoda de

mutatie

pc (probabilitatea

de incrucisare)

pm(probabilitatea

de mutatie)

AG real euristica neuniforma 0.5 0.1

AG binar uniforma binara 0.5 0.01

In algoritmul genetic binar, fiecare variabila iT a fost codificata pe 13 biti

(limitele de variatie ale parametrilor: 8291100 ≤≤ iT , iar precizia dorita: h=1), ceea ce

inseamna ca lungimea unui cromozom este m×13 .

Pentru fiecare generatie T,k 1= se noteaza :

69

• kn

kkk T,...,T,TP 21= populatia curenta (unde fiecare individ, kjT este un

vector de dimensiune m )

• kbT cel mai performant individ din populatie si ( ) ( )k

jn,j

kb

kb TEminTEE

1===

• ( )∑=

=n

i

kj

k TEn

E1

1 performanta medie a populatiei kP

S-au considerat doua structuri ale acviferului, cu grade de complexitate diferite:

m=2 si m=4. Dimensiunea populatiei, n, si numarul de generatii, T, au fost stabilite,

pentru fiecare caz, printr-un proces de tip « trial & error », dupa mai multe rulari.

Tabelul 4.2 Dimensiunea populatiei si numarul de generatii.

n (dimensiunea populatiei) T (numarul de generatii)

AG real 30 30 m = 2

AG binar 30 40

AG real 50 40 m = 4

AG binar 50 60

70

4.3. Calibrarea acviferului impartit in 2 zone (m=2)

Pentru inceput, se considera ca acviferul este impartit in doua zone: una in

jumatatea de nord, avand transmisivitatea « reala » realT1 =2000 m2/zi, cealalta in

jumatatea de sud, realT2 =1000 m2/zi.

Fig. 4.2. Suprafata piezometrica “reala” (cazul 1, m=2)

Fig. 4.3. Suprafata piezometrica “reala” (cazul 2, m=2)

71

Problema inversa se reduce la minimizarea unei functii de doua variabile :

( ) ( ) ( )∑ −=i

obsi

calci hhT,TE

2

21min

02468101214161820222426283032343638404244464850

F

Fig. 4.4. Reprezentarea grafica a functiei eroare ( )21,TTE (cazul 1)

0

20

40

60

80

100

120

140

160

180

200

220

240

260

280

300

320

Fig. 4.5. Reprezentarea grafica a functiei eroare ( )21 T,TE (cazul 2)

72

Algoritmul genetic real converge foarte rapid: in cel mult 30 de generatii eroarea

asociata celui mai bun individ, ( )kb

kb TEE = , devine de ordinul 10-3 ; media populatiei ,

kE converge si ea la 0. In primul caz, functia eroare are o zona de minim relativ

« plata », motiv pentru care punctul de minim gasit aproximeaza transmisivitatile

« reale » cu o marja de eroare de 1%. In cel de-al doilea caz minimul este gasit cu

exactitate. Algoritmul genetic binar converge mai lent si mai « nesigur » : eroarea

asociata celui mai performant individ dupa 40 de generatii este de ordinul 10-2 in primul

caz, si 10-3 in cazul 2, iar valorile calculate ale transmisivitatilor zonale le aproximeaza

pe cele « reale » cu o marja de eroare de 2%, respectiv 1%.

In metoda calirii simulate numarul de subiteratii (efectuate la temperatura

constanta) este n=20 iar numarul maxim de iteratii principale : N=70. Rezultatele

obtinute prin MCS sunt comparabile cu cele obtinute de AG binar.

Tabelul 4.3. Transmisivitatile zonale rezultate din calibrare (cate doua exemple pentru

fiecare caz si pentru fiecare algoritm). m=2

T1 (m2/zi) T2 (m

2/zi) ( )21 T,TE

Valori reale 2000 1000

1991.2 1009.0 0.0001 AG real

2001.5 995.1 0.002

2031 1009 0.038 AG binar

2042 987 0.014

2028.7 984.4 0.002

Cazul 1

Calire simulata

2038.1 975.8 0.0042

2000 1000 0 AG real

1997.8 1001.5 0.001

2016 995 0.026 AG binar

1994 1003 0.0037

2014.2 1000.2 0.0232

Cazul 2

Calire simulata

2001.2 1010.1 0.007

73

0

1

2

3

4

5

6

7

8

1 4 7 10 13 16 19 22 25 28 31 34 37 40

Generatia

Ero

area

min

ima

AG real

AG binar

Fig. 4.6. Algoritmul genetic : variatia celei mai bune performante ( )kb

kb TEE =

cu generatia, k ( m=2)

0

20

40

60

80

100

120

140

1 4 7 10 13 16 19 22 25 28 31 34 37 40Generatia

Ero

are

a m

edi

e

AG realAG binar

Fig. 4.7. Algoritmul genetic : variatia performantei medii kE cu generatia, k ( m=2)

Se observa ca in algoritmul genetic real si performanta medie a populatiei converge la 0.

74

0

5

10

15

20

25

30

35

40

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69

Iteratia

Ero

area

Fig. 4.8. Metoda calirii simulate: variatia functiei obiectiv cu iteratia (m=2)

75

4.4. Calibrarea acviferului impartit in 4 zone ( m=4)

Se mareste gradul de complexitate al problemei, crescand dimensiunea parametrizarii de

la m=2 la m=4 : se considera acviferul impartit in 4 zone (egale ca suprafata), valorile

« reale » ale transmisivitatilor zonale fiind cele din tabelul de mai jos :

Tabelul 4.4. Transmisivitatile zonale « reale » in cazul m=4

T1=4000 T2=500

T3=2000 T4=8000

In acest caz problema calibrarii consta in minimizarea unei functii de 4 variabile:

( ) ( )4321min T,T,T,TE

AG real ajunge la rezultate apropiate de cele reale, cu conditia ajustarii

parametrilor: trebuie marita atat dimensiunea populatiei (la 50 de indivizi), cat si numarul

de generatii (la 40). AG binar este mai lent si mai putin precis (pentru a obtine o precizie

de 10% au fost necesare cel putin 50 de generatii). O mai buna acuratete se poate obtine

ruland inca o data programul cu o populatie initiala formata din cei mai buni indivizi

gasiti in prima rulare. Metoda calirii simulate (in care se utilizeaza n=40 de subiteratii

efectuate la temperatura constanta) ajunge si ea la rezultate apropiate de cele reale :

76

Tabelul 4.5. Transmisivitatile zonale rezultate din calibrare (m=4)

T1 T2 T3 T4 ( )41 T,...,TE

Valori reale 4000 500 2000 8000 -

AG real 4163.5 537.2 2030.9 8289.1 0.006

AG binar 4366 613 1956 8109 0.0437 Cazul 1

MCS 4303.6 607.1 1945.0 7693.2 0.1032

AG real 4009.7 494.7 2003.1 8005.0 0.0007

AG binar 4071 459 2123 7691 0.032 Cazul2

MCS 3985.1 506.3 1988.7 7980.9 0.0006

0

2

4

6

8

10

12

14

16

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49

Generatia

Ero

area

min

ima

AG realAG binar

Fig. 4.9 Algoritmul genetic : variatia celei mai bune performante ( )kb

kb TEE =

cu generatia, k (m=4)

77

0

50

100

150

200

250

300

350

400

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49

Generatia

Ero

are

a m

edi

e

AG realAG binar

Fig. 4.10 Algoritmul genetic: variatia performantei medii kE cu generatia, k ( m=4)

0

2

4

6

8

10

12

14

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69

Iteratia

Ero

area

Fig. 4.11. Metoda calirii simulate: variatia functiei obiectiv cu iteratia ( m=4)

78

Pentru a verifica performantele celor 3 algoritmi, valorile « reale » ale sarcinii

hidraulice in nodurile de calcul au fost perturbate de un zgomot gaussian (de medie 0 si

dispersie 0.2) care sa simuleze « erorile de masurare ». Transmisivitatile calculate de AG

real si MCS pe baza acestor valori aproximeaza destul de exact valorile reale (eroarea

fata de transmisivitatile « reale » este sub 10%) :

Tabelul 4.6 Transmisivitatile « reale » si cele calibrate pe baza unor observatii cu « erori

de masurare » (m=2)

T1 T2 ( )21 T,TE

Valori reale 2000 1000 0.8702

AG real 1964.0 1016 0.8277

AG binar 1632 1131 1.3 Cazul 1

MCS 2064.5 1002.3 0.94

AG real 2001.2 1018.5 0.983

AG binar 2108 1035 2.3 Cazul 2

MCS 2037.3 1057.0 1.3

Tabelul 4.7 Transmisivitatile « reale » si cele calibrate pe baza unor observatii cu « erori

de masurare » (m=4)

T1 T2 T3 T4 ( )41 T,...,TE

Valori reale 4000 500 2000 8000 0.87

AG real 3892 553 1927 7905 0.975

AG binar 4052 572 2065 7192 1.02 Cazul 1

MCS 4112 524 2065 7883 0.907

AG real 3988.1 379.8 2421.5 6886.2 1.22

AG binar 4192 359 2404 6418 0.83 Cazul 2

MCS 3599.5 597 1880.8 7764.6 1.5

79

4.5. Concluzii

Cele doua tehnici de optimizare neconventionale prezentate in capitolul 3 –

algoritmii genetici si metoda calirii simulate – au fost utilizate in calibrarea

transmisivitatilor zonale pentru doua acvifere virtuale bi-dimensionale, in regim

permanent. Diferenta intre cele doua acvifere este data de conditiile de margine.

Atat algoritmii genetici, cat si metoda calirii simulate s-au dovedit deosebit de

eficienti in minimizarea functiei eroare in cazul unei structuri simple, bizonale, dar si

pentru o structura mai complexa, caracterizata de 4 parametri. Algoritmul genetic care

utilizeaza codificarea reala converge mai rapid si este, evident, mai natural si mai usor de

implementat. Solutia gasita de acesta este, in general, mai apropiata de cea reala decat

solutia furnizata de algoritmul genetic binar.

Eficienta algoritmilor prezentati a fost verificata prin utilizarea lor pe un set de

date perturbate de un zgomot gaussian (care simuleaza erorile de observatie ce pot aparea

intr-un caz real), constatandu-se ca transmisivitatile « reale » sunt aproximate suficient de

bine si in aceasta situatie.

Exemplele numerice considerate demonstreaza faptul ca algoritmii genetici si

metoda calirii simulate sunt metode de optimizare deosebit de robuste, care pot fi aplicate

cu succes in calibrarea unor acvifere reale.

80

5. Identificarea parametrilor hidrogeologici ai unui acvifer real

5.1. Conul aluvionar al raului Somes. Modelul conceptual

Cu o suprafata totala de aproximativ 3000 km2, conul aluvionar al Somesului este

situat pe teritoriul Romaniei si Ungariei, fiind alcatuit din nisip si pietris, dar si din

formatiuni argiloase. Probele obtinute din mai multe foraje sugereaza un grad ridicat de

heterogenitate. Conditiile reale, deosebit de complexe, trebuie schematizate/ simplificate,

astfel incat aceasta simplificare sa afecteze cat mai putin gradul de incredere in model

(Drobot et al, 2004). Modelul conceptual a fost realizat in cadrul proiectului SQUASH

(Somes/Szamos Quantitative/Qualitative Study of the Hydrogeology).

Fig. 5.1. (a) Conul aluvionar al raului Somes

(SQUASH Report, 2001)

81

Fig. 5.1. (b) Conul aluvionar al raului Somes. Sectiunea principala.

(SQUASH Report, 2001)

Un compromis rezonabil intre complexitatea conditiilor reale si necesitatea

reprezentarii simplificate s-a considerat ca este o reprezentare tri-strat a acviferului:

Astfel, exista un acvifer de suprafata (pana la o adancime de 30-60 m), un strat

semipermeabil argilos (avand o grosime maxima de 34 m) si un acvifer de adancime, sub

presiune, care se intinde pana la o adancime de 200 m. In partea de est exista un singur

acvifer (freatic). Hartile piezometrice alcatuite pe baza unor date observate in puturi de

suprafata si de adancime indica o diferenta de 1-5 m intre cele doua acvifere: acviferul

freatic (cu o cota piezometrica mai ridicata) alimenteaza, prin stratul semipermeabil,

acviferul de adancime care constituie principala sursa de apa pentru aceasta regiune.

82

Fig 5.2. Modelul conceptual (SQUASH Report, 2001)

Conditiile de margine

a) Conditii de tip Dirichlet (sarcina hidraulica impusa) s-au utilizat pe limita nordica

(raul Tisa) si vestica (raul Crasna) pentru primul strat si in partea estica, unde

exista numai acviferul freatic, pentru a descrie contactul intre zona inalta (de unde

se alimenteaza acviferul prin scurgerea de suprafata) si zona de campie.

b) Conditii de tip Neumann (flux impus) s-au folosit in partea sud-vestica pentru

acviferul de adancime (care se considera ca este alimentat din zona Nyirseg cu un

flux de 0.002 m/zi) si in partea de sud si nord-est (unde limita acviferului s-a

considerat impermeabila pentru cele trei strate) datorita contactului cu formatiuni

geologice cu permeabilitate scazuta.

c) Conditii de tip Cauchy (mixte : sarcina hidraulica dependenta de flux) s-au utilizat

pe limita de nord a acviferului, pentru a modela legatura dintre al doilea si al

treilea strat si raul Tisa

Dupa cum se poate observa, cele de mai sus se refera numai la frontierele

“laterale” ale modelului. Fiind un model tridimensional, frontiera include si suprafata

reprezentata de “culcusul” acviferului, considerata impermeabila (conditie de tip

83

Neumann), si suprafata freatica – o limita variabila (se stie ca grosimea acviferelor

freatice variaza cu sarcina hidraulica) unde conditiile de margine sunt de tip Cauchy:

sarcina hidraulica depinde de fluxul schimbat de acvifer cu cele doua rauri importante –

Somes si Tur – , dar si de alimentarea din precipitatii.

Fig. 5.3.(a) Conditiile de margine in stratul 1

Fig. 5.3. (b) Conditiile de margine in stratul 3

Cota hidraulica impusa (Dirichlet)

Limita impermeabila (Q = 0 : Neumann)

Flux impus (Neumann)

Conditii mixte (Cauchy)

84

Debitele exploatate. Cotele piezometrice masurate

Exista in zona mai multe puturi de exploatare, atat din acviferul de suprafata, cat

si din cel de adancime. Datele utilizate provin din baza de date comuna (Ro – Hu)

realizata in cadrul proiectului SQUASH (Somes/Szamos Quantitative/Qualitative Study

of the Hydrogeology). In aceasta baza de date sunt inregistrate cote piezometrice si debite

medii lunare din perioada 1978 – 2001. Modelul a fost calibrat in regim permanent,

utilizand valorile medii pentru cote piezometrice si debite.

In partea romana a acviferului exista doua sisteme de captare importante:

Martinesti (care alimenteaza orasul Satu Mare) si Doba (care alimenteaza orasul Carei).

Un numar de 32 puturi la Doba si 64 la Martinesti extrag, in medie, din acviferul de

adancime debite de aproximativ 13000 m3/zi (la Doba) si, respectiv, 65000 m3/zi (la

Martinesti). In afara acestor captari mai exista (in zona romaneasca) un numar de 55 de

puturi, care pompeaza un debit de aproximativ 20000 m3/zi.

Partea aflata pe teritoriul Ungariei este o regiune putin populata, fara orase

importante. In aceasta zona exista date inregistrate pentru 33 de puturi prin care se

extrage, in medie, un debit de aproximativ 13000 m3/zi.

Transpunerea in ecuatii matematice a modelului conceptual considerat s-a realizat

cu ajutorul pachetului de programe GMS 4.0. (Groundwater Modeling System). Pentru

rezolvarea ecuatiei de curgere tridimensionale s-a utilizat programul de diferente finite

MODFLOW. Reteaua de discretizare construita este formata din aproximativ 19000 de

celule, repartizate in 3 straturi.

Intr-o prima varianta s-a considerat un model cu 3 parametri:

• Conductivitatea hidraulica orizontala in stratul 1, [ ]300,101 ∈hK m/zi

• Conductivitatea hidraulica orizontala in stratul 3, [ ]200,53 ∈hK m/zi

• Alimentarea din precipitatii, [ ]53 10,10 −−∈R m/zi

Raportul de anizotropie vh KK a fost luat egal cu 10 in stratele 1 si 3. Pentru

stratul de mijloc (semipermeabil) s-au considerat 3 variante:

85

• 22vh KK = = 0.1 m/zi

• 22vh KK = = 1 m/zi

• 22vh KK = =10 m/zi

Minimizarea functiei eroare ( ) ( )∑=

−=n

k

obsk

calckhh hhRKKE

1

231 ,, s-a facut cu ajutorul

programului PEST. Pentru evaluarea modelului (in afara functiei eroare, E ) s-au utilizat

si functiile:

∑=

−=n

k

obsk

calck hh

nMAE

1

1

( )∑=

−=n

k

obsk

calck hh

nRMSE

1

21

unde: n reprezinta numarul punctelor de observatie

obskh reprezinta valoarea sarcinii hidraulice observata in punctul n,..,k,k 1=

calckh reprezinta valoarea sarcinii hidraulice calculata in punctul k.

Valoarea minima gasita a fost aceeasi in toate cele 3 variante, diferentele dintre

cele 3 solutii optime fiind nesemnificative:

E=271, MAE = 1.428 si RMSE = 1.765, si:

( ) ( )( )

( )4

4

4321

1017.1 , 21 10, , 041

1021.1 , 27 1, , 85

102.1 , 27 0.1, , 89,,,

−

−

−

⋅⋅⋅=RKKK hhh

Evident, si hartile piezometrice sunt foarte asemanatoare. In figura 5.4. este

prezentata harta piezometrica (si puturile de observatie) in varianta 1:

86

Fig. 5.4. Cotele piezometrice calculate. Erorile in punctele de observatie.

Fig. 5.5. Diferenta intre valoarea calculata si cea masurata intr-un put de obs.

Daca se considera si conductivitatea hidraulica in stratul 2 ca parametru

[ ]50,05.022 ∈= vh KK m/zi, valoarea minima gasita de PEST pentru functia obiectiv este

aceeasi, E = 271, (MAE = 1.428 si RMSE = 1.765), valori ce se ating pentru seturi

optime de parametri apropiate de cele gasite mai sus:

( ) ( )( )( )4

4

4321

1018.1 , 22 17, , 88

1024.1 , 23 , 13 , 82

1019.1 , 23 8, , 39,,

−

−

−

⋅⋅⋅=RKKK hhh

Eroarea

hobs+1m

hobs-1m

hobs

hcalc

87

Valorile gasite mai sus pentru RKKK hhh ,,, 321 reprezinta valori medii ale

parametrilor respectivi. Pentru ca modelul sa reflecte mai bine situatia reala (caracterizata

de un grad ridicat de heterogenitate), acesti parametrii au fost considerati functii (in loc

de constante). S-au studiat doua variante: zonarea (in care parametrii sunt, practic, functii

constante pe portiuni) si interpolarea (utilizata de metoda punctelor pilot).

88

5.2. Calibrarea acviferului folosind zonarea

Zonarea acviferului de suprafata si a celui de adancime s-a facut mai intai

utilizand informatiile (hidro)geologice existente. Acviferul de suprafata (stratul 1) a fost

impartit in 5 zone, iar acviferul de adancime (stratul 3) a fost impartit in 4 zone. S-a

stabilit acelasi raport de anizotropie vh KK = 10 in toate zonele, mai putin stratul de

mijloc (semipermeabil) pentru care s-au considerat (din nou) cele 3 variante.

In startele 1 si 3 s-a considerat ca parametrul hK (conductivitatea hidaulica in

plan orizontal) variaza in intervalul 10..300 m/zi, respectiv in intervalul 10..200 m/zi.

Valoarea initiala, in toate zonele, a fost de 200 m/zi.

Pentru alimentarea din precipitatii s-au stabilit 6 zone in care acest parametru

variaza in intervalul 10-5..10-3 m/zi. Valoarea initiala, in toate zonele a fost 0.0003 m/zi.

Modelul depinde, deci, de 15 parametri.

Valorile optime ale parametrilor (aproximativ aceleasi in toate cele 3 variante)

sunt prezentate in fig. 5.6. Intre solutiile optime gasite in cele 3 variante diferentele sunt

nesemnificative. La fel si diferentele intre valorile minime gasite de PEST pentru

functia obiectiv:

• 22vh KK = = 0.1 m/zi ⇒E = 173, MAE = 1.122 si RMSE = 1.409

• 22vh KK = = 1 m/zi ⇒ E = 174, MAE = 1.133 si RMSE = 1.413

• 22vh KK = =10 m/zi ⇒ E = 173, MAE = 1.133 si RMSE = 1.411

Pentru comparatie, cea mai mica valoare a erorii obtinuta prin calibrare manuala a fost

E = 257, MAE = 1.302 si RMSE = 1.719

89

a) b)

c)

Fig 5.6. Conductivitatea hidraulica orizontala pentru zonele din stratele 1(a) si 3(b)

c) Alimentarea din precipitatii

90

Fig. 5.7. Harta piezometrica rezultata cu parametrii optimi

Pentru a imbunatati rezultatele s-a considerat o zonare mai "fina": Fiecare zona a

fost impartita in doua-trei zone, in speranta unei descrieri mai exacte a situatiei reale. A

rezultat un model cu 31 de parametri: 11 zone pentru conductivitatea hidraulica in stratul

1, 8 zone in stratul 3, 12 zone pentru alimentarea din precipitatii. Conductivitatea

hidraulica in stratul 2 a fost luata 22vh KK = = 10 m/zi. Valoarea minima a functiei

obiectiv a fost: E = 140, iar MAE = 1.003 si RMSE = 1.268.

In figura 5.8. sunt prezentati parametrii optimi (conductivitatea hidraulica) pentru

fiecare zona (din stratele 1 si 3).

91

a) b)

c)



Desi eroarea este mai mica decat in cazul primei zonari (mai “grosiera”), acest

model nu poate fi acceptat deoarece exista contraste prea mari intre zone alaturate. De

aceea, s-au stabilit niste limite mai stricte pentru conductivitati, modelul rezultat fiind mai

"plauzibil", in ciuda faptului ca eroarea asociata este mai ridicata: E=150; MAE=1.034,

RMSE=1.312.

92

(a) (b)


In afara de suma patratelor reziduurilor, o buna estimare a validitatii modelului

este data de coeficientul de corelatie definit astfel:

( )( )( ) ( )∑∑

∑

==

=

−⋅−

−−=

n

i

calccalci

n

i

calccalci

n

i

obsobsi

calccalci

hhhh

hhhhr

1

2

1

2

1

unde: obs

h reprezinta media cotelor piezometrice observate

calch reprezinta media cotelor piezometrice calculate

In general, coeficientul de corelatie trebuie sa fie peste 0.9 pentru ca modelul sa

poata fi validat (Hill, 1998). In primul caz (cu zone mai putine) coeficientul de corelatie

este r = 0.969, iar in modelul cu zonarea mai fina (ultimul caz), valoarea lui creste la r =

0.984.

93

5.3. Calibrarea acviferului folosind metoda punctelor pilot

In metoda punctelor pilot, spre deosebire de zonare, parametrii fizici nu

inregistreaza salturi bruste, nenaturale, de la o celula la alta. Un alt avantaj este acela ca

pozitia punctelor pilot nu este atat de determinanta pentru model, asa cum este stabilirea

zonelor. In general, aceste puncte pilot sunt uniform raspandite in intregul domeniu.

S-au luat in calcul doua variante:

A) Considerand acviferul tri-strat, ca mai sus. Numarul de puncte pilot a fost

crescut treptat (plecand de la un model cu 5 puncte pilot pentru 1hK , 5 pentru 3

hK , 5

pentru alimentarea din precipitatii).

B) Considerand acviferul monostrat (varianta in care timpul de calcul, dar si

eroarea rezultata, sunt mai mici). Si aici au fost construite mai multe modele, crescand

treptat numarul de puncte pilot (plecand de la un model cu 8 puncte pilot pentru hK si 8

pentru R).

94

A) Reprezentare tri-strat

A1) Model 5x5x5 (5 puncte pilot pentru 1hK , 5 pentru 3

hK , 5 pentru R).

Este un model cu 17 parametri (in afara celor 15 valori in punctele pilot, mai sunt

2 parametri: conductivitatea hidraulica verticala in stratul 1 si in stratul 3). Pentru

conductivitatea hidraulica in stratul 2 s-au luat din nou 3 variante, dar diferentele intre

parametrii optimi au fost nesemnificative. Valoarea minima a functiei obiectiv a fost:

E=194, MAE = 1.211 si RMSE = 1.495

a) b)

c)

Fig. 5.10. Model 5x5x5. Conductivitatea hidraulica pentru zonele din stratele 1(a) si 3(b)


95

A2) Model 10x8x10 (10 puncte pilot pentru 1hK , 8 pentru 3

hK , 10 pentru R)

Este un model cu 28 de parametri (conductivitatea hidraulica verticala in stratele

1 si 3 a fost considerata constanta: 5,10 31 == vv KK ). In stratul 2 s-a luat 22vh KK = = 1

m/zi. Valoarea minima a functiei obiectiv a fost:

E=162, MAE = 1.096 si RMSE = 1.365

a) b)

c)

Fig. 5.11. Model 10x8x10. Conductivitatea hidraulica pentru stratul 1(a) si 3(b)

c)Alimentarea din precipitatii

96

A3) Model 15x10x10

Model cu 35 de parametri.

5,10 31 == vv KK , 22vh KK = = 1 m/zi.

E=148, MAE = 1.019 si RMSE = 1.306

a) b)

c)



97

A4) Model 20x15x15


5,10 31 == vv KK , 22vh KK = = 1 m/zi.

E=143, MAE = 0.985 si RMSE = 1.281

a) b)

c)



98

A5) Model 26x20x20


5,10 31 == vv KK , 22vh KK = = 1 m/zi.

E=119, MAE = 0.927 si RMSE = 1.168

a) b)

c)



99

A6) Model 30x25x25


5,10 31 == vv KK , 22vh KK = = 1 m/zi.

E=111, MAE = 0.888 si RMSE = 1.129

a) b)

c)



In figura 5.16 este reprezentata grafic variatia minimului gasit de PEST, minE , cu

numarul de parametri. Se observa o tendinta de descrestere de forma:

BAxy −=

100

Dupa cum se stie, insa, numarul de parametri nu poate depasi numarul

observatiilor (au fost considerate 87 puturi de observatie), in caz contrar, solutia devine

instabila.

Tabel 5.1 : Modele tristrat

Nr parametri Puncte pilot pt K, stratul 1

Puncte pilot pt K, stratul 3

Puncte pilot pt Recharge minE RMSE

Nr. apelari MODFLOW

/ iteratie 1 3 271 1.765 7 2 17 5 5 5 194 1.495 28 3 28 10 8 10 162 1.365 51 4 35 15 10 10 148 1.306 72 5 50 20 15 15 143 1.281 75 6 66 26 20 20 119 1.168 128 7 80 30 25 25 111 1.129 135 8 87 35 20 32 111 1.129 172

y = 386 x-0.27

0

50

100

150

200

250

300

350

0 20 40 60 80 100

Numar de parametri

E m

in

Fig. 5.16. Variatia minimului functiei eroare, minE , cu numarul de parametri,

pentru reprezentarea tristrat

101

B) Reprezentare monostrat

B1) Model omogen

Considerand un model cu 2 parametri (conductivitatea hidraulica si alimentarea

din precipitatii), minimul gasit de PEST a fost: E = 325.4, MAE = 1.595, RMSE = 1.938,

iar parametrii optimi: K = 200 m/zi (limita superioara considerata in acest caz) si R =

0.0003 m/zi.

In figura de mai jos este prezentata harta piezometrica obtinuta cu acesti parametri

(precum si erorile in punctele de observatie).

Fig. 5.17. Harta piezometrica pentru modelul monostrat omogen

Ca si in cazul modelului tristrat, s-au considerat mai multe variante, crescand

treptat numarul punctelor pilot, observand descresterea valorii minime a functiei obiectiv,

minE , odata cu cresterea gradului de complexitate.

102

B2 ) Model 8x8

Model cu 16 parametri (8 puncte pilot pentru conductivitatea hidraulica, 8 pentru

alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 158, iar

MAE = 1.081 , RMSE = 1.345

a) b)

Fig.5.18. Model 8x8: a) Conductivitatea hidraulica; b) Alimentarea din

precipitatii

B3) Model 10x10

Model cu 20 de parametri (10 puncte pilot pentru conductivitatea hidraulica, 10

pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 139.

MAE = 1.031 , RMSE = 1.266.

a) b)


precipitatii

103

B4) Model 15x8


pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost: E = 131;

MAE = 0.934 , RMSE = 1.23.

a) b)


precipitatii

B5) Model 15x15



MAE = 0.870 , RMSE = 1.127.

a) b)


precipitatii

104

B6) Model 20x20


pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost mai mare

decat cea gasita in modelul cu 15 parametri: E = 122; MAE = 0.922 , RMSE = 1.184.

a) b)


precipitatii

B7) Model 40x35



MAE = 0.727 , RMSE = 0.916.

a) b)


precipitatii

105

B8) Model 47x40


pentru alimentarea din precipitatii). Valoarea minima a functiei obiectiv a fost (aceeasi ca

mai sus): E = 73, MAE = 0.727 , RMSE = 0.916

a) b)

c)

Fig.5.24. Model 47x40: a) Conductivitatea hidraulica; b) Alimentarea din precipitatii

c) Cotele piezometrice calculate

106

Tabel 5.2: Modele monostrat

Numar

parametri Puncte pilot

pentru K Puncte pilot

pentru R minE RMSE

1 2 omogen omogen 331 1.95 2 16 8 8 157 1.345 3 20 10 10 139 1.265 4 22 15 7 131 1.23 5 30 15 15 111 1.127 6 35 20 15 123 1.188 7 40 20 20 122 1.184 8 45 25 20 109 1.117 9 50 25 25 106 1.102 10 60 30 30 96 1.049 11 75 40 35 73 0.915 12 82 47 35 77 0.941 13 87 47 40 73 0.915

y = 452.5 x-0.4

0

50

100

150

200

250

300

350

400

0 20 40 60 80 100

Numar de parametri

E m

in

Fig.5.25. Variatia minimului functiei eroare, minE , cu numarul de parametri,

pentru reprezentarea monostrat

107

5.4. Concluzii

In studiul de caz prezentat in acest capitol s-a aplicat metoda diferentelor finite

pentru modelarea curgerii apei subterane in conul aluvionar al raului Somes. S-a

considerat curgerea in regim stationar, luand ca date de intrare valori medii ale debitelor

si cotelor piezometrice inregistrate pe o perioada de 10 ani. Parametrii hidrogeologici

(conductivitatea hidraulica, alimentarea acviferului) au fost ajustati printr-un proces de

calibrare automata prin metoda Levenberg-Marquardt (metoda utilizata de programul

PEST).

S-au utilizat doua variante de parametrizare:

• zonarea

• interpolarea (metoda punctelor pilot)

Zonele au fost stabilite pe baza datelor existente privind parametrii hidrogeologici

(teste de pompare, etc). Anterior, s-a realizat o calibrare manuala, cea mai mica valoare

obtinuta pentru functia eroare (suma patratelor reziduurilor) fiind E=257. In modelul

rezultat prin calibrare automata (model cu 15 parametri) eroarea a scazut la E=173.

Crescand numarul zonelor (la 31 parametri), eroarea minima a scazut la E=140, dar

modelul rezultat nu este plauzibil, intrucat exista mari contraste (inexistente in realitate)

intre zone adiacente. Pentru a atenua aceste contraste, s-a efectuat o noua calibrare

automata, stabilind, de aceasta data, limite mai stricte pentru conductivitati. Minimul

gasit de PEST a fost E=150.

Metoda punctelor pilot este mai naturala decat zonarea (deoarece parametrii

hidrogeologici nu au salturi bruste de la o celula la alta), mai putin subiectiva (nu necesita

stabilirea zonelor de catre utilizator) si mai usor de implementat. Faptul ca trebuie

calculate, la fiecare iteratie, valorile parametrilor hidrogeologici (pentru celulele care nu

sunt "puncte pilot") nu mareste in mod semnificativ timpul de calcul.

Metoda punctelor pilot a fost aplicata in doua variante:

108

A) Considerand acviferul tri-strat. Numarul de puncte pilot a fost crescut treptat,

plecand de la un model cu 17 parametri (5 puncte pilot pentru 1hK , 5 pentru 3hK , 5 pentru

alimentarea din precipitatii, si, in plus, 1vK si 3vK ), pana la unul cu 87 de parametri.

Minimul functiei eroare (obtinut de PEST) a scazut de la 194 la 111, in timp ce numarul

mediu de apelari per iteratie ale modelului direct (si, implicit, timpul de calcul) a crescut

de la 28 la 172.

B) Considerand acviferul monostrat (varianta in care timpul de calcul, dar si

eroarea rezultata, sunt mai mici). Si aici au fost construite mai multe modele, crescand

treptat numarul de puncte pilot, plecand de la un model cu 16 parametri (8 puncte pilot

pentru hK si 8 pentru R), pana la un model cu 87 de parametri. Minimul functiei eroare a

scazut, in acest caz, de la 157 la 73, iar numarul de apelari ale modelului direct a crescut

de la 30 la 197.

Crescand numarul de parametri (numarul de puncte pilot), descreste minimul

functiei eroare gasit de PEST. Totusi, de la un punct incolo cresterea numarului de

parametri nu mai imbunatateste semnificativ valoarea minima a erorii.

In figura 5.26 este reprezentata grafic variatia minimului functiei eroare, minE , cu

numarul de parametri in cele doua variante. Se observa ca reprezentarea monostrat

furnizeaza rezultate mai bune, conducand la ideea ca exista o foarte buna comunicare

intre strate si ca aceasta schematizare nu afecteaza validitatea modelului.

109

0

50

100

150

200

250

300

350

400

0 20 40 60 80 100

Numar de parametri

E m

in Modele tri-strat

Modele monostrat

Fig.5.26. Variatia minimului functiei eroare, minE , cu numarul de parametri.

Comparatie intre reprezentarea tristrat si cea monostrat

110

6. Concluzii. Contributii personale. Directii de cercetare

Se stie ca procesul de curgere al apei subterane poate fi descris printr-o ecuatie cu

derivate partiale in care necunoscuta (variabila de stare) este sarcina hidraulica, iar

coeficientii sunt parametrii hidrogeologici ai acviferului, distribuiti spatial. Dar, pentru a

construi un model matematic care sa simuleze procesul de curgere, trebuie mai intai

stabilite urmatoarele elemente:

- regimul de curgere (stationar sau tranzitoriu)

- schematizarea acviferului (2D, multistrat, 3D) si alegerea corespunzatoare a

tipului de ecuatie care modeleaza curgerea

- tipul acviferului (cu nivel liber sau sub presiune)

- conditiile de margine

- metoda numerica folosita (diferente finite sau element finit)

Dupa stabilirea acestor elemente, urmatorul pas il constituie identificarea

parametrilor hidrogeologici ai acviferului (conductivitatea hidraulica, alimentarea din

precipitatii, etc), mai precis, determinarea acelor parametri pentru care diferentele dintre

sarcinile hidraulice calculate si cele observate sunt minime. Identificarea parametrilor

(sau rezolvarea problemei inverse) presupune doua etape:

1. Alegerea metodei de parametrizare (zonare / interpolare) si stabilirea

zonelor (respectiv, a punctelor pilot)

2. Alegerea metodei de rezolvare a problemei de optimizare si aplicarea

acesteia pentru minimizarea functiei eroare.

Aceste doua etape au constituit obiectul tezei, atat sub aspect teoretic, cat si

practic. Astfel, daca in prima parte a tezei (primele trei capitole) se defineste matematic

problema inversa in hidrogeologie si sunt descrise principalele metode folosite pentru

rezolvarea acesteia, in a doua parte sunt prezentate rezultatele aplicarii lor in calibrarea

unui acvifer sintetic (capitolul 4), respectiv, real (capitolul 5).

111

Problema de optimizare propusa de metoda celor mai mici patrate poate fi

rezolvata folosind fie metode clasice, traditionale, de programare neliniara, fie tehnici de

cautare globala care sunt mai robuste (avand capacitatea de a evita oprirea la un optim

local) si nu necesita calculul derivatelor functiei obiectiv. Aceste tehnici de optimizare

neconventionale (din care fac parte algoritmii genetici si metoda calirii simulate) incep

sa castige teren si in domeniul calibrarii parametrilor hidrogeologici.

In capitolul 4 am realizat o comparatie intre un algoritm genetic real, un algoritm

genetic binar si metoda calirii simulate. Aplicarea acestor metode pentru calibrarea unui

acvifer sintetic s-a realizat prin programe de calcul personale. Concluzia desprinsa in

urma rezultatelor este ca algoritmul genetic real converge mai rapid decat algoritmul

genetic binar, fiind si mai natural, mai usor de implementat decat acesta. Solutiile gasite

de algoritmul genetic real (care exploreaza spatiul utilizand mai multe puncte simultan)

aproximeaza mai exact valorile reale decat cele obtinute prin metoda calirii simulate

(pentru acelasi numar de evaluari ale functiei obiectiv).

In prezent, cea mai utilizata metoda de parametrizare este zonarea. Dar aplicarea

acestei metode presupune un grad ridicat de subiectivitate rezultata din stabilirea

numarului si formei zonelor. Un alt neajuns al zonarii este aparitia unor contraste mari,

neverosimile, intre celule / elemente alaturate (situate in zone diferite). Aceste neajunsuri

sunt depasite daca se utilizeaza o metoda de interpolare. De aceea, pentru calibrarea

acviferului real – conul aluvionar al raului Somes – am utilizat ambele metode: atat

zonarea, cat si metoda punctelor pilot, realizand o comparatie intre rezultatele obtinute.

Metoda punctelor pilot este mai naturala si mai putin subiectiva decat zonarea, dar

si mai usor de implementat: astfel, am putut realiza mai multe variante ale modelului,

crescand treptat numarul punctelor pilot si observand descresterea erorii (mult sub

valoarea obtinuta utilizand zonarea).

Datele hidrogeologice existente au condus la o reprezentare tri-strat a acviferului,

realizata in cadrul proiectului SQUASH (Somes/Szamos Quantitative/Qualitative Study

of the Hydrogeology). Conul aluvionar al raului Somes se considera format din trei

112

unitati hidrogeologice: un acvifer de suprafata, un strat semipermeabil argilos si un

acvifer de adancime, sub presiune.

Cu toate acestea, am considerat utila si realizarea unui model simplu, mono-strat,

parametrizat tot prin metoda punctelor pilot, crescand treptat dimensiunea parametrizarii

(numarul punctelor pilot). Un rezultat interesant a fost faptul ca eroarea este mai mica in

cazul modelului monostrat decat pentru cel tri-strat, ceea ce inseamna ca exista o buna

comunicare intre acviferul de suprafata si cel de adancime prin stratul semi-permeabil, iar

o reprezentare simpificata mono-strat nu afecteaza validitatea modelului.

Contributii personale

Contributiile personale pot fi rezumate in cele ce urmeaza:

- Sinteza documentara cu privire la problema inversa in hidrogeologie si

metodele de optimizare (clasice si neconventionale) utilizate pentru rezolvarea

acesteia.

- Aplicarea a doua metode de optimizare neconventionale - algoritmii genetici

(in codificare reala si binara) si metodei calirii simulate - pentru calibrarea

unui acvifer sintetic. Pentru aceasta s-au realizat programe proprii de calcul.

- Calibrarea unui acvifer real utilizand doua metode de parametrizare: zonarea

si metoda punctelor pilot.

- Metoda punctelor pilot a fost aplicata crescand, treptat, dimensiunea

parametrizarii si observand descresterea functiei eroare.

- Realizarea unei comparatii intre modelul tristrat (format dintr-un acvifer de

adancime, unul freatic si un strat semipermeabil) si modelul monostrat,

demonstrand comunicarea buna intre acviferul freatic si cel de adancime.

113

Directii de cercetare

O parte din directiile in care se pot dezvolta cercetari ulterioare sunt:

- Identificarea parametrilor hidrogeologici ai acviferului considerand regimul

de curgere nepermanent

- Utilizarea metodei calirii simulate si algoritmilor genetici, dar si a altor tehnici

de optimizare neconventionale (cum ar fi: retelele neurale artificiale,

algoritmul roiului de particule, algoritmul musuroiului de furnici, etc) pentru

calibrarea acviferului real

- Realizarea unei comparatii intre rezultatele obtinute aplicand metode clasice

de optimizare si cele obtinute prin tehnici neconventionale.

114

Bibliografie

Aly, A., Peralta, R. C. (1999). "Comparison of a genetic algorithm and mathematical

programming to the design of groundwater cleanup systems." Water Resources Research,

35(8), 2415-2425.

Anderson, M.P., Woessner, W.W. (1992) Applied groundwater modeling: Simulation of

flow and advective transport. Academic Press, San Diego, California.

Brouyère, S. (2002) Modelling in Hydrogeology. SQASH Project, Training Course,

Liège, May – August 2002.

Carrera J, Alcolea A, Medina A, Hidalgo J, Slooten LJ (2005) Inverse problem in

hydrogeology. Hydrogeol. J., 13(2): 206 – 222.

Carrera, J., Neuman, S. P. (1986), Estimation of aquifer parameters under transient and

steady state conditions: 1. Maximum likelihood method incorporating prior information.

Water Resources Research, 22(2), 199– 210.

Cieniawski, S.E., Eheart, J.W., Ranjithan, S. (1995) Using genetic algorithms to solve a

multiobjective groundwater monitoring problem. Water Resour. Res., 31(2): 399 - 409.

Cooley, R.L. and Naff, R.L. (1990) Regression modeling of ground-water flow.

U.S.Geological Survey Techniques in Water-Resources Investigations, book 3.

Danchiv, A., Stematiu, D. (1997) Metode numerice in hidrogeologie. Editura didactica si

pedagogica, Bucuresti.

Dassargues, A. (1995) Modèles mathématiques en hydrogeologie. Editura didactica si

pedagogica, Bucuresti.

115

Dassargues, A., Brouyère, S., Lenart, L., Szucs, P., Virag, M, Miko, L., Szabo, A.,

Madarasz, T., Drobot, R., Bretotean, M., Minciuna, M., Filip, A., Popescu, I.C. (2001)

SQASH Project. Intermediate Report.

de Marsily GH, Lavedan G, Boucher M, Fasanino G (1984) Interpretation of interference

tests in a well field using geostatistical techniques to fit the permeability distribution in a

reservoir model. Verly et al (ed) Proc Geostatistics for natural resources

characterization. Part 2. D. Reidel Pub. Co. : 831–849.

Deb, K. (1998) Genetic Algorithm in Search and Optimization: The Technique and

Application. Proceedings of International Workshop on Soft Computing and Intelligent

Systems, Calcutta, India: Machine Intelligence Unit, Indian Statistical Institute, 58-87

Doherty, J., L. Brebber & P. Whyte. (2002) PEST – Model-independent parameter

estimation. User's manual. Watermark Numerical Computing, Australia.

Dougherty, D.E., R.A. Marryott, Optimal groundwater management 1. Simulated

Annealing, Water Resour. Res., 27(10), 2493-2508, 1991

Dragota, I. (1998) Metode de calcul numeric. Editura didactica si pedagogica, Bucuresti.

Drobot, R. (1983) Model matematic de programare liniara pentru evaluarea

transmisivitatilor unui mediu permeabil omogen. Hidrotehnica, vol. 28, nr.12: 353-384.

Drobot, R. (1990) Hidrologie. Teoria sistemelor si modelare matematica. Institutul de

Constructii, Bucuresti.

Drobot, R., Toma, C. (1991) Modèle mathématique pour calibrer les paramètres

hydrogéologique dans le cas du mouvement permanent plan-horizontal. XXIe Journées de

l’Hydraulique Sophia Antipolis.

116

Drobot, R., Sarbu, N. (2003) Improvement of the ALSUBTR model for evaluating

natural recharge. Conferinta anuala INHGA, Bucuresti.

Drobot, R., Jianu, M., Sarbu, N., Minciuna, M., Filip, A., Bretotean, M., Brouyère, S.,

Dassargues, A., Popescu, I.C., Szucs, P., Karsai, M., Toth, A., Faur, K., Virag, M. (2004)

Regional Model of the Somes – Szamos Aquifer. Hidrotehnica, vol. 49, no. 9 - 10, 2004.

Dumitrescu, D. (2000) Algoritmi genetici si strategii evolutive - aplicatii in Inteligenta

Artificiala si in domenii conexe, Editura Albastra, Cluj Napoca.

Efstratiadis, A. (2001) Investigation of global optimum seeking methods in water

resources problems. M. Sc. Thesis, Technical University of Athens.

Franke, R. & G. Nielson (1980) Smooth interpolation of large sets of scattered data,

International Journal for Numerical Methods in Engineering, Vol. 15, pp. 1691-1704.

Goldberg, D. E. (1989) Genetic Algorithms in Search, Optimization, and Machine

Learning. Addison-Wesley: New York, NY.

Goldberg, D. E., K. Deb (1991) A comparative analysis of selection schemes used in

genetic algorithms. Foundations of Genetic Algorithms, pp. 69-93, Morgan Kaufman,

San Mateo, CA.

Groza, G. (2005) Analiza numerica. Editura Matrix Rom, Bucuresti.

Guan, J., Aral, M.M. (1999) Optimal remediation with well locations and pumping rates

selected as continuous decision variables. Journal of Hydrology 221: 20 – 42.

Hernandez A.F., Neuman S.P., Guadagnini A, Carrera J. (2003) Conditioning mean

steady state flow on hydraulic head and conductivity through geostatistical inversion.

Stochastic Environmental Research and Risk Assessement, 17 (5):329-338.

117

Hill, M.C. (1990) Preconditioned Conjugate Gradient 2 (PCG2), a computer program for

solving groundwater flow equations, U.S. Geological Survey. Water-resources

investigations report 98-4048, Denver, Colorado

Holland, J. H. (1975) Adaptation in Natural and Artificial Systems. Univ. of Mich. Press,

Ann Arbor.

Houck, C.R., Joines, J.A., Kay, M.G. (1995) A genetic algorithm for function

optimization: a MATLAB implementation. NCSU-IE Technical Report 95-09, North

Carolina State University, Raleigh, NC.

Huang, C., Mayer, A.S. (1997) Pump-and-treat optimization using well locations and

pumping rates as decision variables. Water Resources Research, 33(5): 1001 – 1012

Jianu, M., Drobot, R. (2007) Application of Simulated Annealing for Solving a

Groundwater Flow Inverse Problem. International Conference "Trends and Challenges in

Applied Mathematics” - ICTCAM 2007

Jianu, M. (2008) The Pilot Point Method for Solving a Groundwater Flow Inverse

Problem (I). Mathematical Modelling in Civil Engineering, Bucuresti, No. 1.

Jianu, M., Drobot, R. (2008) The Pilot Point Method for Solving a Groundwater Flow

Inverse Problem (II). Case Study: The Alluvial Fan of Somes River. Mathematical

Modelling in Civil Engineering, Bucuresti, No. 2.

Kirkpatrick S., Gelatt C. D., Vecchi M. P. (1983) Optimization by simulated annealing.

Science 220: 671–680.

Kitanidis, P.K. , Vomvoris, E.G. (1983) A geostatistical approach to the inverse problem

in groundwater modelling (steady state) and one dimensional simulations. Water

Resources Research, 19(3): 677-690.

118

Lavenue A.M., Pickens J.F. (1992). Application of a coupled adjoint sensitivity and

kriging approach to calibrate a groundwater flow model. Water Resources Research,

28(6): 1543-1569.

Levenberg (1944). "A Method for the Solution of Certain Non-Linear Problems in Least

Squares". The Quarterly of Applied Mathematics 2: 164–168

Marquardt, D.W. (1963) An algorithm for least-squares estimation of non-linear

parameters. SIAM Journal on Applied Mathematics, vol. 11 (2): 431 - 441

Marryot, R.A., Dougherty,D.E., Stollar, R.L. (1993) Optimal groundwater management

2. Application of Simulated Annealing to a field-scale contamination site. Water

Resources Research, 29 (4): 847 – 860.

Matheron, G., (1971) The theory of regionalised variables and its applications, Cahiers

du Centre de Morphologie Mathematique, No. 5, Fontainebleau, France.

Mayer, A. S., C. Huang (1999) Development and application of a coupled process

parameter inversion model based on the maximum likelihood estimation method. Adv.

Water Resour., 22(8), 841– 853.

McDonald, M.G., Harbaugh A.W. (1988). MODFLOW, a modular, three-dimensional

finite-difference groundwater flow model. Techniques of the Water-Resources

Investigations of the U.S. Geological Survey, Book 6.

McLaughlin, D., L. R. Townley (1996), A reassessment of the groundwater inverse

problem. Water Resources Research., 32(5), 1131– 1161.

Michalewicz, Z. (1994) Genetic Algorithms + Data Structures = Evolution Programs,

Springer-Verlag, New York.

119

Neuman, S. P. (1973). Calibration of distributed parameter groundwater flow models

viewed as a multiple-objective decision process under uncertainty. Water Resources

Research, 9 (4): 1006-1021.

Nicolau, A. (1982) Analiza numerica. Institutul de Constructii, Bucuresti.

Paltineanu, G., Matei, P., Trandafir, R. (2001) Bazele analizei numerice, Editura

Printech, Bucuresti.

Popa, R., Popa, B. (2003) Optimizarea exploatarii amenajarilor hidroenergetice. Editura

Tehnica, Bucuresti.

Prasad, K.L., Rasogi, A.K. (2001) Estimating net aquifer recharge and zonal hydraulic

conductivity values for Mahi Right Bank Canal project area, India by genetic algorithm.

Journal of Hydrology, 243: 149 – 161.

RamaRao, B.S., LaVenue, A.M., de Marsily Gh, Marietta, M.G. (1995) Pilot point

methodology for automated calibration of an ensemble of conditionally simulated

transmissivity fields. 1. Theory and computational experiments . Water Resources

Research, 31(3): 475 – 494.

Reed, P., Minsker, B., Goldberg, D.E. (2000) Designining a competent simple algorithm

for search and optimization. Water Resources Research 36 (12): 3757 – 3761.

Rogers, L.L., Dowla, F.U. (1994) Optimization of groundwater remediation using

artificial neural networks with parallel solute transport modeling. Water Resources

Research, 30 (2): 457 – 481.

120

Rogers, L. L., F. U. Dowla, V. M. Johnson. (1995). Optimal Field-Scale Groundwater

Remediation Using Neural Networks and the Genetic Algorithm, Environ. Sci. Technol.

29, 1145-1155.

Sun, N.-Z., A. Y. Sun (2002) Parameter identification of environmental systems.

Environmental Fluid Mechanics: Theories and Applications, cap. 9, 297– 337, ASCE

Takeshita, Y., Kohno, I., Yasui, K. (2000) Determination of the hydraulic properties of a

multilayered aquifer from pumping test data using genetic algorithms. Calibration and

Reliability in Groundwater Modelling (Proceedings of the ModelCARE’99 Conference)

IAHS Publ. No. 265, 229 – 235.

Thierens, D., Goldberg, D. E., Pereira, A. G. (1998) Domino Convergence, Drift, and the

Temporal-Salience Structure of Problems. The 1998 IEEE International Conference on

Evolutionary Computation Proceedings, pp. 535-540, IEEE Press: New York, NY.

Tsai, F.T.-C., N.-Z. Sun, W.W.-G. Yeh (2003) A combinatorial optimization scheme for

parameter structure identification in groundwater modeling. Ground Water, 41(2).

Wang, H., Anderson, M. (1982) Introduction to groundwater modeling: finite difference

and finite element methods. Academic Press, San Diego, California.

Yan, S. , Minsker, B. S. (2004). A Dynamic Meta-Model Approach to Genetic Algorithm

Solution of a Risk-Based Groundwater Remediation Design Model. ASCE. EWRI. 2004,

Salt Lake City, UT.

Yeh, W. W.-G. (1986), Review of parameter identification procedures in groundwater

hydrology: The inverse problem. Water Resources Research, 22(2), 95– 108.

Yeh, W. W.-G., Y. S. Yoon, L. S. Lee (1983) Aquifer parameter identification with

kriging and optimum parameterization. Water Resources Research, 19(1): 225- 233.

MODELE DE OPTIMIZARE PENTRU IDENTIFICAREA …digilib.utcb.ro/repository/ccn/pdf/jianu.pdf ·...

Documents

Transcript of MODELE DE OPTIMIZARE PENTRU IDENTIFICAREA …digilib.utcb.ro/repository/ccn/pdf/jianu.pdf ·...