Dipartimento di Biologia Università di Roma “Tor Vergata” · PDF filecaso...

1

Modellistica ambientale:applicazioni e prospettive

Prof. Michele Scardi

Dipartimento di BiologiaUniversità di Roma “Tor Vergata”

http://www.mare-net.com/mscardi [email protected]

sistema reale

modello

astrazione

interpretazione

2

Tipologie di modelli

• Modelli fisici(es. mesocosmi)

• Modelli concettuali (es. modello di Tilman)

• Modelli analitici (es. modello di Lotka-Volterra)

• Modelli empirici (es. modello di Von Bertalanffy)

Modelli fisici

3

Funzioneforzante

Produttoreprimario

Consumatore

Immagazzinamentopassivo

Fattorelimitante

Elemento dicontrollo

Dissipazione Flusso

Modelli concettuali

N

P + - TL Z

self-shading

4

Modelli analitici

5

scambiPNTIfOMTkZTPgdtdN

scambiOMcOMTkZTPgcPcdt

dOM

scambiZcZTPgcZThZTOMPgdtdZ

scambiPcZTPgPNTIfdtdP

snamp

mzna

mp

±−+=

±−−+=

±−−−=

±−−=

)),,()(),((6.12

)(),(

),()(),,(

),(),,(

[ ] )()()(),,( 321max TgOMgPggTOMPg ⋅+⋅= g T TT

eopt

TTopt

3

1

( ) =−

densità iniziale fitoplancton (Chl mg m-3) 10densità iniziale zooplancton (DW mg m-3) 0.2concentrazione iniziale SOM (mg C m-3) 20conc. iniziale azoto inorg. (mM N dm-3) 1numero di giorni simulati dall'1 gennaio 1460torbidità relativa (componente inorganica) 2temperatura massima acqua (°C) 26temperatura minima acqua (°C) 10tasso di crescita massimo del fitoplancton 0.59pendenza della curva di crescita come f(T) 0.075costante di semisaturazione per l'azoto 1.1tasso di mortalità naturale fitoplancton 0.15cost. conversione mg C dm-3 -> mM NXy dm-3 0.0126tasso di crescita max zooplancton erbivoro 1.2costante di semisaturazione per il grazing 25coeff. preferenza grazing su fitoplancton 0.66coeff. preferenza grazing su part. org. 0.33 tasso di respirazione a 0 °C 0.06 pendenza curva respirazione [f(T)] 0.085razione di fitoplancton non assimilata 0.33 tasso di mortalità dello zooplancton 0.21 tasso di decomposizione della SOM a 0 °C 0.05 pendenza funzione decomposizione [f(T)] 0.06 tasso di sedimentazione della SOM 0.33

Parametri del modello (assunti come costanti)

6

⎪⎪⎩

⎪⎪⎨

⎧

−=

−=

2212

2111

mNNbaNdt

dN

NaNrNdt

dN

7

ar

bam

= 0 per N2=

= 0 per N1=

0 20 40 60 800

20

40

60

80

N1

N2

N -1

N -2

N -1N +2

N +1

N +2

N +1

N -2

Sub MODELLO(f(),Y(),r1,p1,r2,m2)'predef(1) = r1 * Y(1) - p1 * Y(1) * Y(2)'predatorif(2) = r2 * p1 * Y(1) * Y(2) - m2 * Y(2)End Sub

Static Sub PREDCORR(x0, x9, k1, n%, k5, e, z%, fl%)ReDim w(1 To 9) As SingleReDim h2(n%, 22) As SingleOn Error GoTo ErrorHandler'verifica le possibili condizioni di errore alla chiamataIf x0 >= x9 Then fl = 1: Exit SubIf (n% <= 0) Or (n% <> Int(n%)) Then fl = 2: Exit SubIf (k5 <= 0) Or (k5 <> Int(k5)) Then fl = 3: Exit SubIf (k1 <= 0) Or (k1 <> Int(k1)) Then fl = 4: Exit SubIf e < 0.000000001 Then fl = 5: Exit SubIf (z - 1) * (z - 2) <> 0 Then fl = 6: Exit Sub'definizione delle costantiw(1) = 0.2071067811865w(2) = 0.2928932188135w(3) = 0.1'inizializzazioneFor i% = 1 to n%

For j% = x0 to x9…

8

http://www.mare-net/mscardi/work/ecologia/mod_preda_predatore.xls

Skip

9

⎪⎪

⎩

⎪⎪

⎨

⎧

−=

−⎟⎠⎞

⎜⎝⎛ −=

2212

211

11 1

mNNbaNdt

dN

NaNKNrN

dtdN

competizioneintraspecificafra prede

0

50

100

150

200

250

300

0 20 40 60 80 100 120t

preda

predatore

0

10

20

30

40

50

60

0 50 100 150 200 250

P

Q

⎪⎪⎪⎪⎪

⎩

⎪⎪⎪⎪⎪

⎨

⎧

−=

−=

−⎟⎠⎞

⎜⎝⎛ −=

332223

32221112

2111

11 1

mNNNabdt

dN

NNaNNabdt

dN

NNaKNrN

dtdN competizione

intraspecificafra prede

la mortalità dei predatori dipende solo da predatori di livello superiore

al vertice della rete trofica, la mortalità è solo per senescenza (in questo caso si assume il tasso di mortlaità come una costante)

10

0

50

100

150

200

250

300

0 5 10 15 20 25

t

P, Q

, R

preda

predatore 1

predatore 2

0

5

10

15

20

25

30

0 50 100 150

P

Q

0

1

2

3

4

5

6

7

0 50 100 150

P

R

0

1

2

3

4

5

6

7

0 10 20 30

Q

R

( )

⎪⎪⎪⎪⎪

⎩

⎪⎪⎪⎪⎪

⎨

⎧

−=

−=

+−⎟⎠⎞

⎜⎝⎛ −=

3231223

2121112

132211

11 1

NmNNabdt

dN

NmNNabdt

dN

NNaNaKNrN

dtdN

11

2 m

2 m

5 m

5 m

2 m

5 m

10 m

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40°

55' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Pedred

duri

Olbia

Rio

S. Ni co la

Rio Seligheddu

Rio Sozz o

D

e al t d el F. P da rogianoI. di Mezzo

I. Bianca

Cala Cocciani

P.ta Ginepro

Cala Saccaia

I. della Bocca

P.ta delle Saline

Stagno di Gravile

I. Gabbia

Porto Romano

I. Manna

I. Lepre

I. del Cavallo

Depuratore nucleo industriale

Depuratore comunale Rete di ripartizione dei reflui depurati

Area con presenza di scarichi liberi

Simulazione di scenari di gestione ambientalenel Golfo di Olbia

dPdt

f T I N P g P T Z c P

dZdt

c g P OM T Z h T Z c Z

dOMdt

c P c g P OM T Z k T OM c OM

dNdt

c h T Z k T OM f T I N P j z T

mp

na mz

mp na s

CN

= − − ±

= − ⋅ − − ±

= + − − ±

= ⋅ + − + ±

( , , ) ( , )

( ) ( , , ) ( )

( , , ) ( )

( ( ) ( ) ( , , ) ) ( , )

scambio

scambio

scambio + reflui + escrezione

scambio + reflui + escrezione

1

f T I N T f I f N( , , ) ( ) ( ) ( )= ⋅ ⋅µ 1 2

µ µ( )

( )

( )

max maxT

ee

f II

Ie

f NN

k N

k T

k T

opt

II

N

l

l

opt

=

=

=+

⋅

⋅

−

1

1

2

Iz

I e dz

I I I I

czz

opt t t t

=

= ⋅ + ⋅ + ⋅

−

− − −

∫1

0 7 0 2 01

00

1 2 3. . .

c Pchl= + ⋅035 0 05. .

12

C1

C2 B2

AE

B1

Tavola I. Compartimentazione spaziale del modello di produzione planctonica.

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40°

55' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Ped

redduri

Olbia

Rio

S. N ic o l a

R io S e l igheddu

Rio S o z z o

C1

C2 B2

AE

B1

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40° 5

5' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Pedred

duri

Olbia

Rio

S. N ic o l a

R io S e l igheddu

R io S o z z o

0

20

mg m-3

chl a

13

2 m

2 m

5 m

5 m

2 m

5 m

10 m

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40° 5

5' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Pedre

dduri

Olbia

Rio

S. Ni co la

R io S eligheddu

Rio Sozz o

D


I. Bianca

Cala Cocciani

P.ta Ginepro

Cala Saccaia

I. della Bocca

P.ta delle Saline

Stagno di Gravile

I. Gabbia

Porto Romano

I. Manna

I. Lepre

I. del Cavallo

Tavola III. Criteri utilizzati per la simulazione della gestione in tempo reale dell'immissione di reflui.

Dal 151.mo giorno dell'anno finoal 269.mo (giungo-settembre),se la biomassa fitoplanctonicasupera i 90 mg C m (circa 2 mgChl m ) nei comparti più interni delGolfo, allora i reflui depurati vengonoimmessi all'esterno del Golfo stesso.

2 m

2 m

5 m

5 m

2 m

5 m

10 m

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40° 5

5' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Pedre

dduri

Olbia

Rio

S. Ni co la

R io S el igheddu

Rio Sozz o

D


I. Bianca

Cala Cocciani

P.ta Ginepro

Cala Saccaia

I. della Bocca

P.ta delle Saline

Stagno di Gravile

I. Gabbia

Porto Romano

I. Manna

I. Lepre

I. del Cavallo

Tavola VII. Ipotesi di massima della collocazione di un insieme di tre centraline di monitoraggio.

L'effettiva posizione delle centralinesarà vincolata dalla possibilità didisporre di un accesso agevole perla manutenzione e dalle condizioniidrodinamiche ed ambientali locali.

NOTA

14

2 m

2 m

5 m

5 m

2 m

5 m

10 m

9° 30' E 31' 32' 33' 34'

30' 31' 32' 33' 34'

40°

55' N

55'

56'

56'

0

metri

1000Rio

C

i

occian

Rio

Pedre

dduri

Olbia

Rio

S. Ni co la

Rio Sel igheddu

Rio So zz o

D

e alt d el F. P da rogianoI. di Mezzo

I. Bianca

Cala Cocciani

P.ta Ginepro

Cala Saccaia

I. della Bocca

P.ta delle Saline

Stagno di Gravile

I. Gabbia

Porto Romano

I. Manna

I. Lepre

I. del Cavallo

Tavola VI. Ipotesi di ripartizione dei reflui depurati.Depuratore nucleo industriale

Depuratore comunale Rete di ripartizione dei reflui depurati

Area con presenza di scarichi liberi

immissione oltre il limiteinferiore delle praterie

di fanerogame

med(chl): ~6 ~4 mg m-3

med(chl): ~9 ~5 mg m-3

15

Modelli empirici

Stima della produzione primaria

• La produzione primaria dipende da:– Biomassa fitoplanctonica– Irradianza– Temperatura– Efficienza fotosintetica del fitoplancton

• La biomassa fitoplanctonica dipende da:– Produttività primaria– Disponibilità di nutrienti– Scambi advettivi

16

data I0(PAR) CHLm(0-2) k zp PT(0-60)Em-2d-1 mg m-3 m-1 m mg C m-2 d-1

02/09/84 11.831 3.04 0.113 40.8 678 03/01/84 15.110 0.25 0.087 53.0 80 03/15/84 30.966 0.93 0.100 46.1 168 03/29/84 13.783 7.33 0.112 41.2 426 04/12/84 37.119 13.52 0.127 36.3 541 04/26/84 44.005 3.93 0.127 36.3 325 05/09/84 45.180 5.27 0.128 36.0 620 05/24/84 55.343 6.26 0.109 42.3 657 06/06/84 12.762 6.83 0.123 37.5 410 06/28/84 57.094 6.25 0.126 36.6 646 07/10/84 55.333 5.20 0.119 38.7 1027 07/24/84 52.449 0.51 0.111 41.5 313 08/08/84 47.360 0.92 0.089 51.8 210 08/21/84 43.527 0.32 0.094 49.0 247 09/07/84 42.333 0.25 0.087 53.0 85 09/18/84 15.649 7.20 0.158 29.2 536

... ... ... ... ... ...

I(0)

Chl(0)

k

Zp

IPP

Relazioni fra irradianza e biomassa fitoplanctonica superficiali, coefficiente di attenuazione dell’irradianza discendente, profondità della zona eufotica e produzione primaria integrata sulla verticale.

17

PP = 72.623 chl

0

500

1000

1500

2000

2500

0 5 10 15 20 25 30

biomassa fitoplanctonica (mg chl m-3 a 0 metri)

prod

uzio

ne p

rim

aria

(mg

C m

-2 g

iorn

o-1)

P a b Bd = + ⋅

Smith et al. (1982)

PP = 0.0722 B0 I0 Zp

0

200

400

600

800

1000

1200

1400

1600

1800

2000

0 5000 10000 15000 20000 25000 30000

B0 I0 Zp

prod

uzio

ne p

rimar

ia (m

g C

m-2

gio

rno-1

)

P a b B Z I

Zk

d p

p

= + ⋅

=

0

4 61.Cole & Cloern (1984)

More info about VGPM at http://warrior.rutgers.edu

Vertically Generalized Production Model (VGPM)(Behrenfeld & Falkowski, 1997)

ΣPP 0.66125 P b_opt.I 0

I 0 4.1. Chl. Z eu. Dl.

Where:

Chl tot Chl( ) if Chl 1.0< 38.0 Chl0.425., 40.2 Chl0.507.,( )

Z eu Chl( ) if 568.2 Chl tot Chl( ) 0.746. 102< 568.2 Chl tot Chl( ) 0.746., 200 Chl tot Chl( ) 0.293.,

P b_opt SST( ) if SST 1.0< 1.13, if SST 28.5> 4.00, 1.2956 2.75 10 1. SST. 6.17 10 2. SST2. 2.05 10 2. SST3.

2.462 10 3. SST4. 1.348 10 4. SST5.+...

3.4132 10 6. SST6. 3.27 10 8. SST7.+...

,,

VGPM can be redefined as a function of 4 predictive variables:

ΣPP Chl I 0, SST, Dl, 0.66125 P b_opt SST( ).I 0

I 0 4.1. Chl. Z eu Chl( ). Dl.

E.g.: ΣPP .601 0.1, 13.83, 13.21,( ) 29.095=

PP=f(B0,Zp,fotoperiodo, PBopt)

Zp=f(B0)

PBopt=f(SST)

18

0 0.5 1.0 1.5

PP media in giugno

g C m giorno-2 -1

Modelli empirici di nuova generazione: reti neurali

19

“...a neural network is a system composed of many simple processing elements operating in parallel whose function is determined by network structure, connection strengths, and the processing performed at computing elements or nodes.”“…una rete neurale è un sistema composto da molti elementi di processo semplici che operano in parallelo, la cui funzione èdeterminata dalla struttura della rete, dall’intensità delle connessioni e dai processi attuati negli elementi di calcolo o nodi.”

(DARPA Neural Network Study, 1988,AFCEA International Press, p. 60)

COME FUNZIONANOCOME FUNZIONANOLE RETI NEURALI?LE RETI NEURALI?

SOLO UN PIZZICO DI TEORIASOLO UN PIZZICO DI TEORIA……

20

Nodi (o neuroni)di input

Variabilipredittive (input)Sono generalmente

scalate in un intervallo[0,1] o [-1,1]

ConnessionisinapticheAd ogni connessione èassociato un peso sinaptico

Nodi (o neuroni)dello strato nascosto

Nodo (o neurone)di output

Variabile dipendente(output)Se necessario l’output deveessere riscalato all’unità dimisura originale

Nodi (o neuroni) di biasHanno un ruolo analogo a

quello del termine costantedi una regressione

Funzione di attivazione

iiwxa

f(a)

x1·w1

x n·wn

x2·w2

La funzione di attivazione accetta come argomento la somma degli input del nodo e ne restituisce l’output

Una rete neurale di tipoerror back-propagation (EBP)a tre strati, con architettura 5-7-1

),,1( 1

1h

n

jjkjk nkwih

i

K== ∑+

=

)( kk hfh = 11 =+hnh

),,1( 1

1h

n

jjkjk nkwih

i

K== ∑+

=

)( kk hfh = 11 =+hnh

∑=

−=on

lll

ooy

nE

1

2)(1

),,1 ;1,,1( ohkolklkl nlnkhzz KK =+=+= ηδ

)1()()()( lllllllol oooyofoy −⋅−=′⋅−=δ

)1,,1 ;1,,1( +=+=+= ihjhkjkjk njnkiww KKηδ

kl

on

l

olkkkl

on

l

olk

hk zhhzhf ∑∑

==⋅−=⋅′=

11)1()( δδδ

L’algoritmo EBPL’algoritmo EBP (Rumelhart et al., 1986) è di gran lunga il più diffuso fra gli algoritmi ditraining per le reti neuronali e può essere schematizzato come segue:

1. le connesioni sinaptiche sono inizializzate in maniera casuale

2. un training pattern è immesso nella rete neuronale

4. l’output della rete è confrontato con i valori noti del set di validazione

3. tutti i pesi sinaptici vengono quindi modificati in funzione dello scarto rilevato tra outputs e valori noti (error-backpropagation)

5. se le condizioni di convergenzasono raggiunte, si termina il training, altrimenti si torna al punto 2

Demo

21

generalizzazionegeneralizzazione

overfittingoverfitting

PP = f (I0, Zp, CHL)PP = f (IPP = f (I00, , ZZpp, CHL), CHL)

PER EVITARE L’OVERFITTING:

• early stopping

• jittering (aggiunta di rumore agli inputs)

• weight decay

• training patterns in ordine casuale

• etc.

22

INOLTRE, PER UNA BUONA GENERALIZZAZIONE:

• gli inputs devono contenere abbastanza informazione

predittiva in rapporto agli outputs desiderati

(targets)

• la relazione da modellizzare deve essere

preferibilmente regolare (cioè piccola variazione in

input --> piccola variazione in output)

• il training set deve essere abbastanza grande e

comunque deve essere un sottoinsieme

rappresentativo del sistema reale

A PHYTOPLANKTON PRIMARY A PHYTOPLANKTON PRIMARY PRODUCTION MODEL FOR PRODUCTION MODEL FOR

CHESAPEAKE BAYCHESAPEAKE BAY

Michele Scardi1 & Lawrence W. Harding, Jr.2

1. Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy2. Horn Point Lab., University of Maryland, USA

skip

23

Chesapeake Bay

Empirical model

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0 5 10 15 20

B·kc/kt·I0

PP

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0 5 10 15 20

B·kc/kt·I0

PP

outliersDelaware Bay

Chesapeake Bay

Predicted vs.

observed values

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

observed PP

pred

icte

d PP

r2 = 0.271

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

observed PP

pred

icte

d PP

r2 = 0.745

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

observed PP

pred

icte

d PP

r2 = 0.900

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0observed PP

pred

icte

d PP

r2 = 0.954

Error distribution

0

10

20

30

40

50

-1.2

-0.9

-0.6

-0.3 0.0

0.3

0.6

0.9

1.2

error

%

0

10

20

30

40

50

-1.2

-0.9

-0.6

-0.3 0.0

0.3

0.6

0.9

1.2

error

%

0

10

20

30

40

50

-1.2

-0.9

-0.6

-0.3 0.0

0.3

0.6

0.9

1.2

error

%

0

10

20

30

40

50

-1.2

-0.9

-0.6

-0.3 0.0

0.3

0.6

0.9

1.2

error

%

d.1 c.1 b.1 a.1

d.2 c.2 b.2 a.2

d.3 c.3 b.3 a.3

24

Phytoplankton primary production in Chesapeake Bay

True color SeaWiFSimage:New York-Chesapeake Bay(NASA-GSFC)

True color SeaWiFSimage:New York-Chesapeake Bay(NASA-GSFC)

Predictive variables

•

•

• latitude• longitude• depth• water temperature• salinity• log chlorophyll• log chlorophyll (Zp)• I0 (PAR)• k• Zp

⎥⎦

⎤⎢⎣

⎡+⎟⎠⎞

⎜⎝⎛

⋅⋅1

3652cos

21

πJulianDay

⎥⎦

⎤⎢⎣

⎡+⎟⎠⎞

⎜⎝⎛

⋅⋅1

3652sin

21

πJulianDay

NN structure: 12 - 5 - 1

Output variable: primary production (mg C m-2 day-1)

training and validation sets (1982-96)

testing set (1997)

0.01

0.1

1

10

0.01 0.1 1 10

observed values (g C m-2 day-1)

neur

al n

etw

ork

outp

ut (g

C m

-2 d

ay-1

)

0%

5%

10%

15%

20%

25%

30%

-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 >1.0

output error (g C m-2 day-1)

1982-1996 data set

1997 testing set

25

1

10

100

1000

10000

1 10 100 1000 10000

Observed net PP (mg C m-2 day-1)

Pred

icte

d ne

t PP

(mg

C m

-2 d

ay-1

)

1

10

100

1000

10000

1 10 100 1000 10000

Observed net PP (mg C m-2 day-1)

Pred

icte

d ne

t PP

(mg

C m

-2 d

ay-1

)

1

10

100

1000

10000

1 10 100 1000 10000

Observed net PP (mg C m-2 day-1)Pr

edic

ted

net P

P (m

g C

m-2

day

-1)

CBPM-2(2001)

CBPM-2/NN(2002)

CBPM-NN(1998)

Test data set: 1999-2000

R2=0.431

R2=0.430

R2=0.604

conventionalmodel

6 predictive variables

neural network

12 predictive variables

August

October

JuneDecember

February, April

PP=f(I0)

26

Temp=8°C

Temp=24°C

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

0 50 100 150 200 250 300

total chlorophyll in the photic zone (mg m-2)

neur

al n

etw

ork

outp

ut (g

C m

-2 d

ay-1

)

Summer 1997

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

0 50 100 150 200 250 300

total chlorophyll in the photic zone (mg m-2)

neur

al n

etw

ork

outp

ut (g

C m

-2 d

ay-1

)

Fall 1997

27

PREVISIONE DELLA STRUTTURA PREVISIONE DELLA STRUTTURA DELLA FAUNA ITTICA MEDIANTE DELLA FAUNA ITTICA MEDIANTE

RETI NEURALI ARTIFICIALIRETI NEURALI ARTIFICIALI

Michele Scardi1, Stefano Cataudella1, Paola Di Dato1, Giuseppe Maio2, Enrico Marconato2, Stefano Salviati2,

Lorenzo Tancioni1, Paolo Turin3 e Marco Zanetti3

1. Dip. di Biologia, Univ. di Roma “Tor Vergata”, Roma2. Aquaprogram s.r.l., Vicenza3. Bioprogramm s.c.r.l., Padova

ProblemaProblema applicativoapplicativo #1:#1:

1.1. Previsione della composizione della Previsione della composizione della fauna fauna ittica sullaittica sulla base base didi predittoripredittoriambientaliambientali

2.2. ComparazioneComparazione della composizionedella composizioneattesaattesa con con quellaquella osservataosservata

3.3. FormulazioneFormulazione didi un un giudiziogiudizio didiqualitqualitàà ambientaleambientale((eses. . sensusensu Direttiva Direttiva 2000/60/CE)2000/60/CE)

28

Problema applicativoProblema applicativo #2:#2:

1.1. Analisi diAnalisi di sensibilitsensibilitàà del del modellomodelloprevisionaleprevisionale

2.2. Identificazione dei Identificazione dei fattori ambientalifattori ambientaliche determinano che determinano le le maggiori maggiori variazioni nella risposta variazioni nella risposta del del modellomodello

3.3. Definizione di possibili Definizione di possibili strategie strategie per per la la gestionegestione delldell’’ambienteambiente

Previsione della composizione di una comunità

Caso 1: numero limitato di specie

Caso 2: molte specie, ma un singolo cenoclino (in teoria, tutte le risposte sono unimodali)

Case 3: molte specie e più cenoclini (interazioni di ordine superiore fra variabili ambientali)

Case 4: elevatissimo numero di specie, cenospazio estremamente complesso con discontinuità

29

• Buoni risultati si possono ottenere sia con metodi convenzionali(es. regressione logistica), sia con le reti neurali.

• Le relazioni implicite (non note) fra specie riducono significativamente la dimensionalità reale del problema.

• Solo le reti neurali possono trarre vantaggio da ciò.

Caso 1 o 2:poche specie o singolo cenoclino

Specie presenti nel data set:32

Combinazioni possibili:232= 4294967296

Combinazioni osservate:131 su 264 casi

Le specie non sono indipendenti le une dalle altre (meno male, se no, poveri ecologi!)

Una rete neurale può “catturare” l’informazione relativa alle relazioni interspecifiche (es.

competizione), migliorando la sua capacitàpredittiva

30

da Matthews (1998)

31

Variabili predittive (inputs NN)

1 altitudine (m)2 profondità media (m)3 correnti (superficie, %)4 pozze (superficie, %)5 raschi (superficie, %)6 larghezza media (m)7 massi (superficie, %)8 sassi e ciottoli (superficie, %)9 ghiaia (superficie, %)

10 sabbia (superficie, %)11 peliti (superficie, %)12 velocità flusso (punteggio, 0-5)13 copertura vegetale (superficie, %)14 ombreggiatura (%)15 disturbo antropico (punteggio, 0-4)16 pH17 conducibilità (µS/cm)18 gradiente (%)19 bacino versante (km2)20 distanza dalla sorgente (km)

Taxa considerati

Abramis brama Leuciscus cephalus Alburnus alburnus alborella Leuciscus souffia Anguilla anguilla Micropterus salmoides Barbus meridionalis Orsinigobius punctatissimus Barbus plebejus Padogobius martensii Carassius carassius Perca fluviatilis Chondrostoma genei Phoxinus phoxinus Cobitis taenia Rutilus erythrophthalmus Cottus gobio Sabanejewia larvata Cyprinus carpio Salmo (trutta) marmoratusEsox lucius Salmo (trutta) truttaGambusia holbrooki Salvelinus fontinalisGasterosteus aculeatus Scardinius erythrophthalmus Gobio gobio Thymallus thymallus Ictalurus melas Tinca tinca Lampetra planeri Salmo (trutta) hybr. trutta/marmoratusLepomis gibbosus Oncorhynchus mykiss

32

Struttura del modello: 20-17-32

• 264 patterns (campioni)

• 20 variabili ambientali predittive

• 32 specie (dati binari, presenza/assenza)

• training della rete neurale: algoritmo di errorback-propagation con early stopping basatosull’errore del set di validazione

training, n=131

validazione, n=66

test, n=67

Taxon NN output >0.5? osservato ok?Abramide 0.032 0 0 1Alborella 0.565 1 1 1Anguilla 0.807 1 1 1Barbo 0.905 1 1 1Carassio 0.064 0 0 1Carpa 0.038 0 0 1Cavedano 0.817 1 1 1Cobite 0.584 1 1 1Gambusia 0.036 0 0 1Ghiozzo di fiume 0.798 1 1 1Gobione 0.384 0 0 1Lampreda di ruscello 0.057 0 0 1Lasca 0.739 1 1 1Luccio 0.597 1 1 1Panzarolo 0.407 0 0 1Persico reale 0.053 0 0 1Persico sole 0.054 0 0 1Persico trota 0.026 0 0 1Pesce gatto 0.011 0 0 1Sanguinerola 0.536 1 1 1Scardola 0.427 0 1 0Scazzone 0.281 0 0 1Spinarello 0.040 0 0 1Temolo 0.074 0 0 1Tinca 0.337 0 0 1Triotto 0.663 1 1 1Trota fario 0.948 1 1 1Trota iridea 0.154 0 0 1Trota marmorata 0.182 0 0 1Vairone 0.111 0 0 1

previsioni corrette: 29 su 30

0.00 0.25 0.50 0.75 1.00

AbramideAlborellaAnguilla

BarboCarassio

CarpaCavedano

CobiteGambusiaGhiozzo di

GobioneLampreda di

LascaLuccio

PanzaroloPersico realePersico solePersico trotaPesce gatto

SanguinerolaScardola

ScazzoneSpinarello

TemoloTinca

TriottoTrota fario

Trota irideaTrota marmorata

Vairone

assente presente

Un esempio di output

33

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Ictalurus melas (Rafinesque, 1820)

Perca fluviatilis (Linnaeus, 1758)

Abramis brama (Linnaeus, 1758)

Cyprinus carpio (Linnaeus, 1758)

Salvelinus fontinalis M .

Gobio gobio (Linnaeus, 1758)

Barbus meridionalis

Chondrostoma genei (Bonaparte, 1839)

Gambusia ho lbrooki (Girard, 1859)

M icropterus salmoides (Lacepede, 1802)

Sabanejewia larvata (DeFilippi, 1859)

Carassius carassius (Linnaeus, 1758)

Salmo (trutta) marmoratus (Cuvier, 1817)

Lepomis gibbosus (Linnaeus, 1758)

Barbus plebejus (Bonaparte, 1839)

Leuciscus souffia (Risso, 1826)

Thymallus thymallus (Linnaeus, 1758)

Lampetra planeri (Bloch, 1784)

Rutilus erythrophthalmus (Zerunian, 1982)

Tinca tinca (Linnaeus, 1758)

Anguilla anguilla (Linnaeus, 1758)

Gasterosteus aculeatus (Linnaeus, 1758)

Leuciscus cephalus (Linnaeus, 1758)

Padogobius martensii (Günther, 1861)

Scardinius erythrophthalmus (Linnaeus, 1758)

A lburnus alburnus alborella (De Filippi, 1844)

Esox lucius (Linnaeus, 1758)

Cobitis taenia (Linnaeus, 1758)

Salmo (trutta) trutta (Linnaeus, 1758)

Phoxinus phoxinus (Linnaeus, 1758)

Orsinigobius punctatissimus (Canestrini, 1864)

Cottus gobio (Linnaeus, 1756)

Previsioni esatte: 91.6% (media test set)

The K statistics

EaNEaOaK

−−

=Oa = observed count of matchesEa = expected count of matchesN = total number of cases

presence absence

presence 1 - 1 1 - 0absence 0 - 1 0 - 0

model output

targ

et

H0 = modeled and observed data are independent of each other

34

0.0 0.1 0.2 0.3 0.7 0.80.0

0.2

0.4

0.6

0.8

1.0

K

species frequency

p(K=0)<0.05 p(K=0)>0.05

Come migliorare le basi di dati

• Una copertura spaziale omogenea èutile, ma non sufficiente

• Il piano di campionamento deve considerare più scale spaziali

• Occorrono più osservazioni



35

Come migliorare l’apprendimento

• Escludere specie, taxa, classi, cenotipi, etc. la cui frequenza nei set di training, validazione e test sia troppo alta o troppo bassa

• Usare criteri alternativi all’MSE per misurare l’errore.

• Utilizzare regole ecologiche per vincolare l’apprendimento

Con dati binari (presenza/assenza):

Per singoli output, su tutti i patterns:numero (or percentuale) di previsioni esattecoefficiente Kappa

correlazione tetracorica

Tutti gli ouput per singolo pattern:indici di distanza/similarità

Tutti gli outputs su tutti i patterns (totale):distanza/similarità media

statistica di Mantel

Come misurare l’errore

36

Training di una EBP NN basato su misure di distanza

Training

Validazione(calcolo )

StopNo

Via!

Set di training

Set di validazione

Si1iiD D −<

D

distanza media fra campioni osservati e predetti

:D

Misurare la distanza fra patterns (campioni)

• Sia la presenza che l’assenza predette sono rilevanti, quindi è necessario un indice simmetrico.

• es. la dissimilarità di Rogers & Tanimoto:

N.B. Le discordanze pesano più delle concordanze in questo indice (particolarità utile se le assenze sono molto più frequenti delle presenze nei dati o viceversa)

dcbadaD

++++

−=22

1

37

Risultati di un training basato su una misura di distanza

Predizioni esatte Distanza MSE

totale 94.4% 93.1%

training+validazione 95.4% 93.6%

test 91.8% 91.6%

Inoltre, le specie la cui presenza non è stata mai predetta dal modello sono solo 2 e molto rare(carpa e salmerino, presenti due sole volte ciascuna nel test set). Con un training convenzionale, basato sull’MSE, sono ben 9.

-0.2 0 0.2 0.4 0.6 0.8 1

Salmo (trutta) trutta (77%)Leuciscus cephalus (28%)

Padogobius martensii (26%)Scardinius erythrophthalmus (25%)

Esox lucius (25%)Rutilus erythrophthalmus (25%)

Alburnus alburnus alborella (21%)Cottus gobio (21%)

Tinca tinca (20%)Cobitis taenia (18%)

Phoxinus phoxinus (18%)Anguilla anguilla (17%)

Orsinigobius punctatissimus (17%)Salmo (trutta) marmoratus (10%)

Sabanejewia larvata (10%)Ictalurus melas (9%)

Lepomis gibbosus (9%)Barbus plebejus (7%)

Chondrostoma genei (7%)Gasterosteus aculeatus (7%)

Carassius carassius (6%)Gobio gobio (6%)

Leuciscus souffia (5%)Thymallus thymallus (5%)

Lampetra planeri (4%)

Gambusia holbrooki (3%)Barbus meridionalis (3%)

Micropterus salmoides (3%)Perca fluviatilis (1%)Abramis brama (1%)

Cyprinus carpio (1%)Salvelinus fontinalis (1%)

K

Rogers & Tanimoto dissimilarityMean Square Error

Error criterion {

MSE

Dissimilarità(Rogers & Tanimoto)

38

UNO STRUMENTO PIUUNO STRUMENTO PIU’’COMPLESSOCOMPLESSO

1. France, Univ. Paul Sabatier, CESAC lab S. Lek (ccord.)2. Denmark, Univ. Copehargen, DFH, Env. Chemistry lab S.E. Jorgensen3. Italy, Univ. Rome Tor Vergata, Dept. Biology M. Scardi4. Belgium, Univ. Namur, Freshwater Ecology lab (LFE) FUNDP J.P. Descy5. France, CEMAGREF, Bordeaux F. Delmas / M. Coste6. Luxemburg, Cell. Recherche Environ. Biotechnol. L. Ector7. Netherlands, ALTERRA Institute, Freshwater Ecol. team P.F.M. Verdonschot8. Austria, Austrian Research Center, Seibersdorf H.M. Knoflacher

PAEQANN

Predicting Aquatic Ecosystem Quality using Artificial Neural Networks: Impact of Environmental characteristics on the Structure

of Aquatic Communities (Algae, Benthic and Fish Fauna)

Proposal number: EVK1-1999-00125Contract n°: EVK1-CT1999-00026

EU 5th Framework Programmeskip

39

http://aquaeco.ups-tlse.fr

41

APRIAMO IL APRIAMO IL BLACK BOXBLACK BOX: COME : COME ESTRARRE INFORMAZIONE DAI ESTRARRE INFORMAZIONE DAI

NOSTRI MODELLINOSTRI MODELLI

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

varia

zion

eMSE

(%)

AltitudineAltitudine

variazioneinput (normalizzato)

Analisi di sensibilità

42

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

varia

zion

eM

SE (%

)

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 -5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5mean change in NN input

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

variazione media input NN

-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5

0

5

10

15

20

25

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5

Varia

zion

eM

SE (%

)ch

ange

in M

SE (%

)va

riazi

one

MSE

(%)

variazione media input NN variazione media input NNvariazione media input NN

AltitudineAltitudine CorrentiProfonditàmedia

Pozze

RaschiRaschi MassiLarghezza media

Sassi e ciottoli

GhiaiaGhiaia PelitiSabbia Velocità flusso

Copertura vegetaleCopertura vegetale Disturbo antropicoOmbreggiatura pH

ConducibilitConducibilitàà Bacino versanteGradiente Distanza sorgente

varia

zion

eM

SE (%

)

•Una procedura di analisi di sensibilità di questo tipo è uno standard applicato comunemente ad un ampio spettro di problemi.

•Questa procedura, in particolare, implica che il dato di presenza (1) o di assenza (0) siano numeri comparabili e trattabili in maniera quantitativa.

•Tuttavia, il significato della presenza o dell’assenza di una specie varia in funzione del contesto ecologico.

•Quindi, è necessario utilizzare altri criteri per valutare modelli che prevedano la presenza di specie.

Questi risultati sono ecologicamente significativi?

43

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

varia

zion

e re

lativ

ade

lla s

tatis

tica

di M

ante

l

0%

10%

20%

30%

40%

50%

60%

70%

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5

varia

zion

e re

lativ

ade

lla s

tatis

tica

di M

ante

lva

riazi

one

rela

tiva

della

sta

tistic

a di

Man

tel

varia

zion

e re

lativ

ade

lla s

tatis

tica

di M

ante

lva

riazi

one

rela

tiva

della

sta

tistic

a di

Man

tel

AltitudineAltitudine CorrentiProfonditàmedia

Pozze

RaschiRaschi MassiLarghezza media

Sassi e ciottoli

GhiaiaGhiaia PelitiSabbia Velocità flusso

Copertura vegetaleCopertura vegetale Disturbo antropicoOmbreggiatura pH

ConducibilitConducibilitàà Bacino versanteGradiente Distanza sorgente

-0.50 -0.25 0.00 0.25 0.50Variazione dell’input della rete neurale

0

5

10

15

20

Varia

zion

e de

lla Z

di M

ante

l (%

)

Ampiezza del profilo = sensibilità della variabile alle perturbazioni

Area sotto il profilo = sensibilità complessiva del modello rispetto alla

variabile in input

Altezza del profilio =

sensibilità del modello ai

cambiamenti

44

Variazione nell’input della rete neurale-0.50 -0.25 0.00 0.25 0.50

0

5

10

15

20

25

Varia

zion

e M

SE

(%)

Distanza dalla sorgente

0

10

20

30

40

50Variazione Z di M

antel(%)

sensibilità relativa

altitudine (m)

superficie bacino versante (km2)

massi (superficie, %)

larghezza media (m)

gradiente (%)

ombreggiatura (%)

sabbia (superficie, %)

pH

distrubo antropico (punteggio, 0-4)

raschi (superficie, %)

velocità del flusso (punteggio, 0-5)

correnti (superficie, %)

peliti (superficie, %)

sassi e ciottoli (superficie, %)

conducibilità (µS/cm)

distanza dalla sorgente (km)

copertura vegetale (superficie, %)

pozze (superficie, %)

ghiaia (superficie, %)

profondità media (m)

45

E LA DIRETTIVA SULLE ACQUE?E LA DIRETTIVA SULLE ACQUE?

Problema

• Una volta definita la struttura della comunità di riferimento, date le condizioni dell’ambiente fisico al contorno, come si misura lo scartoda essa della comunità osservata?

• Ovvero, come si formula un giudizio di qualità?

46

2 2jka dS

a b c d+

=+ + +

jka dS

a b c d+

=+ + +

jkaS

a b c=

+ +

Rogers & Tanimoto (1960)

Sokal & Michener (1958)

Jaccard (1900)

cfr. Moss et al. (1987) O E

Alcune misure di scarto dall’assetto atteso della comunità

O E<1 comunità degradata

≈1 comunità integra

>1 comunità arricchita

Teoria del disturbo intermedio

Connell, J. H. (1978): Diversity in Tropical Rain Forests and Coral Reefs. Science 199: 1302-1310.

47

AN EMPIRICAL MODEL AN EMPIRICAL MODEL CONSTRAINED BYCONSTRAINED BY

A BIOLOGICAL RULEA BIOLOGICAL RULE

Michele Scardi

Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy

skip

48

Phytoplankton primary productionPhytoplankton primary productionsampling sites in Westernsampling sites in WesternMediterranean SeaMediterranean Sea

-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180

-90

-60

-30

0

30

60

90

depth-integratedprimary production

surface chlorophyll

surface temperature

surface irradiance

A simple 3-4-1 neural network modelof phytoplankton primary production

49

I0

P/B

⎟⎟⎠

⎞⎜⎜⎝

⎛ −⋅⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛ −−⋅=

sBsBsB P

IP

IPBP βα expexp1

B0

PP

BIOLOGICAL RULEBIOLOGICAL RULE

There are no more than one There are no more than one relativerelative maximummaximum and four and four relative minimarelative minima in a PP=f(Iin a PP=f(I0 0 ,B,B00) ) surfacesurface

0

0.5

1

1.5

B0

0

10

2030

4050

I0

0

500

1000

1500

PP

0

500

1000

1500

PP

NN TRAINING RULENN TRAINING RULE

If more If more maximamaxima and/or and/or minimaminimaare found, then a penalty is are found, then a penalty is added to the MSE during the NN added to the MSE during the NN training for each exceeding training for each exceeding maximummaximum or or minimumminimum..

constrained NN model (no more than one constrained NN model (no more than one maximum and four minima in f(Imaximum and four minima in f(I00,B)),B))

MSE=70759MSE=70759

MSE=89480MSE=89480MSE=57932MSE=57932

overtrainedovertrained modelmodel(works as a memory)(works as a memory)

generalized NN modelgeneralized NN model(early stopping)(early stopping)

50

MODELLING EEL CATCHES IN THE MODELLING EEL CATCHES IN THE TEVERE RIVERTEVERE RIVER

Eleonora Ciccotti, Stefano Cataudella & Michele Scardi


skip

Eel catches in the Tevere river

Predictive variables

• julian day• no fishing• moon• river flow (day0)• river flow (day-1)• river flow (day-2)• cloud coverage (day0)• cloud coverage (day-1)• cloud coverage (day-2)• rainfall (day0)• rainfall (day-1)• rainfall (day-2)

NN structure

• 12 input nodes• 8 hidden nodes• 1 output node

Output variable

• eel catches (CPUE)

Data sets

• 1991, 1993 and 1995: training (n=532)• 1992 and 1994: validation (n=283)

51

0%

5%

10%

15%

20%

25%

<-4.00<-2.00

<-1.00<-0.50

<-0.25<0.00

<+0.25<+0.50

<+1.00<+2.00

<+4.00>+4.00

NN output - observed value

96% errors < ±1.00 CPUE81% errors < ± 0.50 CPUE

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8

observed values (CPUE)

NN

out

put (

CPU

E)

training set validation set

r 2 = 0.572MSE = 0.447

+ training & validation set + test set

0

1

2

3

4

5

6

7

8

Jan-91 Jan-92 Jan-93 Jan-94 Jan-95

CPU

E observedNN output

training training trainingvalidation validation

observed NN estimate % error

1991 197.4 183.0 -7%1992 174.1 157.0 -10%1993 183.5 185.8 1%1994 166.9 141.3 -15%1995 134.3 176.7 32%

CPUE year-1year

testing testing

52

MODELLING HEAVY METAL AND MODELLING HEAVY METAL AND HC CONCENTRATIONS IN MARINE HC CONCENTRATIONS IN MARINE

SEDIMENTSSEDIMENTS

Michele Scardi & Eugenio Fresi


skip

Variabili predittive

• Latitudine• Longitudine• Profondità (log)• Sabbie (%)

• Distanza dalla costa• Distanza della

batimetrica dei 200 m dal punto più vicino della linea di costa

• Frequenza ponderata delle diverse tipologie del profilo di costa (3 variabili)

• Composizione delle argille (4 variabili)

skip

53

Correzione dei dati di concentrazione

I dati per i quali il tipo di attacco era riportato in maniera esplicita sono stati corretti secondo le indicazioni prodotte dalla campagna sperimentale.

Ad esempio

Cromo

y = 1.0824xR2 = 0.9791

0

50

100

150

200

0 50 100 150 200

Attacco parziale (µg/g p.s.)

Atta

cco

tota

le (µ

g/g

p.s.

)

Distanza minima del punto dalla costa

E’ una misura indiretta (se rapportata alla profondità del punto, dunque) dell’andamento batimetrico medio.

D

54

Distanza del punto più prossimo della costa dalla batimetrica dei 200 m

Esprime l’andamento batimetrico medio dell’area indipendentemente dalla profondità del punto considerato.

D200

200

Frequenza delle tipologie del profilo di costa nell’intorno del punto

Le tre tipologie riconosciute sono funzione delle differenze fra profilo emerso e sommerso:

•concordante•poco discordante•molto discordante

Rmax= 20 mn

0.25

0.15

0.60

mn20

20)( DDDR +=

55

Influenza della tipologiadel profilo di costa

E’ stata definita una semplice relazione empirica che esprime l’influenza della tipologia del profilo di costa come funzione della distanza dalla costa.

D

mn20

20)( DDW −=

mn20

20)( DDW −= )()( DWDR ⋅

D D

x =

Influenza della tipologiadel profilo di costa

mn20

20)( DDDR +=

D

Quanto più èampio il raggio

di ricerca...

...tanto più è bassa l’influenza della tipologia

del profilo di costa.

Quindi la massima influenza si ha per

distanze intermedie.

56

Origine del sedimento superficialeSono state utilizzate come descrittricidell’origine dei sedimentile proporzioni medie in un raggio di 50 km diillite, smectite, caolinite e clorite nelle argille (dati derivati dalla letteratura).Laddove non sono disponibili dati vengono utilizzate le medie generali (0.56, 0.16, 0.15, 0.13 nell’ordine).

Trasformazione dei dati

log

Per:

• profondità

• concentrazioni degli inquinanti

57

Ni (r2=0.82)

Cd (r2=0.32)

58

Dai modelli preliminari a quelli finali

0%10%20%30%40%50%60%70%80%90%

100%

Cd Cr Cu Fe Hg IPA Mn Ni Pb PCB Zn

modelli finali modelli preliminari

varia

nza

spie

gata

Variazione di un profilo tipo in funzione della frazione di sabbie

45°20.00'N 14°30.00'E, profondità = 20 m

0

5

10

15

20

25

30

35

0 20 40 60 80 100

Sabbie (%)

Pb (p

pm)

59

SediViewData base

SediPredModelli

60

SediExpertData base + modelli + regole =

Stima della densitStima della densitàà ee della della produzione atteseproduzione attese inin praterie di praterie di Posidonia Posidonia oceanicaoceanica (L.) (L.) DelileDelile

Michele Scardi & Eugenio Fresi


skip

61

ID minimo massimoLAT 39.9 44.4LON 7.5 18.6

PROF 0 35GRAD 0 0.3

CONCESP 0 1CONCVENT 0 1

concavo CONC 0 1 piano PIANO 0 1 convesso CONV 0 1

RUNS 0 4APERTLIT 1 5ESPVENTI 0 1

sabbia SABBIA 0 1 roccia ROCCIA 0 1 matte MATTE 0 1 ancoraggio ANCOR 0 1 inquinamento INQUIN 0 1 immissioni IMMISS 0 1 dens ass media DENSASS 0 900 prod rizoma PRODRIZ 0 100

variabilelat. (gradi decimali)

long. (gradi decimali)profondità (m)

gradienteconcordanza esposizione

concordanza venti dominanti

conformazione profilo batimetrico

tipologia fondale

sorgenti di disturbo

variabili da predire

"apertura" litoraleruns variazione profilo

esposizione ai venti dominanti

{

{{{

Densità assoluta

0

100

200

300

400

500

600

700

800

900

1000

0 200 400 600 800 1000

valore osservato

valo

re s

timat

o

training set

test set

skip

62

Distribuzione degli scarti

Mediana 5%-95%

Rete neurale(MLP)

PLS-300

-200

-100

0

100

200

300

400fa

scim

-2

Produzione dei rizomi (stima diretta)

0

10

20

30

40

50

60

70

80

90

100

0 20 40 60 80 100

valore osservato

valo

re s

timat

o

training set

test set

63

Produzione dei rizomi (modello a cascata)

0

10

20

30

40

50

60

70

80

90

100

0 20 40 60 80 100

valore osservato

valo

re s

timat

o

training set

test set

Scarti della stima della produzione dei rizomi

Mediana 5%-95%

modellodiretto

modello"a cascata"

-40

-30

-20

-10

0

10

20

30

40

50

gm

-2an

no-1

64

-150 -100 -50 0 50 100 150

COGOLETO-ARENZANO

GALLINARA

MARATEA

MELORIA

MONTEROSSO AL MARE

MORTOLA

OTRANTO

PUNTA MANARA

S. MICHELE DI PAGANA

S. PIETRO (TA)

SANTA MARINELLA

TALAMONE

TERRACINA

TREMITI

VADA

VENTOTENE

differenza fra densità stimata e densità osservata

densità osservata maggiore di quella attesa

densità osservataminore di quella attesa

65

10 metri454 ciuffi m-2

21.4 g PS m-2 anno-1

66

0% 100% 200% 300% 400% 500% 600% 700% 800%

P RO F

E S P V E NTI

LA T

RUNS

G RA D

CO NCV E NT

INQ UIN

M A TTE

S A B B IA

LO N

CO NCE S P

A P E RTLIT

RO CCIA

P IA NO

CO NV

A NCO R

CO NC

IM M IS S

va ria z ion e M S E

Analisi di sensibilità del modello: densità assoluta

67

The Third Primary Production AlgorithmRound-Robin (PPARR3)

http://oceans-www.jpl.nasa.gov/bio/PrimaryProd/index.html

Un’esercizio di comparazione dei modelli globali di produzione primaria

fitoplanctonica

Partecipanti:

68

The NN PP model is based on:

• The OPPWG global data set from OPPWG(Institute of Marine and Coastal Sciences at Rutgers University,New Brunswick, NJ, USA)

• The F029 and F049 data sets(N.O.A.A. National Oceanographic Data Center,Silver Spring, MD, USA)

• A time series from the Gulf of Naples, Italy(Stazione Zoologica ‘A. Dohrn’ of Naples)

• Other models(VGPM by B&F, Howard-Yoder, MOD-27 by Esaias)

69

Metamodeling

N.B. The observed data have been filtered and unlikely patterns have

been excluded (e.g. where the P/B ratio was

too large).

N.B. Estimates at each point are based on real

predictive data, but other estimates have been also generated by changing each predictive value within a given range.

Predictive (input) variables:

• Lat latitude• sinLon 1/2[sin(2π⋅(Longitude+180)/360)+1]• cosLon 1/2[cos(2π⋅(Longitude+180) /360)+1]• sinDay 1/2[sin(2π⋅JulianDate/365)+1]• cosDay 1/2[cos(2π⋅JulianDate/365)+1]• DL day length• I0 surface downwelling PAR• log(MLD) log-transformed mixed layer depth• SST sea surface temperature• Pb

opt’ measured or estimated after B&F• log(Chl) log-transformed surface chlorophyll

70

X1 , X2 , … , Xm PP

f(X1 , X2 , … , Xm ) PP

f(X1 , X2 , … , Xm ) PP

f(X1 , X2 , … , Xm ) PP

f(X1 , X2 , … , Xm ) PP

X1 , X2 , … , Xm PP

X1 , X2 , … , Xm PP

X1 , X2 , … , Xm PP

... ...

... ...

#1

#2

#n

#1

#2

#n

X1 , X2 , … , Xm PP

X1 , X2 , … , Xm PP

X1 , X2 , … , Xm PP

... ...

... ...

... ...

training(50%

)validation

(25%)

test(25%

)

data

n =

2773

4 =

8320

0 / 3

mod

els

n=83

200

f(X1 , X2 , … , Xm ) PP

f(X1 , X2 , … , Xm ) PP

f(X1 , X2 , … , Xm ) PP

X1 , X2 , … , Xm PP

f(X1 , X2 , … , Xm ) PP

Metamodeling, i.e. modeling other models

n=227732

MSE=0.00156

R2=0.88

mean error=-0.0003

median error=-0.0001

-0.025<50% of errors<0.023

-0.063<90% of errors<0.064

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

normalized PP(estimated by other models)

norm

aliz

ed P

P(e

stim

ated

by

the

NN

mod

el)

71

Checking the NN metamodel using an independent test data set

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

normalized PP (observed)

norm

aliz

ed P

P (e

stim

ated

)

n=552

MSE=0.00248

R2=0.85

mean error=-0.004

median error=-0.005

-0.034<50% of errors<0.026

-0.082<90% of errors<0.084

72

Sensitivity analysis

+/- change in input Lat sinLon cosLon sinDay cosDay DL I0 log(MLD) SST PBopt' log(Chl)

1.0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 7% 4%

2.0% 0% 0% 0% 0% 0% 0% 1% 0% 0% 29% 17%

5.0% 1% 0% 0% 0% 0% 2% 5% 3% 1% 184% 105%

10.0% 4% 1% 0% 1% 0% 9% 18% 12% 4% 493% 417%

15.0% 8% 2% 1% 2% 1% 21% 36% 26% 8% 581% 921%

20.0% 13% 3% 1% 4% 1% 40% 59% 47% 13% 639% 1598%

25.0% 18% 5% 1% 5% 1% 68% 89% 75% 19% 686% 2415%

30.0% 25% 7% 2% 7% 2% 108% 121% 107% 26% 722% 3334%

40.0% 38% 10% 2% 10% 3% 221% 201% 172% 41% 763% 5246%

50.0% 52% 12% 3% 14% 4% 323% 302% 216% 56% 780% 6771%

73

IMPROVING A GLOBAL MODEL OF IMPROVING A GLOBAL MODEL OF PHYTOPLANKTON PRIMARY PHYTOPLANKTON PRIMARY

PRODUCTIONPRODUCTION

Michele Scardi


skip

-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180

-90

-60

-30

0

30

60

90

Phytoplankton primary production sampling sites

74

10

100

1000

10000

10 100 1000 10000

observed values (mg C m-2 day-1)

neur

al n

etw

ork

outp

ut (m

g C

m-2

day

-1)

Predictive variables:• surface biomass

• surface irradiance

• surface temperature

• date*

• longitude

• latitude

* 2 variables, i.e.

7-7-1 NN

⎥⎦

⎤⎢⎣

⎡+⎟⎠⎞

⎜⎝⎛ ⋅

= 1365

2cos21

1daydate π

⎥⎦

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛ ⋅

= 1365

2sin21

2daydate π

A global model of phytoplankton primary productionA global model of phytoplankton primary production((ScardiScardi, 2000), 2000)

Depth affects PP via:Depth affects PP via:

•• water column water column dynamics dynamics

•• upwelling regionsupwelling regions

•• coastal frontscoastal fronts

•• nutrient dynamicsnutrient dynamics

•• freshwater runfreshwater run--offoff

•• etc.etc.

Water column depth as a coWater column depth as a co--predictor for primary productionpredictor for primary production

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

-8000 -6000 -4000 -2000 0

mean depth (m)

PP (m

g C

m-2 d

ay-1)

75

•• Phytoplankton surface biomass (as Phytoplankton surface biomass (as ChlChl concentration)concentration)

•• Surface irradianceSurface irradiance

•• Surface temperatureSurface temperature

•• LatitudeLatitude

•• LongitudeLongitude

•• DateDate

•• Average depth Average depth

•• St. dev. of depthSt. dev. of depth

•• Day lengthDay length

⎥⎦

⎤⎢⎣

⎡+⎟⎠⎞

⎜⎝⎛ +⋅

= 1365

180(2sin21

2longitudelongitude π

⎥⎦

⎤⎢⎣

⎡+⎟⎠⎞

⎜⎝⎛ ⋅

= 1365

2cos21

1daydate π

⎥⎦

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛ ⋅

= 1365

2sin21

2daydate π

⎥⎦

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛ +⋅

= 1365

180(2cos21

1longitudelongitude π

1.251.25°° Lon x 0.75Lon x 0.75°° Lat windowLat window

Primary production predictors and coPrimary production predictors and co--predictors:predictors:

76

77--77--1 NN model1 NN model((ScardiScardi, 2000), 2000)

1111--1414--1 NN model1 NN model(with bathymetric(with bathymetricpredictive copredictive co--variables)variables)

1

10

100

1000

10000

1 10 100 1000 10000

observed PP (mg C m-2 day-1)

estim

ated

PP

(mg

C m

-2 d

ay-1)

1

10

100

1000

10000

1 10 100 1000 10000


estim

ated

PP

(mg

C m

-2 d

ay-1)

training andvalidation

testing

MSE=330233MSE=330233MSE=405117MSE=405117

The largest The largest improvementsimprovements

in square error occurred in square error occurred within this rangewithin this range

(2257 out of 2522 cases)(2257 out of 2522 cases)

0.0E+00

5.0E+07

1.0E+08

1.5E+08

2.0E+08

2.5E+08

<100

100-

500

500-

1000

1000

-200

0

2000

-300

0

3000

-400

0

4000

-500

0

>500

0


sum

of s

quar

e er

rors

7-7-1 NN model 11-14-1 NN model (with co-predictors)

190

676

897

544

14

42

14

19

1

10

100

1000

10000

1 10 100 1000 10000


estim

ated

PP

(mg

C m

-2 d

ay-1)

training andvalidation

testing

The 7The 7--77--1 NN model performed 1 NN model performed slightly better than the 11slightly better than the 11--1414--1 1

NN model with coNN model with co--predictors predictors only when PP>5000 mg C monly when PP>5000 mg C m--22

dayday--11

77

0

100

200

300

400

500

600

700

-400

0

-200

0

-100

0

-500

-250

-125 0

125

250

500

1000

2000

4000

Mor

e

output error

n. o

f cas

es

7-7-1 model 11-14-1 model

-1-2daym C mg 250<error7-7-1

11-14-1

0% 25% 50% 75%

1111--1414--1 NN model of phytoplankton primary 1 NN model of phytoplankton primary production: a sensitivity analysisproduction: a sensitivity analysis

100% 1000% 10000%

Chlorophyll

log[med(z)]

Latitude

Irradiance

f[sin(day)]

stdev(z)

f[cos(Longitude)]

f[sin(Longitude)]

Day length

Temperature

f[cos(day)]

relative MSE

78

1.1. CoCo--variablesvariables may help to may help to improve neural network output improve neural network output (i.e. predictions)(i.e. predictions)

2.2. Biological Biological constraintsconstraints damp damp variability in real systems as variability in real systems as well as in neural network well as in neural network modelsmodels

3.3. Data and knowledge (i.e. Data and knowledge (i.e. theoretical assumptions, other theoretical assumptions, other models, etc.) can be merged into models, etc.) can be merged into neural network neural network metamodelsmetamodels

USO COMBINATO DI DIVERSE USO COMBINATO DI DIVERSE TIPOLOGIE DI MODELLITIPOLOGIE DI MODELLI

Analisi della produttivitAnalisi della produttivitàà dello dello Stagno del Calich (Sardegna)Stagno del Calich (Sardegna)

79

0

2

4

6

8

10

12

gen apr lug ott

biom

assa

fito

plan

cton

(mg

CH

l m-3

)

0

20

40

60

80

100

120

140

160

180

biomassa zooplancton

(mg m

-3, peso secco)

fitoplancton zooplancton

0

200

400

600

800

1000

1200

1400

1600

gen apr lug ott

PP (m

g C

m-3

gio

rno-1

)

produzione primaria fitoplanctonica (PP, rete neuronale)produzione primaria fitoplanctonica (PP, misurata)

80

0

200

400

600

800

1000

1200

1400

1600

gen apr lug ott

PP (m

g C

m-3

gio

rno-1

)

0

2

4

6

8

10

12

14

16

18PS (m

g C m

-3 giorno-1)

produzione primaria fitoplanctonica (PP, modello analitico)produzione primaria fitoplanctonica (PP, rete neuronale)produzione primaria fitoplanctonica (PP, misurata)produzione secondaria zooplanctonica (PS)

0

750

1500

PP misurataPP rete neuronalePP modello analitico

giorni

PP [m

g C/(m

² gior

no)]

0 6 0 1 20 1 80 2 40 3 00 3 60 4 20 4 80

(1) c 'è ener g ia r esidua?(2) il poo l d i nu trie nti è com pletam en te sf ru t tato?(3) l'ef fic ienz a fo tosin tet ica è lim itata ?

gior ni

se la produzione misurata in campo è inferiore a quella attesa sulla base di uno o di entrambi i modelli, allora nel sistema è disponibile dell’energia residua che potrebbe (in via teorica) essere sfruttata

se la produzione stimata dal modello empirico (quindi, sulla base di biomassa, luce e trasparenza) èsuperiore alla produzione misurata in campo, allora l’efficienza fotosintetica del fitoplancton potrebbe essere limitata da una insufficiente disponibilità di nutrienti

se la produzione stimata dal modello analitico è superiore a quella misurata, allora è ipotizzabile l’esistenza di fattori limitanti di natura fisica (es. nuvolosità, torbidità stratificata, etc.) o biologica (es. composizione del fitoplancton, inefficiente fotoadattamento, etc.)

81

Produzione primaria fitoplancton240 g C m-2 anno-1

Produzione secondariazooplancton

0.8 g C m-2 anno-1

Produzione primaria fitobenthos60 g C m-2 anno-1

Produzione secondariamacrozoobenthos4.2 g C m-2 anno-1

Produzione secondarianecton

3 g C m-2 anno-1 (= 450 kg ha-1)

Produzione terziarianecton+macrozoobenthos+avifauna

0.8 g C m-2 anno-1 (= 120 kg ha-1)

Links utili

• Il mio sito web (reti neurali, analisi dati, etc.)http://www.mare-net.com/mscardi

• Progetto PAEQANNhttp://aquaeco.ups-tlse.fr/

• Modelling Community Structure in Freshwater Ecosystemshttp://www.springeronline.com/sgw/cda/frontpage/0,11855,4-40109-22-36347264-0,00.html

• Congressi International Society for Ecological Informaticshttp://www.isei3.org e http://www.isei4.org

Dipartimento di Biologia Università di Roma “Tor Vergata” · PDF filecaso...

Documents

Transcript of Dipartimento di Biologia Università di Roma “Tor Vergata” · PDF filecaso...