Dipartimento di Biologia Università di Roma “Tor Vergata” · PDF filecaso...
Transcript of Dipartimento di Biologia Università di Roma “Tor Vergata” · PDF filecaso...
1
Modellistica ambientale:applicazioni e prospettive
Prof. Michele Scardi
Dipartimento di BiologiaUniversità di Roma “Tor Vergata”
http://www.mare-net.com/mscardi [email protected]
sistema reale
modello
astrazione
interpretazione
2
Tipologie di modelli
• Modelli fisici(es. mesocosmi)
• Modelli concettuali (es. modello di Tilman)
• Modelli analitici (es. modello di Lotka-Volterra)
• Modelli empirici (es. modello di Von Bertalanffy)
Modelli fisici
3
Funzioneforzante
Produttoreprimario
Consumatore
Immagazzinamentopassivo
Fattorelimitante
Elemento dicontrollo
Dissipazione Flusso
Modelli concettuali
N
P + - TL Z
self-shading
4
Modelli analitici
5
scambiPNTIfOMTkZTPgdtdN
scambiOMcOMTkZTPgcPcdt
dOM
scambiZcZTPgcZThZTOMPgdtdZ
scambiPcZTPgPNTIfdtdP
snamp
mzna
mp
±−+=
±−−+=
±−−−=
±−−=
)),,()(),((6.12
)(),(
),()(),,(
),(),,(
[ ] )()()(),,( 321max TgOMgPggTOMPg ⋅+⋅= g T TT
eopt
TTopt
3
1
( ) =−
densità iniziale fitoplancton (Chl mg m-3) 10densità iniziale zooplancton (DW mg m-3) 0.2concentrazione iniziale SOM (mg C m-3) 20conc. iniziale azoto inorg. (mM N dm-3) 1numero di giorni simulati dall'1 gennaio 1460torbidità relativa (componente inorganica) 2temperatura massima acqua (°C) 26temperatura minima acqua (°C) 10tasso di crescita massimo del fitoplancton 0.59pendenza della curva di crescita come f(T) 0.075costante di semisaturazione per l'azoto 1.1tasso di mortalità naturale fitoplancton 0.15cost. conversione mg C dm-3 -> mM NXy dm-3 0.0126tasso di crescita max zooplancton erbivoro 1.2costante di semisaturazione per il grazing 25coeff. preferenza grazing su fitoplancton 0.66coeff. preferenza grazing su part. org. 0.33 tasso di respirazione a 0 °C 0.06 pendenza curva respirazione [f(T)] 0.085razione di fitoplancton non assimilata 0.33 tasso di mortalità dello zooplancton 0.21 tasso di decomposizione della SOM a 0 °C 0.05 pendenza funzione decomposizione [f(T)] 0.06 tasso di sedimentazione della SOM 0.33
Parametri del modello (assunti come costanti)
6
⎪⎪⎩
⎪⎪⎨
⎧
−=
−=
2212
2111
mNNbaNdt
dN
NaNrNdt
dN
7
ar
bam
= 0 per N2=
= 0 per N1=
0 20 40 60 800
20
40
60
80
N1
N2
N -1
N -2
N -1N +2
N +1
N +2
N +1
N -2
Sub MODELLO(f(),Y(),r1,p1,r2,m2)'predef(1) = r1 * Y(1) - p1 * Y(1) * Y(2)'predatorif(2) = r2 * p1 * Y(1) * Y(2) - m2 * Y(2)End Sub
Static Sub PREDCORR(x0, x9, k1, n%, k5, e, z%, fl%)ReDim w(1 To 9) As SingleReDim h2(n%, 22) As SingleOn Error GoTo ErrorHandler'verifica le possibili condizioni di errore alla chiamataIf x0 >= x9 Then fl = 1: Exit SubIf (n% <= 0) Or (n% <> Int(n%)) Then fl = 2: Exit SubIf (k5 <= 0) Or (k5 <> Int(k5)) Then fl = 3: Exit SubIf (k1 <= 0) Or (k1 <> Int(k1)) Then fl = 4: Exit SubIf e < 0.000000001 Then fl = 5: Exit SubIf (z - 1) * (z - 2) <> 0 Then fl = 6: Exit Sub'definizione delle costantiw(1) = 0.2071067811865w(2) = 0.2928932188135w(3) = 0.1'inizializzazioneFor i% = 1 to n%
For j% = x0 to x9…
8
http://www.mare-net/mscardi/work/ecologia/mod_preda_predatore.xls
Skip
9
⎪⎪
⎩
⎪⎪
⎨
⎧
−=
−⎟⎠⎞
⎜⎝⎛ −=
2212
211
11 1
mNNbaNdt
dN
NaNKNrN
dtdN
competizioneintraspecificafra prede
0
50
100
150
200
250
300
0 20 40 60 80 100 120t
preda
predatore
0
10
20
30
40
50
60
0 50 100 150 200 250
P
Q
⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪⎪
⎨
⎧
−=
−=
−⎟⎠⎞
⎜⎝⎛ −=
332223
32221112
2111
11 1
mNNNabdt
dN
NNaNNabdt
dN
NNaKNrN
dtdN competizione
intraspecificafra prede
la mortalità dei predatori dipende solo da predatori di livello superiore
al vertice della rete trofica, la mortalità è solo per senescenza (in questo caso si assume il tasso di mortlaità come una costante)
10
0
50
100
150
200
250
300
0 5 10 15 20 25
t
P, Q
, R
preda
predatore 1
predatore 2
0
5
10
15
20
25
30
0 50 100 150
P
Q
0
1
2
3
4
5
6
7
0 50 100 150
P
R
0
1
2
3
4
5
6
7
0 10 20 30
Q
R
( )
⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪⎪
⎨
⎧
−=
−=
+−⎟⎠⎞
⎜⎝⎛ −=
3231223
2121112
132211
11 1
NmNNabdt
dN
NmNNabdt
dN
NNaNaKNrN
dtdN
11
2 m
2 m
5 m
5 m
2 m
5 m
10 m
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40°
55' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Pedred
duri
Olbia
Rio
S. Ni co la
Rio Seligheddu
Rio Sozz o
D
e al t d el F. P da rogianoI. di Mezzo
I. Bianca
Cala Cocciani
P.ta Ginepro
Cala Saccaia
I. della Bocca
P.ta delle Saline
Stagno di Gravile
I. Gabbia
Porto Romano
I. Manna
I. Lepre
I. del Cavallo
Depuratore nucleo industriale
Depuratore comunale Rete di ripartizione dei reflui depurati
Area con presenza di scarichi liberi
Simulazione di scenari di gestione ambientalenel Golfo di Olbia
dPdt
f T I N P g P T Z c P
dZdt
c g P OM T Z h T Z c Z
dOMdt
c P c g P OM T Z k T OM c OM
dNdt
c h T Z k T OM f T I N P j z T
mp
na mz
mp na s
CN
= − − ±
= − ⋅ − − ±
= + − − ±
= ⋅ + − + ±
( , , ) ( , )
( ) ( , , ) ( )
( , , ) ( )
( ( ) ( ) ( , , ) ) ( , )
scambio
scambio
scambio + reflui + escrezione
scambio + reflui + escrezione
1
f T I N T f I f N( , , ) ( ) ( ) ( )= ⋅ ⋅µ 1 2
µ µ( )
( )
( )
max maxT
ee
f II
Ie
f NN
k N
k T
k T
opt
II
N
l
l
opt
=
=
=+
⋅
⋅
−
1
1
2
Iz
I e dz
I I I I
czz
opt t t t
=
= ⋅ + ⋅ + ⋅
−
− − −
∫1
0 7 0 2 01
00
1 2 3. . .
c Pchl= + ⋅035 0 05. .
12
C1
C2 B2
AE
B1
Tavola I. Compartimentazione spaziale del modello di produzione planctonica.
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40°
55' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Ped
redduri
Olbia
Rio
S. N ic o l a
R io S e l igheddu
Rio S o z z o
C1
C2 B2
AE
B1
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40° 5
5' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Pedred
duri
Olbia
Rio
S. N ic o l a
R io S e l igheddu
R io S o z z o
0
20
mg m-3
chl a
13
2 m
2 m
5 m
5 m
2 m
5 m
10 m
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40° 5
5' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Pedre
dduri
Olbia
Rio
S. Ni co la
R io S eligheddu
Rio Sozz o
D
e al t d el F. P da rogianoI. di Mezzo
I. Bianca
Cala Cocciani
P.ta Ginepro
Cala Saccaia
I. della Bocca
P.ta delle Saline
Stagno di Gravile
I. Gabbia
Porto Romano
I. Manna
I. Lepre
I. del Cavallo
Tavola III. Criteri utilizzati per la simulazione della gestione in tempo reale dell'immissione di reflui.
Dal 151.mo giorno dell'anno finoal 269.mo (giungo-settembre),se la biomassa fitoplanctonicasupera i 90 mg C m (circa 2 mgChl m ) nei comparti più interni delGolfo, allora i reflui depurati vengonoimmessi all'esterno del Golfo stesso.
2 m
2 m
5 m
5 m
2 m
5 m
10 m
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40° 5
5' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Pedre
dduri
Olbia
Rio
S. Ni co la
R io S el igheddu
Rio Sozz o
D
e al t d el F. P da rogianoI. di Mezzo
I. Bianca
Cala Cocciani
P.ta Ginepro
Cala Saccaia
I. della Bocca
P.ta delle Saline
Stagno di Gravile
I. Gabbia
Porto Romano
I. Manna
I. Lepre
I. del Cavallo
Tavola VII. Ipotesi di massima della collocazione di un insieme di tre centraline di monitoraggio.
L'effettiva posizione delle centralinesarà vincolata dalla possibilità didisporre di un accesso agevole perla manutenzione e dalle condizioniidrodinamiche ed ambientali locali.
NOTA
14
2 m
2 m
5 m
5 m
2 m
5 m
10 m
9° 30' E 31' 32' 33' 34'
30' 31' 32' 33' 34'
40°
55' N
55'
56'
56'
0
metri
1000Rio
C
i
occian
Rio
Pedre
dduri
Olbia
Rio
S. Ni co la
Rio Sel igheddu
Rio So zz o
D
e alt d el F. P da rogianoI. di Mezzo
I. Bianca
Cala Cocciani
P.ta Ginepro
Cala Saccaia
I. della Bocca
P.ta delle Saline
Stagno di Gravile
I. Gabbia
Porto Romano
I. Manna
I. Lepre
I. del Cavallo
Tavola VI. Ipotesi di ripartizione dei reflui depurati.Depuratore nucleo industriale
Depuratore comunale Rete di ripartizione dei reflui depurati
Area con presenza di scarichi liberi
immissione oltre il limiteinferiore delle praterie
di fanerogame
med(chl): ~6 ~4 mg m-3
med(chl): ~9 ~5 mg m-3
15
Modelli empirici
Stima della produzione primaria
• La produzione primaria dipende da:– Biomassa fitoplanctonica– Irradianza– Temperatura– Efficienza fotosintetica del fitoplancton
• La biomassa fitoplanctonica dipende da:– Produttività primaria– Disponibilità di nutrienti– Scambi advettivi
16
data I0(PAR) CHLm(0-2) k zp PT(0-60)Em-2d-1 mg m-3 m-1 m mg C m-2 d-1
02/09/84 11.831 3.04 0.113 40.8 678 03/01/84 15.110 0.25 0.087 53.0 80 03/15/84 30.966 0.93 0.100 46.1 168 03/29/84 13.783 7.33 0.112 41.2 426 04/12/84 37.119 13.52 0.127 36.3 541 04/26/84 44.005 3.93 0.127 36.3 325 05/09/84 45.180 5.27 0.128 36.0 620 05/24/84 55.343 6.26 0.109 42.3 657 06/06/84 12.762 6.83 0.123 37.5 410 06/28/84 57.094 6.25 0.126 36.6 646 07/10/84 55.333 5.20 0.119 38.7 1027 07/24/84 52.449 0.51 0.111 41.5 313 08/08/84 47.360 0.92 0.089 51.8 210 08/21/84 43.527 0.32 0.094 49.0 247 09/07/84 42.333 0.25 0.087 53.0 85 09/18/84 15.649 7.20 0.158 29.2 536
... ... ... ... ... ...
I(0)
Chl(0)
k
Zp
IPP
Relazioni fra irradianza e biomassa fitoplanctonica superficiali, coefficiente di attenuazione dell’irradianza discendente, profondità della zona eufotica e produzione primaria integrata sulla verticale.
17
PP = 72.623 chl
0
500
1000
1500
2000
2500
0 5 10 15 20 25 30
biomassa fitoplanctonica (mg chl m-3 a 0 metri)
prod
uzio
ne p
rim
aria
(mg
C m
-2 g
iorn
o-1)
P a b Bd = + ⋅
Smith et al. (1982)
PP = 0.0722 B0 I0 Zp
0
200
400
600
800
1000
1200
1400
1600
1800
2000
0 5000 10000 15000 20000 25000 30000
B0 I0 Zp
prod
uzio
ne p
rimar
ia (m
g C
m-2
gio
rno-1
)
P a b B Z I
Zk
d p
p
= + ⋅
=
0
4 61.Cole & Cloern (1984)
More info about VGPM at http://warrior.rutgers.edu
Vertically Generalized Production Model (VGPM)(Behrenfeld & Falkowski, 1997)
ΣPP 0.66125 P b_opt.I 0
I 0 4.1. Chl. Z eu. Dl.
Where:
Chl tot Chl( ) if Chl 1.0< 38.0 Chl0.425., 40.2 Chl0.507.,( )
Z eu Chl( ) if 568.2 Chl tot Chl( ) 0.746. 102< 568.2 Chl tot Chl( ) 0.746., 200 Chl tot Chl( ) 0.293.,
P b_opt SST( ) if SST 1.0< 1.13, if SST 28.5> 4.00, 1.2956 2.75 10 1. SST. 6.17 10 2. SST2. 2.05 10 2. SST3.
2.462 10 3. SST4. 1.348 10 4. SST5.+...
3.4132 10 6. SST6. 3.27 10 8. SST7.+...
,,
VGPM can be redefined as a function of 4 predictive variables:
ΣPP Chl I 0, SST, Dl, 0.66125 P b_opt SST( ).I 0
I 0 4.1. Chl. Z eu Chl( ). Dl.
E.g.: ΣPP .601 0.1, 13.83, 13.21,( ) 29.095=
PP=f(B0,Zp,fotoperiodo, PBopt)
Zp=f(B0)
PBopt=f(SST)
18
0 0.5 1.0 1.5
PP media in giugno
g C m giorno-2 -1
Modelli empirici di nuova generazione: reti neurali
19
“...a neural network is a system composed of many simple processing elements operating in parallel whose function is determined by network structure, connection strengths, and the processing performed at computing elements or nodes.”“…una rete neurale è un sistema composto da molti elementi di processo semplici che operano in parallelo, la cui funzione èdeterminata dalla struttura della rete, dall’intensità delle connessioni e dai processi attuati negli elementi di calcolo o nodi.”
(DARPA Neural Network Study, 1988,AFCEA International Press, p. 60)
COME FUNZIONANOCOME FUNZIONANOLE RETI NEURALI?LE RETI NEURALI?
SOLO UN PIZZICO DI TEORIASOLO UN PIZZICO DI TEORIA……
20
Nodi (o neuroni)di input
Variabilipredittive (input)Sono generalmente
scalate in un intervallo[0,1] o [-1,1]
ConnessionisinapticheAd ogni connessione èassociato un peso sinaptico
Nodi (o neuroni)dello strato nascosto
Nodo (o neurone)di output
Variabile dipendente(output)Se necessario l’output deveessere riscalato all’unità dimisura originale
Nodi (o neuroni) di biasHanno un ruolo analogo a
quello del termine costantedi una regressione
Funzione di attivazione
iiwxa
f(a)
x1·w1
x n·wn
x2·w2
La funzione di attivazione accetta come argomento la somma degli input del nodo e ne restituisce l’output
Una rete neurale di tipoerror back-propagation (EBP)a tre strati, con architettura 5-7-1
),,1( 1
1h
n
jjkjk nkwih
i
K== ∑+
=
)( kk hfh = 11 =+hnh
),,1( 1
1h
n
jjkjk nkwih
i
K== ∑+
=
)( kk hfh = 11 =+hnh
∑=
−=on
lll
ooy
nE
1
2)(1
),,1 ;1,,1( ohkolklkl nlnkhzz KK =+=+= ηδ
)1()()()( lllllllol oooyofoy −⋅−=′⋅−=δ
)1,,1 ;1,,1( +=+=+= ihjhkjkjk njnkiww KKηδ
kl
on
l
olkkkl
on
l
olk
hk zhhzhf ∑∑
==⋅−=⋅′=
11)1()( δδδ
L’algoritmo EBPL’algoritmo EBP (Rumelhart et al., 1986) è di gran lunga il più diffuso fra gli algoritmi ditraining per le reti neuronali e può essere schematizzato come segue:
1. le connesioni sinaptiche sono inizializzate in maniera casuale
2. un training pattern è immesso nella rete neuronale
4. l’output della rete è confrontato con i valori noti del set di validazione
3. tutti i pesi sinaptici vengono quindi modificati in funzione dello scarto rilevato tra outputs e valori noti (error-backpropagation)
5. se le condizioni di convergenzasono raggiunte, si termina il training, altrimenti si torna al punto 2
Demo
21
generalizzazionegeneralizzazione
overfittingoverfitting
PP = f (I0, Zp, CHL)PP = f (IPP = f (I00, , ZZpp, CHL), CHL)
PER EVITARE L’OVERFITTING:
• early stopping
• jittering (aggiunta di rumore agli inputs)
• weight decay
• training patterns in ordine casuale
• etc.
22
INOLTRE, PER UNA BUONA GENERALIZZAZIONE:
• gli inputs devono contenere abbastanza informazione
predittiva in rapporto agli outputs desiderati
(targets)
• la relazione da modellizzare deve essere
preferibilmente regolare (cioè piccola variazione in
input --> piccola variazione in output)
• il training set deve essere abbastanza grande e
comunque deve essere un sottoinsieme
rappresentativo del sistema reale
A PHYTOPLANKTON PRIMARY A PHYTOPLANKTON PRIMARY PRODUCTION MODEL FOR PRODUCTION MODEL FOR
CHESAPEAKE BAYCHESAPEAKE BAY
Michele Scardi1 & Lawrence W. Harding, Jr.2
1. Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy2. Horn Point Lab., University of Maryland, USA
skip
23
Chesapeake Bay
Empirical model
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0 5 10 15 20
B·kc/kt·I0
PP
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0 5 10 15 20
B·kc/kt·I0
PP
outliersDelaware Bay
Chesapeake Bay
Predicted vs.
observed values
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
observed PP
pred
icte
d PP
r2 = 0.271
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
observed PP
pred
icte
d PP
r2 = 0.745
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
observed PP
pred
icte
d PP
r2 = 0.900
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0observed PP
pred
icte
d PP
r2 = 0.954
Error distribution
0
10
20
30
40
50
-1.2
-0.9
-0.6
-0.3 0.0
0.3
0.6
0.9
1.2
error
%
0
10
20
30
40
50
-1.2
-0.9
-0.6
-0.3 0.0
0.3
0.6
0.9
1.2
error
%
0
10
20
30
40
50
-1.2
-0.9
-0.6
-0.3 0.0
0.3
0.6
0.9
1.2
error
%
0
10
20
30
40
50
-1.2
-0.9
-0.6
-0.3 0.0
0.3
0.6
0.9
1.2
error
%
d.1 c.1 b.1 a.1
d.2 c.2 b.2 a.2
d.3 c.3 b.3 a.3
24
Phytoplankton primary production in Chesapeake Bay
True color SeaWiFSimage:New York-Chesapeake Bay(NASA-GSFC)
True color SeaWiFSimage:New York-Chesapeake Bay(NASA-GSFC)
Predictive variables
•
•
• latitude• longitude• depth• water temperature• salinity• log chlorophyll• log chlorophyll (Zp)• I0 (PAR)• k• Zp
⎥⎦
⎤⎢⎣
⎡+⎟⎠⎞
⎜⎝⎛
⋅⋅1
3652cos
21
πJulianDay
⎥⎦
⎤⎢⎣
⎡+⎟⎠⎞
⎜⎝⎛
⋅⋅1
3652sin
21
πJulianDay
NN structure: 12 - 5 - 1
Output variable: primary production (mg C m-2 day-1)
training and validation sets (1982-96)
testing set (1997)
0.01
0.1
1
10
0.01 0.1 1 10
observed values (g C m-2 day-1)
neur
al n
etw
ork
outp
ut (g
C m
-2 d
ay-1
)
0%
5%
10%
15%
20%
25%
30%
-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 >1.0
output error (g C m-2 day-1)
1982-1996 data set
1997 testing set
25
1
10
100
1000
10000
1 10 100 1000 10000
Observed net PP (mg C m-2 day-1)
Pred
icte
d ne
t PP
(mg
C m
-2 d
ay-1
)
1
10
100
1000
10000
1 10 100 1000 10000
Observed net PP (mg C m-2 day-1)
Pred
icte
d ne
t PP
(mg
C m
-2 d
ay-1
)
1
10
100
1000
10000
1 10 100 1000 10000
Observed net PP (mg C m-2 day-1)Pr
edic
ted
net P
P (m
g C
m-2
day
-1)
CBPM-2(2001)
CBPM-2/NN(2002)
CBPM-NN(1998)
Test data set: 1999-2000
R2=0.431
R2=0.430
R2=0.604
conventionalmodel
6 predictive variables
neural network
12 predictive variables
August
October
JuneDecember
February, April
PP=f(I0)
26
Temp=8°C
Temp=24°C
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
0 50 100 150 200 250 300
total chlorophyll in the photic zone (mg m-2)
neur
al n
etw
ork
outp
ut (g
C m
-2 d
ay-1
)
Summer 1997
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
0 50 100 150 200 250 300
total chlorophyll in the photic zone (mg m-2)
neur
al n
etw
ork
outp
ut (g
C m
-2 d
ay-1
)
Fall 1997
27
PREVISIONE DELLA STRUTTURA PREVISIONE DELLA STRUTTURA DELLA FAUNA ITTICA MEDIANTE DELLA FAUNA ITTICA MEDIANTE
RETI NEURALI ARTIFICIALIRETI NEURALI ARTIFICIALI
Michele Scardi1, Stefano Cataudella1, Paola Di Dato1, Giuseppe Maio2, Enrico Marconato2, Stefano Salviati2,
Lorenzo Tancioni1, Paolo Turin3 e Marco Zanetti3
1. Dip. di Biologia, Univ. di Roma “Tor Vergata”, Roma2. Aquaprogram s.r.l., Vicenza3. Bioprogramm s.c.r.l., Padova
ProblemaProblema applicativoapplicativo #1:#1:
1.1. Previsione della composizione della Previsione della composizione della fauna fauna ittica sullaittica sulla base base didi predittoripredittoriambientaliambientali
2.2. ComparazioneComparazione della composizionedella composizioneattesaattesa con con quellaquella osservataosservata
3.3. FormulazioneFormulazione didi un un giudiziogiudizio didiqualitqualitàà ambientaleambientale((eses. . sensusensu Direttiva Direttiva 2000/60/CE)2000/60/CE)
28
Problema applicativoProblema applicativo #2:#2:
1.1. Analisi diAnalisi di sensibilitsensibilitàà del del modellomodelloprevisionaleprevisionale
2.2. Identificazione dei Identificazione dei fattori ambientalifattori ambientaliche determinano che determinano le le maggiori maggiori variazioni nella risposta variazioni nella risposta del del modellomodello
3.3. Definizione di possibili Definizione di possibili strategie strategie per per la la gestionegestione delldell’’ambienteambiente
Previsione della composizione di una comunità
Caso 1: numero limitato di specie
Caso 2: molte specie, ma un singolo cenoclino (in teoria, tutte le risposte sono unimodali)
Case 3: molte specie e più cenoclini (interazioni di ordine superiore fra variabili ambientali)
Case 4: elevatissimo numero di specie, cenospazio estremamente complesso con discontinuità
29
• Buoni risultati si possono ottenere sia con metodi convenzionali(es. regressione logistica), sia con le reti neurali.
• Le relazioni implicite (non note) fra specie riducono significativamente la dimensionalità reale del problema.
• Solo le reti neurali possono trarre vantaggio da ciò.
Caso 1 o 2:poche specie o singolo cenoclino
Specie presenti nel data set:32
Combinazioni possibili:232= 4294967296
Combinazioni osservate:131 su 264 casi
Le specie non sono indipendenti le une dalle altre (meno male, se no, poveri ecologi!)
Una rete neurale può “catturare” l’informazione relativa alle relazioni interspecifiche (es.
competizione), migliorando la sua capacitàpredittiva
30
da Matthews (1998)
31
Variabili predittive (inputs NN)
1 altitudine (m)2 profondità media (m)3 correnti (superficie, %)4 pozze (superficie, %)5 raschi (superficie, %)6 larghezza media (m)7 massi (superficie, %)8 sassi e ciottoli (superficie, %)9 ghiaia (superficie, %)
10 sabbia (superficie, %)11 peliti (superficie, %)12 velocità flusso (punteggio, 0-5)13 copertura vegetale (superficie, %)14 ombreggiatura (%)15 disturbo antropico (punteggio, 0-4)16 pH17 conducibilità (µS/cm)18 gradiente (%)19 bacino versante (km2)20 distanza dalla sorgente (km)
Taxa considerati
Abramis brama Leuciscus cephalus Alburnus alburnus alborella Leuciscus souffia Anguilla anguilla Micropterus salmoides Barbus meridionalis Orsinigobius punctatissimus Barbus plebejus Padogobius martensii Carassius carassius Perca fluviatilis Chondrostoma genei Phoxinus phoxinus Cobitis taenia Rutilus erythrophthalmus Cottus gobio Sabanejewia larvata Cyprinus carpio Salmo (trutta) marmoratusEsox lucius Salmo (trutta) truttaGambusia holbrooki Salvelinus fontinalisGasterosteus aculeatus Scardinius erythrophthalmus Gobio gobio Thymallus thymallus Ictalurus melas Tinca tinca Lampetra planeri Salmo (trutta) hybr. trutta/marmoratusLepomis gibbosus Oncorhynchus mykiss
32
Struttura del modello: 20-17-32
• 264 patterns (campioni)
• 20 variabili ambientali predittive
• 32 specie (dati binari, presenza/assenza)
• training della rete neurale: algoritmo di errorback-propagation con early stopping basatosull’errore del set di validazione
training, n=131
validazione, n=66
test, n=67
Taxon NN output >0.5? osservato ok?Abramide 0.032 0 0 1Alborella 0.565 1 1 1Anguilla 0.807 1 1 1Barbo 0.905 1 1 1Carassio 0.064 0 0 1Carpa 0.038 0 0 1Cavedano 0.817 1 1 1Cobite 0.584 1 1 1Gambusia 0.036 0 0 1Ghiozzo di fiume 0.798 1 1 1Gobione 0.384 0 0 1Lampreda di ruscello 0.057 0 0 1Lasca 0.739 1 1 1Luccio 0.597 1 1 1Panzarolo 0.407 0 0 1Persico reale 0.053 0 0 1Persico sole 0.054 0 0 1Persico trota 0.026 0 0 1Pesce gatto 0.011 0 0 1Sanguinerola 0.536 1 1 1Scardola 0.427 0 1 0Scazzone 0.281 0 0 1Spinarello 0.040 0 0 1Temolo 0.074 0 0 1Tinca 0.337 0 0 1Triotto 0.663 1 1 1Trota fario 0.948 1 1 1Trota iridea 0.154 0 0 1Trota marmorata 0.182 0 0 1Vairone 0.111 0 0 1
previsioni corrette: 29 su 30
0.00 0.25 0.50 0.75 1.00
AbramideAlborellaAnguilla
BarboCarassio
CarpaCavedano
CobiteGambusiaGhiozzo di
GobioneLampreda di
LascaLuccio
PanzaroloPersico realePersico solePersico trotaPesce gatto
SanguinerolaScardola
ScazzoneSpinarello
TemoloTinca
TriottoTrota fario
Trota irideaTrota marmorata
Vairone
assente presente
Un esempio di output
33
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Ictalurus melas (Rafinesque, 1820)
Perca fluviatilis (Linnaeus, 1758)
Abramis brama (Linnaeus, 1758)
Cyprinus carpio (Linnaeus, 1758)
Salvelinus fontinalis M .
Gobio gobio (Linnaeus, 1758)
Barbus meridionalis
Chondrostoma genei (Bonaparte, 1839)
Gambusia ho lbrooki (Girard, 1859)
M icropterus salmoides (Lacepede, 1802)
Sabanejewia larvata (DeFilippi, 1859)
Carassius carassius (Linnaeus, 1758)
Salmo (trutta) marmoratus (Cuvier, 1817)
Lepomis gibbosus (Linnaeus, 1758)
Barbus plebejus (Bonaparte, 1839)
Leuciscus souffia (Risso, 1826)
Thymallus thymallus (Linnaeus, 1758)
Lampetra planeri (Bloch, 1784)
Rutilus erythrophthalmus (Zerunian, 1982)
Tinca tinca (Linnaeus, 1758)
Anguilla anguilla (Linnaeus, 1758)
Gasterosteus aculeatus (Linnaeus, 1758)
Leuciscus cephalus (Linnaeus, 1758)
Padogobius martensii (Günther, 1861)
Scardinius erythrophthalmus (Linnaeus, 1758)
A lburnus alburnus alborella (De Filippi, 1844)
Esox lucius (Linnaeus, 1758)
Cobitis taenia (Linnaeus, 1758)
Salmo (trutta) trutta (Linnaeus, 1758)
Phoxinus phoxinus (Linnaeus, 1758)
Orsinigobius punctatissimus (Canestrini, 1864)
Cottus gobio (Linnaeus, 1756)
Previsioni esatte: 91.6% (media test set)
The K statistics
EaNEaOaK
−−
=Oa = observed count of matchesEa = expected count of matchesN = total number of cases
presence absence
presence 1 - 1 1 - 0absence 0 - 1 0 - 0
model output
targ
et
H0 = modeled and observed data are independent of each other
34
0.0 0.1 0.2 0.3 0.7 0.80.0
0.2
0.4
0.6
0.8
1.0
K
species frequency
p(K=0)<0.05 p(K=0)>0.05
Come migliorare le basi di dati
• Una copertura spaziale omogenea èutile, ma non sufficiente
• Il piano di campionamento deve considerare più scale spaziali
• Occorrono più osservazioni
• Occorrono più osservazioni
• Occorrono più osservazioni
35
Come migliorare l’apprendimento
• Escludere specie, taxa, classi, cenotipi, etc. la cui frequenza nei set di training, validazione e test sia troppo alta o troppo bassa
• Usare criteri alternativi all’MSE per misurare l’errore.
• Utilizzare regole ecologiche per vincolare l’apprendimento
Con dati binari (presenza/assenza):
Per singoli output, su tutti i patterns:numero (or percentuale) di previsioni esattecoefficiente Kappa
correlazione tetracorica
Tutti gli ouput per singolo pattern:indici di distanza/similarità
Tutti gli outputs su tutti i patterns (totale):distanza/similarità media
statistica di Mantel
Come misurare l’errore
36
Training di una EBP NN basato su misure di distanza
Training
Validazione(calcolo )
StopNo
Via!
Set di training
Set di validazione
Si1iiD D −<
D
distanza media fra campioni osservati e predetti
:D
Misurare la distanza fra patterns (campioni)
• Sia la presenza che l’assenza predette sono rilevanti, quindi è necessario un indice simmetrico.
• es. la dissimilarità di Rogers & Tanimoto:
N.B. Le discordanze pesano più delle concordanze in questo indice (particolarità utile se le assenze sono molto più frequenti delle presenze nei dati o viceversa)
dcbadaD
++++
−=22
1
37
Risultati di un training basato su una misura di distanza
Predizioni esatte Distanza MSE
totale 94.4% 93.1%
training+validazione 95.4% 93.6%
test 91.8% 91.6%
Inoltre, le specie la cui presenza non è stata mai predetta dal modello sono solo 2 e molto rare(carpa e salmerino, presenti due sole volte ciascuna nel test set). Con un training convenzionale, basato sull’MSE, sono ben 9.
-0.2 0 0.2 0.4 0.6 0.8 1
Salmo (trutta) trutta (77%)Leuciscus cephalus (28%)
Padogobius martensii (26%)Scardinius erythrophthalmus (25%)
Esox lucius (25%)Rutilus erythrophthalmus (25%)
Alburnus alburnus alborella (21%)Cottus gobio (21%)
Tinca tinca (20%)Cobitis taenia (18%)
Phoxinus phoxinus (18%)Anguilla anguilla (17%)
Orsinigobius punctatissimus (17%)Salmo (trutta) marmoratus (10%)
Sabanejewia larvata (10%)Ictalurus melas (9%)
Lepomis gibbosus (9%)Barbus plebejus (7%)
Chondrostoma genei (7%)Gasterosteus aculeatus (7%)
Carassius carassius (6%)Gobio gobio (6%)
Leuciscus souffia (5%)Thymallus thymallus (5%)
Lampetra planeri (4%)
Gambusia holbrooki (3%)Barbus meridionalis (3%)
Micropterus salmoides (3%)Perca fluviatilis (1%)Abramis brama (1%)
Cyprinus carpio (1%)Salvelinus fontinalis (1%)
K
Rogers & Tanimoto dissimilarityMean Square Error
Error criterion {
MSE
Dissimilarità(Rogers & Tanimoto)
38
UNO STRUMENTO PIUUNO STRUMENTO PIU’’COMPLESSOCOMPLESSO
1. France, Univ. Paul Sabatier, CESAC lab S. Lek (ccord.)2. Denmark, Univ. Copehargen, DFH, Env. Chemistry lab S.E. Jorgensen3. Italy, Univ. Rome Tor Vergata, Dept. Biology M. Scardi4. Belgium, Univ. Namur, Freshwater Ecology lab (LFE) FUNDP J.P. Descy5. France, CEMAGREF, Bordeaux F. Delmas / M. Coste6. Luxemburg, Cell. Recherche Environ. Biotechnol. L. Ector7. Netherlands, ALTERRA Institute, Freshwater Ecol. team P.F.M. Verdonschot8. Austria, Austrian Research Center, Seibersdorf H.M. Knoflacher
PAEQANN
Predicting Aquatic Ecosystem Quality using Artificial Neural Networks: Impact of Environmental characteristics on the Structure
of Aquatic Communities (Algae, Benthic and Fish Fauna)
Proposal number: EVK1-1999-00125Contract n°: EVK1-CT1999-00026
EU 5th Framework Programmeskip
39
http://aquaeco.ups-tlse.fr
40
41
APRIAMO IL APRIAMO IL BLACK BOXBLACK BOX: COME : COME ESTRARRE INFORMAZIONE DAI ESTRARRE INFORMAZIONE DAI
NOSTRI MODELLINOSTRI MODELLI
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
varia
zion
eMSE
(%)
AltitudineAltitudine
variazioneinput (normalizzato)
Analisi di sensibilità
42
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
varia
zion
eM
SE (%
)
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 -5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5mean change in NN input
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
variazione media input NN
-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5-5
0
5
10
15
20
25
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
Varia
zion
eM
SE (%
)ch
ange
in M
SE (%
)va
riazi
one
MSE
(%)
variazione media input NN variazione media input NNvariazione media input NN
AltitudineAltitudine CorrentiProfonditàmedia
Pozze
RaschiRaschi MassiLarghezza media
Sassi e ciottoli
GhiaiaGhiaia PelitiSabbia Velocità flusso
Copertura vegetaleCopertura vegetale Disturbo antropicoOmbreggiatura pH
ConducibilitConducibilitàà Bacino versanteGradiente Distanza sorgente
varia
zion
eM
SE (%
)
•Una procedura di analisi di sensibilità di questo tipo è uno standard applicato comunemente ad un ampio spettro di problemi.
•Questa procedura, in particolare, implica che il dato di presenza (1) o di assenza (0) siano numeri comparabili e trattabili in maniera quantitativa.
•Tuttavia, il significato della presenza o dell’assenza di una specie varia in funzione del contesto ecologico.
•Quindi, è necessario utilizzare altri criteri per valutare modelli che prevedano la presenza di specie.
Questi risultati sono ecologicamente significativi?
43
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.50%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
varia
zion
e re
lativ
ade
lla s
tatis
tica
di M
ante
l
0%
10%
20%
30%
40%
50%
60%
70%
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
varia
zion
e re
lativ
ade
lla s
tatis
tica
di M
ante
lva
riazi
one
rela
tiva
della
sta
tistic
a di
Man
tel
varia
zion
e re
lativ
ade
lla s
tatis
tica
di M
ante
lva
riazi
one
rela
tiva
della
sta
tistic
a di
Man
tel
AltitudineAltitudine CorrentiProfonditàmedia
Pozze
RaschiRaschi MassiLarghezza media
Sassi e ciottoli
GhiaiaGhiaia PelitiSabbia Velocità flusso
Copertura vegetaleCopertura vegetale Disturbo antropicoOmbreggiatura pH
ConducibilitConducibilitàà Bacino versanteGradiente Distanza sorgente
-0.50 -0.25 0.00 0.25 0.50Variazione dell’input della rete neurale
0
5
10
15
20
Varia
zion
e de
lla Z
di M
ante
l (%
)
Ampiezza del profilo = sensibilità della variabile alle perturbazioni
Area sotto il profilo = sensibilità complessiva del modello rispetto alla
variabile in input
Altezza del profilio =
sensibilità del modello ai
cambiamenti
44
Variazione nell’input della rete neurale-0.50 -0.25 0.00 0.25 0.50
0
5
10
15
20
25
Varia
zion
e M
SE
(%)
Distanza dalla sorgente
0
10
20
30
40
50Variazione Z di M
antel(%)
sensibilità relativa
altitudine (m)
superficie bacino versante (km2)
massi (superficie, %)
larghezza media (m)
gradiente (%)
ombreggiatura (%)
sabbia (superficie, %)
pH
distrubo antropico (punteggio, 0-4)
raschi (superficie, %)
velocità del flusso (punteggio, 0-5)
correnti (superficie, %)
peliti (superficie, %)
sassi e ciottoli (superficie, %)
conducibilità (µS/cm)
distanza dalla sorgente (km)
copertura vegetale (superficie, %)
pozze (superficie, %)
ghiaia (superficie, %)
profondità media (m)
45
E LA DIRETTIVA SULLE ACQUE?E LA DIRETTIVA SULLE ACQUE?
Problema
• Una volta definita la struttura della comunità di riferimento, date le condizioni dell’ambiente fisico al contorno, come si misura lo scartoda essa della comunità osservata?
• Ovvero, come si formula un giudizio di qualità?
46
2 2jka dS
a b c d+
=+ + +
jka dS
a b c d+
=+ + +
jkaS
a b c=
+ +
Rogers & Tanimoto (1960)
Sokal & Michener (1958)
Jaccard (1900)
cfr. Moss et al. (1987) O E
Alcune misure di scarto dall’assetto atteso della comunità
O E<1 comunità degradata
≈1 comunità integra
>1 comunità arricchita
Teoria del disturbo intermedio
Connell, J. H. (1978): Diversity in Tropical Rain Forests and Coral Reefs. Science 199: 1302-1310.
47
AN EMPIRICAL MODEL AN EMPIRICAL MODEL CONSTRAINED BYCONSTRAINED BY
A BIOLOGICAL RULEA BIOLOGICAL RULE
Michele Scardi
Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy
skip
48
Phytoplankton primary productionPhytoplankton primary productionsampling sites in Westernsampling sites in WesternMediterranean SeaMediterranean Sea
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180
-90
-60
-30
0
30
60
90
depth-integratedprimary production
surface chlorophyll
surface temperature
surface irradiance
A simple 3-4-1 neural network modelof phytoplankton primary production
49
I0
P/B
⎟⎟⎠
⎞⎜⎜⎝
⎛ −⋅⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛ −−⋅=
sBsBsB P
IP
IPBP βα expexp1
B0
PP
BIOLOGICAL RULEBIOLOGICAL RULE
There are no more than one There are no more than one relativerelative maximummaximum and four and four relative minimarelative minima in a PP=f(Iin a PP=f(I0 0 ,B,B00) ) surfacesurface
0
0.5
1
1.5
B0
0
10
2030
4050
I0
0
500
1000
1500
PP
0
500
1000
1500
PP
NN TRAINING RULENN TRAINING RULE
If more If more maximamaxima and/or and/or minimaminimaare found, then a penalty is are found, then a penalty is added to the MSE during the NN added to the MSE during the NN training for each exceeding training for each exceeding maximummaximum or or minimumminimum..
constrained NN model (no more than one constrained NN model (no more than one maximum and four minima in f(Imaximum and four minima in f(I00,B)),B))
MSE=70759MSE=70759
MSE=89480MSE=89480MSE=57932MSE=57932
overtrainedovertrained modelmodel(works as a memory)(works as a memory)
generalized NN modelgeneralized NN model(early stopping)(early stopping)
50
MODELLING EEL CATCHES IN THE MODELLING EEL CATCHES IN THE TEVERE RIVERTEVERE RIVER
Eleonora Ciccotti, Stefano Cataudella & Michele Scardi
Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy
skip
Eel catches in the Tevere river
Predictive variables
• julian day• no fishing• moon• river flow (day0)• river flow (day-1)• river flow (day-2)• cloud coverage (day0)• cloud coverage (day-1)• cloud coverage (day-2)• rainfall (day0)• rainfall (day-1)• rainfall (day-2)
NN structure
• 12 input nodes• 8 hidden nodes• 1 output node
Output variable
• eel catches (CPUE)
Data sets
• 1991, 1993 and 1995: training (n=532)• 1992 and 1994: validation (n=283)
51
0%
5%
10%
15%
20%
25%
<-4.00<-2.00
<-1.00<-0.50
<-0.25<0.00
<+0.25<+0.50
<+1.00<+2.00
<+4.00>+4.00
NN output - observed value
96% errors < ±1.00 CPUE81% errors < ± 0.50 CPUE
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8
observed values (CPUE)
NN
out
put (
CPU
E)
training set validation set
r 2 = 0.572MSE = 0.447
+ training & validation set + test set
0
1
2
3
4
5
6
7
8
Jan-91 Jan-92 Jan-93 Jan-94 Jan-95
CPU
E observedNN output
training training trainingvalidation validation
observed NN estimate % error
1991 197.4 183.0 -7%1992 174.1 157.0 -10%1993 183.5 185.8 1%1994 166.9 141.3 -15%1995 134.3 176.7 32%
CPUE year-1year
testing testing
52
MODELLING HEAVY METAL AND MODELLING HEAVY METAL AND HC CONCENTRATIONS IN MARINE HC CONCENTRATIONS IN MARINE
SEDIMENTSSEDIMENTS
Michele Scardi & Eugenio Fresi
Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy
skip
Variabili predittive
• Latitudine• Longitudine• Profondità (log)• Sabbie (%)
• Distanza dalla costa• Distanza della
batimetrica dei 200 m dal punto più vicino della linea di costa
• Frequenza ponderata delle diverse tipologie del profilo di costa (3 variabili)
• Composizione delle argille (4 variabili)
skip
53
Correzione dei dati di concentrazione
I dati per i quali il tipo di attacco era riportato in maniera esplicita sono stati corretti secondo le indicazioni prodotte dalla campagna sperimentale.
Ad esempio
Cromo
y = 1.0824xR2 = 0.9791
0
50
100
150
200
0 50 100 150 200
Attacco parziale (µg/g p.s.)
Atta
cco
tota
le (µ
g/g
p.s.
)
Distanza minima del punto dalla costa
E’ una misura indiretta (se rapportata alla profondità del punto, dunque) dell’andamento batimetrico medio.
D
54
Distanza del punto più prossimo della costa dalla batimetrica dei 200 m
Esprime l’andamento batimetrico medio dell’area indipendentemente dalla profondità del punto considerato.
D200
200
Frequenza delle tipologie del profilo di costa nell’intorno del punto
Le tre tipologie riconosciute sono funzione delle differenze fra profilo emerso e sommerso:
•concordante•poco discordante•molto discordante
Rmax= 20 mn
0.25
0.15
0.60
mn20
20)( DDDR +=
55
Influenza della tipologiadel profilo di costa
E’ stata definita una semplice relazione empirica che esprime l’influenza della tipologia del profilo di costa come funzione della distanza dalla costa.
D
mn20
20)( DDW −=
mn20
20)( DDW −= )()( DWDR ⋅
D D
x =
Influenza della tipologiadel profilo di costa
mn20
20)( DDDR +=
D
Quanto più èampio il raggio
di ricerca...
...tanto più è bassa l’influenza della tipologia
del profilo di costa.
Quindi la massima influenza si ha per
distanze intermedie.
56
Origine del sedimento superficialeSono state utilizzate come descrittricidell’origine dei sedimentile proporzioni medie in un raggio di 50 km diillite, smectite, caolinite e clorite nelle argille (dati derivati dalla letteratura).Laddove non sono disponibili dati vengono utilizzate le medie generali (0.56, 0.16, 0.15, 0.13 nell’ordine).
Trasformazione dei dati
log
Per:
• profondità
• concentrazioni degli inquinanti
57
Ni (r2=0.82)
Cd (r2=0.32)
58
Dai modelli preliminari a quelli finali
0%10%20%30%40%50%60%70%80%90%
100%
Cd Cr Cu Fe Hg IPA Mn Ni Pb PCB Zn
modelli finali modelli preliminari
varia
nza
spie
gata
Variazione di un profilo tipo in funzione della frazione di sabbie
45°20.00'N 14°30.00'E, profondità = 20 m
0
5
10
15
20
25
30
35
0 20 40 60 80 100
Sabbie (%)
Pb (p
pm)
59
SediViewData base
SediPredModelli
60
SediExpertData base + modelli + regole =
Stima della densitStima della densitàà ee della della produzione atteseproduzione attese inin praterie di praterie di Posidonia Posidonia oceanicaoceanica (L.) (L.) DelileDelile
Michele Scardi & Eugenio Fresi
Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy
skip
61
ID minimo massimoLAT 39.9 44.4LON 7.5 18.6
PROF 0 35GRAD 0 0.3
CONCESP 0 1CONCVENT 0 1
concavo CONC 0 1 piano PIANO 0 1 convesso CONV 0 1
RUNS 0 4APERTLIT 1 5ESPVENTI 0 1
sabbia SABBIA 0 1 roccia ROCCIA 0 1 matte MATTE 0 1 ancoraggio ANCOR 0 1 inquinamento INQUIN 0 1 immissioni IMMISS 0 1 dens ass media DENSASS 0 900 prod rizoma PRODRIZ 0 100
variabilelat. (gradi decimali)
long. (gradi decimali)profondità (m)
gradienteconcordanza esposizione
concordanza venti dominanti
conformazione profilo batimetrico
tipologia fondale
sorgenti di disturbo
variabili da predire
"apertura" litoraleruns variazione profilo
esposizione ai venti dominanti
{
{{{
Densità assoluta
0
100
200
300
400
500
600
700
800
900
1000
0 200 400 600 800 1000
valore osservato
valo
re s
timat
o
training set
test set
skip
62
Distribuzione degli scarti
Mediana 5%-95%
Rete neurale(MLP)
PLS-300
-200
-100
0
100
200
300
400fa
scim
-2
Produzione dei rizomi (stima diretta)
0
10
20
30
40
50
60
70
80
90
100
0 20 40 60 80 100
valore osservato
valo
re s
timat
o
training set
test set
63
Produzione dei rizomi (modello a cascata)
0
10
20
30
40
50
60
70
80
90
100
0 20 40 60 80 100
valore osservato
valo
re s
timat
o
training set
test set
Scarti della stima della produzione dei rizomi
Mediana 5%-95%
modellodiretto
modello"a cascata"
-40
-30
-20
-10
0
10
20
30
40
50
gm
-2an
no-1
64
-150 -100 -50 0 50 100 150
COGOLETO-ARENZANO
GALLINARA
MARATEA
MELORIA
MONTEROSSO AL MARE
MORTOLA
OTRANTO
PUNTA MANARA
S. MICHELE DI PAGANA
S. PIETRO (TA)
SANTA MARINELLA
TALAMONE
TERRACINA
TREMITI
VADA
VENTOTENE
differenza fra densità stimata e densità osservata
densità osservata maggiore di quella attesa
densità osservataminore di quella attesa
65
10 metri454 ciuffi m-2
21.4 g PS m-2 anno-1
66
0% 100% 200% 300% 400% 500% 600% 700% 800%
P RO F
E S P V E NTI
LA T
RUNS
G RA D
CO NCV E NT
INQ UIN
M A TTE
S A B B IA
LO N
CO NCE S P
A P E RTLIT
RO CCIA
P IA NO
CO NV
A NCO R
CO NC
IM M IS S
va ria z ion e M S E
Analisi di sensibilità del modello: densità assoluta
67
The Third Primary Production AlgorithmRound-Robin (PPARR3)
http://oceans-www.jpl.nasa.gov/bio/PrimaryProd/index.html
Un’esercizio di comparazione dei modelli globali di produzione primaria
fitoplanctonica
Partecipanti:
68
The NN PP model is based on:
• The OPPWG global data set from OPPWG(Institute of Marine and Coastal Sciences at Rutgers University,New Brunswick, NJ, USA)
• The F029 and F049 data sets(N.O.A.A. National Oceanographic Data Center,Silver Spring, MD, USA)
• A time series from the Gulf of Naples, Italy(Stazione Zoologica ‘A. Dohrn’ of Naples)
• Other models(VGPM by B&F, Howard-Yoder, MOD-27 by Esaias)
69
Metamodeling
N.B. The observed data have been filtered and unlikely patterns have
been excluded (e.g. where the P/B ratio was
too large).
N.B. Estimates at each point are based on real
predictive data, but other estimates have been also generated by changing each predictive value within a given range.
Predictive (input) variables:
• Lat latitude• sinLon 1/2[sin(2π⋅(Longitude+180)/360)+1]• cosLon 1/2[cos(2π⋅(Longitude+180) /360)+1]• sinDay 1/2[sin(2π⋅JulianDate/365)+1]• cosDay 1/2[cos(2π⋅JulianDate/365)+1]• DL day length• I0 surface downwelling PAR• log(MLD) log-transformed mixed layer depth• SST sea surface temperature• Pb
opt’ measured or estimated after B&F• log(Chl) log-transformed surface chlorophyll
70
X1 , X2 , … , Xm PP
f(X1 , X2 , … , Xm ) PP
f(X1 , X2 , … , Xm ) PP
f(X1 , X2 , … , Xm ) PP
f(X1 , X2 , … , Xm ) PP
X1 , X2 , … , Xm PP
X1 , X2 , … , Xm PP
X1 , X2 , … , Xm PP
... ...
... ...
#1
#2
#n
#1
#2
#n
X1 , X2 , … , Xm PP
X1 , X2 , … , Xm PP
X1 , X2 , … , Xm PP
... ...
... ...
... ...
training(50%
)validation
(25%)
test(25%
)
data
n =
2773
4 =
8320
0 / 3
mod
els
n=83
200
f(X1 , X2 , … , Xm ) PP
f(X1 , X2 , … , Xm ) PP
f(X1 , X2 , … , Xm ) PP
X1 , X2 , … , Xm PP
f(X1 , X2 , … , Xm ) PP
Metamodeling, i.e. modeling other models
n=227732
MSE=0.00156
R2=0.88
mean error=-0.0003
median error=-0.0001
-0.025<50% of errors<0.023
-0.063<90% of errors<0.064
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1
normalized PP(estimated by other models)
norm
aliz
ed P
P(e
stim
ated
by
the
NN
mod
el)
71
Checking the NN metamodel using an independent test data set
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1
normalized PP (observed)
norm
aliz
ed P
P (e
stim
ated
)
n=552
MSE=0.00248
R2=0.85
mean error=-0.004
median error=-0.005
-0.034<50% of errors<0.026
-0.082<90% of errors<0.084
72
Sensitivity analysis
+/- change in input Lat sinLon cosLon sinDay cosDay DL I0 log(MLD) SST PBopt' log(Chl)
1.0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 7% 4%
2.0% 0% 0% 0% 0% 0% 0% 1% 0% 0% 29% 17%
5.0% 1% 0% 0% 0% 0% 2% 5% 3% 1% 184% 105%
10.0% 4% 1% 0% 1% 0% 9% 18% 12% 4% 493% 417%
15.0% 8% 2% 1% 2% 1% 21% 36% 26% 8% 581% 921%
20.0% 13% 3% 1% 4% 1% 40% 59% 47% 13% 639% 1598%
25.0% 18% 5% 1% 5% 1% 68% 89% 75% 19% 686% 2415%
30.0% 25% 7% 2% 7% 2% 108% 121% 107% 26% 722% 3334%
40.0% 38% 10% 2% 10% 3% 221% 201% 172% 41% 763% 5246%
50.0% 52% 12% 3% 14% 4% 323% 302% 216% 56% 780% 6771%
73
IMPROVING A GLOBAL MODEL OF IMPROVING A GLOBAL MODEL OF PHYTOPLANKTON PRIMARY PHYTOPLANKTON PRIMARY
PRODUCTIONPRODUCTION
Michele Scardi
Dept. of Biology, Univ. of Roma “Tor Vergata”, Roma, Italy
skip
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180
-90
-60
-30
0
30
60
90
Phytoplankton primary production sampling sites
74
10
100
1000
10000
10 100 1000 10000
observed values (mg C m-2 day-1)
neur
al n
etw
ork
outp
ut (m
g C
m-2
day
-1)
Predictive variables:• surface biomass
• surface irradiance
• surface temperature
• date*
• longitude
• latitude
* 2 variables, i.e.
7-7-1 NN
⎥⎦
⎤⎢⎣
⎡+⎟⎠⎞
⎜⎝⎛ ⋅
= 1365
2cos21
1daydate π
⎥⎦
⎤⎢⎣
⎡+⎟
⎠⎞
⎜⎝⎛ ⋅
= 1365
2sin21
2daydate π
A global model of phytoplankton primary productionA global model of phytoplankton primary production((ScardiScardi, 2000), 2000)
Depth affects PP via:Depth affects PP via:
•• water column water column dynamics dynamics
•• upwelling regionsupwelling regions
•• coastal frontscoastal fronts
•• nutrient dynamicsnutrient dynamics
•• freshwater runfreshwater run--offoff
•• etc.etc.
Water column depth as a coWater column depth as a co--predictor for primary productionpredictor for primary production
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
-8000 -6000 -4000 -2000 0
mean depth (m)
PP (m
g C
m-2 d
ay-1)
75
•• Phytoplankton surface biomass (as Phytoplankton surface biomass (as ChlChl concentration)concentration)
•• Surface irradianceSurface irradiance
•• Surface temperatureSurface temperature
•• LatitudeLatitude
•• LongitudeLongitude
•• DateDate
•• Average depth Average depth
•• St. dev. of depthSt. dev. of depth
•• Day lengthDay length
⎥⎦
⎤⎢⎣
⎡+⎟⎠⎞
⎜⎝⎛ +⋅
= 1365
180(2sin21
2longitudelongitude π
⎥⎦
⎤⎢⎣
⎡+⎟⎠⎞
⎜⎝⎛ ⋅
= 1365
2cos21
1daydate π
⎥⎦
⎤⎢⎣
⎡+⎟
⎠⎞
⎜⎝⎛ ⋅
= 1365
2sin21
2daydate π
⎥⎦
⎤⎢⎣
⎡+⎟
⎠⎞
⎜⎝⎛ +⋅
= 1365
180(2cos21
1longitudelongitude π
1.251.25°° Lon x 0.75Lon x 0.75°° Lat windowLat window
Primary production predictors and coPrimary production predictors and co--predictors:predictors:
76
77--77--1 NN model1 NN model((ScardiScardi, 2000), 2000)
1111--1414--1 NN model1 NN model(with bathymetric(with bathymetricpredictive copredictive co--variables)variables)
1
10
100
1000
10000
1 10 100 1000 10000
observed PP (mg C m-2 day-1)
estim
ated
PP
(mg
C m
-2 d
ay-1)
1
10
100
1000
10000
1 10 100 1000 10000
observed PP (mg C m-2 day-1)
estim
ated
PP
(mg
C m
-2 d
ay-1)
training andvalidation
testing
MSE=330233MSE=330233MSE=405117MSE=405117
The largest The largest improvementsimprovements
in square error occurred in square error occurred within this rangewithin this range
(2257 out of 2522 cases)(2257 out of 2522 cases)
0.0E+00
5.0E+07
1.0E+08
1.5E+08
2.0E+08
2.5E+08
<100
100-
500
500-
1000
1000
-200
0
2000
-300
0
3000
-400
0
4000
-500
0
>500
0
observed PP (mg C m-2 day-1)
sum
of s
quar
e er
rors
7-7-1 NN model 11-14-1 NN model (with co-predictors)
190
676
897
544
14
42
14
19
1
10
100
1000
10000
1 10 100 1000 10000
observed PP (mg C m-2 day-1)
estim
ated
PP
(mg
C m
-2 d
ay-1)
training andvalidation
testing
The 7The 7--77--1 NN model performed 1 NN model performed slightly better than the 11slightly better than the 11--1414--1 1
NN model with coNN model with co--predictors predictors only when PP>5000 mg C monly when PP>5000 mg C m--22
dayday--11
77
0
100
200
300
400
500
600
700
-400
0
-200
0
-100
0
-500
-250
-125 0
125
250
500
1000
2000
4000
Mor
e
output error
n. o
f cas
es
7-7-1 model 11-14-1 model
-1-2daym C mg 250<error7-7-1
11-14-1
0% 25% 50% 75%
1111--1414--1 NN model of phytoplankton primary 1 NN model of phytoplankton primary production: a sensitivity analysisproduction: a sensitivity analysis
100% 1000% 10000%
Chlorophyll
log[med(z)]
Latitude
Irradiance
f[sin(day)]
stdev(z)
f[cos(Longitude)]
f[sin(Longitude)]
Day length
Temperature
f[cos(day)]
relative MSE
78
1.1. CoCo--variablesvariables may help to may help to improve neural network output improve neural network output (i.e. predictions)(i.e. predictions)
2.2. Biological Biological constraintsconstraints damp damp variability in real systems as variability in real systems as well as in neural network well as in neural network modelsmodels
3.3. Data and knowledge (i.e. Data and knowledge (i.e. theoretical assumptions, other theoretical assumptions, other models, etc.) can be merged into models, etc.) can be merged into neural network neural network metamodelsmetamodels
USO COMBINATO DI DIVERSE USO COMBINATO DI DIVERSE TIPOLOGIE DI MODELLITIPOLOGIE DI MODELLI
Analisi della produttivitAnalisi della produttivitàà dello dello Stagno del Calich (Sardegna)Stagno del Calich (Sardegna)
79
0
2
4
6
8
10
12
gen apr lug ott
biom
assa
fito
plan
cton
(mg
CH
l m-3
)
0
20
40
60
80
100
120
140
160
180
biomassa zooplancton
(mg m
-3, peso secco)
fitoplancton zooplancton
0
200
400
600
800
1000
1200
1400
1600
gen apr lug ott
PP (m
g C
m-3
gio
rno-1
)
produzione primaria fitoplanctonica (PP, rete neuronale)produzione primaria fitoplanctonica (PP, misurata)
80
0
200
400
600
800
1000
1200
1400
1600
gen apr lug ott
PP (m
g C
m-3
gio
rno-1
)
0
2
4
6
8
10
12
14
16
18PS (m
g C m
-3 giorno-1)
produzione primaria fitoplanctonica (PP, modello analitico)produzione primaria fitoplanctonica (PP, rete neuronale)produzione primaria fitoplanctonica (PP, misurata)produzione secondaria zooplanctonica (PS)
0
750
1500
PP misurataPP rete neuronalePP modello analitico
giorni
PP [m
g C/(m
² gior
no)]
0 6 0 1 20 1 80 2 40 3 00 3 60 4 20 4 80
(1) c 'è ener g ia r esidua?(2) il poo l d i nu trie nti è com pletam en te sf ru t tato?(3) l'ef fic ienz a fo tosin tet ica è lim itata ?
gior ni
se la produzione misurata in campo è inferiore a quella attesa sulla base di uno o di entrambi i modelli, allora nel sistema è disponibile dell’energia residua che potrebbe (in via teorica) essere sfruttata
se la produzione stimata dal modello empirico (quindi, sulla base di biomassa, luce e trasparenza) èsuperiore alla produzione misurata in campo, allora l’efficienza fotosintetica del fitoplancton potrebbe essere limitata da una insufficiente disponibilità di nutrienti
se la produzione stimata dal modello analitico è superiore a quella misurata, allora è ipotizzabile l’esistenza di fattori limitanti di natura fisica (es. nuvolosità, torbidità stratificata, etc.) o biologica (es. composizione del fitoplancton, inefficiente fotoadattamento, etc.)
81
Produzione primaria fitoplancton240 g C m-2 anno-1
Produzione secondariazooplancton
0.8 g C m-2 anno-1
Produzione primaria fitobenthos60 g C m-2 anno-1
Produzione secondariamacrozoobenthos4.2 g C m-2 anno-1
Produzione secondarianecton
3 g C m-2 anno-1 (= 450 kg ha-1)
Produzione terziarianecton+macrozoobenthos+avifauna
0.8 g C m-2 anno-1 (= 120 kg ha-1)
Links utili
• Il mio sito web (reti neurali, analisi dati, etc.)http://www.mare-net.com/mscardi
• Progetto PAEQANNhttp://aquaeco.ups-tlse.fr/
• Modelling Community Structure in Freshwater Ecosystemshttp://www.springeronline.com/sgw/cda/frontpage/0,11855,4-40109-22-36347264-0,00.html
• Congressi International Society for Ecological Informaticshttp://www.isei3.org e http://www.isei4.org