Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de...

65
Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: [email protected] Laboratoire des Sciences du Climat et de l’Environnement CEA/CNRS/IPSL S ´ eminaire de Statistiques Appliqu ´ ees, Montpellier, 20 Mars 2006 Analyse des valeurs extr ˆ emes :Estimation de bornes pour la p ´ eriode de retour – p. 1/57

Transcript of Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de...

Page 1: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Analyse des valeurs extrêmes :Estimation de bornes pour la période de retour

Pierre Ribereau

e-mail: [email protected]

Laboratoire des Sciences du Climat et de l’Environnement

CEA/CNRS/IPSL

Seminaire de Statistiques Appliquees, Montpellier, 20 Mars 2006

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 1/57

Page 2: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Motivations

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 2/57

Page 3: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Motivation

• Objectifs : Produire des périodes de retour à Fort Collins.(Actuellement utilisation des atlas de 1973)

• Définition : La période de retour zt est le niveau que l’ons’attend à dépasser, en moyenne, une fois toutes les tannées.

• Bornes pour la période de retour ?

• Données de précipitations à Fort Collins de 1948 à 2001.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 3/57

Page 4: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Introduction

X1,n ≤ ... ≤ Xn,n

Comportement Moyen ⇒ TCL

Comportement “Extrême"

IP

(Xn,n − bn

an≤ x

)= Fn(an x + bn)

d−→ Hγ(x), n → ∞,

Hγ(x) =

exp(− (1 + γx)−

1

γ

)si γ 6= 0

exp(− exp(−x)

)si γ = 0

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 4/57

Page 5: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Convergence du max

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 5/57

Page 6: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Domaine d’attraction

γ > 0 Fréchet, distribution de type Pareto 1 − F (x) = x−1

γ ℓF (x),

Fréchet, Burr, Pareto...

γ = 0 Gumbel, queues à décroissance exponentielle.Lognormale, Normale, Exponentielle...

γ < 0 Weibull, X admet un point terminal fini,Weibull, ReverseBurr, Beta...

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 6/57

Page 7: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Deuxieme approche

• Fun(y) =

Fun(un + y) − F (un)

1 − F (un)

• supx∈[0,τF−un[

∣∣Fun(x) − Gγ,σ(un)(x)

∣∣→ 0, quand n → ∞.

• Gγ,σ(x) :=

1 −

(1 +

γ

σ

)−1/γsi γ 6= 0, σ > 0,

1 − exp(−x/σ) si γ = 0, σ > 0,

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 7/57

Page 8: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Approche POT

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17X18

X19

X20

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 8/57

Page 9: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Approche POT

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17X18

X19

X20

u

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 8/57

Page 10: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Approche POT

Y1

Y2

Y3

Y4

Y5

u

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 8/57

Page 11: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Approche POT

Y1

Y2

Y3

Y4

Y5

u

−> GPD

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 8/57

Page 12: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimation quantile extreme

• F−1(1 − p) := inf{y|F (y) ≥ 1 − p}

• de Haan (1984) CNS

limtց0

F−1(1 − tx) − F−1(1 − t)

a(t)=

x−γ − 1

γ

⇒ F−1(1 − p) ∼ F−1(1 − t) + a(t) (p/t)−γ−1γ

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 9/57

Page 13: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimation de l’indice des valeurs extremes

• Hill (1975) :HX,kn,n =1

kn

kn∑

j=1

log Xn−j+1,n − log Xn−kn,n.

• Moments (Dekkers et al., 1989)

MX,kn,n = HX,kn,n + 1 − 1

2

(1 −

H2X,kn,n

SX,kn,n

)−1

où SX,kn,n =1

kn

kn∑

j=1

(log Xn−j+1,n − log Xn−kn,n

)2,

• Pickands (1975)

PX,kn,n =1

log 2log

Xn−⌊ kn4⌋,n − Xn−⌊ kn

2⌋,n

Xn−⌊ kn2⌋,n − Xn−kn,n

,

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 10/57

Page 14: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateurs de Hill, Pickands et Moments

0 50 100 150 200

0.0

0.5

1.0

1.5

2.0

k

ind

ice

0 50 100 150 200

0.0

0.2

0.4

0.6

0.8

k

MS

E(a) (b)

(a) Medians et (b) erreurs en moyenne quadratique empiriques des estimateurs de Hill (trait plein), des

moments (tirets) et de Pickands (traits pointilles) bases sur 500 echantillons de taille 500 de loi Frechet (1).

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 11/57

Page 15: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimation de (γ, σ) de la GPD

• Méthode des moments

γMOM =1

2

(1 − x2

s2

)et σMOM =

1

2x( x2

s2+ 1),

• Maximum de vraisemblance

log L(γ, σ) = −n log σ − 1 + γ

γ

n∑

i=1

log(1 +

γXi

σ

).

• MP et MPG

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 12/57

Page 16: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimation de quantiles extremes

• xp = F−1(1 − p) = inf {y : F (y) ≥ 1 − p}• Weissmann (1978)

xHp,k := Xn−k,n

(k + 1

(n + 1)p

)HX,k,n

.

• Moments (Dekkers et al., 1989)

xMp,k = Xn−k,n + a

(k

n

) ( knp)MX,k,n − 1

MX,k,n

a(k

n

)= Xn−k,nHX,k,n max(1 − MX,k,n, 1).

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 13/57

Page 17: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

Fu(x) ≈ Gγ,σ(u)(x)

• X1,X2, ...,Xn ⇒ Seuil u ⇒ Nu excès Yj ⇒ σ et γ

• Comme F (x) = F (u) × F u(x − u) si x > u alors

F (x) =nu

n

(1 + γ

x − u

σ

)−1/γ

⇒ Par inversion xp = u + σ

(Nu

np

)bγ− 1

γ

• En pratique u = Xn−k,n, donc pour p < kn

xPOTp,k := Xn−k,n + σPOT

k

(k

np

)bγP OTk

− 1

γPOTk

.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 14/57

Page 18: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17X18

X19

X20

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 19: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

X(5)

X(7)

X(1)

X(19)

X(13)

X(11)

X(3)

X(14)

X(17)

X(4)

X(8)

X(6)

X(20)

X(16)

X(2)

X(18)

X(10)X(9)

X(15)

X(12)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 20: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

X(5)

X(7)

X(1)

X(19)

X(13)

X(11)

X(3)

X(14)

X(17)

X(4)

X(8)

X(6)

X(20)

X(16)

X(2)

X(18)

X(10)X(9)

X(15)

X(12)

X15

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 21: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

Y1

Y2

Y3

Y4

Y5

X15

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 22: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

Y1

Y2

Y3

Y4

Y5

X15

⇒ σ et γ

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 23: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateur POT

Y1

Y2

Y3

Y4

Y5

X15

⇒ σ et γ

xPOTp,k := Xn−k,n + σPOT

k

(k

np

)bγP OTk

− 1

γPOTk

.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 15/57

Page 24: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Simulations

Comparaisons entre:• Estimateur des moments (rouge)• Estimateur de Weissman (bleu)• Estimateurs POT ML (vert) et MPG (noir)

Figures (a): Medians

Figures (b): MSE adaptées : MSE∗(xp) := E

(log

xp

xp

)2

Droite horizontale = vraie valeur du paramètre avec p = 1/10n etn = 50 ou 100Distributions:

• Burr (β, τ, λ)

• Lognormal (µ, σ)

• ReverseBurr (β, τ, λ, τF )

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 16/57

Page 25: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Burr (1, 12 , 2) avec n = 50

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 17/57

Page 26: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Burr (1, 12 , 2) avec n = 100

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 18/57

Page 27: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Lognormale (0, 1) avec n = 50

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 19/57

Page 28: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Lognormale (0, 1) avec n = 100

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 20/57

Page 29: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

ReverseBurr (1, 8, 1/2, 10) avec n = 50

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 21/57

Page 30: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

ReverseBurr (1, 8, 1/2, 10) avec n = 100

(a) (b)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 22/57

Page 31: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Periode de retour : Exemple

1950 1960 1970 1980 1990 2000

010

020

030

040

050

060

070

0

1997

• Période de retour = zt = F−1(1 − 1/t)

• Quelle est la valeur que l’on peut s’attendre à dépasser aucours de t années ?

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 23/57

Page 32: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Objectifs

• TVE basée sur des arguments asymptotiques : Quid avecn = 53

• TVE pas applicable pour des variables discrètes.

• Solutions : Proposer des bornes faciles à calculer ayant debonnes propriétés.

• Pas d’hypothéses sur la queue de distribution

⇒ bornes pas forcément proches de zt (scénario catastropheraisonnable).

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 24/57

Page 33: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Outil : Inegalite de Markov

F (z) ≤ IE[h(X)]

h(z)

→ Exemples :• Borne de Chernoff avec h(z) = exp(λz) et λ ≥ 0 :

infλ≥0

{e−λz

∫eλxdF (x)

}

• Moment bound avec h(z) = zn et n ≥ 0 :

infn≥0

IE(Xn)

zn

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 25/57

Page 34: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Borne

• Dans notre cas, on choisit h(z) = u(z)v(F (z)) avec :

(u, v) : IR+ × [0, 1] → IR+ × IR+

• Θ(u, v) := IE[h(X)] = IE[u(X)v(F (X))] (GPWM)

• Si u(x) = xs et v(x) = xr → MP

• zt défini comme F (1/t) = zt alors :

zt ≤ bt(u, v) := u←[

tΘ(u, v)

v(1 − 1/t)

]où u ↑ v ↑

⇒ zt ≤ inf{bt(u, v) : u(.) et v(.) croissantes }

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 26/57

Page 35: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Autre borne

• v croissante et u décroissante

Θ∗(u, v) = IE[u(X)v(F (X))1l(X ≤ zt)]

+IE[u(X)v(F (X))1l(X > zt)]

= T1 + T2

T1 ≤ u(zt)v(1/t)

tT2 ≤ [Θ∗(up, vp)]1/p (1 − 1/t)1/q

zt ≤ b∗(u, v) = u←[t

Θ∗(u, v) − (1 − 1/t)(1 − 1/p) [Θ∗(up, vp)]1/p

v(1/t)

]

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 27/57

Page 36: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Borne inferieure

• v(.) décroissante et u(.) croissante

T2 ≤ (1 − 1/t)u(zt)v(1/t) et T1 ≤ t−1/q[Θ∗(up, vp)

]1/p

zt ≥ l∗t (u, v) = u←[

Θ∗(u, v) − t1/p−1 [Θ∗(up, vp)]1/p

v(1/t)(1 − 1/t)

]

zt ≥ sup

{

l∗t (u, v) : u(.) ≥ 0, v(.) ≥ 0, u(.) ↑, v(.) ↓ et p > 1

}

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 28/57

Page 37: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Estimateurs

• Comme Θ(u, v) = E[u(X)v(F (X))]

Θn(u, v) =1

n

n∑

i=1

u(Xi)v(Fn(Xi))

Θn(u, v) =1

n

n∑

i=1

u(Xi,n)v

(i

n

)

⇒ L-statistiques.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 29/57

Page 38: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Theoreme 1 : convergence en distribution

Si v(.) est lipschitzienne d’ordre 1 sur [0, 1] et u(.) est telle que∫|u(x)|dF (x) et

∫v2(F (x))u2(x)dF (x) sont finis alors

√n(θn(u, v) − θ(u, v))

converge en distribution vers une variable gaussienne centréede variance

σ2 = E

(

−v(U)u(F←(U))+θ(u, v)−∫ 1

0

(1l(U ≤ t)−t

)v′(t)u(F←(t))dt

)2

,

où U suit une loi uniforme sur (0, 1).

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 30/57

Page 39: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Theoreme 2 : convergence ps

θn(u, v) = θ(u, v) + O

(√log log n

n

)

presque sûrement

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 31/57

Page 40: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Theoreme 3 : vitesse de convergence en proba

Si u ∈ C1(0,∞) et v ∈ C1[0, 1] sont des fonctions positives etcroissantes telles que u(0) = 0 et

u′(x) = O(xa−1), pour x grand et a > 0.

Supposons que F vérifient

xa−1 [F (x)]3

2−ζ−ν

f(x)= O(1), pour ζ ∈ (0, 1) et ν ∈

(0,

1

4

), quand x → ∞.

Alors, il existe un pont brownien B tel que quelque soitβn = o

(nmin(ν,ζ)

), on a

βn

[√

n(θn(u, v)−θ(u, v)

)+∫∞0 u′(x)B(F (x))v(F (x))dx

]

= oP(1)

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 32/57

Page 41: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Intervalles de confiance

Théorème 1 + Méthode Delta ⇒

√n(bt(u, v)−bt(u, v)

)d−→ N

(0,

t2σ2

v2(1 − 1t )

[(u←)′

( tθ(u, v)

v(1 − 1t )

)]2)

,

bt(u, v) = u←[

tθn(u, v)

v(1 − 1/t)

]

bt(u, v) ∈[

bt(u, v) ± q1−α/2 t bσ√n v(1− 1

t)(u←)′

(tbθn(u,v)v(1− 1

t)

)]

où σ est la version empirique de σ et q1−α/2 le quantile d’ordre1 − α

2 de la loi normale centrée réduite.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 33/57

Page 42: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Simulations

zt ≤ inf

{u←[

tΘ(u, v)

v(1 − 1/t)

]: u(.) ↑ and v(.) ↑

}

zt ≥ sup

{

u←[

Θ∗(u, v) − t1/p−1 [Θ∗(up, vp)]1/p

v(1/t)(1 − 1/t)

]

: u(.) ↑ and v(.) ↓}

• Ici, u(x) = xa et v(x) = xb pour la borne supérieure etu(x) = xa et v(x) = x−b pour la borne inférieure.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 34/57

Page 43: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Simulations

• Distributions :

◦ Frechet avec γ = 0.25◦ Valeur absolue de la loi normale centrée réduite◦ Beta de paramètres 3 et 4◦ Binomiale de paramètres 100 et 0.8◦ Poisson de paramètre 10

• 500 répétitions pour n = 50 et n = 500

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 35/57

Page 44: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Frechet γ = 1/4 avec n = 50

0 50 100 150 200 250 300

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

02

46

810

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 36/57

Page 45: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

MSE pour la Frechet γ = 1/4 avec n = 50

050

100

150

200

0.00

0.02

0.04

0.06

0.08

0.10

0 50 100 150 200 250 300

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 37/57

Page 46: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Frechet γ = 1/4 avec n = 500

400 500 600 700 800 900 1000 1100

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

05

1015

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 38/57

Page 47: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

MSE pour la Frechet γ = 1/4 avec n = 500

020

4060

8010

0

0.00

0.02

0.04

0.06

0.08

0.10

400 500 600 700 800 900 1000 1100

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 39/57

Page 48: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

|Normale| avec n = 50

0 50 100 150 200 250 300

01

23

4

01

23

4

01

23

4

01

23

40

12

34

01

23

40

12

34

01

23

40

12

34

01

23

40

12

34

01

23

40

12

34

01

23

40

12

34

01

23

4

01

23

4

01

23

4

01

23

4

01

23

4

0

12

34

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 40/57

Page 49: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

MSE pour la |Normale| avec n = 50

01

23

4

0.0

0.1

0.2

0.3

0.4

0 50 100 150 200 250 300

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 41/57

Page 50: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

|Normale| avec n = 500

400 500 600 700 800 900 1000 1100

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

01

23

45

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 42/57

Page 51: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

MSE pour la |Normale| avec n = 500

0.0

0.2

0.4

0.6

0.8

1.0

0.00

0.01

0.02

0.03

0.04

0.05

400 500 600 700 800 900 1000 1100

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 43/57

Page 52: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Beta(3,4)

avecn

=50

50100

150200

250

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.20.4 0.6 0.8 1.0 1.2

Analyse

desvaleurs

extremes

:Estim

ationde

bornespour

laperiode

deretour

–p.44/57

Page 53: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Beta(3,4)

avecn

=500

500600

700800

9001000

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

0.4 0.6 0.8 1.0 1.2

Analyse

desvaleurs

extremes

:Estim

ationde

bornespour

laperiode

deretour

–p.45/57

Page 54: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Poisson λ = 10 avec n = 50

50 100 150 200 250

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

1015

2025

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 46/57

Page 55: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Poisson λ = 10 avec n = 500

500 600 700 800 900 1000

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

1015

2025

30

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 47/57

Page 56: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Binom

iale(100,0.8)

avecn

=50

050

100150

200250

300

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 11070 80 90 100 11070 80 90 100 110

70 80 90 100 110

70 80 90 100 11070 80 90 100 110

70 80 90 100 110

70 80 90 100 110

Analyse

desvaleurs

extremes

:Estim

ationde

bornespour

laperiode

deretour

–p.48/57

Page 57: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Binom

iale(100,0.8)

avecn

=500

400500

600700

800900

10001100

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 11070 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

70 80 90 100 110

Analyse

desvaleurs

extremes

:Estim

ationde

bornespour

laperiode

deretour

–p.49/57

Page 58: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Exemple

• Données constituées de maxima

⇒ GEV

⇒ zt = µ − γ

ξ

[1 − (− log(1 − 1/t))−

bξ]• Intervalles de confiance :

• A partir du théorème 1 pour les bornes

• Avec le profile likelihood pour la GEV

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 50/57

Page 59: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Bornes estimees

50 100 150 200 250

200

400

600

800

1000

1200

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 51/57

Page 60: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Bornes estimees avant 1997

50 100 150 200 250

200

400

600

800

1000

1200

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 52/57

Page 61: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Autre exemple

• Nombre maximal de journées consécutives sans pluie paran

1950 1960 1970 1980 1990 2000

020

4060

80

1991

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 53/57

Page 62: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Bornes estimees

50 100 150 200 250

020

4060

8010

012

0

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 54/57

Page 63: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Bornes estimees avant 1991

50 100 150 200 250

020

4060

8010

012

0

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 55/57

Page 64: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Conclusions

• Bornes faciles à calculer• Méthode très générale, peut être appliquée aux mélanges

de loi, aux lois discrètes...• Valable pour toutes les valeurs de n et de t

• Les simulations semblent montrer qu’elles sont“compétitives"

Futurs extensions• Comment optimiser le choix de u et v ?• Comment étendre au cas stationnaire ?• Passer au cas multivarié?

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 56/57

Page 65: Analyse des valeurs extrêmes : Estimation de …Analyse des valeurs extrêmes : Estimation de bornes pour la période de retour Pierre Ribereau e-mail: pierre.ribereau@cea.fr Laboratoire

Bibliographie

• Beirlant et al. (2004) Statistics of Extremes: Theory and Applications.Wiley.

• Coles (2001) An Introduction to Statistical Modeling of ExtremeValues. Springer.

• Diebolt et al. (2005) Approximation of the distribution ofexcesses through a generalized probability weightedmoment method, Statist. Plann. Inference.

• Diebolt et al. (2005) Asymptotic normality of extremequantile estimators based on the peaks-over-thresholdapproach, soumis.

• Li et al. (2001) The law of the iterated logarithm and centrallimit theorem for L-statistics, J. Multivariate Anal.

• Diebolt et al. Return level bounds for extreme values, soumis.

Analyse des valeurs extremes :Estimation de bornes pour la periode de retour – p. 57/57