Méthodes statistiques pour l’évaluation du risque alimentaire · Jessica Tressou...
Transcript of Méthodes statistiques pour l’évaluation du risque alimentaire · Jessica Tressou...
Méthodes statistiques pour l’évaluation durisque alimentaire
Soutenance de thèse publiqueNanterre, le 9 décembre 2005
Jessica Tressou
INRA-Mét@risk, Méthodologies d’analyse de risque alimentaire, Paris
Discipline : Mathématiques Appliquées et Applications desMathématiques
Ecole Doctorale Connaissance et CultureUniversité Paris X, Nanterre
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Composition du Jury
Mme Sylvie Huet, Directeur de Recherche, INRA MIA,Jouy en Josas, RapporteurM. Hilko van der Voet, Senior Statistician, Biometris,Wageningen, Pays-Bas, RapporteurMme Judith Rousseau, Professeur, Université Paris IX,Paris, ExaminateurMme Karine Tribouley, Professeur, Université Paris X,Nanterre, ExaminateurM. Philippe Verger, Directeur de Recherche, INRAMét@risk, Paris, ExaminateurM. Patrice Bertail, Professeur, Université Paris X, Nanterre,Directeur de thèse
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Plan de la présentation
ContexteEvaluation de l’expositionCaractérisation du risque
Risque alimentaire et valeurs extrêmesEvaluation empirique du risqueIndividualisation et risque de long terme
Conclusions et perpectives
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
L’analyse de risque
Objectif de la thèse :Développer des outils statistiques pour l’évaluation du risque
alimentaire
Formalisme et vocabulaire des comités d’expertsL’évaluation de risque
L’identification et la caractérisation du dangerL’évaluation de l’expositionLa caractérisation du risque
Gestion du risqueCommunication du risque
Exemples : risque chronique, Ochratoxine A et Méthylmercure
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Evaluation de l’expositionNotations
P produits p = 1, ...,P
Qp : contamination du produit p, Lp analysesCp : consommation du produit p, n individusω : poids corporel de l’individu
⇒ Exposition d’un individu :
D =
∑Pp=1 QpCp
ω
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Les données pour l’évaluation de risque
Consommation alimentaireINCA : C = (C1, ...,CP)⇒ Corrélation
Contamination des aliments (Plans de surveillance)DGCCRF, DGAL,... : Q1, ...,QP
⇒ Indépendance, Censure
Qp = max (Qp,L), ∆p = I (Qp > L) , L = LOD,LOQ
Valeurs Toxicologiques de Référence (VTR)Dose Hebdomadaire Tolérable (DHT)Dose de Référence Aiguë (ARfD)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Modèles pour l’évaluation de l’exposition
"Déterministe"ParamétriqueSemi-paramétriqueNon paramétrique
⇒ Choix du modèle ?
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Caractérisation du risque
Risque aigu et/ou chroniqueContruction de la distribution d’exposition
Exposition aiguë : occasions de consommation etcontaminations variablesExposition chronique : consommation hebdomadaire totaleet contaminations fixes ou variables
Comparaison à une VTR relative au risque aigu / chronique
⇒ Estimation de la probabilité de dépasser la VTR
P(D > d = VTR)
Intérêt pour les queues de distribution
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Risque alimentaire et valeurs extrêmes (Chapitre 2)Ajuster une loi de type Pareto aux k plus grandes expositions
Loi de Pareto et domaine d’attraction de FréchetHypothèses et notations
(Di)i=1,...,n i.i.d. F.Statistique d’ordre (Di,n)i=1,...,n
Pour x "grand" : 1− F(x) = Cx−1/γ
Estimateur de HILL (1975) (MV cond. à K = k)
Hk,n =1k
k∑i=1
log(Dn−i+1,n)− log(Dn−k,n)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Estimation de l’indice de ParetoEMBRECHTS, KLÜPPELBERG & MIKOSCH (1999)
Hk,n =1k
k∑i=1
log(Dn−i+1,n)− log(Dn−k,n)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Estimation de l’indice de Pareto
Correction du biais par introduction d’une fonction à VL(FEUVERGER & HALL, 1999, BEIRLANT ET AL., 1999)
Définition (Fonction à variation lente (VL))
Pour tout t > 0,L(tx)L(x)
→ 1 quand x →∞
⇒ Nouvelles hypothèses :Pour x "grand" : 1− F(x) = Cx−1/γL(x)Puissance → HP : L(x) = 1 + Dx−β
Logarithme → Hlog : L(x) = (log x)θ
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Estimation de l’indice de Pareto
Théorème (Régression exponentielle)
Pour i = 1, ..., k : Zi = i(log(Dn−i+1,n)− log(Dn−i,n))
Zi ∼i.i.d.,HP
Eiγ exp
[D1
(in
)β1]
et Zi ∼i.i.d.,Hlog
Eiγ exp(
θ
log ni
)avec Ei ∼
i.i.d.Exp(1)
Arguments : Stat. d’ordre, Rep. de Rényi, DLEstimation de γ,D1 et β1 (γ et θ) par MV ∀k
Choix du nombre optimal de valeurs extrêmes
k∗ = arg mink>10
(γ2
kk
+ [Hk,n − γk]2), γ∗ = γk∗
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Risque alimentaire et valeurs extrêmes
Estimer 1− F(d = VTR)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Conclusions et perpectivesRésultats, limites, solutions ?
Chapitre 2 : Risque Alimentaire et Valeurs ExtrêmesQuantification de risques "empiriquement" nulsCaractérisation de sous-populations fortement exposées(Comparaison des P(D > d) ou γ = Γ(Z))Variabilité de la contamination et indépendance ?Quand la DHT n’appartient pas à la queue ?
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Risque alimentaire et valeurs extrêmesTRESSOU ET AL. (2004) Food Chem Tox
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Evaluation empirique du risque alimentaire (Chapitre 3)Notations et définition du paramètre à estimer
Paramètre d’intérêt :
θd (D) = PD
P∑p=1
QpCp > d
La vraie distribution d’exposition : D = C ×
∏Pp=1Qp,
Sa distribution empirique : Demp = Cn×∏P
p=1 QLp ,
Censure : < L → L,L/2, 0
θd (Demp) = PDemp
P∑p=1
QpCp > d
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Evaluation empirique du risque alimentaireEstimateur empirique
θd (Demp) =1
n×P∏
p=1Lp
n∑i=1
L1∑j1=1
. . .
LP∑jP=1
I
P∑p=1
qpjpci
p > d
Une U-statistique généralisée complète (LEE, 1990)Outil : Décomposition de HOEFFDING (1948)
Définitions (Gradients d’ordre 1 = des U-statistiques simples)
ψC(c) = E(I{∑P
p=1 QpCp > d}| C = c
)− θd (D)
ψQp(q) = E(I{∑P
p=1 QpCp > d}| Qp = q
)− θd (D)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Comportement Asymptotique
Théorème (Décomposition de Hoeffding)
θd (Demp)− θd (D)
=1n
n∑i=1
ψC(ci1, . . . , c
iP) +
P∑p=1
1Lp
Lp∑jp=1
ψQp(qpjp) + Rn,L1,...,LP
Théorème (Comportement asymptotique)
Si N = n +∑P
j=1 Lj,nN → η > 0 , Lj
N → βj > 0, et si lesvariances des gradients d’ordre 1 sont non toutes nulles, alorson a : √
N [θd (Demp)− θd (D)] Loi−→N→∞
N(0, S2)
avec
S2 =1η
V [ψC(C)] +P∑
j=1
1βj
V[ψQj(Q
j)]
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
En pratique
θd(Demp) ⇔ n×∏P
p=1 Lp = 1021 termes (OTA, P=9)
⇒ Version incomplète de la U-statistique :
θd,B (Demp) =1B
∑(i,j1,...,jp)∈L
I
P∑p=1
qpjpci
p > d
avec L = des indices tirés avec remise dans
{1, . . . , n} × {1, . . . , L1} × . . .× {1, . . . , LP}
Théorème (Tirage avec remise)
V [θd,B (Demp)] =σ2
1,1,...,1
B+
(1− 1
B
)V [θd (Demp)]
avec σ21,1,...,1 = V(ψC,Q1,...,QP(C,Q1, . . . ,QP))
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Intervalles de confiance (IC)
Validité du bootstrap (θd Hadamard différentiable)Exemple d’algorithme (1 niveau de bootstrap)
1 Etape d’estimation : θ = θd,B(Demp)2 Etape de rééchantillonnage : s = 1, . . . ,M.
1 Tirage avec remise de C(s) et Q(s)p , p = 1, . . . , P
2 Calcul de θd,B(s) sur C(s) et Q(s)
p , p = 1, . . . , P
3 IC "Basic Percentile" :[θ[α/2]d,B ; θ[1−α/2]
d,B
]4 IC "Percentile" :
[2θ − θ[1−α/2]
d,B ; 2θ − θ[α/2]d,B
]Intervalles de Confiance
IC Percentile, Basic Percentile ou Asymptotique (1 niveau)IC de type t-percentile (2 niveaux) cf. HALL (1986)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Estimation des variances
Rééchantillonage : Jackknife et Bootstrap (EFRON, 1979)Validité du Jackknife pour les U-Statistiques simples(ARVESEN, 1969)⇒ ψC : version incomplète de ψC
S2Jack =
1η
VJack
[ψC(C)
]+
P∑j=1
1βj
VJack
[ψQj(Q
j)]
Estimation de la variance du paramètre d’intérêt parbootstrap
S2Boot =
1M
M∑m=1
[θd,B
(m) − θd,B
]2
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Exemple : Ochratoxine ATRESSOU ET AL. (2004) Reg Tox Pharm ; BERTAIL & TRESSOU (2005) Biometrics
Substitution des < L Moyenne P95 P(D > DHT)
H1 : L 39.2 105.5 35.6% 32.8% - 39.8%
H2 : L/2 29.9 91.7 20.4% 15.9% - 23.7%
H3 : 0 18.2 81.7 12.2% 9.2% - 15.9%
IC "Basic Percentile"
⇒ Modélisation de la censure
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Modélisation de la censure (Chapitre 4)
Censure aléatoire à gauche
Définition (Estimateur de Kaplan Meier censure à gauche)
Ri =L∑
j=1
I(Qj = Q∗(i), δj = 1) Ni =L∑
j=1
I(Qj ≤ Q∗(i))
FKM(t) =k∏
i=1
(1− Ri
Ni
)I“
Q∗(i)>t
”Q∗(1) < . . . < Q∗(k)
La distribution produit des estimateurs de KAPLAN-MEIER
(1958) : D = Cn ×∏P
p=1 QLp
θd (D) estimé par θd
(D
)= P eD
(∑Pp=1 QpCp > d
)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Modélisation de la censureApproche similaire, outils différents (VAN DER VAART, 1998)
Théorème (Comportement asymptotique)
Si N = n +∑P
j=1 Lj,nN → η > 0 , Lj
N → βj > 0, et si lesvariances des gradients d’ordre 1 sont non toutes nulles, alorson a : √
N[θd
(D
)− θd (D)
]Loi−→
N→∞N
(0, S2
KM)
avec une décomposition de S2KM en termes de C et (Qp)p=1,...,P
Delta Méthode et Hadamard différentiabilité FKM et θd
(D
)Approximation de θd
(D
)par simulation
Estimation des variances et construction des IC parBootstrap & Double Bootstrap (PONS & TURKEIM, 1989,GILL, 1989)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Modélisation de la censureTRESSOU (2005) Soumis
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Conclusions et perpectivesRésultats, limites, solutions ?
Chapitres 3 et 4 : Evaluation empirique du risque alimentaireQuantification des risques et incertitudesValidation de techniques de Monte Carlo courammentutiliséesCaractérisation de sous-populations fortement exposéesEtude de l’impact de mesures de gestion du risqueLe logiciel Chronic and Acute Risk AssessmenT (CARAT)Censure aléatoire ?Proportion de "vrais" 0 (PAULO ET AL., 2005) ?
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Caractérisation du risqueUne limite pour le risque chronique
Consommation d’une semaine 6= Long Terme
⇒ Estimer la consommation individuelle de long terme
à partir de données individuelles de court terme (cf.Méthode de NUSSER ET AL., 1996)ou à partir de données de ménage sur longue période
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Individualisation et risque de long terme (Chapitre 5)
Données SECODIP : Achats des ménagesPrédiction des expositions indiv. hebdomadaires Di,h,t
Modèle d’individualisation inspiré de CHESHER (1997)
Définitions (Exposition cumulée)
Elimination du contaminant : δ = ln(2)/l1/2
Si,h,t = exp(−δ)Si,h,t−1 + Di,h,t =t∑
s=0
Di,h,s exp(−δ(t − s))
Risque de long terme et pseudo-VTR
Sref ,t =t∑
s=0
DHT exp(−δ(t − s))
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Le modèle d’individualisation
Ménages indépendants d’expositions yt,h
Pour l’individu i ∈ ménage h, semaine t :
yt,i,h = xt,i,hβ + zt,i,hu + wt,i,hγ +T∑
τ=1τ 6=τR
ατ I{τ=t} + εt,i,h,
cov(εt,i,h, εt,i′,h) = ρσ2, V(εt,i,h) = σ2 et 0 si h 6= h′ ou t 6= t′
Pour le ménage h de taille nh
Yt,h =(
yt,h√nh
)= Xt,hβ + Wt,hγ + Zt,hu + δt,hα+ εt,h
⇒ Modèle linéaire mixte et Maximum de VraisemblanceRestreint (RUPPERT ET AL., 2003)
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Individualisation et risque de long termeALLAIS & TRESSOU (2005) Doc. de Travail
Le cas du méthylmercure : l1/2 = 6 semaines, DHT=1.6 µg/sem/kg pc
0
5
10
15
20
25
30
35
40
0 10 20 30 40 50 60
semaine
Exp
osit
ion
cum
ulée
au
MeH
g
PminP05P25P50P75P90P95P975P99P999Pmaxref
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Conclusions et perpectivesRésultats, limites, solutions ?
Chapitre 5 : Individualisation et risque de long termeModèle dynamique très innovant pour le risque alimentairePrédictions du modèle d’individualisation trop incertainesModèle de type Tobit : prédiction des zérosFormalisation du modèle dynamique d’exposition : modèlede ruine/stockage
Xt =∑
n≤N(t)
En −∫ t
s=0r(Xs)ds
Combinaison des différentes approches
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Conclusion Générale
Données ⇒ Outils spécifiquesExtrêmes, Censure, IndividualisationRisque Chronique / AiguNouveau domaine d’application des statistiquesDiscussions pluri-displinaires indispensablesPerspectives principales
Modèle de ruine/stockage (bioaccumulation)Collaboration avec A. Lo, HKUSTClassification des queues de courbes d’exposition
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
MERCI de votre attention
Questions
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Références I
BEIRLANT, J., DIERCKX, G., GOEGEBEUR, Y. & MATTHYS,G. (1999). Tail index estimation and an exponentialregression model. Extremes 2, 177–200.BERTAIL, P. & TRESSOU, J. (2005). Incompletegeneralized U-Statistics for food risk assessment. Aparaître dans Biometrics A paraître.CHESHER, A. (1997). Diet revealed ? : Semiparametricestimation of nutrient intake-age relationships. Journal ofthe Royal Statistical Society A 160, 389–428.EMBRECHTS, P., KLÜPPELBERG, C. & MIKOSCH, T. (1999).Modelling Extremal Events for Insurance and Finance.Applications of Mathematics. Berlin : Springer-Verlag.FEUERVERGER, A. & HALL, P. (1999). Estimating a tailexponent by modelling departure from a ParetoDistribution. Annals of Statistics 27, 760–781.
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Références II
GILL, R. D. (1989). Non and semi parametric maximumlikehood estimators and the von Mises method.Scandinavian Journal of Statistics 16, 87–128.HALL, P. (1986). On the bootstrap and confidenceintervals. Annals of Statistics 14, 1431–1452.HILL, B. M. (1975). A simple general approach toinference about the tail of a distribution. Annals of Statistics3, 1163–1174.LEE, A. J. (1990). U-Statistics : Theory and Practice, vol.110 of Statistics : textbooks and monographs. New York,USA : Marcel Dekker, Inc.NUSSER, S., A.L. CARRIQUIRY, A., DODD, K. & FULLER,W. (1996). A semiparametric transformation approach toestimating usual intake distributions. Journal of theAmerican Statistical Association 91, 1440–1449.
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Références III
PAULO, M. J., VAN DER VOET, H., M. J. W. JANSEN, A. C.J. F. T. B. & VAN KLAVEREN, J. D. (2005). Riskassessment of dietary exposure to pesticides using abayesian method .PONS, O. & TURCKEIM, E. (1989). Méthodes de vonMises, Hadamard différentiabilité et bootstrap dans unmodèle non paramétrique sur un espace métrique.C.R.A.S.S. 308, 369–372.RUPPERT, D., WAND, M. P. & CARROLL, R. J. (2003).Semiparametric regression. Cambridge Series in Statisticaland Probabilistic Mathematics. Cambrige University Press.TRESSOU, J. (2005). Non parametric modelling of the leftcensorship of analytical data in food risk exposureassessment (Document de travail soumis).
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Références IV
TRESSOU, J., CRÉPET, A., BERTAIL, P., FEINBERG, M. H.& LEBLANC, J. C. (2004a). Probabilistic exposureassessment to food chemicals based on extreme valuetheory. application to heavy metals from fish and seaproducts. Food and Chemical Toxicology 42, 1349–1358.TRESSOU, J., LEBLANC, J. C., FEINBERG, M. & BERTAIL,P. (2004b). Statistical methodology to evaluate foodexposure and influence of sanitary limits : Application toOchratoxin A. Regulatory Toxicology and Pharmacology40, 252–263.VAN DER VAART, A. W. (1998). Asymptotic Statistics.Cambridge Series in Statistical and ProbabilisticMathematics. United Kingdom : Cambridge UniversityPress.
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire
Pot de thèse
Le pot de thèse se déroulera dans le bâtiment GSalle E26 bis
Merci à l’équipe MODALX
Jessica Tressou Méthodes statistiques pour l’évaluation du risque alimentaire