Download - P R O B A B I L I T É S Formulaire Probabilités …€¦ · / n estimation statistique ! 2. hypothèses de modélisation: exemple en physique atomique. n. particules réparties

1Bernard CLÉMENT, PhD

MTH2302 Probabilités et méthodes statistiques

P R O B A B I L I T É S

Formulaire Probabilités VERSUS statistiques Espace de probabilités / fonction de probabilités■ Formules■ Comment attribuer les probabilités?■ Formules de dénombrement■ Probabilités: conjointes – conditionnelles – marginales■ Indépendance en probabilité■ Probabilité totale - Bayes Règles du pouce Poker

3Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

STATISTIQUES PROBABILITÉS

quoi data raisonnement / logique

comment observation modélisation& modélisation & hypothèses

quand a posteriori a prioriou après ou avant

où échantillon population

COMPARAISONCOMPARAISON

jeu de va et viens


DéfinitionsExpérience aléatoire = processus planifié répétable dont l’issue

(phénomène) ne peut être prédite avec certitude

Exemples: jet d’un dé / loterie 6/49 / tous les jeux hasard

taille d’un individu choisit au hasard dans un groupe

Dénouement : tout résultat ou issue la plus élémentaire possible: oiEspace d’échantillonnage = S : totalité tous les dénouements Événement : sous ensemble de l’espace d’échantillonnage2 événements mutuellement exclusifs (disjoints): aucun dénouement en commun

Espace de probabilités: espace d’échantillonnage S = { o1 , o2 , …, }

+ fonction P : S intervalle [ 0 , 1 ] 0 0,5 1

1. associe une probabilité pi à oi 0 ≤ p i ≤ 1 pi = Prob( {oi} )

2. ∑ pi = 13. P est une fonction additive sur S


Fonction de probabilitéS : espace de probabilité = totalité tous résultats possibles

E : événenent de S = sous ensemble de S

P( E ) nombre réel entre 0 et 1 appelé « probabilité de E »

fonction P doit satisfaire les propriétés suivantes :

1. 0 ≤ P ( E ) ≤ 1

2. P (S ) = 1 S est un évènement certain

3. { E 1 , E 2 , … , E k .. } événements définis sur S et

mutuellement exclusifs 2 à 2 : E i ∩ E j = { Φ } i ≠ j

P ( U E i ) = ∑ P ( E i ) P est additive



FORMULES { Φ } ensemble vide (évènement impossible) alors P ( { Φ } ) = 0 E ( ou E’) évènement complémentaire à E = non E alors

P (E) = 1 – P ( E )

P (E 1 U E 2) = P (E 1) + P (E 2) - P (E1 ∩ E 2)

E 1

E 2

E 1 ∩ E 2

E 1 ʗ E 2 alors P ( E 1 ) ≤ P ( E 2 )



FORMULES

E 1

E 2

E 1 ∩ E 2

P ( E 1 U E 2 U E 3 ) = P ( E 1 ) + P ( E 2 ) + P ( E 3 )

- P ( E1 ∩ E 2 ) - P ( E1 ∩ E 3 ) - P ( E 2 ∩ E 3 )

+ P ( E1 ∩ E 2 ∩ E 3 )

E 3 E 2 ∩ E 3

E 1 ∩ E 3

E 1 ∩ E 2 ∩ E 3



Comment attribuer des probabilités à oi ? .. 1. estimations basées sur les fréquences: on observe n fois le phénomène

pouvant se dénouer dans oi on obtient n i réalisations de oi dans laséquence observée

P ( E ) ≈ n i / n estimation statistique !

2. hypothèses de modélisation : exemple en physique atomique

n particules réparties au hasard dans m boîtes (cellules) m > nprobabilité de trouver 0 ou 1 particule dans n boîtes spécifiques est

= n ! / m n si particules différentiables (Maxwell-Boltzman )

= ( m – 1 ) ! n ! / (m + n – 1 ) ! part. non différentiables (Bose – Einstein)

= n ! ( m – n ) ! / m ! part. non diff. + jamais 2 part. par boîte (Fermi-Dirac)

rappel n! = n *(n-1)*(n-2) …. 3*2*10! = 1



Comment attribuer des probabilités à oi ?2. hypothèses de modélisation : un exemple en physique atomique

exemple numérique : n = 3 particules m = 5 cellules (boîtes)

arrangement |* | - | * | * | - | * = particule | | = cellule (boîte)probabilités: 6 /125 = 0,048 Maxwell Boltzman

1/35 = 0,029 Bose-Einstein1/10 = 0,100 Fermi-Dirac

3. postulat dérivé de l’observation de variables Y, X, ….(= données)

exemple

taille (grandeur)

d’individus (homes)

distribution normale

y=normal(x;0;1)

-3 -2 -1 0 1 2 30,0

0,1

0,2

0,3

0,4

0,5

0,6

4. Évaluation subjective (personnelle) : lien avec BAYES - page30quelle est votre évaluation de la probabilité d’avoir un Adans le cours MTH2302B?


10Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Règle Bayesutilisation

probabilité subjectivea priori

souvent employée

détails page 30

2ième guerre mondiale

filmThe Imitation Game

bio du mathématicien

Alan TURING

11

Dénouements équiprobables : « chances égales » si l’espace échantillonnal S est de taille finie N S = { o 1 , o 2 , …. o N } dénouements supposés équiprobables alors P( { oi } ) = 1 / N on met sur pied les conditions nécessaires mais la garantie jamais assurée Exemple Loto 6/49 12 juin 1982 au 12 juillet 2008 - 2554 tirages

Bernard CLÉMENT, PhD

Loto6/49 (12juin1982 au 12juillet2008) - 2554 tirages

3143

4734

4546

2740

4132

207

4221

330

136

3738

3926

339

2549

1219

1823

517

811

444

1635

2224

1329

1014

26

4828

15

numéro

0

50

100

150

200

250

300

350

400

450

No

of o

bs

réponse:

écarts sont non significatifs

364

plus fréquents

3 41043 40547 40534 40145 39146 390

moins fréquents

14 3412 3396 338

48 33528 32515 310

distribution équiprobable(modèle) donne 364,86 écarts significatifs?



Dénouements équiprobables : « chances égales » hypothèse souvent employée

on met sur pied les conditions nécessaires mais la garantie n’est jamais assurée …. si l’espace échantillonnal S est de taille finie N S = { o 1 , o 2 , …. o N }

dénouements o i sont supposés équiprobables alors P( { o i } ) = 1 / N

Conséquence : l’évaluation de probabilité d’ évènement repose sur

l’application des formules de dénombrement Principe multiplicatif : si A 1 ,A 2 ,…, A k sont des ensembles ayant

n 1 , n 2 , …, n k éléments : n 1 X n 2 X … X n k façons de composer

un ensemble B avec un élément de A 1 , un de A 2 ,…, un élément de A k

SI ON TIENT COMPTE DE L’ORDRE des résultats de l’obtention des tirages

Permutations : Pnn = n ! arrangements distincts de n objets

Arrangements : Ank = n ! / ( n – k ) ! arrangements de k objets parmi n

SI ON NE TIENT PAS COMPTE DE L’ORDRE (cas fréquent)

Combinaisons : Cnk = n ! / [ ( n – k ) ! k ! ] k objets distincts parmi n



Exemple loto 6/49 ordre pas tenu en compte combinaisons C49

6 = 49 ! / [ ( 49- 6) ! 6 ! ] = 13 983 816dénouements possibles

événements favorables pour gagner un lot $ nombre probabilité

6 sur 6 : C66 x C43

0 = 1 … 0,000 000 072

5 sur 6 +: C65 x C1

1 x C420 = 6 … 0,000 000 429

5 sur 6 : C65 x C42

1 = 252 … 0,000 018 029

4 sur 6 : C64 x C43

2 = 13545 … 0,000 968 620

3 sur 6 : C63 x C43

3 = 246 820 … 0,017 650 404

façons de gagner 260 624

façons de perdre 13 723 192 … 0,981 362 455

6

49 +

43

42



Exemple: essais de Bernoulli= phénomène avec seulement 2 résultats possibles

2 dénouements possibles S = « succès » E = « échecs »

On répète jusqu’à l’obtention du premier succès S

exemple : obtenir le chiffre 6 en lançant un dé à jouerp = 1/6 succès et 1- p = q = 5 /6 échec

1 P (S) = p2 P ( E S ) = q p3 P ( E E S) = q q p…………………………………..k P (E E E…E S) = qk – 1p

∑ qk – 1p = p ∑ q k – 1 = p / ( 1- q) = 1

distribution géométrique : vue plus loin

nombre moyen d’essais avant le premier succès: 1 / p



Exemple : contrôle qualité par échantillonnage

lot 100 pièces dont 5 sont non-conformes (défauts)

tirage échantillon 10 pièces au hasard

chaque pièce est soumise à un test destructif

supposons critère pour accepter le lot : contrôle qualité

E = aucune pièce non conforme dans l’échantillon P ( accepter lot ) = P(E) = ?

S l’espace échantillonnal contient C10010 échantillons possibles

E est défini par les C9510 x C5

0 échantillons favorables

P ( E ) = C9510 x C5

0 / C10010 = 0,584

exemple distribution hypergéométrique : vue plus loin



Probabilités : conjointe – conditionnelles – marginales

Exemple : assemblage de 2 composants

composant 1 : possibilité de 0 -1- 2 -3 défautscomposant 2 : possibilité de 0 -1- 2 -3 - 4 défauts

modèle proposé : probabilités pour l’assemblagedénouement = (i , j ) 20 cas

i = nombre défauts composant 1

j = nombre défauts composant 2

P (0, 0 ) = 0.5 assemblage sans défaut

P ( i, j ) = k / ( i + j ) si ( i, j ) = ( 0, 1), ….. (3, 4)

k = ?



i j i + j k / (i+j) Prob { (i , j) } = 0,0723 / (i + j) 0 0 0 -------- 0,5000 1 1 k / 1 0,072

0 2 2 k / 2 0,036

0 3 3 k / 3 0,024

0 4 4 k / 4 0,018

1 0 1 k / 1 0,072

1 1 2 k / 2 0,036

1 2 3 k / 3 0,024

1 3 4 k / 4 0,018

1 4 5 k / 5 0,014

2 0 2 k / 2 0,036

2 1 3 k / 3 0,024

2 2 4 k / 4 0,018

2 3 5 k / 5 0,014

2 4 6 k / 6 0,012

3 0 3 k / 3 0,024

3 1 4 k / 4 0,018

3 2 5 k / 5 0,014

3 3 6 k / 6 0,012

3 4 7 k / 7 0,010

somme k * 6,91 1.000

k * 6,91 = 0,500

k = 0,5 / 6,91

= 0,0723

= 0,500

(i, j) ≠ (0, 0)


fonction de probabilités CONJOINTES

(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 total

i = 0 0,500 0,072 0,036 0,024 0,018

i = 1 0,072 0,036 0,024 0,018 0,014

i = 2 0,036 0,024 0,018 0,014 0,012

i = 3 0,024 0,018 0,014 0,012 0,010

total 1,000

réécriture en tableau croisé



Probabilité conditionnelleP ( F | E ) probabilité que l’événement F se réalise

compte tenu de la contrainte « E s’est réalisé »il faut que P (E) > 0 dans S

E nouvel espace d’échantillonnage (référentiel) pour tous

les événements F à venir - on restreint l’espace d’observation

Résultat si E et F sont indépendants alors

E et F sont indépendants




Définition P ( F | E ) = P(F ∩ E) / P ( E ) aussi P ( E | F) = P(E ∩ F) / P ( F )donc P(E ∩ F) = P ( E ) P ( F | E ) = P ( F ) P ( E | F)

Définition E et F sont indépendants si P(E ∩ F) = P (E) P(F)


Exemple : suite

probabilités marginales

(i , j) j = 0 j = 1 j = 2 j = 3 j = 4 total

i = 0 0,5 0,072 0,036 0,024 0,018 0,651

1 0,072 0,036 0,024 0,018 0,014 0,165

2 0,036 0,024 0,018 0,014 0,012 0,105

3 0,024 0,018 0,014 0,012 0,010 0,079

total 0,633 0,151 0,093 0,069 0,055 1,000


méthode : sommation partielle


probabilités conditionnelles

j / i 0 1 2 3 4 total

0 0,768 0,111 0,056 0,037 0,028 1

1 0,438 0,219 0,146 0,109 0,088 1

2 0,345 0,223 0,172 0,138 0,115 1

3 0,305 0,229 0,183 0,153 0,131 1

chaque ligne distribution conditionnelle j / i

i / j 0 1 2 3 4

0 0,791 0,480 0,389 0,351 0,329

1 0,114 0,240 0,259 0,263 0,263

2 0,057 0,160 0,145 0,211 0,219

3 0,038 0,120 0,156 0,175 0,188

total 1 1 1 1 1

chaque colonne distribution conditionnelle i / j



Liens: conjointe – marginales – conditionnelles

conjointe marginales

méthode: sommation p( i ) = ∑ p ( i, j )j

p( j ) = ∑ p ( i, j )i

conjointe conditionnelles

conditionnelles p( i / j ) = p ( i, j ) / p ( j )

p( j / i ) = p ( i, j ) / p ( i )

conjointe + indépendance marginales

chemin inverse marginales conjointes ?oui si …. indépendance



Exemple: assemblage de 2 composants - indépendance?

i / j 0 1 2 3 4 p( i )

0 0,500 0,072 0,036 0,024 0,018 0,651

1 0,072 0,036 0,024 0,018 0,014 0,165

2 0,036 0,024 0,018 0,014 0,012 0,105

3 0,024 0,018 0,014 0,012 0,010 0,079

p ( j ) 0,633 0,151 0,093 0,069 0,055 1,000

p(0,0) = 0,500

p(i = 0) * p(j = 0) = 0,651 * 0,633 = 0,412

p(2,3) = 0,014

p(i = 2) * p(j=3) = 0,105 * 0,069 = 0,0072

NON


≠

≠


Exemple: quelle serait la distribution conjointe si

indépendance avec les mêmes marginales?

calcul : p(0,0) = 0,651 * 0,633 = 0,412 etc

i j 0 1 2 3 4 p( i )

0 0,412 0,098 0,061 0,045 0,036 0,651

1 0,105 0,025 0,015 0,011 0,009 0,165

2 0,066 0,016 0,010 0,007 0,006 0,105

3 0,050 0,012 0,007 0,005 0,004 0,079

p ( j ) 0,633 0,151 0,093 0,069 0,055 1,000


distribution conjointe avec indépendance


(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 p( i )

i = 0 0,412 0,098 0,061 0,045 0,036 0,651

i = 1 0,105 0,025 0,015 0,011 0,009 0,165

i = 2 0,066 0,016 0,010 0,007 0,006 0,105

i = 3 0,050 0,012 0,007 0,005 0,004 0,079

p ( j ) 0,633 0,151 0,093 0,069 0,055 1,000

(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 p( i )

i = 0 0,500 0,072 0,036 0,024 0,018 0,651

i = 1 0,072 0,036 0,024 0,018 0,014 0,165

i = 2 0,036 0,024 0,018 0,014 0,012 0,105

i = 3 0,024 0,018 0,014 0,012 0,010 0,079

p( j ) 0,633 0,151 0,093 0,069 0,055 1,000

modèle

original

modèle

indépendance

modèle le plus approprié?



(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 p( i )

i = 0 x11 x12 x13 x14 x15 0,651

i = 1 x21 x22 x23 x24 x25 0,165

i = 2 x31 x32 x33 x34 x35 0,105

i = 3 x41 x42 x43 x44 x45 0,079

p ( j ) 0,633 0,151 0,093 0,069 0,055 1,000

(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 p( i )

i = 0 0,500 0,072 0,036 0,024 0,018 0,651

i = 1 0,072 0,036 0,024 0,018 0,014 0,165

i = 2 0,036 0,024 0,018 0,014 0,012 0,105

i = 3 0,024 0,018 0,014 0,012 0,010 0,079

p ( j) 0,633 0,151 0,093 0,069 0,055 1,000

autres modèles

avec mêmes

marginales


modèle

original


résoudre système 9 équations linéaires20 inconnues x11, x12,…., x45

∑ x1j = 0,065 (1)∑ x2j = 0,165 (2)∑ x3j = 0,165 (3) ∑ x4j = 0,079 (4)

∑ xi1 = 0,633 (5)∑ xi2 = 0,151 (6)∑ xi3 = 0,093 (7) ∑ xi4 = 0,069 (8)∑ xi5 = 0,055 (9)

20 inconnues x i j

9 équations

infinité solutions


autres modèles

avec mêmes

marginales

(i, j) j = 0 j = 1 j = 2 j = 3 j = 4 p( i )

i = 0 x11 x12 x13 x14 x15 0,651

i = 1 x21 x22 x23 x24 x25 0,165

i = 2 x31 x32 x33 x34 x35 0,105

i = 3 x41 x42 x43 x44 x45 0,079

p ( j ) 0,633 0,151 0,093 0,069 0,055 1,000


exemple : modélisation avec indépendanceprototype véhicule fin de test (essai)

M1 : moteur OK M2 : moteur état moyen M3 : moteur état médiocre

probabilité = 0,6 = 0,3 = 0,1D1 : direction OK D2 : direction non opérationnelle

probabilité : = 0,8 = 0,2A1 : amortisseur OK A2 : amortisseur dégradé A3 : amortisseur briséprobabilité = 0,7 = 0,2 = 0,1

probabilités conjointes : hypothèse d’indépendance / 18 CAS

Mi ∩ Dj ∩ Ak prob M i ∩ Dj ∩ Ak prob M i ∩ Dj ∩ Ak prob1 1 1 0,336 2 1 1 0,168 3 1 1 0,0561 1 2 0,096 2 1 2 0,048 3 1 2 0,016 1 1 3 0,048 2 1 3 0,024 3 1 3 0,0081 2 1 0,084 2 2 1 0,042 3 2 1 0,014 1 2 2 0,024 2 2 2 0,012 3 2 2 0,004 1 2 3 0,012 2 2 3 0,006 3 3 3 0,002



Exemple (suite) :

Mi ∩ Dj ∩ Ak prob M i ∩ Dj ∩ Ak prob M i ∩ Dj ∩ Ak prob1 1 1 0,336 2 1 1 0,168 3 1 1 0,0561 1 2 0,096 2 1 2 0,048 3 1 2 0,016 1 1 3 0,048 2 1 3 0,024 3 1 3 0,0081 2 1 0,084 2 2 1 0,042 3 2 1 0,014 1 2 2 0,024 2 2 2 0,012 3 2 2 0,004 1 2 3 0,012 2 2 3 0,006 3 3 3 0,002

Fk : k composants sont fonctionnels k = 0, 1, 2, 3 P(Fk) = ?

P(F3) = P ( M1 ∩ D1 ∩ A1 ) = P( 111) = 0,336

P(F2) = P (112 ) + P( 113 ) + P (211) + P (311) = 0,452

P(F1) = P(122) + P(123) + P (212) + P(213) + P(221) + P(312) + P(313) + P( 321) =0,188

P(F0) = P(222) + P(223) + P (322) + P ( 323) = 0,024

P(F0) + P(F1) + P(F2) + P(F3) = 1

probabilités conjointes avec hypothèse d’indépendance



Formule probabilité totaleDéfinition : Partition de S

E 1 , E 2 , ….., E k sous-ensembles disjoints de S tels que

E 1 U E 2 U …..U E k = Salors les événements E 1 , E 2 , ….., E k forment une partition de Sremarque: un seul des E i peut se réaliser à la fois

Théorème : si k événements E i ( i = 1 ,2, … k ) forment une partitionet que F est un événement défini sur S alors

F = ( F ∩ E 1 ) U ( F ∩ E2 ) U …. U ( F ∩ E k ) = U (F ∩ E i )

E 1

E 2 E 3 E 10

P(F) = ∑ P(F ∩ E i ) = ∑ P( E i ) P ( F| E i )formule probabilité totale

F ∩ E 3

F


RÈGLE (formule, théorème) de Bayesk événements E i ( i = 1 ,2, … k ) forment une partition de SF est un événement défini sur S alors

P( E r | F) = P( E r ) P( F | E r ) / ∑ P( E i ) P ( F| E i )question événement F provient – il de E r ?

cause de F est-elle E r ?


remarque concernant Bayes dans les applicationsP(E i ) : probabilité a priori souvent type subjective

F : data observé (information)P (E i | F) : probabilité a posteriori ré évaluation de P(E i )

application couranteH = hypothèse proposée P(H) = probabilité subjectiveF = data P(data | H) selon un modèle statistique proposécalcul P(H | data) ré évaluation de P(H)peut s’appliquer itérativement plusieurs foisP(H | data) : nouvel a priori dans la deuxième application

Bayes : méthode pour la ré évaluationde l’information

Bayes : contribue à l’essorprobabilité subjective


Exemple 1 supposons que l’on teste une personne pour une maladie assez

rare : arrive dans la population disons environ 1% (prob. a priori)

test est précis à 95% : si vous avez la maladie, le résultat

est positif à 95%

Si le résultat du test est positif, probabilité d’avoir la maladie = ?

choix réponses proposées : 95% 85% 16% 1%

question posée à 100 individus, médecins, ingénieurs,…

résultat 50 sur 100 ont répondu 95%30 sur 100 ont répondu 1%10 sur 100 ont répondu 85%10 sur 100 ont répondu 16% ….. bonne réponse

comment on obtient cette bonne réponse de 16% ?

application de la formule de Bayes …



P (avoir la maladie si le test + ) = 0.95 x 0.01 / (0.95 x 0.01 + 0.05 x 0.99)

= 16% devient l’information a priori si on applique le test encore

Si on répète test deuxième fois et test = +

P (avoir la maladie si le test + ) = 0.95 x 0.16 / (0.95 x 0.16 + 0.05 x 0.84)

= 78%.

Test no Probabilité d’avoir la maladie1 16%2 78%3 98%4 99.9%

si test précis à 98% Test no Probabilité d’avoir la maladie1 33%2 96%3 99.9%4 99.9999%



Exemple 2 téléchargement de fichiers provenant de 3 sites WEBoccasionnellement les fichiers sont infectés

info site proportion chargée proportion infectésE1 10% 1,0%E2 20% 0,5%E3 70% 0,8%

on télécharge un fichier F qui s’avère infecté.on ne souvient plus de quel site on a téléchargé quel site doit-on soupçonné ?

Solution P(E1 l F) = ? P(E2 l F) = ? P(E3 l F) = ?

P(F) = 0,1*0,01 + 0,2*0,005 + 0,7*0,008= 0,001 + 0,001 + 0,0056= 0,0076

P(E1 l F) = 0,0010 / 0,0076 = 0,1315P(E2 l F) = 0,0010 / 0,0076 = 0,1315P(E3 l F) = 0,0056 / 0,0076 = 0,7368

E3 est le site le plus probable d’avoir causer l’infection



Exemple 3 courrier électroniquespam ou non-spam?

Thomas Bayes 1702-1761

hypothèses 100 messages - probabilité a priori10 classés « pourriel = spam » - 10%90 classés « OK » - 90%

message entrant analyse contenu mots clés

Question: risque nouveau message entrant soit un pourriel?nouveau message contient 60% de mots clés dans « spams »

80% de mots clés dans « OK »P(pourriel | message) = ?P(pourriel) = 10% P(OK) = 90%

P(message | pourriel) = 60% P(message | OK ) = 80%

P(pourriel | message) = P(pourriel) * P(message | pourriel)

P(pourriel)*P(message | pourriel) + P(OK)*P(message | OK) = 10 * 60) / (10*60 + 90*80) = 0,0769 .. 7,69% chance message = pourriel

Si hypothèse: 10% spam - 90% changée pour 50% spam et 50% OK alors P(pourriel | message) = 0,42 ... 42% de chance

que message = pourriel


Exemple 4 application médicaletest de diagnostic dépistage

Sensibilité et Spécificité :

performance du test

M : avoir la ‘maladie’M : ne pas avoir la ‘maladie’ (sains)T : avoir un résultat positif (+) au testT : avoir un résultat négatif (-) au test

M M (sains)

T = + n T M n T M

T = - n T M n T Mtotal n M n M

Sensibilité = n T M / n M = proportion de T = + parmi les malades

Spécificité = n T M / n M = proportion de T = - parmi les sains

faux positifs

faux négatifs


n représente des nombres


Exemple 4 suite

applique test ci-haut à un patient et résultat = T = + = positif

probabilité que le patient soit réellement malade?

pour répondre: faut connaitre la fréquence de la maladie Mdans la population = prévalence de la maladie

disons hypothèse : P(M) = 1 / 10 000 probabilité a priori d’avoir la maladieavant d’appliquer le test

On cherche P(M | T) = ? solution avec Bayes

M MT 950 10

T 50 990

Total 1000 1000

Performance du test

Sensibilité = 950 / 1000 = 0,95 = 95%

Spécificité = 990 / 1000 = 0,99 = 99%



Exemple 4 suite

probabilité a posteriori P (M T) ≈ 0,0194 fois plus grande que la probabilité a priori P(M) = 0,0001

Influence de P(M) prévalence avec sensibilité = 95% spécificité = 99%

P(M) = 1 / 1 000 000 1 / 100 000 1 / 10 000 1 / 1 000 1 / 100

P(M |T) = 0,00001 0,0009 0,0094 0,0868 0,4997

P(M |T ) / P(M) 10 000 900 94 87 50

Influence de P(M) prévalence avec sensibilité = 99% spécificité = 99%

P(M) = 1 / 1 000 000 1 / 100 000 1 / 10 000 1 / 1 000 1 / 100

P(M |T) = 0,0001 0,0010 0,0098 0,0901 0,5000



Exemple 5

Nate Silver

The real winner in the US elections: Thomas BayesSource : http://bayesian.org/forums/news/4105

As we all know, last night was the US presidential election. In one sense,President Obama was the winner. But in another sense, the real winner wasBayesian analysis, which scored a public relations coup.In 2008, Nate Silver developed a Bayesian model to forecast the U.S. general election results. He won fame for correctly predicting 49 of 50 states, as well as every Senate race.This brought him a New York Times column and a much higher profile.This time around, his consistent predictions that Obama was in front earnedhim a considerable backlash among pundits. While a few criticisms hadmerit, most were mathematically illiterate, indignantly mocking the ideathat the race was anything other than a tossup.In 2012 he has predicted all 50 states correctly.People with our quantitative background can easily find flaws with thismetric. For example, a majority of states were easy to call -- nobody issurprised by the results in Texas or California.More seriously, his "call" for Florida was a 50.3% probability, essentiallythe proverbial "coin toss". Serious analysis has to chalk Florida up to luck.Nevertheless, the broader point is that Nate's high-profile Bayesian modeljust experienced a very visible success. Even better, he recently authoreda book-length popular exposition of the Bayesian approach. I purchasedthat book, "The Signal and the Noise," on a recent flight. It's excellentreading: more technical than McGrayne's recent entry, but no lessaccessible or engaging.

FilmMoney Ball


http://bayesian.org/forums/news/4105


Recommendations et ‘règles du pouce’ (RP)

RP1 : ne pas multiplier les hypothèses au delà de la nécessité

base : simplicité et parcimonie

RP2 : ne pas multiplier les probabilités au delà de la nécessitébase : les probabilités sont bornées par 1 et l’opération

de multiplication donnera toujours un nombre plus petit

exemple: procès en 1964 à LA - vol d’une bourse en pleine rue

description du vol - Une femme blanche aux cheveux blonds

en queue de cheval arracha une bourse à une autre femme.

La voleuse courut et fut reconnue plus loin alors qu’elle

entrait dans une voiture taxi de couleur jaune conduite par

un homme de race noire portant une moustache et une barbe

QUELLE EST LA PROBABILITÉ DE L’ÉVÉNEMENT CI- HAUT ?



Avocat de la poursuite (couronne) proposa le calcul suivant :

événement probabilité produit probabilité

E1: cheveux blond 1 / 3 1 / 3

E2: cheveux en queue de cheval 1 / 10 1 / 30

E3: voiture couleur jaune 1 / 10 1 / 300

E4: homme portant barbe 1 / 10 1 / 3 000

E5: homme portant moustache 1 / 4 1 / 12 000

E6: couple inter race voiture 1 / 1000 1 / 12 000 000

E = E1 ∩ E2 ∩ E3 ∩ E4 ∩ E5 ∩ E6 1 / 12 000 000 = p

avec hypothèse d’indépendancerésultat : couple en accusation fut condamné car p est très petite !

verdict renversé en Cour d’Appel car introduction de plus en plus d’événements dans le calcul + indépendance





RP3 : préciser toujours l’espace d’échantillonnage afin d’énoncer un risque

base : un énoncé de probabilité repose sur l’espace d’échantillonnage sur lequel il s’applique;

Une probabilité est toujours conditionnelle.Soyez précis sur le référentiel de référence.

Question pertinente : quel est le groupe, quelles sont les unités, etc...

sur lesquels on énonce la probabilité ?

Exemple : selon un ouvrage sur l’évaluation des risquesil y a une probabilité 0,0006 de mourir dans un accident durant

l’ascension d’une montage.

On présume que le groupe de référence est : groupe des personnes qui font de l’ascension de montages.

mais la probabilité est 0 si vous n’en faites pas !



Poker On tire 5 cartes d’un jeu de 52 cartes à jouer - nombre de possibles : C525 = 2 598 560

ordre pas tenu en compte - identification des cartesSORTE: 2, 3, 4,…, 10, valet, dame, roi, as COULEUR : trèfle, carreau, cœur, pique

ÉVÉNEMENT nombre probabilité

PAIRE (2 cartes de la même sorte)1 sorte (2, 3,…, roi, as) parmi 132 couleurs parmi 43 autres cartes parmi 12 sortes restantes1 couleur parmi 4

C131C4

2C123C4

1 C41 C4

1= 13*6*220*4*4*4= 1 098 240

0,422 63

2 PAIRES (2 fois une paire)2 sortes parmi 132 couleurs parmi 4 pour chacune des paires5e carte parmi 44 restantes

C132C4

2C42C44

1= 78*6*6*44 = 123 552 0,047 50

BRELAN (3 cartes de la même sorte) C131C4

3C122C4

1C41

= 13*4*66*4*4 = 54 912 0,021 32

SÉQUENCE (5 sortes consécutivestoute couleur confondue) 9*(45 - 4) = 9 180 0,003 53

COULEUR (5 cartes de mêmecouleur sans les quintes)

- 9 : exclusion de 9 quintes

C41(C13

5 - 9)= 4*1278 = 5 112

0.001 97

MAIN PLEINE (Brelan + 1 paire) C131C4

3C121C4

1=13*4*12*6 = 3 744 0,001 44

CARRÉ (4 cartes de la même sorte) C131C4

4C121C4

1= 13*1*12*4 = 624 0,000 240

QUINTE non royale(5 sortes consécutives d’une même

couleur sauf quinte royale9*4 - 4 = 32 0,000 012

QUINTE ROYALE - (10, valet, dame,roi, as) d’une même couleur 4 0,000 002

CARTE ISOLÉE (rien de ce quiprécède)

2 598 960 - 1 098 240- 109 8240 - 123 552- 54 912 - 9180 - 5112- 3744 -32 – 4 = 1 303 164

0,501 50


Poker POKER nombre mains: 5 cartes parmi j eu de 52 = 2598560 p_prob = nombre / 2598560 rapport cotes = odd ratio = (1 + p_prob) / p_prob paiement casino = multiple de la mise

1événement

2nombre

3p _ p ro b

4rapportcotes

5paiementcasino

paire2 pairesbrelanséquencecouleurmain pleinecarréquinte nonroyquinte royautre

paire (pair) 1098240 0,422634 3 12 paires (2 pairs) 123552 0,047546 22 2brelan (3 of a kind) 54912 0,021132 48 3séquence (straight) 9180 0,003533 284 5couleur (flush) 5112 0,001967 509 8main pleine (full house) 3744 0,001441 695 10carré (four of a kind) 624 0,000240 4192 20quinte nonroy (straight flush) 32 0,000012 81206 50quinte roy (royal flush) 4 0,000002 649641 100autre 1303164 0,501495