Lecture d’article. Evaluation diagnostique

Click here to load reader

  • date post

    18-Jan-2016
  • Category

    Documents

  • view

    24
  • download

    0

Embed Size (px)

description

Lecture d’article. Evaluation diagnostique. F. Kohler Septembre 2007. Questions générales. Objectifs : Identifier le type d’article Critiquer la méthodologie Critiquer la présentation des résultats Critiquer les résultats et la discussion Évaluer les applications cliniques - PowerPoint PPT Presentation

Transcript of Lecture d’article. Evaluation diagnostique

  • Lecture darticle. Evaluation diagnostiqueF. Kohler Septembre 2007

  • Questions gnralesObjectifs :Identifier le type darticle Critiquer la mthodologie Critiquer la prsentation des rsultatsCritiquer les rsultats et la discussionvaluer les applications cliniquesCritiquer la forme de larticleCf autres cours gnraux Points dtaills spcifiques lvaluation diagnostique

  • Le type d'tude : Etudes comparatives ou non,Etalon orSries apparies/Sries non appariesEtudes longitudinalesRalises chez l'tre humain / in vivo.Rgles thiques et juridiques

  • Analyse dun article diagnostiqueLa mthodologie de l'tude : Le protocole d'tude permet de rpondre la question poseQuel protocole pour quel objectif dans une tude diagnostique?

    Vrifier que le protocole choisi correspond lobjectif de ltudeComparaison un talon or (gold standard GS)sries apparies = Le mme sujet bnfice de ltalon or et du test valuer. Attention au biais que peut procurer lentrainement exemple : exploration fonctionnelleEfficacit, utilitsSries non apparies = les sujets sont rpartis alatoirement en 2 ou n groupes. Attention la qualit de la randomisation et si possible travailler en aveugleETUDE CAS/TEMOINS

    Feuil1

    QUESTIONSPROTOCOLE

    Reproductibilit/VariabilitTransversal comparatif avec rptition de mesure

    Dtermination de la Sensibilit et SpcificitTransversal comparatif avec talon-or

    Etude d'efficacit/utilittude contrle randomise

    Stratgie diagnostiquetude contrle randomise ou arbre dcisionnel

  • Analyse dun article diagnostiqueLa mthode de slection des patients est-elle dcrite ?Les caractristiques des patients recruts pour l'tude, les critres dinclusion et dexclusion sont dterminants pour pouvoir juger la validit externe de l'tude, c'est--dire la capacit d'utilisation des rsultats en pratique quotidienne auprs d'une population peu slectionne.Cest eux qui permettent de rpondre la question Puis je utiliser ces rsultats dans ma pratiqueCf Biais de slection (constitution des groupes)Attention si il y a comparaison de deux tests dans plusieurs groupes diffrents au biais que peut entraner un stade diffrent de la maladie dans les groupes

  • La population tudieDfinition claire de la population cibleDfinition des critres dinclusion/exclusionDfinition de la population rellement tudieLa population tudie est elle reprsentative de la population cible ?La population tudie est elle reprsentative de la population de ma pratique ?Modalit de la rpartition entre les groupes ou qualit de lappariement si le sujet nest pas son propre tmoinsEffet de censure=> Biais de slection

  • Analyse dun article diagnostiqueLes caractristiques diagnostiques du test sont-elles calcules ou calculables ?Sensibilit se = a/(a+c) = test + chez les maladesSpcificit sp = d/(b+d) = test chez les non maladesEfficacit diagnostique = (a+d)/(a+b+c+d)Indice de Youden = se + sp -1Rapport de vraisemblance positif L = se / (1-sp) : L fois plus de chance davoir la maladie quand le test est positifRapport de vraisemblance ngatif l = (1-se)/spSi (a+c)/(b+d) = frquence de la maladieVPP = a/(a+b)VPN = d/(c+d)Courbe de ROC : dtermination de la valeur seuil, aire sous la courbe (AROC)Avec un intervalle de confiance

    MaladeNon MaladeTest +aba+bTest -cdc+da+cb+d

  • Analyse dun article diagnostiqueLe test tudi est-il compar un test de rfrence fiable et valid, dtermin a priori ?Lvaluation de la validit dun test se fait par comparaison avec un test diagnostique de rfrence reconnu par tous. Oui mais si ce gold standard ntait quen plaqu.Sil ny a pas de test de rfrence cela ncessite de dfinir le diagnostic recherch avec un faisceau d'arguments dont la validit doit avoir t value.

  • Exemple : Consquences dun gold standard (GS) pas si en or que celaDans la ralit, la prvalence de la maladie est de 0,10 (10%)Le gold standard nest pas parfait Il a une sensibilit de 0, 95 (95%) et une spcificit de 0,90 (90%)Le nouveau test a une sensibilit de 0,98 (98%) et une spcificit de 0,95 (95%)

    Malade Non Malade Malade Non Malade Gold standard + 9 500 9 000 Nouveau test + 9 800 4 500 Gold standard - 500 81 000 Nouveau test - 200 85 500 Total 10 000 90 000 Total 10 000 90 000

  • SuiteDans la pratique, la prvalence nest pas connue et lon considre comme malade tous ceux qui ont un gold standard positif. Le Gold standard fait croire que sur les 100 000 personnes il y a 18 500 malades= 9500 (vrais malades) + 9000 (non rellement malades), parmi lesquels le nouveaux test donne :9500 * 0,98 (= 9310 )+ 9000 * 0,05 (= 450) = 9760 Tests positifs9500 * 0,02 (= 190) + 9000 * 0,95 (= 8550) = 8740 Tests ngatifs Le Gold standard fait croire sur les 100 000 personnes quil y 81000 (vrais non malade) + 500 (faux non malade) = 81 500 non malades parmi lesquels le nouveaux test donne :81000 * 0,02 (=4050) + 500 * 0,98 (=490) = 4540 Tests positifs81000 * 0,95 (=76950) + 500 *0,02 (= 10) = 76960 Tests ngatifs

  • SuiteAu total le nouveau test apparat avec les caractristiques suivantes :Sensibilit = 0,52 (52%) Spcificit = 0,94 (94%)Attention : tout ce qui est jaune et qui brille nest pas de lor le nouveau test pourrait apparatre comme moins performant quun autre vis--vis ce GS alors que ce serait linverse.

    Malade (GS+)Non Malade (GS-)TotalNouveau Test + 9 760 4 540 14 300 Nouveau Test - 8 740 76 960 85 700 Total 18 500 81 500 100 000

  • Analyse dun article diagnostiqueLe terme normal est-il dfini ?La maladie doit tre clairement dfinie par le test de rfrence et par opposition la normalit mdicale. (cf biais de caractrisation)L'attribution d'un diagnostic est elle effectue partir d'un seuil dterminer (c'est le cas pour la valeur de marqueurs) au-del duquel la maladie est prsente avec une probabilit connue et accepte ? (cf Courbe de ROC)

  • Courbe de ROCNombre de sujets1 g/lSujets non diabtiquesSujets diabtiques2,1 g/lLimite L de la glycmie au-del de laquelle on dit le test positifP(T- / M+) = Faux ngatif=1- P(T+/M+) =1- SensibilitP(T+ / M-) = Faux positifs =1- P(T-/M-)= 1- Spcificit

  • Courbe de ROCPour chaque valeur de la limite L du critre quantitatif on a une valeur de la sensibilit et de la spcificit. On obtient ainsi 1 point de la courbe pour L donne. En faisant varier la limite L on obtient dautres points. La courbe joignant les points est la courbe de ROC.Les valeurs de sensibilit et spcificit en fonction de L peuvent tre obtenues par lobservation ou par la modlisation du phnomne par une loi de probabilit.Sensibilit1-Spcificit

  • Analyse dun article diagnostiqueLa frquence de la maladie dans l'chantillon tudi correspond-elle aux donnes pidmiologiques connues ?Si la frquence de la maladie est trs diffrente de celle rencontre en pratique dans votre population, vous ne pourrez pas utilisez les valeurs prdictives Exemple : frquence du paludisme en France / Afrique

  • Analyse dun article diagnostiqueLes caractristiques diagnostiques du test sont-elles calcules ou calculables ?Sensibilit se = a/(a+c) = test + chez les maladesSpcificit sp = d/(b+d) = test chez les non maladesEfficacit diagnostique = (a+d)/(a+b+c+d)Indice de Youden = se + sp -1Rapport de vraisemblance positif L = se / (1-sp) : L fois plus de chance davoir la maladie quand le test est positifRapport de vraisemblance ngatif l = (1-se)/spSi (a+c)/(b+d) = frquence de la maladieVPP = a/(a+b)VPN = d/(c+d)Courbe de ROC : dtermination de la valeur seuil, aire sous la courbe (AROC)Avec un intervalle de confiance

    MaladeNon MaladeTest +aba+bTest -cdc+da+cb+d

  • Intervalle de confianceLtude porte sur un chantillon. La sensibilit (ou tout autre paramtre) obtenue sur cette chantillon nest pas la vraie valeur, une tude sur un autre chantillon aurait donn une autre valeur. Toutes ces valeurs fluctuent autour de la vraie valeur du fait du hasard.On peut construire, autour de la sensibilit (ou des autres indices) un intervalle de confiance 95% cest--dire que 95 fois sur 100, cet intervalle contiendra la vraie valeur. Pour un pourcentage p, obtenu sur un effectif N de lchantillon (cas de la sensibilit),si N*p et N*(1-p) sont suprieur 5 la formule de calcul des bornes de cet intervalle est

  • Importance du rapport de vraisemblanceIl prsente trois avantages importants :1) il ne change pas avec la prvalence de la maladie. Il est un bon reflet de la valeur du test quel que soit le groupe de population auquel celui-ci est appliqu ;2) il est utilisable pour plusieurs niveaux de rsultats dun test. Pour chaque niveau, il procure une information diffrente qui permet dinterprter au mieux les rsultats du test ;L > 10 ou l < 0,1 Forte variation de la probabilit avant et aprs le testL entre 5 et 10 ou l entre 0,1 et 0,2 variation importanteL < 2 ou l > 0,5 faible intrt du test3) il permet de calculer de manire individuelle lintrt de raliser le test partir de la probabilit initiale de maladie du patient.Diagramme de Fagan permet sans calcul de dterminer la probabilit post-test partir de la prvalence (probabilit pr-test) et du rapport de vraisemblance

  • Source HAS

  • Analyse dun article diagnostiqueAnalyse des rsultats : Les rsultats sont ils analyses en aveugle ? (quand cest possible)Par exemple, y a-t-il comparaison en aveugle du test tudi et du test de rfrence ou lecture en aveugle dun examen dimagerie par un radiologue nayant pas ralis lexamen et/ou ne connaissant pas le diagnostic.

  • Y a-t-il significativit statistique ?Dans le cas de la comparaison de plusieurs mthodes,La diffrence minimale attendueLe risque alphaLe risque bta (ou la puissance = 1- bta)Sont ils prciss priori ?Ou un calcul de puissance postriori est- il effectu