Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de...

47
Le forage de données (Data Mining), une approche pour adresser la complexité dans les grandes bases de données liées au vieillissement Maimouna Bagna, Ingénieure, M.Sc.,PhD

Transcript of Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de...

Page 1: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Le forage de données (Data Mining), une

approche pour adresser la complexité dans les

grandes bases de données liées au vieillissement

Maimouna Bagna, Ingénieure, M.Sc.,PhD

Page 2: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Plan de la présentation

1. Qu’est-ce que le Forage de données?

2. Forage de données vs Statistiques

3. Processus du Forage de données

4. Exemple: Caractérisation de profils de vieillissement

– NuAge

– ESCC-Vieillissement en santé

5. Perspectives

2017-04-24

Page 3: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Qu’est-ce que le Forage de données?

Data mining / knowledge discovery:

• Ensemble de processus et de méthodes utilisant des

techniques de statistiques et d’intelligence

artificielle pour identifier et extraire de l’information

et des connaissances nouvelles et utiles (patrons) à

partir de grandes quantités de données.

2017-04-24

Page 4: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Pourquoi le Forage de données?

• De plus en plus de données sont collectées et stockées

• Ces données constituent une mine d’or pour les entreprises (marketing) et la recherche (santé)

• Exemple: Peut-on prédire un comportement d’achat, des perturbations climatiques, un diagnostique en examinant les données préexistantes?

• Beaucoup de domaines d’applications possibles

• Avènement de méthodes puissantes de calcul et de processeurs réduisant le coût et le temps de calcul

• En recherche, spécialement en médecine, il y a beaucoup de bases de données qui restent inexploitées

2017-04-24

Page 5: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Forage de données Vs Statistiques

2017-04-24

En statistique :

– Analyse primaire des données

– Quelques centaines d’individus, quelques variables

– Fortes hypothèses de départs (lois statistiques)

– Importance accordée au calcul (Statistiquement significatif)

– Analyses axées par hypothèses

En Forage de données

– Analyse secondaire des données

– Des millions d’individus, des centaines de variables

– Données existantes (sans hypothèse préalable)

– Nécessité de calculs rapides (mégadonnées)

– Corpus d’apprentissage (génération de nouvelles hypothèses)

Page 6: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Processus du Forage de données

2017-04-24

Intégration de données

Bases de données ou fichiers

Données Pré-traitées

Données intéressantes

Sélection

Forage de données

Evaluation de patrons

Nettoyage de données

expert

analyste

décideur

Préparation

Modélisation

Évaluation

Déploiement

Étape la plus longue

Page 7: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Préparation des données

• Réduction de variables

• Données manquantes

• Valeurs aberrantes

• Duplication

• Discrétisation (catégorisation)

• Transformation de variables (Z-transform,

[0,1],…)

2017-04-24

Page 8: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

• Classification

– Analyses par grappes (Cluster Analysis)

• Partitionnement (k-means, k-medoid, PAM),

• hiérarchique ( Agglomérative, divisive, Ward dendrogram)

– Classification (SVM, k-nn, SOM)

• Prédiction

– Règles d’association (market basket rules)

– Analyse discriminante

– Régressions (linéaire, logistique)

– Arbres de décision

– Réseaux de neurones

– ..etc. 2017-04-24

Modèles

Page 9: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Évaluation

1. Choix du modèle ( Est-ce le meilleur modèle?)

2. Performance du modèle (efficacité de prédiction, classification)

3. Visualisation des résultats (représentation intuitive)

4. Interprétabilité des résultats ( Ce que mon modèle me suggère a-t-il du sens?)

5. … retour à l’étape 1 ( processus itératif).

6. Pour les besoins de la recherche: Reproductibilité et généralisation ( Est-ce que je peux tirer les mêmes conclusions avec une autre méthode? Avec une autre base de donnée?)

2017-04-24

Page 10: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Déploiement

• Le déploiement se fait de concert avec les experts

(les chercheurs)

• Quelles sont les nouvelles connaissances acquises?

• Ces connaissances sont-elles utiles?

• A-t-on généré de nouvelles hypothèses?

• Quelles conclusions peut-on en tirer?

• Quelles actions doit-on prendre?

• Doit-on recommencer le processus?

2017-04-24

Page 11: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Exemple d’ application:

Caractérisation de Profils de

vieillissement

Page 12: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Mise en Contexte

• Population de plus en plus âgée

• Demande accrue d’interventions et soins de

santé

• Coûts de santé de plus en plus élevés

• Une seule approche n’est pas bonne pour tous

• Approches de plus en plus centrées sur le

patient

• Les individus vieillissent différemment

Page 13: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Mise en Contexte

• Le processus de vieillissement est donc très

hétérogène!

• Cependant dans cette hétérogénéité, il existe

certains patrons répétitifs

• Comment comprendre cette hétérogénéité et

distinguer ces patrons sachant que le

processus de vieillissement est très

multifactoriel?

Page 14: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

ObjectifsAge

Genre

IMC

GDS

SMAF

QOL

PASE

SPA

……

Former des sous-groupes reflétant des profils distincts de vieillissement i.e

des sous-groupes de population dont les individus dans le même groupe sont

très proches les uns des autres en termes de leur processus de vieillissement

mais très différents des individus des autres groupes

A priori on ne connaît pas:

• Le nombre de profils distincts

• La composition des sous-groupes

• Les sous-groupes dominants

• La particularité de chacun des sous-groupes

Bref,…… aucune hypothèse a priori

Page 15: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Objectifs

1) Identifier des profils distincts de

vieillissement chez les hommes et chez les

femmes

2) Caractériser ces profils selon plusieurs co-

variables

3) Identifier les profils à risque de fragilité

Page 16: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Méthodes

1) Méthodes K-means pour l’analyse par

grappes (clustering) des individus et

l’identification des profils de vieillissement

2) Analyse des co-variables pour la

caractérisation des profils de vieillissement

3) Analyse de survie sur la fragilité pour

l’identification les profils à risque

Page 17: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Données 1: NuAge

• N=1793 participants, âgés de 68+, 940 F (52,4%) , 4 temps de mesure annuels (T1,T2,T3,T4)

• 3 catégories de variables:

– Analyses par grappes (variables centroîdes)

– Caractérisation des sous-groupes (co-variables ou caractéristiques)

– Facteurs de risque (outcomes) pour l’analyse de survie ( ici fragilité)

Page 18: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Variables centroîdes

• 26 variables de type continu, liées à 10 domaines du vieillissement sont initialement choisies, candidates à l’analyse: – Anthropométrie

– Performance physique

– Pression artérielle

– Qualité de vie (SF-36)

– Autonomie (SMAF)

– Activité physique (PASE)

– Dépression (GDS)

– Cognition (3MS)

– Participation sociale (DSC)

– Risque nutritionnel (DNA)

Page 19: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Co-variables

• Variables sociodémographiques– Age

– État civil

– Situation de vie (Vivre seul ou pas)

– Nombre d’années de scolarité

– Revenu

– Tabac

• Autres – Nombre de maladies

– Maladies chroniques

– Nombre de médicaments

Page 20: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Outcome (Fragilité)

• Fragilité selon les critères de Fried (2001)1) Perte de poids non-intentionnelle (10 lbs et + en 1 an),

2) Fatigue ou épuisement déclaré (SF-36)

3) Faiblesse (force de préhension < 20% /âge & sexe)

4) Vitesse de marche lente (<1m/s)

5) Faible activité physique (score PASE<20%/âge & sexe)

• Non Fragile = 0/5

• Pré-fragile (1-2)/5

• Fragile 3+/5

Deux catégories:

0= Non-Fragile

1= Pré-Fragile + Fragile

Page 21: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Méthode K-means1. Choisir k centres aléatoires

définis dans l’espace des données

2. Assigner chaque individu au centre le plus proche (en terme de distance, ici Euclidienne)

3. Recalculer de nouveaux centres représentant la moyenne des individus assignés par groupe

4. Si le critère de convergence (aucune réassignation d’individus) n’est pas atteint, retourner à l’étape 2

Page 22: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Méthodes

• 26 variables utilisées pour la classification

• List-wise deletion sur les données manquantes

• Z-transform sur toutes les variables

• Échantillon final

– T1, N= 679 hommes (H) et (Age: 74,22 ±4,1) et 709Femmes(F) (age: 74,45 ±4,2)

– T2, N = 609 H, 623 F

– T3, N= 539 H, 562F

– T4, N = 451H, 455F

Page 23: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Choix du nombre de groupes

• Basé sur des mesures internes et externes de

validation des clusters (Gini, DB, ARI,

Jaccard…)

– Faire varier le nombre k de clusters possible entre

2 et + (ici k varie de 2 à 16)

– Calculer les mesures internes et chercher des

minima ou maxima

– Calculer les mesures externes et trouver les

incréments de k résilients à la scission

Page 24: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Choix du nombre de groupesMesures internes Mesures externes

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

k2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Page 25: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Méthodes

• Procédure K-means

– K= 4

– Stratifié par sexe

– Randomisation X100

– Répéter pour chaque temps de mesure

(T1,T2,T3,T4)

Page 26: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats (H)

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

Hei

ght

Ssca

p

Sup

ra

MA

FA

MA

MA

TUP

5X

WSp

eed

MA

XV

MA

XQ

Syst

BP

Dia

stB

P

Hea

rtb

eat

SF-3

6 R

P

SF-3

6 V

T

SF-3

6 S

F

SF-3

6 R

E

SF-3

6 P

F

SF-3

6 B

P

SF-3

6 G

H

SF-3

6 M

H

SMA

F

PA

SE

GD

S

3M

S

SPA

ENS

Men centroids T2

Healthiest

High BMI

Less healthy

At risk

Healthiest n=272 (44.7%) mean±SE

Age 73.48 ± 0.25

Years of scholar 12.56 ± 0.31

Income (X1000CND) 45.73 ± 1.5

BMI 25.81 ± 0.16

Less Healthy n=66 (10.8%) mean±SE

Age 75.88 ± 0.53

Years of scholar 11.24 ± 0.68

Income (X1000CND) 40.44 ± 2.83

BMI 26.18 ± 0.4

High BMI n=170 (27.9%) mean±SE

Age 72.86 ± 0.27

Years of scholar 12.11 ± 0.4

Income (X1000CND) 45.76 ± 1.84

BMI 30.98 ± 0.28

At Risk n=101 (16.6%) mean±SE

Age 76.06 ± 0.37

Years of scholar 10.8 ± 0.45

Income (X1000CND) 38.52 ± 2.27

BMI 27.96 ± 0.35

P< 0.001 Posthoc

Age 1,2≠3,4

Years of scholar 1≠4

Income (X1000CND) 2≠4

BMI 2,4≠all

Page 27: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats (H)

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

Hei

ght

Ssca

p

Sup

ra

MA

FA

MA

MA

TUP

5X

WSp

eed

MA

XV

MA

XQ

Syst

BP

Dia

stB

P

Hea

rtb

eat

SF-3

6 R

P

SF-3

6 V

T

SF-3

6 S

F

SF-3

6 R

E

SF-3

6 P

F

SF-3

6 B

P

SF-3

6 G

H

SF-3

6 M

H

SMA

F

PA

SE

GD

S

3M

S

SPA

ENS

Men centroids T2

Healthiest

High BMI

Less healthy

At risk

Healthiest n=272 (44.7%) mean±SE

SF-Physical Compo. 53.87 ± 0.28

SF-Mental Compo. 57.7 ± 0.25

Nb of diseases 2.49 ± 0.1

Nb of medication 3.43 ± 0.18

Less Healthy n=66 (10.8%) mean±SE

SF-Physical Compo. 45.88 ± 1.22

SF-Mental Compo. 42.28 ± 0.99

Nb of diseases 4 ± 0.28

Nb of medication 5.98 ± 0.5

High BMI n=170 (27.9%) mean±SE

SF-Physical Compo. 50.5 ± 0.48

SF-Mental Compo. 56.49 ± 0.4

Nb of diseases 3.21 ± 0.14

Nb of medication 4.56 ± 0.23

At Risk n=101 (16.6%) mean±SE

SF-Physical Compo. 44.84 ± 0.77

SF-Mental Compo. 57.92 ± 0.51

Nb of diseases 4.2 ± 0.19

Nb of medication 5.89 ± 0.31

P< 0.001 Posthoc

SF-Physical Compo. 1,2≠all

SF-Mental Compo. 3≠all

Nb of diseases 1,2≠all

Nb of medication 1,2≠all

Page 28: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats co-variables (H)

Chronic conditions

Arthritis 292 (47.95%) 95 (34,93%) 92 (54,12%) 67 (66,34%) 38 (57,58%) P<0.001

High Blood Pressure 307 (50.41%) 113 (41,54%) 106 (62,35%) 56 (55,45%) 32 (48,48%) P<0.001

Cardiovascular Disease 236 (38.75%) 88 (32,35%) 60 (35,29%) 53 (52,48%) 35 (53,03%) P<0.001

Diabet 90 (14.78%) 22 (8,09%) 30 (17,65%) 22 (21,78%) 16 (24,24%) P<0.001

Cancer 17 (2.79%) 3 (1,1%) 5 (2,94%) 4 (3,96%) 5 (7,58%) p=0.030

Total

n=609

Healthiest

n=272

(44.7%)

High BMI

n=170

(27.9%)

At risk

n=101

(16.6%)

Less Healthy

n=66

(10.8%)

P value

Page 29: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats 4 temps (H+F)

-0,60

-0,40

-0,20

0,00

0,20

0,40

0,60

0,80

1,00

Healthy Aging profils T3

T1

T4

T2

-2,50

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

Less Healthy aging profils

T3

T1

T4

T2

HF

Page 30: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

-1,00

-0,50

0,00

0,50

1,00

1,50

High BMI aging profilsT3

T1

T4

T2

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

AT risk aging profils

T3

T1

T4

T2

HF

Résultats 4 temps (H+F)

Page 31: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats-analyse de survie(fragilité)

Khi-deux ddl Sig.Log Rank (Mantel-Cox) 134,122 3 ,000

Khi-deux ddl Sig.Log Rank (Mantel-Cox) 187,296 3 ,000

Page 32: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats-survie-Modèles de Cox (H)

(fragilité)

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

ClusterHommes 101,976 3 ,000

High BMI ,272 ,097 7,877 1 ,005 1,312 1,085 1,587

At Risk ,621 ,087 51,198 1 ,000 1,861 1,570 2,207

Less Healthy ,895 ,096 86,373 1 ,000 2,448 2,027 2,956

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

ClusterHommes 82,152 3 ,000

High BMI ,235 ,098 5,715 1 ,017 1,265 1,043 1,533

At Risk ,554 ,093 35,446 1 ,000 1,739 1,450 2,087

Less Healthy ,858 ,100 74,099 1 ,000 2,358 1,940 2,866

age ,008 ,009 ,817 1 ,366 1,008 ,991 1,025

Revenue -,002 ,002 1,694 1 ,193 ,998 ,995 1,001

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

ClusterHommes 65,091 3 ,000

High BMI ,220 ,098 5,007 1 ,025 1,246 1,028 1,511

At Risk ,558 ,093 36,289 1 ,000 1,746 1,457 2,094

Less Healthy ,777 ,106 53,529 1 ,000 2,174 1,766 2,677

age ,004 ,009 ,225 1 ,635 1,004 ,987 1,021

nbpathos ,048 ,017 8,092 1 ,004 1,050 1,015 1,085

Reference = Healthy Profile

Page 33: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats-survie-Modèles de Cox (F)

(fragilité)Reference = Healthy Profile

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

clusterFemmes 139,728 3 ,000

High BMI -,007 ,098 ,005 1 ,943 ,993 ,819 1,204

At Risk ,580 ,087 44,897 1 ,000 1,786 1,507 2,116

Less Healthy ,877 ,090 95,203 1 ,000 2,404 2,016 2,867

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

clusterFemmes 123,489 3 ,000

High BMI ,013 ,102 ,016 1 ,898 1,013 ,830 1,236

At Risk ,588 ,093 39,663 1 ,000 1,800 1,499 2,162

Less Healthy ,900 ,096 88,790 1 ,000 2,460 2,040 2,966

age ,002 ,008 ,069 1 ,792 1,002 ,986 1,018

Revenue ,002 ,002 ,805 1 ,370 1,002 ,998 1,005

B

Erreur

standard Wald ddl Sig. Exp(B)

95,0% CI pour Exp(B)

Inférieur Supérieur

clusterFemmes 125,833 3 ,000

High BMI ,006 ,099 ,004 1 ,952 1,006 ,829 1,221

At Risk ,595 ,092 42,074 1 ,000 1,813 1,515 2,170

Less Healthy ,910 ,096 89,340 1 ,000 2,483 2,056 2,999

age ,003 ,008 ,113 1 ,737 1,003 ,987 1,018

nbpathos -,016 ,015 1,142 1 ,285 ,984 ,956 1,013

Page 34: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

CCHS-Healthy Aging

• Statistiques Canada(CIQSS) N= 30865

• 65 et +, N= 16369

• 15 variables (14 domaines)

• Échantillon final: N= 13966

• 5797 H (âge: 75,5 ± 0.1) et 8169 F (77,4 ±0,1)

• K=4 pour K-means

Page 35: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

Low support

AT Risk

Less Healthy

Healthier

Résultats CCHS-Healthy Aging (H)

Healthier (n=2604) (44.9%) mean±SE

Age 73.364 ± 0.140

BMI 26.499 ± 0.073

Income (index) 8.029 ± 0.063

Indice Santé générale 0.923 ± 0.002

Low support (n=873) (15.1%) mean±SE

Age 77.148 ± 0.280

BMI 26.089 ± 0.143

Income (index) 5.863 ± 0.093

Indice Santé générale 0.759 ± 0.008

Less Healthy (n=575) (9.9%) mean±SE

Age 79.167 ± 0.362

BMI 27.642 ± 0.230

Income (index) 6.548 ± 0.120

Indice Santé générale 0.341 ± 0.010

At Risk (n=1745) (30.1%) mean±SE

Age 76.591 ± 0.187

BMI 26.475 ± 0.107

Income (index) 6.865 ± 0.067

Indice Santé générale 0.792 ± 0.004

Page 36: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

Low support

At Risk

Less Healthy

Healthier

Résultats CCHS-Healthy Aging (F)

Healthier (n=3730) (45.7%) mean±SE

Age 75.807 ± 0.130

BMI 25.472 ± 0.073

Income (index) 6.460 ± 0.050

Indice Santé générale 0.909 ± 0.002

Low support (n=1723) (21.1%) mean±SE

Age 77.547 ± 0.195

BMI 24.851 ± 0.110

Income (index) 5.255 ± 0.058

Indice Santé générale 0.839 ± 0.004

Less Healthy (n=742) (9.1%) mean±SE

Age 77.957 ± 0.294

BMI 26.597 ± 0.226

Income (index) 4.959 ± 0.086

Indice Santé générale 0.391 ± 0.011

At Risk (n=1974) (24.2%) mean±SE

Age 80.079 ± 0.184

BMI 27.227 ± 0.131

Income (index) 5.643 ± 0.063

Indice Santé générale 0.581 ± 0.006

Page 37: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Discussion

• Nous avons identifié des profils distincts de vieillissement dans 2 populations différentes

• Il existe des profils plus en santé que d’autres

• A partir des profils nous avons pu prédire un facteur de risque (fragilité)

• Les profils de vieillissement reflètent des interactions complexes de plusieurs domainesdu vieillissement

• Nous étudions présentement les mécanismes de transition entre profils ( ceux-ci semblent être différents entre les hommes et les femmes)

Page 38: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Conclusion

• La caractérisation de profils de vieillissement permet de: – Découvrir différents profils de vieillissement intelligibles et

distincts

– Différencier les profils de vieillissement en regard de la santé des individus

– Suivre l’évolution de sous-groupes de population pour mieux comprendre les mécanismes sous-jacents de différents processus de vieillissement

– Découvrir les mécanismes de déclin et les profils à risque

– Et éventuellement… mieux prévoir, pour mieux adapter les soins, les approches préventives et la prise en charge générale de la personne âgée.

– Tout cela…. En en considérant le vieillissement dans une approche holistique

Page 39: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Remerciements

• Alan Cohen

• Shengrui Wang

• Hélène Payette

• Mélanie Levasseur

• Olivier Germain

expert

analyste

décideur

Page 40: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Merci!

``Laissons parler les données !’’

Page 41: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données
Page 42: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats-Transitions d’états T1-T4 (H)

Healthy

Less Healthy

High BMI At risk

27,6%

11,3%

13,4% 17,1%

22,9%

57,6%

65,7%68,0%

56,1%

16,5%

19,5%

Page 43: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats-Transitions d’états T1-T4 (F)

Healthy

Less Healthy

High BMI At risk

16,3%18,5%

11,0% 17,2%

24,1% 29,3%

11,0%

61,4%

51,2%75,2%

51,7%

Page 44: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats (F)

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

Hei

ght

Ssca

p

Sup

ra

MA

FA

MA

MA

TUP

5X

WSp

eed

MA

XV

MA

XQ

Syst

BP

Dia

stB

P

Hea

rtb

eat

SF-3

6 R

P

SF-3

6 V

T

SF-3

6 S

F

SF-3

6 R

E

SF-3

6 P

F

SF-3

6 B

P

SF-3

6 G

H

SF-3

6 M

H

SMA

F

PA

SE

GD

S

3M

S

SPA

ENS

Women centroids T2

Healthiest

High BMI

Less healthy

At Risk

Healthiest n=185 (29.7%) mean±SE

Age 72.41 ± 0.29

Years of scholar 12.08 ± 0.28

Income (X1000CND) 38.95 ± 1.86

BMI 26.01 ± 0.21

Less Healthy n=124 (19.9%) mean±SE

Age 75.64 ± 0.34

Years of scholar 11.53 ± 0.33

Income (X1000CND) 32.4 ± 1.86

BMI 28.05 ± 0.4

High BMI n= n=136 (21.8%) mean±SE

Age 73.9 ± 0.35

Years of scholar 11.38 ± 0.34

Income (X1000CND) 33.46 ± 1.68

BMI 31.44 ± 0.34

At Risk n=178 (28.6%) mean±SE

Age 75.29 ± 0.3

Years of scholar 10.85 ± 0.28

Income (X1000CND) 30.19 ± 1.53

BMI 24.39 ± 0.25

P< 0.001 Posthoc

Age 1,2≠all

Years of scholar 1≠4

Income (X1000CND) 1≠4

BMI all≠

Page 45: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats (F)

-2,00

-1,50

-1,00

-0,50

0,00

0,50

1,00

1,50

Hei

ght

Ssca

p

Sup

ra

MA

FA

MA

MA

TUP

5X

WSp

eed

MA

XV

MA

XQ

Syst

BP

Dia

stB

P

Hea

rtb

eat

SF-3

6 R

P

SF-3

6 V

T

SF-3

6 S

F

SF-3

6 R

E

SF-3

6 P

F

SF-3

6 B

P

SF-3

6 G

H

SF-3

6 M

H

SMA

F

PA

SE

GD

S

3M

S

SPA

ENS

Women centroids T2

Healthiest

High BMI

Less healthy

At Risk

Healthiest n=185 (29.7%) mean±SE

SF-Physical Compo. 53.03 ± 0.39

SF-Mental Compo. 56.68 ± 0.34

Burden of diseases 2.76 ± 0.12

Number of medication 3.77 ± 0.17

Less Healthy n=124 (19.9%) mean±SE

SF-Physical Compo. 37.9 ± 0.71

SF-Mental Compo. 48.18 ± 0.85

Burden of diseases 5.23 ± 0.2

Number of medication 6.33 ± 0.28

High BMI n= n=136 (21.8%) mean±SE

SF-Physical Compo. 46.48 ± 0.6

SF-Mental Compo. 56.81 ± 0.46

Burden of diseases 3.77 ± 0.16

Number of medication 5.22 ± 0.29

At Risk n=178 (28.6%) mean±SE

SF-Physical Compo. 50.02 ± 0.48

SF-Mental Compo. 54.53 ± 0.49

Burden of diseases 3.72 ± 0.17

Number of medication 5.3 ± 0.24

P< 0.001 Posthoc

SF-Physical Compo. all≠

SF-Mental Compo. 3,4≠all

Burden of diseases 1,3≠all

Number of medication 1,3≠all

Page 46: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Résultats co-variables (F)

Chronic conditions

Arthritis 390 (62.6%) 100 (54,05%) 83 (61,03%) 103 (57,87%) 104 (83,87%) P<0.001

High Blood Pressure 333 (53.45%) 79 (42,7%) 81 (59,56%) 89 (50%) 84 (67,74%) P<0.001

Cardiovascular Disease 228 (36.6%) 72 (38,92%) 42 (30,88%) 49 (27,53%) 65 (52,42%) P<0.001

Diabet 51 (8.19%) 10 (5,41%) 13 (9,56%) 13 (7,3%) 15 (12,1%) p=0.876

Cancer 19 (3.05%) 5 (2,7%) 3 (2,21%) 7 (3,93%) 4 (3,23%) p=0.255

Totaln=623

Healthiestn=185

(29.7%)

High BMIn=136

(21.8%)

At Riskn=178

(28.6%)

Less Healthyn=124

(19.9%)P value

Page 47: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données

Perspectives futures

• Une approche basée sur les Profils de vieillissement

permettra de:

– Proposer un cadre nouveau pour la recherche sur le

vieillissement et l’approche aux soins

– Développer une approche pluridisciplinaire intégrative

– Considérer le vieillissement dans une approche holistique

– Proposer de meilleurs approches préventives de santé

personnalisées

– Proposer des approches de soins mieux adaptées et plus

personnalisées

– …..tout en minimisant les coûts (recherche et santé)