Analyse de régression linéaire

16
ANALYSE DE RÉGRESSION LINÉAIRE Université Larbi Ben M’hidi, Oum El Bouaghi, Algérie Faculté des sciences de la terre et de l’architecture Prof. Adad Mohamed Chérif 2017 y=ax+ b

Transcript of Analyse de régression linéaire

Page 1: Analyse de régression linéaire

ANALYSE DE RÉGRESSIONLINÉAIRE

Université Larbi Ben M’hidi, Oum El Bouaghi, AlgérieFaculté des sciences de la terre et de l’architecture

Prof. Adad Mohamed Chérif 2017

y = a x + b

Page 2: Analyse de régression linéaire

LA RELATION DOIT ÊTRE LINÉAIRE. LES VALEURS SONT INDÉPENDANTES. LA DISTRIBUTION DE CHAQUE

VARIABLE SUIT UNE LOI NORMALE.

Conditions d’utilisation de l’analyse de régression

Trois conditions

Page 3: Analyse de régression linéaire

Principes de l’analyse de régression

La régression et la corrélation conviennent pour détecter une relation linéaire entre variables. Donc, la régression vise aussi à analyser l’association entre une variable dépendante(variable prédicteur) et une ou plusieurs variables indépendantes (variable à prédire) et à prédire la variable dépendante si la variable indépendante est connue .

y = a x + b

Equation de la droite

Page 4: Analyse de régression linéaire

Pour atteindre cet objectif, on doit se référer à l’équation de régression.

a: la pente b: la constantex: la variable indépendantey: la variable dépendante

y = a x + b

En termes plus clairs, la relation entre x et y est matérialisée par une ligne droite dont la pente est « a » .

Page 5: Analyse de régression linéaire

Cette équation de la droite exprime une relation linéaire entre x et y, la valeur de la variable dépendante (y) est fonction de la valeur de la ou des variable(s) indépendante(s) (x), y=f(x).

Donc, il y a 2 types de régression: Régression bivariée /une seule variable indépendante (x) est associée à une variable dépendante (y), Exemple: température intérieure(ti)=f[température extérieure,(te)], ti=a(te)+b

Selon cette équation, la température intérieure dépend linéairement de la température extérieure .

Régression bivariée

Page 6: Analyse de régression linéaire

Régression multiple

•Régression multiple / 2 ou plusieurs variables indépendantes (x₁, x₂) sont associées à une seule variable dépendante (y). y= a₁x₁+a₂x₂+b Exemple: température intérieure (ti)=f[température extérieure (te) , humidité relative (H%)]. i= a₁(te)+ a₂(H%)+b Selon cette équation, la température intérieure dépend linéairement de la température extérieure et de l’humidité relative .

•Pour déterminer les paramètres de l’équation de régression linéaire a et b , on fait appel à la méthode dite des moindres carrés .

Page 7: Analyse de régression linéaire

LA RELATION LINÉAIRE ET NON LINÉAIRE

2 exemples de relation non linéaire

Un exemple de relation linéaire

Ici, les observations (nuage de point en verte) suivent presque une ligne droite. La ligne bleue, qui exprime le meilleur ajustement des valeurs observées, est la régression . Cependant, cette droite de régression n’exprime pas parfaitement la position parfaite des différentes observations, il y a toujours une erreur (Ɛ), car il existe une certaine distance entre les valeurs observées et les valeurs calculées qui constituent ligne bleue de régression. Pour cela qu’il faut introduire Ɛ dans l’équation y=ax+b. y= ax + b + Ɛ constitue uniquement une prédiction. D’où x (la variable indépendante) ne dépend pas totalement de y (la variable dépendante) et qu’il y a uniquement des preuves qui attestent de l’existence d’une relation entre les 2 variables.

Régression positive et forte Régression négative forte

Page 8: Analyse de régression linéaire

. VALEUR OBSERVÉES . VALEURS CALCULÉES

Les valeurs des observations sont distantes par rapport à la droite de régression ( ou droite des moindres carrés) .La droite de régression est constituée de l’ensemble des valeurs calculées à partir des observations.

Les valeurs observées et valeurs calculées

Page 9: Analyse de régression linéaire

« Il n'existe aucune relation entre démographie et demande en logements »

PROCÉDONS AU TESTE DE RÉGRESSION

Soit l ’hypothèse nulle H₀

Variable indépendante Variable dépendante

Si H₀ est rejetée, cela signifie que la pente b=0Si H1 est acceptée, cela signifie que la pente b≠0

Avant de procéder à l’analyse du modèle de régression, il est nécessaire que les variables indépendante et dépendante soient bien corrélées.

Page 10: Analyse de régression linéaire

Analysons maintenant les données des variables « démographie » et « demande »

Analyse RégressionLinéaire

1

Page 11: Analyse de régression linéaire

A l’inverse de la corrélation, la régression exige que la variable indépendante et la variable dépendante soient bien spécifiées et placées séparément dans des champs différents : la variable dépendante dans «Dépendant :» et la variable indépendant dans « Variables indépendantes: »

Transférons les deux variables dans leur champ correspondant.

Appuyez sur le bouton Ok sans toucher aux autres.

2

Page 12: Analyse de régression linéaire

Nous obtenons 4 tableaux dont 3 uniquement qui nous intéressent pour l’analyse de régression « Variables introduites/supprimées » , « Récapitulatif des modèles » et « Coefficients »

3

Le 1er tableau indique la variable indépendante « Démographie » La variable dépendante « demande en logements »

Page 13: Analyse de régression linéaire

2ème tableau

2 valeurs importantes dans le modèle de régression : R = 0,987 (coefficient de corrélation) et R² =0,975 (R X R) R (r) (coefficient de corrélation) presque égal à 1 indique clairement que les 2 variables sont

significativement en relation. (Même valeur obtenue lors de l’analyse de corrélation) R² (coefficient de détermination ) mesure la qualité de prédiction d’une régression linéaire R² de valeur de 0,975 (97,5%) indique que la démographie explique la demande en logements dans un fort pourcentage de 97,5 .

0 ≤R²≤1 Ce coefficient se situe entre 0 (exprime un pouvoir de prédiction faible) et 1 (exprime un pouvoir de prédiction fort voire parfait).Sur le plan graphique Plus R² se rapproche de 0, plus le nuage de points est diffus et se disperse autour de la droite

de régression. Plus le R² tend vers 1, plus le nuage de points se rapproche et se resserre autour de la droite

de régression. Quand les points sont exactement alignés sur la droite de régression, R²=1.

4

Page 14: Analyse de régression linéaire

3ème tableau

Ici, il y a 3 valeurs importantes : -31,997 qui exprime la Constante b 8,231 est la valeur de la pente a.Si x=0 alors y=- 31,997P-value=0,000 <0,05 donc H₁: il existe une relation statistiquement significative entre démographie et demande en logements. Cette forte relation est déjà confirmée par R² de valeur de 0,975 ou 97,5% (2ème tableau) Bêta (coefficients standardisés) est égale à 0,987 . C’est la même valeur que celle du coefficient de corrélation . Cette égalité de valeurs est vraie quand il s’agit d’une régression linéaire simple.

5

Page 15: Analyse de régression linéaire

H₁: il existe une relation statistiquement significative entre démographie et demande en logements, b≠0.

L’équation de régression par rapport H₁

Y= ax + b (l’équation de la régression) Selon le 3ème tableau , Pente =8,23 et Constante = - 31,99Y= 8,23 * démographie +(- 31,99)

Quelle est la demande en logements pour une démographie de 28 millions d’habitants ?

Y= 8,23 * 28 - 31,99= 198,45

Donc, pour la valeur de démographie de 28 millions (variable indépendante), la valeur prédite en demande en logements (variable dépendante), est 198,45 (en milliers) environ,En conclusion , R, R² et le coefficient non standardisés (A) sont les plus importants nombres à chercher et à contrôler pour effectuer l'analyse de régression.

Comme c’est déjà annoncé, on peut prédire la variable dépendante (le résultat) avec l’analyse de régression.

6

Page 16: Analyse de régression linéaire

Merci pour votre attention

Prof. Adad Mohamed Chérif

Université d’Oum El Bouaghi Faculté des sciences de la terre et de l’architecture