Chapitre 1
Chapitre 1
Chapitre 1
Régression linéaire
1-Régression Simple
1-1Introduction
Le but de la régression simple (resp. multiple) est d'expliquer une variable 𝑌 à l'aide d'une
variable 𝑋 (resp. plusieurs variables 𝑿𝟏 ...,𝑿𝒏 ). La variable Y est appelée variable dépendante,
ou variable à expliquer et les variables 𝑋𝑗 (𝑗 = 1 … . 𝑛)) sont appelées variables indépendantes,
ou variables explicatives.
1.2 Le modèle Mathématique
On cherche à modéliser la relation entre deux variables quantitatives continues. Un modèle de
régression linéaire simple est de la forme suivante :
𝒀 = 𝒇(𝒙) = 𝜶𝑿 + 𝜷 + 𝜺 (1.1)
Où 𝜀est la variable résiduelle représentant l’écart entre la valeur ajustée et la valeur observée
-𝒀 est la variable à expliquer (à valeurs dansℝ)
-𝑿 est la variable explicative (à valeurs dansℝ)
-𝜺 Tapez une équation ici.est la variable résiduelle représentant l’écart entre la valeur ajustée
et la valeur observée
- 𝜶et 𝜷 sont deux paramètres à estimer
On estime les coefficients 𝛼 et 𝛽 de telle sorte à remplacer la série d’observations
(𝑥𝑖 , 𝑦𝑖 ) 𝑖 = 1 … 𝑛 par une équation du type :
𝒀 = 𝜶𝑿 + 𝜷 (1.2)
En admettant que le modèle 𝑌 = 𝑓(𝑥 ) = 𝛼𝑋 + 𝛽 + 𝜀 est vrai, on estime les coefficients 𝜶
et 𝜷 de ce modèle .pour chaque observation (𝑥𝑖 , 𝑦𝑖 ) , la valeur calculée 𝑦̂ = 𝛼𝑥𝑖 + 𝛽 par le
modèle estimé ne coïncide pas en général avec la valeur 𝑦𝑖 = 𝛼𝑥𝑖 + 𝛽 + 𝜀𝑖 .
2-Méthode Des Moindres Carrés
Soient deux variables 𝑿 et 𝒀 liées par une certaine relation les points
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ) … . . (𝑥𝑛 , 𝑦𝑛 ),ou 𝑥𝑖 et 𝑦𝑖 (𝑖 = 1,2 … … . . 𝑛) sont les valeurs prises par 𝑿 et 𝒀
respectivement et 𝑛 la taille de l’échantillon, représentés dan ℝ𝟐 forment un nuage de points
(diagramme de dispersion) .la représentation graphique se fait par une courbe continue (dite
courbe d’ajustement) approchant le nuage de point .entre les deux variable 𝑿 (variable
explicative) et 𝒀 (variable expliquée) la relation 𝒚 = 𝒇(𝒙) peut-être linéaire ou non linéaire .
1
a-Droite De Régression
Parmi toutes les droites d’équations qui
𝒀 =approchent
𝜶𝑿 + 𝜷 le nuage de point, celle qui vérifie la
propriété :
∑𝒏𝒊=𝟏(𝒚𝒊 − 𝒂𝒙𝒊 − 𝒃)𝟐 (1.3)
Donne le meilleur ajustement au sens des moindres carrés.
Les conditions 𝛼 et 𝛽 sont données par la résolution du système
𝜷𝒏 + 𝜶 ∑𝒏𝒊=𝟏 𝒙𝒊 = ∑𝒏𝒊=𝟏 𝒚𝒊
{ (1.4)
𝜷 ∑𝒏𝒊=𝟏 𝒙𝒊 + 𝜶 ∑𝒏𝒊=𝟏 𝒙𝟐𝒊 = ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊
On trouve
𝒏 ∑𝒏 𝒏 𝒏
𝒊=𝟏 𝒙𝒊 𝒚𝒊 −(∑𝒊=𝟏 𝒙𝒊 )((∑𝒊=𝟏 𝒚𝒊 ))
𝜶= (1.5)
𝒏(∑𝒏 𝟐 𝒏
𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟏 𝒙𝒊 )
(∑𝒏 𝒏 𝟐 𝒏 𝒏
𝒊=𝟏 𝒚𝒊 )(∑𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟏 𝒙𝒊 )(∑𝒊=𝟏 𝒙𝒊 𝒚𝒊 )
𝜷= (1.6)
𝒏(∑𝒏 𝟐 𝒏
𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟎 𝒙𝒊 )
et
𝜷 = 𝒀 − 𝜶𝑿 (1.8)
La droite de régression 𝒀 = 𝜶′𝑿 + 𝜷′
Ou
𝒄𝒐𝒗(𝑿,𝒀)
𝜶′ = (1.9)
𝑽(𝑿)
et
𝜷′ = 𝒀 − 𝜶′𝑿
Les droites (𝑫) et (𝑫′) passent toutes les deux par le point (𝑿, 𝒀)
Quelque Ajustement
On utilise souvent des ajustements autres que linéaire .on peut citer :
𝒀 = 𝒂𝟎 + 𝒂𝟏 𝑿 + 𝒂𝟐 𝑿𝟐 + ⋯ … . +𝒂𝒏 𝑿𝒏
Fonction des n-ièmes degrés
Les coefficients 𝒂𝟎 , 𝒂𝟏 , 𝒂𝟐 … … . 𝒂𝒏 sont obtenues par la résolution du système de 𝒏
2
Equations à 𝑛 inconnues.
On Obtient
𝒛 = 𝜶𝑿 + 𝜷 (1.11)
3-coefficients de corrélation
Ce coefficient permet de détecter la présence ou l'absence d'une relation linéaire entre deux
caractères quantitatifs continus. Pour calculer ce coefficient il faut tout d'abord calculer la
covariance. La covariance est la moyenne du produit des écarts à la moyenne.
𝐶𝑜𝑣(𝑋,𝑌)
𝑟 = 𝑟𝑋𝑌 = (1.12)
𝜎𝑋 𝜎𝑌
Le signe de r indique donc le sens de la relation tandis que lala valeur absolue de 𝑟 indique
l'intensité de la relation c'est-à-dire la capacité à prédire les valeurs de Y en fonctions de celles
de X.
3
m.zigadi@univ-boumerdes.dz
Boumerdése le 04/11/2021