Chapitre 1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 4

Chapitre 1

Régression linéaire
1-Régression Simple
1-1Introduction
Le but de la régression simple (resp. multiple) est d'expliquer une variable 𝑌 à l'aide d'une
variable 𝑋 (resp. plusieurs variables 𝑿𝟏 ...,𝑿𝒏 ). La variable Y est appelée variable dépendante,
ou variable à expliquer et les variables 𝑋𝑗 (𝑗 = 1 … . 𝑛)) sont appelées variables indépendantes,
ou variables explicatives.
1.2 Le modèle Mathématique
On cherche à modéliser la relation entre deux variables quantitatives continues. Un modèle de
régression linéaire simple est de la forme suivante :
𝒀 = 𝒇(𝒙) = 𝜶𝑿 + 𝜷 + 𝜺 (1.1)
Où 𝜀est la variable résiduelle représentant l’écart entre la valeur ajustée et la valeur observée
-𝒀 est la variable à expliquer (à valeurs dansℝ)
-𝑿 est la variable explicative (à valeurs dansℝ)
-𝜺 Tapez une équation ici.est la variable résiduelle représentant l’écart entre la valeur ajustée
et la valeur observée
- 𝜶et 𝜷 sont deux paramètres à estimer
On estime les coefficients 𝛼 et 𝛽 de telle sorte à remplacer la série d’observations
(𝑥𝑖 , 𝑦𝑖 ) 𝑖 = 1 … 𝑛 par une équation du type :

𝒀 = 𝜶𝑿 + 𝜷 (1.2)
En admettant que le modèle 𝑌 = 𝑓(𝑥 ) = 𝛼𝑋 + 𝛽 + 𝜀 est vrai, on estime les coefficients 𝜶
et 𝜷 de ce modèle .pour chaque observation (𝑥𝑖 , 𝑦𝑖 ) , la valeur calculée 𝑦̂ = 𝛼𝑥𝑖 + 𝛽 par le
modèle estimé ne coïncide pas en général avec la valeur 𝑦𝑖 = 𝛼𝑥𝑖 + 𝛽 + 𝜀𝑖 .
2-Méthode Des Moindres Carrés
Soient deux variables 𝑿 et 𝒀 liées par une certaine relation les points
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ) … . . (𝑥𝑛 , 𝑦𝑛 ),ou 𝑥𝑖 et 𝑦𝑖 (𝑖 = 1,2 … … . . 𝑛) sont les valeurs prises par 𝑿 et 𝒀
respectivement et 𝑛 la taille de l’échantillon, représentés dan ℝ𝟐 forment un nuage de points
(diagramme de dispersion) .la représentation graphique se fait par une courbe continue (dite
courbe d’ajustement) approchant le nuage de point .entre les deux variable 𝑿 (variable
explicative) et 𝒀 (variable expliquée) la relation 𝒚 = 𝒇(𝒙) peut-être linéaire ou non linéaire .

1
a-Droite De Régression
Parmi toutes les droites d’équations qui
𝒀 =approchent
𝜶𝑿 + 𝜷 le nuage de point, celle qui vérifie la
propriété :
∑𝒏𝒊=𝟏(𝒚𝒊 − 𝒂𝒙𝒊 − 𝒃)𝟐 (1.3)
Donne le meilleur ajustement au sens des moindres carrés.
Les conditions 𝛼 et 𝛽 sont données par la résolution du système
𝜷𝒏 + 𝜶 ∑𝒏𝒊=𝟏 𝒙𝒊 = ∑𝒏𝒊=𝟏 𝒚𝒊
{ (1.4)
𝜷 ∑𝒏𝒊=𝟏 𝒙𝒊 + 𝜶 ∑𝒏𝒊=𝟏 𝒙𝟐𝒊 = ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊

On trouve
𝒏 ∑𝒏 𝒏 𝒏
𝒊=𝟏 𝒙𝒊 𝒚𝒊 −(∑𝒊=𝟏 𝒙𝒊 )((∑𝒊=𝟏 𝒚𝒊 ))
𝜶= (1.5)
𝒏(∑𝒏 𝟐 𝒏
𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟏 𝒙𝒊 )

(∑𝒏 𝒏 𝟐 𝒏 𝒏
𝒊=𝟏 𝒚𝒊 )(∑𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟏 𝒙𝒊 )(∑𝒊=𝟏 𝒙𝒊 𝒚𝒊 )
𝜷= (1.6)
𝒏(∑𝒏 𝟐 𝒏
𝒊=𝟏 𝒙𝒊 )−(∑𝒊=𝟎 𝒙𝒊 )

La droite de régression (𝐷) de 𝑌 en 𝑋 a pour équation :


𝑌 = 𝛼𝑋 + 𝛽
𝒄𝒐𝒗(𝑿,𝒀)
𝜶= (1.7)
𝑽(𝑿)

et

𝜷 = 𝒀 − 𝜶𝑿 (1.8)
La droite de régression 𝒀 = 𝜶′𝑿 + 𝜷′
Ou
𝒄𝒐𝒗(𝑿,𝒀)
𝜶′ = (1.9)
𝑽(𝑿)

et

𝜷′ = 𝒀 − 𝜶′𝑿

Les droites (𝑫) et (𝑫′) passent toutes les deux par le point (𝑿, 𝒀)

Quelque Ajustement
On utilise souvent des ajustements autres que linéaire .on peut citer :

𝒀 = 𝒂𝟎 + 𝒂𝟏 𝑿 + 𝒂𝟐 𝑿𝟐 + ⋯ … . +𝒂𝒏 𝑿𝒏
Fonction des n-ièmes degrés
Les coefficients 𝒂𝟎 , 𝒂𝟏 , 𝒂𝟐 … … . 𝒂𝒏 sont obtenues par la résolution du système de 𝒏

2
Equations à 𝑛 inconnues.

Fonction exponentielle 𝒀 = 𝜶𝜷𝑿


Ce modèle se linéarise en posant
𝒁 = 𝒍𝒐𝒈𝒀
On Obtient
𝒁 = 𝒍𝒐𝒈𝜶 + 𝜷𝑿 (1.10)
𝟏
-Fonction Hyperbole 𝒀 = 𝜶𝑿+𝜷

Ce modèle se linéarise en posant


𝟏
𝒁=
𝒀

On Obtient
𝒛 = 𝜶𝑿 + 𝜷 (1.11)
3-coefficients de corrélation
Ce coefficient permet de détecter la présence ou l'absence d'une relation linéaire entre deux
caractères quantitatifs continus. Pour calculer ce coefficient il faut tout d'abord calculer la
covariance. La covariance est la moyenne du produit des écarts à la moyenne.
𝐶𝑜𝑣(𝑋,𝑌)
𝑟 = 𝑟𝑋𝑌 = (1.12)
𝜎𝑋 𝜎𝑌

𝑪𝒐𝒗(𝑿, 𝒀) = ∑(𝒙𝒊 − 𝒙)(𝒚𝒊 − 𝒚)

Et 𝜎𝑋 𝜎𝑌 = √(𝒙𝒊 − 𝒙)2 (𝒚𝒊 − 𝒚)2

3-1 Propriétés et interprétation de 𝒓𝑿𝒀


On peut démontrer que ce coefficient varie entre -1 et +1. Son interprétation est la suivante :

- si 𝑟 est proche de 0, il n'y a pas de relation linéaire entre X et Y


- si 𝑟 est proche de -1, il existe une forte relation linéaire négative entre X et Y
- si 𝑟 est proche de 1, il existe une forte relation linéaire positive entre X et Y

Le signe de r indique donc le sens de la relation tandis que lala valeur absolue de 𝑟 indique
l'intensité de la relation c'est-à-dire la capacité à prédire les valeurs de Y en fonctions de celles
de X.

3
m.zigadi@univ-boumerdes.dz

Boumerdése le 04/11/2021

Vous aimerez peut-être aussi

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy