Chapitre Algorithmes de Régression
Chapitre Algorithmes de Régression
Chapitre Algorithmes de Régression
1. Introduction
La régression sert à trouver la relation d’une variable par rapport à une ou plusieurs
autres.
• Régression linéaire
• Régression polynomiale
• Régression logistique
• Régression quantile
2. Régression linéaire
La régression linéaire simple sert à trouver une relation d’une variable de sortie par
rapport à une autre.
Où:
Dans ce cas, l’apprentissage est le fait d’estimer ces poids en se basant sur des
données d’entrées et des résultats attendus.
La fonction coût
La fonction du coût aide à trouver l’erreur entre le résultat estimé et le résultat attendu.
Elle est utilisée pour régler les poids des caractéristiques. Donc, pour trouver les poids
les plus optimaux, il faut minimiser cette fonction. Étant donnée un ensemble des
données d’entrainement avec N échantillons, la fonction coût la plus utilisée est l’erreur
quadratique moyenne (MSE) entre les sorties attendues (y) et les sorties estimées (ŷ)
Cette fonction est une fonction convexe ; ça veut dire qu’elle n’a pas des minimums
locaux. Donc, elle a un minimum global unique.
Algorithme du gradient
1. Initialiser les poids θj à 0. Fixer un pas α pour mettre à jour les poids. Aussi,
Fixer un seuil de tolérance ε > 0.
2. Calculer les gradients de la fonction du coût en θj
3. Mettre à jours les poids θj en utilisant leurs anciennes valeurs, leurs gradients
et le pas α
4. Si la fonction du coût J < ε on s’arrête; sinon, on revient à l’étape (2).
Pour θ0:
Mise à jour des poids : Les poids sont mis à jour en se basant sur les gradients
et le pas comme suit :
3. Régression polynomiale
4. Régression logistique
La régression logistique est utilisée pour le classement et pas la régression. Mais, elle
est considéré comme une méthode de régression puisqu’elle sert à estimer la probabilité
d’appartenir à une classe. Il y a trois types de régression logistique:
Régression logistique binaire: le but de la classification est d’identifier si un
échantillon appartient à une classe ou non.
Régression logistique multinomiale : le but de la classification est
d’identifier à quelle classe appartient-t-il un échantillon parmi plusieurs
classes.
Régression logistique ordinale: le but de la classification est de chercher la
classe d’un échantillon parmi des classes ordonnées. Un exemple de classes :
non satisfait, satisfait, très sataisfait.
Les valeurs de la fonction logistique sont comprises entre 0 et 1; comme il est indiqué
dans le diagramme suivant:
❖ La décision : Pour prédire si un échantillon x appartient à une classe donnée
(classe positive) y=1, on calcule sa probabilité en utilisant l’équation
précédante. Ensuite, on utilise un seuil sur cette probabilité pour décider.
La régression linéaire
La régression polynomiale
La régression logistique
• Pourtant elle est utilisée pour la classification, elle donne des probabilités pour
les sorties.
• Le modèle logistique peut être mis à jour facilement.
❖ Limites
La régression linéaire
• Elle donne des mauvaises performances s’il n’y a pas une relation linéaire.
• La plupart des phénomènes réelles ne correspondent pas la supposition du
modèle linéaire.
• Sensible aux valeurs aberrantes
La régression polynomiale
La régression logistique