Cours 6 Merged
Cours 6 Merged
Cours 6 Merged
1
Définitions, axiomes et propriétés
Avant de donner des définitions formelles, essayons
de comprendre la signification du mot probabilité.
Considérons les expériences suivantes :
3
Définitions, axiomes et propriétés
3) On lance un dé équilibré. On sait que la
probabilité d’obtenir 2 est 1/6.
4
Définitions
Expérience aléatoire:
Une expérience aléatoire est une expérience dont
on ne peut pas prédire les résultats avec certitude.
Espace échantillon:
L'ensemble des résultats possibles d'une expérience
aléatoire est appelé espace échantillon. Il sera
dénoté par Ω.
5
Définitions
Événement:
Un événement A est un sous-ensemble de l'espace
échantillon Ω.
Événement élémentaire:
Un événement élémentaire est un événement qui
ne peut être décomposé.
Remarque :
Les définitions d’événement et d’événement
élémentaire implique qu’un événement est une
union d’événements élémentaires.
6
Définitions
En jetant un dé :
- "obtenir un six " est un évènement
Les événements:
9
Exemple 2:
Expérience : Lancer deux pièces de monnaie.
Ω = {PP , PF , FP , FF}.
10
Exemple 2:
Expérience : Lancer un dé. Ω = {1,2,3,4,5,6}
11
Combinaisons d'événements
12
Combinaisons d'événements
13
Combinaisons d'événements
14
Combinaisons d'événements
Événement impossible et événement certain.
L'ensemble vide φ et l'ensemble Ω sont
respectivement, l’événement impossible et
l’événement certain.
Source: https://datascience.eu/fr/mathematiques-et-statistiques/evenement-mutuellement-exclusif-definition-exemples-syndicats 17
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 18
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 19
Combinaisons d'événements
Exemple:
On tire au hasard une personne au hasard dans une
certaine population.
Considérons les événements suivants:
A : La personne choisie a les yeux bleus
B : La personne choisie a les cheveux blonds
C : La personne choisie a les yeux verts
21
Axiomes
Définition:
Une fonction P qui fait correspondre à chaque
événement A ⊂ Ω un nombre réel P(A) est appelée
une probabilité si elle satisfait les axiomes suivants:
A3. P(Ω) = 1 22
Propriétés
1. P( Ac ) =1− P(A)
2. P(φ) = 0 : la probabilité de l'événement
impossible est 0
3. P(A) = P(A∩B) + P(A∩Bc )
4. Si B ⊂ A, alors P(B) ≤ P(A)
5. P(A) ≤ 1 pour tout événement A ⊂ Ω
6. P(A - B) = P(A) - P(A∩B)
7. P(A∪B) = P(A) + P(B) - P(A∩B)
23
Probabilités conditionnelles - Indépendance
Une expérience aléatoire est une expérience dont le
résultat dépend du hasard.
• Chacun des résultats possibles s’appelle une
éventualité (ou une issue).
• L’ensemble Ω de tous les résultats possibles d’une
expérience aléatoire s’appelle l’univers de l’expérience.
• On définit une loi de probabilité sur Ω en associant, à
chaque éventualité xi , un réel pi compris entre 0 et 1 tel
que la somme de tous les pi soit égale à 1.
• Un événement est un sous-ensemble de Ω.
Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 24
Probabilités conditionnelles - Indépendance
Le lancer d’un dé à six faces est une expérience
aléatoire d’univers comportant 6 éventualités : =
{1;2;3;4;5;6}
Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 25
Probabilités conditionnelles - Indépendance
Ces événements peuvent être représentés par un
diagramme de Venn :
Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 26
Probabilités conditionnelles - Indépendance
• l’événement contraire de A noté 𝐴ҧ est l’ensemble
des éventualités de qui n’appartiennent pas à A.
Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 27
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• 𝐸ത 1 = {1;3;5} : cet événement peut se traduire par « le
résultat est un nombre impair »
28
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• E1∪E2 = {1;2;3;4;6} : cet événement peut se traduire
par « le résultat est pair ou strictement inférieur à 4 ».
29
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• E1∩E2 = {2} : cet événement peut se traduire par
« le résultat est pair et strictement inférieur à 4 ».
30
Probabilités conditionnelles - Indépendance
On dit que A et B sont incompatibles si et seulement
si A∩B = ∅
Exemple:
«Obtenir un chiffre inférieur à 2 » et « obtenir un
chiffre supérieur à 4 » sont deux événements
incompatibles.
31
Probabilités conditionnelles - Indépendance
Propriétés:
• p(∅) = 0
• p(Ω) = 1
• p(𝐴) = 1 − p(A)
• p(A∪B) = p(A) + p(B) − p(A∩B).
Si A et B sont incompatibles, la dernière égalité
devient :
• p(A∪B) = p(A) + p(B).
32
Arbre
Lorsqu’une expérience aléatoire comporte plusieurs
étapes, on utilise souvent un arbre pondéré pour la
représenter.
Exemple:
Dans une classe de Terminale, 52% de garçons et 48%
de filles étaient candidats au baccalauréat. 80% des
garçons et 85% des filles ont obtenu leur diplôme.
On choisit un élève au hasard et on note :
G : l’événement « l’élève choisi est un garçon » ;
F : l’événement « l’élève choisie est une fille » ;
B : l’événement « l’élève choisi(e) a obtenu son
baccalauréat ». 33
Arbre
On peut représenter la situation à l’aide de l’arbre
pondéré ci-dessous :
On choisit un élève au hasard et on note :
G : l’événement « l’élève choisi est un garçon » ;
F : l’événement « l’élève choisie est une fille » ;
B : l’événement « l’élève choisi(e) a obtenu son
baccalauréat ».
35
Probabilités Conditionnelles
Soit A et B deux événements tels que p(A) ≠ 0, la
probabilité de B sachant A est le nombre :
36
Probabilités Conditionnelles
Exemple:
On reprend l’exemple du lancer d’un dé. La
probabilité d’obtenir un chiffre pair sachant que
le chiffre obtenu est strictement inférieur à 4 est
(en cas d’équiprobabilité) :
E1 = {2;4;6}, E2 = {1;2;3}
37
Probabilités Conditionnelles
Remarques:
L’égalité précédente s’emploie souvent sous la forme :
38
Probabilités Conditionnelles
Remarques:
Avec un arbre pondéré, les probabilités conditionnelles
figurent sur les branches du second niveau et des
niveaux supérieurs (s’il y en a).
39
Probabilités Conditionnelles
Remarques:
40
Probabilités Conditionnelles
Remarques:
La formule p(A∩B) = p(A)×pA(B) s’interprète alors de la
façon suivante :
41
Probabilités Conditionnelles
Remarques:
42
Evénements Indépendants
Remarques:
Deux événements A et B sont indépendants si et
seulement si :
43
Evénements Indépendants
Exemple 1:
On rappelle qu’un jeu de 32 cartes est composé des
cartes 7, 8, 9, 10, valet, dame, roi et as, déclinées en
quatre couleurs : trèfle, pique, coeur et carreau.
Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 44
Evénements Indépendants
Exemple 1:
Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 45
Evénements Indépendants
Exemple 1:
Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 46
Evénements Indépendants
Exemple 1:
47
Evénements Indépendants
Exemple 1:
48
Evénements Indépendants
Exemple 1:
49
Evénements Indépendants
Exemple 2:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 50
Evénements Indépendants
Exemple 2:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 51
Probabilités
Univers, issues et événements
Source: http://www.apprendre-en-ligne.net/MADIMU2/PROBA/PROBA2.PDF 52
Probabilités
Univers, issues et événements
53
Probabilités
Univers, issues et événements
54
Probabilités
Univers, issues et événements
55
Probabilités
Exemple
56
Probabilités
Exemple
*Un nombre premier est un entier naturel qui admet exactement deux diviseurs
distincts entiers et positifs.
57
Probabilités
Exemple
58
Probabilités
Exemple
59
Vocabulaire propre aux évènements
60
Probabilité
61
Probabilité
1
2
Example 1:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 3
Example 1:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 4
5
Example 2:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 6
Example 2:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 7
Example 3:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 8
Example 3:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 9
Example 4:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 10
Example 4:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 11
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 12
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 13
Example 5:
A, B, C sont trois événements d’un espace
d’épreuves Ω. Exprimer à l’aide de A, B, C, les
événements suivants :
1. A, B, C se produisent simultanément.
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster 14
Example 5:
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster 15
Example 5-1:
Exemple:
Soit A et B deux événements tels que
P(A) = 0,3, P(B) = 0,5 et P(A∪B) = 0,7.
Déterminer:
a) P(A∩B)
b) P(Ac∩Bc)
c) P(B∩Ac).
Solution:
a) P(A∩B) = P(A)+P(B) - P(A∪B) = 0,3+0,5-0,7=0,10
b) P(Ac∩Bc) = P(A∪B)c = 1 - P(A∪B) = 0,30
c) P(B∩Ac) = 0,40
Calculer P(A∩B)
Source: https://www.ilemaths.net/sujet-probabilites-niveau-seconde-583818.html 18
Example 6:
A et B sont deux événements d'une même expérience
aléatoire tels que:
ҧ
P(𝐴)=0,44 ത
; P(𝐵)=0,63 ; P(𝐴𝑈𝐵)=0,32.
Calculer P(A∩B)
Solution:
P(A∩B)=P(A)+P(B)-P(AUB)
=(1 - P(𝐴)ҧ ) + (1 - P(𝐵))
ത - (1 - P(𝐴𝑈𝐵))
=0,56 + 0,37 – (1- 0,32)
=0,93-0,68
P(A∩B)=0,25
Source: https://www.ilemaths.net/sujet-probabilites-niveau-seconde-583818.html 19
Example 7:
A et B sont deux évènements d’une expérience
ഥ l’évènement contraire de B.
aléatoire. On note B
On sait que:
P(A) = 0,6
P(B) = 0,5 et
P(A∩B) = 0,42
Calculer
ഥ)
P(AUB), PA(B), PB(A), et P(A∩B
Source: https://www.freemaths.fr/annales-mathematiques/bac-es-mathematiques-antilles-guyane-
2017-specialite-corrige-exercice-1.pdf 20
Example 7:
P(A) = 0,60
P(B) = 0,50 et
P(A∩B) = 0,42
Solution:
P(AUB) =P(A)+P(B)-P(A∩B)=0,60+0,50-0,42=0,68
ഥ) = 0,6-0,42 = 0,18
P(A∩B
Source: https://www.freemaths.fr/annales-mathematiques/bac-es-mathematiques-antilles-guyane-
2017-specialite-corrige-exercice-1.pdf 21
Example 8:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 22
Example 8:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 23
Example 9:
A et B sont deux événements tels que P(A∩B)=0,4,
P(AUB)=0,7 et PA(B)=0,8
Source: https://nosdevoirs.fr/devoir/1936360 24
Example 9:
Source: https://nosdevoirs.fr/devoir/1936360 25
Example 10:
En 1999, 23% des ménages étaient équipés d’un
ordinateur et 28% d’un téléphone portable. Ils
étaient 70% à n’avoir ni ordinateur ni téléphone
portable.
D’après l’énoncé, on a
P(A) = 0.23 et
P(B) = 0.28 et
P(Ac∩Bc) = 0.7
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 27
Example 10:
1. Quelle est la probabilité pour un ménage pris au
hasard d’être équipé d’un ordinateur et d’un
téléphone portable ?
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 28
Example 10:
2. Ces chiffres sont contestés et on prétend qu’ils
étaient en fait 73% à n’avoir ni ordinateur ni téléphone
portable. Est-ce possible ?
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 29
Exemple 10-1:
En étudiant une population, on a remarqué que,
durant un mois, 40% des individus sont allés au
cinéma, 25% sont allés au théâtre, et 12, 5% sont
allés au cinéma et au théâtre.
30
Exemple 10-1:
Calculer la probabilité que cette personne
31
Exemple 10-1:
Correction D’après l’énoncé, on a
P(C) = 0,40 P(T) = 0,25 et P(C∩T) = 0,125
Ainsi,
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 33
Example 11:
1. Reproduire et compléter le tableau suivant :
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 34
Example 11:
2. On choisit au hasard une personne parmi les 1000
interrogées. On suppose que toutes les personnes ont
la même probabilité d’être choisies. On considère les
événements :
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 35
Example 11:
A : "la personne interrogée est intéressée par Internet"
B : "la personne interrogée a moins de 25 ans"
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 36
Example 11:
Solution:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 37
Example 11:
Solution:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 38
Example 12:
39
Example 12:
Dans un atelier, deux machines M1 et M2 découpent
des pièces métalliques identiques. M1 fournit 60% de
la production (parmi lesquelles 6, 3% sont
défectueuses), le reste étant fourni par M2 (dont 4%
de la production est défectueuse).
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 40
Example 12:
1. Utilisation des formules des probabilités
conditionnelles.
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 41
Example 12:
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 42
Example 12:
2. Utilisation d’un tableau on suppose maintenant que la
production est composée de 10000 pièces.
(a) Reproduire et compléter le tableau suivant qui décrit la
production du jour :
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 44
Example 12:
3. Utilisation d’un arbre des probabilités
conditionnelles
(a) Dresser un arbre des probabilités conditionnelles
relatif à la situation proposée.
(b) Quelle est la probabilité de prélever une pièce
défectueuse, sachant qu’elle est produite par M1 ?
(c) Quelle est la probabilité de prélever une pièce
défectueuse, sachant qu’elle est produite par M2 ?
(d) Quelle est la probabilité de prélever une pièce
défectueuse ?
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 45
Example 12:
46
Example 13:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 47
Example 13:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 48
Example 13:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 49
Example 13:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 50
Example 13:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 51
Example 14:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 52
Example 14:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 53
Example 14:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 54
Example 15:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 55
Example 15:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 56
Example 15:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 57
Example 15:
Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 58
La Corrélation
1
Introduction
Fondamentalement, une corrélation est un nombre compris entre –1 et +1 qui
résume la relation entre deux variables, que nous appellerons X et Y.
Dans les livres de statistiques, cette partie de la relation est appelée la direction
de la relation (c'est-à-dire qu'elle est positive ou négative).
À mesure que la corrélation se rapproche de +1, nous disons que la relation est
forte et positive.
À mesure que la corrélation se rapproche de –1, nous disons que la relation est
forte et négative.
Une corrélation nulle signifie qu'il n'y a pas de relation entre X et Y. Cela signifie
que ni X ni Y ne peuvent être utilisés comme prédicteur de l'autre.
3
Introduction
Une bonne façon de comprendre ce que signifie une corrélation est de voir une
«image» du nuage de points de points produit dans un graphique par les points de
données.
Supposons que vous vouliez savoir si la variable X peut être utilisée pour prédire la
variable Y. Nous placerons la variable prédictive X sur l'axe des x (l'axe horizontal
d'un graphique) et la variable de critère Y sur l'axe des y (la verticale axe d'un
graphique).
4
Introduction
La figure montre le nuage de points pour une corrélation positive parfaite de
r = + 1,0.
Cela signifie que vous pouvez parfaitement prédire chaque valeur y à partir de
chaque valeur x car les points de données se déplacent «vers le haut et vers la
droite» le long d'une ligne droite parfaitement ajustée.
5
Introduction
La figure montre le nuage de points pour une corrélation modérément positive de
r = + 0,53.
Cela signifie que chaque valeur x peut prédire modérément bien chaque valeur y,
car vous pouvez dessiner une image d'un «ballon de football» à l'extérieur des
points de données qui se déplacent vers le haut et vers la droite, mais pas le long
d'une ligne droite ligne.
6
Introduction
La figure montre le nuage de points pour une corrélation faible et positive de
r = + 0,23.
Cela signifie que chaque valeur x est un mauvais prédicteur de chaque valeur y
parce que «l'image» que vous pourriez dessiner autour de l'extérieur des points
de données se rapproche d'un cercle en forme.
7
Introduction
Nous n'avons pas montré de figure d'une corrélation nulle car il est facile
d'imaginer à quoi cela ressemble en tant que nuage de points. Une corrélation
nulle de r = 0,00 signifie qu'il n'y a pas de relation entre X et Y et que «l'image»
dessinée autour des points de données serait un cercle parfait en forme, indiquant
que vous ne pouvez pas utiliser X pour prédire Y parce que ces deux variables ne
sont pas corrélés les uns aux autres.
8
Introduction
La figure montre le nuage de points pour une faible corrélation négative de
r = - 0,22 ce qui signifie que chaque X est un mauvais prédicteur de Y dans une
relation inverse, ce qui signifie que lorsque X augmente, Y diminue. Dans ce cas, il
s'agit d'une corrélation négative car le «football» que vous pourriez dessiner
autour des points de données est incliné vers le bas et vers la droite.
9
Introduction
La figure montre le nuage de points pour une corrélation négative modérée de
r = - 0,39 ce qui signifie que X est un prédicteur moyennement bon de Y, bien qu'il
existe une relation inverse entre X et Y (c'est-à-dire que lorsque X augmente, Y
diminue). Dans ce cas, il s'agit d'une corrélation négative car le «football» que
vous pourriez dessiner autour des points de données est incliné vers le bas et vers
la droite.
10
Introduction
La figure montre une corrélation négative parfaite de r = -1,00, ce qui signifie que
X est un prédicteur parfait de Y, bien que dans une relation inverse telle que
lorsque X augmente, Y diminue. Les points de données s'adaptent parfaitement le
long d'une ligne droite en pente descendante.
11
Les Coefficients de Corrélation
Les coefficients de corrélation sont des indices numériques de la relation entre
deux variables. Ils forment la base de nombreuses procédures statistiques et sont
largement utilisés dans les sciences sociales.
La corrélation de Pearson est utilisée pour les variables de score (bien qu'elle
puisse être utilisée lorsqu'une variable est une variable nominale avec seulement
deux catégories). La corrélation de Spearman est utilisée lorsque les scores sont
classés du plus petit au plus grand (c'est-à-dire non paramétrique -n'impliquant
aucune hypothèse quant à la forme ou aux paramètres d'une distribution de fréquence).
Source: Norris, G., Qureshi, F., Howitt, D. and Cramer, D. (2013). Introduction to Statistics with SPSS for Social Sciences. 12
Les Coefficients de Corrélation
Il faut prendre grand soin d’inspecter le diagramme de dispersion entre les deux
variables en question afin de s’assurer que la «ligne de meilleur ajustement» est
droite plutôt qu’une courbe.
14
Les Coefficients de Corrélation
Positive correlation between two variables
15
Les Coefficients de Corrélation
Negative correlation between two variables
16
Les Coefficients de Corrélation
Perfect correlation between two variables
17
Les Coefficients de Corrélation
Near-zero correlation between two variables
18
Liaison Entre 2 Variables Quantitatives
Source: https://eric.univ-lyon2.fr/~ricco/cours/cours/Analyse_de_Correlation.pdf 19
Liaison Entre 2 Variables Quantitatives
20
Coefficient de Corrélation de Pearson
Le coefficient de corrélation linéaire simple, dit de Bravais-Pearson (ou de
Pearson), est une normalisation de la covariance par le produit des écarts-type
des variables.
21
Covariance
L'objectif de la covariance est de quantifier la liaison entre deux variables X et Y,
de manière à mettre en évidence le sens de la liaison et son intensité.
COV (X, Y) < 0 : la liaison est négative c.-à-d. lorsque X est plus grand que son
espérance, Y a tendance à être plus petit que sa propre espérance.
23
Covariance
Quelques remarques:
3. La covariance d'une variable avec elle-même est la variance, la relation est
toujours positive. En effet,
24
Covariance
Propriétés
1. Symétrie. COV (X, Y) = COV (Y, X)
2. Distributivité. COV (X, Y +Z) = COV (X, Y ) +COV (X, Z) (... ne pas oublier que
E[X +Y] = E[X] + E[Y])
3. Covariance avec une constante.
COV (X, a) = 0
4. Covariance avec une variable transformée. (Transformation affine)
COV (X, a + b × Y ) = b × COV (X, Y)
5. Variance de la somme de deux variables aléatoires.
V (X + Y) = V (X) + V (Y) + 2 × COV (X, Y )
6. Covariance de 2 variables indépendantes.
X, Y independants ⇒ COV (X, Y) = 0
25
Covariance
La covariance est définie dans l'ensemble des réels c.-à-d. −∞ < COV (.) < +∞.
Il permet de se rendre compte du sens de la liaison. Plus sa valeur est élevée (en
valeur absolue), plus la liaison est forte. Mais nous ne savons pas quelle est la
limite. Nous ne pouvons pas non plus comparer la covariance d'une variable X
avec deux autres variables Y et Z.
26
Covariance: Détails des calculs sur un exemple
Pour préciser les idées, détaillons les calculs dans le tableur EXCEL. Nous
cherchons à calculer la covariance entre la cylindrée et la puissance de 28
véhicules.
28
Covariance: Détails des calculs sur un exemple
29
Coefficient de Corrélation de Pearson
Propriétés:
30
Coefficient de Corrélation de Pearson
Propriétés:
3. Lorsque le couple de variables (X, Y) suit une loi normale bi-variée, et
uniquement dans ce cas, nous avons l'équivalence r = 0 ⇔ X et Y sont
indépendants. Dans ce cas, le coefficient de corrélation caractérise parfaitement
la liaison entre X et Y . Dans les autres cas, le coefficient de corrélation constitue
une mesure parmi les autres de l'intensité de la corrélation.
32
Exemples Numériques
Reprenons les variables cylindrée (X) et puissance (Y) de notre fichier "voitures".
Nous détaillons les calculs dans la feuille EXCEL.
33
Exemples Numériques
34
Exemples Numériques
Nuage de points
Il y a une forte liaison linéaire entre "cylindrée" et "puissance", ce que confirme
le graphique nuage de points. On notera aussi, et le coefficient de corrélation ne
sait pas traduire ces informations, que 2 points semblent s'écarter des autres,
mais pas de la même manière :
35
Exemples Numériques
Nuage de points
- La "Lancia K 3.0 LS" est une grosse cylindrée, très puissante. Elle s'écarte du
nuage certes, mais elle est dans la lignée de la liaison entre les deux variables.
- La "Hyundai Sonata 3000" est aussi une grosse cylindrée, mais elle est
relativement anémique. Le point est un peu à l'écart des autres, tout comme la
Lancia, mais elle ne respecte pas, apparemment, l'apparente liaison (visuelle et
numérique) entre cylindrée et puissance. Si on retire cette observation, la
corrélation est renforcée, elle passe à 0.9635.
36
Exemples Numériques
Influence des valeurs aberrantes sur une corrélation
37
Exemples Numériques
Comparaison de coefficients de corrélation.
38
Causalité
On soutient généralement qu'une corrélation ne prouve pas la causalité. Le fait
que deux variables soient liées l'une à l'autre n'est pas une raison de dire autre
chose que le fait qu'elles sont liées. L'analyse statistique est fondamentalement
incapable de prouver qu'une variable a influencé directement l'autre variable.
Les questions telles que celle de savoir si une variable a affecté l'autre sont
traitées principalement par la nature de votre conception de recherche et non
par l'analyse statistique en tant que telle.
39
Causalité
Il existe cependant toute une gamme de problèmes statistiques où l'on s'intéresse
à la relation entre plusieurs variables.
Exemples:
Les individus les plus grands sont-ils les plus lourds ?
Le revenu d'une famille a-t-il une influence sur les résultats scolaires des enfants ?
Y a-t-il une relation entre le tabagisme et les cancers du poumon ?
Le rendement en céréales dépend-il de la quantité d'engrais utilisée ?
La productivité d'une entreprise est-elle liée au salaire des ouvriers ou employés ?
Dans ces questions, nous désirons savoir si le comportement d'une variable est
influencé par la valeur d'une autre variable:
Source: http://www.astro.ulg.ac.be/cours/magain/STAT/Stat_Main_Fr/Chapitre7.html 40
Causalité
41
Causalité
Exemple:
sa taille en abscisse
chaque individu est donc, dans ce graphique, représenté par un point (point
représentatif).
42
Causalité
Exemple:
Soit un individu mesurant 172 cm et pesant 66 kg:
43
Causalité
Exemple:
Dans le graphe, il y aura donc autant de points qu'il y a d'individus dans
l'échantillon.
44
Causalité
Exemple:
Relation entre le poids et la taille dans un échantillon de 30 individus:
On peut (par la pensée ou réellement) tracer une droite qui passe au mieux par
ces points (au milieu du "nuage" de points).
Si cette droite "monte", on dira qu'il y a corrélation positive entre les deux
variables.
46
Corrélation
47
Corrélation
48
Corrélation
49
Corrélation
50
Corrélation
51
Corrélation
52
Corrélation
a) r=0,60
b) r=1,00
c) r=-0,80
d) r=-1,00
e) r=0,00
f) r=0,00
53
Corrélation
Corrélation entre le poids et la taille pour les garçons de 2ème candidature
communication (1998).
54
Corrélation
Corrélation entre le poids et la taille pour les filles de 2ème candidature
communication (1998).
55
Exemple: Peur du Crime et Confiance dans la Police
Nos données pour ce calcul proviennent de scores mesurant la relation entre la
peur du crime et la confiance dans la police.
Il est toujours judicieux de dessiner le scattergramme pour tout coefficient de
corrélation que vous calculez. Pour ces données, le scattergramme sera comme
la figure. Notez que la pente du scattergramme est négative, comme on aurait
pu le déduire de la tendance de ceux qui obtiennent un score élevé au
questionnaire sur la peur du crime à avoir de faibles scores de confiance dans
l'enquête policière.
Vous pouvez également voir non seulement qu'une ligne droite est un très bon
moyen de décrire les tendances des points sur le diagramme de dispersion, mais
que les points correspondent raisonnablement bien à la ligne droite. Il faut donc
s'attendre à une corrélation négative assez élevée du coefficient de corrélation.
Source: Norris, G., Qureshi, F., Howitt, D. and Cramer, D. (2013). Introduction to Statistics with SPSS for Social Sciences. 56
Exemple: Peur du Crime et Confiance dans la Police
57
Exemple: Peur du Crime et Confiance dans la Police
58
Exemple: Peur du Crime et Confiance dans la Police
59
Exemple: Peur du Crime et Confiance dans la Police
8+3+9+7+2+3+9+8+6+7
2+6+4+5+7+7+2+3+5+4 𝑌ത =
𝑋ത = 10
10
62
ത
45 𝑌ത =
𝑋= 10
10
𝑌ത = 6,2
𝑋ത = 4,5
60
Exemple: Peur du Crime et Confiance dans la Police
ഥ )(𝒀 − 𝒀
= σ(𝑿 − 𝑿 ഥ)
= 2 − 4,5 ∗ (8 − 6,2) + 6 − 4,5 ∗ (3 − 6,2) + 4 − 4,5 ∗ (9 − 6,2) + 5 − 4,5 ∗ (7 − 6,2) +
7 − 4,5 ∗ (2 − 6,2) + 7 − 4,5 ∗ (3 − 6,2) + 2 − 4,5 ∗ (9 − 6,2) + 3 − 4,5 ∗ (8 − 6,2) +
5 − 4,5 ∗ (6 − 6,2) + 4 − 4,5 ∗ (7 − 6,2)
= −2,5 ∗ (1,8) + 1,5 ∗ (−3,2) + −0,5 ∗ (2,8) + 0,5 ∗ (0,8) + 2,5 ∗ −4,2
+ 2,5 ∗ (−3,2) + −2,5 ∗ (2,8) + −1,5 ∗ (1,8) + 0,5 ∗ (−0,2) + −0,5 ∗ (0,8)
ഥ )(𝒀 − 𝒀
(𝑿 − 𝑿 ഥ ) = −39
61
Exemple: Peur du Crime et Confiance dans la Police
Les Ecart-Types:
(2 − 4,5)2 +(6 − 4,5)2 +(4 − 4,5)2 +(5 − 4,5)2 +(7 − 4,5)2 +(7 − 4,5)2 +(2 − 4,5)2 +(3 − 4,5)2 +(5 − 4,5)2 +(4 − 4,5)2
𝑆𝑋 =
10 − 1
(6,25) + (2,25) + (0,25) + (0,25) + (6,25) + (6,25) + (6,25) + (2,25) + (0,25) + (0,25)
𝑆𝑋 =
9
30,5
𝑆𝑋 = = 3,38889 = 1,840894
9
62
Exemple: Peur du Crime et Confiance dans la Police
Les Ecart-Types:
(8 − 6,2)2 +(3 − 6,2)2 +(9 − 6,2)2 +(7 − 6,2)2 +(2 − 6,2)2 +(3 − 6,2)2 +(9 − 6,2)2 +(8 − 6,2)2 +(6 − 6,2)2 +(7 − 6,2)2 +
𝑆𝑌 =
10 − 1
(3,24) + (10,24) + (7,84) + (0,64) + (17,64) + (10,24) + (7,84) + (3,24) + (0,04) + (0,64)
𝑆𝑌 =
9
61,6
𝑆𝑌 = = 6,877777 = 2,616189
9
63
Exemple: Peur du Crime et Confiance dans la Police
1
∗(−39)
10−1
r=
(1,840894)∗(2,616189)
1
∗(−39)
9
r=
4,816127
r= −0,89975
64
Exemple: Peur du Crime et Confiance dans la Police
Interprétation du résultat:
Ainsi, la valeur obtenue pour le coefficient de corrélation est égale à −0,90. Cette
valeur est conforme à ce que nous avons suggéré à propos du scattergramme qui
sert de vérification approximative à notre calcul. Il existe une relation négative
très importante entre la peur du crime et la confiance dans la police.
En d'autres termes, les personnes qui avaient le plus peur du crime avaient le
moins confiance en la police, et vice versa. On ne prétend pas qu’ils ont peur du
crime parce qu’ils n’ont pas confiance en la police, mais simplement qu’il existe
une association inverse entre les deux.
65
Exemple: Peur du Crime et Confiance dans la Police
Communication des résultats:
Nous écrivions quelque chose comme: «Il a été constaté que la peur du crime
était inversement liée à la confiance dans la police. Le coefficient de corrélation de
Pearson était de - 0,90, ce qui est statistiquement significatif au niveau de 5% avec
une taille d'échantillon de 10.
66
La Corrélation
1
Introduction
La corrélation statistique est une technique statistique qui s'utilise pour voir si
deux variables sont liées.
Par exemple, considérez le revenu et les dépenses d'une famille comme variables.
Il est bien connu que l'augmentation ou la diminution des revenus et des
dépenses, se passent au même temps. Ainsi, ils sont liés tous les deux dans le sens
où le changement dans une de ces deux variables est accompagné d'un
changement dans l'autre variable.
Encore une fois des prix et de la demande de produits sont des variables
connexes; lorsque la demande des hausses de prix ont tendance à diminue et vice
versa.
Source: https://explorable.com/fr/la-correlation-statistique 2
Introduction
Si le changement dans une variable est accompagnée d'un changement dans
l'autre, puis les variables sont dites d'être corrélées. Nous pouvons donc dire que
le revenu familial et les dépenses, - le prix et la demande- sont corrélés.
La corrélation peut vous dire quelque chose au sujet de la relation entre les
variables. Il est utilisé pour comprendre:
4
Introduction
Coefficient de Corrélation
En général, r> 0 indique une relation positive, r <0 indique une relation négative
tandis que r = 0 indique l'absence de relation (ou que les variables sont
indépendantes et non liées). Ici, r = +1,0 décrit une corrélation positive parfaite et
r = -1,0 décrit une corrélation négative parfaite.
Si les coefficients sont plus proche de +1,0 et -1,0, plus grande est la force de la
relation entre les variables.
5
Introduction
Coefficient de Corrélation
En règle générale, les lignes directrices suivantes sur la force de la relation sont
souvent utiles (bien que de nombreux experts sont plutôt en désaccord sur le
choix des limites).
6
Introduction
La corrélation est seulement approprié pour examiner la relation entre les
données significatives quantifiables (par exemple l'air sous pression, température)
plutôt que des données catégoriques tels que le sexe, la couleur préférée, etc.
7
Introduction
Inconvénients
Alors que 'r' (coefficient de corrélation) est un outil puissant, il doit être manipulé
avec soin.
- Les coefficients de corrélation les plus utilisés ne mesurent relation linéaire. Il est
donc parfaitement possible que s'il existe une forte relation non linéaire entre les
variables, r est proche de 0 ou même est 0. Dans un tel cas, un diagramme de
dispersion peut grossièrement indiquer l'existence ou non d'une relation non
linéaire.
- «R» ne doit pas être utilisé pour dire quelque chose à propos de relation de
cause à effet. Autrement dit, en examinant la valeur de «r», on pourrait conclure
que les variables X et Y sont liées. Cependant, la même valeur de «r» ne nous dit
pas si X influences Y ou l'inverse. Corrélation statistique ne doit pas être le
principal outil utilisé pour étudier la causalité, à cause du problème avec des
tierces variables.
9
Corrélation et Causalité
Corrélation et causalité, étroitement liée à des facteurs de confusion, est
l'hypothèse erronée que parce quelques choses se corrélées, il ya une relation de
cause à effet.
La causalité est le domaine des statistiques qui est le plus souvent mal utilisé, et
mal interprété par des non-spécialistes. Des sources médiatiques, des politiciens
et des groupes de pression souvent sautent sur une corrélation perçue, et
l'utilisent pour «prouver» leurs propres croyances. Ils ne comprennent pas que,
simplement parce que les résultats montrent une corrélation, il n'existe aucune
preuve d'un lien de causalité sous-jacente.
Beaucoup de gens pensent que parce qu'un sondage ou une statistique, contient
beaucoup de nombres, il doit être scientifique, et donc correcte.
Source: https://explorable.com/fr/corr%C3%A9lation-et-causalit%C3%A9 10
Corrélation et Causalité
Les modèles de causalité dans l'esprit
11
Corrélation et Causalité: un exemple
La meilleure façon de voir l'abus de corrélation et causalité est de regarder un
exemple précis:
Une enquête, tel que rapporté dans un journal britannique, consistait à interroger
un groupe d'adolescents sur leur comportement, et déterminer si leurs parents
fument. Le journal a rapporté, en effet, que les enfants dont les parents fument
sont plus susceptibles de manifester des comportements délinquants.
Les résultats semblent montrer une corrélation entre les deux variables, de sorte
que le papier imprimé le titre: «Le tabagisme parental entraîne les enfants à mal
se conduire." Le professeur chargé de l'enquête a déclaré que les paquets de
cigarettes doivent porter des alertes aux questions sociales, aux côtés des
avertissements de santé importants.
12
Corrélation et Causalité: un exemple
Cependant, il y a un certain nombre de problèmes avec cette hypothèse. La
première est que les corrélations peuvent souvent fonctionner en sens inverse.
Par exemple, il est parfaitement possible que les parents fument à cause du stress
de s'occuper d'enfants délinquants.
Une autre cause peut être que la classe sociale provoque la corrélation, les classes
inférieures sont généralement plus susceptibles de fumer, et sont plus
susceptibles d'avoir des enfants délinquants. Par conséquent, le tabagisme des
parents et de la délinquance sont à la fois les symptômes du problème de la
pauvreté, et pourrait bien avoir aucun lien direct entre eux.
13
Corrélation et Causalité: un exemple
Préjudgés Émotives Influences causalité
Cet exemple met en évidence une autre raison derrière les erreurs de corrélation
et causalité, parce que le professeur était fortement anti-tabac. Il a été l'espoir de
trouver un lien qui appuierait son propre jugement. Cela ne veut pas dire que ses
résultats étaient inutiles, car ils ont montré qu'il ya une cause profonde des
problèmes de délinquance et de la probabilité de fumer. Ceci, cependant, n'est
pas la même chose qu'une relation de cause à effet, et il a permis à ses émotions
obscurcir son jugement. Le tabagisme est un sujet très émotif, mais les
universitaires doivent rester à l'écart et sans biais si la validité interne est de rester
intact.
14
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
Source: http://svt4vr.e-monsite.com/pages/6eme/colonisation-
plante/la-formation-des-graines.html
Source: https://fr.khanacademy.org/math/be-5eme-secondaire2h2/x741278364a599ec1:statistiques/x741278364a599ec1:nuage-de-points-et-correlation/a/constructing-
and-interpreting-a-scatterplot. 15
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
16
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
17
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
Question 2) Que peut-on dire de la relation entre la longueur de la tige et la longueur des pétales de ses fleurs ?
18
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
Question 2) Que peut-on dire de la relation entre la longueur de la tige et la longueur des pétales de ses fleurs ?
19
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
20
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales
21
Exemple 2 : Âge d'un conducteur et nombre d'accidents
22
Exemple 2 : Âge d'un conducteur et nombre d'accidents
23
Exemple 2 : Âge d'un conducteur et nombre d'accidents
24
Exemple 2 : Âge d'un conducteur et nombre d'accidents
25
Exemple 2 : Âge d'un conducteur et nombre d'accidents
26
Exemple 3 : Pointure et note au contrôle de maths
Pointure: Nombre qui indique la dimension des chaussures, des chapeaux, des gants. 27
Exemple 3 : Pointure et note au contrôle de maths
28
Exemple 3 : Pointure et note au contrôle de maths
29
Exemple 3 : Pointure et note au contrôle de maths
30
Exemple 3 : Pointure et note au contrôle de maths
31
Exemple 4
Robin a noté pendant six jours la durée, en minutes, de sa méditation du soir
et son nombre d'heures de sommeil.
32
Exemple 4
33
Exemple 5
34
Exemple 5
35
Exemple 6
36
Exemple 6
37
Exemple 7
38
Exemple 7
39
Exemple 8
Supposons un échantillon aléatoire de 4 firmes pharmaceutiques présentant
les dépenses de recherche X et les profits Y suivants (en millions de dollars)
Source: http://www.astro.ulg.ac.be/cours/magain/STAT/Stat_Main_Fr/Chapitre7.html 40
Exemple 8
50 + 60 + 40 + 50
40 + 40 + 30 + 50 𝑌ത =
ത
𝑋= 4
4
200
160 𝑌ത =
𝑋ത = 4
4
𝑌ത = 50
𝑋ത = 40
41
Exemple 8
ഥ )(𝒀 − 𝒀
= σ(𝑿 − 𝑿 ഥ)
= 40 − 40 ∗ (50 − 50) + 40 − 40 ∗ (60 − 50) + 30 − 40 ∗ (40 − 50) + 50 − 40 ∗ (50 − 50)
= 0 + 0 + −10 ∗ (−10) + 0
= +100
ഥ )(𝒀 − 𝒀
(𝑿 − 𝑿 ഥ ) = 100
42
Exemple 8
Les Ecart-Types:
200
𝑆𝑋 = = 66,7 = 8,167
3
43
Exemple 8
Les Ecart-Types:
200
𝑆𝑌 = = 66,7 = 8,167
3
44
Exemple 8
1
∗(100)
4−1
r=
(8,167)∗(8,167) La corrélation est positive et de qualité moyenne.
1
∗(100)
3
r=
66,7
r= 0,499 = 0,50
45
Exemple 8
46
Exemple 8
𝑋ത = 40 𝑌ത = 50
47
Exemple 9
Pointure des chaussures (X) et quotient intellectuel (Y) de 10 enfants d'âge
scolaire
Source: http://grasland.script.univ-paris-diderot.fr/STAT98/stat98_6/stat98_6.htm 48
Exemple 9
49
Exemple 9
On se propose d'examiner s'il existe une relation entre la capacité à épeler et la taille
des pieds : il y a quatre réponses possibles :
- plus la taille des pieds est importante, plus la capacité à épeler est importante
(RELATION POSITIVE)
- plus la taille des pieds est importante, moins la capacité à épeler est important
(RELATION NEGATIVE)
- la taille des pieds est liée au quotient intellectuel par une relation complexe
comportant au moins un maximum et un minimum (RELATION NON MONOTONE)
- la taille des pieds n'est pas liée à la capacité à épeler (RELATION NULLE)
50
Exemple 9
51
Exemple 9
52
Exemple 9
La covariance de X et Y étant égal à 64.1, on obtient le coefficient de corrélation
de X et de Y en divisant la covariance par le produit de l'écart-type de X et de
l'écart-type de Y :
r(X,Y) = 64.1 / (2.4 * 32) = +0.83
Nous sommes en présence d'une corrélation positive forte, qui semble indiquer
qu'il existe une relation linéaire (de type Y=aX+b) reliant le quotient intellectuel
des enfants et la taille de leurs pieds.