Statistique Descriptive: Enseignant: Pegdwind e Ouss Eni Fabrice OUEDRAOGO
Statistique Descriptive: Enseignant: Pegdwind e Ouss Eni Fabrice OUEDRAOGO
Statistique Descriptive: Enseignant: Pegdwind e Ouss Eni Fabrice OUEDRAOGO
Statistique univariée
Enseignant:
Pegdwindé Ousséni Fabrice OUEDRAOGO
Licence 1, Géologie
Institut Teng-Tuuma Géoscience de Ouagadougou (I.T.T.G.O)
2019-2020
Tableau de données
Note à l’examen
Individu Couleur des yeux Sexe Mention au Bac de statistiques
Michel V H P 12
Jean B H AB 8
Stéphane N H P 13
Charles M H P 11
Agnès B F AB 10
Nadine V F P 9
Etienne N H B 16
Giles M H AB 14
Aurélie B F P 11
Stéphanie V F B 15
Marie-Claude N F P 4
Anne B F TB 18
Christophe V H AB 12
Pierre N H P 6
Bernadette M F P 2
J
X
n = n1 + n2 + · · · + nJ soit n= nj
j=1
ou en cas de pourcentage,
J
X
0 ≤ fj ≤ 100, j = 1, . . . , J et fj = 100
j=1
M M D C C M C C C M
C M V M V D C C C M
xj C M V D Total
nj 9 7 2 2 20
fj 0.45 0.35 0.10 0.10 1
♠ Une variable qualitative est dite définie sur une échelle nomimale si
ses modalités ne sont pas naturellement ordonnées.
Exemple : La variable couleur des yeux , la variable sexe, . . ..
♠ Elle est dite définie sur une échelle ordinale si l’ensemble de ses
modalités peut être doté d’une relation d’ordre.
Exemple : La variable mention au Bac, . . .
où xmax (resp. xmin ) désigne la plus grande (resp. la plus petite)
valeur observée.
152 154 156 157 159 161 162 164 168 170
152 154 156 157 159 160 162 164 168 171
152 154 156 157 160 160 163 165 168 171
153 155 156 158 160 161 164 166 169 171
153 155 156 158 160 162 164 167 169 171
[151.5; 154.5[
[154.5; 157.5[
[157.5; 160.5[
[160.5; 163.5[
[163.5; 166.5[
[166.5; 169.5[
[169.5; 172.5[
[cj− ; cj+ [ nj fj
[151.5; 154.5[ 8 0.16
[154.5; 157.5[ 10 0.2
[157.5; 160.5[ 9 0.18
[160.5; 163.5[ 6 0.12
[163.5; 166.5[ 6 0.12
[166.5; 169.5[ 6 0.12
[169.5; 172.5[ 5 0.1
50 1.0
J
X
nj cd = nk
k=j
J
X
fj cd = fk
k=j
xj C M V D
nj 9 7 2 2
fj 0.45 0.35 0.10 0.10
nj cc 9 16 18 20
fj cc 0.45 0.80 0.90 1.00
zj nj nj cc fj fj cc
1 5 5 0.10 0.10
2 9 14 0.18 0.28
3 15 29 0.30 0.58
4 10 39 0.20 0.78
5 6 45 0.12 0.90
6 3 48 0.06 0.96
8 2 50 0.04 1.00
50 1.0
Nous allons ici étudier les variables couleur des yeux (variable qualitative
nominale) et mention au Bac (variable qualitative ordinale).
Mention au Bac nj nj cc fj fj cc
P 8 8 0.5333 0.5333
AB 4 12 0.2667 0.8000
B 2 14 0.1333 0.9333
TB 1 15 0.0667 1.0000
15 1.0000
Dans le cas des variables quantitatives continues, les effectifs aussi bien
que les fréquences sont représentés par des histogrammes. L’histogramme
consiste à représenter les effectifs (resp. fréquences) par des rectangles
dont la surface (et non la hauteur) représente l’effectif (resp. la fréquence).
X Pour un histogramme des effectifs, la hauteur du rectangle
correspondant à la classe j est donnée par :
nj
hj =
aj
[cj− ; cj+ [ nj nj cc fj fj cc
[151.5; 154.5[ 8 8 0.16 0.16
[154.5; 157.5[ 10 18 0.20 0.36
[157.5; 160.5[ 9 27 0.18 0.54
[160.5; 163.5[ 6 33 0.12 0.66
[163.5; 166.5[ 6 39 0.12 0.78
[166.5; 169.5[ 6 45 0.12 0.90
[169.5; 172.5[ 5 50 0.10 1.00
50 1.00
On a ai = 3, j = 1, . . . , J avec J = 7.
Remarque :
Le mode peut être calculé pour tout type de variable, quantitative et
qualitative.
Le mode n’est pas nécessairement unique. Par exemple dans le cas du
tableau statistique de la variable couleur des yeux, les modes sont :
”Bleu”, ”Noir” et ”Vert”.
Quand une variable continue est découpée en classes, on peut définir
une classe modale (classe correspondant à l’effectif le plus élevé).
Par exemple dans le tableau de répartition de la variable classée taille
des élève, la classe modale est [154.5; 157.5[ .
La moyenne est la somme des valeurs observées divisée par leur nombre,
elle est notée x̄.
n
x1 + x2 + · · · + xi + · · · + xn 1X
x̄ = = xi
n n
i=1
La moyenne peut être calculée à partir des valeurs distinctes et des effectifs
J
1X
x̄ = nj xj
n
j=1
2×0+3×1+1×2+1×3+1×4
x̄ = = 1.5
8
n
!1/n
Y
G= xi = (x1 × x2 × · · · × xn )1/n
i=1
Le bon taux moyen est G et non x̄, car si on applique 4 fois le taux moyen
G aux 100 francs, on obtient
H ≤ G ≤ x̄
Note 5 4 3 6 5
Crédits 6 3 4 3 4
x1/2 = F −1 (0.5)
En général on note x(1) , x(2) , . . . , x(i) , . . . x(n) la série ordonnée par ordre
croissant. On appelle cette série ordonnée la statistique d’ordre. Cette
notation très usuelle en statistique permet de définir la médiane de
manière très synthétique.
- Si n est impair
x1/2 = x( n+1 )
2
- Si n est pair
1n o
x1/2 = x( n2 ) + x( n2 +1)
2
Remarque : La médiane peut être calculée sur des variables quantitatives
et sur des variables qualitatives ordinale
xp = x(dnpe) ,
où dnpe représente le plus petit nombre entier supérieur ou égal à np.
Remarque :
- La médiane est le quantile d’ordre p = 1/2,
- On utilise souvent
x1/4 le premier quartile,
x3/4 le troisième quartile,
x1/10 le premier décile,
x1/5 le premier quintile,
x4/5 le quatrième quintile,
x9/10 le neuvième décile,
x0.05 le cinquième percentile,
x0.95 le nonante-cinquième percentile.
- Si F (x) est la fonction de répartition, alors F (xp ) ≥ p.
Exemple : Soit la série statistique 12, 13, 15, 16, 18, 19, 22, 24, 25, 27
contenant 10 observations (n = 10).
- Le premier quartile : Comme np = 0.25 × 10 = 2.5 n’est pas un
nombre entier, on a
La variance est la somme des carrés des écarts à la moyenne divisée par le
nombre d’observations :
n
1X
sx2 = (xi − x̄)2
n
i=1
La variance peut également être définie à partir des effectifs et des valeurs
distinctes :
La variance peut également être définie à partir des effectifs et des valeurs
distinctes :
J
2 1X
sx = nj (xj − x̄)2
n
j=1
ou
J
1X
sx2 = nj xj2 − x̄ 2
n
j=1
L’écart moyen absolu est la somme des valeurs absolues des écarts à la
moyenne divisé par le nombre d’observations :
n
1X
emoy = |xi − x̄|
n
i=1
L’écart médian absolu est la somme des valeurs absolues des écarts à la
médiane divisé par le nombre d’observations :
n
1X
emed = |xi − x1/2 |
n
i=1
m10 = x̄
m1 = 0
n
1X 2
m20 = xi = sx2 − x̄
n
i=1
m2 = sx2
Tous les coefficients d’asymétrie ont les mêmes propriétés, ils sont nuls si
la distribution est symétrique, négatifs si la distribution est allongée à
gauche (left asymetry), et positifs si la distribution est allongée à droite
(right asymetry)
g2 = β 2 − 3