Cours Stat Karim
Cours Stat Karim
Cours Stat Karim
INTRODUCTION :
Aussi loin que l'on remonte dans le temps et dans l'espace, les États ont
toujours senti le besoin de disposer d'informations sur leurs sujets ou sur les
biens qu'ils possèdent et produisent. Mais malgré les recensements de population
et de ressources, les statistiques sont restées purement descriptives
jusqu'au17ème siècle.
I- DEFINITIONS
1- LA STATISTIQUE :
La Statistique, c'est une méthode qui consiste à réunir des données chiffrées sur
des ensembles nombreux, puis à les analyser et à les interpréter.
Page 1
ISET SFAX STATISTIQUE DESCRIPTIVE
2- LES STATISTIQUES :
Exemples :
3- STATISTIQUE DESCRIPTIVE :
A cette fin, la statistique descriptive utilise des paramètres, des graphiques et des
méthodes dites d'analyse des données (l'ordinateur a facilité le développement
de ces méthodes).
C'est l'ensemble des méthodes qui permettent de faire des prévisions, des
interpolations sur une population à partir des résultats recueillis sur un
échantillon.
Page 2
ISET SFAX STATISTIQUE DESCRIPTIVE
Exemples de populations :
2- ECHANTILLON :
4- CARACTERE STATISTIQUE :
Les données relatives à une population sont des mesures portant sur un ensemble
de caractères. Un caractère c'est un aspect observable du phénomène étudié, c'est
donc l'élément retenu pour spécifier un phénomène étudié.
Exemple : les étudiants de l’ISET peuvent être étudiés selon plusieurs critères :
âge, moyenne, taille, poids…
Les modalités d'un caractère sont les différents états possibles ou les différentes
situations possibles du caractère.
Page 3
ISET SFAX STATISTIQUE DESCRIPTIVE
6- CARACTERE QUALITATIF :
Un caractère qualitatif est un caractère dont les modalités diffèrent par leur
nature donc les modalités ne peuvent être mesurées, elles peuvent seulement être
identifiées et constatées comme la couleur des yeux, la forme juridique, la
marque…
7- CARACTERE QUANTITATIF :
C’est un caractère dont les modalités ne diffèrent pas par leur nature mais par
leur intensité comme le poids, la taille, l'âge, le revenu, ce sont les caractères
mesurables, quantifiables.
8- DISTRIBUTION STATISTIQUE :
Page 4
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 5
ISET SFAX STATISTIQUE DESCRIPTIVE
Remarque :
On parle de fréquence relative, l'effectif est donc la fréquence absolue.
La somme des fréquences relatives est égale à 1.
Exemple : répartition des employés d’une entreprise selon la qualification :
Population ; les employés d’une entreprise.
Individu ; un employé.
Caractère : qualification, nature du caractère : qualitatif.
Modalités : apprenti (A), stagiaire (S), ouvrier (O), ouvrier qualifié (Oq).
Page 6
ISET SFAX STATISTIQUE DESCRIPTIVE
2- REPRESENTATION GRAPHIQUE :
Pour une variable statistique qualitative, on utilise des diagrammes à secteurs
circulaires ou des diagrammes en tuyaux d'orgue. Le principe est de représenter
des aires proportionnelles aux fréquences de la variable statistique.
a- Diagramme à secteurs circulaires :
La population est représentée par un cercle divisé en k secteurs (k est le nombre
de modalités). Chaque secteur a un angle i tel que i = 360° x fi.
Exemple :
Modalités Fréquence fi i = 360° x fi
(qualification)
Apprenti 5/100 = 0,05 360 x 0,05 = 18°
Stagiaire 15/100 = 0,15 360 x 0,15 = 54°
Ouvrier 56/100 = 0,56 360 x 0,56 = 201,6°
Ouvrier qualifié 24/100 = 0,26 360 x 0,26 = 86,4°
Total fi = 1 i = 360°
Exemple précédent :
ni
Qualification
Page 7
ISET SFAX STATISTIQUE DESCRIPTIVE
Une variable statistique est discrète si l'ensemble des valeurs possibles est un
ensemble discret c'est à dire un ensemble de valeurs isolées, cet ensemble est
constitué en général par des nombres entiers.
Exemple : on observe pendant un mois, 50 ouvriers d’une entreprise selon le
caractère nombre de retards.
Population ; 50 employés d’une entreprise.
Individu ; un employé.
Caractère : nombre de retards, nature : quantitatif discret.
Modalités : 0 retard, 1 retard, 2 retards, 3 retards, 4 retards.
On obtient les résultats suivants : (ce sont des données individuelles)
0-1-2-0-3-1-0-2……………………-0-2-4.
Ces données individuelles peuvent être présentées sous forme d’un tableau
statistique :
Nombre de Effectif ni Fréquence
retards fi
0 8 8/50 = 0,16
1 6 0,12
2 22 0,44
3 10 0,20
4 4 0,08
Total N =ni = 50 fi =1
Page 8
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 9
ISET SFAX STATISTIQUE DESCRIPTIVE
Questions :
Quelle est la proportion des ouvriers ayant moins de 3 retards ?
Quelle est la proportion des ouvriers ayant au moins 3 retards ?
Quel est le nombre des employés ayant plus que 2 retards ?
Quel est le nombre des employés ayant au plus 2 retards ?
Quelle est la proportion des employés ayant plus qu’un retard et moins de
4 retards ?
2- REPRESENTATION GRAPHIQUE :
Page 10
ISET SFAX STATISTIQUE DESCRIPTIVE
La distribution d’une variable statistique continue peut être présentée sous forme
du tableau suivant :
[e0, e1[ n1 f1
[e1, e2[ n2 f2
[ek-1, ek[ nk fk
Remarque :
Page 11
ISET SFAX STATISTIQUE DESCRIPTIVE
Remarque :
On peut calculer pour la variable statistique continue la fréquence
(l’effectif) cumulée croissante et la fréquence (effectif) cumulée
décroissante.
Fréquence cumulée croissante = F([ei-1,ei[) = proportion (x<ei).
Fréquence cumulée décroissante = G ([ei-1,ei[) = proportion (x>=ei-1).
F([ei-1,ei[) + G ([ei-1,ei[) >1.
Exemple précédent :
Page 12
ISET SFAX STATISTIQUE DESCRIPTIVE
Quel est le nombre des employés qui touchent un salaire horaire supérieur
ou égal à 1 dinar ?
Quelles la proportion des employés qui touchent un salaire horaire
inférieur à 1,600 ?
Quelle est la proportion des employés qui touchent au moins un salaire
horaire de 1,200 ?
Quelle est la proportion des employés qui touchent au moins un salaire
horaire de 1,200 et ne dépassant pas 1,600 ?
2- REPRESENTATION GRAPHIQUE :
Comme pour les caractères discrets, la représentation graphique donne lieu à un
diagramme différentiel (histogramme), et un diagramme intégral (diagramme
cumulatif).
a- L’histogramme :
L'histogramme est la représentation graphique de la distribution d'un caractère
continu, c'est un ensemble de k rectangles juxtaposés (un par classe) dont la base
est l’amplitude ai. Quant à la surface Si, elle est proportionnelle à l'effectif ou à
la fréquence de la classe.
Remarque :
Lorsque les amplitudes des classes sont égales, l’histogramme sera
construit en prenant comme hauteur hi de chaque rectangle l’effectif ni ou
la fréquence fi.
Si les amplitudes des classes sont inégales, il faut corriger tout d’abord
l’effectif ou la fréquence et prendre par la suite comme hauteur de chaque
rectangle une de ces deux valeurs corrigées.
L’effectif corrigé = nic = (ni/ai) ; la fréquence corrigée = (fi/ai).
sera choisi comme étant l’amplitude la plus petite ou la plus fréquente.
Page 13
ISET SFAX STATISTIQUE DESCRIPTIVE
Exemple précédent :
Page 14
ISET SFAX STATISTIQUE DESCRIPTIVE
I- LE MODE
1- Définition :
Le mode d’une variable statistique (Mo) est la valeur la plus fréquente de cette
variable.
Remarque : le Mode correspond à une valeur de la variable et non pas à une
valeur de l’effectif.
2- Détermination du mode :
2-1- Cas d’une variable discrète :
Exemple 1 : la répartition des chambres d’un hôtel selon le nombre de lits par
chambre est la suivante :
Xi ni fi
1 15 0,25
2 25 0,416
3 15 0,25
4 5 0,084
60 1
Le Mode de cette variable est 2. C’est-à-dire que la plupart des chambres de cet
hôtel renferment 2 lits.
Page 15
ISET SFAX STATISTIQUE DESCRIPTIVE
Xi ni fi
[150, 200[ 50 0,2
[200, 250[ 25 0,1
Classe modale [250, 300[ 100 0,4
[300, 350[ 60 0,24
350 et plus 15 0,06
250 1
Xi ni fi fi c
[19, 20[ 32 0,16 0,16
Classe modale [20, 21[ 56 0,28 0,28
[21, 23[ 86 0,43 0,215
[23, 24[ 26 0,13 0,13
250 1
Dans le cas des amplitudes inégales, il faut tout d’abord calculer les fréquences
corrigées (ou les effectifs corrigés) puis trouver la classe modale à partir de ces
fréquences.
Page 16
ISET SFAX STATISTIQUE DESCRIPTIVE
Dans notre exemple, la classe modale est [20, 21[, c’est-à-dire que la plupart des
étudiant de ce département sont âgés entre 20 et 21 ans.
Remarque : Une distribution peut avoir plus qu’un Mode. On parle donc d’une
distribution bimodale (deux modes) ou multimodale (plus que deux modes).
Exemple : soit la distribution suivante :
Xi ni
1 50
2 50
3 40
4 30
170
Cette distribution admet deux modes qui sont 1 et 2. Il s’agit donc d’une
distribution bimodale.
II- LA MEDIANE (Mé)
1- Définition :
C’est la valeur de la variable qui divise les observations en deux parties égales.
Elle laisse autant d’observation à sa gauche qu’à sa droite.
Proportion (X< Mé) = Proportion (X > Mé) = 50%.
2- Détermination de la médiane :
2-1- Cas de N observations individuelles :
N est impair
Exemple : 5 étudiants ont eu les notes suivantes : 9 ; 9,5 ; 10,5 ; 11 ; 12
La Médiane est la valeur de la variable qui laisse autant d’observations à sa
gauche qu’à sa droite. Dans notre exemple, la Médiane est égale à 10,5
N est pair
Exemple : 6 étudiants ont eu les notes suivantes : 9 ; 9,5 ; 10,5 ; 11 ; 12 ; 13.
Dans ce cas, on a un intervalle médian [10,5 ; 11]
Page 17
ISET SFAX STATISTIQUE DESCRIPTIVE
Fi
0,916
0,666
0,5
0,25
1 2=Mé 3 4 Xi
Page 18
ISET SFAX STATISTIQUE DESCRIPTIVE
Xi ni fi Fi
[150, 200[ 50 0,2 0,2
[200, 250[ 25 0,1 0,3
[250, 300[ 100 0,4 0,7
[300, 350[ 60 0,24 0,94
350 et plus 15 0,06 1
250 1
250 Mé 300
Page 19
ISET SFAX STATISTIQUE DESCRIPTIVE
Exemple : la moyenne d’un étudiant qui a obtenu les notes suivantes : 8 ; 9,5 ;
10 ; 10,5 ; 11 ; 11 ; 12 est :
Page 20
ISET SFAX STATISTIQUE DESCRIPTIVE
1
X x130 2,16 Chaque chambre renferme en moyenne 2,16 lits.
60
2-3- Cas d’une variable statistique continue
Exemple 2 : La répartition des employés d’une entreprise selon le salaire
mensuel obtenu.
Xi ni ci ni ci
[150, 200[ 50 175 8750
[200, 250[ 25 225 5625
[250, 300[ 100 275 27500
[300, 350[ 60 325 19500
[350, 400[ 15 375 5625
250 67000
Remarque : On choisira par convention le centre de la classe comme valeur
représentative de la variable.
Le centre d’une classe [ei, ei+1[ = (ei+ei+1) / 2
1 1
X
N
n c i i
250
x67000 268 D
n x i i X 0
Démonstration :
n xi i
X ni xi X ni N X N X 0
Propriété 2 : propriété de la linéarité
Soient X et X’ deux variables statistiques telles que X’ = aX + b. Si X est la
moyenne arithmétique de la variable X, alors la moyenne arithmétique de la
variable X’ vérifie cette propriété : X ' a X b
Page 21
ISET SFAX STATISTIQUE DESCRIPTIVE
N1 X 1 N 2 X 2
d’effectif N = N1+N2, a pour moyenne : X
N1 N 2
Page 22
ISET SFAX STATISTIQUE DESCRIPTIVE
INTRODUCTION :
I- L’ETENDUE
C’est la différence entre les valeurs extrêmes prises par la variable. On l’utilise
pour avoir une première idée sur la dispersion d’une série.
Exemple : répartition des employés selon le salaire mensuel :
Page 23
ISET SFAX STATISTIQUE DESCRIPTIVE
Xi ni
[150, 200[ 50
[200, 250[ 25
[250, 300[ 100
[300, 350[ 60
[350, 400[ 15
250
L’étendue = 400 – 150 = 250.
Xmin Q1 Q2 = Mé Q3 Xmax
Page 24
ISET SFAX STATISTIQUE DESCRIPTIVE
III- LA VARIANCE
On appelle variance d’une variable statistique xi la quantité positive définie par :
1 k
V ( x) ni ( xi X ) 2
N i 1
Remarque :
k
La variance peut être calculée autrement : V ( x) f i ( xi X )
2
i 1
N
Pour une variable statistique continue, on remplace xi par les centres des
1 k
classes ci. V ( x)
N i 1
ni (ci X ) 2
La variance d’une constante est égale à 0.
V(ax+b) = a2 V(x)
Exemple : répartition des employés selon le salaire mensuel :
Xi ni ci ni*Ci Ci2 ni*Ci2
[150, 200[ 50 175 8750 30625 1531250
[200, 250[ 25 225 5625 50625 1265625
[250, 300[ 100 275 27500 75625 7562500
[300, 350[ 60 325 19500 105625 6337500
[350, 400[ 15 375 5625 140625 2109375
250 67000 18806250
1 1
X
N
ni ci
250
67000 268D
2
V(x) = 1/N (ni*Ci2 ) – X
=(1/250 * 18806250) – 2682 = 3401D2
Page 25
ISET SFAX STATISTIQUE DESCRIPTIVE
V- LE COEFFICIENT DE VARIATION
Le coefficient de variation est utilisé pour remédier au problème de la sensibilité
de la dispersion à l’unité de mesure. En effet, ce coefficient est un indicateur
sans unité.
( x)
Coefficient de variation = CV
X
VI- L’ECART ABSOLU MOYEN
On appelle écart absolu moyen la quantité définie par :
1 k
EAM = ni xi X
N i 1
Page 26
ISET SFAX STATISTIQUE DESCRIPTIVE
INTRODUCTION
Les paramètres de forme permettent de préciser l’allure de la courbe des
fréquences sans avoir besoin de la tracer. La forme sera déterminée par deux
types de coefficient :
Les coefficients d’asymétrie.
Les coefficients d’aplatissement.
I- MESURE DE L’ASYMETRIE
1- Définition :
Une distribution est dite symétrique si les valeurs de la variable observée sont
dispersées de la même manière de part et d’autre d’une valeur centrale.
Autrement dit, une distribution statistique est symétrique si les paramètres de
tendance centrale (Mode, Médiane et moyenne arithmétique) sont confondus.
Si Mode = Médiane = Moyenne arithmétique alors la distribution est
symétrique, on a autant d’observations à gauche qu’à droite de ces paramètres.
Mo = Mé = Moyenne
Distribution symétrique
Si la série n’est pas symétrique, on dit qu’elle est oblique, soit à droite, soit à
gauche.
Si Mo<Mé<Moyenne, on dit que la série est oblique à gauche ou étalée vers la
droite :
Page 27
ISET SFAX STATISTIQUE DESCRIPTIVE
Si ces deux coefficients sont égaux à zéro alors la distribution est symétrique.
S’ils sont positifs, alors la distribution est oblique à gauche. S’ils sont négatifs,
alors la distribution est oblique à droite.
Exemple : répartition des chambres d’un hôtel selon le nombre de lits par
chambre :
Page 28
ISET SFAX STATISTIQUE DESCRIPTIVE
Xi ni
1 15
2 25
3 15
4 5
60
ni
1 2 3 4 Xi
fi
Distribution aigue
Distribution normale
Distribution plate
xi
Page 29
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 30
ISET SFAX STATISTIQUE DESCRIPTIVE
INTRODUCTION :
I- DETERMINATION DE LA CONCENTRATION A
PARTIR DE LA MEDIALE :
1- Définition de la médiale :
La médiale d’une série statistique est une médiane que l’on calcule non
plus à partir des effectifs ni de la série {xi, ni} mais plutôt à partir du produit nixi
de la série {xi, nixi}.
Page 31
ISET SFAX STATISTIQUE DESCRIPTIVE
Ml [250,300[
Détermination de la médiale par interpolation linéaire :
250 Ml 300
Ml = 284,77 D
Interprétation : 50% de la masse salariale (soit 50% de 67000) est accordée aux
employés dont le salaire mensuel est inférieur à 284,77D et 50% de la masse
salariale est accordée aux employés dont le salaire mensuel dépasse 284,77D
Page 32
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 33
ISET SFAX STATISTIQUE DESCRIPTIVE
qi
A pi
Page 34
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 35
ISET SFAX STATISTIQUE DESCRIPTIVE
INTRODUCTION :
Lorsque l’on veut étudier la liaison statistique entre deux caractères
quantitatifs, la méthode la plus appropriée est celle des moindres carrés
ordinaires (MCO), dite « régression linéaire ».
I- EXEMPLE
Soit une entreprise qui veut savoir s'il existe une liaison entre ses dépenses
mensuelles de publicité et son chiffre d'affaires mensuel. Elle étudie donc les
chiffres mensuels sur un an qui sont les suivants :
Mois Dépenses publicitaires Chiffre d’affaires
En milliers de dinars En milliers de dinars
Janvier 7,04 210
Février 10,4 240
Mars 8,75 205
Avril 2,1 140
Mai 4,5 180
Juin 6 180
Juillet 3 120
Août 0,5 100
Septembre 0,84 120
Octobre 1,3 130
Novembre 7,82 230
Décembre 9,88 260
Page 36
ISET SFAX STATISTIQUE DESCRIPTIVE
1- Analyse graphique :
Le chargé d'étude fait un graphique en forme de nuage de points et remarque
alors qu'il existe une liaison positive entre les dépenses publicitaires et le chiffre
d'affaires.
Page 37
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 38
ISET SFAX STATISTIQUE DESCRIPTIVE
cov ( x, y) 1
Ou bien a
V ( x)
avec cov ( x, y)
N
xi yi X Y
Pour calculer a et b, on suivra la procédure indiquée ci-après :
Page 39
ISET SFAX STATISTIQUE DESCRIPTIVE
Page 40
ISET SFAX STATISTIQUE DESCRIPTIVE
Remarque : 0≤R2≤1
Plus ce coefficient est proche de 1, plus la qualité globale de la régression est
bonne.
Page 41