Statistiques RECAP

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 32

Statistique descriptive

Récapitulatif
Cours préparé par :
El Haddad Mohamed Yassine
vocabulaire statistique
 Population : c’est l’ensemble des éléments statistiques.

 Individu : c’est un élément de l’ensemble statistique.

 Caractère : un aspect déterminé commun à tous ses éléments.

 Modalités : Les modalités sont les différents états ou les différentes valeurs d’un caractère.
Caractère ou variable statistique

Modalités: mots Variable statistique Modalités: nombres

Variable qualitative Variable quantitative

Ce sont les caractères dont les modalités non ce sont les caractères dont les modalités sont
mesurables. mesurables.

Variables Nominal Variables discrètes

Variables ordinal Variables continues


Le tableau statistique d’une variable qualitative nominale peut être représenté par deux
types de graphiques.
Les effectifs sont représentés par un diagramme en barres et les fréquences par un
diagramme en secteurs

Diagramme en secteurs des Diagramme en barres des effectifs


fréquences
Les fréquences d’une variable qualitative ordinale sont représentées au moyen d’un
diagramme en secteurs et les effectifs ou effectifs cumules croissant sont
représentés par un diagramme en barres

Diagramme en secteurs des fréquences Diagramme en barres des effectifs


Quand la variable est discrète, les effectifs sont représentés par des
bâtonnets et Les fréquences cumulées sont représentées au moyen de la
fonction de répartition.

Diagramme en bâtonnets : Fonction de répartition :


Pour les variables continus l’histogramme représente les effectifs des classes par
des rectangles continus dont la surface représente l’effectif. Et les fréquences
cumulées sont représentées au moyen de la fonction de répartition.

Histogramme : Fonction de répartition :


Comment Déterminer l’amplitude a retenir pour
une étude qui n’a pas encore démarré ?

En règle générale, on choisit au moins cinq classes de même


amplitude.
L’intervalle de classe est obtenue ensuite de la manière suivante :

Autrement Dit :

Amplitude à retenir = ( Xi max – Xi min ) / J


Les différentes caractéristiques de la variable statistique quantitative X :

Ses caractéristiques de tendance centrale : Mode, Médiane, quantiles, moyenne

Ses caractéristiques absolues de dispersion : E, IQ, e(X), V(X), σ

Ses caractéristiques relatives de dispersion : Er, IQr, er ,CV

Ses caractéristiques de forme : CYule, CP1, CP2, CF1=γ1

Une caractéristique d’aplatissement : CF2=γ2


Le mode d’une variable statistique est la modalité la plus fréquente dans la distribution. Il correspond alors, à
l’effectif ou à la fréquence la plus élevée.

La détermination du mode se diffère selon la nature du caractère.


Ainsi, dans le cas des caractères qualitatifs ou discrets, le mode est détecté par un simple regard du tableau des
données, c’est la modalité du caractère qui se répète le plus dans la distribution.

Pour un caractère continu et dans le cas d’une distribution à classes égales il va falloir le calculer par une formule.
 1  1= nCM-nCM-1
Mode BI CM  ampCM   2= nCM-nCM+1
 1   2 

Pour un caractère continu et dans le cas d’une distribution à classes ne sont pas égales il va falloir corriger les
effectifs avant de le calculer .
Effectif corrigé de la classe i = Effectif d’origine de la classe i * amplitude la plus fréquente (α)/ amplitude de la classe i (a )
i
nc= ni *α/ ai

En suite on applique la formule du Mode sur les effectifs corrigé.


la médiane d’une distribution statistique est la valeur de la variable qui partage
l’effectif total de la distribution en deux parties égales
Pour le caractère continu la médiane va nécessiter un calcul.
 N 
  nCMé  1 cc   0,5  f cc 
Me BI CMé  amp  2  BI CMé  aCMé  CMé  1 
CMé 
 nCMé cc  nCMé  1 cc  
 f CMé
cc  f CMé  1
cc 

 

Pour les autres caractères il suffit de déterminer ou se trouve N/2 (dans ni cumulé
croissant) la médiane c’est le xi correspondant
Quantiles d’un caractère continu

Comment calculer les quantiles? ( Q , D , C )

 Rang (Quantile)  nCQuantile  1 cc 


Quantile BI CQuantile  amp  
CQuantile  cc  nCQuantile  1 cc 
 nCQuantile 

Avec les fréquences la formule suivante:

 Rang (Quantile ) 
 f cc 
Quantile BI CQuantile  amp
CQuantile  1
 cc 
CQuantile


f CQuantile cc  f CQuantile  1 
La médiale, notée ML, d’une série d’observations classées préalablement
par ordre croissant, est la valeur de la variable qui partage en deux la masse
globale du caractère.

ML a pour rang ∑ni xi /2

 Rang ( Médiale)  x n 
 i i CMédiale 1 cc 
Médiale BI CMédiale  amp  
CMédiale
x n
 i i CMédiale

cc  x n
i i CMédiale 1 cc 

Pour un caractère continu xi correspond au centre des classes


Les moyennes :

Moyenne Arithmétique : Moyenne Géométrique :

k
N xj k
ni xi k
G  N  xi
ni
X 
N
  f x i
i 1 N
i
j 1 i 1 i 1

cas ou on a affaire à des valeurs absolues la moyenne de pourcentages

Moyenne Harmonique : Moyenne Quadratique :


k

n i k

f 2
 xi
i1
H  Q
n
k
i i
i 1
x i1 i

lorsqu’on a affaire a des grandeurs composé pour le calcul de la surface moyenne


Coefficients de dispersion:
1. L’étendue absolue (E) et relative (Er)

Etendue:

absolu relatif

E
E Val . max  Val . min Er 
Me
2. Les intervalles inter-quantiles
Trois types de quantiles sont à considérer, les quartiles (Q), les
déciles (D) et les centiles (ou les percentiles) (P).

absolu relatif
Iq
I q Q3  Q1 et I qr 
Q2
Id
I d D9  D1 et I dr 
D5 Me
Ip
I p  P99  P1 et I pr 
P50
Diagramme en boîte

Un diagramme en boîte montre les principaux indicateurs de


dispersion, notamment l'étendue, les quartiles et l'écart interquartile.
3. L’écart absolu moyen e(x)
l'écart absolu moyen est la moyenne de la valeur absolue des écarts à la
moyenne.

absolu relatif
k
ex   f i xi  X ex 
er x  
i 1 2X
4. variance2 , écart type  et coefficient de
variation Cv
La variance V(x)= 2(x) ou  x   V X 

V(x) =

Le coefficient de variations :

 x 
CV 
X
Moments centrés et non centrés

a. Le moment simple (non centré) d’ordre r est égal :


k
mr  f i xi
r

i 1

b. Le moment centré d’ordre r

k
 r  f i ( xi  X ) r

i 1
Les caractéristiques de forme

Les paramètres mesurant la


symétrie d’une distribution:

• Coefficient de Yule
• Coefficients de Pearson
• Coefficient de Fisher
Courbe asymétrique à gauche Courbe asymétrique à droite Courbe symétrique
Coefficient de Yule
(Q3  Q2 )  (Q2  Q1 )
CY 
(Q3  Q2 )  (Q2  Q1 )
Q3  Q1  2Q2

Q3  Q1

Si CY=0, la distribution est symétrique

Si CY> 0, la distribution est dissymétrique à droite

Si CY< 0, la distribution est dissymétrique à gauche


Le premier coefficient de Pearson

X  Mo
CP1 
 X 
Si CP1=0, la distribution est symétrique

Si CP1> 0, la distribution est dissymétrique à droite

Si CP1< 0, la distribution est dissymétrique à gauche


Le deuxième coefficient de Pearson

3X  Me 
CP2 
 X 
Si CP2=0, la distribution est symétrique

Si CP2> 0, la distribution est dissymétrique à droite

Si CP2< 0, la distribution est dissymétrique à gauche


Coefficient de Fisher

3
CF1 1 
 X 
3

Si CF1=0, la distribution est symétrique

Si CF1> 0, la distribution est dissymétrique à droite

Si CF1< 0, la distribution est dissymétrique à gauche


L’aplatissement
L’aplatissement est mesuré par le coefficient 2 de Fisher

4
C F2 2   3
 X 
4

Si 2 0 alors la courbe de la distribution étudiée est normale

Si 2  0 alors la courbe de la distribution étudiée est pointue

Si 2  0 alors la courbe de la distribution étudiée est aplatie


La concentration
100

nixi/∑nixicc en %

S5
S4
S3
S1 S2
ficc en % 100

B S S1  S 2  S 3  S 4  S 5
iG 1  5000 1  5000 1  5000
où S=S1+S2+S3+S4+S5.

S1 est la surface d’un triangle

Si est la surface d’un trapèze; i=2,3,4,5


100

nixi/∑nixicc en %

GB
S3
PB
S1 B
H h 100

ficc en %

S1= base * hauteur/2 S1=H*B/2


Si= (Petite base + Grande base). hauteur/2; i=2,3,4,5

S3=(PB+GB)*h/2
• iG 1; forte concentration
• iG 0; faible concentration
Exercice : On considère les salariés d’une entreprises que l’on classe en fonction du salaire
mensuel en dirhams. Les résultats de l’observation figurent dans le tableau ci-dessous :

Tranches de Fréquences Fréquences relatives Fréquences relatives


salaire mensuel Effectifs relatives en % Cumulées Croissantes Cumulées Décroissantes
en 1000 DH en % en %
[1,5 ; 2[ 24 --------- --------- ---------
[2 ; 2,5[ --------- --------- --------- 52
[2,5 ; 3[ --------- --------- 86 32
[3 ; 3,5 [ --------- --------- --------- ---------
[3,5 et plus --------- --------- --------- 6
TOTAL --------- --------- --------- ---------

•Compléter le tableau ci-dessus.


•Donnez la signification de la fréquence relative cumulée décroissante correspondant à la
tranche de salaire mensuel 3500 ; 3500 et plus.
•Représentez graphiquement les effectifs en considérant l’égalité des amplitudes.
•Déterminez le mode et la médiane.
•En regroupant les deux derniers intervalles en un seul , représentez la distribution et calculez
les mêmes paramètres que précédemment.
Exercice : Les importations de pétrole brut ont évolués de la façon suivante au cours des années 2018
à 2023 :

Années Pourcentage de variation par rapport à


l’année précédente
2018 -3,8
2019 -18,3
2020 +14,2
2021 -3,1
2022 -1,5
2023 +8,9

•Calculez le taux annuel moyen de variation des importations de pétrole brut au cours de la période
considérée. Quel type de moyennes ce calcul fait-il intervenir ?
•Sachant par ailleurs que le taux moyen d’augmentation des importations de pétrole brut a été de 9,2%
par an pour la période 1992-2005 (13 années) et de 12,4 % par an pour la période 2006-2017 (11
années), calculez le taux annuel moyen de variation des importations de pétrole brut au cours de la
période 1992-2023. De quel type de moyennes s’agit-il ?

Vous aimerez peut-être aussi

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy