STATISTIQUE

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 17

Chapitre 7 : Appliquer les notions de bases des statistiques

1- Données statistiques :
Une donnée statistique est une information codifiée, figée et transmissible
Les données statistiques peuvent être des données numériques ou des données
alphanumériques.
Une donnée statistique peut être une donnée à caractère quantitatif ou qualitatif.
a. Données quantitatives :
Les données quantitatives sont des données qui peuvent être mesurées (taille,
poids…) ou repérées (température…).

b. Données qualitatives :
Les données qualitatives sont des données auxquelles on ne peut pas attribuer
une valeur ou une caractéristique. Par exemple : couleur, texture, odeur…

2- Tendance centrale des données statistiques :


Les mesures de tendance centrale décrivent une mesure statistique autour de
laquelle se concentrent les données d'une distribution.
Voici trois des mesures de tendance centrale les plus couramment utilisées :
i. La moyenne
De façon générale, on peut résumer la moyenne comme étant une donnée qui
représente le centre d'équilibre d'une distribution. Puisqu'il y a différents modes de
représentation des données, il existe également différentes méthodes pour calculer une
moyenne. En voici quelques exemples :
 La moyenne arithmétique :
En général, la moyenne se calcule en faisant la somme de toutes les données et
en la divisant par le nombre de données de la distribution.
𝑆𝑜𝑚𝑚𝑒 𝑑𝑒 𝑡𝑜𝑢𝑡𝑒𝑠 𝑙𝑒𝑠 𝑑𝑜𝑛𝑛é𝑒𝑠
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠
Exemple :
Voici le nombre de buts marqués par le Canadien de Montréal lors de ses 15
derniers matchs : 0, 1, 3, 2, 3, 1, 3, 4, 5, 2, 5, 1, 3, 4 et 2.
Quelle est la moyenne du nombre de buts marqués par le Canadien lors de ses 15
derniers matchs ?
0+1+3+2+3+1+3+4+5+2+5+1+3+4+2 39
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = = = 2,6
15 15
Lors de cette séquence de 15 matchs, le Canadien a marqué en moyenne 2,6
buts par match. En d'autres mots, on pourrait rationnaliser le tout en disant que le
Canadien a marqué exactement 2,6 buts à chacun de ses 15 derniers matchs.
 La moyenne pour des données condensées :
En d'autres mots, il s'agit d'une distribution où les mêmes valeurs sont répétées
plusieurs fois. Dans ce cas, il est plus simple de les regrouper. Dans ces situations, la
moyenne se calcule ainsi :
𝑆𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑝𝑟𝑜𝑑𝑢𝑖𝑡𝑠 𝑑𝑒 𝑐ℎ𝑎𝑞𝑢𝑒 𝑣𝑎𝑙𝑒𝑢𝑟 𝑝𝑎𝑟 𝑙𝑒𝑢𝑟 𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
𝑁𝑜𝑚𝑏𝑟𝑒 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠
Exemple :
Dans une équipe sportive, l’âge des 30 athlètes est représenté dans le tableau
suivant.

Age 7 8 9 10
EFFECTIF 13 9 6 2

À la lumière de ces informations, quelle est la moyenne d'âge de ce groupe ?


En d'autres mots, l'âge 7 revient à 13 reprises (7×13), l'âge 8 revient à 9 reprises
(8×9), l'âge 9 est présent 6 fois (9×6) et l'âge 10 est présent à 2 reprises (10×2).

(7 × 13) + (8 × 9) + (9 × 6) + (10 × 2)
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
13 + 9 + 6 + 2
91 + 72 + 54 + 20
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
30
237
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
30
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = 7,9 𝑎𝑛𝑠 𝑝𝑎𝑟 é𝑙é𝑣𝑒.
Finalement, l'âge moyen des élèves de ce groupe est de 7,9 ans, ce qui équivaut
à 7 ans et presque 11 mois.
 La moyenne pour des données groupées en classe :
Lorsque les données sont regroupées par classes (intervalles), cela implique
un nombre infini de valeurs. Pour relativiser le tout, on considère seulement la
valeur médiane de chacune des classes. De cette façon, on peut
déterminer la moyenne à l'aide de la formule suivante :
𝑆𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑝𝑟𝑜𝑑𝑢𝑖𝑡𝑠 𝑑𝑒𝑠 𝑚𝑖𝑙𝑖𝑒𝑢𝑥 𝑑𝑒 𝑐ℎ𝑎𝑞𝑢𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 𝑝𝑎𝑟 𝑙𝑒𝑢𝑟 𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
𝑁𝑜𝑚𝑏𝑟𝑒 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠

Exemple :
Voici la durée (en minute) du trajet en autobus effectué par 337 élèves pour se
rendre à leur école.

Durée (minutes) [10,15[ [15,20[ [20,25[ [25,30[ [30,35[ [35,40[


Nombre d’élèves 44 58 70 81 54 30

Lorsque les données sont présentées en classes, il faut utiliser le milieu de chacune
d'elles. Par la suite, c'est avec ces nouvelles valeurs médianes qu'il faudra faire les
calculs. Exemple : = 12,5

Durée (minutes) [10,15[ [15,20[ [20,25[ [25,30[ [30,35[ [35,40[


Données centrales 12,5 17,5 22,5 27,5 32,5 37,5
Nombre d’élèves 44 58 70 81 54 30

Avec ces nouvelles données centrales, on est en mesure d'interpréter que la


donnée 12,5 est présente 44 fois (12,5×44), 17,5 est apparue 58 fois dans la
distribution (17,5×58) et ainsi de suite. De cette énumération, on en déduit
l'équation suivante :
𝑀𝑜𝑦𝑒𝑛𝑛𝑒
(12,5 × 44) + (17,5 × 58) + (22,5 × 70) + (27,5 × 81) + (32,5 × 54) + (37,5 × 30)
=
44 + 58 + 70 + 81 + 54 + 30
550 + 1015 + 1575 + 2227,5 + 1755 + 1125
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
337
8247,5
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 =
337
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 ≈ 24,47 𝑚𝑖𝑛𝑢𝑡𝑒𝑠 𝑝𝑎𝑟 é𝑙é𝑣𝑒.
En moyenne, chaque élève effectue un trajet d'autobus qui dure
approximativement 24,47 minutes (ce qui correspond à 24 minutes et 28,2
secondes).
 La moyenne pondérée :
Dans le cas d'une moyenne pondérée, elle est utilisée quand les valeurs n'ont
pas toutes la même importance par rapport au résultat final. Dans ce cas, on
donne une pondération (généralement en pourcentage) à chacune des
valeurs. Par ailleurs, la somme des pondérations doit être de 100%.
Dans ce cas, on calcule la moyenne pondérée de la façon suivante :
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = 𝑆𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑝𝑟𝑜𝑑𝑢𝑖𝑡𝑠 𝑑𝑒𝑠 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑝𝑎𝑟 𝑙𝑒𝑢𝑟 𝑝𝑜𝑛𝑑é𝑟𝑎𝑡𝑖𝑜𝑛
Exemple :
Voici un tableau qui présente les résultats d'Alexandre lors de ces derniers
examens ainsi que leur pondération respective.

Résultats d’examen Pondération


Examen 1 82% 20%
Examen 2 75% 35%
Examen 3 86% 45%

Afin d'avoir la note finale d'Alexandre, calcule la moyenne associée à ces trois
résultats.
Pour faciliter le reste de la démarche, il est idéal d'écrire chacun des
pourcentages en nombre décimale.
Ainsi, 20 % = 0,20, 35 % = 0,35 et 45 % = 0,45.
Ainsi, la note globale d'Alexandre serait de :
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = (82 × 0,20) + (75 × 0,35) + (86 × 0,45)
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = 16,4 + 26,25 + 38,7
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = 81,35

Au final, la note d'Alexandre sera de 81,35%.


ii. Le mode
Le mode est la valeur ou la modalité dont l'effectif est le plus élevé.
La classe modale est l'intervalle de valeurs dont l'effectif est le plus élevé.
Pour avoir une estimation du mode, il suffit de prendre la donnée centrale de la
classe modale.
 Le mode pour des données énumérées ou condensées :
En d'autres mots, le mode correspond à la donnée qui est la plus fréquente.
Exemple :
Selon la distribution suivante : 60, 65, 67, 70, 70,72, 78, 78, 78, 84, 88, 88, 90, 95.
78 est le mode puisque c'est la donnée qui se répète le plus souvent, soit 3 fois.
Exemple :
En considérant le tableau de données condensées suivant :
Nombre d’animaux 0 1 2 3 4 TOTAL

Nombre de personnes 12 17 10 6 3 48

Il est plus facile d'identifier le mode qui correspond à 1 animal. En effet, c'est la
valeur dont l'effectif est le plus élevé (17).

 Le mode pour des données groupées en classes :


Puisque les données sont regroupées en classe (intervalle), il ne sera plus
question de mode, mais de classe modale. Même si l'expression a changé, la
façon de le déterminer demeure la même.
Exemple :
En considérant le tableau de données condensées suivant :
Age (Années) [0,5[ [5,10[ [10,15[ [15,20[

Nombre de personnes 5 17 10 8

Dans ce cas, la classe modale est [5,10[ puisque c'est la classe qui a l'effectif
le plus élevé.
Fait à noter, cette classe inclut les personnes qui ont précisément 5 ans, mais
elle exclut celles qui sont âgées d'exactement 10 ans. Il en est ainsi par
l'orientation des crochets de cet intervalle.
Pour ce qui est du mode, on peut seulement en faire une estimation en
calculant le milieu de la classe modale :
5 + 10
= 7,5 𝑎𝑛𝑠
2
iii. La médiane
La médiane est la mesure de tendance centrale qui indique le centre de la série de
données. En d'autres mots, c'est la valeur qui sépare une distribution ordonnée en
deux groupes qui contiennent le même nombre de données.

Si une série compte 𝑛 données, alors le rang de la donnée médiane sera :


𝑛+1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Deux cas peuvent survenir :

- Si 𝑛 est un nombre impair, alors sera un nombre entier et on pourra aller


chercher directement la médiane.
- Si 𝑛 est un nombre pair, alors sera un nombre décimal. Dans ce cas, on
détermine la médiane en faisant la moyenne des données centrales de la
distribution.

 La médiane dans une distribution de données non groupées :


Comme mentionné dans la formule, calculer la médiane est un processus qui
est différent selon le nombre de données contenues dans la distribution.
Exemple :
Soit le nombre de kilomètres parcourus par jour par Victor donné ci-dessous,
détermine la valeur de la médiane : 192, 196, 134, 185, 201, 188, 197.
Ordonner la distribution (placer en ordre croissant)
134, 185, 188, 192, 196, 197, 201.
Identifier la donnée qui sépare la distribution en 2 groupes égaux
Puisqu’il y a 3 données avant et 3 données après 192, alors 192 est la médiane.
En utilisant la formule avec 𝑛 = 7, on trouve :
7+1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 4 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒.
2
En retournant analyser la distribution ordonnée, on identifie celle qui est en
4éme position, soit 192.
Exemple :
Lors de son voyage, Victor est parti 8 jours plutôt que 7. Selon la distribution
suivante, détermine la valeur de la médiane.192, 196, 134, 185, 201, 188, 197,
199.
Ordonner la distribution (placer en ordre croissant)
134, 185, 188, 192, 196 , 197, 199, 201.
Identifier la donnée qui sépare la distribution en 2 groupes égaux
Avec un nombre pair de données, on voit qu'il faudrait séparer la distribution
entre 192 et 196 pour que chacun des 2 groupes ainsi formés soient égaux. Par
convention, on fait la moyenne de ces deux données pour obtenir la valeur
estimée de la médiane.
192 + 196
= 194
2
En utilisant la formule pour une distribution contenant 8 données (𝑛 = 8), on
obtient :
8+1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 4,5 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Concrètement, la 4,5é𝑚𝑒 donnée est obtenue en faisant la moyenne entre la
4éme donnée (192) et la 5-ème donnée (196).
192 + 196
= 194
2
 La médiane dans une distribution de données condensées :
Dans ce cas, la médiane est associée à la valeur située au milieu de l'effectif.
Exemple :
Soit la distribution de données condensées suivante, quelle est la médiane ?

Valeur Effectif
1 6
2 12
3 5
4 2
Total 25
On applique la formule pour trouver la position de la médiane.
25 + 1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 13 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Donc, la médiane est la 13e donnée de la distribution ordonnée.
On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on
dépasse ou égalise la valeur de la position de la médiane.

Valeur Effectif Effectif cumulé


1 6 6
2 12 18
3 5 23
4 2 25
Total 25
Avec l'effectif cumulé, on peut déduire que les 6 premières données de la
distribution sont 1, que les données situées entre la 7éme et la 18éme position
sont 2 et ainsi de suite. Selon le calcul, on veut la 13éme donnée, ce qui
correspond à la valeur 2 puisque la 13éme donnée est située entre la 7éme et
la 18éme position.
Ainsi, la médiane est 2.
Exemple :
Soit la distribution de données condensées suivante, quelle est la médiane ?

Valeur Effectif
1 9
2 16
3 19
4 6
Total 50

On applique la formule pour trouver la position de la médiane.


50 + 1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 25,5 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Donc, la médiane correspond à la moyenne entre la 25éme et la 26éme
donnée.
On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on
dépasse ou égalise la valeur de la position de la médiane.

Valeur Effectif Effectif cumulé


1 9 9
2 16 25
3 19 44
4 6 50
Total 50
Selon l'effectif cumulée, on voit que la valeur 2 est associée aux positions 10 à 25
inclusivement, Donc, la 25éme donnée vaut 2. Dans le même ordre d'idée, on
peut associer la valeur 3 aux positions 26 à 44 inclusivement. Ainsi, la 26éme
donnée vaut 3. Finalement, on calcule la moyenne de ces deux données :
3+2
= 2,5.
2
Donc, la médiane de cette distribution est 2,5.
 La médiane dans une distribution de données groupées en classes :
Pour une distribution de données groupées en classes, la classe
comportant la médiane est appelée classe médiane. Pour une
estimation de la valeur médiane, il suffit de déterminer le milieu de la
classe médiane.
Exemple :
Soit la distribution de données groupées en classes suivante, quelle est la
médiane ?

Valeur Effectif
[0,10[ 7
[10,20[ 12
[20,30[ 8
[30,40[ 14
Total 41
On applique la formule pour trouver la position de la médiane.
41 + 1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 21 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Ce qui signifie que la médiane se situe exactement à la 21éme position de la
distribution ordonnée.
On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on
dépasse ou égalise la valeur de la position de la médiane.

Valeur Effectif Effectif cumulé


[0,10[ 7 7
[10,20[ 12 19
[20,30[ 8 27
[30,40[ 14 41
Total 41
Selon la colonne de l'effectif cumulé, on déduit que la donnée qui est en
21éme position se situe entre les 20éme et 27éme positions, soit dans l'intervalle
[20, 30[. Donc, la classe médiane est [20, 30[, mais l'estimation de la donnée
médiane est :
30 + 20
𝑉𝑎𝑙𝑒𝑢𝑟 𝑚é𝑑𝑖𝑎𝑛𝑒 é𝑠𝑡𝑖𝑚é𝑒 = = 25.
2
Exemple :
Soit la distribution de données groupées en classes suivante, quelle est la
médiane ?

Valeur Effectif
[0,5[ 32
[5,10[ 28
[10,15[ 41
[15,20[ 23
Total 124

On applique la formule pour trouver la position de la médiane.


124 + 1
𝑅𝑎𝑛𝑔 𝑑𝑒 𝑙𝑎 𝑚é𝑑𝑖𝑎𝑛𝑒 = = 62,5 é𝑚𝑒 𝑑𝑜𝑛𝑛é𝑒
2
Ce qui signifie que la médiane se situe entre les 62e et 63e données de la
distribution ordonnée.
On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on
dépasse ou égalise la valeur de la position de la médiane.

Valeur Effectif Effectif cumulé


[0,5[ 32 32
[5,10[ 28 60
[10,15[ 41 101
[15,20[ 23 124
Total 124

Dans cet exemple, la 62éme et la 63éme données sont situées dans le même
intervalle, soit [10, 15[. Ainsi, la classe médiane est [10, 15[, mais la donnée
médiane estimée correspond à la valeur se situant au milieu de cet intervalle :
10 + 15
𝑉𝑎𝑙𝑒𝑢𝑟 𝑚é𝑑𝑖𝑎𝑛𝑒 é𝑠𝑡𝑖𝑚é𝑒 = = 12,5.
2
3- Paramètre de dispersion :
On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution
d'un caractère à s'étaler, à se disperser, de part et d'autre d'une valeur centrale.
Les paramètres de dispersion absolue indiquent de combien les valeurs d'une
distribution s'écartent en général de la valeur centrale de référence. Un paramètre de
dispersion absolue s'exprime toujours dans l'unité de mesure.
Les trois paramètres de dispersion absolue les plus courants sont l'étendue,
l'intervalle inter quantile, et l'écart type.

i. L’étendue ou amplitude :
Soit 𝑋 une série statistique, qui correspond à l’ensemble de la population
étudiée. On appelle étendue de la série, le réel défini par :
𝑒(𝑋) = 𝑚𝑎𝑥(𝑋) – 𝑚𝑖𝑛(𝑋)
Il s’agit de la première mesure de la dispersion d’une série statistique. Son
principal mérite a longtemps été d’exister, et de fournir une information sur la
dispersion très simple à obtenir.
ii. L’intervalle inter-quantile :
 Les quantiles :
On appelle quantile d’ordre 𝛼%, on dit aussi fractiles, et qu’on note 𝑄 , la
valeur 𝑥 du caractère telle que 𝛼% des valeurs observées soient inférieures
strictement à 𝜒 .
Autrement dit un quantile d’ordre 𝒏 est une série ayant 𝑛 groupes d’effectifs
égaux. Ainsi la médiane est un quantile d’ordre 2.
Les quantiles les plus fréquemment utilisées dans la statistique
descriptive sont :
- La médiane 𝑀 : est le quantile d’ordre 50%. Elle partage la série des
valeurs observées en deux séries de même taille.
- Les quartiles, c’est-à-dire les quantiles d’ordre 4, notée 𝑄 , 𝑄 , 𝑄 , elle
partage la série en 4 séries de même taille :
25% des observations sont inférieures au 1er quartile 𝑄 .
50% des observations sont inférieures au 2ème quartile 𝑄 .
75% des observations sont inférieures au 3ème quartile 𝑄 .
- Les déciles ; ce sont les quartiles d’ordre 10, ils partagent l’effectif total en
dix groupes égaux. Il y en a neuf déciles notés 𝐷 , 𝐷 , 𝐷 …..𝐷 .
 Les intervalles inter-quantiles :
 La différence 𝑄 − 𝑄 s’appelle écart interquartile.
 L’intervalle interdécile noté 𝐼 ou 𝐼. 𝐼𝑑 est la différence entre 𝑄 et
𝑄 , et on a :
𝐼 =𝑄 − 𝑄 , cet intervalle contient 80% des observations.
La différence 𝑄 −𝑄 s’appelle écart interdécile.
 L’intervalle interdécile noté 𝐼 ou 𝐼. 𝐼𝐶 est la différence entre 𝑄 et
𝑄 , et on a :
𝐼 =𝑄 − 𝑄 , cet intervalle contient 98% des observations.
La différence 𝑄 − 𝑄 s’appelle écart intercentile.
 Tous ces écarts permettent de mesurer la dispersion de la série
autour de la médiane.
iii. L’écart type :
 La variance :
La variance d’une série statistique 𝑋 (correspondant à la toute la
population) est le nombre noté 𝜎²(𝑋) obtenu comme moyenne des carrés
des écarts constatés par rapport à la moyenne de la série :
𝑛 (𝑥 − 𝑥̅ ) + 𝑛 (𝑥 − 𝑥̅ ) + ⋯ + 𝑛 (𝑥 − 𝑥̅ )
𝜎 (𝑋) =
𝑛 + 𝑛 + ⋯+ 𝑛
1
𝜎 (𝑋) = 𝑛 (𝑥 − 𝑥̅ )
𝑁

1
𝜎 (𝑋) = 𝑛 𝑥 ² − 𝑥̅
𝑁
La variance est égale à la moyenne des carrés moins le carré de la
moyenne.
Elle quantifie la dispersion statistique des données autour de la moyenne.

 L’écart type :
On appelle écart-type (ou déviation standard 𝜎) d’une série statistique 𝑋
(correspondant à la population) le réel noté 𝜎(𝑋) défini par :
𝜎(𝑋) = 𝜎(𝑋)²

La précision des données autour de la moyenne est donnée par l’écart-


type (la déviation standard) σ, qui est la racine carrée de la variance. Plus
la déviation standard est petite, meilleure est la précision des données.
Plus la distribution est dispersée c'est-à-dire moins les valeurs sont
concentrées autour de la moyenne, plus l'écart-type sera élevé. En d’autres
termes, Plus l'écart-type est faible, plus la population est homogène.
 Propriétés :
La variance et l’écart-type présentent les propriétés suivantes
- La variance et l’écart-type sont des nombres positifs ou nuls.
- Une variance nulle ou un écart-type nul signifient que toutes les valeurs
de la série statistique sont égales à sa moyenne.
- Plus la variance (ou l’écart-type) d’une série est grande, plus cette
série est dispersée autour de sa moyenne.
4- Type de représentations :
a. Variable qualitative :
 Diagramme à barres :
Le diagramme à barres (ou à bandes) permet de décrire les effectifs
observés. Il est utilisé pour présenter des données qualitatives.

- Chaque bande est associée à une valeur ou une modalité.


- La longueur d’une bande est proportionnelle à son effectif.
- La distance entre chacune des bandes doit être la même et la
première bande ne doit pas être collée sur l'axe qui lui est parallèle.
- La largeur des bandes doit être uniforme.
- Le diagramme doit avoir un titre et les axes doivent être identifiés selon
ce qu'ils représentent.

Exemple :

Animal de compagnie Oiseau Chat Chien Poisson


Nombre de personnes 10 20 25 30
 Diagramme circulaire
Le diagramme circulaire permet d'illustrer qu'un tout est partagé en
parties. On l'utilise pour représenter des données qualitatives.
- Chaque secteur du cercle est en lien avec une valeur ou une modalité
généralement présentée avec un pourcentage.
- L’angle d’un secteur circulaire représente la proportion d’une
catégorie par rapport au tout (360∘).
- Il doit y avoir un titre et une légende qui associe le contenu des
secteurs à une valeur ou une modalité.
Exemple :

Modalités Effectifs Fréquence Angle au


relative (%) centre (en °)
Hiver 48 30 108
Automne 24 15 54
Printemps 16 10 36
Eté 72 45 162
Total 160 100 360

Pour ce qui est de la fréquence relative, on peut la calculer selon la


proportion suivante :
𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑 𝑢𝑛𝑒 𝑚𝑜𝑑𝑎𝑙𝑖𝑡é
𝑃𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑎𝑠𝑠𝑜𝑐𝑖é à 𝑙𝑎 𝑚𝑜𝑑𝑎𝑙𝑖𝑡é = × 100
𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑡𝑜𝑡𝑎𝑙
En ce qui concerne l'angle au centre, c'est également une proportion
basée sur une égalité :
𝑃𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑎𝑠𝑠𝑜𝑐𝑖é à 𝑙𝑎 𝑚𝑜𝑑𝑎𝑙𝑖𝑡é
𝐴𝑛𝑔𝑙𝑒 𝑎𝑢 𝑐𝑒𝑛𝑡𝑟𝑒 𝑑 𝑢𝑛 𝑠𝑒𝑐𝑡𝑒𝑢𝑟 = × 360
100

Puisque le diagramme circulaire est construit à l'aide d'un cercle, on peut


utiliser ses caractéristiques afin de déduire des quantités manquantes.
b. Variable quantitative :
i. Variable discrète :
 Diagramme en bâtons :
Un diagramme en bâtons est un moyen de représenter une série statistique
dont le caractère est quantitatif discret.
Exemple :

Note 1 2 3 4 5 6 7 8 9 10
Effectif 2 1 6 5 2 9 7 1 0 1
ii. Variable classée :
 L’histogramme :
- Les bandes sont collées les unes contre les autres.
- Sur l’axe vertical, on indique la fréquence de chaque valeur.
- Sur l’axe horizontal, on indique les classes.
- Ils sont généralement utilisés pour représenter des variables quantitatives
continues qui sont regroupées en classes.
Exemple :

Age Nombre de personnes


[0, 5[ 0
[5, 10[ 7
[10, 15[ 14
[15, 20[ 20
[20, 25[ 24
[25, 30[ 16
[30, 35[ 12
Exercices :
Pour chacune des questions suivantes, entourer la (ou les) bonne(s) réponse(s) :

Dans la série : 7 2 9 9 3 La médiane est La médiane est La moyenne est La moyenne est
7 9 9 6
La série est donnée par le tableau : La médiane est La médiane est La moyenne est La moyenne est
Nombre 5 6 10 6 10 7 8
Effectif 4 5 11
On considère la série statistique : 11 5 8 11 13
; 8 ; 15 ; 4 ; 9 ; 11 ; 13 ; 6.
L’étendue de cette série statistique
est égale à :
On considère la série statistique : 11 9 11 13 15
; 8 ; 15 ; 4 ; 9 ; 11 ; 13 ; 6. Le
troisième quartile de cette série
statistique est :
On considère la série statistique : 11 50% des 63,2% des 88% des valeurs 20% des valeurs
; 8 ; 15 ; 4 ; 9 ; 11 ; 13 ; 6. Entre le valeurs de la valeurs de la de la série de la série.
premier quartile Q1 et le troisième série. série.
quartile Q3 de cette série
statistique, il y a exactement :
𝑥 , 𝑥 , … , 𝑥 les valeurs prise par L’écart-type de La moyenne de Le mode
une variable et 𝑛 , 𝑛 , … , 𝑛 les la série la série
effectifs correspondants. Soit statistique. statistique.
( . )
𝑀𝑥 =
𝑀𝑥 est …

Vous aimerez peut-être aussi

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy