Sunteți pe pagina 1din 11

Statistique descriptive

Chapitre 2 : Mesures de Position, de


Dispersion

Plan du Chapitre 2
Introduction.
1. caractéristiques de position
1.1. Mode
1.2. Médiane
1.3. Moyenne
Exemples.
Introduction :On distingue 3 catégories d’indicateurs : les mesures de position (parmi
lesquelles se retrouvent les mesures de tendance centrale), les mesures de dispersion et les
mesures de forme.
1. caractéristiques de position
Parmi les mesures de position, nous avons les indicateurs qui permettent de caractériser les
individus qui occupent le centre, le milieu, qu’on appelle les mesures de tendance centrale. On
va décrire dans ce qui suit les plus importantes :
Caractéristiques de tendance centrales: sont principalement le mode, la médiane et la
moyenne
-Le mode : c’est la valeur de la modalité dominante, qui correspond au maximum de
l’effectif. Autrement dit, c’est la valeur observée qui apparaît le plus souvent. Il est désigné
par Mo.
Exemple : Une entreprise spécialisée veut lancer la fabrication d'un médicament. Elle doit
choisir celui de large consommation.

Remarque : il peut arriver que l’effectif maximal se répète deux ou plusieurs fois pour
différente valeur de la variable. On parle alors de série à deux modes (bimodale) ou à plusieurs
modes (multimodales).
Cas d’un caractère qualitatif : Si on reprend l’exemple des boissons non-alcoolisées, on avait
le tableau des fréquences suivant :
Tableau des fréquences des boissons non-alcoolisées
Boisson effectif Fréquence
CC 19 0,38
CL 8 0,16
PC 13 0,26
P 5 0,10
S 5 0,10
Total n=50 1

Alors, le mode de cette variable est Mo=Coca-Cola (CC),


Cela signifie que Coca Cola est la boisson la plus fréquemment achetée.

Graphiquement : le mode est la modalité qui correspond à la bande la plus grande


Mo=Coca Cola
Diagramme à bandes

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 2


effectif
20
18
16
14
12
10
effectif
8
6
4
2
0
CC CL PC P S

Cas discret :
Exemple : Dans une PME, on a comptabilisé le nombre de jours d’absence pour l’arrêt-maladie
de chacun des 12 employés. On s’intéresse au nombre de jours d’absence le plus demandé.

nb jours
d’absence 1 2 3 4 5 6 7 8

EFFECTIF ni
2 1 3 6 5 3 2
1

A partir du tableau, nous avons l’effectif maximum est 6, ce qui correspond à M0 = 4 jours

Graphiquement : c’est le bâton le plus élevé, donc Mo = 4 jours

Cas continu :

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 3


1er Cas : Classe de Même amplitudes : On parlera de la classe modale [xi, , xj].
C’est la classe correspondante au plus grand effectif. Pour déterminer Mo qui appartient à cette
classe, on utilise la formule suivante :
Mo= [xi hj + xj hi]/ (hi+hj )
h1=ni – nprec: excédent d’effectif de la classe modale à l’effectif de la classe précédente.
hj=nmax – nsuiv: excèdent d’effectif de la classe modale à l’effectif de la classe suivante.

Exemple : Déterminons le mode des données suivantes :


[ai-1 ai [ ni
[5 , 10 [ 350
[10 , 15[ 150
[15 , 20[ 450
[20 , 25[ 1200
[25 , 30[ 1400
[30 ,35[ 550
[35 , 40[ 200

La classe modale est : [25 - 30[


Le mode Mo = 25.95

Graphiquement, le mode se détermine de la manière suivante :

L’histogramme
COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 4
2eme Cas : Classe d’amplitudes inégales
Dans ce cas, on corrige l’effectif pour déterminer le mode ( on utilise 2eme méthode : voir en
haut)
Classe Longueur Effectif Effectif Corrigé (effectif unitaire)
[0 - 10[ 10 180 18
[10 - 15[ 5 120 24
[15 - 20[ 5 100 20
[20 - 25[ 5 45 9
[25 - 30[ 5 30 6
[30 - 40[ 10 60 6
[40 - 50[ 10 90 9
[50 - 65[ 15 90 6
[65 - 100] 35 35 1
Total 750

Classe modale : [10 - 15[


Mo= 13
Graphiquement : le mode se détermine comme suit :

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 5


-La médiane : On appelle médiane d’une série , et on note "Me" la valeur de la variable
partageant les observations classées par ordre croissant en deux groupes de même effectifs
(50%).
Cas discret :
Données groupées :
Elle se détermine à partir des fréquences cumulées ou des effectifs cumulés.

Valeur xi Effectifs cumulés Fréquences cumulées


1 191 5.4
2 816 23.1
médiane 3 2109 59.7
4 3193 90.4
5 3534 100.0

La moitié de l’effectif total : 3534/2 = 1767


Me= 3, cette modalité correspond à la fréquence cumulée qui vient après 50%.

Cas continu :
Méthode algébrique : Elle se détermine à partir des fréquences cumulées, ou d’effectifs
cumulés. Elle peut être obtenue de deux manières :
En se basant sur l’effectif :
• Me= Xi + (Xj- Xi) [ (n/2-Ni)/(Nj- Ni) ]
Tel que : Xj et Xi se sont respectivement la borne supérieure et la borne inférieure de la
classe médiane. Nj est l’effectif cumulé de la classe médiane, et Ni est l’effectif cumulé de
la classe qui précède la classe médiane.
En se basant sur la frequence :
• Me= Xi + (Xj- Xi) [ (50-Fi)/(Fj- Fi) ]
OU Fj est la fréquence cumulée de la classe médiane, et Fi est la fréquence cumulée de la classe
qui précède la classe médiane.
Détermination Graphique :
A partir de la courbe des fréquences cumulées, la médiane est la valeur de la variable associée
à la fréquence cumulée 50%.

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 6


Exemple : Déterminez le salaire médian pour 200 employés d’une entreprise. (Indiquez votre
réponse avec une précision de 2 décimales).
Salaires (UM) effectif Effectif cumulés
[500,1000[ 80 80
[1000,1200[ 60 140
[1200,1500[ 30 170
[1500,2000[ 20 190
[2000,3000[ 10 200
Total 200

Etape 1 : détermination de la classe contenant la médiane


L'effectif cumulé théoriquement associé à la médiane est égal à n/2 = 200/2=100. La classe
contenant la médiane est, dans la liste des classes, la première classe à avoir un effectif cumulé
supérieur ou égal à ; il s'agit donc de
Etape 2 : détermination de la valeur de la médiane dans la classe médiane
𝟏𝟎𝟎−𝟖𝟎
Me=1000+(1200-1000)[𝟏𝟒𝟎−𝟖𝟎] 100 = 1066.67

Le salaire médian est donc égal à 1066.67 unités monétaires ; approximativement la moitié des
200 travailleurs de l'entreprise perçoit un salaire inférieur ou égal à ce salaire.
Détermination graphique de la médiane :

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 7


Remarque : si on utilise les fréquences cumulées, c’est le points qui correspond à 50%

La moyenne
Cas des données brutes :
La moyenne est égale à la somme des valeurs prises par cette variable divisée par le nombre n
d’observation. Elle est appelée moyenne arithmétique

x = [(x1+x2+…+xk) / n] = 1/n ∑xi

Données groupées : Soit une variable pouvant prendre les valeurs x1,…..,xk aux quelles
correspondent respectivement les effectifs n1,…..,nk ; la moyenne pondérée est :

X = [(n1x1+n2x2+…+nkxk) / (n)] = 1/n∑nixi = f1x1+f2x2+…+fkxk


Ou fi=ni/n ; ∑fi=1.

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 8


Si la variable est quantitative continue, alors les xi sont les centres de classe
Remarque : On utilise directement le terme : « moyenne »
Exemple : soit les notes obtenues lors d’un test :
2 1 1.5 2 3 17 18 18 19 18.5

La moyenne obtenue du groupe est égale à : 𝑋̅ = 10

En regardant les notes, on remarque que la moyenne ne reflète pas les notes obtenues. Donc,
cette moyenne est non représentative.

Remarque à retenir : La moyenne est dépourvue de sens physique


Exemple : ce tableau présente les nombres de jours d'absence de 20 salariés d'une usine au
cours d'une année :
Nbre de jours d absences 0 1 2 3 4 5 7
effectif 3 5 2 2 3 3 1

Le nombre d’absence moyen : 4.55


On remarque que la moyenne est influencée par les valeurs extrêmes (anormalement élevée)
Exemple : ci-joint les tranches de salaire en unité monétaire des employés d’une entreprise :
salaires [500,1000[ [1000,1200[ [1200,1500[ [1500,2000[ [2000,3000[
effectifs 80 60 30 20 10

Exemple : Déterminez le salaire moyen (indiquez votre réponse avec une précision de
1 décimale).

Salaires Centre de classe Effectif ni*xi

[500 , 1000[ 750 80 60 000


[1000 , 1200[ 1 100 60 66 000
[1200 , 1500[ 1 350 30 40 500
[1500 , 2000[ 1 750 20 35 000

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 9


[2000 , 3000[ 2 500 10 25 000
Total 200 226 500

Le salaire moyen est égal à 226 500/200=1 132.5 unités monétaires. Vous remarquez que cette
valeur n’apporte pas une information sur les salaires ses employés.

Positions respectives du mode, de la médiane, et de la moyenne :


Nous avons trois possibilités :
Les trois caractéristiques de tendance centrale sont confondues (sont égales) : on dit que la
distribution est symétrique,

la médiane est généralement comprise entre le mode et la moyenne, et plus proche de cette
dernière. Alors, la distribution est asymétrique,

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 10


4- CARACTERISTIQUES DE DISPERSION
4.1. LA VARIANCE : DEFINITION
On donne la séries{x1,……. xp} avec les effectifs respectifs {n1,…….np }vérifiant
n1 +…+ np= n .
La variance de cette série est la moyenne arithmétique des carrés des écarts à la moyenne
arithmétique
V(x) = 1/n ∑ni ( xi- moyenne)2
L’écart-type x est égal à la racine carrée de la variance :

x = Racine carré de la variance

La variance de cette série est la moyenne arithmétique des carrés des écarts à la moyenne
arithmétique

1 p
V(x) = 
n i 1
( xi  x ) 2

𝟏
̅) 𝟐
V(x) = 𝒏 ∑𝒏𝒊(𝒙𝒊 − 𝒙

L’écart-type x est égal à la racine carrée de la variance :

x = var(x)

C’est l’indicateur statistique qui permet de mesurer la dispersion des observation par rapport à
la valeur moyenne (moyenne arithmétique).

Exemple
On donne la série suivante :
X : 6, 8, 10, 12,14
Il est aisé de voir que la moyenne est égale à 10, et l’écart-type est :
V(x) = 8 donc l’écart-type sera 2,828.

COURS STATISTIQUE Descriptive /Enseignant : Pr. H.DJEMA/EHEC Page 11

S-ar putea să vă placă și