Sunteți pe pagina 1din 19

Session universitaire : Automne-Hiver 2018-2019 (premier semestre)

Responsable de la matière : Pr. Ragbi Aziz


Chargé de TD : Bourdane Youssef

Statistique Descriptive: l’appréhension


statistique (chapitre préliminaire)
Qu’est ce que la statistique descriptive ?

✓ Définition :

La statistique est un ensemble de méthodes permettant de décrire et d’analyser, de façon


quantifiée, des phénomènes repérés par des éléments de même nature, susceptibles d’être
dénombrés et classés.

▪ Remarques :
• La statistique n’est qu’un outil préalable d’investigation plutôt qu’un modèle idéal;
• Les variables sont mesurées avec plus ou moins de précision selon les domaines d’application;
• Le dénombrement et le classement permettent à la statistique de synthétiser efficacement les
phénomènes.
• Les statistiques ne sont que les résultats numériques auxquels conduit l’application de ces
méthodes.
Vocabulaire statistique

✓ La population et les unités statistiques :

▪ La population : la statistique étudie de façon quantitative des ensembles nombreux qui


portent le nom de population. Elle dépasse largement le cadre strict de la population.

• Exemple :

➢ Ensemble d’êtres humains : la population du Maroc à la date du recensement de 2014 est de


31 millions d’habitants;

➢ Stocks d’objets concrets : le parc automobile marocain en 2014.

▪ Unité statistique : chaque population contient des éléments que l’on peut dénombrer
(habitants, salariés, automobiles, …). Les éléments de la population portent le nom d’unités
statistiques ou d’individus.
✓ Les caractéristiques statistiques :

▪ Le caractère (variable) : pour décrire une population, on repère et on classe les individus en
sous-ensemble appelés caractère.

• Exemple :

➢ La population au Maroc pourrait être décrite par des caractère tels que : sexe, âge,
nationalité, niveau de revenu … etc.

✓ Les modalités :

▪ Les modalités : chaque caractère étudié peut présenter deux ou plusieurs situations différents
que l’on appelle modalités.

• Exemple :

➢ Un individu peut être masculin ou féminin, c’est-à-dire remplir l’une des deux modalités du
caractère sexe;

➢ Il peut également satisfaire l’une des quatre modalités du caractère ‘état matrimonial’ : Marié,
célibataire, veuf ou divorcé.
▪ Echantillon : Sous ensemble de la population. Idéalement, on voudrait que ce sous-ensemble
représente bien la population (posséder les propriétés fondamentales de cette population).

❑ Pour bien comprendre :

❖ Population d’une ville à une date P

❖ Unité statistiques Les habitants

❖ Caractère Etat matrimonial 𝑥

❖ Modalité (2) Marié ou non marié 𝑥1 ou 𝑥2


Tableau statistique ou ‘distribution’ de P selon 𝑥
Modalités (𝑥𝑖 ) Effectifs (𝜂𝑖 )
𝑥1 𝜂1
𝑥2 𝜂2
. .
. .
. .

෍=𝜂
Les différents types de caractère et de variables

✓ Les types de caractères :

▪ Caractère qualitatif : un caractère est dit qualitatif lorsque son observation ne peut pas être
réduite par une mesure; ses diverses modalités sont simplement constatées, repérées par un
mot traduisant un état.

• Exemple : les caractères : Sexe, Profession, Nationalité, Couleur … ne présentant pas de


modalités mesurables, sont donc qualitatifs.

▪ Caractère quantitatif : un caractère est dit quantitatif si ses modalités sont mesurables, c’est-à-
dire traduites par des nombres qui en mesurent leurs valeurs. Le caractère prend alors le nom
de variable statistique et ses différentes modalités sont les valeurs possibles de la variable.

• Exemple : l’âge, la consommation, le revenu, la taille, le poids sont des caractères ou des
variables statistiques, dont les modalités sont mesurables dans diverses unités spécifiques.
Chaque individu de la population est repéré par un nombre.
✓ Les types de variables :

▪ Variables discrètes (ou discontinues) : une variable statistique est discrète lorsqu’elle est
mesurée par des nombres isolés (la plupart du temps des nombre entiers : 0, 1, 2, 3, 4, etc… ).

• Exemple : le nombre d’enfants par ménages, le nombre de pièces d’un appartement, ou le


nombre de salariés dans une entreprise, sont des variables statistiques discrètes.

▪ Variables continues : une variable statistique est continue lorsqu’il est à priori possible de
‘pousser’ sa mesure à des décimales. C’est-à-dire lorsque ses valeurs sont en nombre infini.

• Exemple : les grandeurs liées à l’espace (longueur, surface), au temps (âge, vitesse), à la
masse (poids, teneur), à la monnaie (salaire, chiffre d’affaires), sont considérées comme des
variables continues.
Elaboration des séries statistiques

✓ L’opérations technique qui consiste à élaborer les statistiques porte le nom


général d’enquête qui prend les formes suivantes :
▪ Le recensement : ou enquête exhaustive consiste à chiffre les données pour chaque individu
de la population enquêtée (âge, chiffre d’affaire, revenu …);

▪ Les sondages ou enquêtes partielles : permettent d’obtenir des renseignements sur une
population, sans avoir besoin d’en interroger tous ses membres (échantillon);

▪ La méthode empirique des quotas présume que l’on connaisse les principaux caractères de
cette population que l’on va étudier;

▪ La méthode de sondages probabilistes : est fondées sur la notion d’estimation. L’échantillon


est choisi de façon aléatoire.
Regroupement de données sous forme de tableaux de fréquences

✓ Regroupement de données sous forme de tableaux de fréquences :

▪ Une fois l’information quantitative collectée il s’agit ensuite de la regrouper et de la traiter


dans des tableaux et des graphes;

▪ L’objectif de ce point est de déterminer comment on présente l’information pour qu’elle soit
lisible et compréhensible.

❑ Définition : un tableau à une seule dimension se présente généralement sous la forme suivant,
ou les individus ont le même caractère 𝑥.
Modalités Effectifs
(𝑋𝑖 ) (𝜂𝑖 )
▪ À chaque modalité correspond un nombre d’individus 𝑋1 𝜂1
𝜂𝑖 appelé effectif de la modalité 𝑥𝑖 . La somme des 𝑋2 𝜂2
effectifs est l’effectif total de la population : 𝑋3 𝜂3
𝑛 . .
. .
෍ 𝜂𝑖 = 𝜂1 + 𝜂2 + 𝜂3 + ⋯ 𝜂𝑘 = 𝜂
. .
𝑖=1 𝑋𝑘 𝜂𝑘
𝜂
✓ Notion de fréquence :

❑ Définition :
▪ la fréquence ‘𝑓𝑖 ’ est la proportion d’individus présentant la même modalité dans la population
totale. Donc
𝜂𝑖 𝜂𝑖
𝑓𝑖 = ou 𝑓𝑖 % = ∗ 100
𝜂 𝜂

▪ On la calcul dans le tableau en divisant chaque effectif par l’effectif total.

✓ Les tableaux des caractères qualitatifs :


▪ Lorsqu'on est en présence de caractère non mesurables (qualitatifs) on les range dans le
tableau selon la logique qui permet au mieux l’interprétation.

• Exemple : répartition des salariés de l’entreprise 𝑋 au 31 décembre 2014


Modalités Effectifs
1. Cadres supérieurs 10
2. Contremaîtres 5
3. Employés 30
4. Ouvriers 90
spécialisés 5
5. Autres catégories
𝜂 = 140
✓ Les tableaux des caractères quantitatifs :

▪ La notion de fréquence cumulée : permet de répondre à la question ‘combien de ménage


ont plus de 2 enfants ou moins de 4 enfants par exemple;

▪ Le calcul se fait comme suit : on somme (ou ‘cumule’) les fréquences relatives ou absolues (les
effectifs) dans une colonne du tableau.

• Exemple : (variable discontinue) le tableau est de type de celui présenté plus haut : « Nombre
d’enfants par ménages »; les valeurs sont discrètes : 0, 1, 2, 3, 4.

En proportion En effectif
𝑥𝑖 𝜂𝑖 𝑓𝑖 𝑘 𝑘 𝑘 𝑘

෍ 𝑓ℎ ෍ 𝑓ℎ ෍ 𝜂ℎ ෍ 𝜂ℎ
𝑖=1 𝑖=1 𝑖=1 𝑖=1
0 2 0.2 0.2 1 2 10
1 5 0.5 0.7 0.8 7 8
2 1 0.1 0.8 0.3 8 3
3 0 0 0.8 0.2 8 2
4 2 0.2 1 0.2 10 2

‘’Moins ‘’Plus ‘’Moins ‘’Plus


de‘’ de‘’ de‘’ de‘’
▪ Variable statistique continue : les individus (ou observations) sont regroupés en classes, définies
par leurs bornes ou extrémités.

• Exemple :

Une classe de salaire mensuel : de 8000 Dh à moins de 9000 Dh

Ou : [8000 Dh; 9000 Dh[ ou [𝑒𝑖−1 ; 𝑒𝑖 [


𝑒𝑖−1 + 𝑒𝑖 8000+9000
Le centre de la classe sera donc : 𝑐𝑖 = = = 8500 𝐷ℎ
2 2
Les constructions graphiques

✓ Les graphiques sont souvent utiles pour synthétiser de façon visuelle l’information contenue
dans les tableaux statistiques.

▪ Le caractère qualitatif : deux modes de représentations graphique prédominent dans ce cas :

• Les diagrammes à « secteurs circulaires » : ils permettent de visualiser des parts relatives, dans
des surfaces ou secteurs de cercle, que l’on peut différencier par des couleurs ou des
nuances différentes.

➢ Exemple : 50% d’ouvriers; 25% d’employés; 20% de cadres; 5% de cadres supérieurs. Chaque
secteur correspond à une modalité.
5%

20%

50%

25%

ouvriers employés
cadres cadres supérieurs
• Les graphiques en « tuyaux d’orgue » : ils font apparaître des rectangles de base constantes,
dont les hauteurs sont proportionnelles aux effectifs ou aux fréquences. On ordonne
généralement les valeurs des effectifs de la plus grande à la plus faible en partant de l’origine
des axes

➢ 100 d’ouvriers; 50 d’employés; 40 de cadres; 10 de cadres supérieurs.

120

100

80

60

40

20

0
ouvriers employés cadres cadres
supérieurs
▪ Le caractère quantitatif :

• Cas des variables discrètes (ou discontinues) :

❖ Le diagramme en bâtons : A chaque valeur 𝑥𝑖 de la variable, on fait correspondre un segment


vertical de longueur proportionnelle à 𝑛𝑖 ou 𝑓𝑖 selon que l’on veut faire apparaître
respectivement des effectifs ou des fréquences relatives :

𝒙𝒊 𝒏𝒊 𝒇𝒊
0 50 0,28
1 60 0,33
2 40 0,22
3 20 0,11
4 5 0,03
5 5 0,03

180 1
❖ La courbe cumulative :

▪ il s’agit de représenter les fréquences cumulées (FC).

▪ La courbe obtenue à partir des valeurs du tableau est une courbe « en escalier » dont les
paliers sont horizontaux.

▪ Dans le cas des FC ascendantes, elle représente la proportion des individus pour lesquels la
valeur de la variable est strictement inférieure à 𝑥𝑖 .

𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵(𝒙) 𝑭(𝒙)
0 50 0,28 50 0,28
1 60 0,33 110 0,61
2 40 0,22 150 0,83
3 20 0,11 170 0,94
4 5 0,03 175 0,97
5 5 0,03 180 1
• Cas des variables continues :

✓ Dans le cas continu (ou les observations sont regroupées en classes) le diagramme de
référence s’appelle : Histogramme;

✓ Le diagramme en bâtons ne peut pas s’appliquer ici, dans la mesure ou il existe une infinité de
valeurs intermédiaires;

✓ À chaque classe de la variable, on fait correspondre la surface d’un rectangle ayant pour
base l’amplitude de la classe;

✓ Deux cas de présentent :

• Les amplitudes sont égales;

• Les amplitudes sont inégales.


✓ Reprenons le même exemple que précédemment, mais en regroupant les deux dernières
classes en une seule : on obtient :

𝒙𝒊 𝒏𝒊 𝒇𝒊 (%) 𝒂𝒊 (𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆) 𝒉𝒊 (𝒉𝒂𝒖𝒕𝒆𝒖𝒓 𝒄𝒐𝒓𝒓𝒊𝒈é𝒆 𝒅𝒖 𝒓𝒆𝒄𝒕𝒂𝒏𝒈𝒍𝒆)


[10 ;20[ 9 13,85% 10 13,85
[20 ;30[ 13 20,00% 10 20
[30 ;40[ 22 33,85% 10 33,85
[40 ;50[ 10 15,38% 10 15,38
[50 ;70[ 11 16,92% 20 8,46
65 100%

✓ La colonne 𝒂𝒊 permet de visualiser des différences d’amplitudes;

✓ La colonne 𝒉𝒊 est construite en reportant les valeurs de 𝒇𝒊 pour obtenir un histogramme en


fréquence relatives, et l’on divise 𝒇𝒊 ou 𝒏𝒊 par le rapport des amplitudes quand elles ne sont
pas égales à l’amplitude unité;

✓ Il est intéressant de connaître le nombre d’observations inférieures ou supérieures à une valeur


données, c’est-à-dire représenter les fréquences relatives ou les effectifs cumulés. Il faut pour
cela utiliser la colonne du tableau « fréquences cumulés » 𝑭(𝒙) ou 𝑵(𝒙);
✓ Dans le cas discret on a vu que l’on obtenait une « courbe en escaliers ». Dans le cas continu,
qui nous intéresse ici, on obtiendra une courbe monotone non décroissante (fréquence
cumulées ascendantes);

✓ Sur les données de l’exercice précèdent, la courbe cumulative est la suivante :

𝒙𝒊 𝒏𝒊 𝒇𝒊 (%) 𝑭 𝑿 %
[10 ;20[ 9 13,85% 13,85
[20 ;30[ 13 20,00% 33,85
[30 ;40[ 22 33,85% 67,7
[40 ;50[ 10 15,38% 83,08
[50 ;70[ 11 16,92% 100

S-ar putea să vă placă și