Documente Academic
Documente Profesional
Documente Cultură
1. Introduction
Les méthodes quantitatives sont omniprésentes dans la vie quotidienne.
Il existe tellement de firmes de sondage et chacune d’entre elles possède sa
propre méthodologie de recherche.
2. La méthode scientifique
Les premières choses à faire lorsqu’on veut faire un sondage ou une étude
sont de définir l’objet de l’étude, la problématique et les objectifs recherchés.
Il faut également s’assurer de la faisabilité du projet : échéancier, ressources
matérielles, financières et humaines. Nous ne nous attarderons pas sur ces
aspects. Voici les étapes de la méthode scientifique :
69
70 5. Statistiques descriptives Partie 1
Table 1. Les étapes de la méthode scientifique.
3. Quelques définitions
Le type d’étude que l’on choisit dépend de plusieurs facteurs. Avant de
tenter de bien comprendre ces facteurs, définissons quelques termes.
Définition 1. Quelques définitions en méthodes quantitatives :
Population cible: c’est l’ensemble de tous les individus, objets ou faits que
l’on désire étudier.
Unité statistique: c’est un élément de la population cible.
Population statistique: c’est l’ensemble de toutes les unités accessibles au
moment de l’étude.
Taille d’une population: c’est le nombre d’unités statistiques dans la po- Intuitivement...
Pour le cours,
pulation, notée par N . population
cible=population
statistique=
Exemple 5.1. Si l’objet d’étude est le nombre d’heures de travail rému- population.
néré des élèves de niveau collégial en 2008, alors la population est l’ensemble
des élèves de niveau collégial en 2008.
Exemple 5.2. Un gestionnaire veut étudier le revenu mensuel de son en-
treprise, alors la population est constituée de tous les mois depuis l’ouverture
de l’entreprise.
Exemple 5.3. Un biologiste désire étudier le nombre de poulets atteints
d’une maladie dans les fermes du Québec. Quelle est la population étudiée ?
SOLUTION
allo le monde
4. Les variables
Dans le cadre du cours de Méthodes Quantitatives pour Sciences Hu-
maines, nous allons parler surtout de sondage dont le principal outil est le
questionnaire. Cette section porte sur la façon de construire ce question-
naire, d’aborder les différents sujets à traiter et de commencer l’analyse de
ces sujets.
Intuitivement...
Le sexe, la couleur Définition 4 (Variable). Une variable est une caractéristique étudiée
préférée, le nombre de
téléviseurs par foyer
dans une population donnée.
ou encore l’âge sont
des variables. Exemple 5.4. À la session Hiver 2009, 2 professeurs à la retraite ont
effectué une enquête (sondage) sur 311 étudiants. On leur posait alors des
questions sur leurs habitudes liées à la consommation de drogue, leur travail
rémunéré, leurs études, leur milieu familial, leurs amis et leur intimité. Dé-
terminez la population, l’unité statistique, la taille de l’échantillon ainsi que
le nom de 2 variables à l’étude dans cette enquête.
SOLUTION
allo le monde
Type de variable
Qualitative Quantitative
4.1. Les échelles de mesure. L’étude des variables doit se faire avec
des outils de mesure. Il n’est pas possible de mesurer le degré de satisfaction
de la même façon qu’on peut mesurer la taille d’un individu. Voilà pour-
Intuitivement...
quoi, on utilise différentes échelles de mesures. Il existe 4 types d’échelles de
Le mot clé pour les mesure.
retenir est NOIR.
Définition 8. allo le monde
(1) L’échelle de mesure est dite Nominale si les résultats sont des mo-
Intuitivement... dalités ne possédant pas d’ordre naturel.
Un zéro arbitraire est
un zéro qui ne (2) L’échelle de mesure est dite Ordinale si les résultats possèdent un
correspond pas à une
absence. La
ordre naturel.
température en est un
exemple. Le zéro est
(3) L’échelle de mesure est dite d’Intervalles si les résultats sont des
fixé au point de valeurs ayant un zéro arbitraire.
congélation de l’eau,
alors qu’on aurait bien (4) L’échelle de mesure est dite de Rapports si les résultats sont des
pu décider de fixer le
zéro de la température valeurs ayant un zéro absolu.
au point de
congélation du Cheez
Whiz.
Exemple 5.6 (Échelle d’intervalles). Lorsque la température augmente
de 10 degrés Celsius à 20 degrés Celsius, on ne peut pas dire qu’il fait 2 fois
Intuitivement... plus chaud, parce que 10 degrés Celsius correspond à 50 degrés Farenheit et
Un zéro absolu est un
zéro qui correspond à 20 degrés Celsius correspond à 68 degrés Farenheit, ce qui ne correspond pas
une absence. Le
nombre d’heures
au double de la température. Alors on peut seulement dire qu’il fait 10 degrés
d’étude pour un de plus.
examen est mesuré à
l’aide d’une échelle de Exemple 5.7 (Échelle de rapports). Par contre, dans le cas d’une va-
rapports parce que 0
heure d’étude riable mesurée à l’aide d’une échelle de rapports, on peut affirmer qu’un élève
correspond à une
absence d’étude. qui a 2 emplois a deux fois plus d’emplois qu’un élève qui n’a qu’un seul em-
ploi.
5.4. Les variables 75
Type de variable
Qualitative Quantitative
Discrète Continue
Nominale Ordinale • Échelle ordinale • Échelle ordinale
• Échelle nominale • Échelle ordinale • Échelle d’intervalles • Échelle d’intervalles
• Échelle de rapports • Échelle de rapports
Exemple 5.8. Pour chacune des situations suggérées, identifier les élé-
ments suivants :
(1) La population
(2) L’unité statistique
(3) L’échantillon
(4) La variable
(5) Le type de variable
(6) L’échelle de mesure
a) Dans le but de déterminer le degré de satisfaction des étudiants
sur la qualité des services offerts par la Coop, on interroge les étu-
diants qui suivent un cours de méthodes quantitatives. (modalités :
peu...très satisfait)
d) On interroge tous les membres d’un club social pour savoir s’ils sont
intéressés à souscrire à une assurance médicaments. (modalités :
oui, non)
5. Le questionnaire
Il y plusieurs façons de récolter des données, telles que des grilles d’ob-
servations, des expériences, des appareils d’enregistrements et même des re-
cherches bibliographiques mais la plus utilisée est sans aucun doute le ques-
tionnaire. Dans cette section, nous verrons d’abord les 5 qualités à retenir
afin de construire un questionnaire fiable et ensuite les différents types de
question pouvant en faire partie.
Définition 9 (Base de sondage). Une base de sondage est une liste des
individus à partir de laquelle on prélève un échantillon. Cette liste détermine Intuitivement...
L’annuaire
la population. téléphonique est un
bon exemple de base
de sondage.
Il existe 4 techniques d’échantillonnage aléatoire.
(1) L’échantillonnage aléatoire simple consiste à choisir des indi-
vidus au hasard parmi la base de sondage.
Procédure :
(a) Numéroter les unités statistiques de 1 à N .
(b) Tirer au hasard n unités statistiques de la population qui for-
meront l’échantillon.
(2) L’échantillonnage aléatoire systématique est une technique où
les unités statistiques sont choisies à intervalle régulier dans la base
de sondage.
Procédure :
(a) Numéroter les unités statistiques de 1 à N.
(b) Calculer l’intervalle de sélection (le pas de sondage). On le cal-
cule avec la formule N/n.
(c) Tirer au hasard une unité statistique de la population qui fera
partie de l’échantillon.
(d) Tirer les autres unités en appliquant le pas de sondage.
(3) L’échantillonnage aléatoire stratifié suppose que la population
peut être divisée en sous-ensembles distincts en fonction de caracté-
ristiques telles que le sexe, l’âge, l’ethnie, etc... Ces différents sous-
ensembles sont appelés des strates.
Cette méthode consiste à prélever un échantillon ayant une compo-
sition plus comparable à celle de la population à l’égard des carac-
téristiques choisies.
IMPORTANT
On détermine les strates selon des caractéristiques que l’on suppose
ayant une influence sur la variable étudiée. Par exemple : le taux de
décrochage est influencé par le sexe, donc on stratifie selon le sexe.
Procédure :
(a) Diviser la population en strates.
(b) Pour chaque strate, choisir de façon aléatoire simple un nombre
d’unités statistiques pour constituer l’échantillon de telle sorte
que le pourcentage d’unités dans chacune des strates de l’échan-
tillon soit le plus près possible du pourcentage d’unités dans
chacune des strates de la population.
80 5. Statistiques descriptives Partie 1
Intuitivement...
(4) L’échantillonnage aléatoire par grappes consiste à choisir des
Un groupe d’élèves sous-ensembles plutôt que de choisir des unités statistiques isolées.
faisant partie de la
même classe, des
habitants du même
Définition 10 (grappe). Une grappe est un sous-ensemble non
immeuble, des homogène de la population défini, en général, selon la proximité.
habitants du même
quartier ou même des
équipes sportives sont Procédure :
des exemples de
grappes. (a) Diviser la population en grappes.
(b) Choisir de façon aléatoire simple un certain nombre de grappes.
(c) L’échantillon sera alors composé de toutes les unités statis-
tiques appartenant aux grappes choisies.
Voici un tableau comparant chacune des méthodes avec leurs avantages et
leurs inconvénients.
Table 2. Les techniques d’échantillonnage aléatoires.
Lorsque les résultats sont tirés d’un rapport, d’un journal ou autres, on
doit spécifier cette source. En voici un exemple :
(50.9%)
pas
très
(3.9%)
assez
peu
(10.9%)
(34.3%)
Source : M.-C. Lortie,«Les jeunes aiment leur emploi», La Presse, 20 février 2000, p.A8.
L’important ici est de savoir comment calculer l’angle que fait chaque secteur.
Pour ce faire, il faut se rappeler qu’il y a 360◦ dans un cercle. Il faut donc faire
un rapport. Commençons par l’angle du secteur de la valeur "Très satisfait",
que l’on appelle x. On a que
50.9 x
= .
100 360◦
Cette équation signifie que dans un cercle (représenté par le 360◦ ) il y a
100%. On veut savoir à combien de degrés (x) correspondent 50.9%. On
utilise donc le produit croisé pour obtenir que
360◦ × 50.9
x= = 183.24◦ .
100
Calculons maintenant l’angle pour "Assez satisfait". On utilise le même prin-
cipe.
360◦ × 34.3
x= = 123.48◦ .
100
On répète le même processus pour "Peu satisfait" et "Pas du tout satisfait".
7.2.2. Diagramme à bandes horizontales et à bandes verticales. Puis-
qu’une image vaut mille mots, voici le diagramme à bandes horizontales
des résultats tirés de la table 5.
Répartition en % des jeunes Québécois selon le degré de
satisfaction à l’égard de leur emploi
5.7. Présentation des données 87
Degré de
satisfaction
Pas du tout satisfait
Peu satisfait
Assez satisfait
Très satisfait
10 20 30 40 50 60 % des
jeunes
Québécois
Source : M.-C. Lortie,«Les jeunes aiment leur emploi», La Presse, 20 février 2000, p.A8.
50
40
30
20
10
Degré de
A
Pe
Pa
Tr
ss
ès
satisfaction
ez
du
sa
sa
sa
tis
tis
to
tis
fa
fa
ut
fa
it
it
sa
it
tis
fa
it
Source : M.-C. Lortie,«Les jeunes aiment leur emploi», La Presse, 20 février 2000, p.A8.
IMPORTANT
Il est à noter que dans chacun des cas, il y a un titre et les axes sont
identifiés et gradués.
88 5. Statistiques descriptives Partie 1
270
240
210
Nombre de 180
ménages 150
120
90
60
30
Intuitivement...
Attention les bandes
1 2 3 4 5 6 7 8Nombre de ne sont pas collées !
personnes
par ménage
90 5. Statistiques descriptives Partie 1
30
25
20
15
10
5
5 10 15 20 25 30 35 40 45 50
Âge de la mère
5.7. Présentation des données 91
b
30 b
25
20
15 b
b
10
5 b b
b b b
5 10 15 20 25 30 35 40 45 50 Intuitivement...
Âge de la mère Habituellement,
l’ogive en est une de
7.4.3. La courbe de fréquences (relatives) cumulées. La courbe de fré- fréquences relatives.
quences (relatives) cumulées ou ogive est basée sur la somme des fréquences
des classes inférieures. Il sera donc possible, par exemple, de savoir combien
(ou quel pourcentage) de mères avaient moins de 35 ans au moment de la
naissance. Voici les étapes pour tracer une ogive :
(1) Titrer le graphique
(2) Identifier les axes. L’axe horizontal est gradué selon les classes et
l’axe vertical est gradué pour les fréquences relatives cumulées, soit
de 0 % à 100%.
(3) Pour chaque classe, positionner les points sur le graphique dont les
coordonnées sont (borne supérieure de la classe ; fréquence relative
cumulée de la classe)
(4) Ajouter le point supplémentaire suivant : (borne inférieure de la
première classe, 0) afin que la courbe débute à 0%.
(5) Relier chacun des points par un segment de droite.
92 5. Statistiques descriptives Partie 1
90 b
80
70
60
b
50
40
30
20 b
10
b
b
5 10 15 20 25 30 35 40 45 50 Âge
Âge de la mère
Exemple 5.15. Complétez le tableau suivant et tracez l’histogramme, le
polygone de fréquence et l’ogive.
Répartition de 178 personnes de la petite PME «Forage inc.»
selon leur revenu annuel
Revenu
annuel Point Nombre de Pourcentage
Pourcentage
(en mil- milieu personnes cumulé
liers)
[20,25[ 1
[25,30[ 8
[30,35[ 28
[35,40[ 36
[40,45[ 42
[45,50[ 37
[50,55[ 20
[55,60[ 4
[60,65[ 2
Total 178
SOLUTION
allo le monde
allo le monde
5.7. Présentation des données 93
25
20
15
10
5
0
2060 4080 100 120 140 160
Revenu (milliers de $)
On remarque que les dernières classes n’ont pas le même ordre de grandeur
d’effectifs que les précédentes. Donc, il peut être utile de changer l’amplitude
des dernières classes. Nous aurons donc des classes de largeurs inégales. Nous
allons donc construire des classes d’amplitude 10 et une dernière classe plus
grande que les autres, d’amplitude 80.
94 5. Statistiques descriptives Partie 1
20
% de ménages
15
10
0
20 40 60 80 100 120 140 160
Revenu (milliers de $)
20
% de ménages
15
10
0
20 40 60 80 100 120 140 160
Revenu (milliers de $)
b) allo le monde
c) allo le monde
105
106 6. Statistiques descriptives Partie 2
IMPORTANT
La médiane existe seulement pour les variables quantitatives.
Pour calculer la médiane, nous devons placer les valeurs en ordre croissant.
Pour trouver la médiane, il faut d’abord trouver la position de cette dernière.
n+1
Cette position est donnée par .
2
Exemple 6.3. Soit les 7 données suivantes :
1, 2, 4, 6, 7, 13, 18
Trouvez la médiane.
SOLUTION
7+1
Calculons la position : = 4. Ainsi, la médiane se trouve à la 4e position,
2
d’où M d = 6.
Exemple 6.4. Soit les 8 données suivantes :
1, 2, 4, 6, 7, 9, 13, 18
Trouvez la médiane.
SOLUTION
6.1. Les mesures de tendance centrale 107
8+1
Calculons la position : = 4.5. Puisqu’une position ne peut être frac-
2
tionnaire, la médiane sera la moyenne des valeurs aux positions 4 et 5. D’où,
6+7
Md = = 6.5
2
Exemple 6.5. Trouvez la médiane des données suivantes :
Répartition des répondants selon le niveau d’aptitude à la lecture.
Niveau Nombre de répondants Cumulatif des répondants
1 17 17
2 23 40
3 55 95
4 155 250
Total 250
SOLUTION
allo le monde
SOLUTION
La première étape est de calculer les fréquences cumulées afin de déterminer
la classe médiane, c’est-à-dire la classe qui contient la médiane. Puisque
celle-ci se trouve à la position n+1 2 = 31, alors la classe médiane [10, 20[.
Pour trouver la valeur de la médiane, rappelons-nous l’allure de l’ogive sur
l’intervalle [10, 20[. Il s’agissait d’un segment de droite.
108 6. Statistiques descriptives Partie 2
38 b
31
22 b
10 M d 20
Puisque les trois points se situent sur la même droite, nous pouvons calculer
la pente de cette dernière de deux manières différentes ce qui nous permettra
de trouver M d.
38 − 22 31 − 22
=
20 − 10 M d − 10
9
1.6 =
M d − 10
9
M d − 10 =
1.6
M d = 15.625 ans
SOLUTION
allo le monde
6.1. Les mesures de tendance centrale 109
Définition 4 (Moyenne).
x̄ =
1 n X xk =
x1 + x2 + x3 + ... + xn
n k=1 n
µ=
1 Xx N
=
x1 + x2 + x3 + ... + xN
k
N k=1
N
2, 4, 3, 4, 2, 4, 3, 5, 5, 4, 3, 5, 5, 4, 5, 4, 3, 2, 3, 4, 5, 3, 5, 4, 3.
SOLUTION
x1 + x2 + x3 + ... + xn
x̄ =
n
x1 + x2 + x3 + ... + x25
=
25
1
= (2 + 4 + 3 + 4 + 2 + 4 + 3 + 5 + 5 + 4 + 3
25
+ 5 + 5 + 4 + 5 + 4 + 3 + 2 + 3 + 4 + 5 + 3 + 5 + 4 + 3)
95
=
25
=3.76
x̄ =
1 Xv f
k
=
v1 f1 + v2 f2 + ... + vk fk
,
i i
n i=1
n
où
• vi est la i-ème valeur
• fi est la fréquence de la i-ème valeur
• k est le nombre de valeurs possibles
SOLUTION
v1 f1 + v2 f2 + ... + vk fk
x̄ =
n
2×3+3×7+4×8+5×7
=
25
= 3.76
x̄ =
1 Xm f
k
=
m1 f1 + m2 f2 + ... + mk fk
,
i i
n i=1
n
où
• mi est le milieu de la i-ème classe
• fi est la fréquence de la i-ème classe
• k est le nombre de classes
SOLUTION
6.1. Les mesures de tendance centrale 111
m1 f1 + m2 f2 + ... + m7 f7
µ=
N
5 × 22 + 15 × 16 + 25 × 11 + 35 × 7 + 45 × 1 + 55 × 3 + 65 × 1
=
61
1145
=
61
= 18.8 ans
IMPORTANT
Il faut écrire les unités après les mesures de tendance centrale.
allo le monde
b) allo le monde
allo le monde
c) allo le monde
allo le monde
d) allo le monde
allo le monde
1.4. Caractéristiques.
• Long à calculer.
• Unique
• Influencé par les données marginales.
Moyenne Quantitatives • Utiliser lorsque les données sont symé-
triques
• Point central de l’inférence statistique.
114 6. Statistiques descriptives Partie 2
E = Vmax − Vmin
=4−1
= 3 niveaux
Pour calculer l’étendue d’une variable quantitative continue dont les ré-
sultats sont regroupés en classe, il suffit de soustraire la borne inférieure de
la classe inférieure à la borne supérieure de la classe supérieure.
Exemple 6.13. Trouvez l’étendue.
6.2. Les mesures de dispersion 115
SOLUTION
E = Limsup − Liminf
= 60 − 0
= 60 ans
P (x − µ)
N
i
2 P (x − x̄)
n
i
2
2 i=1 2 i=1
σ = s = .
N n−1
IMPORTANT
Contrairement au calcul de la moyenne, il y a une différence majeure
dans le calcul de la variance pour une population et pour un
échantillon. Dans le premier, on divise par N et dans le second, c’est
par n − 1. Ceci provient de la théorie des estimateurs et ne sera pas
abordée dans ce cours.
Il sera rare que nous travaillerons avec la variance d’une série de données.
Par contre, nous utiliserons énormément l’écart-type qui, comme on le sait,
est la racine carrée de la variance.
SOLUTION
Í
Supposons que nous savons que la moyenne est 18.
P (m − µ) f
k
i
2
i
i=1
σ=
Ê N
(5 − 18)2 × 22 + (15 − 18)2 × 16 + ... + (55 − 18)2 × 3
=
60
= 13, 70 ans
2.3. Calcul de l’écart-type avec la calculatrice. Il faut d’abord
avoir entré les données.
1) Population : ALPHA -> 6 (σ)
2) Échantillon : ALPHA -> 5 (s)
3. Le coefficient de variation
Le coefficient de variation permet de comparer la variabilité de deux sé-
ries qui ont des moyennes très différentes ou même qui ne sont pas exprimées
dans les mêmes unités puisque le coefficient de variation exprime l’écart-type
en pourcentage de la moyenne.
Définition 8 (Le coefficient de variation). Le coefficient de variation
(CV ) est donné par
σ s
CV = × 100% CV = × 100%
µ x̄
Le coefficient de variation donne l’homogénéité de la série. Si le coefficient
de variation est inférieur à 15%, on considère que les données sont homogènes
(c’est-à-dire qu’elles sont similaires) et inversement, si le coefficient de varia-
tion est supérieur à 15%, on dit que les données sont hétérogènes.
Exemple 6.16. Pour chacun des tableaux suivants, trouvez l’étendue,
l’écart-type et le coefficient de variation et interprétez le résultat.
118 6. Statistiques descriptives Partie 2
a) allo le monde
allo le monde
b) allo le monde
allo le monde
6.4. Les mesures de position 119
3.1. Caractéristiques.
• Rapide à calculer.
• Mêmes unités que la variable.
Étendue E • Ne tient compte que des données extrêmes.
• Influencé par les données marginales.
• Long à calculer.
• Mêmes unités que la variable, mais au carré.
Variance (σ 2 , s2 )
• Tient compte de toutes les données.
• Long à calculer.
• Mêmes unités que la variable.
Écart-type (σ, s) • Tient compte de toutes les données.
• Le plus utilisé.
• Long à calculer
• Aucune unité
Coefficient de va-
• Tient compte de toutes les données.
riation (CV )
• Caractérise l’homogénéité des données
Il existe deux façons d’obtenir les quantiles. La première façon est d’uti-
liser l’ogive, mais attention vous n’obtenez qu’une estimation de la réponse.
La deuxième façon donne une réponse exacte.
b
b
90
80 b
70
b
60
50
40 b
30
20
10 durée du règne (années)
0 b
Q1 10 20 30 40 50 60 70
La deuxième façon nous permet de déterminer la valeur exacte. On cherche
la première classe pour laquelle le pourcentage cumulé dépasse 25%, c’est
alors dans cette classe que se situe Q1 . Ainsi, Q1 se trouve entre 0 et 10.
On sait que la valeur 0 est associée à 0% et que la valeur 10 est associée à
36, 06%. On cherche la valeur associée à 25%. Puisque ces trois points sont
sur une même droite, on a alors
10 − 0 Q1 − 0
= .
36, 06 − 0 25 − 0
En isolant Q1 , on obtient Q1 = 6, 93ans.
Exemple 6.18. Trouvez D6 pour l’exemple précédent.
SOLUTION
D6 correspond à la valeur de la variable telle que 60% des données lui sont
inférieures ou égales. D6 appartient donc à la classe [10, 20[. Nous avons
donc un triplet de points (10, 36.06), (D6 , 60) et (20, 62.30). Puisque ces trois
points sont sur une même droite, on a alors
20 − 10 D6 − 10
= .
62.30 − 36, 06 60 − 36.06
En isolant D6 , on obtient D6 = 19.12ans.
Il en va de même pour toutes les autres mesures de position, puisque
chaque mesure de position correspond à un pourcentage précis, il sera pos-
sible de calculer de cette façon chacun des quantiles demandés.
Exemple 6.19. Voici un tableau représentant des données provenant de
statistiques canada sur le nombre de femmes au chômage :
Répartition de 902 femmes au chômage à la recherche d’emploi
selon l’âge
122 6. Statistiques descriptives Partie 2
4.2. Les rangs. Nous verrons trois types différents de rang : le rang
brut, le rang cinquième et le rang centile.
4.2.1. Le rang brut. Le rang brut sert à situer les données les unes par
rapport aux autres. Il suffit de classer les données en ordre.
Exemple 6.20. Les notes d’un examen sont les suivantes : 99, 98, 98,
98, 97, etc...
Est-ce que la personne qui a le troisième 98 est quatrième de sa classe ? ?
Bien sûr que non, elle est aussi deuxième. Par contre, la personne ayant la
note 97 se retrouve au cinquième rang puisqu’il y a 4 personnes ayant eu une
meilleure note qu’elle.
Il y a une formule très simple pour calculer le rang brut d’une donnée :
Si les données sont placées en ordre croissant :
Rb (x) = 1 + nombre de données de valeur inférieure à x
Si les données sont placées en ordre décroissant :
Rb (x) = 1 + nombre de données de valeur supérieure à x
4.2.2. Le rang cinquième et le rang centile dans le cas de variables grou-
pées par valeurs. Pour calculer le rang centile, on utilise la formule vue au
chapitre 4 :
nb de données inférieures à x + 21 nb de données égales à x
R100 (x) = × 100.
nb total de données
Pour ce qui est du rang cinquième, on peut le déterminer à partir du rang
centile de la façon suivante :
• Si R100 (x) est dans l’intervalle [80, 100[, alors R5 (x) = 1.
• Si R100 (x) est dans l’intervalle [60, 80[, alors R5 (x) = 2.
• etc...
4.2.3. Le rang cinquième et le rang centile dans le cas de données groupées
en classes. Dans le cas des variables groupées en classes, le rang cinquième
et le rang centile se calculent à l’aide d’un raisonnement similaire à celui
utilisé pour calculer les quantiles. Le prochain exemple illustre la méthode.
Exemple 6.21. Le conseil étudiant a fait un étude sur le salaire moyen
des élèves pendant leurs études collégiales.
Répartition de 500 élèves selon le revenu d’emploi (en milliers)
Revenu d’emploi Nombre d’élèves Pourcentage Pourcentage cumulé
[0, 5[ 156
[5, 10[ 184
[10, 15[ 82
[15, 20[ 42
[20, 25[ 36
Total 500
a) Complétez le tableau.
124 6. Statistiques descriptives Partie 2
b) Donnez le rang centile et le rang cinquième d’un élève qui gagne 17000
$ par année.
c) Quelle est la signification de la réponse précédente ?
d) Quelle est la valeur du 53e centile ?
e) Un élève affirme qu’il est dans le quatrième rang cinquième. Que peut-on
affirmer à propos de son revenu d’emploi ?
SOLUTION
allo le monde
6.5. Exercices récapitulatifs du chapitre 6 125
b) allo le monde
Très en désaccord, 16
En désaccord, 29
En accord, 108
126 6. Statistiques descriptives Partie 2
c) allo le monde
%
39
40 36
30
20
7 7.5
10 6
1.5 2.5 0.5
O+ O− A+ A− B+ B− AB+AB− Groupe
d) allo le monde
e) allo le monde
6.5. Exercices récapitulatifs du chapitre 6 127
Nombre d’élèves
125
100
75
50
25
8 16 24 32 40Nombre de fautes
f) allo le monde
b) allo le monde
6.5. Exercices récapitulatifs du chapitre 6 129
100 b
b b
90
b
80
70
60
b
50
40
30
20 b
10
b
b
5 10 15 20 25 30 35 40 45 50 Âge
a) Parmi les femmes qui ont donné naissance à un enfant, quel pourcentage
des mères étaient âgées de moins de 30 ans ?
6.5. Exercices récapitulatifs du chapitre 6 131
c) Trouvez l’étendue.
a) Calculez Q3 .
b) Calculez D4 et V4 .
c) Calculez C22 .
165