Documente Academic
Documente Profesional
Documente Cultură
INS
PLAN DE L’EXPOSE
I - Utilité de la Statistique
II - Différence entre Recensement et sondage
aléatoire
III- Quelques définitions
IV - Principales caractéristiques de tendances
centrales
V - Résumés visuels en statistique
VI- Exercices d’application
I- Utilité de la Statistique
La statistique est conçue comme une aide
à la décision en environnement incertain.
Son objectif est donc de fournir des
prévisions à partir d’un modèle
mathématique qui rend compte des
variations du phénomène étudié.
I- Utilité de la Statistique
La statistique est dialectique dans son
approche: elle part du concret des données à
l’abstrait du modèle pour faire des prévisions
concrètes. L’utilisation pertinente de la
statistique passe donc non seulement par la
connaissance des différents modèles et leurs
propriétés mais aussi par l’apprentissage de leur
mise en œuvre. Ce module de présentation vise
à nous familiariser avec quelques notions de
statistiques pour leur mise en œuvre.
II- Différence entre Recensement et
sondage aléatoire
Recensement
Le recensement est une opération de
collecte exhaustive sur l’ensemble Ω
(univers) de la population étudiée.
Ω (Univers)
Populations
Le sondage
Ω
Échantillon
Masculin 20 1 21
Feminin 13 2 15
T 33 3 36
2- Les variables quantitatives
30
Moyenne 10 Médecins par province
3
Pour généraliser, supposons une
population ou un échantillon de n
observations notées x1, x2, …, xn
La moyenne symbolise par X est obtenu
en calculant la somme et en la divisant par
le total.
1
Moyenne X ( x1 x2 ... xn )
n
ii- La médiane
Définition
Pour les variables quantitatives, la notion
d’ordre a un sens. La médiane est la
valeur qui scinde la population classée
dans l’ordre croissant en deux sous
populations de taille égale.
ii- La médiane
Formule de calcul
Pour une série ordonnée n = 2p+1, la médiane est M=
(n+1)/2
(exemple soit le série 1,2,3,4,5,6,7. M= (7+1)/2 soit 4)
Pour une série ordonnée n= 2p, M est un intervalle
médian. Exemple soit la série 1,2,3,4,5,6 M= 3,5 qui
appartient bien à [3, 4]
Pour une série de données groupées selon le tableau
suivant on procède par interpolation.
i- La médiane
Formule de calcul
Pour une série de données groupées selon le tableau
suivant on procède par interpolation.
50 Fi 1
a
M = i 1 ( ai ai 1 )
Fi Fi 1
iii Le mode
F cumulée F cumulée
fi absolues fi relatives croissante fi absolues fi relative croissante
Classes avril avril avril mais mai mai
150 à moins de 200 0 0 0 3 16,67 16,67
200 --- 250 4 22,22 22,22 5 27,78 44,45
250 --- 300 3 16,67 38,89 3 16,67 61,11
300 --- 350 1 5,56 44,44 2 11,11 72,23
350 --- 400 2 11,11 55,56 2 11,11 83,34
400 --- 450 3 16,67 72,22 1 5,56 88,89
450 --- 500 1 5,56 77,78 1 5,56 94,45
500 --- 550 2 11,11 88,89 1 5,56 100,00
550 --- 600 2 11,11 100,00 0 0 100,00
Total 18 100 // 18 100 //
Xi fi fixi fixi2 yi fi fiyi fiyi2
175 0 0 0 175 3 525 91875
225 4 900 202500 225 5 1125 253125
275 3 825 226875 275 3 825 226875
325 1 325 105625 325 2 650 211250
375 2 750 281250 375 2 750 281250
425 3 1275 541875 425 1 425 180625
475 1 475 225625 475 1 475 225625
525 2 1050 551250 525 1 525 275625
575 2 1150 661250 575 0 0 0
18 6750 2796250 18 5300 1746250
ai1ai
CentredeclasseXi=
2
RUBRIQUES Formules Valeuravril Valeur mai
18
f X i i
Moyennes i1 375 294
f i1
i
Médianes/ 50Fi1
(intervalles médians) ai1 (ai ai1) 375 / (350---400) 267/ (250---300)
Fi Fi1
Sur legraphiqueoudans le
tableaude fréquences on
Modes 200--250
apprécie la modalité (classe
modale) laplus représentative
18
f X
2
i i
Ecart-types i1
m2 121 102
fi1
i
Interprétation:
En moyenne,294 patients ont été reçus à l’HPM
au mois de mai contre 375 au mois d’avril.
L’écart-type du mois de mai (102) est très
inférieur à celui du moi d’avril (121). Cette faible
dispersion pour le moi de mai montre que: les
patients de mai dont l’effectif chaque année est
plus proches de la moyenne sont les plus
réguliers par rapport à ceux du mois d’avril.
V - Résumés visuels en statistique
Une série statistique peut être envisagée selon
deux points de vue: celui de la variabilité et celui
de la stabilité de ses valeurs autour d’une valeur
centrale.
Variabilité ou stabilité ne sont pas toujours
clairement perceptibles au niveau des données
numériques et il peut être utile alors de tenter de
les faire apparaître au travers d’un graphique
approprié.
Le graphique est étroitement lié à la nature de la
variable et de la forme des données qu’il illustre.
V - Résumés visuels en
statistique
a)- Variables qualitatives
Les représentations graphiques que l’on
rencontre avec les variables qualitatives
sont assez nombreuses. Les trois plus
courantes, qui sont aussi les plus
appropriées, sont :
le diagramme en colonne,
le diagramme en barre,
le diagramme en secteur.
a.1 Diagramme en colonne
Le diagramme en colonne est constitué de
colonnes de largeurs égales, de hauteurs
proportionnelles aux fréquences
d’apparition de chacune des modalités de
la variable.
répartition des enfants selon leur poids à la
naissance
50%
40%
pourcentage d'enfants
30%
effectifs
20%
10%
0%
<3 3 à 3,5 3,5 à 4 4 et +
poids
a.2 Diagramme en barre
100%
11%
90%
80%
22%
70%
60%
50%
40% 39%
30%
20%
10% 17%
0%
<3 3 à 3,5 1 3,5 à 4 4 et +
a.3 Diagramme en secteur
4 et + <3
13% 19%
3,5 à 4
25%
3 à 3,5
43%
b)- Variables quantitatives
Trois graphiques permettent de faire un
résumé visuel d’un caractère quantitatif :
L’HISTOGRAMME
b.2 L’Histogramme
Dans le cas d’un échantillon, on cherche à
approcher par une estimation empirique le
graphe de la densité de la loi théorique
associée à la population.
L’histogramme en est un exemple. Une
fois déterminée un découpage en classes
de l’ensemble des valeurs et les
fréquences d’occurrences de ces classes,
un histogramme est la juxtaposition de
rectangles dont les aires valent la
fréquence de la classe correspondante
Diagramme en bâtons
Le diagramme en bâton permet d’illustrer la variabilité d’une série
aux données groupées issue de l’observation d’une variable
quantitative discrète.
Le graphique ci-dessous représente la répartition du nombre
d’enfants par employé dans l’Hôpital provincial de Maroua en 2004
Nbre 9
d’enfants 8
7
6
5
4 HPM
3
2
1
0
Employés
a b c d e j t u s o n q
Diagramme de dispersion
Le diagramme de dispersion permet d’illustrer la variabilité d’une série
ponctuelle issue de l’observation d’une variable quantitative discrète.
L’exemple ci-contre représente le nombre N de naissances par
mois dans le service de maternité de l’Hôpital provincial de Maroua
en 2004
Nbre de naissance
100
80
O
60
40
O
20 O
0
J F M A M J J A S O N D Mois
Exercices d’application
Les exercices sont constitués de QCM
Le principe consiste à cocher la case
correspondant à la bonne réponse
1- On note T la tension artérielle systolique, en
mm de mercure des 65 patients présents le
13/01/91 dans le service de cardiologie de
l’hôpital de district de Maroua. La population P
étudiée est formée par:
a l’ensemble des malades
b l’ensemble des cardiaques
c les 65 patients présents le 13/01/91 dans le
service de cardiologie de l’hôpital de district de
Maroua.
3- on observe le poids à la naissance de 10 bébés, poids
consignés dans le tableau ci-dessous
i 1 2 3 4 5 6 7 8 9 10
P 3.1 2.7 2.5 3.9 4.0 4.1 3.9 3.3 3.6 3.7
pourcentage 23 27 38 10 2
a) Résumer l’information
b) Caractériser l’aspect stable,
c) Caractériser l’aspect variable.
a) La moyenne arithmétique;
b) la médiane;
c) l’écart- type;
d) la variance.
Le tableau suivant donne la répartition en F des
revenus dans une population P déterminée.