Sunteți pe pagina 1din 30

2017-2018

Faculté des Sciences de Kénitra

IBN TOFAIL
UNIVERSITE
Pr Hinde HAMI
OBJECTIFS

Se familiariser avec le vocabulaire de la statistique


descriptive;
Fournir des outils de base permettant de décrire des
données statistiques.
La Statistique,… c’est quoi ?

Statistique descriptive, 2017-2018


DÉFINITIONS

Statistiques: Ensemble cohérent de données numériques relatives à un


groupe d’individus.
Ex: Statistiques démographiques, Statistiques du chômage
Statistique: Ensemble des méthodes qui permettent de rassembler, de
présenter, d’analyser et d’interpréter les données associées à une
situation ou à un phénomène.

Statistique descriptive: Ensemble des méthodes permettant de décrire, de


résumer et de présenter les données observées sous la forme la plus
accessible : Tableaux, graphiques, pourcentages et indicateurs ou résumés
numériques (moyenne, médiane…..)
LA DÉMARCHE STATISTIQUE

Toute étude statistique se fonde sur une population formée de


nombreux individus sur lesquels on peut observer des caractères
(variables).
VOCABULAIRE DE BASE

Population: ensemble des personnes, objets ou éléments sur lesquels


on veut effectuer l’étude statistique;

Échantillon: c’est un sous-ensemble de la population;


Echantillon
Population Individu
Individu (ou unité statistique): chacun des éléments de la population;
Variable (ou caractère): caractéristique relative à chacun des individus
de la population
Sur la même population, on peut s'intéresser à plusieurs variables telles
l'âge, le sexe, la filière…
variable

Quantitative Qualitative

Discrète Continue Nominale ordinale

Nombre d’enfants Poids Groupes sanguins Mention


Taille Couleur Stade d’une
Salaire Profession maladie
Etat matrimonial Taille vestimentaire
Exemple 1

Une étude sur le poids de chacun des enfants d’un groupe d’enfants
de 7 ans donne la série suivante (en Kg)
22 25 23 25 24 19 23 18 20 21 19 22 20 17
21 23 24 23 17 21 20 20 19 22 19 20 19 21

Il s'agit d'une série statistique brute résultant de la mesure de la variable


(ou caractère)………………sur les individus (ou unités statistiques)……………
La population étudiée comporte……………individus.
La nature de la variable étudiée: ……………
Exemple 1

Série brute
22 25 23 25 24 19 23 18 20 21 19 22 20 17
21 23 24 23 17 21 20 20 19 22 19 20 19 21

1. Classer le caractère étudié par ordre croissant en fonction de son effectif


2. Quel est l’effectif des enfants ayant moins de 21 kg ?

1.
Poids des enfantsxi 17 18 19 20 21 22 23 24 25 Total
Nombre d’enfants ni 2 1 5 5 4 3 4 2 2 28

2. Le nombre d’enfants ayant un poids moins de 21 kg est 13 enfants


Exemple 2

Absentéisme dans le service « Achats » (pendant une période donnée)


Nombre de jours Nombre d’employés
d’absence xi concernés ni
0 5
1 8
2 6
3 3
4 2
5 1
6 2
Total 27

1. Le tableau de données ci-dessus comporte :…………individus


2. Quel est le caractère étudié ? Donner sa nature
Effectif
Exemple 3

Destination des Nombre de Fréquence


voyages/Heure xi voyageurs ni fi=ni/n
Europe 2300 0,22
Afrique 1200 0,12
Asie 850 0,08
Amérique du Nord 4800 0,47
Amérique du sud 1100 0,11
Total 10250 1
Effectif total n

1. Quel est le caractère étudié ? Est-il qualitatif, quantitatif ?

Pour l’«Afrique» par exemple, l’effectif est 1200, il y a 1200 voyageurs


qui se dirigent vers l’Afrique (à chaque heure)
La fréquence pour l’Afrique est 1200/10250=0,12 (12%)
REPRÉSENTATION DES DONNÉES

Pour exploiter au mieux les données :

 Classement des valeurs par ordre croissant ou décroissant;


 Transformation des effectifs en fréquences;
 Répartition des valeurs en classes;
 Tableaux statistiques (effectifs et fréquences) et Graphiques;
 Calcul des mesures caractéristiques.
INDICATEURS NUMERIQUES

Les indicateurs numériques ont pour but de résumer, à partir de


quelques nombres clés, l'essentiel de l'information relative à
l'observation d'une variable quantitative.

Indicateurs de position (tendance centrale)


Moyenne
Mode
Médiane
Quartiles

Indicateurs de dispersion (variabilité)


Variance
Ecart type
Coefficient de variation
INDICATEURS DE POSITION
LA MOYENNE

Variable discrète =1/n Σ nixi n=Σ ni


Variable continue =1/n Σ nici
ni: Effectif
n: Effectif total
ci: Centre de la classe

La moyenne s'exprime toujours dans la même unité


que les observations Xi
INDICATEURS DE POSITION
LA MOYENNE

Exemple 1

Soit la série statistique correspondant à la taille de 6 étudiants: 160, 170,


180, 180, 190, 200 (en cm)

n=6, Σxi=1080 =1080/6=180 cm


INDICATEURS DE POSITION
LA MOYENNE

Exemple 2

Au poste de péage, on compte le nombre de voitures se présentant sur


une période de 5 mn. Sur 100 observations de 5 mn, on obtient les
résultats suivants :
Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
Nb d’observations ni 2 8 14 20 19 15 9 6 2 3 1 1 100
ni xi 2 16 42 80 95 90 63 48 18 30 11 12 507

n=Σni=100 =1/n Σnixi

=507/100=5,07
INDICATEURS DE POSITION
LA MOYENNE

Exemple 3

Soit le tableau suivant donnant les salaires en dirhams des cadres d’une
entreprise
Salaires xi Effectif ni ci nici
[5000, 7000[ 21 6000 126000
[7000, 9000[ 34 8000 272000
[9000,14000[ 25 11500 287500
[14000, 20000[ 15 17000 255000
[20000, 30000[ 5 25000 125000
Total 100 1065500

n=Σni=100 =1/n Σnici

=1065500/100=10655
LES AUTRES VALEURS CENTRALES
LE MODE

Le mode: Correspond à la valeur la plus fréquente dans une distribution.


Il peut y avoir plusieurs modes : 2 (bimodale) ; 3 (trimodale); 4 modes
ou plus (plurimodale).

Variable discrète: le mode correspond à la valeur qui admet


le plus grand effectif;
Variable continue: on parle de la classe modale, la classe qui
admet le plus grand effectif.
LES AUTRES VALEURS CENTRALES
LE MODE
Exemple 1

Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
Effectif ni 2 8 14 20 19 15 9 6 2 3 1 1 100

Le mode est le nombre de voitures qui revient plus fréquemment dans la


série (20 observations)

Mode=4
LES AUTRES VALEURS CENTRALES
LA MÉDIANE

La médiane: correspond au centre de la série statistique classée par ordre


croissant.

 Sur une distribution non groupée :

Si n est impair, la médiane est l’observation de rang (n+1)/2


Si n est pair, la médiane est tout nombre situé entre xn/2 et x(n/2)+1
LES AUTRES VALEURS CENTRALES
LA MÉDIANE
Exemple 1

Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
Nb d’observations ni 2 8 14 20 19 15 9 6 2 3 1 1 100
Effectif cumulé Ni 2 10 24 44 63 78 87 93 95 98 99 100

N est pair: X100/2 ; X(100/2)+1 X50 ; X51??

Médiane=5
LES AUTRES VALEURS CENTRALES
LA MÉDIANE

 Sur une distribution groupée, la classe médiane est celle qui


contient la médiane.

On suppose que [xm, x’m[ est la classe médiane

Médiane=xm+am [(n/2)-Nm-1)]/nm am= x’m –xm

xm: limite inférieure de la classe médiane


am: amplitude de la classe médiane
n: taille de l’échantillon (effectif total)
Nm-1: effectif cumulé de la classe inférieure à la classe médiane (la
somme des effectifs des classes inférieures à la classe médiane)
nm: effectif de la classe médiane
LES AUTRES VALEURS CENTRALES
LA MÉDIANE
Exemple 2 Médiane=xm+am [(n/2)-Nm-1)]/nm
On a mesuré la longueur de la grande nervure de 75 feuilles de plantes.
L’étude de la répartition des mesures a donné les résultats suivants :
Longueur Nombre de Effectif
en mm xi feuilles ni cumulé Ni N est impair: X(75+1)/2 X38??
[100-110[ 1 1
[110-120[ 6 7
La classe médiane: [150-160[
[120-130[ 6 13
[130-140[ 9 22
[140-150[ 15 37 Médiane=150+10 [(75/2)-37)]/16
[150-160[ 16 53
[160-170[ 11 64 Médiane=150,31 mm
[170-180[ 8 72
[180-190[ 3 75
T 75
INDICATEURS DE DISPERSION
LA VARIANCE

La variance: est la moyenne arithmétique des carrés des écarts à la


moyenne
Exemple 1
Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
Nb d’observations ni 2 8 14 20 19 15 9 6 2 3 1 1 100
nixi2 2 32 126 320 475 540 441 384 162 300 121 144 3047

2 2
S2 = 1/n Σni(xi- ) = 1/n Σnixi2 -

S2 =1/100*3047-(5,07)2=4,77
INDICATEURS DE DISPERSION
L’ÉCART TYPE

L’écart type: est la racine carrée de la variance et sa formule est la


suivante:
S = S2
Exemple 1

Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
Nb d’observations 2 8 14 20 19 15 9 6 2 3 1 1 100
niixi2
n 2 32 126 320 475 540 441 384 162 300 121 144 3047

S2=4,77
S =2,18
INDICATEURS DE DISPERSION
COEFFICIENT DE VARIATION

Le coefficient de variation: est le rapport de l'écart-type à la


moyenne. Il est souvent utilisé pour comparer la variabilité de deux
groupes de données par rapport à leur niveau moyen.

C.V.=100*S /
Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de
la moyenne est grande. Il est généralement exprimé en pourcentage.
REPRÉSENTATION GRAPHIQUE
DES DONNÉES

Exemple 1: Situation familiale de 150 employés d’une entreprise

Situation Effectif ni 13%


20%
familiale xi
Célibataire 30 13%
Marié 80
Divorcé 20
Veuf 20 54%
Total 150

Diagramme circulaire ou sectoriel


Situation familiale
Marié
Célibataire
Veuf
Divorcé
REPRÉSENTATION GRAPHIQUE
DES DONNÉES
Exemple 2: Nombre de voitures se présentant sur une période de 5 mn
au poste de péage
Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T
fi(%) fi (%) 2 8 14 20 19 15 9 6 2 3 1 1 100

20
Diagramme en bâtons
18
des fréquences
16
14 2%
12 1
10
8
6
4
2

1 2 3 4 5 6 7 8 9 10 11 12 Nb de voitures
REPRÉSENTATION GRAPHIQUE
DES DONNÉES
Exemple 3: Age de 240 patients intoxiqués par une plante

%
45
Histogramme
40,8 40.4
40

35

30

25

20

15
10,0
10
4.6
5 3,4 0.8
0
[2-10[ [10-20[ [20-30[ [30-40[ [40-50[ [50-60[
Groupes d’âges (en années)

Répartition des patients en fonction de l’âge


Exercice
Le tableau ci-dessous donne la répartition des boulangeries d’une ville
en France selon le prix auquel elles vendent la baguette.

Prix (€) 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90
Effectif 4 14 26 11 7 12 7 5

1. Calculer le prix moyen d’une baguette


2. Déterminer le prix médian d’une baguette
3. Déterminer les premier et troisième quartiles de cette série
4. Calculer la variance et l’écart type
5. Calculer l’étendue de la série

S-ar putea să vă placă și