Documente Academic
Documente Profesional
Documente Cultură
Jean-François Coeurjolly
http://www-ljk.imag.fr/membres/Jean-Francois.Coeurjolly/
Mode
Mode
Calcul du mode :
variable discrète : modalité présentant le plus grand effectif (ou
plus grande fréquence).
variable continue : on cherche d’abord la classe ayant la plus
grande densité : c’est la classe modale. Le mode peut ensuite
être défini (par exemple comme le centre de cette classe).
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Mode
Calcul du mode :
variable discrète : modalité présentant le plus grand effectif (ou
plus grande fréquence).
variable continue : on cherche d’abord la classe ayant la plus
grande densité : c’est la classe modale. Le mode peut ensuite
être défini (par exemple comme le centre de cette classe).
Remarques :
pour une var. continue, en général on ne donne que la classe
modale.
Une série peut avoir plusieurs modes (en présence de maxima
locaux de fréquence ou densité selon le type de variable) ; on
parle de série plurimodale.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Mode
0.40
●
xi fi
0.35
1 10%
0.30
fréquence
2 25%
0.25
● ●
3 40%
0.20
0.15
4 25%
0.10
●
nombre de personnes/voiture
40
xi fi di
Revenu en euros
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiane
Médiane - définition
Définition
La médiane est la valeur de la série (i.e. une modalité) qui
partage la série en deux sous-ensembles de même effectif (ou de
même fréquence).
Médiane
Médiane
Médiane
Médiane
Médiane
Médiane
Médiane
Exemple nb personnes/voiture
xi ni fi Fi
1 40 10% 10%
2 100 25% 35%
3 160 40% 75%
4 100 25% 100%
Total 400 100% ×
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiane
Exemple nb personnes/voiture
xi ni fi Fi
1 40 10% 10%
2 100 25% 35%
3 160 40% 75%
4 100 25% 100%
Total 400 100% ×
Médiane
Exemple nb personnes/voiture
xi ni fi Fi
1 40 10% 10%
2 100 25% 35%
3 160 40% 75%
4 100 25% 100%
Total 400 100% ×
Médiane
Médiane
Médiane
Médiane
●
0.8
●
0.6
ce graphique ?
0.4
0.2
0.0
Médiane
Graphiquement : la médiane
0.8
(Me,50%)
d’intersection entre la courbe des
Fi
●
●
0.4
50% − Fi
Me = xi + × (xi+1 − xi )
Fi+1 − Fi
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiane
Graphiquement : la médiane
0.8
(Me,50%)
d’intersection entre la courbe des
Fi
●
●
0.4
Application numérique :
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiane
Graphiquement : la médiane
0.8
(Me,50%)
d’intersection entre la courbe des
Fi
●
●
0.4
Application numérique :
xi = 1600, xi+1 = 2400, Fi = 45%, Fi+1 = 80%.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiane
Graphiquement : la médiane
0.8
(Me,50%)
d’intersection entre la courbe des
Fi
●
●
0.4
Application numérique :
xi = 1600, xi+1 = 2400, Fi = 45%, Fi+1 = 80%.
Me = 1600 + 50%−45%
80%−45% × (2400 − 1600) ' 1714.28 e.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Quantile
Définition
Un quantile d’ordre α (pour α ∈ (0, 1)) notée en toute généralité Qα
est la valeur qui partage la série en deux sous-ensembles ; une
proportion α se situe en dessous de Qα et une proportion 1 − α
au-dessus strictement de Qα .
Remarques :
Me = Q50% .
Quartiles (notés Q1 , Q2 , Q3 ) : quantiles qui séparent la série en 4
sous-ensembles de même effectif/fréquence. Plus précisément
Quantile (2)
Quantile (2)
Quantile (2)
Moyenne
Moyenne - introduction
Moyenne
Moyenne
Exemple nb personnes/voiture
xi ni fi Fi
1 40 10% 10%
2 100 25% 35%
3 160 40% 75%
4 100 25% 100%
Total 400 100% ×
Application :
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Moyenne
Exemple nb personnes/voiture
xi ni fi Fi
1 40 10% 10%
2 100 25% 35%
3 160 40% 75%
4 100 25% 100%
Total 400 100% ×
Application :
Moyenne
Application :
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Moyenne
Application :
Moyenne
Moyenne
Moyenne
Moyenne
Moyenne
Moyenne
Moyenne géométrique
Moyenne
Moyenne géométrique
Moyenne
Moyenne
Définition
Soit la série statistique x1 , . . . , xp d’effectif n1 , . . . , np alors la
moyenne géométrique notée en général x G est définie par
!1/n
n
xG = x1n1 × x2n2 × ... × xp p
où n = n1 + . . . + np .
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Moyenne
Moyenne harmonique
Moyenne
Moyenne harmonique
Moyenne
Moyenne harmonique
⇐⇒ 2
= 1
+ 1
⇐⇒ vmoy = 2
= 15 km/h.
10 + 30
vmoy 10 30 1 1
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Moyenne
Définition
Soit la série statistique x1 , . . . , xp d’effectif n1 , . . . , np alors la
moyenne harmonique notée en général x H est définie par
n
xH = n1 np
x1 + ... + xp
où n = n1 + . . . + np .
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Synthèse
Salaires xi ci ni ai
en e (1 u.a. 4000e)
[0, 4000[ 2000 45 1
[4000, 8000[ 16000 10 6
[28000, 32000[ 30000 45 1
x = 16000e, Me = 16000e.
2 classes modales :
[0, 4000[,[28000, 32000[.
⇒
Moyenne et médiane non
représentatives de la série.
Modes informatifs.
série pluri-modale
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Salaires xi ci ni ai
en e (1 u.a. 1000e)
[0, 1000[ 500 5 1
[1000, 2000[ 1500 90 1
[2000, 3000[ 2500 5 1
x = 1500e, Me = 1500e.
classes modales : [1000, 2000[.
⇒
les trois indicateurs peuvent être
utilisés.
on préfèrera la moyenne qui
possède des propriétés intéressant
(calcul algébrique)
série symétrique
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Salaires xi ci ni ai
en e (1 u.a. 2000e)
[0, 2000[ 1000 90 1
[2000, 38000[ 18000 10 18
x = 2900e, Me = 1100e.
⇒
La moyenne n’est pas
représentative car trop influencée
par les gros salaires.
la médiane est plus adaptée.
série asymétrique
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Caractéristiques de dispersion
Définition
L’étendue est la différence entre la plus grande et la plus petite
observation de la série.
Notion très peu utilisée en pratique car elle est très sensible
aux fluctuations de l’échantillon.
Exemple : on relève l’âge de 10 individus : 24, 16, 18, 22,
16, 26, 35, 25, 15, 76.
⇒ étendue est de
tp76-16 = 50 ans.
Si on remplace 76 par un âge ≤ 35 l’étendue devient 19 ans.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Ecarts interquantiles
Ecarts-interquantiles
Définition
On définit l’écart-interquartile et l’écart-interdécile comme
suit
Ecart absolu
Ecarts absolus
x : statistique, xi : modalités, ni : effectifs, p nbre de modalités.
1 Ecart absolu moyen :
p
1X
ex = ni |xi − x |.
n i=1
Remarques
Plus les écarts absolus sont grands, plus la série est dispersée.
Avantage : facile à calculer, écart absolu médian moins sensible
aux valeurs extrêmes.
Inconvénient : ne se prête pas aux calculs algébriques.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Ecart-type et variance
Ecart-type et variance
Définition
La variance est la moyenne arithmétique pondérée des écarts à
la moyenne au carré. L’écart-type est la racine carrée de la
variance.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Ecart-type et variance
Ecart-type et variance
Définition
La variance est la moyenne arithmétique pondérée des écarts à
la moyenne au carré. L’écart-type est la racine carrée de la
variance.
Variance :
p p
1X X
Var (x ) = ni (xi − x )2 = fi (xi − x )2
n i=1 i=1
Ecart-type :
σx =
p
Var (x )
Interprétation
Plus l’écart-type (ou variance) est grand(e) et plus la série
observée est dispersée.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Ecart-type et variance
Ecart-type et variance
Ecart-type et variance
Ecart-type et variance
√
Ecart-type : σx = 631600 ' 794.7 e.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Ecart-type et variance
Théorème
Considérons une population P de taille n composée de k
sous-populations P1 , . . . , Pk d’effectifs respectifs n1 , . . . , nk . Notons,
x 1 , . . . , x k et Var (x1 ), . . . , Var (xk ) les moyennes et variances des k
sous-populations. Alors, la variance de la population P est
Ecart-type et variance
Ecart-type et variance
Ecart-type et variance
Ecart-type et variance
Var . Intra + Var . Inter = Moy. des variances + Var. des moyennes
= 521250 + 31250 = 552500e2 .
Ecart-type et variance
Var . Intra + Var . Inter = Moy. des variances + Var. des moyennes
= 521250 + 31250 = 552500e2 .
σx 111.8 σy 16.8
' ' 0.45 et ' ' 0.45.
x 250 y 37.5
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Coefficient de dispersion :
Q3 − Q1 D9 − D1
ou .
Me Me
Rapport interquartile ou rapport interdécile :
Q3 D9
ou
Q1 D1
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
50000
sachant que pour les
40000
agriculteurs
D1 = 6040
30000
Q1 =11135
Me = 18010
20000
Q3 = 27140
10000
D9 = 39010
agriculteurs cadres profInt employes ouvriers
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
50000
sachant que pour les
40000
agriculteurs
D1 = 6040
30000
Q1 =11135
Me = 18010
20000
Q3 = 27140
10000
D9 = 39010
agriculteurs cadres profInt employes ouvriers
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Introduction
Courbe de Lorentz
Courbe de Lorentz
xi (en e) ci ni fi Fi
[600, 1200[ 900 15 30% 30 %
[1200, 1800[ 1500 25 50% 80%
[1800, 2100[ 1950 10 20% 100%
Total × 50 100% ×
2
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Courbe de Lorentz
Courbe de Lorentz
xi (en e) ci ni fi Fi ni ci
[600, 1200[ 900 15 30% 30 % 13500
[1200, 1800[ 1500 25 50% 80% 37500
[1800, 2100[ 1950 10 20% 100% 19500
Total × 50 100% × 70500
2
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Courbe de Lorentz
Courbe de Lorentz
xi (en e) ci ni fi Fi ni ci gi Gi
[600, 1200[ 900 15 30% 30 % 13500 19.1% 19.1%
[1200, 1800[ 1500 25 50% 80% 37500 53.2% 72.3%
[1800, 2100[ 1950 10 20% 100% 19500 27.7% 100%
Total × 50 100% × 70500 100% ×
Courbe de Lorentz
Courbe de Lorentz
xi (en e) ci ni fi Fi ni ci gi Gi
[600, 1200[ 900 15 30% 30 % 13500 19.1% 19.1%
[1200, 1800[ 1500 25 50% 80% 37500 53.2% 72.3%
[1800, 2100[ 1950 10 20% 100% 19500 27.7% 100%
Total × 50 100% × 70500 100% ×
Définition
La courbe de Lorentz est obtenue en faisant correspondre à la
fréquence cumulée Fi à la fréquence cumulée Gi de la masse salariale.
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Courbe de Lorentz
100
●
80
●
60
Gi (en %)
40
20
●
0
0 20 40 60 80 100
Fi (en %)
Indice de Gini
Indice de Gini
100
●
80
IGini = S
= 2S ∈ [0, 1]
40
Surf. Demi-carré
20
●
0
0 20 40 60 80 100
Fi (en %)
Plus IGini est proche de 0 , plus la concentration est faible
(proche de équirépartition).
Dans notre cas, IGini ' 14% (on ne cherchera pas à calculer
l’indice)
Caractéristiques de tendance centrale Caractéristiques de dispersion Caractéristiques de concentration
Médiale
Médiale
xi (en e) ci ni fi Fi ni ci gi Gi
[600, 1200[ 900 15 30% 30 % 13500 19.1% 19.1%
[1200, 1800[ 1500 25 50% 80% 37500 53.2% 72.3%
[1800, 2100[ 1950 10 20% 100% 19500 27.7% 100%
Total × 50 100% × 70500 100% ×
Médiale
Médiale
xi (en e) ci ni fi Fi ni ci gi Gi
[600, 1200[ 900 15 30% 30 % 13500 19.1% 19.1%
[1200, 1800[ 1500 25 50% 80% 37500 53.2% 72.3%
[1800, 2100[ 1950 10 20% 100% 19500 27.7% 100%
Total × 50 100% × 70500 100% ×
Médiale
Médiale
xi (en e) ci ni fi Fi ni ci gi Gi
[600, 1200[ 900 15 30% 30 % 13500 19.1% 19.1%
[1200, 1800[ 1500 25 50% 80% 37500 53.2% 72.3%
[1800, 2100[ 1950 10 20% 100% 19500 27.7% 100%
Total × 50 100% × 70500 100% ×