Sunteți pe pagina 1din 55

Support de cours : statistiques probabilits

1re Partie

Les concepts de base de la statistique descriptive

1.1 Dfinition : La statistique est lensemble des mthodes et techniques ayant pour objet de collecter , de rassembler , de traiter , danalyser et dinterprter des donnes numriques relatives un ensemble dobjets , dindividus ou dlments qui permettent de tirer des conclusions , daider la bonne dcision et /ou de faire des prvisions . La statistique est considre aujourdhui comme un outil fiable qui peut fournir des renseignements et une interprtation dans tous les domaines : conomiques , politiques , sociologiques , biologiques , physiques etc. 1.2 Vocabulaire statistique : Population : Lensemble des objets de mme nature que lon soumet une tude statistique sappelle : la population ou lensemble statistique ou lunivers . Individu : Chaque lment de la population est appel individu ou unit statistique . Le nombre dunits statistiques formant la population est appel : Effectif . Exemples : Une population de touristes : lindividu est un touriste . Une population dentreprises : lindividu est lentreprise . Enqute : Lensemble des oprations ayant pour but de collecter de faon organise des informations relatives une population aprs avoir fix les objectifs de ltude statistique sappelle : Enqute . Si cette dernire porte sur lensemble des individus de la population ; il sagit dun recensement. Si au contraire, lenqute ne porte que sur une partie ou sur quelques lments de la population il sagit dun sondage . Le recensement ou enqute exhaustive . Il sagit denqute complte portant sur toutes les units statistiques de la population tudie . Exemple : Le recensement de la population dun pays . Le principe du recensement est simple mais il demande du temps . Son excution est lourde et elle peut tre onreuse. Gnralement, les recensements permettent galement dobtenir un nombre important dinformations et de renseignements sur les tendances et volutions. Le sondage ou enqute partielle. Le sondage conduit nobserver quune partie de la population statistique constituant un chantillon. Ltude de cet chantillon fournira des informations qui pourront tre tendues, quoique avec prudence la population complte. Le problme capital de cette mthode est celui de lobtention dun chantillon le plus reprsentatif possible de la population.

Page 1 sur 55

Support de cours : statistiques probabilits

Diffrentes mthodes sont la base du choix de lchantillon. Les deux principales sont : Le sondage au hasard : Dtermination de lchantillon par tirage au sort, afin que chaque ait la mme probabilit dtre choisi. Le sondage par choix raisonn ou mthode des quotas. Les diffrentes catgories de la population sont reprsentes proportionnellement dans lchantillon. On essaie ainsi dobtenir une image fidle. Les instruments de lenqute : Le questionnaire et les enquteurs. Le questionnaire : lorsque les units statistiques sur lesquelles portent les observations sont des personnes, elles sont soumises un questionnaire. Le questionnaire est un document renfermant lensemble des questions auxquelles les individus concerns sont pris de rpondre. Un questionnaire doit prsenter un certain nombre de qualits : - Il doit tre adapt au niveau des personnes consultes - Il doit tre complet. - Les questions poses doivent tre simples et appeler des rponses prcises et courtes : oui ou non par exemple. Les enquteurs : Lenquteur doit faire preuve dimpartialit, de conscience professionnelle. Lexcution dune enqute est gnralement faite selon les procds suivants : - Enqute par : interview - correspondance tlphone inter net Le dpouillement des observations : Cest lensemble des oprations permettant le passage des documents de base (questionnaires) aux donnes chiffres relatives au problme pos. Lobjectif du dpouillement est la prsentation des rsultats de lenqute dune manire comprhensible permettant une analyse et une interprtation fiables sous formes de tableaux statistiques et de reprsentations graphiques. Chapitre 2 : Les diffrents types de caractres et de variables statistiques 2.1 Les diffrents types de caractres. Dfinition : Toute proprit commune aux individus dune population sappelle : un caractre. Le caractre se prsente chez tous les individus de la population tudie mais avec une intensit ou une nature ventuellement diffrente. Exemple : La population des employs dune entreprise. Chaque employ peut tre caractris par son ge, son niveau dtude, son origine, son poids ou le nombre denfants charge. La modalit : Cest une particularit qui accompagne un fait. Chaque caractre pouvant prsenter plusieurs modalits. Exemples : - Le caractre nationalit peut avoir comme modalits : Marocaine franaise guinenne malienne sngalaise
Page 2 sur 55

Support de cours : statistiques probabilits

- Le caractre marque de voiture peut avoir comme modalits : Peugeot Renault Fiat BMW Audi Honda - Le caractre nombre denfants charges peuvent avoir comme modalits : Aucun enfant 1 enfant 2 enfants 3 enfants et plus. Un caractre peut tre soit qualitatif soit quantitatif. 2.1.1 Caractre qualitatif : Un caractre est dit qualitatif lorsquil nest ni mesurable ni reprable. Exemples : La profession la nationalit la situation familiale 2.1.2 Caractre quantitatif : Un caractre est dit quantitatif lorsquil est mesurable ou reprable. Exemples : Lge le poids le revenu annuel la temprature. 2.2 Les variables statistiques : Une variable statistique est une application dfinie sur la population tudie et valeurs dans un ensemble dtermin. Le caractre quantitatif lui correspond une variable statistique qui est la mesure du caractre. Celle ci peut tre soit discrte soit continue. 2.2.1 La variable statistique discrte : Une variable statistique est dite discrte lorsquelle ne peut prendre que des valeurs entires. Exemples - Le nombre denfants dans une famille : 0 ; 1 ; 2 ; 3 ; 4 - Le nombre de pices dun logement : 1 ; 2 ; 3 ; 4 ; 5 2.2.2 La variable statistique continue : Une variable statistique est continue lorsquelle peut prendre pour valeur numrique tout rel dun intervalle de lensemble IR. Exemples Le chiffre daffaires : 174587425.85 dh Le salaire : 6032.63 dh Le poids : 65.5 kg

Chapitre 3

Les sries statistiques une dimension


Page 3 sur 55

Support de cours : statistiques probabilits

et leur reprsentation graphiques 3.1 Les sries statistiques une dimension (ou une variable). Une variable statistique est une simple numration des observations : x1 ; x2 ; x3 ; x4 xi xn . Aprs dpouillement des observations dune enqute relative une population selon un caractre donn , on prsente les rsultats sous forme de tableaux statistiques puis on les reprsente graphiquement . Tableau statistique une entre . Le tableau statistique le plus simple est celui ou figureront deux colonnes rserves respectivement : - La premire aux valeurs du caractre , dsign par xi . - La deuxime aux effectifs correspondants , dsigns par ni . Exemple 1 .On a enqut 20 employs dune entreprise dont on veut tudier leur situation familiale . Le caractre situation familiale peut prendre les modalits suivantes : Clibataire : C ; Mari : M ; Veuf : V ; Divorc : D Les rsultats bruts sont les suivants : MMMMCCCDDC C CDVVMMMMC. Lunit statistique : un employ . La population : lensemble des 20 employs . Le caractre : situation familiale . Type de caractre : qualitatif . Modalits : clibataire mari veuf divorc . Les rsultats peuvent tre consigns dans le tableau suivant sous forme simple et claire . Variable statistique (xi) Effectif (ni) (Situation familiale) (nombre demploys) C 7 M 8 V 2 D 3 Total ni = 20 Exemple 2 . Soit un chantillon de 50 familles , les rsultats dune enqute concernant le nombre denfants par famille sont les suivants : 5463201643 1015463266 5436511302 3046521015 4332651061

Page 4 sur 55

Support de cours : statistiques probabilits

Lunit statistique : une famille . La population : lensemble des 50 familles. Le caractre tudi : nombre denfants par famille . Le type de caractre : quantitatif . Les modalits : 0123456. La variable statistique : discrte . Dans les rsultats bruts les diffrentes valeurs prises par la variable statistique sont : 0 1 2 3 4 5 6 . On prsente les rsultats dans un tableau statistique comme le cas dun caractre qualitatif . Variable statistique (xi) (nombre denfants) 0 1 2 3 4 5 6 Total Effectif (ni) (nombre de familles) 6 9 5 8 6 7 9 ni = 50

Exemple 3 .On a pes 20 lves dune classe. Les rsultats xi sont les suivants : unit le kilogramme. 77,45 62,20 67,82 71,28 74,47 81,29 78,54 63,22 59,47 61,33 56,41 63,23 63,28 71,66 68,72 54,93 71,44 74,31 77,82 67,41. Lunit statistique : un lve La population : lensemble des 20 lves Le caractre tudi : le poids de llve en kg Le type de caractre : quantitatif La variable statistique : continue . Premier travail faire : On cherche le domaine de variation de la variable, cest dire la diffrence entre la plus grande valeur et la plus petite valeur prises par la variable appele : Etendue . Dans ce cas : 81,29 54,93 = 26,36. Comme le nombre dobservations distinctes est grand , il est presque impossible de prsenter les donnes sous forme dune srie statistique .

Page 5 sur 55

Support de cours : statistiques probabilits

2me travail faire : On partage le domaine de variation en classes damplitudes gales de prfrence . Chaque classe possde une borne suprieure et une borne infrieure .La diffrence entre les bornes suprieure et infrieure est appele : amplitude de la classe . On appelle effectif dune classe le nombre de valeurs ni comprises dans cette classe . Le choix du nombre de classes varie avec le nombre dobservations . En rgle gnrale , il est recommand de ne pas dpasser 20 classes . Prenons pour amplitude 5 kg par exemple dans ce cas : La deuxime colonne du tableau statistique sera rserve au nombre dobservations appartenant la classe . Les rsultats seront prsents comme suit : Classes Effectif (ni) [54,93 59,93[ 3 [59,93 64,93[ 5 [64,93 69,93[ 3 [69,93 74,93[ 5 [74,93 79,93[ 3 [79,93 84,93[ 1 Total ni = 20 On appelle le centre de la classe de rang (i) not xi : la moiti de la somme de ses bornes infrieure et suprieure .
borne inf + borne sup 2 54,93 + 59,93 = 57,43 2 59,93 + 64,93 = 62,43 2

xi =

Exemples : x1 = x2 =

Dans cette distribution on peut dire que : Deux lves ont un poids suprieur ou gal 54,93 kg mais infrieur 59,93 kg. Cinq lves ont un poids suprieur ou gal 59,93 kg mais infrieur 64,93 kg. Un lve a un poids suprieur ou gal 79,93 kg mais infrieur 84,93 kg. Leffectif ni est appel aussi : frquence absolue . Leffectif total n : On appelle effectif total la somme des effectifs ni . n = ni = n1 + n2 + n3 + La frquence fi : On appelle frquence fi appele aussi frquence relative le rapport de leffectif ni , attach la valeur xi du caractre leffectif total n .
ni ni n1 = Exemples : f 1 = n ni n n + n + n + ... Remarque : f i = 1 2 3 = n

fi =

; f2 =

n =
i

n2 n
n n

=1

Effectifs cumuls :

Page 6 sur 55

Support de cours : statistiques probabilits

Les effectifs cumuls croissants (ECC) est lopration qui consiste tablir une nouvelle srie en additionnant successivement les effectifs de la srie initiale du haut du tableau vers le bas . Les effectifs cumuls dcroissants (ECD) est lopration qui consiste tablir une nouvelle srie en additionnant successivement les effectifs de la srie initiale du bas vers le haut . Exemple : Soit la distribution statistique suivante , une date donne ,des employs dune entreprise selon leur ge . Classes Effectifs (annes) (ni) [20 25[ 9 [25 30[ 27 [30 35[ 36 [35 40[ 45 [40 45[ 18 [45 50[ 9 [50 55[ 3 [55 60[ 3 Total 150 Dressons un tableau indiquant : - les centres des classes (xi); - les frquences fi ; - les frquences fi (%) ; - les effectifs cumuls croissants (ECC) ; - les frquences cumules croissantes (%) ; - les effectifs cumuls dcroissants (ECD) ; - les frquences cumules dcroissantes (%) .
Colonne 0
Classes (Annes)

Colonne 1 Colonne 2 Colonne 3 Colonne 4 Colonne 5 Colonne 6 Colonne 7 Colonne 8


Centres des classes (xi) Effectifs (ni) Frquences (fi) Frquences (fi) (%) Effectifs cumuls croissants (ECC) Frquences cumules croissantes (%) Effectifs cumuls dcroissants (ECD) Frquences cumules dcroissantes (%)

[20 25[ [25 30[ [30 35[ [35 40[ [40 45[ [45 50[ [50 55[ [55 60[ Totaux

22,5 27,5 32,5 37,5 42,5 47,5 52,5 57,5 -

9 27 36 45 18 9 3 3 150

0,06 0,18 0,24 0,30 0,12 0,06 0,02 0,02 1

6 18 24 30 12 6 2 2 100
Page 7 sur 55

9 36 72 117 135 144 147 150 -

6 24 48 78 90 96 98 100 -

150 141 114 78 33 15 6 3 -

100 94 76 52 22 10 4 2 -

Support de cours : statistiques probabilits

Les effectifs cumuls croissants ou dcroissants permettent de rpondre aux deux types de questions suivantes : - Quel est le nombre demploys ayant moins de 35 ans ? - Quel est le nombre demploys ayant au moins 35 ans ? Indications concernant les colonnes du tableau : - La colonne 1 : les centres des classes (xi) .
20 + 25 2 25 + 30 La 2me valeur : 27,5 = 2 55 + 60 La 8me valeur : 57,5 = 2

La 1re valeur : 57,5 =

- La colonne 2 : leffectif total n n = ni = 9 + 27 + 36 + 45 + 18 + 9 + 3 + 3 = 150 - La colonne 3 : les frquences fi =


ni n
9 150 27 = 150 27 150

La 1re valeur : 0,06 = La 2me valeur : 0,18

La 8me valeur : 0,02 = La 1re valeur : 6 = La 2me valeur : 18 La 8me valeur : 2 =


3 100 150 9 100 150 27 = 150 100

- La colonne 4 : les frquences en pourcentage : fi (%) = fi 100.

- La colonne 5 : les effectifs cumuls croissants (ECC) : La 1re valeur : la 1re valeur de la colonne 2 des effectifs . La 2me valeur : la somme des 2 premires valeurs de la colonne 2. La 3me valeur : la somme des 3 premires valeurs de la colonne 2. La 8me valeur : leffectif total n . - La colonne 6 : comme la colonne 5, la colonne 4 remplace la colonne 2 le dernier cumul tant gal 100 . - La colonne 7 : les effectifs cumuls dcroissants (ECD). la 8me valeur : la 8me valeur de la colonne 2 la 7me valeur : la somme de la 8me et la 7me valeur de la colonne 2

Page 8 sur 55

Support de cours : statistiques probabilits

la 1re valeur : leffectif total n . Autrement dit : la 1re valeur : leffectif total n la 2me valeur : leffectif total n moins la 1re valeur de la colonne 2 la 3me valeur : la 2me de la colonne 7 moins la 2me de la colonne 2 la 8me valeur : la 7me de la colonne 7 moins la 7me de la colonne 2. - La colonne 8 : les frquences cumules dcroissantes . Mme chose que la colonne 7, la colonne 4 remplace la colonne 2. Interprtation: La colonne 4 : la 1re valeur 6 ; veut dire que 6% des employs ont un ge suprieur ou gal 20 ans mais infrieur 25 ans . la 2me valeur 18 : veut dire que 18% des employs ont un ge suprieur ou gal 25 ans mais infrieur 30 ans. re La colonne 5 : la 1 valeur : veut dire que 9 employs ont moins de 25 ans la 2me valeur : veut dire que 36 employs ont moins de 30 ans La colonne 6 : la 1re valeur : veut dire que 6% des employs ont moins de 25. la 2me valeur : veut dire que 24% ont moins de 30 ans . La colonne 7 : la 1re valeur : 150 employs ont au moins 20 ans . la 2me valeur : 141 employs ont au moins 25 ans . 3.2 Les reprsentations graphiques . 3.2.1 Gnralits : Les tableaux statistiques prsentent les informations rassembles . Ils permettent dj une premire analyse des populations tudies . Mais les chiffres restent peu parlant dans un tableau statistique .Il serait intressant de traduire les informations par un graphique qui permettra de visualiser les faits de dceler des tendances et suggre mme une certaine interprtation . Un graphique doit comporter les lments suivants : - Un titre indiquant la nature du phnomne reprsent - Des indications ( lgendes , chelles ). Le mode de reprsentation graphique dune distribution statistique dpend de la nature du caractre observ et du but de ltude . On a vu quun caractre peut tre soit qualitatif soit quantitatif .

3.2.2 Reprsentations graphiques dune distribution caractre qualitatif .


Page 9 sur 55

Support de cours : statistiques probabilits

Selon la variable observe , il existe de nombreuses reprsentations dune srie caractre qualitatif qui peuvent tre utilises . Cependant les deux plus employs sont : - Diagramme en tuyaux dorgue . - Diagramme circulaire . 3.2.2.1 Diagramme en tuyaux dorgue : Appel aussi diagramme en barre ou diagramme bandes . Dans ce diagramme : - Les modalits sont places sur une droite horizontale (attention ne pas orienter cette droite car les modalits ne sont pas mesurables et il n y a pas dordre entre elles) . - Les effectifs ni (ou les frquences fi ) sont placs sur un axe vertical . La hauteur du tuyau est proportionnelle leffectif ni (ou la frquence fi) . Exemple : Une enqute un temps donn a concern 250 touristes visitant la ville de Marrakech selon leur nationalit .Les rsultats sont comme suit : Nationalit Effectifs (ni) Frquence (%) Allemande 55 22 Italienne 30 12 Franaise 40 16 Amricaine 35 14 Belge 45 18 Autres 45 18 Totaux 250 100 Diagrammes en tuyaux dorgue des effectifs et des frquences (%) :
Touristes visitant marrakech selon leur nationalit
60 50 effectif 40 30 20 10 0
nn e Fr an a ise Am r ica in e Be lg e Au tre s an de lie

25 %frquence 20 15 10 5 0 Nationalit Effectifs (ni) Frquence (%)

le m

3.2.2.2

Diagramme circulaire :

Al

Ita

Page 10 sur 55

Support de cours : statistiques probabilits

Appel aussi diagramme sectoriel ou secteurs ou camembert . Dans ce diagramme leffectif total n est reprsent par un disque plan . A chaque modalit on fait correspondre un secteur du disque . Langle au centre et donc la surface , de chaque secteur est proportionnel leffectif (ni) ou la frquence (fi) . La totalit des 360o correspond leffectif total n. Si ni est la leffectif de la modalit i reprsenter il est traduit par un angle i tel que : i =
360 ni n

= 360.fi
360 ni n

En effet n correspond 360o ni correspond i =

Autres 18%

Allemande 22%

Belge 18% Amricaine 14%

Italienne 12% Franaise 16%

Exemple : Une enqute sur la situation familiale des employs dune entreprise a concern un chantillon de 72 personnes. Les rsultats obtenus sont comme suit Situation Effectifs Frquences Angles familiale (ni) (fi)(%) (i) Clibataires 18 25 90o Maris 36 50 180o Divorcs 12 16,66 60o Veufs 6 8,33 30o Totaux 72 100 360o

Etablir le diagramme circulaire des effectifs :

Page 11 sur 55

Support de cours : statistiques probabilits

Si fi (%) est la frquence de la modalit reprsenter elle sera traduite par un angle i tel que : i =
360 100

fi

Ainsi sur lexemple prcdent : 1 = 90o ; 2 = 180o ; 3 = 60o 3.2.3 Reprsentations graphiques dune distribution caractre quantitatif Selon que la variable correspondante au caractre quantitatif est discrte ou continue, la reprsentation graphique sera diffrente . 3.2.3.1 Variable discrte : Les valeurs entires xi prises par les modalits sont places sur laxe des abscisses et les effectifs ni (ou les frquences fi) correspondants sur laxe des ordonnes. La hauteur du bton est proportionnelle leffectif ou la frquence. Lensemble des btons sappelle un diagramme en btons . Le polygone des effectifs est obtenu en joignant les sommets des btons des btons par des segments . Exemple : En vue de promouvoir la qualit de ses services , une agence de voyage a procd au recensement des htels pouvant accueillir sa clientle dans les grandes villes marocaines une priode donne . Les rsultats sont consigns dans le tableau suivant : Nombre dtoiles ( Modalits xi) 1 2 3 4 5 Total Nombre dhtels (Effectifs ni ) 100 120 60 80 40 400

Reprsentations graphiques a) Diagramme en btons des effectifs.


Nombre dhtels (Effectifs ni ) par toile 150 Effectifs 100 50 0 1 2 3 4 5 Nombre d'toiles

Page 12 sur 55

Support de cours : statistiques probabilits

b) Diagramme en bton des frquences. Nombre dtoiles Nombre dhtels ( modalits xi) (effectifs ni ) 1 100 2 120 3 60 4 80 5 40 Total 400 Frquences fi (%) 25 30 15 20 10 100

Frquence des hotles par toile


% Frquence 40 30 20 10 0 1 2 3 4 5 Nombre des toiles

3.2.3.1.2 Les diagrammes cumulatifs : Reprenons la srie statistique prcdente et calculons et reprsentons graphiquement les effectifs cumuls croissants et les frquences cumules croissantes.
Nombre dtoiles ( Modalits xi) Nombre dhtels (Effectifs ni ) Frquences fi (%) Effectifs cumuls croissants (ECC) Frquences cumules croissantes

1 2 3 4 5 Total

100 120 60 80 40 400

25 30 15 20 10 100

100 220 280 360 400 -

25 55 70 90 100 -

Diagramme en escaliers des effectifs cumuls croissants (ECC)


Page 13 sur 55

Support de cours : statistiques probabilits

Effectifs cumuls croissants

500 400 300 200 100 0 1 2 3 4 5 6 Nombre des toiles

Diagramme en escaliers des frquences cumules croissantes .


120 Frquence cumul croissant 100 80 60 40 20 0 1 2 3 4 5 Nombre des toiles

Remarque : On peut reprsenter de mme les diagrammes en escaliers des effectifs cumuls dcroissants (ECD) ou les frquences cumules dcroissantes . - On utilise les effectifs (frquences) cumuls croissants pour rpondre aux questions du style : Quel est le nombre (%) dindividus dont la valeur du caractre est infrieure x ? - On utilise les effectifs (frquences) cumuls dcroissants pour rpondre aux questions du style : Quel est le nombre (%) dindividus dont la valeur du caractre est suprieure ou gale x ? 3.2.3.2 Caractre quantitatif continu : Lhistogramme est la reprsentation approprie du caractre quantitatif continu . Cest un ensemble de rectangles juxtaposs. Chaque rectangle associ chaque classe ayant une surface proportionnelle leffectif (frquence) de cette classe.

Page 14 sur 55

Support de cours : statistiques probabilits

Remarque : Avant toute construction dhistogramme , il y a lieu de voir si les classes sont damplitudes gales ou ingales . Deux cas peuvent se prsenter : 3.2.3.2.1 Cas de classes de mmes amplitudes . La reprsentation se fait par des rectangles ayant pour base lamplitude commune des classes et une hauteur proportionnelle leffectif (frquence) correspondant chaque classe . Exemple : Les salaires horaires en dirhams des cent employs dune entreprise sont rsums dans le tableau suivant : Classes Effectifs Frquences (salaires) (ni) (fi) [10 12[ 4 0,04 [12 14[ 6 0,06 [14 16[ 10 0,10 [16 18[ 20 0,20 [18 20[ 30 0,30 [20 22[ 15 0,15 [22 24[ 10 0,10 [24 26[ 5 0,05 Totaux 100 1 Histogramme des effectifs

Page 15 sur 55

Support de cours : statistiques probabilits

Histogramme des frquences

Remarque : En joignant par des segments les milieux des bases suprieures des rectangles constituant lhistogramme , on obtient le polygone des effectifs ou le polygone des frquences . 3.2.3.2.2 Cas de classes damplitudes diffrentes : Si les classes nont pas les mmes amplitudes, il est ncessaire de rectifier la hauteur des rectangles de telle sorte que la surface du rectangle soit proportionnelle leffectif (ou frquence) correspondant . Pour rectifier la hauteur dun rectangle on choisit une amplitude unitaire, gnralement la plus frquente. Si une classe est damplitude k fois lamplitude unitaire choisie alors on divise par k leffectif correspondant cette classe . Autrement dit, soit a lamplitude unitaire choisie. Pour une classe i , si son amplitude est ai = k.a , alors leffectif rectifi correspondant sera ni/k . Cette remarque met laccent sur le fait que, en matire de reprsentation laide dun histogramme, cest la surface des rectangles et non la hauteur qui est proportionnelle aux effectifs.
Page 16 sur 55

Support de cours : statistiques probabilits

La construction de lhistogramme se fait par des rectangles ayant pour bases les amplitudes des classes et des hauteurs proportionnelles aux effectifs rectifis. Exemple : Le tableau suivant rsume la rpartition de 26 magasins dune chane dalimentation selon leur volume de vente quotidien moyen en milliers de DH . Classes Effectifs Amplitudes Effectifs (milliers dh) (ni) (ai) rectifis [40 80[ 4 40 4 [80 120[ 6 40 6 [120 140[ 4 20 8 [140 180[ 6 40 6 [180 220[ 4 40 4 [220 300[ 2 80 1 Si on choisit comme amplitude unitaire a = 40 puisque cest lamplitude frquente les effectifs rectifis seront comme indiqus dans le tableau. Histogramme des effectifs

Remarque : On tracera de mme lhistogramme des frquences. Courbes des effectifs cumuls croissants et dcroissants : a) la courbe des effectifs cumuls croissants : Elle est obtenue en joignant par des segments de droite les coordonnes des points ayant pour abscisses les bornes suprieures des classes et pour ordonnes les effectifs cumuls croissants correspondants aux classes . b) La courbe des effectifs cumuls dcroissants : Elle est obtenue en joignant par des segments de droite les coordonnes des points ayant pour abscisses les bornes infrieures des classes et pour ordonnes les effectifs cumuls dcroissants correspondants aux classes . Exemple : Soit la srie statistique suivante :

Page 17 sur 55

Support de cours : statistiques probabilits

Classes [60 80[ [80 100[ [100 110[ [110 120[ [120 130[ [130 140[ [140 150[ [150 170[ [170 190[ Total

Effectifs Effectifs cumuls Effectifs cumuls (ni) croissants (ECC) dcroissants (ECD) 3 3 100 6 9 97 12 21 91 15 36 79 26 62 64 18 80 38 10 90 20 8 98 10 2 100 2 100 -

3.2.4 Reprsentations sous formes de graphiques non cartsiens . 3.2.4.1 Graphiques coordonnes polaires. Dans un graphique coordonnes polaires un point M est repr par son argument (mesure algbrique de langle polaire) et par son module = OM valu sur laxe port par la demi-droite (OM) . (tta) et (rho) sont les coordonnes polaires du point M. Ce type de graphique est utilis pour reprsenter des sries statistiques observations mensuelles, trimestrielles ou annuelles. Exemple : Le tableau suivant rsume lvolution mensuelle du chiffre daffaires en milliers de dirhams dune entreprise au cours de deux annes conscutives .
Page 18 sur 55

Support de cours : statistiques probabilits

Mois J An 1 28 An 2 31

F 22 29

M 27 33

A 32 33

M 35 37

J 32 35

J 29 31

A 18 20

S 29 35

O 39 41

N 47 49

D 45 52

Diagramme polaire . Principe : 3.2.4.2 Graphique coordonnes semi logarithmiques . De tels graphiques sont construits partir daxes perpendiculaires dont lun porte une chelle logarithmique , lautre une chelle arithmtique . Exemple : Le chiffre daffaires mensuelle dune entreprise exprim en milliers de dirhams a volu de la manire suivante durant les 12 premiers mois de sa cration .
Mois CA(103) 1 31,6 2 63 3 125,9 4 252 5 502 6 1122 7 2015 8 4025 9 7950 10 11 12 19960 3 1622 70820

Il est visible que le graphique simple chelle arithmtique sera difficile reprsenter cause de la disproportion entre les valeurs du chiffre daffaires . Dans ce cas le recours une chelle semi logarithmique est une solution rationnelle pour la reprsentation dune telle srie . On calcule alors les logarithmes dcimaux des diffrents chiffres daffaires . Exemple : Mois 1 log CA = Log 31600 = 4,499
Mois CA(103) log(CA) 1 31,6 4,499 2 3 63 125,9 4,80 5,10 4 252 5,40 5 502 5,70 6 1122 6,05 7 2015 6,30 8 4025 6,60 9 7950 6,90 10 11 12 19960 3 1622 70820 7,30 7,50 7,85

On place sur laxe des abscisses les mois : Graduation arithmtique ; sur laxe des ordonnes les logarithmes des chiffres daffaires correspondants . Cest ce quon appelle coordonnes semi logarithmiques Graphique coordonnes polaires :

Page 19 sur 55

Support de cours : statistiques probabilits

Chapitre 4 :

Les caractristiques dune distribution statistique.

4.1 Les caractristiques de position ou de tendance centrale . Gnralits : Synthtiser linformation contenue dans un tableau par un graphique est la premire tape ralise en statistique. Par la suite, on cherche synthtiser encore plus linformation en la rduisant une seule valeur numrique. Les caractristiques de tendance centrale essayent de donner la plus reprsentative dun ensemble de valeurs numriques . Remarque : Les paramtres dfinis par la suite nont de sens que pour les variables quantitatives . 4.1.1 Les moyennes : Les moyennes en tant quoutils statistiques et en particulier, la moyenne arithmtique est frquemment utilise dans les analyses couvrant tous les domaines de la vie conomique, sociale, politique 4.1.1.1 La moyenne arithmtique simple : La moyenne arithmtique simple dune srie dobservations sobtient en divisant la somme de toutes les observations par le nombre total de ces observations . Elle se note : x (se lit x barre). a) Cas dune srie statistique de n observations. Soit x 1 ; x2 ; x3 ; ; xn La moyenne arithmtique simple :
x

x1 + x 2 + x3 + ... + x n n

x = n
i i

Exemple : Etant donn les observations suivantes : 2 7 3 8 4 12 . La moyenne arithmtique simple est :
x

2 + 7 + 3 + 8 + 4 + 12 6

36 6

=6

b) Cas dune variable statistique discrte . La moyenne arithmtique simple est :


x

n1 .x1 + n2 .x 2 + n3 .x3 ... n1 + n 2 + n3 ...

n .x = n
i i i

Page 20 sur 55

Support de cours : statistiques probabilits

Exemple : On relev le nombre denfants dans 850 mnages ayant au moins un enfant. On obtenu la srie statistique suivante valeurs isoles. Nombre denfants Effectifs ni.xi (xi) (ni) 1 282 282 2 273 546 3 148 444 4 70 280 5 35 175 6 42 252 Totaux 850 1979 La moyenne arithmtique simple est :
x

On dit que chaque mnage a en moyenne 2 3 enfants . c) Cas dune variable continue groupe par classe . La moyenne arithmtique simple est :

n .x = 1979 = 2.33 850 n


i i i

xi : centre de la classe i ni : effectif correspondant la classe i . Exemple : Les poids (en kg) de 20 joueurs dune quipe de foot bal sont rpartis selon les classes du tableau suivant : Classes Centres des Effectifs ni.xi (en kg) classes (xi) (ni) [71,5 76,5[ 74 2 148 [76,5 81,5[ 79 2 158 [81,5 86,5[ 84 4 336 [86,5 91,5[ 89 6 534 [91,5 96,5[ 94 4 376 [96,5 101,5[ 99 2 198 Totaux 20 1750

n .x n
i i

Page 21 sur 55

Support de cours : statistiques probabilits

La moyenne arithmtique simple est :

On dit que chaque joueur a en moyenne un poids de 87,5 kg . 4.1.1.2 La moyenne arithmtique pondre .

n .x = 1750 = 87,5 20 n
i i i

La moyenne arithmtique pondre intervient dans le cas ou les observations nauraient pas la mme importance . A chaque observation i est associ un coefficient de pondration i indiquant son poids parmi les autres .

.x
i i

i : le poids affect lobservation i xi : la variable . Exemple : Etant donn cinq copies (xi)dun mme tudiant notes sur 20 : (12 8 17 12 13), sachant que leurs coefficients (i) respectifs sont : (2 3 1 3 2). La moyenne arithmtique pondre est :
x

On dit que ltudiant a une note moyenne

.x = 12 2 + 8 3 + 17 1 + 12 3 + 13 2 = 127 = 11,54 2 + 3 +1 + 3 + 2 11
i i i

= 11,54 .

4.1.1.3 La moyenne gomtrique : La moyenne gomtrique est utilise pour donner une tendance centrale lorsque lon cherche tablir une moyenne dans un phnomne multiplicatif . Exemple : Soit la srie statistique suivante : Valeurs de la Effectifs variable (xi) (ni) x1 n1 x2 n2 x3 n3 . . . . . . xk nk

Page 22 sur 55

Support de cours : statistiques probabilits

Total

On appelle moyenne gomtrique : G=


n n3 nk n2 x1n1 .x 2 .x3 ...x k

Le calcul dune moyenne gomtrique est long et pnible . On aura alors lavantage dcrire la formule qui donne G sous forme logarithmique : 1 n n n n n n En effet G peut scrire : G = ( x1n .x 2 .x3 ...x k ) n lnG = ln ( x1 .x 2 .x3
1 2 3 k 1 2

1 nk n ...x k )

lnG = lnG =

1 n 1 n

n n n n ln ( x1 .x 2 .x3 ...x k ) =
1 2 3 k

1 n

n (ln x1n + ln x 2 + ln x3 + + ln x k )
1 2

n3

nk

(n1.lnx1 + n2.lnx2 + n3.lnx3 + + nk.lnxk) =

Ce qui peut snoncer que : Le logarithme de la moyenne gomtrique est gal la moyenne arithmtique des logarithmes des valeurs de la variable : lnG =
i

n . ln x n
i i

1 ni . ln xi n

n . ln x n
i

Exemple : Soit la distribution statistique suivante : Variable Effectifs lnxi ni.lnxi (xi) (ni) 15 2 2,708 5,416 13 3 2,565 7,695 9 2 2,197 4,394 11 2 2,398 4,796 12 1 2,485 2,485 Totaux 10 24,785 La moyenne gomtrique G est elle que : lnG =

n . ln x = n
i i i

24,786 10

= 2,4786

Page 23 sur 55

Support de cours : statistiques probabilits

G = 11,92 Le calcul dune moyenne gomtrique prsente toujours un intrt et a une signification lorsque les valeurs observes de la variable , mise en ordre croissant ou dcroissant sont en proportion gomtrique . 4.1.1.4 La moyenne harmonique La moyenne harmonique que lon dsigne par la lettre H est gale linverse de la moyenne arithmtique des inverses des valeurs de la variable :
H=

n n x

i i i

Le calcul dune moyenne harmonique sera intressant chaque fois que lon peut donner un sens aux membres inverses des valeurs de la variable statistique (cot moyen , vitesse moyenne ) Exemple : Un automobiliste a parcouru une distance de 100 km avec trois vitesses diffrentes comme suit : ni Vitesses (km/h) Distance (km) (h) xi (xi) (ni) 80 10 0,125 100 30 0,300 120 60 0,500 Totaux 100 0,925 La moyenne harmonique : H=

n n x

i i i

100 0,925

= 108,108 km/h

on dit que lautomobiliste a parcouru la distance de 100 km une vitesse moyenne harmonique de 108,108 km/h .

4.1.2 Le mode :

Page 24 sur 55

Support de cours : statistiques probabilits

Le mode ou dominante est la valeur particulire de la variable pour laquelle leffectif est le plus lev . Remarque : Une srie statistique peut prsenter deux ou plusieurs modes . Elle est alors bi - modale ou multi modales . 4.1.2.1 Cas dune variable discrte : Le mode est facile calculer, il correspond une valeur bien dtermine de la srie statistique . Exemple : Lors dun sondage dun chantillon de 1000 mnages sur le nombre de pices de leurs logements la rpartition a t comme suit : Nombre Effectifs de pices (xi) (ni) 1 127 2 273 3 296 4 166 5 et plus 138 La variable qui correspond leffectif le plus lev 296 est x = 3 pices . On dit que le 3 pices est le mode ou la valeur dominante . On dit aussi que ce type de logement est le plus frquent . 4.1.2.2 Cas dune variable continue 4.1.2.2.1 Classes de mme amplitude . On parle de classe modale qui est la classe qui correspond leffectif le plus lev . Certains auteurs prconisent par simplicit de prendre pour valeur du mode le centre de la classe modale .Cependant il prfrable de tenir compte des classes voisines de la classe modale de la manire suivante : Le mode est alors labscisse qui correspond lintersection des segments AB et CD. Dtermination graphique du mode xxxxx

On dmontre que lexpression analytique du mode est la suivante :

Page 25 sur 55

Support de cours : statistiques probabilits

Mo = L1 + d + d (L2 L1) 1 2 L1 : L2 : d1 : d2 : borne infrieure de la classe modale . borne suprieure de la classe modale . la diffrence des effectifs de la classe modale et la classe prcdente . la diffrence des effectifs de la classe modale et la classe suivante . a = L2 L1
a m a m = = d1 d1 OE OE

d1

Dmonstration : Soit m = Mo L1
d 2 OE d 2 OE = = a m am

Dautre part on a :

On tire a m des 2 expressions : am = OE =


d 2 OE OE .a = .a d1(d2 OE) = d2.OE d1.d2 d2 d1 d1 .d 2 d1 d 1 .d 2 OE .a = .a = .a or m = d1 + d 2 d2 (d1 + d 2 ).d 2 d1 + d 2

= OE(d1 +d2)

et puisque m = Mo L1 et donc
d1

a = L2 L1

Mo = L1 + d + d (L2 L1) 1 2 Exemple : Soit la srie statistique suivante : Classes Effectifs [10 20[ 20 [20 30[ 30 [30 40[ 40 [40 50[ 10 Total 100 a) Dterminons graphiquement le mode Mo : Traons lhistogramme de cette srie :

b) Appliquons la formule thorique du mode Mo :

Page 26 sur 55

Support de cours : statistiques probabilits

Mo = L1 + d + d (L2 L1) 1 2 La classe qui correspond leffectif le plus lev est [30 40[ . Cest la classe modale . Donc L1 = 30 ; L2 = 40 et L2 L1 = 10 d1 = 40 30 = 10 ; d2 = 40 10 = 30 Soit Mo = 30 + 4.1.2.2.2 Classes damplitudes diffrentes . Mme dmarche que prcdemment condition de rectifier les effectifs pour le traage de lhistogramme correspondant . Conclusions : La dtermination du mode est immdiate .Sa signification est vidente car il est intressant de connatre la valeur de la variable qui revient le plus souvent au cours des observations . Lorsque la srie statistique prsente plusieurs modes, le mode perd alors toute signification. Il est rejet comme mesure de tendance centrale . 4.1.3 La mdiane La mdiane Me dune srie statistique est la valeur de la variable qui partage la srie tel que le nombre des observations qui lui infrieures soit gal au nombre des valeurs des observations qui lui sont suprieures . 4.1.3.1 Cas dune variable discrte Pour dterminer la mdiane Me il faut : 1) Ranger en ordre croissant ou dcroissant les variables de la srie statistique . 2) Examiner la parit de la srie : - Si le nombre n dobservations est impair (n = 2p + 1), alors la mdiane correspond la (p + 1)e observation . Me = xp+1 - Si le nombre n dobservations est pair (n = 2p), il existe un intervalle mdian [xp xp+1[ .On prend gnralement la moyenne arithmtique de la pe et la (p+1)e observation . Me =
x p + x p +1 2
10 10 10 + 30

d1

= 32,5

Exemples : Les donnes suivantes reprsentent les notes de 11 lves lors dun examen : 7 9 8 14 16 8 14 16 13 7 12 . Pour dterminer la mdiane de cette srie on doit dabord la ranger en ordre . Classons ces notes par ordre croissant : 7 7 8 8 9 12 13 14 14 16 16 . Le nombre dobservations tant gal 11 donc impair : 11 = 2p + 1 p = 5 et la mdiane correspond la (5 + 1)e soit la 6e observation . Sur la srie Me = 12. Cela veut dire que 5 lves ont une note infrieure la mdiane Me = 12 et 5 lves ont une note suprieure la mdiane Me = 12.
Page 27 sur 55

Support de cours : statistiques probabilits

Si leffectif des lves tait pair et gal 12 par exemple , soit : 7 9 8 14 16 8 14 16 13 7 12 10 . On classe ces notes par ordre croissant : 7 7 8 8 9 10 12 13 14 14 16 16 . Le nombre dobservations tant pair : n = 2p p = 6 , donc la mdiane correspond la moyenne arithmtique de la 6e et la 7e observation . Soit Me =
10 +11 2

= 10,5 .

On conclut que le nombre dlves ayant une note infrieure la mdiane est gal au nombre dlves ayant une note suprieure la mdiane Me = 10,5 . Remarque : Si les notes se prsentaient aprs classement comme suit : 6 7 7 8 9 10 10 10 10 10 13 14 . Ici pas de mdiane ; en effet lquipartition de la srie nest pas plus ralise du fait que 5 notes sont infrieures 10 et 2 notes seulement lui sont suprieures . On peut conclure que , lorsque la variable statistique est discrte , il ny a pas en gnral de valeur mdiane . 4.1.3.2 Cas dune variable continue .

Lorsque les donnes sont groupes par classes, deux manires pour dterminer la mdiane sont possibles . - Dtermination graphique - Dtermination par le calcul 4.1.3.2.1 Dtermination graphique de la mdiane : A partir du tableau statistique labor on trace la courbe des effectifs cumuls croissants (ECC) qui est obtenue en joignant par des segments de droites les coordonnes des points ayant pour abscisses les bornes suprieures des classes et pour ordonnes les effectifs cumuls correspondants . Sur cette courbe on peut dterminer graphiquement la mdiane Me qui a pour valeur labscisse du point dordonne la moiti de leffectif total (n/2). Exemple : Un sondage a t effectu auprs de 68 personnes sur le temps quils ont pass devant la tlvision un soir . Les rsultats sont groups comme suit : Classes Effectifs (mn) (ni) [0 15[ 14 [15 30[ 10 [30 60[ 16 [60 120[ 20 [120 180[ 8 Total 68 On dresse un tableau sur lequel sont reprsentes les colonnes des effectifs cumuls croissants et dcroissants .
Page 28 sur 55

Support de cours : statistiques probabilits

Classes Effectifs Effectifs cumuls Effectifs cumuls (mn) (ni) croissants (ECC) dcroissants (ECD) [0 15[ 14 14 68 [15 30[ 10 24 54 [30 60[ 16 40 44 [60 120[ 20 60 28 [120 180[ 8 68 8 Total 68 On trace la courbe des effectifs cumuls croissants (ECC) . Remarque : On peut dterminer graphiquement la mdiane aussi partir de la courbe des effectifs cumuls dcroissants (ECD) de la mme manire que ci dessus . Consquence : Lintersection des deux courbes des effectifs cumuls croissants et dcroissants a pour abscisse la valeur de la mdiane Me de la srie . 4.1.3.2.2 Dtermination de la mdiane par le calcul . Aprs avoir identifi la classe mdiane de la srie statistique qui correspond au premier effectif cumul croissant suprieur la moiti de leffectif total (n/2) . Cest cette classe mdiane qui contiendra la valeur de la mdiane qui peut tre donne par une interpolation linaire . Si la classe mdiane est la ke classe , cest dire de rang k, alors ses bornes seront [Lk-1 Lk[ et leffectif cumul croissant sera Nk .
n N k 1 2 Me LK 1

On remarque que : Donc : Me = Lk-1 +

= L L k k 1

N k N k 1

(Triangles semblables)

n N k 1 2 ( Lk Lk 1 ) N k N k 1

Avec : -

Me : Mdiane , Lk-1 : Borne infrieure de la classe mdiane de rang k. Lk : Borne suprieure de la classe mdiane de rang k. n : Effectif total . Nk : Effectif cumul croissant correspondant la classe mdiane .
Page 29 sur 55

Support de cours : statistiques probabilits

- Nk-1 : Effectif cumul croissant prcdent Nk . Application : Reprenons lexemple prcdent . Leffectif total n = 68 donc la moiti de leffectif total est : n/2 = 68/2 = 34 Identification de la classe mdiane . Dans la colonne des effectifs cumuls croissants on cherche le premier effectif cumul croissant suprieur n/2 (34) .Cest 40. Il correspond la classe [30 60[qui est la classe mdiane . cette classe mdiane est de rang k = 3 . Donc L3 = 60 ; L2 = 30 ; N3 = 40 ; N2 = 24 . Me = Lk-1 + Me = 30 +
n N K 1 2 ( Lk LK 1 ) N k N k 1 34 24 (60 30) = 30 + 40 24

= L2 +

68 N2 2 ( L3 L2 ) N3 N2

18,75 = 48, 75.

On remarque que cette valeur de la mdiane est la mme que celle trouve ci dessus graphiquement ( Me = 49). 4.1.4 Les quantiles : Ce sont des caractristiques de position . Pour une srie statistique de n observations : La mdiane Me spare les observations en deux groupes deffectifs gaux . Il y a trois quartiles Q1 ,Q2 et Q3 qui sparent les observations en quatre groupes deffectifs gaux . Il y a neuf dciles D1, D2, D3D9 qui sparent les observations en dix groupes deffectifs gaux . Il y a 99 centiles C1, C2, C3 C99 qui sparent les observations en cent groupes deffectifs gaux . La dtermination de ces caractristiques est identique celle de la mdiane graphiquement ou par le calcul . Les quartiles Q1, Q2, Q3 sont obtenus lorsquon a cumul n/4 ; 2n/4 ; 3n/4. Les dciles D1, D2 D9 sont obtenus lorsquon a cumul n/10; 2n/10 9n/10. Les centiles C1, C2C99 sont obtenus lorsquon a cumul n/100, 2n/100 On appelle : Intervalle inter quartile : IIq = Q3 Q1 Il contient 50% des observations . Intervalle inter dcile : IId = D9 D1 Il contient 80% des observations.
Page 30 sur 55

Support de cours : statistiques probabilits

Intervalle inter centile : IIc = C99 C1 Il contient 98% des observations . Remarques : 1) Les intervalles inter quartiles, inter dciles, inter centiles prsentent un grand intrt et sont les plus utiliss dans les analyses de la statistique descriptive . 2) La notion de dciles et de centiles na de sens que sil y a beaucoup dobservations et donc essentiellement pour une variable classe . 4.1.4.1 Dtermination graphique des quartiles : On procde de la mme manire que pour la dtermination graphique de la mdiane. Exemple : Le relev des retards cumuls en minutes de 120 employs dune entreprise pour un mois de travail a donn les rsultats suivants : Classes Effectifs (mn) (ni) [100 120[ 24 [120 140[ 48 [140 160[ 30 [160 180[ 12 [180 200[ 6 Total 120 On dresse un tableau sur lequel est reprsente la colonne des effectifs cumuls croissants (ECC) . Classes Effectifs ECC (mn) (ni) [100 120[ 24 24 [120 140[ 48 72 [140 160[ 30 102 [160 180[ 12 114 [180 200[ 6 120 Total 120 Traons la courbe des effectifs cumuls croissants . Remarque : De la mme manire on dtermine les dciles et les centiles graphiquement . 4.1.4.2 Dtermination des quantiles par le calcul Par analogie la mdiane :
Page 31 sur 55

Support de cours : statistiques probabilits

Me = Lk-1 +
n N k 1 2 ( Lk Lk 1 ) N k N k 1

Lintervalle [Lk-1 - Lk[ contient la mdiane Me On dtermine les quantiles ainsi , - Les quartiles : Q1 = Lk-1 +
n N k 1 4 ( Lk Lk 1 ) N k N k 1

Lintervalle [Lk-1 - Lk[ contient le quartile Q1. Q2 = Lk-1 +


n N k 1 2 ( Lk Lk 1 ) N k N k 1

Lintervalle [Lk-1 LK[ contient le quartile Q2 qui est confondu avec Me. Q3 = Lk-1 +
3n N k 1 4 ( Lk Lk 1 ) N k N k 1

Lintervalle [Lk-1 Lk[ contient le quartile Q3 . - Les dciles D1 = Lk-1 +


n N k 1 10 ( Lk Lk 1 ) N k N k 1

Lintervalle [LK-1 LK[ contient le dcile D1 . . . . D9 = Lk-1 +


9n N k 1 10 ( Lk Lk 1 ) N k N k 1

- Les centiles

Page 32 sur 55

Support de cours : statistiques probabilits

C1 = Lk-1 +

n N k 1 100 ( Lk Lk 1 ) N k N k 1

Lintervalle [LK-1 LK[contient le centile C1 etc

4.2 Les caractristiques de dispersion . Position du problme : Deux sries statistiques peuvent avoir mme moyenne et tre assez diffrentes l'une de l'autre . Exemple : La srie 1 comporte les valeurs : 4 - 4,5 - 5 - 5,5 - 6 . La srie 2 comporte les valeurs : 1 - 2 - 5 - 8 - 9 . La moyenne arithmtique simple est : Pour la Pour la
x

4 + 4,5 + 5 + 5,5 + 6 25 premire srie : x = = =5 5 5 1+ 2 + 5 + 8 + 9 25 deuxime srie : x = = =5 5 5

x n

i i

Ces deux sries ont mme moyenne mais les valeurs de la deuxime srie sont plus loigns de la moyenne x = 5. On dit que les valeurs de la deuxime srie sont plus disperses. La connaissance de la valeur centrale ne suffit pas pour traduire numriquement cette diffrence des deux sries prcdentes , c'est dire la manire dont se rpartissent les valeurs de la variable les unes par rapport aux autres ou par rapport leur valeur moyenne . Y - a - t - il des procds pour mesurer ces dispersions ? Mesure de dispersion base sur les carts par rapport la moyenne . 4.2.1 L'cart moyen . On appelle cart par rapport la moyenne : ei = xi On appelle cart moyen ou moyenne des carts : em = .

n e n
i i

Page 33 sur 55

Support de cours : statistiques probabilits

Calculons l'cart moyen pour chacune des deux sries prcdentes : Pour la srie 1: em = Pour la srie 2 : em =
( 4 5) + ( 4,5 5) + (5 5) + (5,5 5) + (6 5) 5 (1 5) + (2 5) + (5 5) + (8 5) + (9 5) 5

=0

=0

On remarque que l'cart moyen est nul pour les deux sries. Il ne peut apporter aucune information pour la mesure de la dispersion.

L'cart moyen est toujours nul . En effet : em =


i i
i i

n e = n ( x x) = (n x n n n n n x x n = x - x = 0. = n n
i i

x)

n x n n
i i i

i i

4.2.2 L'cart absolu moyen . eam =

n e n
i i

Pour la srie 1 : eam = Pour la srie 2 : eam =

4 5 + 4,5 5 + 5 5 + 5,5 5 + 6 5 5 1 5 + 2 5 + 5 5 + 8 5 9 5 5

3 = 0,6 5 14 = 2,8 5

Ainsi on peut dire que les valeurs de la srie 1 s'cartent en moyenne de la valeur moyenne x = 5 de 0,6. Alors que les valeurs de la srie 2 s'cartent en moyenne de la valeur moyenne x = 5 de 2,8 . Conclusion : L'cart absolu moyen est une bonne mesure de l'talement des valeurs donc de la dispersion des observations des sries statistiques. Mais le calcul avec des valeurs absolues sont peu pratiques. Les paramtres de mesure de la dispersion les plus utiliss sont : la variance et l'cart type. 4.2.3. La variance La variance est la moyenne arithmtique des carrs des carts des valeurs de la variable leur moyenne arithmtique . Si les xi dsignent les observations d'une variable discrte ou les centres des classes d'une variable continue la variance note V est :
Page 34 sur 55

Support de cours : statistiques probabilits

Calculons la variance de chacune des sries prcdentes : Pour la srie 1 : V= Pour la srie 2 : V=
(1 5) 2 + (2 5) 2 + (5 5) 2 + (8 5) 2 + (9 5) 2 5 (4 5) 2 + (4,5 5) 2 + (5 5) 2 + (5,5 5) 2 + (6 5) 2 5

n ( x x ) V= n
i i i

=
50 5

2,5 5

= 0,5.

= 10.

Mais ces rsultats expriment le carr de l'unit. Pour retrouver un nombre s'exprimant avec la mme unit que les termes des sries, on dfinit ainsi une nouvelle caractristique de dispersion appele : Ecart type dont l'importance est primordiale dans l'analyse statistique. 4.2.4 L'cart type : L'cart type not est la racine carre de la variance : = =

n ( x x) n
i i i

Il mesure la dispersion autour de la moyenne. Ainsi pour la srie 1 = 0,5 = 0,707. pour la srie 2 = 10 = 3,16. On peut conclure que les valeurs de la srie 1 sont moins disperses que celles de la srie 2. Remarque : La variance et l'cart type ne peuvent comparer la dispersion de deux ou plusieurs sries statistiques que si elles sont de mme nature, c'est dire elles ont les mmes units. Formule dveloppe de la variance : V= En effet
2

n x n
i i
i

2 i

2 n ( x x) ni ( x i 2 x i x + x ) nx V= = = n ni n 2
i i i

2 i

n 2x x + n x n n
i i i i i

n x n
i i

2 i

n x 2x n
i i

+x

n = n x n n
i i i i

2 i

2 x.x + x

n x = n
i i

2 i

4.2.5 Le coefficient de variation :

Page 35 sur 55

Support de cours : statistiques probabilits

Le coefficient de variation ou de dispersion est le rapport de l'cart type la moyenne arithmtique x . Cv =

C'est un nombre sans dimension, indpendant donc des units dans lesquelles sont exprimes les donnes . Il permet de comparer les dispersions des sries statistiques exprimes dans des units diffrentes. Exemples : Salaires en dirhams et salaires en dollars. Le poids en kg et la taille en cm pour une population . Calculons le coefficient de variation pour les sries prcdentes : Pour la srie 1 : Cv = Pour la srie 2 : Cv =
0,707 5 3,16 5

= 0,14. = 0,63.

On peut ainsi conclure que la srie 1 est mois disperse que la srie 2. D'une manire gnrale: Une srie est fortement disperse quand son Cv est proche de 1. Une srie est faiblement disperse quand son Cv est proche de 0.

Page 36 sur 55

Support de cours : statistiques probabilits

CHAPITRE 5

LA CONCENTRATION

5.1 Gnralits Les paramtres : moyenne, mdiane, quantiles et cart type ne rpondent que d'une faon incomplte un type de question que l'on est souvent amen se poser en gestion et en conomie lors d'une analyse statistique : La rpartition de la masse globale est - elle quitablement rpartie sur la population ou au contraire elle est concentre sur un petit nombre d'individus ? Une telle question n'a de signification que si l'addition des produits des valeurs de la variable xi par le nombre d'individus (ni) correspondant a elle mme un sens. Autrement dit il faut que les produits (ni.xi) soient susceptibles d'addition et aient une signification . Exemple: Des individus classs selon la fortune, le salaire, le revenu, le chiffre d'affaires, la surface exploite, la production . . . Par contre des individus classs selon leur ge, la taille ne prsente pas priori un intrt particulier. On sent alors le besoin de dfinir une caractristique qui permet d'tudier la disparit des masses globales entre les individus d'une srie statistique. Cette caractristique est la concentration. 5.2 Exemple : Considrons une entreprise dans laquelle une tude statistique a donn la distribution des salaires horaires en dirhams de 120 employs. Classes Effectifs [0 - 10[ 48 [10 - 20[ 36 [20 - 30[ 24 [30 - 40[ 12 Total 120 5.2.1 Construction de la courbe de concentration.
Page 37 sur 55

Support de cours : statistiques probabilits

La courbe de concentration ou de la courbe de GINI ou courbe de LORENZ se construit sur un graphique cartsien partir des frquences cumules croissantes exprimes en (%). En abscisses : seront portes les frquences cumules croissantes en (%)des effectifs ni : (colonne 6). En ordonnes : seront portes les frquences cumules croissantes en (%) des produits ni.xi : (colonne 8).

Pour cela on dresse le tableau suivant :


Colonne 1 Classes Colonne 2 Effectifs (ni) Colonne 3 Centres (xi) Colonne 4 Colonne 5 fi = ni ni Colonne Colonne 6 7 fi cum Fi = (%) ni x i ni xi Colonne 8 Fi cum (%)

ni.xi

[0 - 10[ [10 - 20[ [20 - 30[ [30 - 40[ Totaux

48 36 24 12 120

5 15 25 35 ---

240 540 600 420 1800

0,40 0,30 0,20 0,10 1,00

40 70 90 100 ---

0,1333 0,30 0,3333 0,2333 1,00

13,33 43,33 76,66 100 ---

Les deux axes seront gradus de 0 100. On reprsente les points de coordonnes : (0 , 0) ; (40 , 13.33) ; (70 , 43.33) ; (90 , 76.33) et (100 , 100). Courbe de concentration : graphe ****

Interprtation de la courbe de concentration. Si la rpartition de la masse globale salariale de l'entreprise tait uniforme ou assez galitaire , la courbe de concentration se rapproche de la diagonale OI, ce qui correspond une faible concentration. Si au contraire la masse globale salariale tait concentre entre un petit nombre d'employs alors la courbe de concentration s'loigne de la diagonale OI et se rapproche des cts de l'angle droit en A , ce qui correspond une forte concentration. 5.2.2 Le coefficient de concentration ou indice de GINI. 5.2.2.1 La surface de concentration S.

Page 38 sur 55

Support de cours : statistiques probabilits

On appelle surface de concentration S la surface situe entre la courbe de concentration et la diagonale OI . Cette surface est toujours comprise entre 0 et 5000. 4.2.2.2 Le coefficient de concentration Cc . On appelle coefficient de concentration Cc, le rapport de la surface de concentration S la surface S' du triangle OAI (S' = Cc =
S 5000 100 100 = 5000 ). 2

Lorsque Cc se rapproche de 0 alors il ya une faible concentration . Lorsque Cc se rapproche de 1 alors il ya une forte concentration. D'une faon gnrale le coefficient de concentration Cc sera d'autant plus proche de 1 que la srie sera plus concentre : donc ingalitaire . Calcul de la surface de concentration S. On remarque que : S + S' = 5000 S = 5000 - S' . Il suffit de calculer S' qui est la surface complmentaire de S par rapport la surface du triangle OAI . Dans l'exemple prcdent : S' = surface du triangle (1) + les surfaces des trapzes (2) , (3 )et (4). On rappelle que : La surface d'un triangle de base B et de hauteur H est : est :
( PB + GB) H 2
B H 2

La surface d'un trapze de petite base PB , de grande base GB et de hauteur H . 5.2.2.3 Application . Calculons le coefficient de concentration de la srie prcdente : Pour cela calculons la surface S'. S' = S1 + S2 + S3 +S4 S1 : Surface du triangle (1) . S1 = S2 : Surface du trapze (2) . S2 = S3 : Surface du trapze (3) . S3 = S4 : Surface du trapze (4) . S4 =
40 13.33 = 266,6 2 (13.33 + 43.33) (70 40) = 850. 2 (43.33 + 76.66) (90 70) = 1200. 2 (76.66 + 100) (100 90) = 883,3. 2

Donc S' = 266.6 + 850 + 1200 + 883, 3 = 3200 Le coefficient de concentration Cc =


S 5000 S S 3200 = = 1 =1 = 0,36 5000 5000 5000 5000

On peut conclure qu'il s'agit d'une concentration moyenne.

Page 39 sur 55

Support de cours : statistiques probabilits

5.3 La mdiale . On dsigne par valeur globale de la variable le produit de la variable xi par l'effectif correspondant ni, c'est dire : nixi. Par dfinition, la mdiale note Mle est la valeur de la variable pour laquelle le cumul des valeurs globales reprsentent 50% du cumul total (masse globale). La mdiale comme la mdiane peut tre dtermine de deux manires: Graphiquement et par interpolation linaire . 5.3.1 Dtermination graphique de la mdiale. Sur une courbe de concentration ayant pour axe d'abscisses Ox et pour axe d'ordonnes Oy et grce un axe Oz auxiliaire descendant rserv aux classes de la srie statistique, on reprsente la courbe des frquences cumules croissantes en (%) ayant pour axe des ordonnes l'axe des abscisses de la courbe de concentration et pour axe des abscisses l'axe Oz. A l'ordonne 50 prise sur l'axe Oy de la courbe de concentration correspond sur l'axe Ox une abscisse xm . Cette abscisse devient une ordonne sur la courbe des frquences cumules croissantes en ( %) qui correspond une abscisse sur Oz, cette abscisse est la mdiale : Mle. Remarque : A l'ordonne 50 sur l'axe Ox correspond la mdiane Me de la srie sur l'axe auxiliaire Oz. Graphe **** 5.3.2 Dtermination de la mdiale par le calcul . Pour la mdiane on a vu que : Me =
Lk 1

n N k 1 ) + 2 ( L K Lk 1 ) ( N K N k 1 ) (

De mme la mdiale est :

Page 40 sur 55

Support de cours : statistiques probabilits

Mle =

Lk 1

100 ( N k 1 ) + 2 ( LK Lk 1 ) ( N K N k 1 )

[Lk-1 - Lk[ tant la classe mdiale c'est dire la classe correspondant au premier cumul croissant en (%) des valeurs globales (nixi) suprieur 50% . Nk : Le cumul croissant en (%) des (nixi) correspondant la classe [Lk-1 - Lk[. Nk-1 : Le cumul prcdent Nk . Remarque : La mdiane est toujours infrieure la mdiale, ce qui se vrifie dans tous les cas puisque les 50% des individus (ni) appartenant aux faibles classes auront une part dans la masse globale ncessairement infrieure 50%.

Page 41 sur 55

Support de cours : statistiques probabilits

CHAPITRE 6

Les sries chronologiques

6.1 Dfinition : Une srie chronologique ou chronique est une suite d'observations d'une variable statistique ayant t faites intervalles de temps constants (jours, semaines, mois, trimestres, semestres, annes ). Mathmatiquement on peut dfinir une srie chronologique comme un ensemble de valeurs prises par une fonction y =f(t) . Exemples : - Le volume du commerce extrieur d'un pays valu mois par mois pendant une dcennie . - Le nombre de voyageurs transports mensuellement par un organisme de transport (ONCF, CTM). - Les ventes bimestrielles en quantit d'une entreprise . 6.2 Les composantes d'une srie chronologique : La succession des observations d'un phnomne conomique au cours du temps rsulte traditionnellement de la superposition de quatre composantes ou mouvements suivants : 1) Une composante T de longue dure (quelques annes) que l'on appelle la tendance ou Trend qui traduit l'allure d'ensemble du phnomne. C'est le plus souvent une fonction rgulire ( affine par exemple ). 2) Une composante S de courte dure correspondant aux fluctuations annuelles que l'on appelle composante saisonnire (fermeture de l'usine l't, conditions mtorologiques (ski)). 3) Une composante C intermdiaire entre les deux prcdentes que l'on appelle composante cyclique (intervalle de prosprit, intervalle de rcession ). 4) Une composante A accidentelle souvent imprvisible dite alatoire (pannes, sismes, guerres, scheresse ). Remarque : Il y a deux manires de combiner ces quatre composantes : a) Selon un modle additif . Y = T + C + S + A. On utilise ce modle lorsque la dispersion (cart type) des valeurs de la variable t ne varie que trs peu d'une anne l'autre . On pense en effet que les variations successives sont constantes . b) Selon un modle multiplicatif. On utilise ce modle lorsque la dispersion suit la tendance. Les variations successives sont constantes en pourcentage . 6.3 Analyse d'une srie chronologique . 6.3.1 Gnralits : L'analyse d'une srie chronologique ncessite des instruments spcifiques permettant de corriger les variations saisonnires de l'effet perturbateur des fluctuations, c'est dire la dsaisonnaliser aprs sa reprsentation graphique .

Page 42 sur 55

Support de cours : statistiques probabilits

Parmi les principales mthodes pour dsaisonnaliser une srie chronologique, la plus utilise est celle dite des rapports la tendance gnrale ou au trend. Cette mthode est base sur les tapes suivantes : 1) La premire tape consiste dterminer le Trend. 2) La deuxime tape consiste faire le rapport de chacune des valeurs observes de la srie initiale la valeur calcule partir du Trend la mme date . 3) La troisime tape consiste synthtiser l'ensemble des coefficients en une seule srie des coefficients saisonniers par calcul de la moyenne arithmtique ou la mdiane des coefficients saisonniers qui s'utilisent pour liminer les variations saisonnires de la srie initiale. 6.3.2 Exemple: Soit la srie chronologique suivante reprsentant le nombre de voyageurs (en centaines de milliers) transports mensuellement par une compagnie autonome de transport au cours de trois annes conscutives . Tableau des releves : J F M A M J J A S O N D An 1 2 3 4 5 4 5 6 1 4 4 3 4 An 2 4 5 6 4 7 8 7 2 6 9 10 12 An 3 8 10 11 13 13 13 14 7 12 13 14 15 1) Construction de la courbe chronologique . La reprsentation graphique de la courbe doit tre faite sur du papier millimtr . L'axe des abscisses est rserv au temps t (t: dsigne le rang du mois considr). Dans cette exemple t varie de 1 pour le mois de janvier de l'an 1 36 pour le mois de dcembre de l'an 3. Sur l'axe des ordonnes on porte le nombre de voyageurs transports correspondant chaque mois. On obtient ainsi 36 points, que l'on joint par des segments de droite : c'est la courbe chronologique . Sur cet exemple on va dterminer la tendance gnrale ou Trend puis mettre en vidence l'influence saisonnire en essayant de la mesurer puis l'liminer. 2) Dtermination du Trend . La reprsentation graphique de la srie suggrant un Trend linaire . Le Trend peut tre dtermin par plusieurs procds. Cependant on se limitera l'ajustement linaire par la mthode des moindres carrs(voir principe de la mthode en annexe n ***) On remplace les n points de la courbe chronologiques par une droite d'quation y = at + b dont la pente a est donne comme suit : a =

t y t
i i

t t

t y

Cette droite passe par le point moyen M( t , y ), c'est dire b= y -a


Page 43 sur 55

= a t + b Soit:

Support de cours : statistiques probabilits

On dresse alors un tableau de calcul contenant ti ; yi; ti2; tiyi comme suit: ti yi ti 2 tiyi 1 2 1 2 2 3 4 6 3 4 9 12 4 5 16 20 5 4 25 20 6 5 36 30 7 6 49 42 8 1 64 8 9 4 81 36 10 4 100 40 11 3 121 33 12 4 144 48 13 4 169 52 14 5 196 70 15 6 225 90 16 4 256 64 17 7 289 119 18 8 324 144 19 7 361 133 20 2 400 40 21 6 441 126 22 9 484 198 23 10 529 230 24 12 576 288 25 8 625 200 26 10 676 260 27 11 729 297 28 13 784 364 29 13 841 377 30 13 900 390 31 14 961 434 32 7 1024 224 33 12 1089 396 34 13 1156 442 35 14 1225 490 36 15 1296 540 t i =66 y i = 26 t i 2 = 16206 t i y i =626 6 8 5

Page 44 sur 55

Support de cours : statistiques probabilits

On rappelle les formules suivantes afin d'viter de calculer chaque terme:


n(n + 1) ; 2 i =1 i=n 1 2 2 2 2 - t i = 1 + 2 + 3 + ... + n = n(n + 1)(2n + 1) ; 6 i =1

i=n

= 1 + 2 + 3 + ... + n =

pour notre exemple :


i =36

t
i =1 i =36 i =1

=
2

36 37 = 666 2 1 = 36 37 73 = 16206. 6

On tire alors du tableau :


i =36

t i
i =1

i =36

666 ; = = 18,5 36 36

y
i =1

36 t yi =

268 = 7,44 36

le coefficient a =

t y t
i i

i 2

t ti

6265 18,5 268 1307 = = 0,336 . 16206 18,5 666 3885

et b = y at = 7,44 - 0,336 18,5 = 1,224 donc la tendance gnrale (Trend) peut tre traduite par la droite d'quation : y = 0,336.t + 1,224 On trace alors cette droite sur le graphique de la courbe chronologique . Cette droite est le Trend de la srie chronologique (cf graphique). 3) Etude de l'influence saisonnire . a) L'objectif est de rechercher pour chacun des douze mois de l'anne un coefficient saisonnier qui sera propre au mois en question. Pour cela, on utilise la mthode des rapports au Trend . On dtermine d'abord les valeurs prises par le Trend y = 0,336 + 1,224 aux diffrents mois (t variant de 1 36 ). Exemples : Mois de rang 1 ; y = 0,336 1 + 1,224 = 1,56. Mois de rang 2 ; y = 0,336 2 + 1,224 = 1,896 1,90 Mois de rang 3 ; y = 0,336 3 + 1,224 = 2,232 2,23 etc Les rsultats trouvs sont consigns dans le tableau suivant : J An 1 1,56 An 2 5,60 An 3 9,62 F M A M J J A S O N D
1,90 2,23 2,57 2,90 3,24 3,58 3,90 4,25 4,58 4,92 5,26 5,93 6,24 6,60 6,94 7,27 7,61 7,94 8,28 8,62 8,95 9,29 9,96 10,3 10,63 10,97 11,30 11,64 11,98 12,31 12,65 12,98 13,32

Page 45 sur 55

Support de cours : statistiques probabilits

b) Dtermination des coefficients par la mthode des rapports au Trend. Pour chacun des 36 mois de la srie, on fait le rapport entre les valeurs des donnes de la srie initiale et les valeurs calcules l'aide du Trend correspondantes. Exemples - Le mois de rang 1: c1 = 1,56 - Le mois de rang 2 : c2 = - Le mois de rang 13 : c13= - Le mois de rang 36 : c36 =
15 =1,13 . 13,32 4 = 0,71 5,60 2 =1,28 3 =1,58 1,9

On obtient alors le tableau des coefficients relatifs chaque mois de chaque anne . J F M A M J J A S O N D An 1 1,28 1,58 1,79 1,94 1,38 1,54 1,68 0,26 0,94 0,72 0,61 0,76 An 2 0,71 0,84 0,96 0,60 1,00 1,10 0,92 0,25 0,72 1,04 1,11 1,29 An 3 0,83 1,00 1,07 1,22 1,18 1,15 1,20 0,58 0,97 1,03 1,08 1,27 total 2,82 3,42 3,82 3,76 3,56 3,79 3,80 2,75 2,63 2,79 2,80 3,32 Enfin on synthtise les coefficients obtenus en coefficients saisonniers par utilisation de la moyenne ou de la mdiane des rapports de chaque mois. Dans notre cas on va prendre la moyenne arithmtique simple des trois coefficients relatifs aux mmes mois des trois annes. Exemple : Pour le mois de janvier le coefficient saisonnier sera : Cs = Pour le mois de fvrier le coefficient saisonnier sera : Cs = Pour le mois de dcembre le coefficient saisonnier sera : Cs =
3,32 =1,11. 3

3 3 3,42 =1,14 3

c = 2,82 = 0,94

Les coefficients saisonniers sont rsums dans le tableau suivant : J F M A M J J A S O 0,94 1,14 1,27 1,25 1,19 1,26 1,27 0,92 0,88 0,93 Cs

N
0,93

D
1,11

Page 46 sur 55

Support de cours : statistiques probabilits

3) Elimination de l'influence saisonnire : Dsaisonnalisation L'limination de l'influence saisonnire se fera par division des nombres du tableau initial par le coefficient saisonnier du mois correspondant . Ainsi les 3 nombres des mois de janvier des trois ans seront diviss par le coefficient saisonnier calcul ci dessus propre janvier qui est Cs = 0,94. De mme les 3 nombres des mois de fvrier seront diviss par le coefficient saisonnier propre fvrier qui est Cs = 1,14 etc Les calculs ont conduit au tableau suivant : J An 1 2,13 An 2 4,25 An 3 8,51 F
2,63 4,38 8,77

3,15 4,00 3,36 3,97 4,72 4,72 3,20 5,88 6,35 5,51 8,66 10,40 10,92 10,32 11,02

1,09 5,54 4,30 3,22 3,60 2,17 6,82 9,68 10,75 10,81 7,60 13,63 14,77 15,05 13,51

On obtient ainsi la srie dsaisonnalise . Dans la pratique on reprsente cette srie graphiquement. La courbe correspondante est une courbe dont les pics sont beaucoup mois aigus que dans le cas de la srie initiale . 6.4 Essai de prvision partir du Trend et des coefficients saisonniers . La prvision qui peut tre faite est fonde : - D'une part sur l'hypothse que les annes venir connatront la mme tendance gnrale que les trois annes passes. - D'autre part sur un calcul correct des coefficients saisonniers . Supposons qu'on dsire prvoir le nombre de voyageurs qui seront transports pendant le mois de novembre de l'an 4, premier an venir aprs les trois ans passs . On utilise d'abord le Trend sous la forme : y = 0,336.t + 1,224 Le mois de novembre en question est de rang 47 partir du premier mois de la srie. En effet 36 + 11 = 47. On fait t = 47 dans le Trend soit y = 0,336 47 + 1,224 = 17,02. On affecte ce rsultat du coefficient saisonnier propre au mois de novembre qui est 0,93. Donc 17,02 0,93 = 15,83 . On peut alors estimer qu'il sera transport 15,83 centaines de milliers de voyageurs soit 15,83 100 000 = 1 583 000 voyageurs environ pendant le mois novembre de la 4me anne .

Page 47 sur 55

Support de cours : statistiques probabilits

CHAPITRE 7

LES INDICES

7.1Gnralits : Dans le domaine conomique on se trouve en prsence de grandeurs pour lesquelles on a d'autant plus de difficults saisir leur volution dans le temps ou dans l'espace ou la fois dans le temps et dans l'espace . Exemples : - Qu'est ce qu'un niveau de vie ? - Comment volue un pouvoir d'achat ? Il faut alors des instruments de mesure qui peuvent donner des renseignements et une image dynamique de ces phnomnes . Ces instruments sont appels les indices . 7.2 Dfinition : Un indice est un nombre sans dimension permettant de suivre l'volution et de comparer les valeurs d'une mme grandeur susceptible de varier dans diffrentes situations (temps ; espace ; catgorie socioprofessionnelle ). Les grandeurs peuvent tre soit : - Simples alors l'indice est dit simple ou lmentaire . - Complexes alors l'indice est dit synthtique . 7.3 Les indices simples : 7.3.1 Calcul de l'indice simple . L'indice tant sans dimension, la connaissance d'une seule valeur n'a donc pas de signification en soi ; par contre la comparaison de plusieurs valeurs apporte une information . On fixe une situation de base comme rfrence 0. La valeur de la grandeur X observe dans cette situation de base sera note X0 . La mme grandeur prenant la valeur Xt dans la situation t. On peut dfinir l'indice simple (dit lmentaire) de la grandeur X dans la situation t relativement la situation de rfrence 0, le rapport : It/0 = X 0 Pour des raisons de simple commodit pratique de l'expression de l'indice, le rsultat de ce rapport est gnralement multipli par 100, soit : It/0 = X .100 0
Xt Xt

Page 48 sur 55

Support de cours : statistiques probabilits

L'interprtation d'un indice simple doit citer la grandeur tudie, les situations concernes, la valeur et le sens de variation. Si It/0 > 100 , soit a = It/0 - 100 . On dit que la grandeur X a connu une augmentation de a % entre la situationde rfrence 0 et la situation t. Si It/0 < 100, soit d = 100 - It/0 . On dit que la grandeur X a connu une diminution de d % entre la situation de rfrence 0 et la situation t. Remarque : Dans la dfinition prcdente on a employ le terme gnral de situations; le plus souvent il s'agit d'poques . t sera donc l'poque d'observation ou de calcul de l'indice et 0 l'poque de base. Exemple : Supposons qu' une date donne 0, le prix d'une certaine marchandise soit P0 = 4 dh l'unit . Supposons qu' une date ultrieure le prix de cette mme marchandise soit Pt = 5,20 dh l'unit . On cherche l'indice simple du prix de la marchandise tudie la date t calcule sur la base 100 la date de rfrence 0. It/0 = P 100 = 4 100 = 130 . 0 On remarque que It/0 >100 donc a = 130 - 100 = 30. On dit que la marchandise tudie a connu une augmentation de son prix unitaire de 30 % entre la date de rfrence 0 et la date d'observation t. Ainsi on peut dire qu'on dpense 130 dh la date t pour acqurir la mme marchandise qui cotait 100 dh la date de base 0. 7.3.2 Proprits des indices simples Trois proprits essentielles caractrisent les indices simples . a) L'identit : Il y a identit lorsque la valeur de l'indice est gale 100. It/0 = X 100 = 100 0 Cela signifie que Xt = X0 c'est dire que la grandeur X tudie n'a pas enregistr de variation la date t par rapport la date de rfrence 0. Exemple : Un journal vendu 2,50 dh la date de rfrence 0 (an 1999) est toujours vendu 2,50 dh la date d'observation t (an 2004). It/0 = 2,50 100 =100 . b) La rversibilit : Il y a rversibilit lorsque le produit de l'indice d'une grandeur la date t calcule sur la base 100 la date de rfrence 0 par l'indice de la mme grandeur la date 0 calcule sur la base 100 la date t est gal 104. It/0 I0/t = 104 En effet :
t It/0 = X 100 0

Pt

5,20

Xt

2,50

et

0 I0/t = X 100 d'o It/0 I0/t =10000 t

Page 49 sur 55

Support de cours : statistiques probabilits

Ce qui montre qu'un indice simple est rversible . c) La transfrabilit ou la circularit d'un indice Considrons les mesures X0 , Xt et Xt' d'une grandeur aux dates 0, t et t'. Soit les trois indices simples suivants :
t t' It/0 = X 100 ; It'/0 = X 100 ; 0 0

t' It'/t = X 100 t

On dit qu'un indice simple est transfrable si : It'/0 =


X t' X t' Xt

1 I It/0 100 t'/t

Autrement dit X = X X . 0 t 0 Ce qui montre qu'un indice simple est transfrable . Exemple : Soit le prix du litre du gasoil au Maroc aux dates suivantes : Juillet 1996 (date 0) P0 = 4 dh. Octobre 1996 (date t) Pt = 4,32 dh. Fvrier 1997 (date t') Pt' = 5,40 dh. Calculons les indices simples :
t It/0 = P 100 = 4 100 = 108 0 t' It'/0 = P 100 = 4 100 = 135 0 t' It'/t = P 100 = 4,32 100 = 125 . t

4,32

5,40

5,40

On vrifie aisment que Soit 135 = 7.4


1 100

It'/0 =

1 I It/0 100 t'/t

(125 108) .

Les indices synthtiques :

7.4.1 Gnralits : La recherche d'un indice peut ne pas tre limite la comparaison des mesures d'une seule grandeur aux poques de rfrence 0 et d'observation t. On peut en effet envisager de caractriser avec un indice l'volution de plusieurs grandeurs et de calculer non plus un indice simple mais un indice synthtique . On distingue deux types d'indices synthtiques : - Les indices synthtiques simples qui reprsentent une moyenne arithmtique simple d'indices lmentaires. - Les indices synthtiques pondrs qui reprsentent une moyenne pondre d'indices simples . 7.4.2 Principe de construction des indices synthtiques . Construire un indice synthtique , c'est rsumer en une seule valeur un grand nombre d'observations de plusieurs grandeurs.
Page 50 sur 55

Support de cours : statistiques probabilits

La construction d'un indice synthtique ncessite : a) Le choix du nombre d'lments retenir, c'est dire l'chantillon d'lments jug reprsentatif. b) La nature des lments retenir : Il convient de retenir des lments remplissant les deux conditions suivantes : - Chaque lment retenu devant tre en rapport aussi faible que possible avec les autres lments galement retenus. - Chaque lment retenu devant tre en rapport aussi fort que possible avec les autres lments non retenus susceptibles de figurer dans l'chantillon. c) Mode de calcul : Le statisticien doit d'abord justifier le choix entre le calcul de l'indice des moyennes ou la moyenne des indices. Exemple : A partir d'une enqute statistique, on a obtenu les prix d'un kg de viande, d'un litre d'huile, d'un kg de sucre et d'un kg de beurre au cours des priodes 0 et t . 1 kg de viande 1L d'huile 1 kg de sucre 1 kg de beurre Prix P0 (dh) 50 6 4 20 Prix Pt (dh) 70 9 5 30 On va calculer l'indice des moyennes arithmtiques des prix et la moyenne arithmtique des indices des prix de chaque produit . 1) L'indice des moyennes des prix : On calcule les moyennes arithmtiques des prix P0 et Pt .
50 + 6 + 4 + 20 80 = = 20 4 4 70 + 9 + 5 + 30 114 = = 28,5 Pt = 4 4

P0 =

L'indice des moyennes des prix est :

It/0 =

Pt P0

100 =

28,5 100 = 142,5 20

2) La moyenne des indices : Cherchons d'abord pour chaque produit la valeur de l'indice lmentaire des prix la priode t calcule sur la base 100 la priode de rfrence 0. Indice des prix de la viande Indice des prix de l'huile Indice des prix du sucre Indice des prix du beurre It/0 = (1 kg) (1 litre) (1 kg) (1 kg) : It/0 = : : :
70 100 = 140 50 9 It/0 = 6 100 = 150 5 It/0 = 4 100 = 125 30 It/0 = 20 100 = 150

La moyenne arithmtique des indices des prix entre les priodes 0 et t est :
140 + 150 + 125 + 150 = 141,25 4

Page 51 sur 55

Support de cours : statistiques probabilits

On remarque que la moyenne arithmtique des indices des prix (141,25) est diffrente de l'indice des moyennes arithmtique des prix (142,5). Pour justifier le choix on limine celui qui change avec le changement des units des produits . Reprenons le tableau prcdent dans lequel remplaons par exemple l'unit le litre de l'huile par le mtre cube (1000 litres) et le kg du sucre par la tonne soit (1000 kg), on aura le tableau suivant : Prix P0 (dh) Prix Pt (dh) 1 kg de viande 1m3 d'huile 50 6000 70 9000 1 tonne sucre 4000 5000 1 kg de beurre 20 30

Reprenons les mmes calculs que prcdemment et calculons l'indice des moyennes arithmtiques des prix : On calcule d'abord les nouvelles moyennes arithmtiques des prix P0 et Pt .
50 + 6000 + 4000 + 20 10070 = = 2517,5 4 4 70 + 9000 + 5000 + 30 14100 P = = 3525 = t 4 4 P 3525 D'o l'indice des moyennes : It/0 = Pt 100 = 2517,5 100 = 140 0
P0

On remarque que l'indice des moyennes a chang avec le changement des units (140 142,5). Calculons maintenant la moyenne arithmtique des indices des prix de chacun des quatre produits. Indice des prix de la viande Indice des prix de l'huile Indice des prix du sucre Indice des prix du beurre
I t/0 =

(1 kg) : It/0 = (1m3) : It/0 = (1 t) : It/0 =

(1 kg) : It/0 =

70 100 = 140 50 9000 100 = 150 6000 5000 100 = 130 4000 30 100 = 150 20

D'o la moyenne arithmtique des indices des prix est :


140 + 150 + 125 + 150 = 141,25 4

On remarque que la moyenne arithmtique des indices des prix est insensible aux changements des units . En conclusion l'indice des moyennes n'est pratiquement jamais utilis puisque l'utilisation d'units diffrentes (multiples ou sous multiples des units) conduit un indice diffrent, ce qui est tout fait illogique du point de vue conomique. Consquence : Le mode de calcul le plus appropri est la moyenne arithmtique des indices.

Page 52 sur 55

Support de cours : statistiques probabilits

7.5 Principaux types d'indices: Les formules d'indices sont nombreuses, cependant dans la pratique, elles se rduisent un petit nombre de types dont les principaux sont ceux de LASPEYRES et de PAASCHE qui portent essentiellement sur les prix et les quantits . 7.5.1 Les indices de LASPEYRES. On notera : - Pi.o et Qi.o respectivement le prix et la quantit du ime produit l'poque de rfrence 0. - Pi.t et Qi.t respectivement le prix et la quantit du ime produit l'poque d'observation t. 7.5.1.1 L'indice des prix de LASPEYRES. Lp =

P P

i .t

Qi .0 Qi.0

100

i .0

100 Pi.0 Qi 0

Pi .t P ( Pi.0 Qi.0 ) i .0

On dit que le coefficient de pondration de l'indice des prix est : Pi.o Qi.o . Remarques : 1) Si Lp > 100 : soit a = Lp 100, on dit que les prix ont augment de a % entre la priode de rfrence 0 et la priode d'observation t. 2) Si Lp < 100 : soit d = 100 Lp , on dit que les prix ont diminu de d % entre la priode de rfrence 0 et la priode d'observation t. 7.5.1.2 L'indice des quantits de LASPEYRES . Lq =

Q Q

it

Pi 0 Pi 0

100 =

i0

100 Qi.0 Pi.0

Qi .t Q (Qi.0 Pi.0 ) i .0

On dit de mme que le coefficient de pondration de l'indice des quantits est : Qi.o Pi.o Remarques : 1) Si Lq > 100 , soit a = Lq 100, on dit que les quantits ont augment entre la priode de rfrence 0 et la priode d'observation t. 2) Si Lq < 100 , soit d = 100 Lq , on dit que les quantits ont diminu de d % entre la priode de rfrence 0 et la priode d'observation t.

Page 53 sur 55

Support de cours : statistiques probabilits

4.5.2 Les indices de PAASCHE 7.5.1.3 Indice de LASPEYRES des valeurs globales Lvg =

Q Q

i .t

Pi .t Pi .0

100

i .0

7.5.2 Les indices de PAASCHE 7.5.2.1 Indice de PAASCHE des prix


Pp =

P P

i .t

Qi .t Qi .t

100

i .0

Remarques : 1) Si Pp > 100, soit a = Pp 100; on dit que les prix ont augment de a % entre l'poque de rfrence 0 et l'poque d'observation t. 2) Si Pp < 100, soit d = 100 Pp ; on dit que les prix ont diminu de d % entre l'poque de rfrence 0 et la priode d'observation t. 7.5.2.2 Indice de PAASCHE des quantits Pq =

Remarque : 1) Si Pq > 100, soit a = Pq 100 ; on dit que les quantits ont augment de a % entre l'poque de rfrence 0 et l'poque d'observation t. 2) Si Pq < 100 , soit d = 100 Pq ; on dit que les quantits ont diminu de d % entre l'poque de rfrence 0 et l'poque d'observation t . 7.5.2.3 Indice de PAASCHE des valeurs globales Pvg =

Q Q

i .t

Pi.t Pi.t

100

i .0

7.5.3 Les indices de FISHER L'indice de FISHER est la moyenne gomtrique des deux indices de LASPEYRES et de PAASCHE . Il compris entre ces deux indices et vient pallier leurs carences . F = L P 7.5.3.1 Indice de LASPEYRES des prix Fp =
L p Pp

Q Q

i .t

Pi.t Pi.0

100

i .0

Page 54 sur 55

Support de cours : statistiques probabilits

7.5.3.2 Exemple

Indice de FISHER des quantits Fq =


Lq Pq

Page 55 sur 55

S-ar putea să vă placă și