Documente Academic
Documente Profesional
Documente Cultură
EXERCICES .............................................................................................................................................................. 18
CHAPITRE II. ETUDE DES VALEURS TYPIQUES DES SERIES STATISTIQUES UNIVARIEES. ........................................... 20
II.1. Paramètres de tendance centrale (ou de position) .............................................................................................. 20
II.2. Paramètres de dispersion ................................................................................................................................... 27
II.3. Les paramètres de forme.................................................................................................................................... 30
EXERCICES .............................................................................................................................................................. 32
EXERCICES .............................................................................................................................................................. 43
INTRODUCTION ...................................................................................................................................................... 46
IV.1. EVÉNEMENT ALÉATOIRE ......................................................................................................................... 46
EXERCICES .............................................................................................................................................................. 53
EXERCICES .............................................................................................................................................................. 74
EXERCICES .............................................................................................................................................................. 93
X.2.4 Test de comparaison d’une proportion théorique P à une proportion observée P0........................... 110
X.2.5 Comparaison de données appariées. ...................................................................................................... 111
X.2.6 Test d’existence d’une liaison statistique linéaire. ............................................................................... 112
INTRODUCTION GENERALE
Une opération de collecte des données peut porter sur l’ensemble des
unités statistiques (population) ou sur une partie de ces unités
statistiques (ou échantillon). Par ailleurs, tout travail de collecte des
données se heurte à certaines contraintes : le coût, la main-d’œuvre et le
matériel, le délai d’exploitation et la qualité des résultats.
Dans cette section, nous allons répondre à deux questions fondamentales :
Comment choisir les unités statistiques à examiner ?
Quel nombre d’unités statistiques faut-il interroger en vue d’obtenir
l’information recherchée.
probabilistes.
1. Les méthodes d’échantillonnages aléatoires ou probabil istes.
Elles consistent à analyser une fraction de la population supposée
représentative de la population d’étude et tirée de façon aléatoire.
On distingue :
- l’échantillon aléatoire avec remise ;
- l’échantillon aléatoire sans remise.
Procédé du tirage.
- identifier tous les N individus de la population et les ranger suivant
un critère déterminé ;
- attribuer un numéro à chaque individu ;
Page 8 sur 124
- inscrire ces numéros sur des bouts de papier à placer dans une
urne ;
- opérer le tirage l’un après l’autre jusqu’à n.
Description
Description de la méthode
- La population est subdivisée (partitionnée) en k classes : C1, C2, …,
Ck plus ou moins homogènes face au caractère faisant l’objet de
l’étude statistique. Cette partition est obtenue en faisant une étude
préalable socio-économico-démographique et sanitaire.
- Le nombre d’individu appartenant à chaque strate et qui devra faire
parti de l’échantillon est donné par la formule suivante :
Page 9 sur 124
Ni
ni où ni = nombre d’individu à tirer dans la
N × n
≅
strate
Ni = taille de la strate
n = taille de l’échantillon
N = taille de la population.
Ni ∩ Nj = Ø ∀i ≠ j.
confiance de 95% ;
p : proportion de la population ayant une caractéristique donnée. Si
aucune estimation n’existe, on prendra p = 0,50 ;
q = 1-p ;
d : degré de précision voulu. En général, d=0,05, parfois 0,01.
Tableau n°1.3. Répartition par âge, par sexe et par groupe de maladie
des patients ayant reçu des soins ambulatoires dans un Centre
de Santé.
Tranches d’âges
0-15 16-45 >45 Tot
M F M F M F al
Maladies 10 20 12 13 16 2 73
infectieuses
Troubles 22 25 40 10 15 8 120
nutritionnelles
Traumatisme 30 25 11 14 18 16 114
Autres affections 12 10 13 15 6 15 71
Total 74 80 76 52 55 41 378
Page 12 sur 124
4. Tableau de contingence.
∑ ni P 150
Page 14 sur 124
Centre de classe
xk
a).
a). Le diagramme en bâtonnets
Nombre de personnes
Nombre
ayant ce nombre
d'enfants
d'enfants
0 103
1 115
2 95
3 35
4 10
5 2
Nombre de
Age (ans) personnes dans
cette tranche
d'âge
20 à 30 100
30 à 40 150
40 à 50 90
50 à 65 20
Page 17 sur 124
Nombre de
Age (ans) personnes dans
cette tranche d'âge
20 à 30 120
30 à 40 150 Graphique à secteurs circulaires
40 à 50 80
50 à 65 10
a)
b) Diagramme à colonnes (voir TP).
Page 18 sur 124
EXERCICES
- Paramètres de dispersion
Donnent les écarts entre les différentes valeurs et la moyenne
arithmétique (Etendue, variance, écart-type, coefficient de variation,…)
- Paramètres de forme
Caractérisent la forme de la courbe de fréquence (symétrie, asymétrie)
− n1 x1 + n2 x2 + ... + nk xk
x=
n
ou encore
n
x=1
n
∑nx i i (formule pondérée)
i =1
x = 34/6=5,6
On calcul d’abord des centres des classes (xi), puis on applique la formule
pondérée.
Page 22 sur 124
1.2.
1.2. La moyenne géométrique (G)
Elle est définie, pour une série de n termes positifs xi, par la racine nième
du produit de ces termes :
G= n x1 .x 2 ... x n
1.3.
1.3. La moyenne harmonique (H)
Considérons une série statistique x1, x2, …, xn de séries à termes positifs.
La moyenne harmonique est définie comme étant l’inverse de la moyenne
arithmétique des inverses des éléments de la série considérée :
1
H= n
1 1
∑
n i =1 xi
1.4.
1.4. La moyenne quadratique (Q)
La moyenne quadratique d’une série de n termes est la racine carrée de la
moyenne des carrés de ses termes :
Page 23 sur 124
2.1. Définition.
C’est la valeur observée dont la fréquence absolue est la plus grande.
2.2. Remarques
Mo n’existe pas toujours,
Lorsque le mode existe, il peut ne pas être unique. D’où on peut
trouver :
• Une distribution unimodale
• Une distribution multimodale
∆1
= fréquence classe modale – fréquence classe précédente
∆2
= fréquence classe modale – fréquence classe suivante.
3. Médiane ( Me ou x1/2)
3.1. Définition
C’est la valeur observée se situant au milieu d’une série statistique rangée
par ordre croissant. Elle est telle qu’il y ait 50 % d’observations à sa
gauche et 50 % à sa droite.
Si n est impair :
M e = x n +1
2
Page 25 sur 124
Si n est pair :
1
Me = (xn + xn )
2 2 2 +1
Exemples
Ex1. 10 ;12 ;13 ;14 ;18
= = 3è
_`a c`a
b b
Donc Me = 13
n/2= 3e
2 2
(n/2) + 1= 4e
Me = (3e +4e ) /2 = (13+14)/2= 13,5(valeur fictive)
Où
li est la limite inférieure de la classe médiane
h est l’amplitude de la classe médiane
ni est la fréquence absolue de la classe médiane
n est la taille de l’échantillon
Ni-1 est la fréquence absolue cumulée de la classe
Page 26 sur 124
n= 150
n/2 =150/2=75e
li= 35 ;
h= 5
Ni-1= 72
ni= 45
Me = 35 + 5 (75-72/45) = 35 +3/9 = 35 + 1/3= 35,3 ans
Me= 35 ans 3mois 18 jours
4. Les quartiles (Q1, Q2, Q3).
Ce sont des valeurs observées qui divisent la série statistique en quatre
parties égales. Elles sont déterminées à partir des formules suivantes :
n
4 − N i −1
Q1 = l i + h
ni
Page 27 sur 124
Où
ℓi est la limite inférieure de la classe
contenant le premier quartile ;
h l’amplitude de la classe ;
ni est la fréquence absolue de la classe ;
Ni-1 est fréquence absolue cumulée de la classe ;
n
2 − N i −1
Q2 = l i + h = Me
ni
3n
4 − N i −1
Q3 = l i + h
ni
Où i varie de 1 à 9.
NOTA :
On peut définir de manière similaire les centiles.
II.2. Paramètres de dispersion
2. Variance ( s²)
Déf.
C’est la moyenne des carrés des écarts de diverses valeurs de la
série statistique vis-à-vis de la moyenne arithmétique.
Formule simple :
( ) ( ) ( )
2 2 2
x1 − x 2 + x2− x + .. xn+ x
s² =
n
( xi − x )
2
Ou encore
∑
n
i =1
s² =
Formule pondérée
( ) ( ) ( )
2 2 2
n1 x1 − x + n2 x2 − x + ...nk xk − x
s² =
n
s
C .V . = −
× 100
a) Variance
s² =
1
n
( )
∑ ni xi − x ²
= 8250/150= 55 ( ans) ²
Coefficients d’asymétrie.
x − Mode
.
SK =
S
Si g1 = 0, il y a symétrie
2. Coefficients d’aplatissement
Coefficient de FISHER
;
m4
b2 =
S4
u
S u = jk ∑_vra nv (xv − xw)b s
−
où et
1 n
∑ i i )4 . a
m4 = n ( x − x
_
n i =1
EXERCICES
Classe Effectif
30 – 60 7
60 – 90 11
90 – 120 14
120 – 150 11
150 - 180 7
1,47 1,7 2,01 1,12 1,85 1,01 1,58 2,01 1,31 0,77
1,2 1,93 1,47 1,97 2,59 2,94 1,19 1,89 0,75 1,2
1,13 1,2 0,8 1,31 2,01 1,47 0,87 1,31 1,19 0,76
Page 34 sur 124
classe
effectifs 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2
Trouver :
a) le QI moyen pour cette école
b) l’écart type de la distribution.
Dans les chapitres précédents, les séries étudiées portent une seule
variable ; or il est possible d’étudier sur une même unité statistique deux
ou plusieurs variables comme par exemple la taille et le poids des
étudiants de l’INBTP, l’âge etc.
III.1. REGRESSION
x
b) Ajustement mécanique
Il y a plusieurs méthodes mécaniques :
Page 39 sur 124
c) Ajustement analytique
Le problème d’ajustement analytique est de trouver le meilleur
ajustement des données c’est-à-dire une fonction qui doit s’adapter de la
façon la plus satisfaisante aux observations faites et conduire à une
courbe d’ajustement aussi simple que possible.
Cette fonction est notée f(x).
Nous distinguons :
Ajustement linéaire (droite des moindres carrés)
Ajustement parabolique
Ajustement à l’aide d’une fonction exponentielle
Ajustement à l’aide d’une fonction des puissances.
Page 40 sur 124
∑ (y )
n
2
− yi'
paramètres a et b tels que soit minimum.
i
i =1
∑( x − x)( y − y)
n
i i
COV ( x, y)
a= i =1
=
∑( x − x)
n 2 Varx (1)
i
i =1
b = y − ax (2)
NOTA : (1) peut encore s’écrire :
n
1 n n
∑ xi yi − ∑ i ∑ yi
x
n i =1 i =1
a= i =1
2
n
1 n
∑
i =1
x − 2
∑ xi
n i =1
i
III.2. CORRELATION
1. Existence
Existence d’une liaison statistique entre deux variables
c’est – à – dire à une valeur donnée d’une des variables il correspond non
pas une seule, mais toute une distribution des valeurs de l’autre variable.
Et inversement.
On ne saurait dire, par exemple, que le poids est une fonction de la taille
au sens mathématique de ce terme, ou inversement.
Pour une valeur donnée de la taille, dans un groupe de sujets dont on
étudie la taille et le poids, on trouvera toute une série de sujets ayant cette
taille, mais différents entr’eux par le poids. Inversement, pour une valeur
donnée du poids on trouvera toute une série de sujets différents entr’eux
par taille.
y y y
∑( x − x)( y − y)
n
i i
COV ( X ,Y ) COV ( X ,Y )
r= i =1
= = (1)
Varx ×Vary
∑( x − x) ∑( y − y)
n 2 n 2 Sx SY
i i
Calcul rapide de r :
i =1 i =1
n
1 n n
∑ xi yi − ∑ xi ∑ yi
(1) est équivalent à : r =
i =1 n i=1 i=1
n 2 1 n 2 n 2 1 n 2
∑ xi − ∑ xi ∑ yi − ∑ yi
i=1 i=1
n i=1 n i=1
3. Propriétés de r
EXERCICES
INTRODUCTION
Définition
Une expérience aléatoire est une expérience dont le résultat est
imprévisible.
Exemple
Un lancer de dé est une expérience aléatoire.
Définition
On appelle événement un ensemble d’événements élémentaires.
Définition
Etant donnée une expérience aléatoire. On appelle espace fondamental ou
univers, noté Ω, l’ensemble de tous les événements élémentaires
possibles.
Exemple
Remarque
Dans cet exemple Ω est fini et donc dénombrable. Mais Ω peut être infini
dénombrable comme dans le cas suivant : on jette une pièce de monnaie
jusqu’à ce qu’on obtienne pile ; l’ensemble fondamental correspondant est
la suite des nombres entiers Ω = {1, 2, 3, ..., n, ...} puisqu’on peut avoir une
pile au bout d’un jet, de 2 jets, de n jets, n étant aussi grand que l’on veut.
Exemple
Soit ε "jet d’un dé homogène une fois". Les événements A "obtenir un
chiffre pair" et B "obtenir un chiffre impair" sont disjoints.
Définition
Soit E un ensemble fini, on appelle cardinal de E, noté Card(E)ou |E|, le
nombre d’éléments de E.
Propriété
Pour deux ensembles finis E et F, on a la formule :
Card(E ∪ F) = Card(E) + Card(F) − Card(E ∩ F):
Définition
Soit Œ un ensemble. Une loi de probabilité ℙ sur Œ est une fonction qui à
tout événement A associe un réel ℙ(Ž) , et qui a les trois propriétés
suivantes :
a) 0 ≤ ℙ(•) ≤ 1
b) ℙ(•) = 1
c) Pour toute famille finie ou dénombrable (A_ )_‘’ d’événements
disjoints, on a
ℙ “” A_ • = – ℙ(A_ )
_‘’ _‘’
Propriétés
Preuve
3) ℙ(A ∩ B) = ℙ(∅) = 0
4) Si A ⊆ B alors B = A ∪ (B\A).
Proposition
(1) Pour toute famille finie ou dénombrable (A_ )_∈’
d’événements
ℙ ›” A_ œ ≤ – A_
_∈’ _∈’
ℙ ›” A_ œ = lim A_
_→Ÿ
_∈•
ℙ“ A_ • = lim A_
_→Ÿ
_∈•
– ¤¥ = §
¥r§
si A est dénombrable, les sommes finies sont remplacées par les sommes
de séries.
Ceci implique
Page 53 sur 124
EXERCICES
1. Soient A et B deux événements élémentaires. Donner une expression et
représenter le diagramme de Venn de l’événement tel que : (i) A est
réalisé mais non B, c.à.d. que seulement A se réalise ; (ii) soit A, soit B,
se réalise, mais pas les deux en même temps ; c.à.d. qu’exactement un
seul des deux événements se produit.
2. Soient A, B et C des événements élémentaires. Trouver une expression
et représenter le diagrame de Venn de l’événement tel que (i) A et B
mais non C se réalise ; (ii) A seulement se réalise.
3. On jette en l’air une pièce de monnaie et un dé, et l’on suppose que
l’ensemble fondamental S se compose des 12 éléments :
S = { F1, F2, F3, F4, F5, F6, P1, P2, P3, P4, P5, P6 }
(i) Exprimer d’une façon explicite les événements suivants : A = {
face et un nombre pair apparaissent}, B = { un nombre premier
apparaît }, C = { pile et un nombre impair apparaissent }.
(ii) Exprimer d’une façon explicite l’événement : (a) A ou B est
réalisé, (b) B et C est réalisé, (c) B seulement est réalisé.
(iii) Lesquels des événements A, B et C s’excluent mutuellement ?
4. On suppose qu’un ensemble fondamental S est formé de 4 éléments :
S = {a1, a2, a3, a4}.
Laquelle des fonctions suivantes définit une probabilité sur S ?
(i) P(a1) = ½, P(a2) = 1/3, P(a3)= ¼, P(a4)= 1/5.
(ii) P(a1) = ½, P(a2) = ¼, P(a3)= - ¼, P(a4)= 1/2.
(iii) P(a1) = ½, P(a2) = ¼, P(a3)= 1/8, P(a4)= 1/8.
(iv) P(a1) = ½, P(a2) = ¼, P(a3)= ¼, P(a4)= 0.
5. On pipe une pièce de monnaie de telle sorte que face apparaisse deux
fois plus que pile. Calculer P(P) et P(F).
6. Deux hommes h1 et h2, et trios femmes, f1, f2 et f3 participent à un
tournoi d’échecs. Les individus de même sexe ont des chances égales de
gagner, mais un homme à deux fois plus de chances de gagner qu’une
femme. (i) Calculer la probabilité pour qu’une femme gagne le tournoi.
(ii) Si h1 et f1 sont mariés, calculer la probabilité pour que l’un d’eux
gagne le tournoi.
Page 54 sur 124
12. On jette un dé 100 fois. Le tableau suivant donne les six résultats
possibles, ainsi que leur fréquence d’apparition :
Nombre 1 2 3 4 5 6
Fréquence 14 17 20 18 15 16
Calculer la fréquence relative f des événements suivants
(a) Un 3 apparait
(b) Un 5 apparait
(c) Un nombre pair apparait
(d) Un nombre premier apparait
13. Un dé est lancé une fois. On demande :
a) La probabilité d’obtenir le point 2 comme face supérieure du dé ?
b) La probabilité d’obtenir un point pair comme face supérieure du
dé ?
14. On jette une paire de dés bien équilibrés. Sachant que la somme des
valeurs obtenues est de 6.
Calculez la probabilité pour que l’un des dés ait donné un chiffre 5
20. On tire au hasard deux cartes d’un jeu ordinaire de 52 cartes. Calculer
la probabilité pour que
(a) Les deux cartes soient des piques ;
(b) Une carte soit un pique et l’autre soit un cœur.
= = .
¶({c}) a/² a
¡({a,·,,¸ }) i/² i
Plus généralement, on a
Définition
ℙ(A ∩ B)
ℙ(A|B) =
ℙ(B)
Exemples
Exemples
ℙ(A ∩ B) |A ∩ B| 2
Donc ℙ(A|B) = = =
ℙ(B) |B| 5
Donc
ℙ(Ž ∩ º) = ℙ(º|Ž). ℙ(Ž)
Exemple
Une urne contient deux boules blanches et une boule noire. Une personne
tire une boule et la garde, une deuxième tire une boule. Avec quelle
probabilité les deux boules tirées sont-elles blanches ?
Solution
Donc
2 1 1
ℙ(A et B) = ℙ(B|A). ℙ(A) = × =
3 2 3
On a la généralisation suivante :
Proposition (Probabilités
(Probabilités composées)
composées)
Soit (•, ℙ)un espace de probabilité et soit A1, A2,…, An des événements.
Alors on a
ℙ (An et An-1et… et A1) = ℙ(A|B_ )ℙ(A|B_ )ℙ(A|B_ ) ⋯ ℙ(A|B_ )
Proposition
Exemple
Trois coups sont tirés à la file sur une même cible. La Probabilité
d’atteinte de la cible est respectivement égale à pa = 0.3 au premier coup,
pb = 0.6 au 2nd coup et pi = 0.8 au 3è coup. La Probabilité de destruction
de la cible est respectivement égale à ta = 0.4 quand elle est touchée une
fois, t b = 0.7 quand elle est touchée deux fois t i = 1 quand elle est
touchée trois fois. Quelle est la ℙ de détruire la cible quand 3 coups sont
tirés
Solution
Soit A l’événement "détruire la cible quand 3 coups sont tirés"
Page 60 sur 124
V.4 SYSTÈME COMPLET D’ÉVÉNEMENTS
.4 SYSTÈME COMPLET D’ÉVÉNEMENTS
SYSTÈME COMPLET D’ÉVÉNEMENTS :
Les événements A1, A2, ..., An forment un système complet si les Ai
constituent une partition de Ω, c’est-à-dire si :
a) les événements sont deux à deux disjoints : ∀(i ≠ j), ÀAv ∩ AÁ = ∅Â
b) ils couvrent tout l’espace : ⋃_vra Av = Ω
Page 61 sur 124
Proposition
Proposition (théorème
(théorème de Bayes)
Soient (•, P) un espace de probabilité et B1, B2,…, Bn le système complet
d’événements et l’événement A qui ne peut se réaliser que conjointement
avec l’un des événements B1, B2,…, Bn que nous appelons des causes.
En vertu du théorème des probabilités totales,
_
ℙ(Bv ). ℙ(A|Bv )
Dés lors, ℙ(Bv |A) =
ℙ(A)
ℙ(Bv ). ℙ(A|Bv )
Donc, ℙ(Bv |A) =
∑_vra ℙ(Bv ). ℙ(A|Bv )
Exemple
L’événement A dont les causes équiprobables B1, B2, B3, B4 sont telles que
ℙ(A|Ba ) = 0.7 ; ℙ(A|Bb ) = 0.1 ;ℙ(A|Bi ) = 0.1 ;ℙ(A|Bu ) = 0.02 .
On donne
Page 62 sur 124
ℙ› Av œ = Å ℙ(Av )
v∈Ä v∈Ä
Cas particuliers
Cas particuliers
- Deux événements A et B sont dits indépendants
ssi ℙ(A ∩ B) = ℙ(A). ℙ(B) ssi ℙ(B|A) = ℙ(B).
Dire que deux événements sont indépendants revient à que la
connaissance de l’un n’influence pas l’autre.
- Trois événements A, B et C sont dits indépendants si
II.0. ils sont 2 à 2 indépendants
III.0. et ℙ(A ∩ B ∩ C) = ℙ(A). ℙ(B). ℙ(C)
Page 63 sur 124
Exemple
EXERCICES
défaite (D), et une probabilité de 0,1 de faire match nul (N). l’équipe
joue trois matches pendant le week-end. (i) Déterminer les éléments
de l’événement A tel que l’équipe gagne au moins deux fois et ne
perde pas, et calculer P(A). (ii) Déterminer les éléments de
l’événement B tel que l’équipe gagne, perde et fasse match nul, et
calculer P(B).
19. Soit S un ensemble fini probabilisé et soit T l’ensemble probabilisé
de n épreuves indépendantes dans S. Montrer que T est bien défini,
c’est-à-dire que (i) la probabilité de chaque élément de T est positive
ou nulle et (ii) la somme des probabilités de tous les éléments est
égale à 1.
20. Calculer l’espérance mathématique µ, la variance σ2 et l’écart-type σ
de chacune des lois de probabilité suivants :
(i)
xv 2 3 11
f(xv ) 1/3 1/2 1/6
(ii)
xv -5 -4 1 2
f(xv ) ¼ 1/8 ½ 1/8
(iii)
xv 1 3 4 5
f(xv ) 0,4 0,1 0,2 0,3
26. Quelle est la probabilité d’obtenir exactement 2 faces avec 6 jets d’une
pièce de monnaie parfaitement équilibrée.
27. Un joueur possède 4 piques tirés d’un jeu de 52 cartes. Si on lui donne
trois cartes de plus, quelle est la probabilité pour qu’au moins l’une
des cartes supplémentaires soit aussi un pique ?
28. Une classe contient 12 garçons et 4 filles. Si l’on choisit trois élèves de
la classe au hasard, quelle est la probabilité pour que tous soient des
garçons ?
29. Les élèves d’une classe sont choisis au hasard l’un âpres l’autre pour
subir un examen. Calculer la probabilité pour que l’on ait
alternativement un garçon et une fille, sachant que
30. Soit A : « l’événement tel qu’une famille a des enfants des deux sexes »,
et B : « l’événement tel qu’une famille a au plus un garçon ».
a) montrer que A et B sont des événements indépendants si une famille
a trois enfants
Page 68 sur 124
VI.1 VARIABLES
VARIABLES ALÉATOIRES
Définitions
Définitions
- Une variable aléatoire est une application X de Ω dans ℝ, Ë ∶ Œ ⟶ ℝ
telle qu’à tout résultat possible de l’expérience (à tout élément de Ω), la
variable aléatoire X fait correspondre un nombre réel.
- La fonction de répartition F d’une variable aléatoire X est la fonction de
R dans R définie par : pour tout réel x, Î(Ï) = ℙ({Ë ≤ Ï})
Remarque
Lorsque Ω est fini ou infini dénombrable, toute application de Ω dans ℝ
est une variable aléatoire, puisque la définition rigoureuse d’une
variable aléatoire X impose que tout intervalle de ℝ soit l’image d’une
partie de Ω par l’application X. Or toute partie de Ω est un événement
aléatoire.
Définition
Une variable aléatoire X qui prend ses valeurs dans un sous-ensemble fini
ou dénombrable {ÏÐ : Ð ∈ Ñ} est appelée variable aléatoire discrète.
Page 70 sur 124
(∀i), pv ≥ 0 et – pv = 1
vra
xi x1 x2 x3 x4 … xn
pi p1 p2 p3 p4 … pn
xi
x1 x2 x3 x4 xn
x
0 xi
Page 71 sur 124
Dans tous les cas, F(x) est une fonction monotone croissante, c’est-à-dire
F(a) ≥ F(b) si a ≥ b. De plus limÒ→ÕŸ F(x) = 0 et limÒ→`Ÿ F(x) = 1
Définition
On dit qu’une variable aléatoire X est dite continue s’il existe une fonction
f de ℝ dans ℝ positive ou nulle telle que pour tout sous ensemble de ℝ ,
on a
ℙ(X ∈ B) = Ö f(x)dx
×
La fonction f est appelée la fonction de densité de probabilité de la
variable aléatoire X.
Les propriétés de la fonction de répartition F sont telle que :
Ö f(x)dx = 1
ÕŸ
Ú
De plus, quels que soient a et b (a<b), on a F(a) = ÙÕŸ f(x)dx
- ℙ(a < Û < Ü) = ℙ(a ≤ X < Ü) = ℙ(a < Û ≤ Ü) = ℙ(a ≤ X ≤ b) =
Ý
ÙÚ f(x)dx = F(b) − F(a)
- ℙ(X = a) = 0
- Si f est donnée, la probabilité ℙ(a ≤ X ≤ b) est la surface sous la
courbe entre a et b
Page 72 sur 124
f(x)
â (ã ≤ Û ≤ Ü )
x
a b
Définition
Soient X et Y deux variables aléatoires définies sur un espace de
probabilité (Ω ℙ).
Page 73 sur 124
Proposition
Proposition
EXERCICES
f(x v ) 1 1 1
3 2 6
xv -5 -4 1 2
f(x v ) 1 1 1 1
4 8 2 8
2. On jette trois fois une pièce de monnaie mal équilibrée et telle que
ℙ(F) = et ℙ(P) = . Soit X la variable aléatoire représentant la plus
i a
u u
grande succession de faces que l’on obtient. Calculer la distribution de
probabilité, espérance mathématique, la variance et l’écart type de X.
3. On lance trois fois une pièce de monnaie parfaitement équilibrée. X
est une variable aléatoire prenant respectivement les valeurs 0 et 1
selon que le premier jet donne face ou pile. Y désigne le nombre de
faces obtenu. Calculer (i) la loi de probabilité de X et Y, (ii) la loi de
probabilité produit h de X et Y, (iii) Cov (X, Y).
4. Soit X une variable aléatoire de moyenne µ et d’écart-type σ ˃ 0 ; soit
X* la variable aléatoire centrée réduite correspondant à X, c-à-d. X* =
(X - µ)/σ. Montrer que E(X*) = 0 et Var (X*)=1 (D’où σX* = 1).
5. Soit X une variable aléatoire ayant une distribution f. on définit le
moment Mr d’ordre r de X par
Mé = E(X é ) = – xvé f(xv )
Calculer les cinq premiers moments de X sachant que X a la distribution
suivante :
xv -2 1 3
f(xv ) ½ ¼ ¼
Page 75 sur 124
μ = E(X) = Ö X(ω)dP(ω)
ë
μ = E(X) = – X(ω)ℙ(ω)
ì‘ë
μ = E(X) = – xv . pv
v∈’
- Si X est une variable aléatoire continue alors
`Ÿ
μ = E(X) = Ö xf(x)dx
ÕŸ
Proposition
Soit X une variable aléatoire et une fonction ϕ de ℝ dans ℝ.
μ = E(ϕ(X)) = – ϕ(xv ). pv
v∈’
`Ÿ
μ = E(ϕ(X)) = Ö ϕ(x)f(x)dx
ÕŸ
Proposition
Soient X et Y deux variables aléatoires sur un espace de probabilité (Ω, P)
et soient at b des réels alors on a
a) E(aX + b) = aE(X) + b
b) E(X + Y) = E(X) + E(Y)
Définition
De l’égalité,
[X − E(x)]b = X b − 2E(X)X + [E(X)]b
On déduit
ν(X) = E[X b − 2E(X)X + [E(X)]b ] = E(X b ) − 2E(X)E(X) + [E(X)]b
Donc
ν(X) = E(X b ) − [E(X)]b
Cette égalité est souvent utile dans le calcul des effectifs des variances.
Page 78 sur 124
Proposition
Proposition
Soit X une variable aléatoire.
a) La variance de X est nulle si et seulement s’il existe un réel c tel que
ℙ (X=c)=1.
On dit alors que X est presque surement constante.
b) soient a et b des réels alors on a
υ(aX + b) = ab υ(X)
σ(aX + b) = aσ(X)
Définition
Soit X et Y deux variables aléatoires. On appelle covariance de X et Y ,
l’expression
cov(X, Y) = (Y − E(Y))(Y − E(Y))
Remarques
(a) La formule ( ∗) devient
E(X + Y) = E(X) + E(Y) + 2 cov (X, Y)
Page 79 sur 124
Définition
Le coefficient de corrélation de deux variables aléatoires X et Y est
donnée
cov(X, Y) cov(X, Y)
ρ= =
ñvar(X)var(y) σ(X)σ(Y)
Remarques
1) C’est un coefficient sans dimension.
2) On peut montrer par des méthodes classiques en analyse que :
−1 < ø(X, Y) < 1
3) ρ (X, Y) = 1 si et seulement si il existe a > 0 et b réel tel que
Y = aX + b
4) ρ (X, Y) = −1 si et seulement si il existe a < 0 et b réel tel
que Y = aX + b
Définition
Soient X et Y deux variables aléatoires sur un même espace fondamental
Ω. X et Y sont indépendantes si tous les événements X = xi et Y = yj sont
indépendants :
ℙÀ[X = xv ] ∩ [Y = yÁ ]Â = ℙ(X = xv ). ℙÀY = yÁ Â ∀ les couples (i, j)
Page 80 sur 124
Proposition
1. Loi de Bernoulli
Modèle : on effectue n tirages avec remise dans une urne contenant des
boules blanches et noires, les premiers en proportion p, les secondes en
proportion q= 1- p. Soit X le nombre de boules blanches tirées.
Définition
Proposition
Si X suit une loi de Bernoulli de paramètre p, i.e. X ∼ Bern(p), alors
E(X) = p et Var (X) = p(1 − p).
Remarque :
On utilisera une variable de Bernoulli lorsqu’on effectue une épreuve qui
n’a que deux issues : le succès ou l’échec. Une telle expérience est alors
appelée épreuve de Bernoulli.
Bernoulli On affecte alors 1 à la variable en cas de
succès et 0 en cas d’échec
Exemple
Une urne contient deux boules rouges et trois boules vertes. On tire une
boule de l’urne. La variable aléatoire X = nombre de boules rouges tirées
est une variable de Bernoulli.
Page 82 sur 124
Solution
ℙ (X = 1) = 2/5 = p et ℙ (X = 0) = 3/5 = q
Noter que la loi binomiale B(n, p) est la loi d'une somme X de n variables
aléatoires indépendantes suivant chacune la même loi de Bernoulli (p).
C'est aussi le nombre de réalisations d'un évènement A lors de l'exécution
de n expériences aléatoires indépendantes, le résultat de chacune
réalisant A avec la probabilité p. En effet, soit Xi i=1, .., n la variable de
Bernoulli associée à la ième épreuve. Si la ième épreuve donne un succès Xi
vaut 1 alors dans le cas contraire Xi vaut 0. La somme de ces n variables
comptabilise donc le nombre de succès au cours des n épreuves.
On a donc : X = X1 + X2 + ..... + Xn . X peut prendre (n + 1) valeurs :
0,1,.....,n.
La probabilité ℙ(X = k ) d'avoir k succès suivis de (n-k) échecs est
p¨ q_Õ¨ , car ces résultats sont indépendants les uns des autres. La
probabilité d'avoir k succès et n − k échecs dans un autre ordre de
réalisation est toujours p¨ q_Õ¨ .
Donc tous les événements élémentaires qui composent l’événement
(X =k) ont même probabilité.
Combien y en a-t-il? Autant que de façons d’ordonner les k succès par
rapport aux (n-k) échecs ? Il suffit de choisir les k places des succès parmi
les n possibles et les(n-k) échecs prendront les places restantes. Or il y a
Cnk manières de choisir k places parmi n.
Finalement, on obtient pour 0 ≤ k ≤ n : ℙ(X = k) = Cnk p¨ q_Õ¨
Définition
On dit qu’une variable aléatoire X à valeurs dans {0, … , m } suit une loi
binomiale de paramètre (n, p) avec n ≥ 1 et 0 ≤ p ≤ 1 si
ℙ(X = k) = Cn p¨ q_Õ¨
k
pour 0 ≤ k ≤ n
Page 83 sur 124
Remarque
L'adjectif binomial vient du fait que lorsqu'on somme toutes ces
probabilités, on retrouve le développement du binôme de Newton :
n n
∑ P( X = k ) = ∑ Cnk p k q n−k = ( p + q) n = 1
k =0 k =0
Proposition
Proposition
Exemple
Dans un atelier de fabrication de barre de fer, 30% de barres de fer sont
des bonnes qualités. Quelle est la probabilité pour qu’il y ait, dans un
échantillon aléatoire de 10 barres de fer tirées de cette population,
exactement 4 barres de fer de bonnes qualités ?
Solution
p=0,30 ; q=0,70 ; n=10 ; k=4
P4 = C104 ( 0,30 ) 4 ( 0,70 )10 − 4 = 0, 20
Définition
Remarque
La loi de Poisson est la loi des phénomènes rares, de petite probabilité. On
peut considérer la loi de Poisson de paramètre λ comme la loi limite d’une
loi binomiale B(n, α t ) lorsque n tend vers l’infini, le produit des
Notation X ≈ ℙ (λ)
Paramètres caractéristiques
a) Moyenne : E( X) = λ
b) Variance : Var(X) = λ
c) Ecart-type : σ(X) = λ
Exemple.
Exemple
Solution
Dans une grande usine, le nombre moyen d’accidents sérieux est de 5 par
an. Si le nombre d’employés reste constant, quelle est la probabilité pour
que dans l’année en cours il y ait exactement 7 accidents ?
57 (2, 718)−5
p7 = = 0,104
7!
Page 85 sur 124
Nota :
A mesure que λ augmente, la forme de la distribution tend à devenir
symétrique et s’approche de celle de la loi normale. Cela est vérifié pour
λ≥10 et même acceptable pour λ≥5.
On approche la loi de Poisson P(λ) par la loi normale N(λ, λ ) dès que
λ≥16.
4. Loi hypergéométrique
Définitions
Exemple
Paramètres caractéristiques
caractéristiques
a) Contraintes sur k
b) Moyenne
Nous montrerons que la moyenne µ de la distribution hypergéométrique
est
N1
µ=n
expression s'écrit
µ = np
c) Variance
N1 ( N − N1 ) n −1
σ2 =n (1 − )
N 2
N −1
Remarquez que, pour une valeur de p donnée, σ² converge vers np(1 - p),
la variance de la distribution binomiale de paramètres (n, p), quand la
taille de la population N tend vers l'infini. Ce résultat s'explique
naturellement par la convergence de la distribution hypergéométrique
vers la distribution binomiale que nous décrivons maintenant.
Mais ce qui nous intéresse est la distribution du nombre de ces succès (et
non de leur proportion), qui, sous ces conditions, tend vers la distribution
binomiale B(N1, p).
Nous venons de mentionner que si N1/N tend vers une limite p quand N
tend vers l'infini (la taille de l'échantillon étant maintenue constante), la
distribution hypergéométrique H(N, N1, n) converge vers la distribution
binomiale B(n, p).
Par ailleurs, nous savons que la distribution binomiale B(n, p) tend vers
une distribution normale quand n tend vers l'infini. Il semble donc
presque évident que la distribution hypergéométrique doit tendre vers
Page 89 sur 124
VIII.2.1
III.2.1 Distribution normale (ou Laplace – Gauss)
Définition
La loi normale est une distribution continue dont la densité de probabilité
f est donnée par
1 x−µ
1 − ( )²
f ( x) = e2 σ
2πσ
où µ la moyenne de la v.a.c X et σ l’écart-type de la v.a.c X
Notation : X = N (µ, σ)
C’est pourquoi elle porte également les noms de : loi de Laplace, loi de
Gauss et loi de Laplace-Gauss.
Remarques
1°) si µ = 0 et σ = 1, on obtient la loi normale centrée-réduite notée par
Z = N(0,1). C’est le cas le plus utilisé (en pratique). Sa loi de densité de P
est donnée par :
1
1 − z²
f (z) = e 2
2π
Exemple
Le poids moyen d’un échantillon de 50 étudiants vaut 78 kg avec un écart-
type de 10 kg. Déterminer le poids centré-réduit d’un étudiant pesant 93
kg.
Solution
µ = 78 kg
σ = 10 kg
x = 93 kg→
93 − 78
Z= = 1, 5
10
VIII.2.2
III.2.2 Loi de Student (ou de Gosset)
La loi de Student (ou loi de Student-Fisher) est utilisée lors des tests de
comparaison de paramètres comme la moyenne et dans l’estimation de
paramètres de la population à partir de données sur un échantillon (Test
de Student). Student est le pseudonyme du statisticien anglais William
Page 91 sur 124
Exemple
si n = 45 et k = 2 alors ν = 45 – 2 = 43 d.d.l
VIII.
III.2.3 Distribution de Chi-
Chi-carré (χ
(χ²)
Définition
On définit la statistique de Chi-carré (χ²) par :
N −
Ns ² ∑(X i − X )²
χ² = = i =1
σ² σ²
si nous considérons des échantillons de taille N tirés d’une population
d’écart-type σ, et si pour chaque échantillon nous calculons χ², appelée la
distribution de Chi-carré (χ²).
VIII.2.4
III.2.4 Distribution de Fisher (F)
Définition
Définissons la statistique :
^2
s1 N 1 s12
σ 12 ( N 1 − 1)σ 12
F = =
^2 N 2 s 22
s2
( N 2 − 1)σ 22
σ 22
Où
N 1 s12 N 2 s 22
s12 = et s 2
=
( N 1 − 1)σ 12 ( N 2 − 1)σ 22
2
EXERCICES
6. Trouver l’aire comprise sous la courbe normale dans chacun des cas
ci-après :
a) z=0 et z=1,2 d) z>-1,20
b) z=-2,40 et z=1,25 e) z>1,37
c) z=0,15 et z=1,65
Page 96 sur 124
IX.1
IX.1 Estimation ponctuelle
IX.2
IX.2 Estimation par intervalle
Soit une population infinie caractérisée par une variable aléatoire X dont
on connait la loi de probabilité. Soit la valeur du paramètre à estimer et
l un estimateur sans biais de θ .
Il s’agit de trouver d la limite telle que
ℙ[ m − ≤ ≤ m + ] = 1− ∝
ℙ[ m − ≤ ≤ m + ] = 1− ∝
ℙ\ m − ≤ ≤ m + x = 1− ∝
ℙ\ m ≤ + m ≥ − x = 1− ∝
La ℙ complémentaire
ℙ\ m > + m < − x = ∝
ℙ\ m > + x + ℙ\ m < − x = ∝
Si m suit une loi normale, alors
∝
ℙ\ m > + x = ℙ\ m < − x =
2
Nota
Nota
a) Cas
Cas de la moyenne d’une population.
de la moyenne d’une population.
Grands échantillons (n≥
Grands échantillons (n 30).
≥30).
ℙ #Ûw − . ≤ ≤ Ûw + . $ = 1−∝
√m √m
∝ ∝
aÕ " aÕ "
Donc
∈ #Ûw − . , Ûw + . $
√m √m
∝ ∝
aÕ " aÕ "
Petits échantillons (n<
Petits échantillons (n< 30).
0).
On trouve la valeur critique lÕa,% et on pose = lÕa,% . √l
c) Cas de l’écart
Cas de l’écart-
de l’écart-type d’une population.
type d’une population.
( (
∈# − ∝ . , + . $
√2m
∝
√2m
aÕ " aÕ "
d) Cas de
Cas de la somme et la différence des moyennes de deux populations.
la somme et la différence des moyennes de deux populations
b b b b
− ∈ +(Ûwa − Ûwb ) − ., + , (Ûwa − Ûwb ) + ., + -
a b a b
ma mb ma mb
a b ∝ ∝
aÕ " aÕ "
e) Cas de
Cas de la somme et de
la somme et de la différence des proportions de deux populations.
de la différence des proportions de deux populations.
la différence des proportions de deux populations.
.k + $et
%* .* %" ."
∝
aÕ " l* l"
Page 101 sur 124
Page 102 sur 124
EXERCICES
9. On a calculé que l’écart –type des durées de vie d’un échantillon de 200
ampoules électriques valait 100heures.
a) Déterminer les limites de confiance à 95% et 99% de l’écart –type de
l’ensemble des ampoules de ce type.
b) De quelle taille doit – on choisir un échantillon d’ampoules électriques
dans les limites de confiance à 99,73% pour que l’écart –type de la
population ne diffère pas plus de 5% et de 10% de l’écart –type
empirique ?
Page 104 sur 124
Introduction
On parle d’un test paramétrique lorsque les données sont issues d’une
distribution paramétrée. Alors, la question de base du test d’hypothèse est
de déterminer combien grande ou significative doit être la différence
entre un paramètre et une valeur supposée du paramètre pour pouvoir
légitimement rejeter l’hypothèse que le paramètre vaut bien cette valeur
présumée. Cette hypothèse est appelée hypothèse nulle et notée H0. Sa
validité est vérifiée à partir des données de l’échantillonnage.
L’hypothèse alternative à H0 est notée H1.
L’expérimentateur se fixe a priori une limite afin de séparer ce qu’il
considère comme des valeurs conformes (la zone de confiance)et des
valeurs non conformes(la zone d’erreur de type I). Cette limite s’appelle
seuil ou niveau de signification et a pour valeur critique aÕ∝ pour un test
unilatéral et aÕ∝ pour un test bilatéral.
"
aÕ "
∝ : valeur critique pour un test bilatéral
( :on doit partager la probabilité d’erreur en deux parties égales
∝
b
de chaque coté de la distribution)
Le tableau suivant donne les valeurs critiques pour les tests
bilatéraux et unilatéraux.
Tableau 8.1.
Niveau de signification 0.10 0.05 0.01 0.005 0.002
α
Valeurs de z pour des -1.28 ou -1.645 ou -2.33 ou -2.58 ou -2.88 ou
tests unilatéraux 1.28 1.645 2.33 2.58 2.88
Valeurs de z pour des -1.645 et -1.96 et -2.58 et -2.81 et -3.08 et
tests unilatéraux 1.645 1.96 2 ;58 2.81 3.08
Procédure du test
a) Calcul de la statistique
x1 − x2
ε=
s12 s22
+
n1 n2
Cas où l’un au moins des échantillons est petit (n1 < 30 ou n2< 30)
Procédure du test
a) Calcul de la statistique t =
x1 − x2
1 1
s +
n1 n2
où s=
n1s12 + n2 s22
n1 + n2 − 2
d) Règle de décision :
-Si t < l* `l"Õb;% , accepter H0
-Si t ≥ l* `l" Õb;% , rejeter H0 accepter H1
Page 107 sur 124
Solution
* Hypothèses : H0 : /a =/b
H1 : /a ≠ /b
* Statistique
= -2,5
x1 − x2 107 − 112
ε= =
2 2
s s 100 64
+
1 2 +
n1 n2 36 50
Solution
a) Statistique
x1 − x2
t=
1 1
s +
n1 n2
Calculons d’abord s= ?
n1s12 + n2 s22 16.(100) + 14(64)
s= = = 9,4
n1 + n2 − 2 16 + 14 − 2
107 − 112
t= = −1,5
1 1
9,4 +
16 14
Au seuil de α = 0,05
d.d.l = n1+n2 -2 = 16+14-2 = 28
' = 1 − ∝"=0,975
deux groupes :
Au seuil de α = 0,01 , t 28;0,995 = 2,76 ; d.d.l = 28
H0 : µ = µ 0
H1 : µ ≠ µ 0
Page 109 sur 124
Procédure du test
a) Calcul de la statistique
x − µ0
ε=
σ
"
H0 : P1 =P2
H 1 : P 1 ≠ P2
* Procédure du test
a) Calcul de la statistique =
%1* Õ%1"
3 *4
2 3* 2
3 "4
3"
k 5 ` 5
* "
où &1a = 1- '̂a
&1b = 1-'̂ b
b) Fixer un seuil α ( α = 0,05 ou α = 0,01)
c) Recherche de la valeur critique : α = 0,05 aÕ "
∝ = 1,96
α = 0,01 ∝
aÕ
= 2,58
"
d) Règle de décision :
- si z < ∝
aÕ " ,
on accepte Ho (d’où pas de différence significative)
Page 110 sur 124
Exemple
Selon les résultats d’une enquête 15 étudiantes de l’INBTP sur 100
fument la cigarette contre 18 étudiants sur total de 100. Existe –t-il une
différence signification entre les deux proportions aux seuils de : a) 0,05 ?
et b) 0,01 ?
Solution
Ech.1 (étudiantes) : n1= 100
'̂a = 15/100 = 0,15
&1a = 1- '̂a = 1-0,015= 0, 85
Ech.2. (étudiants) : n2 = 100
'̂ b = 18/100 = 0,18
&1b = 1- '̂ b = 1 – 0, 018= 0,82
* Hypothèses : H0 : P1 =P2
H 1 : P 1 ≠ P2
* Statistique : = = -0, 19
%1* Õ%1" 0,15 − 0,18
=
3 *4
2 3* 2
3 "4
3"
k 5 ` 5
* "
(0,15)(0,85) (0,18)(0,82)
+
100 100
* Avec α = 0,05 ∝
aÕ "
= 1,96
Avec α = 0,01 ∝
aÕ "
= 2,58
Si z ≥ aÕ "
∝ rejeter H0, accepter H1
Calcul de la valeur observée : =
%Õ%6
2 4
k 6 6
5
Procédure du test.
• On considère le test bilatéral suivant :
8 : / = 0ú
7
8a : / ≠ 0
• Règle de décision
a) Si la variance de la population est inconnue
on vérifie si | | < aÕ∝ alors on accepte H0
"
et si | | ≥ aÕ "
∝ alors on rejette H0
où
−
d− µ d
z=
σd
n
On note
ρ : le coefficient de corrélation linéaire entre deux caractères quantitatifs
X et Y au sein d’une population.
r : le coefficient de corrélation linéaire entre les deux caractères dans un
échantillon tiré de cette population.
• On considère le test bilatéral :
8 : ρ = 0ú
8a : ρ ≠ 0
7
Règle de décision
-Si t < lÕb,% , accepter H0
-Si t ≥ lÕb,% , rejeter H0 accepter H1
On calcule la statistique de Student :
=9 student à (n – 2 ) ddl et à l’aire ' = 1 − ∝"
√lÕb
ñaÕ: "
Page 113 sur 124
EXERCICES
Tableau 1
Nombre de 5 garçons 4 garçons 3 garçons 2 garçons 1 0 Total
garçons et filles 0 fille 1 fille 2 filles 3 filles garçon garçon
4 filles 5 filles
Nombre de 18 56 110 88 40 8 320
famille
11. On choisit par hasard dans un vaste champ 200 parcelles et on recense
dans chacune d’elles, le nombre des touffes d’une certaine espèce d’herbe.
On observe la distribution suivante :
Nombre de
0 1 2 3 4 5 6 7 8
touffes
Nombre de
109 58 20 6 4 2 0 1 0
parcelles
1ère 15 14 13 17 16
balance
2ème 11 12 14 12 15
balance
16. Dans une enquête sur le cancer de la vessie, on trouve : sur 210
cancers, 90% de fumeurs ; sur 210 témoins, 80% de fumeurs. Le
pourcentage de fumeurs est-il diffèrent chez les malades atteints de
cancer et les témoins ?
XI.1 Introduction
Les tests d’hypothèses non paramétriques sont des tests qui concernent
des variables qualitatives. Elles ne sont pas mesurables numériquement
mais sont répertoriées selon les modalités.
Supposons une population dont on voudrait étudier un caractère
qualitatif à k modalités. On note ;<= la proportion d’individus présentant
la modalité i
On prélève de cette population un échantillon de taille n. On note par >n
l’effectif observé, le nombre d’individus présentant la modalité ? dans
l’échantillon et ;n = la proportion d’individus présentant la modalité ?
@=
l
dans l’échantillon.
Sous l’hypothèse que H0(;n = ;<= ), on s’attend à observer m;<= le nombre
d’individus présentant la modalité ?. Ce nombre s’appelle effectif attendu
ou effectif théorique de la modalité ? et on le note par n .
La question de base du test d’hypothèse non paramétrique est de savoir si
les effectifs observés >n différent sensiblement des effectifs théoriques n .
La statistique utilisée à cet effet est la variable aléatoire continue
B B B
(>n − n )b
Ab = – ãC D m = – >n = – n
n
nra nra nra
Tableau 10.1.
Evénement E1 E2 E3 …. Ek
Effectif O1 O2 O3 …. Ok
observé
Effectif e1 e2 e3 …. ek
théorique
Page 118 sur 124
Formulation d’hypothèses :
Tableau de contingence
Effectifs Observés
1ère Variable
mod1 mod2 … mod i … mod k Total
mod1 l1
mod2 l2
2nd variable
…
modj … Oji … lj
…
…
mod m lm
Total C1 C2 Ci Ck n
FG ×H=
On trouve les effectifs théoriques correspondants : En =
l
Effectifs théoriques
1ère Variable
mod1 mod2 … mod i … mod k Total
mod1 l1
mod2 l2
2nd variable
modj … eji … lj
…
mod m lm
Total C1 C2 Ci Ck n
Page 119 sur 124
On calcule
I B
(>En − En )
b
A = ––
b
En
Era nra
De manière compacte, en considérant toutes les cellules du tableau de
contingence numérotées de 1 à m :
I
(> − )b
A =–b
ra
Règle de décision
A b < A(HÕa)×(FÕa),aÕ∝
b
on accepte H0
A b ≥ A(HÕa)×(FÕa),aÕ∝
b
on rejette H0
où c : le nombre de colonnes du tableau
l : le nombre de ligne du tableau
Formulation d’hypothèses
Tableau de contingence
On note
O1i : nombre d’individus issu de l’échantillon 1,présentant la modalité i.
O2i : nombre d’individus issu de l’échantillon 2,présentant la modalité i.
Page 120 sur 124
Effectifs observés
mod1 mod2 … mod i … mod k total
échantillon 1 O11 O12 … O1i … O1k n1
échantillon 2 O21 O22 … O2i … O2k n2
Total C1 C2 … Ci … Ck n
Effectifs théoriques
mod1 mod2 … mod i … mod k total
échantillon 1 e11 e12 … e1i … e1k n1
échantillon 2 e21 e22 … e2i … e2k n2
Total C1 C2 … Ci … Ck n
On calcule
b B
(>En − En )
b
A = ––
b
En
Era nra
De manière compacte, en considérant toutes les cellules du tableau de
contingence numérotées de 1 à m :
M
(OL − eL )b
χ =–
b
eL
Lra
Règle de décision
Formulation d’hypothèses
Statistique de décision
¨
(Ov − ev )b
χ =–
b
ev
vra
Où les Ov sont données et ev = n × φPÓ avec φPÓ la proportion de la
modalité i selon la distribution théorique
Règle de décision
EXERCICES
8. Dans ses expériences avec les pois, Mendel a observé 315 pois ronds
et jaunes ; 108 pois ronds et verts, 101 pois ridés et jaunes et 32 pois
Page 123 sur 124
Bleus
Couleur des yeux
25(16,0) 9(13,8) 3(7,5) 7(6,7) 44
TOTAL 45 39 21 19 124
Nota : Les nombres entre parenthèses représentent les effectifs
théoriques.
Page 124 sur 124