Documente Academic
Documente Profesional
Documente Cultură
1
Exemple
Etude sur 5761 femmes de la survenue daccouche-
ment premature et de lexposition a des evenements
stressants.
X : type daccouchement
variable qualitative a 2 modalites
Y : score sur une echelle allant de 0 a 3.
variable quantitative discrete a 4 valeurs
HH Y
HH 0 1 2 3 totaux
X HH
a terme 4698 413 250 197 5558
premature 165 16 12 10 203
totaux 4863 429 262 207 5761
2
1 Organisation des donnees
1.1 Notations
Definition
On appellera distribution jointe des
effectifs de X et Y lensemble des
informations (xi , yj , nij ) pour i = 1, . . . , k et
j = 1, . . . , .
3
1.2 Tableau de contingence
Representation de la distribution jointe du
couple (X, Y ) : on utilise un tableau a double
entree appele
tableau de contingence
HH Y
HH y1 yj y
X HH
x1 n11 n1j n1
xi ni1 nij ni
xk nk1 nkj nk
Exemple :
12 : le nombre de femmes ayant accouche
prematurement et ayant un score egal a 2.
k X
X
Remarque : nij = N
i=1 j=1
4
2 Distributions Marginales
On ajoute au tableau de contingence les totaux
en ligne et en colonne.
HH Y
HH y1 yj y totaux
X HH
x1 n11 n1j n1 n1
xi ni1 nij ni ni
xk nk1 nkj nk nk
totaux n1 nj n N = n
5
En marge a droite (totaux en ligne) :
la distribution de X : pour chaque indice i,
leffectif ni est le nombre total dobservations
de la modalite xi de X quelle que soit la
modalite de Y . Cest-a-dire
X
ni = nij = total de la ligne i
j=1
Definition
Les k couples (xi , ni ) definissent la
distribution marginale de la variable X.
k
X
Remarque : ni = N
i=1
6
Exemple
HH Y
HH 0 1 2 3 totaux
X HH
en ligne
a terme 4698 413 250 197 5558
premature 165 16 12 10 203
Distribution marginale de X
7
En marge en bas (totaux en colonne) :
la distribution de Y : pour chaque indice j,
leffectif nj est le nombre total dobservations
de la modalite yj de Y quelle que soit la
modalite de X. Cest-a-dire
k
X
nj = nij = total de la colonne j
i=1
Definition
Les couples (yj , nj ) definissent la
distribution marginale de la variable Y .
X
Remarque : nj = N
j=1
8
Exemple
HH Y
HH 0 1 2 3
X HH
a terme 4698 413 250 197
premature 165 16 12 10
totaux 4863 429 262 207
en colonne
Distribution marginale de Y
Y 0 1 2 3 effectif total
effectifs 4863 429 262 207 5761
9
3 Distributions conditionnelles
Exemple
Y |X=premature 0 1 2 3 total
effectifs 165 16 12 10 203
10
Principe :
Comportement de lune des deux variables
quand lautre a une valeur donnee.
Reponse :
Definition :
La distribution des observations suivant les
modalites de la variable Y sachant que la
variable X prend la modalite xi , est appelee
distribution conditionnelle de Y pour
X = xi .
11
A la colonne j du tableau de contingence, on
lit la distribution de la variable X sachant
que Y = yj , notee X|Y =yj .
Definition :
La distribution des observations suivant les
modalites de la variable X sachant que la
variable Y prend la modalite yj , est appelee
distribution conditionnelle de X pour
Y = yj .
12
Exemple
13
4 Proportions associees a
un couple de variables
trois notions de proportion (ou frequence)
14
Exemple :
N=5761.
pour (X, Y ) = ( a terme, 0) la proportion est :
4698
= 0.815.
5761
HH Y
H
HH 0 1 2 3
X H
a terme 0.815 0.072 0.043 0.034
premature 0.029 0.003 0.002 0.002
La somme de toutes les proportions = 1
Definition 1.
La proportion du couple (xi , yj ) est
nij
pij = .
N
15
Exemple :
N=5761 ;
Proportions marginales pour X :
Definition 2.
La proportion marginale de xi est
ni
pi = .
N
La proportion marginale de yj est
nj
pj = .
N
16
Exemple :
Y |X=prema. 0 1 2 3 tot.
effectifs 165 16 12 10 203
proportions 0.813 0.079 0.059 0.049 1
Definition 3. :
La proportion conditionnelle de xi
sachant que Y = yj est
nij
pi|Y =yj =
nj
La proportion conditionnelle de yj
sachant que X = xi est
nij
pj|X=xi = .
ni
17
Remarque :
ou encore
pij pij
pi|Y =yj = et pj|X=xi =
pj pi
18
Remarque : lien entre les variables
19
Exemple :
HH Y
HH 0 1 2 3
X HH
a terme 0.966 0.963 0.954 0.952
prema. 0.034 0.037 0.046 0.048
20
5 Etude de deux variables
quantitatives
Notations
21
Exemple
22
5.1 Principales caracteristiques
Moyennes des distributions marginales :
Moyenne de X :
k k
1 X X
(X) = ni xi = pi xi
N i=1 i=1
Moyenne de Y :
1 X X
(Y ) = nj yj = pj yj
N j=1 j=1
Exemple
1
(Y ) = (15 0 + 30 1 + 35 2 + 20 3) = 1.6
100
1
(X) = (2025+3535+3045+1555) = 39
100
23
Variances des distributions marginales :
Variance et ecart-type de X :
k
!
1 X
V (X) = ni x2i (X)2
N i=1
p
(X) = V (X)
Variance et ecart-type de Y :
1 X
V (Y ) = nj yj2 (Y )2
N j=1
p
(Y ) = V (Y )
Exemple
V (X) = 1615 392 = 94 donc (X) = 9.67
V (Y ) = 3.5 1.62 = 0.94 donc (Y ) = 0.97
24
Moyennes et variances des distributions
conditionnelles :
Moyenne de X sachant Y = yj
k k
1 X X
(X|Y =yj ) = nij xi = pi|Y =yj xi
nj i=1 i=1
Variance de X sachant Y = yj
k
1 X
V (X|Y =yj ) = nij x2i ((X|Y =yj ))2
nj i=1
Exemple
250+3515+4510+555
(X|Y =1 ) = 30 = 41.67
352 15+452 10+552 5
V (X|Y =1 ) = 30 41.672
2
V (X|Y =1 ) = 1791.67 41.67 = 55.28
(X|Y =1 ) = 7.44
25
5.2 Representation graphique
On peut representerer la distribution du
couple (X, Y ) par un nuage de points de
coordonnees (xi , yj ), chaque point etant
affecte du poids nij .
Le centre de gravite du nuage est alors le
point (non observe) de coordonnees
((X); (Y )).
26
Exemple
27
5.3 Covariance, Correlation
Definition
La covariance de X et Y est le nombre reel
defini par
k
1 XX
cov(X, Y ) = nij (xi (X))(yj (Y ))
N i=1 j=1
Exemple
cov(X, Y ) = 58.5 39 1.6 = 3.9
28
Proprietes
cov(X, Y ) = cov(Y, X) et cov(X, X) = V (X).
Remarques :
dependance aux unites utilisees
prend nimporte quelle valeur reelle.
29
Definition
Le coefficient de correlation lineaire de
X et Y est defini par
cov(X, Y )
corr(X, Y ) =
(X)(Y )
Proprietes
corr(X, Y ) [1, 1]
corr(X, Y ) = corr(Y, X) et corr(X, X) = 1.
Exemple
3.9
corr(X, Y ) = 9.70.97 = 0.414
30
Le coefficient de correlation est un coefficient
sans dimension. Il mesure la presence et
lintensite de la liaison lineaire entre X et Y .
31
Remarque :
il faut bien se garder au vu de la seule valeur
du coefficient de correlation, demettre des
interpretations abusives.
Ex des chaussures et de la culture generale tous
deux lies a lage ! !
Par contre il existe des outils permettant
detudier plus en detail les relations lineaires
entre deux caracteres et permettant (dans une
certaine mesure) dextrapoler a partir de
donnees existantes et de faire de la prevision !
32