Documente Academic
Documente Profesional
Documente Cultură
(ADD)
A- Introduction
B- Les données et leurs caractéristiques
C- Grandeurs associées aux données
A-1 Les méthodes
2
le groupe vert , caractérisé par
un taux de délits en tous genres Georgia
1
inférieur à la moyenne
Alaska Illinois
0
un taux de délits en tous genres Kansas Idaho
supérieur à la moyenne
-1
Connecticut
Le groupe noir caractérisé par Colorado
Maine
Iow a
Delaw are
supérieur à la moyenne -2
Haw aii
-3 -2 -1 0 1 2 3
Le groupe rouge caractérisé par
forte criminalite ---- faible criminalite
un taux de délits mineurs
supérieur à la moyenne
A-2- Exemples
A-2 – Exemples
(ACP sous statistica)
A-2 Exemples
• Analyse discriminante
3 groupes de personnes repérées par 4 variables : age revenu patrimoine emprunt
4
Jeunes
2
2
1
2
2
1
0
LD2
3 1
3
-2
3
-4
ages -4 -2 0 2 4
Gros patrimoines LD1
emprunt eleve
A-2 Exemples
Le groupe 1 est un groupe de gens assez jeunes à revenus plus faibles que la
moyenne dont le patrimoine est nettement plus faible que dans les autres classes
et le taux d’emprunt plus élevé que la moyenne
Le groupe 2 est caractérisé par des gens jeunes de revenus moyens, mais dont le
patrimoine est très important et le taux d’emprunt très faible
Le groupe 3 est caractérisé par des gens plus agés de revenus confortables et de
patrimoine assez important, ayant un taux d’emprunt plus élevé que dans les
autres classes
B –1 Tableau individu*variables
Individu X1 X2 Xj Xp
e1 x11 x12 x1 j x1 p
e2 x 21 x 22 x2 j x2 p
en x n1 xn2 x nj x np
B –1 Tableau individu*variables
x x ... x ... x
11 12 1j 1p
x x ... x ... x
21 22 2j 2p
... ... ... ... ... ...
X=
x x ... x ... x
i1
i2 ij ip
... ... ... ... ... ...
x x ... x ... xnp
n1 n2 nj
B –1 Tableau individu*variables
x
i1
...
e = x
∈Rp
i ij
...
x
ip
B –1 Tableau individu*variables
x
1j
...
x = x ∈ Rn
j ij
...
x
nj
B –1 Les données: tableau individu*variables
B.2- Matrice des poids associés aux
individus
On dispose de 6 variables représentant les taux de différents délits commis pour 100000 habitants dans 20 Etats
des Etats-unis. Ces données peuvent être mises dans un tableau individu*variable
60
40
rapt
20
0
0 5 10 15 20
meurtre
2000
18 0 0
16 0 0
14 0 0 viol
12 0 0
10 0 0
800 meutre
600
400 rapt
200 attaque
0
vol
0 500 10 0 0 150 0 2 0 00
alabam a
on peut comparer par rapport à la première bissectrice les valeurs prises par les variables sur les
différents individus afin d’identifier des individus proches en terme de valeurs prises par les variables.
Ainsi, l’Alaska se distingue par un nombre relativement important de larcins.
B-4 Centre de gravité
60
40
rapt
20
0
0 5 10 15 20
m eurtre
B-4 Centre de gravité
>mean(proteine)
p
d ²(ei , ek ) = ei − ek ² = ∑ ( x − x )² = (ei − ek )'(ei − ek )
j=1 ij kj
j=
p
d ²(e ,G) = ∑ ( x − x )²
i j=1 ij j
B-5 Inertie
n p
I = ∑ p d ²(e ,G) = ∑ Var ( X j ) = Tr (V )
i=1 i i j =1
> cov=cov(crime2)
> c=as.matrix(cov); c
> I=sum(diag(c));I
[1] 731948.3
C-1 Tableau centré associé à X
x −x x − x ... x −x ... x − x p
11 1 12 2 1j j 1p
x − x x − x ... x − x ... x − x p
21 1 22 2 2j j 2p
Matrice centrée :
... ... ... ... ... ...
Xc =
X c = X − EG '
x −x x −x ... x −x ... x − xp
i1 1 i2 2 ij j ip
... ... ... ... ... ...
x x − x ... x −x ... xnp − x p
n1− x n2 2 nj j
1
C-2 Tableau centré-réduit associé à X
σ ( X ) 0 0 0 0
1
0 .... 0 0 0
X r = X c Ds−1 Ds
= 0 0 σ (X j) 0 0
0 0 0 .... 0
0 0 0 0 σ (X p
)
C-2 Tableau centré-réduit associé à X
x −x x −x x −x x − x p
11 1 12 2 ... 1j j ... 1p
σ (X ) σ (X ) σ (X j) σ ( X p)
1 2
x −x x −x x −x x − xp
21 1 22 2 ... 2 j j ... 2 p
σ (X ) σ (X ) σ (X j) σ ( X p)
1 2
... ... ... ... ... ...
Xr =
x −x x −x x −x x − xp
i1 1 i2 2 ... ij j ... ip
σ (X ) σ (X ) σ (X j) σ ( X p)
1 2
... ... ... ... ... ...
x −x x −x x −x xnp − x p
n1 1 n2 2 ... nj j ...
σ (X ) σ (X ) σ (X j) σ (X p)
1 2
C-2 Tableau centré-réduit associé à X
données initiales
14
12
10
8
6
données centrées réduites
4
2 2
1,5
0 1
0 1 2 3 4 5 0,5
0
-0,5 0 1 2 3 4 5
-1
-1,5
-2
données centrées
0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
-2
-4
-6
C-3 Matrice de variance-covariance
associée à X
Var ( X ) Cov( X , X ) ......... Cov( X , X ) ......... Cov( X , X p )
1 1 2 1 j 1
Cov( X , X ) Var ( X ) .......... Cov( X , X ) .......... Cov( X , X p )
1 2 2 2 j 2
......... .......... .......... .......... .......... ..........
V=
Cov( X , X ) Cov( X , X ) ........... Var ( X ) ......... Cov( X , X p )
1 j 2 j j j
.......... .......... ........... ........... ......... ..........
Cov( X , X p ) Cov( X , X p ) ........... Cov( X , X p ) .......... Var ( X p )
1 2 j
n
cov( X j , X l ) = ∑ pi ( xij − x j )( xil − xl ) = X cj ' PX lc
V = X c' PX c i =1
Cov( X , X )
r( X , X ) = j k r( X , X ) = X r ' PX r
j k σ ( X )σ ( X ) j k j k
j k
1 r ( X 1 , X 2 ) ......... r ( X 1 , X j ) ......... r ( X 1 , X p )
r( X , X ) 1 .......... r ( X , X ) .......... r ( X , X )
1 2 2 j 2 p
R = X r' PX r = Ds−1VDs−1
C-3 Matrice de corrélation associée à X