Documente Academic
Documente Profesional
Documente Cultură
André Bouchier
Permission is granted to make and distribute verbatim copies of this manual provided the copyright
notice and this permission notice are preserved on all copies.
Permission is granted to copy and distribute modified versions of this manual under the conditions for
verbatim copying, provided that the entire resulting derived work is distributed under the terms of a
permission notice identical to this one.
l Pré-recquis
Les fonctions utilisées pour cette analyse sont disponibles dans les
bibliothèques standard de R et dans la bibliothèque ade4. Pour aider à la
compréhension, l'écriture des «programmes» sera détaillée. Par la suite, vous
pourrez condenser cette écriture. Mais n'oubliez pas de les commenter
abondamment.
l On utilise un espace à 2 dimensions (un plan). Ce plan est appelé le plan principal.
.../...
don<-na.omit(don)
layout(matrix(c(1:9),3,3))
for(i in 1:9) {hist(don[,i],main=names(don)[i],xlab="")}
layout(1)
Puissance Largeur Vitesse
25
15
Frequency
Frequency
Frequency
10
15
15
5
0 5
0 5
0
4 6 8 10 14 1.5 1.7 1.9 2.1 140 180 220
12
25
25
Frequency
Frequency
Frequency
8
15
15
4
0 5
0 5
0
500 1500 2500 5 6 7 8 9 28 32 36 40
15
Frequency
Frequency
Frequency
10 15
0 2 4 6 8
10
5
5
0
0
3.5 4.0 4.5 5.0 800 1200 1600 4 6 8 10 12
library(ade4)
z<- dudi.pca(don, center = T, scale = T, scannf = F)
Les options center et scale de la fonction dudi.pca sont utilisées pour centrer
et réduire les variables.
z$eig
6.453 1.137 0.656 0.331 0.236 0.100 0.0434 0.0390 0.000
l Les variances cumulées (Σ des variances = 9, les données sont centrées réduites) :
cumsum(z$eig)
6.453 7.591 8.247 8.579 8.816 8.917 8.960 8.999 9.000
inertie<-z$eig/sum(z$eig)*100
barplot(inertie,ylab="% d'inertie",names.arg=round(inertie,2))
title("Eboulis des valeurs propres en %")
70
60
50
% d'inertie
40
30
20
10
0
inertia.dudi(z,col.inertia = T)$col.abs
Comp1 Comp2
Puissance 824 1867
Cylindree 1201 2
Longueur 1291 528
Largeur 937 2211
Surface 1307 1196
Poids 1345 485
Vitesse 1263 868
DepArret 798 2354
Conso 1034 490
Somme 10000 10000
l La deuxième sera :
plot(cl1,cl2,type="n",main="Les individus",xlim=c(-7,7))
abline(h=0,v=0)
text(cl1,cl2,row.names(z$li))
Les individus
2
Alfa-Romeo 33 1.5 ie
Fiat UNO 1.4i.e Alfa-Romeo 155 2.0 BMW 730i
Citroen
Renault
AX1.0Clio 1.4 RN
Fiat TIPO 1.8ie Citroen XM V6
1
Fiat UNO TD Fiat TEMPRA 1.8ie
Citroen XANTIA 2.0
Fiat CROMA 2.0i
Renault TwingoRenault 19 1.8RN
Renault
Peugeot
Citroen
RenaultRenault
Clio 1.9D 21
ZX1.6 405 Citroen
SR TS XM 2.0i
Prima
Peugeot 19
3061.4RN
BMWXTDT
BMW 316i
325 TD
Renault 19 1.9XANTIA
dT
BMW 518i
0
Fiat
CitroenCitroen
TIPO TD
ZX1.9TD Peugeot 1.8I
605 SLi
Citroen AX14TD Peugeot 405 STD
Peugeot 106 XN
Peugeot 306 XNFiat CROMA
Alfa-Romeo 164 2.5 TD
2.5 T
cp2
Renault Clio 1.2 RN
Fiat TEMPRA TD
Renault 21
Alfa-Romeo Renault
Prima
405 GL155 TD TD
Safrane2.0i
Peugeot 106 XTDPeugeot
CitroenCitroen
ZX1.1 XANTIA 1.6I
-1
Citroen XANTIA TD
Citroen XM Safrane2.5
TD12
Renault
Renault Espace d 2.2i
-2
Peugeot 605 SLD
-3
-6 -4 -2 0 2 4 6
cp1
plot(cc1,cc2,type="n",
main="Les variables",
xlim=c(-1,1),
ylim=c(-1,1),
asp=1, #rapport entre "Echelle X" et "Echelle Y"
ylab= "Comp2 71.7%",
xlab= "Comp1 12.6%")
abline(h=0,v=0)
text(cc1,cc2,row.names(z$co))
symbols(0,0,circles=1,inches=FALSE,add=TRUE)
Les variables
1.0
0.5
Puissance
Vitesse
Comp2 71.7%
Conso
0.0
Cylindree
Poids
Longueur
Surface
-0.5
DepArret Largeur
-1.0
Comp1 12.6%
l La bibliothèque ade4 propose les fonctions supcol() et suprow() pour calculer les
coordonnées des variables et individus supplémentaires. Ces fonctions s'utilisent
après le calcul de l'A.C.P.
Axis1 Axis2
BMW 525 TD 2.5032655 -0.2648280
Fiat Panda 1000i.e -5.7235880 -0.1497245
Ford Fiesta 1400 -2.9921568 0.1666408
Ford Fiesta TD -2.7224814 0.1001151
Ford Escort 1400 -1.7987546 -1.0503674
Ford Escort 1800 TD -1.0292275 -0.3706771
Ford MONDEO 1800i 1.2600677 0.0763634
Ford MONDEO TD 0.1373121 -1.2755206
Ford Scorpio 2000i 1.7339527 0.4465114
Ford Scorpio 2900i 3.3727519 1.9269659
2
Ford Scorpio 2900i
Alfa-Romeo 33 1.5 ie
Fiat UNO 1.4i.eAlfa-Romeo 155 2.0 BMW 730i
Citroen
Renault
AX1.0Clio Fiat
1.4 RN
TIPO 1.8ie Citroen XM V6
1
Fiat UNO TDFiat TEMPRA 1.8ie
Citroen XANTIA 2.0
Fiat CROMA 2.0i
Renault Twingo Ford
Renault 1921 Scorpio 2000i
1.8RN
Renault Renault
Peugeot
Citroen
Clio 1.9D ZX1.6 Citroen
Prima
405 SR TSXM 2.0i
Ford
FordFiesta
Fiesta1400
Renault
Ford
Peugeot 19
TD 1.4RN
306MONDEO
BMWXTDT
BMW 316i
325 TD 1800i
0
Renault
Fiat 19
Citroen
TIPO 1.9
TD BMW
dT
XANTIA
Peugeot518i
1.8I
605 SLi
Fiat Panda AX14TDCitroen
Citroen1000i.e ZX1.9TD
Peugeot BMW
405 STD 525 TD
Fiat CROMA
Alfa-Romeo 2.5
164 TD
2.5 T
Renault Ford
Peugeot 106 XN Escort
Peugeot 306 1800 TD
XN TD
cl2
Clio 1.2 RN
Fiat TEMPRA
Renault
Alfa-Romeo
Peugeot 21
405Renault
Prima
GL155 Safrane2.0i
TD
TD
Peugeot 106 XTDCitroen XANTIA 1.6I
-1
Citroen
Ford ZX1.11400
Escort
Citroen
Ford XANTIA TD
MONDEO TD
Citroen XMSafrane2.5
Renault
Renault TD12
Espace 2.2i
d
-2
Peugeot 605 SLD
-5 0 5
cl1
l Pour plus de lisibilité, dans le cas présent, il est sans doute préférable de
représenter séparément les individus supplémentaires
plot(cl1,cl2,type="n",main="Individus supplém",xlim=c(-8,8))
abline(h=0,v=0)
text(csup1,csup2,row.names(ligsup$lisup),col="red",cex=1.1)
Individus supplém
2
Ford Scorpio 2900i
1
-1
-5 0 5
cl1
l Logiciel R :
http://www.R-project.org.
l Bibliothèque ade4 :
Jean Thioulouse, Anne-Beatrice Dufour and Daniel Chessel (2004). ade4: Analysis of
Environmental Data : Exploratory and Euclidean methods in Environmental sciences. R
package version 1.3-3.
http://pbil.univ-lyon1.fr/ADE-4
Mailing list: http://pbil.univ-lyon1.fr/ADE-4/adelist.html