Documente Academic
Documente Profesional
Documente Cultură
2 mars 2010
Andr Bouchier
p.1/31
2010, Andr Bouchier (2 Mars 2010) http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ Le document L'analyse factorielle des correspondances multiples by A.Bouchier est mis disposition selon les termes de la licence Creative Commons Paternit-Pas d'Utilisation Commerciale-Partage des Conditions Initiales l'Identique 2.0 France.
p.2/31
1.Avant propos :
l Pr-recquis On suppose connues les bases du logiciel R ainsi que quelques notions de statistiques concernant les analyses factorielles. l Les fonctions utilises : Les fonctions utilises pour cette analyse sont disponibles dans les bibliothques standard de R et dans la bibliothque ade4. Pour aider la comprhension, l'criture des programmes sera dtaille. Par la suite, vous pourrez condenser cette criture. Mais n'oubliez pas de les commenter abondamment.
p.3/31
p.4/31
p.5/31
p.6/31
permettre de transformer les donnes pour rendre le traitement par l'AFC possible. donnes brutes
Parcelle
01 02 03 04 05
Culture
Surface
Prcdent
2 1 3 1 2
Anne
donnes codes
Parcelle Surface Prcdent Anne
01 02 03 04 05
1 1 2 3 2
2 3 1 1 2
2 1 3 1 2
1 3 2 2 2
p.7/31
01 02 03 04 05
1 1 2 3 2
2 3 1 1 2
2 1 3 1 2
1 3 2 2 2 Anne 1 0 0 0 0 0 0 1 1 1 0 1 0 0 0
p.8/31
1 2 3 87 88 96
01 02 03 04 05
1 1 0 0 0
0 0 1 0 1
0 0 0 1 0
0 0 1 1 0
1 0 0 0 1
0 1 0 0 0
0 1 0 1 0
1 0 0 0 1
0 0 1 0 0
01 02 03 04 05
l Le nom des modalits doit tre choisi afin de rester lisible une fois projet sur le
plan factoriel
p.9/31
Les donnes quantitatives sont dcoupes en classes Les donnes qualitatives sont conserve sans modification. Pour viter des effectifs de classe trop faibles, on peut aussi regrouper des modalits Dans cette tape, les logiciels demande souvent de nommer les diffrentes modalits
l 2
me
Cette tape est souvent effectue par les logiciels sans intervention de l'utilisateur
l 3
tape : une analyse des correspondances est effectue sur le tableau disjonctif
me
p.10/31
AFC multiple
Analyse factorielle des correspondances multiples - 02/03/2010 p.11/31
1 2 3 4 5 6 7 8 9
Numero RDT PLM ZON ARG LIM SAB VRT PGM MST AZP VRTC 1 6.490 84 1 21.5 60.6 17.9 3 43.10 34.49 3.82 2 2 15.580 112 1 21.0 58.3 20.7 3 38.30 39.18 3.78 2 3 7.290 68 1 26.2 47.6 26.2 3 45.30 26.89 2.61 2 4 1.090 88 1 29.7 54.5 15.8 3 29.09 23.09 3.78 2 5 5.100 174 1 22.8 59.0 18.2 3 42.80 18.10 3.41 2 6 2.030 63 1 19.6 68.0 12.4 3 41.26 20.43 3.04 2 7 6.330 92 1 26.7 53.7 19.6 3 38.57 20.93 2.26 2 8 17.300 117 1 34.0 44.9 21.1 1 31.80 40.70 3.85 1 9 6.970 58 1 16.7 57.6 25.7 4 42.40 29.97 2.69 3 .../...
p.13/31
p.15/31
l Pour tre pertinent, un dcoupage en classes doit respecter 3 principes : 1) Pas d'effectifs de classes trop dsquilibrs 2) Des nombres de classes semblables pour toutes les variables 3) Des dcoupages ayant une signification pour le chercheur
p.17/31
[1] 0.369 0.277 0.204 0.185 0.159 l Les valeurs propres en % round(z$eig/sum(z$eig)*100,2) [1] 18.45 13.86 10.18 9.26 7.96
0 18.45
10
15
9.26
7.29
5.05
3.65
2.39
1.64
1.06
0.65
0.19
p.19/31
7 6
3 4 11 9 5 1
20 19 44
33 36 18
46 37
AZP.1
30 34 35 50 39
AZP.2
28
2 15 10
ZON.3 RDT.245
PGM.3
13 PLM.2 22 PLM.3 47 29 48 24
27
ZON.2
RDT.3 MST.3
25 31 32
SAB.2 LIM.2
Bl dur
Analyse factorielle des correspondances multiples - 02/03/2010 p.20/31
0.5
Axe 2
0.0
PGM.3 VRTC.3 ARG.3 AZP.3 PLM.2 PLM.3 RDT.3 MST.3 SAB.2 LIM.2
ZON.2
-1.5
-1.0
-0.5
0.0 Axe 1
0.5
1.0
1.5
p.21/31
Axe 2
0.0
20 19 33 44 36 18 37 46 43 34
12 39 28 30 50 35 26 45 38 49 42 21 40 23 13 22 29 47 48 24 14 27 17
2 15 8 10
4116
-0.5
-1.0
p.22/31
inertia.dudi(z,col.inertia = T)$col.abs Comp1 Comp2 Comp3 RDT.1 52 1178 122 RDT.2 265 128 125 RDT.3 528 544 0 PLM.1 76 966 305 PLM.2 29 188 80 PLM.3 12 317 683 .../... ZON.1 803 783 1 ZON.2 25 367 1101 ZON.3 528 94 873 VRTC.1 123 52 3 VRTC.2 30 96 270 VRTC.3 169 19 882 -----------------------Somme 10000 10000 10000
Analyse factorielle des correspondances multiples - 02/03/2010 p.23/31
22.Interprtation des facteurs : contributions des individus : l Contributions des lignes la construction des axes : inertia.dudi(z,row.inertia = T)$row.abs Axis1 Axis2 Axis3 1 151 444 159 2 511 25 67 3 51 774 136 4 173 555 76 5 98 434 9 6 72 900 0 7 53 891 3 8 476 2 88 9 31 413 832 10 770 3 55 11 174 546 66 .../... --------------------Somme 10000 10000 10000
Analyse factorielle des correspondances multiples - 02/03/2010 p.24/31
-1.0
-0.5
0.0
0.5
1.0
p.25/31
-0.5
0.0
0.5
1.0
p.26/31
#cration du tableau disjonctif disj<-acm.disjonctif (doncd) #l'analyse factorielle z<-dudi.coa(df = disj, scannf = FALSE, nf = 3) #l'boulis des valeurs propres inertie<-z$eig/sum(z$eig)*100 barplot(inertie,ylab="% d'inertie",names.arg=round(inertie,2)) title("Eboulis des valeurs propres en %") #les valeurs propres round(z$eig,3) #les valeurs propres en % round(z$eig/sum(z$eig)*100,2) #plan factoriels scatter.coa(z, method = 1, sub = "Bl dur", posieig = "none") #une autre reprsentation : les variables plot(z$co[,1],z$co[,2],type="n",xlab="Axe 1",ylab="Axe 2", xlim=c(-1.4,1.4)) text(z$co[,1], z$co[,2], label= colnames(disj)) title("Bl dur - plan des variables") abline(h=0,v=0) #une autre reprsentation : les individus plot(z$li[,1],z$li[,2],type="n",xlab="Axe 1",ylab="Axe 2", xlim=c(-1.4,1.4)) text(z$li[,1], z$li[,2], label=row.names(disj)) title("Bl dur - Plan des individus") abline(h=0,v=0)
Analyse factorielle des correspondances multiples - 02/03/2010 p.28/31
#contribution des variables la construction de l'axe inertia.dudi(z,col.inertia = T)$col.abs #contribution des individus la construction de l'axe inertia.dudi(z,row.inertia = T)$row.abs #aide l'interprtation : axe 1 modal<-as.data.frame(z$co) modal<-modal[sort.list(modal$Comp1),] dotchart(modal[,1],labels = row.names(modal),cex=0.8) title(sub="Rpartition des modalits sur l'axe 1") abline(v=0) #aide l'interprtation : axe 2 modal<-as.data.frame(z$co) modal<-modal[sort.list(modal$Comp2),] dotchart(modal[,2],labels = row.names(modal),cex=0.8) title(sub="Rpartition des modalits sur l'axe 2") abline(v=0)
p.29/31
26.Quelques rfrences :
l Logiciel R : R Development Core Team (2004). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org. l Bibliothque ade4 : Jean Thioulouse, Anne-Beatrice Dufour and Daniel Chessel (2004). ade4: Analysis of Environmental Data : Exploratory and Euclidean methods in Environmental sciences. R package version 1.3-3. http://pbil.univ-lyon1.fr/ADE-4 Mailing list: http://pbil.univ-lyon1.fr/ADE-4/adelist.html
p.30/31