Sunteți pe pagina 1din 0

E Ec co ol le e d d E Et t

S St ta at ti is st ti iq qu ue es s, , C Ca ar rt to og gr ra ap ph hi ie es s e et t A An na al ly ys se e s sp pa at ti ia al le e
Y Ya ao ou un nd d , , a ao o t t 2 20 00 06 6





A AN NA AL LY YS SE E D DE E D DO ON NN NE EE ES S
C CA AR RT TO OG GR RA AP PH HI IE E A AU UT TO OM MA AT TI IQ QU UE E

L L A AN NA AL LY YS SE E E EN N C CO OM MP PO OS SA AN NT TE ES S
P PR RI IN NC CI IP PA AL LE ES S



R Re es sp po on ns sa ab bl le es s : : M My yr ri ia am m B BA AR RO ON N, , L Le en na a S SA AN ND DE ER RS S
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
2



Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
3

LANALYSE EN COMPOSANTES PRINCIPALES (ACP)



I I. . R RA AP PP PE EL LS S S SU UR R L LE ES S S ST TA AT TI IS ST TI IQ QU UE ES S U UN NI I- - E ET T B BI IV VA AR RI IE EE ES S
I.1. Dfinitions et codages des variables du tableau lmentaire de donnes

I.2. Premiers rsums dun tableau lmentaire de donnes
I I. .2 2. .1 1. . V Va al le eu ur rs s c ce en nt tr ra al le es s e et t p pa ar ra am m t tr re es s d de e d di is sp pe er rs si io on n
I I. .2 2. .2 2. . D Di is sc cr r t ti is sa at ti io on n e et t r re ep pr r s se en nt ta at ti io on ns s c ca ar rt to og gr ra ap ph hi iq qu ue es s

I.3. Mise en relation des caractres dun tableau lmentaire de donnes
I I. .3 3. .1 1. . C Co oe ef ff fi ic ci ie en nt t d de e c co or rr r l la at ti io on n, , m ma at tr ri ic ce e d de e c co or rr r l la at ti io on ns s
I I. .3 3. .2 2. . R R g gr re es ss si io on n l li in n a ai ir re e, , r r s si id du us s ( ( c ca ar rt ts s a au u m mo od d l le e) ), , r re ep pr r s se en nt ta at ti io on ns s c ca ar rt to og gr ra ap ph hi iq qu ue es s


I II I. . N NO OT TI IO ON NS S C CL LE ES S D DE E L L A AN NA AL LY YS SE E E EN N C CO OM MP PO OS SA AN NT TE ES S P PR RI IN NC CI IP PA AL LE ES S ( (A AC CP P) ) N NO OR RM ME EE E
II.1.Principes gnraux de lAnalyse de Donnes

II.2. Rsultats gnraux de lACP norme

II.3. Rsultats dtaills de l ACP norme
I II I. .3 3. .1 1. . L Le es s c co oo or rd do on nn n e es s d de es s v va ar ri ia ab bl le es s
I II I. .3 3. .2 2. . L Le es s c co oo or rd do on nn n e es s d de es s p pa ay ys s a af fr ri ic ca ai in ns s
I II I. .3 3. .3 3. . G Gr ra ap ph hi iq qu ue es s c co on nc ce er rn na an nt t l le e p pr re em mi ie er r p pl la an n f fa ac ct to or ri ie el l
I II I. .4 4. . M Mi is se e e en n v va al le eu ur r c ca ar rt to og gr ra ap ph hi iq qu ue e d de es s r r s su ul lt ta at ts s d d u un ne e A AC CP P n no or rm m e e


III. L LE ES S L LI IM MI IT TE ES S D DE E L L A AN NA AL LY YS SE E E EN N C CO OM MP PO OS SA AN NT TE ES S P PR RI IN NC CI IP PA AL LE ES S N NO OR RM ME EE E
III.1. Rsultats dtaills de lAnalyse en Composantes Principales norme (suite)
I II II I. .1 1. .1 1. . L Le es s c co os si in nu us s c ca ar rr r s s
D De es s v va ar ri ia ab bl le es s d d c cr ri iv va an nt t l le es s d di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s
D De es s u un ni it t s s s sp pa at ti ia al le es s ( (l le es s 4 42 2 p pa ay ys s a af fr ri ic ca ai in ns s) )

I II II I. .1 1. .2 2. . L Le es s c co on nt tr ri ib bu ut ti io on ns s
D De es s v va ar ri ia ab bl le es s d d c cr ri iv va an nt t l le es s d di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s
D De es s u un ni it t s s s sp pa at ti ia al le es s ( (l le es s 4 42 2 p pa ay ys s a af fr ri ic ca ai in ns s) )

I II II I. .2 2. . I In nd di iv vi id du us s e et t v va ar ri ia ab bl le es s s su up pp pl l m me en nt ta ai ir re es s

III.3. Recours dautres m m t th ho od de es s dAnalyse de Donnes


Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
4
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
5

I I. . R RA AP PP PE EL LS S S SU UR R L LE ES S S ST TA AT TI IS ST TI IQ QU UE ES S U UN NI I- - E ET T B BI IV VA AR RI IE EE ES S
D Di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s a af fr ri ic ca ai in ns s
D Do oc cu um me en nt t n n 1 1 : : D D f fi in ni it ti io on ns s e et t c co od da ag ge es s d de es s v va ar ri ia ab bl le es s d d u un ne e t tu ud de e
P Po oi in nt t d de e r r v vi is si io on n : : n na at tu ur re e d de es s v va ar ri ia ab bl le es s d du u t ta ab bl le ea au u l l m me en nt ta ai ir re e d de e d do on nn n e es s
nom Nom du pays
id Identifiant du pays 3 chiffres, le 1er chiffre correspondant au continent
code Code alphabtique du pays en 5 lettres
DEN99 Densit de population (hab./ km) en 1999
URB00 Part de la population urbaine dans la population totale (%) en 2000
AGR00 Part des agriculteurs dans la population active (%) en 2000
JEU99 Part des moins de 15 ans dans la population totale (%) en 1999
VIE99 Part des plus de 60 ans dans la population totale (%) en 1999
TMI99 Taux de mortalit infantile (pour 1 000 naissances) en 1999
EVH99 Esprance de vie des hommes (nombre d'annes) en 1999
EVF99 Esprance de vie des femmes (nombre d'annes) en 1999
PNB97 Produit national humain ($ / habitant) en 1997
PIB99 Produit intrieur humain ($ / habitant) en 1997
ALP95 Taux d'alphabtisation (% de la population totale) en 1995
SCO95 Taux de scolarisation en 1995
ISF99 Indice synthtique de fcondit (nombre d'enfants par femme en ge de procrer) en 1999
IDH95 Indice de dveloppement humain en 1995
Exemple de commentaire :
La densit de population en 1999 est une variable quantitative de taux mesurable : ce nest
pas un caractre quantitatif de stock (la somme de ses modalits na pas de sens) ; ce nest pas
non plus un caractre qualitatif nominal ou ordinal.
De la mme manire, pour chacune des autres variables qui caractrisent les
diffrenciations entre pays africains, prcisez leur nature.
A partir de ce tableau, on peut galement tenter de cerner les manires dont les
diffrenciations sont dfinies. On peut se poser deux types de questions : dans quelle(s)
mesure(s) le choix de ces variables rend compte des proccupations dune poque ? Dans quelle(s)
mesure(s) le choix de ces variables ne fait que renvoyer au seul indice de dveloppement humain
(IDH95) ?
On constate en effet que les variables slectionnes pour rendre compte des diffrenciations
entre pays africains sont conomiques (population active employe dans le secteur agricole,
produit national brut et produit intrieur brut) ; concernent lencadrement social et sanitaire des
populations (taux de mortalit infantile, taux dalphabtisation et taux de scolarisation) et
quelques caractristiques dmographiques (importance des populations de moins de 15 ans dans la
population totale, importance des plus de 60 ans dans la population totale). Prs de 30 ans
auparavant, les diffrenciations entre pays taient essentiellement dfinies en fonction de
critres conomiques et dmographiques. Ce nest que depuis 1990 avec la dfinition de lIndice
de Dveloppement Humain (IDH) que les notions de dveloppement et de diffrenciations se sont
enrichies dune dimension relevant de lencadrement social voire sanitaire des populations.
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
6
D Do oc cu um me en nt t n n 2 2 : : P Pr re em mi ie er rs s r r s su um m s s d d u un n t ta ab bl le ea au u l l m me en nt ta ai ir re e d de e d do on nn n e es s
I.2.1. Points de rvision : valeurs centrales et paramtres de dispersion
Variables Moyennes Ecarts-types
Coefficients de
variation
JEU99 43,71 3,76 0,09
EVH99 48,50 8,41 0,17
EVF99 51,21 9,05 0,18
ISF99 5,49 1,12 0,20
VIE99 3,43 0,82 0,24
TMI99 91,71 30,58 0,33
ALP95 53,73 17,94 0,33
AGR00 61,38 21,93 0,36
URB00 40,78 17,47 0,43
SCO95 44,88 20,19 0,45
PIB99 1837,89 1747,53 0,95
DEN99 41,61 40,46 0,97
PNB97 776,67 934,88 1,20


Exemple de commentaire :
Lindice synthtique de fcondit (ISF99) moyen dans les pays africains pour lesquels
linformation est disponible en 1999 est gal 5,49 enfants par femme, tandis que le produit
national brut moyen par habitant dans ces mmes pays africains est gal 776,67 dollars.
Ces deux caractres ne peuvent pas tre compars directement car ils ne sont pas exprims dans
la mme unit de mesure.
De la mme manire, bien quexprims dans la mme unit de mesure (%), la part des jeunes dans
la population totale (43,71%), la part des plus de 60 ans (VIE99) dans la population totale
(3,43%) et la part des actifs employs dans le secteur agricole (61,38%) ne peuvent tre
compars directement car leurs ordres de grandeur (moyennes) sont diffrents.
Pour pouvoir comparer directement toutes ces variables qui soit sont exprimes dans des
units de mesure diffrentes soit nont pas les mmes ordres de grandeur, on a recours aux
paramtres de dispersion relative qui sont toujours dfinis comme le rapport entre un
paramtre de dispersion absolu et une valeur centrale. Ici, on utilise le coefficient de
variation qui est le rapport entre lcart-type et la moyenne. Il permet de positionner
relativement les caractres les uns par rapport aux autres : il ne sinterprte pas par rapport
une ou des valeurs de rfrence.
A partir du tableau ci-dessus, la part des jeunes (JEU99) est trs peu diffrente d'un pays
africain un autre : elle voisine 43,7% de la population totale. Tandis que la densit de
population (DEN99) varie considrablement d'un pays un autre : la densit moyenne de prs de
42 habitants au km n'est donc pas vraiment reprsentative de l'ensemble des pays africains. Il
en va de mme pour le PIB et le PNB. Enfin, il existe un rapport suprieur 10 entre la variable
ou caractre qui introduit le moins de diffrenciations entre les pays africains savoir la part
des jeunes dans la population totale (coefficient de variation gal 0,09) et les caractres qui
introduisent le plus de diffrenciations savoir le PIB en 1999, la densit nationale d'habitants
en 1999 et le PNB en 1997 (coefficients de variation respectivement gaux 0,95 0,97 et 1,20).
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
7
D Do oc cu um me en nt t n n 3 3 : : d di is sc cr r t ti is sa at ti io on n e et t r re ep pr r s se en nt ta at ti io on ns s c ca ar rt to og gr ra ap ph hi iq qu ue es s

On retient pour ce rappel un exemple de variable qui diffrencie peu les pays africains et un
autre qui diffrencie beaucoup ces mmes pays.
Ce quil faut retenir :
Comme lide est de comparer les deux distributions gographiques, il faut retenir la mme
mthode de discrtisation autrement dit le mme type de partition en classes. Les 2 phnomnes
retenus ne se rpartissent pas tous les deux selon une distribution normale : on choisit donc une
rpartition en classes deffectifs gaux. Compte-tenu du nombre de villes sur lesquelles porte
ltude, savoir 18, le nombre de classes ne doit pas excder selon lindice dHuntsberger :
N(Cl) = 1 + 3,3log
10
(N) o N est le nombre total dindividus statistiques
N(Cl) est le nombre maximum de classes de la partition
N(Cl) = 6,53
Dans le cas prsent, on choisit la mthode des quartiles qui prsente lavantage didentifier
clairement les 21 pays soit 50% dont les valeurs sont proches de la mdiane, les 25% de pays
dont les valeurs sont les plus faibles pour le phnomne soit 10 ou 11 ; enfin de mme les 25% de
pays dont les valeurs sont les plus fortes pour le phnomne.
Enfin, il sagit de choisir la ou les variables visuelles qui va ou vont permettre de raliser la carte.
Soit on choisit de privilgier la continuit et alors le plus simple est de ne retenir que la valeur
(rapport blanc-noir) :

Soit on choisit dinsister sur les valeurs infrieures la mdiane et celles qui lui sont suprieures
mais aussi les plus proches de la mdiane et celles qui en sont le plus loignes, on retient alors 2
textures-structures de base combines avec le grain ou/et lespacement :



Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
8

D Do oc cu um me en nt t n n 4 4 : : M Mi is se e e en n r re el la at ti io on n d de es s c ca ar ra ac ct t r re es s d d u un n t ta ab bl le ea au u l l m me en nt ta ai ir re e d de e
d do on nn n e es s
M Ma at tr ri ic ce e d de e c co or rr r l la at ti io on ns s
Variables
DEN99 URB00 AGR00 JEU99 VIE99 TMI99
DEN99 1
URB00 -0,397 1
AGR00 0,164 -0,706 1
JEU99 0,155 -0,661 0,724 1
VIE99 -0,193 0,475 -0,608 -0,755 1
TMI99 0,034 -0,507 0,748 0,605 -0,512 1
EVH99 -0,008 0,558 -0,728 -0,619 0,452 -0,720
EVF99 0,000 0,562 -0,715 -0,622 0,449 -0,657
PNB97 -0,274 0,566 -0,700 -0,717 0,842 -0,549
PIB99 -0,230 0,615 -0,740 -0,718 0,826 -0,630
ALP95 -0,215 0,357 -0,482 -0,358 0,397 -0,444
SCO95 -0,109 0,491 -0,755 -0,533 0,519 -0,611
ISF99 0,114 -0,600 0,720 0,822 -0,613 0,767
Variables
EVH99 EVF99 PNB97 PIB99 ALP95 SCO95 ISF99
EVH99 1
EVF99 0,987 1
PNB97 0,362 0,343 1
PIB99 0,480 0,449 0,930 1
ALP95 0,133 0,124 0,435 0,489 1
SCO95 0,373 0,332 0,659 0,747 0,746 1
ISF99 -0,635 -0,614 -0,594 -0,652 -0,499 -0,681 1
En gras, valeurs significatives (hors diagonale) au seuil alpha=0,050 (test bilatral)

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
9

Exemple de commentaire :
A l'exception de la densit d'habitants au km qui n'est corrle aucune variable caractrisant
les pays africains part la part de population urbaine dans la population totale, il existe de
nombreuses relations significatives entre les variables. C'est ainsi qu'il existe une relation
positive et significative entre l'indice synthtique de fcondit et la part des jeunes dans la
population totale (coefficient de corrlation de Bravais-Pearson gal +0,822) : ce qui signifie
que les pays caractriss par un ISF lev sont aussi les pays dans lesquels la part des jeunes
dans la population totale est importante. Il existe en revanche une relation ngative et
significative entre cette mme part des jeunes dans la population totale et le PIB par habitant
(coefficient de corrlation de Bravais-Pearson gal -0,718) : ce qui signifie que les pays
africains caractriss par une part de population jeune leve ont des PNB par habitant plutt
faibles. Il sagit de cooccurrence spatiale et non de relation de causalit entre deux variables.
Enfin, il est prcis que les valeurs en gras sont significatives avec une marge derreur de 5% : ce
qui signifie que lon a 5 chances sur 100 de se tromper quand on affirme quil existe une relation
positive et significative entre la part des jeunes dans la population totale et lindice synthtique
de fcondit dans les pays africains.
Ce quil faut savoir :
La valeur dun coefficient de corrlation volue dans un intervalle compris entre les valeurs
1 et +1 ; la valeur 0 indique labsence de relation linaire entre deux caractres ; enfin le
degr de significativit du coefficient de corrlation est fonction du nombre dindividus
statistiques autrement dit ici du nombre de pays sur lesquels porte le calcul.
Dans le cadre des Analyses factorielles, les relations linaires mises en vidence entre les
diffrents caractres sont autant d'indications pour formuler des hypothses sur les
rsultats de l'ACP norme. En effet, si l'on suppose que la part des jeunes dans la
population totale contribue diffrencier principalement les pays africains alors l'ISF se
trouvera proximit alors que le PNB se situera l'oppos.

D Do oc cu um me en nt t n n 5 5 : : R R g gr re es ss si io on n l li in n a ai ir re e, , r r s si id du us s ( ( c ca ar rt ts s a au u m mo od d l le e) ), , r re ep pr r s se en nt ta at ti io on n
c ca ar rt to og gr ra ap ph hi iq qu ue e
Exemple de commentaire :
Ltude de la matrice des corrlations a indiqu trs clairement que la corrlation la plus
significative au seuil de 5% valait +0,822 et concernait la part des jeunes dans la population
totale et lindice synthtique de fcondit. Autrement dit, dans les 42 pays africains pour
lesquels linformation est disponible, plus lindice synthtique de fcondit est lev, plus la part
des jeunes dans la population totale est importante.
Aussi important que le coefficient de corrlation, il ne faut pas oublier de regarder ou de
calculer le coefficient de dtermination qui indique le pouvoir explicatif de la relation et qui
correspond la valeur du coefficient de corrlation leve au carr. Dans le cas prsent, le
coefficient de dtermination est gal 0,676 : ce qui signifie que la variation de la part des
jeunes dans la population totale dans les pays africains est explique plus de 67% par la
variation de lindice synthtique de fcondit ; ce qui signifie galement que 33% de cette
variation dans les pays africains nest pas explique par la variation de lindice synthtique
de fcondit.

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
10
Lquation de la droite de rgression linaire est du type :
Y = aX + b o Y est la part des jeunes dans la population totale
o X est lindice synthtique de fcondit
o a = 2,76 et b = 28,55

Ltude des rsidus doit aussi permettre de vrifier quil ny a pas auto corrlation des rsidus,
ni homoscdasticit des rsidus.

Enfin, la dernire tape correspond la cartographie de ces rsidus. Celle-ci nest pas trs
difficile mettre en uvre dans la mesure o elle obit aux mmes rgles, aux mmes mthodes
et aux mmes choix qui ont t voqus pour la reprsentation dun seul phnomne. On peut
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
11
identifier 3 grands ensembles de pays. Le premier est le plus nombreux et caractris par des
rsidus centrs-rduits positifs et ngatifs pour la part des jeunes dans la population totale
compris entre -1 et +1 : autrement dit il sagit de pays dans lesquels la part des moins de 15 ans
est conforme ce que laisserait attendre la valeur prise par lindice synthtique de fcondit. A
la diffrence, 6 pays parmi lesquels le Kenya sont caractriss par une part des moins de 15 ans
bien suprieure ce que laisserait attendre la valeur de lindice synthtique de fcondit et ont
donc des rsidus centrs-rduits trs positifs (suprieurs +1). Enfin, un dernier groupe de pays
parmi lesquels la Cte dIvoire, lAfrique du Sud, est caractris par une part des moins de 15 ans
bien infrieure ce que laisserait attendre les valeurs dindice synthtique de fcondit (rsidus
centrs-rduits infrieurs -1). Dans ce dernier cas, on ne peut que rapprocher ces constats de
linstabilit rgionale ou de la manire dont certaines grandes pandmies comme le SIDA
touchent les populations.


Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
12



Pour approfondir et bien rviser :
BARON M., BOULIER J. (resp.), 2006, Smiologie graphique et cartographie automatique, Ecole dEt
Statistiques, Cartographies et Analyse spatiale, Yaound, 58 pages.
SAINT-JULIEN T., GRASLAND C. (resp.), 2006, Statistiques descriptives univaries et bivaries : cours,
Ecole dEt Statistiques, Cartographies et Analyse spatiale, Yaound, 102 pages.
SAINT-JULIEN T., GRASLAND C. (resp.), 2006, Statistiques descriptives univaries et bivaries :
applications, Ecole dEt Statistiques, Cartographies et Analyse spatiale, Yaound, 61 pages.
http://www.grasland.cicrp.jussieu.fr/grasland/ Plus prcisment les enseignements intituls GO152, GO252
et EXCE qui comportent un support de cours et des exercices corrigs dans certains cas.

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
13

I II I. . N NO OT TI IO ON NS S C CL LE ES S D DE E L L A AN NA AL LY YS SE E E EN N C CO OM MP PO OS SA AN NT TE ES S P PR RI IN NC CI IP PA AL LE ES S
N NO OR RM ME EE E
D Di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s a af fr ri ic ca ai in ns s
D Do oc cu um me en nt t n n 1 1 : : P Pr ri in nc ci ip pe es s g g n n r ra au ux x d de e l l A An na al ly ys se e d de e D Do on nn n e es s
Mthodes et outils
statistiques
Apports Limites
Etude statistique univarie
Rsumer un tableau lmentaire de
donnes
Ne pas rendre compte des
configurations spatiales et
territoriales
Etude statistique bivarie
Rendre compte des associations de
variables prises 2 2
Poser des hypothses fortes sur le
sens de la relation
Ne pas permettre de vue densemble
Ne pas permettre dapprhender la
complexit
Analyse de donnes Rorganiser linformation
Hirarchiser cette information
Rendre compte de la complexit des
phnomnes gographiques
Mthode descriptive mais pas
explicative
a. Analyse en
composantes
principales norme
(ACP norme)
Intrt pour lentre par les variables,
la dfinition de nouvelles variables
synthtiques
Rorganisation pas toujours efficace
Intrt secondaire pour la
rpartition spatiale des
combinaisons de phnomnes
b. Analyse
factorielles des
correspondances
(AFC)
Intrt de mettre sur le mme plan les
variables et les individus statistiques
Utilisation dun systme de
pondration inverse pour attnuer les
effets de masse
Rorganisation pas toujours efficace
Intrt secondaire pour la
rpartition spatiale des
combinaisons de phnomnes
c. Classification
ascendante
hirarchique (CAH)
Intrt pour lentre par les units
spatiales, la faon dont elles se
regroupent
Naboutit pas toujours une
rgionalisation
D Do oc cu um me en nt t n n 2 2 : : R R s su ul lt ta at ts s g g n n r ra au ux x d de e l l A An na al ly ys se e e en n C Co om mp po os sa an nt te es s P Pr ri in nc ci ip pa al le es s n no or rm m e e
Notions cls : facteurs, valeurs propres, part de variance, part de variance cumule

Qualit de
l'ACP
F1 F2 F3 F4 F5 F6

Valeur
propre
7,64 1,66 1,08 0,89 0,44 0,40

% variance 58,76 12,79 8,32 6,86 3,38 3,10

% cumul 58,76 71,56 79,88 86,74 90,13 93,22


Qualit de
l'ACP
F7 F8 F9 F10 F11 F12 F13
Valeur
propre
0,31 0,22 0,14 0,10 0,06 0,03 0,01
% variance 2,42 1,71 1,11 0,75 0,48 0,27 0,04
% cumul 95,65 97,35 98,47 99,21 99,69 99,96 100,00
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
14

Valeurs propres
F13 F12 F11 F10 F9
F8
F7
F6 F5
F4
F3
F2
F1
0
1
2
3
4
5
6
7
8
9

Ce quil faut savoir
Le tableau et le graphique du document 2 comportent des informations sur la qualit gnrale de
lACP ralise.
On constate quil y a autant de facteurs dans le tableau final quil y avait de caractres dans
le tableau lmentaire de donnes (13). Ce nest donc pas sur le nombre que les facteurs sont
diffrents des caractres mais bien sur leur dfinition.
Le passage aux facteurs permet de rorganiser linformation et surtout de la hirarchiser. Un
facteur est une variable synthtique autrement dit une combinaison linaire de toutes les
variables prsentes dans le tableau lmentaire de donnes. Le numro de chacun des
facteurs (F
1
, F
2
F
13
) renvoie un ordre : la combinaison linaire qui dfinit le premier facteur
rsume plus dinformations que celle qui dfinit le deuxime facteur etc. Enfin, chaque facteur
est indpendant des autres : ce qui signifie que chaque combinaison linaire est diffrente et que
dun point de vue gomtrique lindpendance des facteurs se traduit par le fait quils sont
perpendiculaires deux deux.
Chaque facteur est caractris par une valeur propre, une part de variance totale (%variance)
et une part de variance cumule (%cumule). A partir du premier tableau, on constate que la
somme des 13 valeurs propres correspondant aux 13 facteurs est gale 13. Plus
gnralement la somme de toutes les valeurs propres correspond linertie totale (I) :
I =
j

j

A partir du tableau et du graphique, on remarque que ces valeurs sont dcroissantes de F
1
(7,64)
F
10
(0,01) et qu partir de F
4
elles sont infrieures 1. On remarque enfin que les valeurs
propres sont bien diffrencies surtout entre le premier et le deuxime facteur : ce qui
traduit une hirarchisation nette de linformation.
% variance correspond la part de variance totale prise en compte par le facteur : partir
de lexemple de F
1
, on remarque quil existe un rapport de 1 13 entre la valeur propre (7,64) et
la part de variance (58,76%). La part de variance totale prise en compte par un facteur est en
effet dfinie comme le rapport entre la valeur propre qui caractrise le facteur et la somme des
valeurs propres : pour F
1
, cela donne %variance = 7,64/13 = 0,587 = 58,76%. Ce qui signifie qu
lui seul, le premier facteur rsume prs de 60% de linformation totale sur les diffrenciations
entre pays africains.
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
15
Plus gnralement : %variance(F
k
) = R
k
=
k
/I
o R
k
est la part de variance totale prise en compte par le K
ime
facteur
o
k
est la valeur propre associe au K
ime
facteur
o I est linertie totale du nuage de points
% cumul correspond la somme des parts de variance totale prise en compte jusquau
facteur K. Pour le facteur ou axe factoriel F
1
, la part de variance (58,76%) et la part de
variance cumule sont identiques. En revanche, ds F
2
, elle sont diffrentes : %variance=12,79
tandis que %cumul=71,56. Ce qui signifie que ds le premier facteur plus de la moiti de
linformation concernant les diffrenciations entre pays dAfrique est rsume. Enfin, si les 3
premiers facteurs sont retenus autrement dit tous ceux dont la valeur propre est suprieure
1, alors prs de 80% de linformation totale aura t rsume.

Conclusion : quand on veut savoir ce qui diffrencie le plus les pays africains, le recours
lAnalyse en Composantes Principales norme (ACP) est pertinent. La rorganisation et la
hirarchisation de linformation sont bien nettes : ds le premier facteur plus de la moiti de
linformation contenue dans le tableau initiale de donnes est rsume ; les 3 premiers facteurs
(soit prs du tiers de lensemble) prennent en compte quant eux 80% de cette mme
information.

D Do oc cu um me en nt t n n 3 3 : : R R s su ul lt ta at ts s d d t ta ai il ll l s s d de e l l A An na al ly ys se e e en n C Co om mp po os sa an nt te es s P Pr ri in nc ci ip pa al le es s n no or rm m e e
Notions cls : coordonnes des variables et des individus
Les coordonnes des variables
Variables
F1 F2 F3
DEN99 0,226 0,439 0,735
URB00 -0,754 0,008 -0,375
AGR00 0,909 -0,095 -0,038
JEU99 0,862 -0,064 0,114
VIE99 -0,790 -0,199 -0,092
TMI99 0,812 -0,221 -0,220
EVH99 -0,738 0,629 -0,078
EVF99 -0,717 0,641 -0,106
PNB97 -0,821 -0,358 -0,087
PIB99 -0,878 -0,273 -0,011
ALP95 -0,561 -0,498 0,376
SCO95 -0,778 -0,324 0,381
ISF99 0,863 -0,083 -0,133

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
16
Les coordonnes des pays africains
Pays F1 F2 F3 Pays F1 F2 F3
Afrique du Sud -5,78 -0,91 0,67 Kenya 0,24 -0,36 1,29
Algrie -4,25 1,46 -0,43 Libye -6,52 1,30 -0,55
Angola 2,28 -0,21 -1,03 Madagascar 1,20 0,70 -0,52
Bnin 1,03 1,06 -0,18 Malawi 2,60 -1,68 2,01
Botswana -4,05 -3,19 -0,49 Mali 2,37 -0,04 -1,52
Burkina Faso 3,03 0,84 -0,60 Maroc -4,67 2,52 -0,27
Burundi 3,39 1,67 2,79 Mauritanie 0,10 0,81 -1,43
Cameroun -0,89 0,30 -0,12 Mozambique 2,64 0,10 -0,88
Centrafricaine
(Rpublique) 0,64 -0,53 -0,78 Namibie -2,26 -2,87 0,66
Congo -0,97 -1,24 -0,13 Niger 4,21 0,06 -1,48
Congo. (Rp.dm.du
ex-Zare) 1,39 -0,50 0,30 Nigeria -0,12 1,47 1,64
Cte d'Ivoire 0,60 0,18 -0,38 Ouganda 2,29 -0,42 1,75
Djibouti 0,62 0,36 -1,92 Sngal 0,55 1,18 -0,50
gypte -3,86 1,71 0,73 Sierra Leone 2,07 0,83 -0,30
thiopie 3,31 -0,10 -0,23 Soudan 0,25 0,78 -0,51
Gabon -4,44 -2,30 -1,20 Tanzanie 1,46 -0,29 0,27
Gambie 1,77 0,60 0,90 Tchad 1,92 -0,05 -0,83
Ghana -0,39 1,50 1,12 Togo 0,58 0,47 1,31
Guine 2,23 -0,06 -0,88 Tunisie -6,12 1,28 0,29
Guine quatoriale -0,87 -1,85 -0,08 Zambie 1,29 -2,09 0,22
Guine-Bissau 1,74 -0,67 -0,37 Zimbabwe -0,63 -1,81 1,65
Graphiques concernant le premier plan factoriel


Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
17
Ce quil faut savoir
Dans lensemble des sorties de lACP, les variables slectionnes pour rendre compte des
diffrenciations entre pays africains sont caractrises par leurs coordonnes, leurs cosinus
carrs sur chacun des facteurs et leurs contributions la dfinition de chacun des facteurs
galement.
La population active employe dans le secteur agricole, lindice synthtique de fcondit et la
part des moins de 15 ans ont les coordonnes les plus positives sur le premier facteur,
respectivement +0,91 et +0,86. Tandis que le Produit intrieur brut (-0,88) et le Produit national
brut (-0,82) sont caractriss par les coordonnes les plus ngatives.
Les coordonnes des variables peuvent donc tre positives ou ngatives. Leurs valeurs absolues
sont infrieures ou gales 1. Les coordonnes des variables sur chacun des facteurs sont les
valeurs des coefficients de corrlation des variables avec chacun des facteurs.
Attention : les coordonnes ngatives ne renvoient pas des sous reprsentations ; de
mme, les coordonnes positives ne renvoient pas des surreprsentations.
Tandis que les coordonnes des individus statistiques ou units spatiales sont elles aussi positives
ou ngatives mais peuvent tre infrieures 1 ou suprieures +1. Les coordonnes des
individus statistiques ne sont pas des coefficients de corrlation.

Le premier facteur, qui prend en compte prs de 60% de linertie totale est dfini par
lopposition entre les pays o la part de population active employe dans le secteur agricole,
lindice synthtique de fcondit et la part des moins de 15 ans dans la population totale sont
levs et ceux o les PIB et PNB sont forts. La principale structuration des diffrences entre
les pays africains est base sur une opposition entre des phnomnes conomiques et des
caractres dmographiques. Ce premier facteur oppose la plupart des pays situes aux marges
nord et sud du continent (Tunisie (-6,12), Libye (-6,52) et Afrique du Sud (-5,78)) certains pays
de la zone sub-saharienne (Niger (+4,21) et Ethiopie (+3,31)). Dun point de vue gographique,
la principale structuration des diffrenciations entre pays africains dessine en partie un modle
centre-priphrie invers .
Le deuxime facteur, qui rsume prs de 13% de linertie totale, a une structuration
diffrente du premier : il est dfini par une opposition entre les esprances de vie des hommes
et des femmes (respectivement +0,64 et +0,63) et le taux dalphabtisation des populations (-
0,50). Il sagit dun axe factoriel rendant compte des diffrences entre des situations a priori
les plus favorables, autrement dit les pays des marges mridionales et septentrionales du
continent. Ce deuxime facteur diffrencie donc des pays comme le Maroc (+2,52) dautres
comme le Botswana (-3,19) et la Namibie (-2,87).

D Do oc cu um me en nt t n n 4 4 : : M Mi is se e e en n v va al le eu ur r c ca ar rt to og gr ra ap ph hi iq qu ue e d de es s r r s su ul lt ta at ts s d d u un ne e A AC CP P n no or rm m e e
Ce quil faut savoir
Il y a 2 faons de cartographier les rsultats dune ACP norme :

- une carte reprsente les coordonnes des units spatiales sur un facteur et un seul. On
se ramne donc des problmes de reprsentation cartographique univarie avec une valeur de
rfrence (ici 0) qui marque une rupture dans la progression des valeurs. Cela revient combiner
au moins 2 variables visuelles : dune part 2 couleurs distinctes (par exemple le bleu pour les
valeurs ngatives et le rouge pour les valeurs positives) associes une monte en valeur en
fonction de la valeur absolue de la coordonnes (plus la valeur absolue de la coordonne est forte,
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
18
plus le rapport blanc-noir tire vers le noir) ou 2 trames distinctes (par exemple les traits pour les
valeurs ngatives et les points pour les valeurs positives) associes une paisseur croissante de
la texture-structure de base ou/et un resserrement du motif de base.

On prend soin de bien construire la lgende, avec un titre le plus dtaill possible et des
prcisions qui permettent de savoir quoi correspondent les valeurs positives et
ngatives, comme il suit :




On apporte un soin la mise en page et lhabillage de la carte ralise :




Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
19
- une carte peut reprsenter les coordonnes des units spatiales sur un plan factoriel
(autrement dit 2 facteurs pris ensemble). On se ramne cette fois des problmes de
croisements de reprsentations cartographiques univaries avec toujours une valeur de
rfrence (ici 0) qui marque une rupture dans la progression des coordonnes sur chacun des
facteurs retenus. Cela revient toujours combiner au moins 2 variables visuelles : pour lun des
axes, 2 couleurs distinctes (par exemple le bleu pour les valeurs ngatives et le rouge pour les
valeurs positives) ; pour lautre 2 trames distinctes (par exemple les points pour les valeurs
ngatives et les traits pour les valeurs positives).
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
20
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
21

III. L LE ES S L LI IM MI IT TE ES S D DE E L L A AN NA AL LY YS SE E E EN N C CO OM MP PO OS SA AN NT TE ES S P PR RI IN NC CI IP PA AL LE ES S N NO OR RM ME EE E
D Di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s a af fr ri ic ca ai in ns s

D Do oc cu um me en nt t n n 1 1 : : R R s su ul lt ta at ts s d d t ta ai il ll l s s d de e l l A An na al ly ys se e e en n C Co om mp po os sa an nt te es s P Pr ri in nc ci ip pa al le es s n no or rm m e e
( (s su ui it te e) )
L Le es s c co os si in nu us s c ca ar rr r s s
D De es s v va ar ri ia ab bl le es s d d c cr ri iv va an nt t l le es s d di if ff f r re en nc ci ia at ti io on ns s e en nt tr re e p pa ay ys s
Variables
F1 F2 F3
DEN99 0,051 0,193 0,540
URB00 0,569 0,000 0,141
AGR00 0,826 0,009 0,001
JEU99 0,744 0,004 0,013
VIE99 0,625 0,040 0,008
TMI99 0,659 0,049 0,049
EVH99 0,544 0,395 0,006
EVF99 0,514 0,411 0,011
PNB97 0,675 0,128 0,007
PIB99 0,771 0,074 0,000
ALP95 0,314 0,248 0,141
SCO95 0,605 0,105 0,145
ISF99 0,744 0,007 0,018
De es s u un ni it t s s s sp pa at ti ia al le es s ( (l le es s 4 42 2 p pa ay ys s a af fr ri ic ca ai in ns s) )
Pays F1 F2 F3 Pays F1 F2 F3
Afrique du Sud 0,89 0,02 0,01 Kenya 0,01 0,03 0,38
Algrie 0,84 0,10 0,01 Libye 0,86 0,03 0,01
Angola 0,74 0,01 0,15 Madagascar 0,50 0,17 0,09
Bnin 0,24 0,25 0,01 Malawi 0,42 0,17 0,25
Botswana 0,53 0,33 0,01 Mali 0,57 0,00 0,23
Burkina Faso 0,71 0,05 0,03 Maroc 0,69 0,20 0,00
Burundi 0,42 0,10 0,28 Mauritanie 0,00 0,16 0,51
Cameroun 0,40 0,05 0,01 Mozambique 0,70 0,00 0,08
Centrafricaine (Rpublique) 0,11 0,07 0,16 Namibie 0,32 0,53 0,03
Congo 0,14 0,23 0,00 Niger 0,79 0,00 0,10
Congo. (Rp.dm.du ex-
Zare) 0,31 0,04 0,01 Nigeria 0,00 0,28 0,34
Cte d'Ivoire 0,17 0,02 0,07 Ouganda 0,52 0,02 0,31
Djibouti 0,04 0,01 0,36 Sngal 0,09 0,41 0,07
gypte 0,76 0,15 0,03 Sierra Leone 0,61 0,10 0,01
thiopie 0,91 0,00 0,00 Soudan 0,02 0,17 0,07
Gabon 0,55 0,15 0,04 Tanzanie 0,54 0,02 0,02
Gambie 0,35 0,04 0,09 Tchad 0,65 0,00 0,12
Ghana 0,03 0,44 0,24 Togo 0,11 0,07 0,56
Guine 0,73 0,00 0,11 Tunisie 0,93 0,04 0,00
Guine quatoriale 0,11 0,51 0,00 Zambie 0,20 0,53 0,01
Guine-Bissau 0,45 0,07 0,02 Zimbabwe 0,04 0,30 0,25
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
22
Ce quil faut savoir
Dans lensemble des sorties de lACP, les variables slectionnes pour rendre compte des
diffrenciations entre pays africains sont caractrises par leurs coordonnes mais aussi par
leurs cosinus carrs sur chacun des facteurs et leurs contributions la structuration de chacun
des facteurs.

La part des actifs employs dans le secteur agricole et lindice synthtique de fcondit ont les
coordonnes les plus positives sur le premier facteur : respectivement +0,91 et +0,86. Il sagit
aussi des valeurs pour les cosinus carrs parmi les plus leves : respectivement 0,82 et 0,74.
Les cosinus carrs des variables sur chacun des facteurs sont les valeurs des carrs des
coefficients de corrlation des variables avec chacun des facteurs. Ces caractristiques
rendent compte de la qualit de reprsentation des variables sur chacun des facteurs : il sagit
donc dune mesure de la qualit de reprsentation des variables. Les valeurs des cosinus carrs
varient dans un intervalle compris entre 0 et +1 : plus cette valeur est proche de +1,
meilleure est la qualit de reprsentation de la variable ou de lunit spatiale sur le
facteur.
Dans cet exemple, on peut dire que non seulement lAfrique du Sud, la Tunisie et la Libye ont des
coordonnes trs ngatives sur le premier facteur mais aussi que ces trois pays ont galement
une trs bonne qualit de reprsentation sur le premier facteur ou axe factoriel ou composante :
respectivement 0,89, 0,93 et 0,86.


D Do oc cu um me en nt t n n 2 2 : : L Le es s c co on nt tr ri ib bu ut ti io on ns s
Des variables dcrivant les diffrenciations entre pays (%)
Variables F1 F2 F3
DEN99 0,67 11,61 49,92
URB00 7,44 0,00 13,03
AGR00 10,81 0,54 0,13
JEU99 9,73 0,24 1,20
VIE99 8,18 2,38 0,78
TMI99 8,62 2,93 4,49
EVH99 7,12 23,76 0,57
EVF99 6,72 24,70 1,05
PNB97 8,83 7,72 0,69
PIB99 10,09 4,47 0,01
ALP95 4,12 14,93 13,07
SCO95 7,92 6,30 13,43
ISF99 9,74 0,42 1,63

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
23

Des units spatiales (les 42 pays africains) (%)
Pays F1 F2 F3 Pays F1 F2 F3
Afrique du Sud 10,42 1,19 1,00 Kenya 0,02 0,18 3,68
Algrie 5,63 3,05 0,40 Libye 13,26 2,42 0,68
Angola 1,62 0,06 2,33 Madagascar 0,45 0,71 0,60
Bnin 0,33 1,60 0,08 Malawi 2,11 4,05 8,91
Botswana 5,10 14,53 0,54 Mali 1,76 0,00 5,06
Burkina Faso 2,86 1,00 0,80 Maroc 6,79 9,13 0,16
Burundi 3,59 4,01 17,07 Mauritanie 0,00 0,93 4,47
Cameroun 0,25 0,13 0,03 Mozambique 2,17 0,01 1,69
Centrafricaine (Rpublique) 0,13 0,40 1,33 Namibie 1,59 11,83 0,95
Congo 0,29 2,19 0,04 Niger 5,53 0,00 4,82
Congo. (Rp.dm.du ex-Zare) 0,61 0,36 0,19 Nigeria 0,00 3,10 5,94
Cte d'Ivoire 0,11 0,05 0,32 Ouganda 1,64 0,25 6,76
Djibouti 0,12 0,18 8,09 Sngal 0,09 1,99 0,55
gypte 4,64 4,18 1,16 Sierra Leone 1,34 1,00 0,19
thiopie 3,41 0,02 0,12 Soudan 0,02 0,87 0,57
Gabon 6,15 7,57 3,15 Tanzanie 0,67 0,12 0,16
Gambie 0,97 0,51 1,78 Tchad 1,15 0,00 1,51
Ghana 0,05 3,22 2,76 Togo 0,11 0,32 3,78
Guine 1,54 0,00 1,70 Tunisie 11,68 2,33 0,19
Guine quatoriale 0,23 4,89 0,02 Zambie 0,52 6,28 0,11
Guine-Bissau 0,95 0,64 0,30 Zimbabwe 0,12 4,69 6,02
Ce quil faut savoir
Dans lensemble des sorties de lACP, les variables slectionnes pour rendre compte des
diffrenciations entre pays africains sont caractrises par leurs coordonnes, leurs cosinus
carrs sur chacun des facteurs mais aussi leurs contributions la structuration de chacun des
facteurs.
La part des actifs employs dans le secteur agricole et lindice synthtique de fcondit ont les
coordonnes les plus positives sur le premier facteur : respectivement +0,91 et +0,86. Il sagit
aussi des valeurs pour les contributions parmi les plus leves : respectivement 10,8 et 9,7%. Les
contributions des variables la structuration de chacun des facteurs rendent compte de
limportance des variables dans la dfinition des diffrents facteurs. Cette importance, ce
poids de chacune des variables est exprim en % et ne doit pas excder 15 20% dans la
structuration densemble du facteur : autrement dit une variable ne doit pas contribuer plus
de 1/5
e
la structuration dun facteur.
Cest le cas dans ltude sur les diffrenciations entre pays africains. La part des actifs employs
dans le secteur agricole et lindice synthtique de fcondit contribuent chacun moins de 11%
la structuration du premier facteur. Aucune variable du tableau lmentaire de donnes ne
fausse les rsultats de lACP. On na pas se poser de question du type : dans quelle(s) mesure(s)
certaines variables ne masquent pas dautres phnomnes ? On na donc pas tenter de rsoudre
un problme du type : faut-il les retirer de lACP norme ? Si oui, selon quelle(s) modalit(s) ?
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
24
De la mme manire, pour les contributions des individus statistiques ou units spatiales. La
Libye contribue un peu plus de 13% la structuration du premier facteur et la Tunisie prs de
12% : ces deux pays structurent pour un quart le premier facteur. Aucun pays du tableau
lmentaire de donnes ne fausse les rsultats de lACP norme.
Au final, aucune variable et aucun pays africain nont de contribution excessive pour la
structuration du premier facteur.

D Do oc cu um me en nt t n n 3 3 : : I In nd di iv vi id du us s e et t v va ar ri ia ab bl le es s s su up pp pl l m me en nt ta ai ir re es s
Quand on dcide de placer une variable ou un individu statistique (le plus souvent une unit
spatiale en gographie) en lment supplmentaire, cela signifie quil ne joue aucun rle actif dans
lACP norme. Autrement dit : les diffrents facteurs vont tre dfinis en fonction des
associations et des oppositions des autres variables ou individus statistiques. On ne fera que
projeter les variables et/ou individus statistiques supplmentaires sur les facteurs ainsi dfinis.
Ce qui peut galement snoncer de la manire suivante : les variables ou/et individus
statistiques supplmentaires doivent avoir des contributions nulles la structuration de tous les
facteurs de lACP norme.
Dans cette dmarche, il est recommand de faire du pas pas : on commence par mettre les
variables qui contribuent de manire excessive la structuration du voire des premiers facteurs
comme variables supplmentaires et on vrifie si cela change les rsultats savoir la
structuration du ou des premiers facteurs.
Dans un deuxime temps, on rintgre ces variables dans le tableau principal mais on dclare
cette fois les individus statistiques qui contribuent de manire excessive la structuration du
voire des premiers facteurs comme individus supplmentaires. A la fin de cette deuxime tape,
on est en mesure de dire si cette opration a modifi les principaux rsultats de lACP norme.
Enfin, dans un troisime et dernier temps, on dclare la fois les variables et les individus
statistiques qui contribuent de manire excessive la structuration du voire des premiers
facteurs comme lments supplmentaires. Assez souvent, les rsultats des nouvelles ACP
normes changent peu par rapport ceux de lACP initiale : il sagit donc le plus souvent de
vrifications.
Dans le cas dune nouvelle ACP norme dans laquelle des variables supplmentaires sont
dclares, ces 2 variables sont regroupes la fin du tableau de donnes et correspondent aux
dernires colonnes. Dans les tableaux de rsultats dtaills de la nouvelle ACP norme, ces
variables apparatront toujours en fin de tableau : elles occuperont les dernires lignes et seront
spares des autres variables par un trait.
D Do oc cu um me en nt t n n 4 4 : : R Re ec co ou ur rs s d d a au ut tr re es s m m t th ho od de es s d d A An na al ly ys se e d de e D Do on nn n e es s
N No ot ti io on ns s c cl l s s : : s st tr ru uc ct tu ur re es s, , o or rd dr re es s d de e g gr ra an nd de eu ur r, , a an na al ly ys se es s f fa ac ct to or ri ie el ll le es s, , m m t th ho od de es s d de e
c cl la as ss si if fi ic ca at ti io on n
LACP norme est effectue partir des valeurs du tableau lmentaire de donnes qui ont t
pralablement centres et rduites. On privilgie donc la structure de linformation et on perd
les ordres de grandeur des phnomnes.
On peut dcider de vouloir garder ces ordres de grandeur : on a alors recours aux Analyse
Principales ou/et aux Analyses Factorielles. Attention toutefois : quand les carts sont trop
grands dans les ordres de grandeur des diffrentes variables, le premier facteur ne rendra
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
25
compte que des effets de masse autrement dit des poids en prsence. Ce sont les facteurs
suivants qui sont intressants analyser et rvler des combinaisons de variables diffrentes
de celles mises en vidence par lACP norme.
Plus gnralement, les analyses factorielles et particulirement les Analyses Factorielles des
Correspondances (AFC) permettent de traiter les variables quantitatives soit de taux soit de
stock. Dans ce dernier cas, on utilise la mtrique du Chi-2 ou et non la mtrique euclidienne
pour mesurer les distances entre individus et entre variables. La mtrique du prsente
lavantage deffectuer une pondration inverse . Autrement dit les individus qui sont
caractriss par les valeurs les plus faibles auront un poids plus important que ce quils
reprsentent. A linverse, les individus qui sont caractriss par les valeurs les plus fortes auront
un poids plus faible que ce quils reprsentent.
Les AFC permettent galement de traiter des variables qualitatives. Dans ce dernier cas,
chaque modalit dune variable qualitative correspond une variable qui ne peut prendre que 2
modalits : prsence/absence qui peut tre code en 1/0. Un tel tableau qui dcrit des individus
statistiques en fonction de modalits codes en 0 (absence) ou 1 (prsence) est appel tableau
disjonctif complet.
Les Analyses Factorielles privilgient lentre par les variables. Dans le cas de lexemple des
diffrenciations entre pays africains, chacun des 3 premiers facteurs ne souligne pas toujours un
fait structurant de lespace tudi.
En complment de ces premires analyses, on peut dcider de privilgier une entre par
les individus statistiques ou units spatiales. Le type de questionnement est certes diffrents
mais surtout complmentaire. Au lieu de tenter de rpondre la question comment se
regroupent ou/et sopposent les principaux phnomnes ? , les questions deviennent : est ce
que les units spatiales se regroupent ? Si oui, selon quelles modalits ? Pour les
gographes, cette question est dautant plus intressante quelle renvoie ltude et lanalyse
des relations qui peuvent exister entre les rsultats dune classification et les diffrentes
mthodes de rgionalisation. La cartographie des rsultats dune classification permet de voir si
les units spatiales qui se ressemblent et appartiennent une mme classe sont proches les unes
des autres et constituent ainsi un grand ensemble rgional.

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
26
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
27

A AP PP PL LI IC CA AT TI IO ON N N N 1 1
F Fa am mi il li ia ar ri is sa at ti io on n a av ve ec c l le es s r r s su ul lt ta at ts s d d u un ne e A An na al ly ys se e e en n C Co om mp po os sa an nt te es s P Pr ri in nc ci ip pa al le es s
n no or rm m e e ( (A AC CP P) )
L Le es s d di if ff f r re en nc ci ia at ti io on ns s d d m mo og gr ra ap ph hi iq qu ue es s e et t c co on no om mi iq qu ue es s d de es s t ta at ts s d du u M Mo on nd de e
____________________________________________________________
D Do oc cu um me en nt ts s j jo oi in nt ts s : :
Description du tableau lmentaire caractrisant les tats du Monde
Tableaux lmentaire caractrisant les tats du Monde (monde1999_data.xls)
Fond de carte (cartemonde1999.ai)
____________________________________________________________
On analyse la situation sociale et conomique des diffrents pays du monde en 1995-1999, les
diffrenciations et les associations caractristiques. Pour ce faire, on dispose de donnes
collectes par lINED et concernant les caractristiques dmographiques et conomiques des
pays du monde entre 1995 et 1999.

I- ANALYSES STATISTIQUES UNIVARIE ET BIVARIEE

A partir des tableaux rsumant le tableau lmentaire de donnes caractrisant les tats du
Monde
1. Vous indiquerez les variables qui introduisent le plus de diffrenciations entre les tats,
et celles qui en introduisent le moins. Vous justifierez votre rponse.
2. Vous mettrez en vidence les principales associations et oppositions entre les variables.
Vous conclurez en mettant des hypothses sur lorganisation de linformation lors de la
ralisation dune Analyse en Composantes Principales norme (ACP).
3. Vous indiquerez enfin si certains caractres sont redondants ou non avec dautres. Si tel
est le cas, vous prciserez le ou les caractres et justifierez votre rponse.
4. Vous mettrez des hypothses sur les consquences que lexistence dventuelles
variables redondantes peuvent avoir dans la ralisation dune ACP norme.

II- ANALYSE EN COMPOSANTES PRINCIPALES NORMEES

A partir des tableaux et des graphiques regroupant les principaux rsultats dune ACP sur
lensemble des pays du Monde, vous tenterez de rpondre la question suivante : que vous
apprend lensemble de ces rsultats sur la situation des pays du monde en 1995-1999 ?

1. Vous justifierez du nombre de facteurs retenus, en ayant soin de justifier compltement
votre rponse.
2. Vous dfinirez ce que lon entend par coordonnes, qualit de reprsentation et
contribution des variables pour chacun des facteurs. Vous conclurez sur la pertinence de
lACP mene en fonction de ces 3 rsultats.
3. Vous tenterez de comprendre pourquoi lindice de dveloppement humain de 1995
(IDH95) possde une coordonne sur chacun des facteurs, a une qualit de
reprsentation mais na pas de contribution.
4. Vous construirez et caractriserez les axes factoriels retenus, en leur donnant un titre.
5. Vous prciserez enfin ce que vous apprend lanalyse du premier plan factoriel quant au
positionnement des pays de cette tude. Vous indiquerez en particulier o se projette
lIDH95 par rapport aux autres variables.
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
28

III- CARTOGRAPHIE DES RESULTATS DUNE ANALYSE EN COMPOSANTES
PRINCIPALES NORMEES

A partir des rsultats de lACP mene sur les tats du monde, vous raliserez au moins 1
reprsentation cartographique de ces rsultats, en accordant un soin particulier aux variables
visuelles, la prsentation de la lgende et plus gnralement lhabillage de votre document.

Cette carte est raliser laide du logiciel Philcarto.
Attention la correspondance entre les codes des individus dans le fichier fond de carte et
le fichier Excel de donnes

1. Vous mettrez en page votre carte laide du logiciel Adobe Illustrator en accordant un
soin particulier lhabillage.
2. Pour comparaison, vous raliserez une carte de lIndice de Dveloppement Humain
(IDH95) dans les pays du Monde.
Vous ferez un commentaire gographique prcis et concis dans lequel vous apporterez des
rponses aux questions suivantes :
1. Quelle(s) est(sont) la(les) configuration(s) territoriale(s) mise(s) en vidence par les
rsultats de lACP ?
2. Quelle(s) est(sont) la(les) ressemblance(s) et la(les) diffrence(s) entre la
reprsentation cartographique des rsultats de lACP et celle de lIDH ?
3. Quelle(s) est(sont) la(les) hypothse(s) explicative(s) que vous avanceriez ?

A partir des rsultats et des commentaires de lensemble de cette tude, que proposez-
vous comme prolongements possibles thmatiques et/ou mthodologiques ?

Tableau 1 : Description du contenu du tableau concernant les tats du Monde
Code de la
variable
Description de la variable
id
Identificateur du pays 3 chiffres, le premier chiffre gauche correspondant au continent ou sous-
continent : 1 pour lAmrique, 2 pour lAfrique, 3 pour lEurope, 4 pour lAsie, 5 pour les anciennes
rpubliques sovitiques et 6 pour lOcanie
nom nom du pays
DEN99 densit de population (habitants/km) en 1999
URB00 part de la population urbaine dans la population totale (%) en 2000
AGR00 part des agriculteurs dans la population active (%) en 2000
JEU99 part des moins de 15 ans dans la population totale (%) en 1999
VIE99 part des plus de 60 ans dans la population totale (%) en 1999
TMI99 taux de mortalit infantile (pour 1000 naissances) en 1999
EVH99 esprance de vie des hommes (ans) en 1999
EVF99 esprance de vie des femmes (ans) en 1999
PNB97 produit national humain en 1997
PIB99 produit intrieur humain en 1997
ALP95 taux d'alphabtisation en 1995
SCO95 taux de scolarisation en 1995
ISF99 indice synthtique de fcondit (nombre d'enfants par femme en ge de procrer) en 1999
IDH95 indice de dveloppement humain en 1995
Source : INED 1999, 2000


Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
29

A AP PP PL LI IC CA AT TI IO ON N N N 2 2
F Fa am mi il li ia ar ri is sa at ti io on n a av ve ec c l le es s p pr ro oc c d du ur re es s d d A An na al ly ys se e e en n C Co om mp po os sa an nt te es s P Pr ri in nc ci ip pa al le es s
( (A AC CP P) ) s so ou us s P Ph hi il lc ca ar rt to o
P Po op pu ul la at ti io on ns s e et t l lo og ge em me en nt ts s d da an ns s l le es s q qu ua ar rt ti ie er rs s d de e Y Ya ao ou un nd d
____________________________________________________________
Documents joints :
Description du tableau lmentaire caractrisant les quartiers de Yaound
Tableau caractrisant les quartiers de Yaound (ecourb51.xls ; ecourb168.xls)
Carte de localisation des quartiers de Yaound
Fonds de carte de Yaound par quartiers (yaounde.ai)
________________________________________________________________________
On tudie les caractristiques de la rpartition des diffrents groupes de populations dans la
ville de Yaound, capitale du Cameroun. Pour ce faire, on dispose dun tableau qui pour chacun des
51 quartiers de Yaound indique la rpartition des populations par tranche dge, par origine
gographique. On tente de mettre jour quelques grands types dorganisation des populations
dans la ville. On tente de savoir dans quelle(s) mesure(s) les grands faits de rpartition des
populations et des logements dans cette ville africaine prsentent des similitudes avec des
modles urbains du type de ceux de lEcole de Chicago.

I- ANALYSE EN COMPOSANTES PRINCIPALES NORMEES ET CARTOGRAPHIE

A partir du tableau lmentaire de donnes, vous mnerez une tude statistique, danalyse de
donnes et cartographique complte sous Philcarto.

Vous indiquerez, en ayant soin de bien justifier votre rponse, si lACP, mene sur un
ensemble de caractres que vous aurez slectionns, fournit un rsum efficace de
linformation initiale.
Vous mettrez en vidence les principales oppositions entre quartiers de la ville.
Vous raliserez au moins une carte sous Philcarto des rsultats de lACP norme qui rend
compte des oppositions majeures.
Vous ferez un commentaire gographique prcis dans lequel vous apporterez des
rponses aux questions suivantes :
Quelle(s) est(sont) la(les) configuration(s) territoriale(s) mise(s) en vidence par
cette analyse ?
Quel(s) modle(s) graphique(s) de lorganisation de lespace Yaound pouvez-vous
proposer ?
Quelle(s) est(sont) la(les) hypothse(s) explicative(s) que vous avanceriez ?
Quelle(s) est(sont) vos principales conclusion(s) sur cette tude ?

On dispose des mmes renseignements que ceux caractrisant les 51 quartiers de Yaound mais
cette fois au niveau des 168 chefferies. En vous appuyant sur les rsultats obtenus pour les 51
quartiers, vous formulerez des hypothses de travail pour cette nouvelle tude et mentionnerez
les prcautions quil faudra prendre.

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006
30
Tableau 1 : Description du contenu du tableau concernant les quartiers de Yaound

CODE Nom des variables
POP Population totale (en habitants)
AGE1 Personnes ges de 0 14 ans (% population totale)
AGE2 Personnes ges de 15 30 ans (% population totale)
AGE3 Personnes ges de 30 50 ans (% population totale)
AGE4 Personnes ges de plus de 50 ans (% population totale)
FEC Indice conjoncturel de fcondit (nombre d'enfants par femme)
HOM Sex-ratio (nombre d'hommes pour 100 femmes)
DEN Densit de population (hab./ha)
MEN Taille moyenne des mnages (personnes/mnage)
RES1 Habitat en maison individuelle (% des mnages)
RES2 Habitat dans des maisons plusieurs logements (% mnages)
RES3 Habitat dans des immeubles d'appartement (% des mnages)
RES4 Habitat dans des villas modernes (% des mnages)
ACT1 Travailleurs indpendants (% de la pop. Active)
ACT2 Travailleurs salaris (% population active)
ORI1 Natifs de la province du Centre (% population totale)
ORI2 Natifs de la province de l'Ouest (% population totale)
ORI3 Natifs de la province du Sud (% population totale)
ORI4 Natifs de la province du Littoral (% population totale)
ORI5 Natifs des trois provinces du nord (% population totale)
ORI6 Natifs des deux provinces anglophones (% population totale)
ORI7 Natifs trangers (% population totale)
Source : RGP 1987
Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale, Yaound, aot 2006



Localisation des quartiers de Yaound


in BOPDA A., 2003, Yaound et le dfi camerounais de lintgration, Paris, CNRS, collection Espaces et
Milieux, 422 p.

Convention Universits Paris 7 Denis Diderot Yaound 1, Ecole dEt Statistiques, Cartographies et
Analyse spatiale , Yaound, aot 2006

32

S-ar putea să vă placă și