Documente Academic
Documente Profesional
Documente Cultură
N 54 1999
Analyse factorielle
dynamique : test du nombre
de facteurs, estimation et
application lenqute de
conjoncture dans lindustrie
Catherine DOZ, Fabrice LENGLART*
92
2 Utilisation de l'analyse factorielle
statique dans un cadre dynamique
2.1. Prsentation
L'analyse factorielle classique a pour but d'offrir une description parci-
monieuse d'un ensemble d'observations. Elle tente de reprsenter les variables
tudies dans un cadre linaire, en fonction d'un ensemble de variables
latentes, appeles facteurs, ou facteurs communs. C'est une technique qui est
approprie lorsqu'un petit nombre de facteurs peut rendre compte d'une part
importante de l'information contenue dans l'ensemble des variables initiales.
Cette mthode a t initialement cre pour l'tude de donnes indivi-
duelles. Elle repose sur la modlisation suivante : on note n le nombre de
variables tudies, T le nombre d'observations dont on dispose pour chaque
variable, et yit la valeur de la t-ime observation de la variable yi ; le modle
dcrivant les variables y1 ,. . . ,yn en fonction de p facteurs communs
F1 ,. . . ,Fp , p < n, s'crit :
yit = m i + i1 F1t + + i p Fpt + u i t , pour i = 1 n et pour tout t
On suppose que les (u it )tT sont indpendants entre eux et indpendants
des facteurs :
i =
/ j (t, ) E(u it u j ) = 0 et (i, j ) (t, ) E(u i t Fj ) = 0
Comme le modle est destin l'tude de donnes individuelles, on suppose
en outre que :
i t =/ E(u i t u i ) = 0 et E(Fi t Fi ) = 0
Un tel modle n'est donc applicable l'tude de donnes temporelles (yi t )
que dans le cas trs restrictif o tous les processus (Fj t ) et (u i t ) sont
supposs sans autocorrlation (c'est--dire sont des bruits blancs au sens
faible).
En utilisant des notations matricielles :
yt = (y1t ,. . . ,ynt )0 ,Ft = (F1t ,. . . ,Fpt )0 ,
u t = (u 1t ,. . . ,u nt )0 ,3 = (i j ) 16i 6n
16 j 6 p
le modle s'crit de faon plus concise :
yt = m + 3Ft + u t
avec : E Ft = 0,Eu t = 0,E(u t u 0t ) = D = diag(d1 ,. . . ,dn ) ,
(t, ) E(Ft u 0 ) = 0,
/ ,E(Ft F0 ) = 0,
(t, ),t =
/ ,E(u t u 0 ) = 0 ,
(t, ),t =
Un tel modle n'a d'intrt que lorsque les variables prsentent une forte
corrlation car il permet dans ce cas d'analyser la structure de cette corrla-
94
tions entre variables, mais les lments diagonaux (qui correspondent aux h i2)
sont fixs, en premire approximation, aux valeurs des corrlations cano-
niques de chaque variable avec l'ensemble des autres. On est alors conduit
calculer les valeurs propres de cette matrice, et le nombre de facteurs retenir
est choisi en fonction de la taille de ces valeurs propres. Dans une deuxime
tape, il est possible de mettre en uvre la mthode de maximum de vraisem-
blance. En outre, un test du rapport de vraisemblance permet, dans ce cadre
statique, de contrler que le nombre de facteurs retenu est correct.
Signalons enfin que, dans les deux mthodes, les paramtres i j sont
estims en premier, et que les valeurs prises par les facteurs communs Fj t (les
scores) sont approxims dans un second temps comme des combinaisons
linaires des variables initiales ceci est fait par le biais de techniques de
rgression visant minimiser la variance de l'cart entre chaque facteur et son
approximation linaire.
2. Bien sr, cette procdure peut tre utilise pour mener des tests de faon squentielle avec diff-
rentes valeurs de p. Le modle est d'autant plus contraint que la valeur de p retenue est petite.
P
3. On rappelle que pour toute matrice symtrique ,
P
vech = (i j , 1 6 j 6 i 6 n) = (11 ,21 ,. . . ,n1 ,22 ,32 ,. . . ,n2 ,. . . nn )0
96
calcul de la loi asymptotique, sous l'hypothse nulle, du vecteur du score
h
associ la pseudo-vraisemblance. Elle suppose que la matrice est de
0
plein rang colonne. Cependant, dans le cas que nous tudions, cette dernire
hypothse n'est pas toujours vrifie, comme nous le verrons plus loin. De
sorte que nous serons amens tendre les rsultats de GOURIROUX et
h
MONFORT au cas o la matrice n'est pas de plein rang colonne (proposi-
0
tion 4).
Le calcul de la loi asymptotique du vecteur du pseudo-score sous l'hypo-
thse nulle reposant sur le calcul pralable de la loi asymptotique sous
l'hypothse alternative, nous commenons donc par calculer ce vecteur et
cette loi asymptotique (proposition 3).
Dans la suite de ce paragraphe, nous utilisons des notations introduites par
MAGNUS et NEUDECKER afin de simplifier les formules de calcul diffrentiel
lorsqu'il est appliqu dans un cadre matriciel (voir par exemple MAGNUS et
NEUDECKER [1988]). Ces notations sont les suivantes :
Dnest la matrice de duplication d'ordre n, c'est--dire la matrice de
n(n + 1)
format n 2 , qui vrifie :
2
pour toute matrice M symtrique d'ordre n,vecM = Dn vechM.
Dn+ = (Dn0 Dn )1 Dn0 est la pseudo-inverse de Dn. En particulier, pour
toute matrice M symtrique d'ordre n,vechM = Dn+ vecM.
K nn est la matrice de commutation, c'est--dire la matrice de format
(n 2 , n 2 ) qui vrifie :
pour toute matrice M carre d'ordre n,vecM 0 = K nn vecM.
Nous utiliserons en outre diverses proprits de ces matrices4 (voir par
exemple LTKEPOHL [1993] pour un rappel de l'ensemble de leurs proprits).
Considrons maintenant la pseudo-vraisemblance du modle non contraint :
X
1 1 1
L T (x,6) = ln det6 tr 6 1 xt xt0 .
2 2 T t
LT LT
Comme (x,6) = Dn0 (x,6) et comme Dn0 K nn = Dn0 , on en
vech6 vec6
dduit :
LT 1 0 1 1 1X 0
(x,6) = Dn 6 6 vec 6 xt xt
vech6 2 T t
L'estimateur du pseudo-maximum de vraisemblance du modle non
X
b= 1
contraint est donc l'estimateur usuel 6 x t x t0, c'est--dire la matrice
T t
de variance-covariance empirique des donnes, que nous avons aussi note S.
Cet estimateur est convergent puisque, par hypothse, le vecteur x des
variables observes est stationnaire. De plus, on a vu dans la section prc-
dente que l'estimateur obtenu en maximisant la pseudo-vraisemblance du
modle contraint est lui aussi convergent.
98
LT 1X 0
ii) (x,6) = J 0 vech 6 x x
t t
vech6 T t
1X L 0
iii) T vech 6 xt xt N 0,2Dn+ 0 Dn+
0
T t
LT L 0
iv) T (x,6) N 0,2J0 Dn+ 0 Dn+ J0
vech(6)
L
Elle vrifie : S 2 (r )
H0
1
avec r = ((n p)2 (n + p)).
2
ii) Elle est identique la statistique du test de HAUSMAN-WALD de H0.
5. Cette condition est la suivante : on dfinit 8 = D 3(30 D 1 3)1 30 = i j , et on suppose
que la matrice de terme gnral i j est inversible.
2
100
Preuve : voir annexe 6.
On peut remarquer que le nombre de degrs de libert de la loi de chi-deux
obtenue comme loi limite est bien gal au nombre de contraintes testes. En
effet, le modle contraint contient np + n paramtres, mais la matrice 3 n'est
dfinie qu' une rotation prs. De fait, (cf. LAWLEY-MAXWELL [1971]) la
pseudo-vraisemblance est maximise sous une contrainte identifiante, savoir
0 p( p 1)
la contrainte que la matrice 3 D 1 3 soit diagonale. Ceci impose
2
conditions d'orthogonalit sur les colonnes de 3. Le nombre de paramtres
p( p 1)
libres du modle contraint est donc ( p + 1)n , si bien que le
2
nombre de contraintes testes est :
n(n + 1) p( p 1) 1
( p + 1)n = ((n p)2 (n + p)) = r .
2 2 2
Pour conclure cette partie, il importe de noter que la procdure de
maximum de vraisemblance ainsi utilise sans tenir compte de l'autocorrla-
tion des variables fournit des estimateurs asymptotiquement normaux mais
non asymptotiquement efficaces. On pourrait amliorer cet estimateur en
changeant la fonction objectif6, mais ceci ne permettrait plus d'utiliser la
procdure standard de l'analyse factorielle. La procdure de test que nous
venons de prsenter a l'avantage d'tre trs simple utiliser. Mais elle ne peut
tre conue que comme une tape prliminaire visant dterminer le nombre
de facteurs pertinent. Dans une deuxime tape, nous serons donc amens
tenir compte explicitement de la dynamique des variables traites, de faon
obtenir des estimateurs asymptotiquement efficaces. Nous procderons alors
une estimation par filtre de KALMAN, fonde sur une criture tat-mesure du
modle. Comme nous l'avons signal en introduction, cette mthode est en
effet employe pour l'estimation des modles facteurs dynamiques, lorsque
le nombre de facteurs est fix (voir par exemple STOCK et WATSON [1989,
1993]).
6. CRAGG et DONALD [1995] ont par exemple trait de cette faon le cas de l'htroscdasticit des
composantes spcifiques.
GRAPHIQUE 1
Soldes dopinions de lenqute mensuelle.
7. Cependant, deux soldes d'opinion (OSCD et OSSK) prsentent une saisonnalit trop instable pour
tre corrige. Ces soldes, publis comme CVS par l'INSEE, sont donc en fait gaux leurs valeurs
brutes.
102
Chaque solde d'opinion prsente une dynamique cyclique trs
prononce, en ce sens qu'il peut tre considr comme stationnaire, mais qu'il
prsente une structure d'autocorrlation assurant une persistance ses varia-
tions. En effet, les autocorrlogrammes empiriques montrent que les
autocorrlations sont significativement positives jusqu' l'ordre 8.
Nanmoins, ces sries n'en sont pas pour autant intgres. En effet, le test
de DICKEY-FULLER augment refuse l'hypothse nulle de la prsence d'une
racine unit et, l'inverse, le test KPSS (KWIATKOWSKI et alii [1992]) conduit
accepter chaque fois l'hypothse nulle que les soldes sont des variables
stationnaires (pour le dtail des rsultats des tests, voir annexe 7).
Ainsi, alors qu'un test men sans tenir compte de l'autocorrlation des
sries (nombre de retard fix zro), conduit rejeter l'hypothse d'un
unique facteur8, cette hypothse est au contraire accepte pour un seuil de
5 % lorsque l'on modifie le test pour tenir compte du cadre dynamique du
modle. En dfinitive, il apparat licite de chercher construire un indicateur
rsumant l'information commune apporte par les six principaux soldes
de l'enqute d'activit.
On peut noter que ce facteur commun suffit rendre compte de 82 % de la
variance totale des sries tudies. Plus prcisment, les pondrations et les
communalits sont :
8. C'est aussi le rsultat que fournit le test du rapport de vraisemblance calcul par le programme
standard de SAS dans le cas sans autocorrlation.
dans laquelle les processus (et ) et (t ) sont non autocorrls, non corrls
entre eux, et vrifient :
Eet = 0, V et = Ht , Et = 0, V t = Q t .
Dans un tel cadre, le vecteur t, qui est appel le vecteur d'tat, est inobser-
vable. L'quation (M) est appele quation de mesure : elle donne la relation,
chaque date t, entre le vecteur yt des variables observes et le vecteur d'tat.
L'quation (T ), ou quation de transition, dcrit la dynamique du vecteur
d'tat.
Les matrices Z t , At ,dt ,ct ,Rt ,Ht et Q t sont non stochastiques, mais elles
peuvent dpendre du temps de faon dterministe. Elles peuvent aussi
dpendre des paramtres du modle.
Dans le cas qui nous concerne, on peut rcrire le modle sous une forme
tat-mesure en posant le vecteur d'tat t = (Ft ,Ft1 ,t ,u 1t ,. . . ,u nt )0 :
Ft
Ft1
1 0 0
. . . t
yt = .. .. .. In
u 1t
n 0 0 .
..
u nt
104
1 2
Ft 1 0 0 0 Ft1
Ft1 Ft2
0 0 0
t t1
u 1t = 1 u 1t1
. .
.. .. ..
0 .
u nt u nt1
n
1
0 0
1 t
1t
+ ..
0
.
.
. nt
. In
0
Un tel modle peut tre estim de diverses faons. Dans ce papier, nous
utilisons une procdure du maximum de vraisemblance par filtre de KALMAN.
Rappelons brivement les aspects principaux de cette mthode - une prsenta-
tion complte figure, par exemple, dans HARVEY [1989] ou GOURIROUX et
MONFORT [1989b]. Pour tout ensemble fix de valeurs des paramtres, le filtre
de KALMAN en tant que tel consiste dterminer la meilleure prvision du
vecteur d'tat chaque date, compte tenu de l'information disponible cette
date. Pour tout t, les prvisions optimales : at|t1 = E(t | It1 ) et
at = E(t | It ), sont ainsi calcules par une procdure itrative.
Sous hypothse de normalit des perturbations, il est alors possible de
calculer explicitement la vraisemblance du modle en fonction de ces prvi-
sions optimales du vecteur d'tat et des matrices de variance-covariance des
erreurs de prvision associes. La vraisemblance peut ainsi tre obtenue en
tout point de l'espace des paramtres, et maximise l'aide d'une procdure
quelconque d'optimisation, de faon obtenir les estimateurs du maximum de
vraisemblance des paramtres. Sous des hypothses standard, ces estimateurs
sont asymptotiquement normaux.
Lorqu'on estime le modle facteur dynamique prsent prcdemment, les
rsultats sont les suivants.
Les estimations obtenues pour les paramtres du facteur commun condui-
sent l'quation :
Ft = 1,83 Ft1 0,85 Ft2 + t 0,48 t1
(0,05) (0,05) (0,11)
Question i i i
estimation cart-type estimation cart-type estimation cart-type
TPPA 2,76 0,24 0,33 0,04 2,55 0,15
TPPRE 1,96 0,21 0,81 0,03 3,23 0,15
OSCD 3,17 0,30 0,88 0,03 2,55 0,19
OSCDE 3,25 0,36 0,87 0,03 3,94 0,20
OSSK 1,61 0,18 0,82 0,04 2,83 0,14
PGP 3,69 0,55 0,89 0,03 5,95 0,25
Si l'on tient compte du fait que, dans le cas prsent, les soldes et le facteur
commun obtenu ne sont pas normaliss, les pondrations obtenues sont
compatibles avec celles que fournissait l'analyse factorielle statique10.
Comme nous travaillons dans un cadre stationnaire, les statistiques usuelles
peuvent tre utilises. Cependant, le problme de la significativit des para-
mtres d'cart-type est un peu plus complexe puisque la valeur zro est sur la
frontire de l'espace admissible des paramtres. Dans ce cas, le carr de la
1 1
statistique de STUDENT suit un mlange de lois : 02 + 12 11. L'tude des
2 2
rsultats conduit, ici encore, conclure que ces paramtres sont tous trs
significatifs. En particulier, les composantes spcifiques de chaque solde ne
peuvent tre assimiles de simples bruits blancs (le coefficient autorgressif
d'ordre 1 est significativement diffrent de zro), ce qui laisse penser que la
rponse chaque question de l'enqute contient bien une information suppl-
mentaire par rapport aux autres et par rapport aux enseignements qu'on peut
tirer du facteur commun.
Il convient galement, pour juger de la qualit de l'estimation, de savoir si
les diffrentes innovations obtenues peuvent tre assimiles des bruits
blancs. On a donc procd une analyse des autocorrlogrammes direct,
inverse et partiel de ces innovations et on a calcul des tests du portmanteau
9. Par exemple, WATSON [1986] estime la composante cyclique du PIB amricain sous une forme
AR(2) dans le cadre d'un modle composantes inobservables et il obtient :
Ct = 1,50Ct1 0,58Ct2 + u t. Ici aussi, 1 + 2 # 1, ce qui signifie que les racines du poly-
nome retard sont en module proches de l'unit. WATSON relve ce fait, mais ne teste par l'hypo-
thse de non stationnarit.
10. Plus prcisment, si l'on multiplie les pondrations normalises obtenues par analyse factorielle
statique par les cart-types des soldes correspondants et si l'on les divise par l'cart-type du fac-
teur commun estim par filtre de KALMAN (ce afin de rendre les rsultats comparables entre les
deux mthodes), on obtient :
TPPA : 2,74 ; TPPRE : 1,96; OSCD : 3,33 ; OSCDE : 3,20 ; OSSK : -1,66 ; PGP : 4,08.
11. Voir par exemple HARVEY (1989) : un test de niveau 5 % est obtenu en comparant le STUDENT 1,6.
106
(bien qu'ils ne soient pas directement adapts au cadre des modles compo-
santes inobservables). Ces derniers conduisent accepter au seuil de 5 %
l'hypothse que les innovations du facteur commun et des composantes spci-
fiques sont des bruits blancs, pour toutes les sries sauf pour celle qui
correspond au solde portant sur la demande et les carnets globaux (OSCD).
L'examen de l'autocorrlogramme de l'innovation correspondante permet en
effet de constater l'existence d'une autocorrlation significativement diffrente
de zro l'ordre 12 (de l'ordre de 0,20). Ce phnomne est sans doute attri-
buable au fait que le solde correspondant n'est pas corrig des variations
saisonnires lorsqu'il est publi par l'INSEE (pour des raisons de mauvaise
stabilit des coefficients saisonniers ventuels). En dfinitive, on est conduit
juger que l'estimation obtenue est globalement satisfaisante.
On peut enfin noter que le facteur commun tir du filtre de KALMAN est
extrmement proche de celui obtenu par analyse factorielle statique (cf.
graphique 2). Ce rsultat est surprenant a priori puisque cette dernire tech-
nique ne tient aucun compte de la dynamique des sries utilises. Il semble
suggrer que l'analyse factorielle classique fournit des rsultats qui demeu-
rent, en pratique, utilisables dans le domaine temporel lorsque les donnes
observes prsentent une trs forte corrlation instantane.
GRAPHIQUE 2
Comparaison des facteurs communs obtenus par les deux mthodes.
108
turel tudi. Cette prcaution prise, on peut maintenant tenter, la lumire des
rponses aux questions de l'enqute mensuelle, de dcrire plus prcisment
les fluctuations conjoncturelles que l'industrie franaise a traverses.
La rponse relative au niveau de la production passe (cf. graphique 4) est
extrmement proche du climat gnral, si bien qu'elle constitue elle seule
une bonne approximation de l'information commune sous-jacente aux six
questions de l'enqute, condition de la lisser quelque peu. Cet avantage a
pour contrepartie vidente le fait que l'information spcifique apporte par
l'opinion sur l'activit passe, anime de mouvements de faible amplitude,
gnralement irrguliers et contradictoires, ne semble pas interprtable.
GRAPHIQUE 4
Tendance de la production passe.
GRAPHIQUE 5
Tendance de la production prvue.
GRAPHIQUE 6
Carnet de commande globaux.
110
GRAPHIQUE 7
Carnets de commande trangers.
mi 1996. Toutefois, l'chelle des vingt dernires annes, on peut noter que
les volutions du solde d'opinion sur la demande trangre semblent se
rapprocher de celles suivies par le climat gnral. Ce fait peut sans doute s'in-
terprter comme un signe tangible de l'ouverture progressive de l'conomie
franaise, et plus spcifiquement du secteur industriel, vers l'extrieur, si bien
que les fluctuations conjoncturelles majeures suivies par le pays apparaissent
de plus en plus relies celles que connaissent ses principaux partenaires.
Un intrt de la dcomposition en informations commune et spcifique du
solde d'opinion relatif au niveau des stocks (cf. graphique 8) pourrait tre de
proposer une lecture plus prcise de la rponse cette question qui est, en
effet, toujours difficile analyser. On demande aux industriels s'ils jugent le
niveau de leurs stocks suprieur, infrieur ou conforme la normale. La diffi-
cult porte donc sur l'interprtation donner ce terme : la normale
dsigne-t-elle un niveau moyen de stocks, constant au cours du temps, ou
bien un niveau de stocks variable, dpendant de la conjoncture du moment ?
Dans le schma prsent ici, les mouvements dus aux fluctuations du climat
gnral traduiraient le comportement de stockage li au cycle conjoncturel
proprement dit : en phase ascendante, pour des raisons tenant la fois une
GRAPHIQUE 8
Opinion sur les stocks.
GRAPHIQUE 9
Perspectives gnrales de production.
4 Conclusion
112
asymptotiquement efficaces en prsence d'autocorrlation, et doivent donc
tre considrs comme des estimateurs prliminaires.
Dans ce papier, aprs avoir fix le nombre de facteurs retenir l'aide du
test propos, nous avons choisi de modliser la dynamique des diverses
composantes du modle, et d'utiliser ensuite le filtre de KALMAN pour obtenir
dans une deuxime tape des estimateurs asymptotiquement efficaces. Il se
trouve que, sur les donnes que nous avons tudies ici, les rsultats obtenus
sont quasiment identiques ceux de la premire tape. Il serait videmment
intressant, dans des travaux ultrieurs portant sur d'autres donnes, de
comparer les rsultats obtenus en utilisant les deux dmarches.
Pour ce qui concerne la prsente tude, nous avons mis en vidence qu'un
modle avec un seul facteur commun peut dcrire de faon satisfaisante les
soldes d'opinion de l'enqute mensuelle d'activit dans l'industrie : ceci
permet de justifier l'utilisation de ce facteur comme un indicateur rsum,
sorte de climat gnral. De plus, dans ce cadre, l'apport supplmentaire des
diffrentes questions peut tre analys travers l'volution des composantes
spcifiques. En dfinitive, on peut esprer qu'un tel outil constitue une aide
dans le travail d'interprtation dlicat que doivent mener les conjoncturistes.
Preuve de la proposition 1
Dans ce paragraphe, on note : kMk = max | m i j | pour toute matrice M.
i, j
La matrice de variance-covariance
0
du processus s'crit 6 = 330 + D. On
dfinit : Q T (x, ) = L T (x,33 + D).
La preuve s'articule en quatre tapes.
Etape 1 : k6k + H Q T (x, )
On montre tout d'abord que : k6k + H det 6 +.
En effet, comme on a suppos que di = / 0, pour i = 1,. . . ,n, la matrice D
est dfinie positive. Comme, en outre, 6 > D,6 est aussi dfinie positive.
Pour montrer que det 6 +, il suffit donc de montrer que l'une au moins
des valeurs propres de 6 tend vers +.
y0 M 0 M y
Or, on sait que : kMk22 = max dfinit une autre norme sur l'es-
y=/ 0 y0 y
pace des matrices, et que, si l'on dsigne par li ,i = 1,. . . ,n les valeurs
propres de la matrice symtrique dfinie positive 6, cette norme vrifie :
k6k2 = max li. Par quivalence des normes sur l'espace des matrices, on
i
obtient ainsi le rsultat.
Montrons maintenant que tr6 1 S reste born. Tout d'abord, il est clair que :
| tr6 1 S |6 n 2
6 1
kSk.
Si l'on note : d = min di, comme 6 > D > 0, on sait que les valeurs
i
propres de 6 sont toutes suprieures d. D'aprs le rsultat prcdemment
cit sur l'quivalence des normes de matrices, il existe donc un rel k tel que :
1
k
6
6 . Comme on a, de plus, suppos qu'il existe un rel > 0, tel
d
kn 2
que : 2,i = 1,...n di > , on obtient : | tr6 1 S |6 kSk.
Comme le processus (x t ) est stationnaire, kSk est p.s. borne quand T varie
et on obtient le rsultat.
L'tape 1 dcoule du fait que k6k + H det 6 + et que
tr6 1 S reste born. Il en rsulte que, lorsqu'on cherche maximiser
Q T (x, ) sur une rgion de la forme R np [,+[n, on peut se restreindre
au cas o varie dans un compact inclus dans R np [,+[n.
Dans toute la suite, on suppose donc que appartient un compact 2
contenant 0 et inclus dans une rgion de la forme R np [,+[n, o est
un rel strictement positif fix.
Etape 2 : Q T (x, ) converge en probabilit, uniformment pour 2,
vers Q 0 ( )
114
1 1
Posons : Q 0 () = ln(det 6) tr(6 1 60 )
2 2
On a :
X
1 1
2 | Q T (x,) Q 0 () | = |tr6 xt xt tr6 1 60 |
0
T t
X
1 1 0
=| tr6 xt xt 60 |
T t
1 X
6 n 2 6 1 xt xt0 60
T t
kn 2 1 X
6 xt xt0 60
T t
12. On notera que le raisonnement qui est fait ici consiste appliquer l'ingalit de l'information de
KULLBACK la pseudo-loi, en faisant momentanment comme si c'tait la vraie loi. Cette ingali-
t est en effet une proprit de la loi tudie, qu'elle soit ou non la vraie loi des observations.
Preuve du lemme 2
Montrons d'abord la proprit pour h = 0.
Comme vec(x t x t0 ) = x t x t, il est clair que :
(vecx t x t0 )(vecx t x t0 )0 = x t x t .x t0 x t0 = x t x t0 x t x t0 .
Xn
En notant (ei ) les vecteurs de la base canonique de R n, et x t = xi t ei ,
on obtient : i=1
X
E(x t x t0 x t x t0 ) = E(xi t x j t x kt xlt )ei e0j ek el0
i, j,k,l
X
= E(xi t x j t x kt xlt )ei ek .e0j el0
i, j,k,l
X
= (i j kl + i k jl + il j k )ei ek .e0j el0
i, j,k,l
X X X 0
ik jl ei ek .e0j el0 = ik vec(ek ei0 ) jl vec(el e0j )
i, j,k,l i,k j,l
= vec6 .(vec6 ) = vec6.(vec6)0
0 0 0
Enfin, comme :
u R n ,v R n : K nn u v = K nn vec(vu 0 ) = vec(uv 0 ) = v u, on a :
X X
il jk ei ek .e0j el0 = K nn il jk ek ei .e0j el0
i, j,k,l i, j,k,l
X
= K nn il jk ek e0j ei el0
i, j,k,l
X X
= K nn jk ek e0j il ei el0
j,k i,l
0
= K nn 6 6 = K nn 6 6
116
Comme K nn 6 6 = 6 6 K nn, on a ainsi obtenu :
E((vecx t x t0 )(vecx t x t0 )0 ) = E(x t x t0 x t x t0 )
(1)
= (vec6)(vec6)0 + (6 6)(In 2 + K nn )
Preuve de la proposition 3
1X
i) En notant S = x t x t0 , on sait que :
T t
LT 1
(x,6) = K nn vec 6 1 6 1 S6 1
vec6 2
On en dduit (voir par exemple LTKEPOHL [1993], page 471, pour les
formules de drivation utilises) :
2LT 1 h 1 1 1
i0
(x,6) = vec6 vec(6 S6 ) K nn
(vec6)(vec6)0 2 vec6
" #0
1 vec6 1 1 vec6
1
1 vec6 1
= (In 6 S) (6 S In ) K nn
2 (vec6)0 (vec6)0 (vec6)0
1 h 1
= 6 6 1 (In 6 1 S)(6 1 6 1 )
2 i0
(6 1 S In )(6 1 6 1 ) K nn
1 h 1 i
= 6 6 1 6 1 6 1 S6 1 6 1 S6 1 6 1 K nn
2
2LT 0 2LT
Comme (x,6) = D (x,6)Dn ,
(vech6)(vech6)0 n
(vec6)(vec6)0
il s'ensuit :
2LT
(x,6)
(vech6)(vech6)0
1 h i
= Dn0 6 1 6 1 6 1 6 1 S6 1 6 1 S6 1 6 1 Dn
2
X
1
Enfin, puisque E(S) = E xt xt0 = 6, on obtient :
T t
" #
2LT 1 0
J0 = E 0
(x,6) = Dn 6 1 6 1 Dn
(vech6)(vech6) 2
118
iii) Le vecteur z t = vec(6 x t x t0 ) tant stationnaire d'esprance nulle, on
X
1X L 0
sait que : T z t N 0, E(z t z th ) .
T t hZ
Par application du lemme 2, on sait que :
0 ) = 0(h) 0(h)(I + K )
h Z E(z t z th n2 nn
X
En notant 0 = 0(h) 0(h), on a ainsi :
hZ
1X L
T vec(6 x t x t0 ) N 0,0 (In 2 + K nn )
T t
1X 1X
Comme vech(6 x t x t0 ) = Dn+ vec(6 x t x t0 ) et comme
T t T t
K nn Dn+0 = Dn+0, on obtient :
1X L 0
T vech(6 x t x t0 ) N 0,2Dn+ 0 Dn+
T t
iv) rsulte de ii) et iii) de faon immdiate.
Preuve de la proposition 4
Comme les estimateurs T et T sont convergents, on peut effectuer les
mmes dveloppements limits sous l'hypothse nulle que ceux qui sont faits
par GOURIROUX et MONFORT [1989]. De fait, on peut crire :
QT QT 2 QT
(1) (x,T0 ) # (x,0 ) + (x,0 )(T0 0 )
0
QT h
# (x,0 ) J0 0 (0 )(T 0 )
Q T Q T 2 Q T
(2) (x,T ) = 0 # (x,0 ) + (x,0 )(T 0 )
0
h 0 QT h 0 h
# (0 ) (x,0 ) (0 )J0 0 (0 )(T 0 )
h
Dans le cas o la matrice (0 ) est de plein rang colonne, GOURIROUX et
0
MONFORT montrent que ces deux relations entranent :
QT QT
(3) (x,T0 ) # M0 (x,0 ).
h
Pour montrer que ce rsultat reste vrai lorsque (0 ) n'est pas de plein
0
rang, il suffit, compte tenu de la relation (1) et du fait que M = Im P, de
montrer que :
h QT
(4) J0 0 (0 )(T 0 ) # P 0 (x,0 )
Or, en utilisant la dfinition de P et la relation (2), on peut crire :
0 + 0
0 QT h h h h QT
P (x,0 ) = J0 0 (0 ) (0 )J0 (0 ) (0 ) (x,0 )
0 + 0
h h h h h
# J0 0 (0 ) (0 )J0 0 (0 ) (0 )J0 0 (0 )(T 0 )
h
= J0 P (0 )(T 0 )
0
120
QT L
Comme on a suppos : T (x,0 ) N (0,), il en rsulte que
sous H0 :
QT L
T (x,T0 ) N (0,M 0 M).
Puisque rg(M 0 M) = rg(M) = m q0, on obtient :
0
QT 0 0 QT L
T (x,T ) (M M) (x,T ) 2 (m q0 ),
0
et par consquent :
0
QT 0 0 QT L
T (x,T ) ( M M) (x,T ) 2 (m q0 ).
0
Preuve du lemme 5
vec30 vec3
i) Notons : 0 = et = .
d0 d
h(0 + ) h(0 ) = vech((30 + 3)(30 + 3)0 + (D0 + D))
vech(30 300 + D0 )
0
= vech(30 30 + 330 + 330 + D)
0
l'application
Comme
7 vech(30 3 + 3300 + D) est linaire et
0
comme vech(33 ) = o (k3k), on en dduit :
h
(0 ). = vech(30 30 + 3300 + D)
0
= Dn+ vec(30 30 + 3300 + D)
h 0
i
= Dn+ (In 2 + K nn )vec(330 ) + vecD
On obtient donc :
h
(0 ) = Dn+ [(In + K nn )(30 In ) 1n ] = Dn+ [230 In 1n ]
0
puisque Dn+ K nn = Dn+.
h
ii) (0 ) est une matrice (n(n + 1)/2,n( p + 1)). Pour tudier son rang, il
0
suffit de dterminer la dimension de son noyau.
h
vec3
Soit = tel que 0 (0 ). = 0. On a de faon quivalente :
d
0
vech(30 30 + 330 + D) = 0 et donc : 30 30 + 3300 + D = 0.
0
Posons P30 = 30 (30 D01 30 )1 300 D01.
La relation prcdente entrane :
0
(In P30 )(30 30 + 330 + D)(In P30 0 ) = 0
et donc : (In P30 )D(In P30 0 ) = 0. Or, In P30 = 80 D01, o 80 est la
matrice qui intervient dans la condition suffisante d'identifiabilit locale. On
122
obtient alors : 80 D01 D D01 800 = 0 et la nullit des termes diagonaux
fournit :
X dj
i i2j 2 = 0
d0 j
j
Comme la condition de ANDERSON RUBIN est suppose vrifie, i2j est
par hypothse une matrice inversible. Ceci entrane que D = 0, donc que
30 30 + 3300 = 0.
0
On obtient alors : (In P30 )(30 3 + 3300 ) = 0, d'o :
(In P30 )3300 = 0. Comme 30 est une matrice (n, p) de rang p, on a
aussi : (In P30 )3 = 0. Il en rsulte qu'il existe une matrice carre M de
taille p telle que 3 = 30 M.
La relation 30 30 + 3300 = 0 se rcrit alors :
30 M 0 300 + 30 M300 = 30 (M 0 + M)300 = 0
Comme 30 est une matrice (n, p) de rang p, on en dduit : M 0 + M = 0,
c'est--dire que M est une matrice antisymtrique. On vient ainsi de montrer
que :
h n o
vec30 M
ker 0 (0 ) = /M + M 0 = 0
0
Preuve de la proposition 6
vec3
i) Il suffit d'appliquer la proposition 4 avec : = , = vech6 et :
d
Q T (x, ) = L T (x,6).
On sait en effet dans ce cas que :
T et T sont des estimateurs convergents de et ;
LT
b 0 ) = J0 vech 6
(x,6 b 01 A (cf. proprit 3 ii) )
vech6 T T
m = n(n + 1)/2 et est de plein rang n(n + 1)/2, donc dfinie positive.
p( p 1)
rg P = q0 = n( p + 1) d'aprs le lemme 5, puisque P est un
2
h
projecteur sur le sous-espace engendr par les colonnes de (0 ). On en
0
dduit que :
n(n + 1) p( p 1)
rg M = m q0 = ( p + 1)n
2 2
1
= ((n p)2 (n + p)).
2
Pour appliquer la proposition 4, il reste donc calculer une inverse gnra-
lise de M 0 M. Or, on a :
0
M 0 M = 2M 0 J0 Dn+ 0 Dn+ J0 M
0
= 2J0 M Dn+ 0 Dn+ M 0 J0
car M est une matrice de projection J0-orthogonale. On vrifie alors de faon
0
immdiate que, si M Dn+ 0 Dn+ M 0 est une inverse gnralise de
0 1 0
M Dn+ 0 Dn+ M 0, la matrice M 0 M = J01 M Dn+ 0 Dn+ M 0 J01
2
est une inverse gnralise de M 0 M.
124
Alors :
0
LT LT
T b
(x,6T )
0 0
M M b
(x,6T )
0
vech6 vech6
0
= T.vech 6 b 01 S J0 1 J 1 M Dn+ 0 Dn+0 M 0
T 2 0
J01 J0 vech 6b 01 S
T
T 0 0
= vech 6 b 01 S M D + D+ M 0
n 0 n vech b
6 01
S
2 T T
LT
ii) On sait que vech(6 S) = J01 (x,6).
vech6
On a donc :
L
T vech 6b 0 S N 0,2M Dn+ 0 Dn+0 M 0 ,
T
H 0
si bien que :
0 h i
b 0 S) Vas
S = T vech(6 T vech 6b0 S b 0 S)
vech(6
T T T
1X
Comme S = x t x t0 est l'estimateur non contraint, on a bien crit une
T t
statistique de HAUSMAN-WALD.
126
Rfrences bibliographiques
ANDERSON, T.W. (1984) An Introduction to Multivariate Statistical Analysis, 2nd ed.,
Wiley.
CRAGG, J.G., DONALD, S.G. (1995) Factor analysis under more general conditions with
reference to heteroskedasticity of unknown form, in Advances in econometrics and
quantitative economics: Essays in honor of Professor C.R. Rao, G.S. Maddala, P.C.B.
Phillips, and T.N. Srinivasan ed. Blackwell, Cambridge MA.
FORNI, M. , REICHLIN, L. (1998) Let's get real: a dynamic factor analytical approach to
disaggregated business cycle, Review of Economic Studies.
GOURIROUX, C., MONFORT, A. (1989a) A general framework for testing a null hypothesis
in a ''mixed'' form, Econometric Theory, 5, pp. 63-82.
GOURIROUX, C., MONFORT, A. (1989b) Statistique et Modles Economtriques, vol. 2,
Economica.
HARVEY, A.C. (1989) Forecasting, structural time series models and the Kalman filter,
Cambridge University Press.
KWIATKOWSKI, D., PHILLIPS, P.C.B., SCHMIDT, P., SHIN, S. (1992) Testing the null hypo-
thesis of stationarity against the alternative of a unit root, Journal of Econometrics, 54,
pp. 159-178.
LAWLEY, D.N., MAXWELL, A.E. (1971) Factor Analysis as a Statistical Method, New
York Macmillan Publishing Co., Inc.
LTKEPOHL, H., (1993) Introduction to Multiple Time Series Analysis, 2nd ed, Springer
Verlag.
MAGNUS, J.R., NEUDECKER, H. (1988) Matrix Differential Calculus with Applications in
Statistics and Econometrics, Chichester, J. Wiley.
NEWEY W.K., MACFADDEN, D. (1994) Large Sample Estimation and Hypothesis testing,
in Handbook of Econometrics, vol. 4, pp. 2113-2245.
NEWEY W.K., WEST, K.D. (1994) Automatic Lag Selection in Covariance Matrix
Estimation, Review of Economic Studies, 61, pp. 631-653.
QUAH D., SARGENT, T.J. (1993) A dynamic index model for large cross-sections, in
Business cycles, indicators and forecasting, J.H. Stock and M.W. Watson Ed., University
of Chicago Press.
STOCK, J.H., WATSON, M.W. (1989) New indexes of coincident and leading indicators, in
NBER Macroeconomics Annual, Blanchard and Fisher Ed. MIT Press, Cambridge.
STOCK, J.H., WATSON, M.W. (1993) A procedure for predicting recessions with leading
indicators: econometric issues and recent experience, in Business cycles, indicators and
forecasting, J.H. Stock and M.W. Watson Ed., University of Chicago Press.
WATSON, M.W., (1986) Univariate detrending methods with stochastic trends, Journal of
Monetary Econometrics, 18, pp. 49-75.