Documente Academic
Documente Profesional
Documente Cultură
La relation entre les 2 variables peut être exprimée par une droite
y =α+βx
I Néanmoins, tous les points ne passent pas par cette droite
y =α+βx +ε
I ε est un terme aléatoire ayant des propriétés statistiques
y =α+βx +ε
L'analyse de régression comporte deux aspects essentiels :
I Notation:
I ème
yi est la i observation de la variable dépendante
I ŷi est la valeur ajustée/prédite de yi sur la droite de régression
I Autrement dit:
n
− y )2
P
Minimiser i =1 (ŷ i i
est équivalent à
P n 2
Minimiser i =1 ε̂i
ou encore
Minimiser SCR
par rapport à α et β
1. Sachant que y
i = ŷ + ε̂ = α̂ + β̂ x + ε̂
i i i i , on a :
SCR (y − α̂ − β̂ x )2
X
= i i
i =1
∂ SCR
n
(y − α̂ − β̂ x ) = 0
X
= −2 i i
∂ α̂
i =1
∂ SCR
n
x (y − α̂ − β̂ x ) = 0
X
= −2 i i i
∂ β̂ i =1
∂ SCR /∂ α̂ = 0 y − α̂ n − β̂ x = 0
( (P P
i i
⇐⇒
∂ SCR /∂ β̂ = 0 x y − α̂ x − β̂ x 2 = 0
P P P
i i i i
y = nȳ x = nx̄ ,
P P
Comme i et i la 1ère équation se réécrit:
ȳ − α̂ − β̂ x̄ = 0 ⇐⇒ α̂ = ȳ − β̂ x̄
xy (ȳ − β̂ x̄ ) nx̄ x2 = 0
X h i X
i i − − β̂ i
4. (suite)
xy (ȳ − β̂ x̄ ) nx̄
x2 = 0
X h X i
i i − − β̂ i
x y − nȳ x̄ + β̂ nx̄ 2 − β̂ x 2 = 0
X X
i i i
x 2 − nx̄ 2 = x y − nȳ x̄
X X
β̂ i i i
Par conséquent, on a :
β̂ [nVar (x )] = nCov (x , y )
β̂ = Cov (x , y )/Var (x )
[x y − x ȳ − y x̄ + x̄ ȳ ] =
i i i i x y − nx̄ ȳ − nȳ x̄ + nx̄ ȳ = x y − nȳ x̄
i i i i
y =α+βx +ε
Cov (x , y )
β̂ = et α̂ = ȳ − β̂ x̄ (1)
Var (x )
y =α+βx +ε
L'estimation par MCO fournit les résultats suivants :
ŷ = α̂ + β̂ x
y =α+βx +ε (2)
E (y |x ) = E (α + β x + ε|x ) = α + β x + E (ε|x )
Si E (ε|x ) = 0, la régression linéaire (2) est équivalente à :
E (y |x ) = α + β x (3)
E\
(y |x ) = α̂ + β̂ x = ŷ
y =α+βx +ε ⇔ E (y |x ) = α + β x
L'estimation par MCO fournit les résultats suivants :
ŷ = α̂ + β̂ x ⇔ E\
(y |x ) = α̂ + β̂ x
ŷ = 9.74 + 1.25 x
suivants :
ŷ = −0.24 + 1.64 x
1. β̂ : lorsque le taux de rendement excédentaire du CAC40
augmente de 1 unités, celui du titre IBM augmente en
moyenne de 1.64 unités
2
c'est la diérence entre le taux de rendement du titre IBM et celui obtenu
avec un placement sans risque
Emmanuel Flachaire Économétrie Appliquée
Modèle de régression et PGD
y =α+βx +ε
On suppose que le processus qui a généré les données (PGD) est
y = α0 + β0 x + ε
où α0 et β0 sont des valeurs inconnues.
y = α̂ + β̂ x + ε̂
Autrement dit, α̂ et β̂ sont des estimations de α0 et β0
yi =α+βx +εi i
3
Cette hypothèse est vériée si x est supposé non-stochastique, déterministe
Emmanuel Flachaire Économétrie Appliquée
Propriétes des estimateurs : Théorème de Gauss-Markov
Cov (x , y )
β̂ = et α̂ = ȳ − β̂ x̄
Var (x )
Leurs variances sont égales à :
x2
P
2 2 1
σβ̂ = σ i
et σα̂2 = σ 2
n2 Var (x ) nVar (x )
σ2 est un paramètre inconnu. Il faut le remplacer par une valeur
estimée pour pouvoir utiliser ces mesures en pratique.
1 SCR
σ̂ 2 = ε̂2 =
X
n i
n
mais il est biaisé. Un estimateur sans biais est :
1 SCR
σ̂ 2 = ε̂2 =
X
n−2 i
n−2
4
ε̂ est un estimateur convergent de ε qui lui, est inobservable
i i
Cov (x , y )
β̂ = et α̂ = ȳ − β̂ x̄
Var (x )
Leurs écarts-types sont :
x2
s P s
i
1
σ̂β̂ = σ̂ et σ̂α̂ = σ̂
n2 Var (x ) nVar (x )
x2
s P s
i
1
σ̂β̂ = σ̂ et σ̂α̂ = σ̂
n2 Var (x ) nVar (x )
L'estimateur est d'autant plus précis que σ̂ est petit, autrement dit
les résidus sont peu dispersées
y =α+βx +ε
sont habituellement présentés comme suit :
ŷ = −0.5912 + 0.35 x
(0.034) (0.011)
ou encore
y = −0.5912 + 0.35 x + ε̂
(0.034) (0.011)