Var Qual

Les variables
qualitatives
Plan du cours : premire
partie
Les modles variables qualitative dpendante
1. Le modle de probabilit linaire
2. Lestimation par le maximum de vraisemblance
3. La rgression logistique
Plan du cours : deuxime
partie
La rgression logistique multinomiale
3.
1. Simple
2. Ordinale
4. Les modles de comptage

1. Le modle de Poisson
2. Le modle ngatif binomial
Les modles variable
qualitative dpendante
Le modle de probabilit
linaire
linaire
Quand la variable qualitative dpendante est binaire ou
dichotomique (0/1), le modle OLS est appel modle de probabilit
linaire (par exemple : Y=1 si lentreprise innove, Y=0 sinon).
Y 0 1x1 2 x 2 u
Y ne prend que 2 valeurs (0;1). Comment interprter j? Si E(u|X)=0
alors:
E(Y | X) 0 1x1 2 x 2
linaire
Y suit une distribution de Bernoulli desprance P. Ce modle est
donc dit MPL car son esprance conditionnelle E(Y|X) peut tre
interprte comme la probabilit conditionnelle que lvnement se
produise compte tenu des valeurs de X :
E(Y | X) Pr(Y 1| X)
1 E(Y | X) Pr(Y 0 | X)
mesure de combien est modifi la probabilit de succs quand X
change dune unit (X=1)
E(Y | X) Pr(Y 1| X)
Pr(Y 1| X)
X X
Les limites du modle de prob.
linaire (1) Labsence de normalit des erreurs
OLS6 : Le terme d'erreur est indpendant des variables indpendantes et suit une loi Normale de moyenne nulle et de variance
2
Les erreurs tant le complmentaire par rapport 1 de la probabilit conditionnelle, elles suivent une distribution de Bernoulli,
et non normale.
u : Normal(0, ) 2
linaireLabsence
(1) de normalit des erreurs
2.5
2 1.5
Density
1
.5
0
-1 -.5 0 .5
Residuals
linaire (2) Lhtroscdasticit des erreurs
OLS5 : La variance du terme d'erreur est la mme, quelle que soiet les valeurs des variables indpendantes
Si le terme derreur suit une distribution de Bernoulli, alors sa variance dpend de X:
Var u x1 , x 2 ,K , x k 2
Var(u) P(1 P) E(Y | X) (1 E(Y | X))

linaireLhtroscdasticit
(2) des erreurs
.5
0
Residuals
-.5
-1
.4 .6 .8 1 1.2
Fitted values
linaire (3)
Des prdictions aberrantes
Par dfinition, une probabilit est toujours comprise entre 0 et 1, si bien que :
Or OLS ne garantit en rien cette condition :

On peut imaginer des prdictions en dehors de [0;1]
Leffet marginal reste constant en permanence car P = E(Y|X) croit linairement avec X. Ceci nest pas raliste (ex: la probabilit davoir un enfant en fonction du
nombre denfants dans la fratrie).
0 E Y | X 1
linaire (3)
3
2
Mauvaises
Density
prdictions
1
0
.4 .6 .8 1 1.2
Fitted values
linaire (4) Un coefficient de dtermination faible
Les valeurs observes de Y sont gales 1 ou 0, alors que les valeurs prdites appartiennent lensemble des
rels compris enter 0 et 1 : [0;1].
Si on confronte graphiquement les valeurs prdites avec les valeurs observes, lajustement linaire apparat
systmatiquement faible.
linaire (3)
1
.8
Dummy innovation
Mauvaises
.6
prdictions qui
baissent le R2
.4 .2
0
.4 .6 .8 1 1.2
Fitted values
Les limites du modle de
probabilit linaire
1. Labsence de normalit des erreurs u : Normal(0, 2 )
2. Lhtroscdasticit des erreurs
Var u x1 , x 2 ,K , x k 2
3. Les prdictions aberrantes
4. La faible valeur du coefficient de dtermination

0 E Y | X 1
Surmonter les limites du MPL
1. Labsence de normalit des erreurs
Augmenter la taille de lchantillon
2. Lhtroscdasticit des erreurs

Effectuer des estimations robustes
3. Les prdictions aberrantes

Effectuer des estimations contraintes ou non linaires
4. La faible valeur du coefficient de dtermination

Ne pas utiliser le R2 pour estimer la qualit de lajustement
Le MPL et ses utilisations
Malgr ses limites, le MPL est assez largement utilis :
1. Parce quil constitue une base exploratoire dont les coefficients

sont faciles interprter.
2. Parce quil marche plutt bien pour les valeurs des variables
indpendantes qui sont proches de la moyenne des donnes.
3. Parce qu la condition de travailler sur des grandes bases de

donnes, il permet daborder des problmes destimation que
dautres approches ont du mal aborder.
Le modle LOGIT
Probabilits, chances et logit
Nous voulons expliquer la ralisation vnement : la
variable expliquer prend deux valeurs : y={0;1}.
En fait, on va expliquer la probabilit de ralisation (ou
non) de lvnement: P(Y=y | X) [0 ; 1].
Il nous faudrait une transformation de P(Y) qui tendent
lintervalle de dfinition.
Nous allons voir que le calcul des chances permet
denvisager cette transformation.
Nous comprendrons alors les sources de la fonction logit.
Le modle Logit (1)
Modlisons la probabilit en nous assurant que quelles que soient
les valeurs de X, P reste toujours entre 0 et 1.
eZ 1
P
1 e Z
1 e Z
1 1
1 P 1 Z

1 e 1 e Z
avec z 0 i x i u i
Le modle Logit (2)
Ecrivons le ratio de chance (odds ratio) et prenons son log:
P 1 eZ
Z
e Z
1 P 1 e
P
ln z 0 1x1 2 x 2 u
1 P
Notons deux caractristiques importantes et dsires du modle :
1. Malgr le fait que P soit compris entre 0 et 1, le logit est un

rel compris entre - et +
2. La probabilit nest pas linaire en X

Les ratios de chance
Probabilitinnover
Chanceinnover (odds ratio)innover
Probabilit ne pas innover
Ou plus gnralement
P(Y 1)
odds ratio =
1 P (Y 1)
Plutt que dexpliquer Y (=1 ou =0), on va tenter
dexpliquer le ratio de chance (ou odds ratio)
Probabilits, chances et logit
p(y=1)
P(Y=1) Odds Ln (odds)
1-p(y=1)
0.01 1/99 0,01 -4,60
0.03 3/97 0,03 -3,48
0.05 5/95 0,05 -2,94
0.20 20/80 0,25 -1,39
0.30 30/70 0,43 -0,85
0.40 40/60 0,67 -0,41
0.50 50/50 1,00 0,00
0.60 60/40 1,50 0,41
0.70 70/30 2,33 0,85
0.80 80/20 4,00 1,39
0.95 95/5 19,0 2,94
0.97 97/3 32,3 3,48
0.99 99/1 99,0 4,60
La transformation logit
Le prcdent tableau fait correspondre une liste de
probabilit entre 0 et 1 et son quivalent en termes de
chance au logarithme des chances.
Si la probabilit varie de 0 1, la chance varie de 0
linfini. Le log de la chance varie de + .
Remarquez que la distribution des chances et des log
est symtrique.
La distribution logistique
.25
.2 .15
Density
.1 .05
0
-10 -5 0 5 10
Log (Odds ratio)
La mthode du maximum de
vraisemblance
Le problme est que nous nobservons pas le ratio de chance.
Encore une fois, le modle MCO ne convient pas.
Pour estimer le modle LOGIT, on a recours la mthode du
maximum de vraisemblance.
La mthode MV est une mthode destimation alternative la
mthode des moindres carrs.
Elle consiste trouver la valeur des paramtres qui maximisent la
vraisemblance des donnes.
La vraisemblance en conomtrie est dfinie comme la probabilit
jointe dobserver un chantillon, tant donn les paramtres du
processus ayant gnr les donnes.
vraisemblance
Supposons que nous disposons dun chantillon de n observations
alatoires. Soit f(Y) la probabilit que Y=1 ou 0. La probabilit jointe
dobserver les n variables de Y est donne par la fonction de
vraisemblance :
n
f y1 , y2 ,..., yn f ( yi )
i 1
On doit maintenant spcifier la fonction f(.). Elle dcoule de la

distribution des probabilits dun vnement qui ne peut avoir que
deux occurrences: un succs et un chec. Il sagit de la distribution
binomiale :
f ( yi ) p yi (1 p)1 yi
La fonction de vraisemblance
En dfinitive, la fonction de vraisemblance scrit:
n n
L y f (yi ) p 1 p
yi 1 yi
i 1 i 1
yi 1 yi
n n
e z
1
L y, z f (yi , z) z 1 e z
i 1 i 1 1 e
yi 1 yi
n n
e x i
1
L y, x, f (yi , x i , ) x i 1 e xi
i 1 i 1 1 e
Parce quelle est difficile manipuler, on utilise gnralement le log.
Aprs manipulation, la fonction log de la vraisemblance scrit :
n n
LL y, z yi z ln 1 e z
i 1 i 1
n n
LL y, x, yi x i ln 1 e xi
i 1 i 1

n
LL y, x, ln 1 e xi yi x i
i 1
vraisemblance
Le problme est le suivant: tant donn la forme
fonctionnelle de f(.) et les N observations, quelles valeurs
des paramtres rendent lobservation de lchantillon la
plus vraisemblable?
La maximisation de la
vraisemblance
Les estimateurs obtenus en maximisant la vraisemblance
sont efficaces. Ou encore en maximisant le log de la
vraisemblance.
LL n
yi i x i 0
i 1 ez
where i
LL n
1 e z
i 1 i x i x i
i 1

Cette maximisation na pas de solution analytique et se

rsout grce un algorithme ditration dit de Newton-
Raphson.
Lexemple des chances
dinnover
Les entreprises de biopharmaceutique : 373
(81%) ont innover et 84 (19%) ne lont pas fait.
La chance dinnover est denviron 4 contre 1.En

effet 373/84=4.4
Pour les entreprises de biopharmaceutique, la

probabilit dinnover est quatre fois plus leve
que la probabilit de ne pas le faire.
Le modle de rgression
logistique
Application sur la base de donnes OLS
Instruction Stata : logit
logit y x1 x2 x3 xk [if] [weight] [, options]
Options : noconstant : estime le modle sans constante

robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Interprtation des coefficients
(1)
Pour avoir la mesure de la variation de probabilit, il faut utiliser la
formule du logit pour transformer le logit en probabilit
e i
x
P x i
1 e
(2)
Tapons un modle sans variable explicative et
seulement une constante:
Tapons logit inno et nous trouvons
e1,491
P 0,81
1 e 1,491
La constante 1.491 sinterprte comme le log ratio

moyen. Calculons la probabilit moyenne dinnover.
Tapons : dis exp(_b[_cons])/(1+exp(_b[_cons]))
Nous trouvons bien la valeur observe: 81%
(3)
Un signe positif signifie que la probabilit de succs augmentera
avec la variable correspondante.
Un signe ngatif signifie que la probabilit de succs diminuera

avec la variable correspondante.
Une des difficults dans linterprtation des probabilits est leur non
linarit: elles ne varient pas identiquement selon le niveau des
variables indpendantes.
Cest pourquoi il est frquent de calculer la probabilit au point

moyen de lchantillon.
(4)
Tapons logit inno rdi size spe pharma
e -7.630.757rdi0.979size0.367spe3.781pharma
P
1 e-7.630.757rdi0.979size0.367spe3.781pharma
A partir du modle, on peut calculer la probabilit conditionnelle

moyenne en utilisant les valeurs moyennes de rdi, size, spe et
pharma.
e1.9228238
P 0,8724
1 e1.9228238
Les effets marginaux (1)
Il est souvent utile de connatre leffet marginal dune variable explicative sur
la probabilit de succs dun vnement.
Puisque la probabilit est une fonction non linaire des variables
explicatives, la variation de la probabilit due un changement dune
variable explicative (ou son effet marginal) ne sera pas identique selon que
les autres variables sont maintenues leur niveau moyen, ou mdian, ou au
premier quartile, etc.
prvalue produit les probabilit prdites aprs un modle logit (ou autre
modle)
prvalue
prvalue , x(size=10) rest(mean) renvoie pour p(Y=1) : 0.1177
prvalue , x(size=10) rest(median) renvoie pour p(Y=1) : 0.0309
Les effets marginaux (2)
La commande prchange est bien utile. Elle produit
leffet marginal de chacune des variables explicatives
pour la plupart des variations de valeurs dsires.
prchange [varlist] [if] [in range]

,x(variables_and_values) rest(stat) fromto
prchange
prchange, fromto
prchange , fromto x(size=10.5) rest(mean)
Qualit de lestimation
Il nexiste pas de mesure comparable au R 2 de la rgression linaire.
On utilise exclusivement la statistique du log de vraisemblance (LL), cad du

log de la probabilit jointe dobserver lchantillon.
Plus il y a dobservation, plus le produit des probabilit jointe tend vers 0.
Autrement dit, pour un mme modle, plus il y a dobservations, plus LL tend vers
-
Pour une mme nombre dobservations, plus le modle est explicatif, plus LL tend
vers 0.
Cest en comparant deux LL que lon value la qualit dun ajustement, avec
toujours un modle contraint et un modle non contraint.
Le McFadden Pseudo R2
On utilise le McFadden Pseudo R2 (1973) en premire analyse pour
voir la qualit de lajustement. Il sinterprte de manire analogue au
R2. Toutefois, parce quil reste gnralement faible, son utilisation
reste limite.
Le pseudo-R2 dpend des maxima de vraisemblance obtenus si le

modle navait quune constante (modle contraint) et pour le modle
complet (modle non contraint). Il est compris entre 0 et1. Plus il est
proche de 1 et mieux cest.
Pseudo R 2

ln L c ln L nc
1
ln L nc
MF
ln L nc ln Lc
Le rapport de vraisemblance
(LR test)
Le ratio de vraisemblance dpend aussi des maxima de vraisemblance
et suit une loi de 2. La probabilit que les variables indpendantes ne
sont pas explicatives (H0) est donne par le test du 2.
Le rapport de vraisemblance compare une spcification contrainte
une autre non contrainte:
LR 2 ln L nc ln L c
Ce rapport suit une distribution du 2.
Une grande valeur indique que le modle non contraint apporte une
information significative lvnement que le modle veut expliquer.
Autre utilisation du LR test
Comme output, STATA prsente toujours le LR test, comparant le
modle spcifi avec un modle sans variable explicative et
seulement une constante.
On peut raliser ce test pour comparer deux spcifications pour

justifier lajout de variables explicatives. Ceci est trs utile lorsquil
sagit de voir si lajout dune variable apporte de linformation.
logit [modle contraint]

est store [nom1]
logit [modle non contraint]

est store [nom2]
lrtest nom2 nom1
La qualit de la prvision
On peut enfin effectuer une comparaison entre les vnements prdits
correctement avec ceux prdits avec erreurs.
Il faut alors faire une hypothse: quand la probabilit prdite est suprieure
0,5, alors la prdiction est que lvnement a lieu.
Sous STATA, ceci est effectuer avec

estat class
Autre modlisation du choix
binaire
Le modle Logit ne constitue quune modlisation
possible, mme dans le cas o la variable dpendante
est une variable binaire.
On utilise largement le modle Probit comme modle

concurrentiel.
Ou encore le modle dit log-log complmentaire dans le

cas des probabilit de survie, car il se prte bien la
modlisation de la fonction de hasard.
Autres modlisations de
choix binaire
Le modle Probit
X

2
z2 2 2
z e
X e X
Pr(Y 1| X) X
dz dz t dt

2
2
Le modle log-log complmentaire

Pr(Y 1| X) X
1 exp exp(X )
Les fonctions de vraisemblance et
commandes STATA
yi 1 yi
n n
e X
1
Logit : L( y, x, ) f ( yi , xi , ) 1 eX
i 1 1 e
X
i 1
n n
Probit : L( y, x, ) f ( yi , xi , ) ( X
) 1 (X )
yi 1 yi
i 1 i 1
n n
Log-log comp : L( y, x, ) f ( yi , xi , ) 1 exp( exp( X
)) exp( exp( X ))
yi 1 yi
i 1 i 1
Exemple
logit inno rdi size spe pharma

probit inno rdi size spe pharma
cloglog inno rdi size spe pharma
Les fonctions de rpartition
1
.8
.6
y
.4
.2
0
-4 -2 0 2 4
x
Probit Transformation Logit Transformation

Complementary log log Transformation
Comparaison des modles
OLS Logit Probit C log-log
rd - size 0.113 0.757 0.428 0.365

[4.03]*** [3.63]*** [3.55]*** [3.24]***
ln(Actif matriel) 0.126 0.979 0.558 0.495
[8.73]*** [7.43]*** [7.68]*** [7.32]***
ln(spcialisation technologique) 0.051 0.367 0.196 0.131
[1.03] [0.90] [0.87] [0.67]
Dummy Pharma -0.447 -3.782 -2.12 -1.836
[7.56]*** [6.63]*** [6.83]*** [6.57]***
Constant -0.407 -7.64 -4.376 -4.264
[2.39]** [5.31]*** [5.44]*** [5.61]***
Observations 457 457 457 457
Absolute t value in brackets (OLS) z value for other models.

* 10%, ** 5%, *** 1%
Comparaison des effets
marginaux
OLS Logit Probit C log-log
Intensit de recherche 0.113 0.085 0.093 0.102
Actif matriel 0.126 0.110 0.121 0.137
Spcialisation technologique 0.051 0.040 0.042 0.037
Entreprise Pharmaceutique -0.445 -0.470 -0.466 -0.455
Pour les modles logit, probit et cloglog, les effets marginaux ont t valus par une variation dun point
autour de la moyenne, en utilisant les valeurs moyennes des autres variables.
Le modle LOGIT
multinomial
Le modle multinomial
Envisageons maintenant le cas o la variable dpendante est
multinomial. Par exemple, dans la cadre des activits dinnovation de
la firme:
Collabore avec universit (modalit 1)
Collabore avec grande firme (modalit 2)
Collabore avec PME (modalit 3)
Ne collabore pas (modalit 4)
Ou dans le cadre de la survie des firmes:

Survie (modalit 1)
Banqueroute (modalit 2)
Rachat (modalit 3)
Introduction au modle
multinomial
Prenons le cas de la survie des firmes. La premire possibilit est
denvisager trois rgressions logistiques indpendantes comme suit:
P(Y 1| X)
ln (1)
0 1 x1 K m x m
(1) (1)
1 P(Y 1| X)
P(Y 2 | X)
ln (2)
0 1 x1 K m x m
(2) (2)
1 P(Y 2 | X)
P(Y 3 | X)
ln (3)
0 1 x1 K m x m
(3) (3)
1 P(Y 3 | X)
O 1 = survie, 2 = banqueroute, 3 = rachat.
1. Ouvrez le fichier mlogit.dta
2. Pour chaque modalit, estimez la probabilit au point moyen de
lchantillon, conditionnelle :
- temps (log_time)
- la taille (log labour)
- lge (entry_age)
- lindicatrice spinout (spin_out)
- lindicatrice cohorte (cohort_*)
Introduction au modle
multinomial
ln
P(Y 1| X)
x K x
(1) (1) (1)
1 P(Y 1| X) 0 1 1 m m

P(Y 2 | X)
ln (2)
0 (2)
1 x 1 K (2)
m xm
1 P(Y 2 | X)
P(Y 3 | X)
ln (3)
0 1
(3)
x 1 K (3)
m xm
1 P(Y 3 | X)
P(Y 1| X) 0.8771
P(Y 2 | X) 0.0398 P(Y k | X)
k
0.9848 1
P(Y 3 | X) 0.0679
Premirement, la somme des probabilits conditionnelles doccurrence

dvnements exclusifs doit tre gale lunit.
k
P Y j| X 1
j0
Deuximement, pour k modalits diffrentes, nous navons besoin

destimer que (k 1) modalits. Donc
k
P Y 0 | X 1 P Y j | X
jk
Troisimement, le modle multinomial est un modle destimation
simultane comparant des ratios de chance pour chaque pair de
modalits. Dans le cas de trois modalits:
P(Y 1| X)
ln (1|0)
0 1
(1|0)
x 1 K (1|0)
m xm
P(Y 0 | X)
P(Y 2 | X)
ln (2|0)
0 1
(2|0)
x 1 K (2|0)
m xm
P(Y 0 | X)
P(Y 1| X)
ln (1|2)
0 1
(1|2)
x 1 K (1|2)
m xm
P(Y 2 | X)
Le modle logit multinomial
Remarquons quil y a redondance dinformation dans les trois modles
prcdents. En effet :
P Y 1| X P Y 2 | X P Y 1| X
ln ln ln
P Y 0 | X P Y 0 | X P Y 2 | X
P Y 1| X 1|0 P Y 2 | X
2|0 P Y 1| X
ln x ;ln x ;ln x 1|2
P Y 0 | X P Y 0 | X P Y 2 | X
x
1|0
x
2|0
x
1|2
Quatrimement, lestimation dun modle multinomial revient estimer

conjointement (k 1) modles logit en posant la contrainte sur les
paramtres estimer:
1|0 2|0 1|2

Dans une modlisation logistique k modalits, la probabilit
doccurrence de la modalit j scrit:
e
x
( j|0 )
P Y j| X jk

( j|0 )
x
e
j0
Par convention, la modalit 0 est la modalit de base

P Y j | X j|j
Notez que x j|j ln ln(1) 0 x, j: 0
P Y j | X
e
x
( j|0 )
P Y j| X jk

( j|0 )
x
e
j0
e
x
( j|0 )
1
P Y j | X P Y 0 | X jk
j k
x x
1 e
( j|0 )
1 e
( j|0 )
j1 j1
Le modle Logit binomial
comme un cas particulier du
logit multinomial
Rcrivons la probabilit de lvnement Y=1
e
x
P Y 1| X
1 e x
e
x
(1|0 )
e
x
(1|0 )
e
x (1|0 )
P Y 1| X
x x e x x

(1|0 ) ( 0|0 ) (1|0 ) ( k|0 )
1 e e e
k 0,1
On voit bien que le logit binomial est un cas particulier du

cas multinomial o seulement deux modalits sont
analyses.
vraisemblance
Supposons que nous disposons dun chantillon de n observations
alatoires. Soit f(Y) la probabilit que Y=j. La probabilit jointe
dobserver les n variables de Y est donne par la fonction de
vraisemblance :
n
f y1 , y 2 ,..., y n f (yi )
i 1
On doit maintenant spcifier la fonction f(.). Elle dcoule de la

distribution des probabilits dun vnement qui peut avoir plusieurs
modalits. Il sagit de la distribution multinomiale :
f (yi ) p 0 dYi p1dYi p jdYi p k dYi p jdYi

0 1 j k k
jK
n n k
dYij
L(y) f y i p j
i 1 i 1 j 1

dYi0

dYij
x
( j|0 )
n n
1 k
e
L(y) f yi , x i , ( j|0) j k

j k

i 1 x j 1 x
1 e
( j|0 ) ( j|0 )
i 1
1 e
j1 j1

Aprs manipulation, la fonction log de la vraisemblance scrit

n
k xi ( j|0)
1 e
LL(y, x, ( j|0) ) dyi0 ln dy ij ln
j k
x i ( j|0) j k
x i ( j|0 )
i 1
1 e
j1
1 e
j 0 j 0
n x
k
j k
j k
x
) ln 1 e dy i x i ln 1 e
( j|0 ) ( j|0)
LL(y, x,

( j|0) j ( j|0)

i i

i 1 j 0 j1 j 0
n k k j k
x
) dy x i
ln 1
( j|0)
LL(y, x, k 1

( j|0) j ( j|0)
e
i
i

i 1 j1 j1 j 0
Le modle de logit
multinomial
Instruction Stata : mlogit
mlogit y x1 x2 x3 xk [if] [weight] [, options]

rgression
Le modle de logit
multinomial
use mlogit.dta, clear
mlogit type_exit log_time log_labour entry_age entry_spin cohort_*
Bloc des description de lajustement
Paramtres estims, erreurs

standards et probabilits critiques
Dans Stata, la modalit de rfrence est celle

qui a la plus grande frquence empirique
Interprtation des
coefficients
Linterprtation des coefficients seffectue toujours en rfrence la
catgorie de base.
La probabilit de rachat dcroit-elle

avec le temps ?
Non!!
Linterprtation correcte est:
relativement la survie, la probabilit
de rachat dcroit avec le temps
Interprtation des
coefficients
Linterprtation des coefficients seffectue toujours en rfrence la
catgorie de base.
La probabilit de rachat est elle moins

forte pour les spinoffs ?
Non!!
Linterprtation correcte est:
relativement la survie, La probabilit
de rachat est moins forte pour les
spinoffs
Interprtation des
coefficients
1|0 2|0 1|2 2|0 1|0 2|1

Relativement la banqueroute, la
probabilit de rachat est plus forte
pour les spinoffs
lincom [boughtout]entry_spin [death]entry_spin

Croiser les rfrences
mcross fait le travail pour nous !
Attention la nouvelle catgorie

de rfrence !!
Rachat relativement la
banqueroute
Relativement la banqueroute, la
probabilit de rachat est plus forte
pour les spinoffs
Croiser les rfrences
mcross fait le travail pour nous !
Et nous retrouvons notre rsultat

prcdent
Lhypothse dindpendances
des tats non pertinents (IIA)
Le modle repose sur lhypothse que pour chaque paire de modalits les ralisations sont
indpendantes des autres modalits. Autrement dit, les autres modalits sont non
pertinentes (irrelevant).
Dun point de vue statistique, cela revient faire lhypothse dindpendance des termes
derreur entres les diffrentes modalits (do le nom IIA: Independence of irrelevant
alternatives)
Une faon simple de tester la proprit IIA est alors destimer le modle en retirant une
modalit (pour retreindre les choix), et de comparer les nouveaux paramtres avec ceux du
modle complet
Si IIA est valide, les paramtres ne changent pas significativement
Si IIA nest pas valide, les paramtres changent significativement
Lhypothse dindpendances
des tats non pertinents (IIA)
H0: La proprit IIA est valide
H1: La proprit IIA nest pas valide

1
H R *C var R var *C R *C

La statistique H (H car il sagit en fait dun test dHausman) suit une

distribution du M degr de libert (M tant le nombre de
paramtres)
Application de IIA
mlogtest, hausman
Variable omise
Application de IIA
mlogtest, hausman
Donc on compare les paramtres du modle
Banqueroute relativement Rachat

estim conjointement avec
survie relativement rachat
avec
les paramtres du modle

Banqueroute relativement Rachat
estim sans
survie relativement rachat
Application de IIA
mlogtest, hausman
La conclusion est que la modalit survie modifie

significativement larbitrage rachat ou
banqueroute.
En fait pour une firme, le rachat peut tre vu

comme une modalit de rester en activit avec
une perte sur la dcision conomique
dinvestissement notamment.
Le LOGIT multinomial
ordonn
ordonn
Envisageons maintenant le cas o la variable dpendante est une
variable discrte, dont la valeur indique une intensit. Typiquement,
dans le cadre dune enqute dopinion (genre CIS1-4), on a des
questions dont la rponse est code par une chelle de Likert :
Obstacles linnovation (chelle de 1 5)

Intensit de collaboration (chelle de 1 5)
Enqute de marketing (Napprcie pas (1) Apprcie (7))
Note dtudiants
Test dopinion
Etc.
La structure ordonne
Ces variables dcrivent des chelles verticales quantitatives, si
bien quune faon de modliser le problme est de considrer des
intervalles dans lesquels la variable latente y* peut se trouver
y 1 si y*n 1
y 2 si 1 y*n 2
y 3 si 2 y*n 3
M
y k si 3 y*k
o j sont des bornes inconnues estimer, dfinissant la frontire

des intervalles.
On pose ensuite lhypothse que la variable latente (non observe)
y* est une combinaison linaire des variables explicatives :
y*i x i u i
o ui admet une fonction de rpartition F(.). Les probabilits
associes aux ralisations de y (y y*) sont alors lies la fonction
de rpartition de F(.). Regardons la probabilit que y = 1 :

P(y 1) P y*i 1
P(y 1) P x i u i 1
P(y 1) P u i 1 x i
e1 xi
P(y 1) 1 x i
1 e1 xi
Regardons la probabilit que y = 2 :

P(y 2) P y*i 2 P y*i 1
e 2 x i e1 xi
P(y 2) 2 x i 1 x i
1 e2 xi 1 e1 xi
Donc dans lensemble, nous avons:
P(Y 1) 1 x i
P(Y 2) 2 x i 1 x i
P(Y 3) 3 x i 2 x i
M
P(Y k) 1 k 1 x i
Probabilit dans le modle
ordonn 1 x i 2 x i 3 x i k 1 x i
y=1 y=2 y=3 y=k
ui
n k dy j
L(y, x, , ) = F( j x i) F( j-1 x i)
i=1 j=1

avec
F( 0 - x n ) 0
F( k - x n ) 1
Dans le cas o ui suit une fonction logistique, la fonction log de
la vraisemblance scrit :
dy j
n k
j xi
j-1 x i
e
e

L(y, x, , ) =

j xi
j-1 x i
i=1 j=1
1 e
1 e

et donc
n k j x i j-1 xi
e e
LL(y, x, , ) = dy ln j
i j xi

j-1 xi

i 1 j1 1 e 1 e
Le logit multinomial
ordonne
Instruction Stata : ologit
ologit y x1 x2 x3 xk [if] [weight] [, options]

rgression
Le modle de logit
multinomial
use est_var_qual.dta, clear
ologit innovativeness size rdi spe biotech
Qualit de
lajustement
Paramtres
estims
Points seuils
Interprtation des
coefficients
Un signe positif signifie une relation positive entre la variable explicative et le rang (ou lordre)
Une des difficults dans linterprtation est le rle des variables de seuil. Notre modle est :
Quelle est la probabilit que Y = 1 : P( = 1) ?

Quelle est la probabilit que le score soit infrieur au premier seuil ?
Score x i u i

P(y 1) P x i u i 1

e 1.95
P(y 1) P 270.5 u i 268.6 1.95
.1245
1 e
P(y 1) P u i 1.9
Interprtation des
coefficients
Quelle est la probabilit que Y = 2 : P( Y = 2) ?
P(y 1) P x i u i 1

e 1.95
P(y 1) P 270.5 u i 268.6 1.95
.1245
1 e
P(y 1) P u i 1.9 P(Y 2) F 2 x i F 1 x i

P(Y 2) .2321 .1245

P(y 1) P x i u i 2
P(Y 2) .1076
e 1.95
P(y 1) P 270.5 u i 269.3 .2321
1.95
1 e
P(y 1) P u i 1.2

Obtenir les probabilit
prdites
prvalue fait le travail pour nous !

Var Qual

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Var Qual

Încărcat de

Drepturi de autor:

Formate disponibile

Les variables

2. Lestimation par le maximum de vraisemblance

4. Les modles de comptage

Si le terme derreur suit une distribution de Bernoulli, alors sa variance dpend de X:

Var(u) P(1 P) E(Y | X) (1 E(Y | X))

Des prdictions aberrantes

Or OLS ne garantit en rien cette condition :

2. Lhtroscdasticit des erreurs

4. La faible valeur du coefficient de dtermination

2. Lhtroscdasticit des erreurs

3. Les prdictions aberrantes

4. La faible valeur du coefficient de dtermination

1. Parce quil constitue une base exploratoire dont les coefficients

3. Parce qu la condition de travailler sur des grandes bases de

1. Malgr le fait que P soit compris entre 0 et 1, le logit est un

2. La probabilit nest pas linaire en X

On doit maintenant spcifier la fonction f(.). Elle dcoule de la

Cette maximisation na pas de solution analytique et se

La chance dinnover est denviron 4 contre 1.En

Pour les entreprises de biopharmaceutique, la

Instruction Stata : logit

logit y x1 x2 x3 xk [if] [weight] [, options]

Options : noconstant : estime le modle sans constante

La constante 1.491 sinterprte comme le log ratio

Un signe ngatif signifie que la probabilit de succs diminuera

Cest pourquoi il est frquent de calculer la probabilit au point

A partir du modle, on peut calculer la probabilit conditionnelle

prchange [varlist] [if] [in range]

On utilise exclusivement la statistique du log de vraisemblance (LL), cad du

Le pseudo-R2 dpend des maxima de vraisemblance obtenus si le

Ce rapport suit une distribution du 2.

On peut raliser ce test pour comparer deux spcifications pour

logit [modle contraint]

logit [modle non contraint]

Sous STATA, ceci est effectuer avec

On utilise largement le modle Probit comme modle

Ou encore le modle dit log-log complmentaire dans le

Le modle log-log complmentaire

logit inno rdi size spe pharma

Probit Transformation Logit Transformation

rd - size 0.113 0.757 0.428 0.365

Absolute t value in brackets (OLS) z value for other models.

Intensit de recherche 0.113 0.085 0.093 0.102

Actif matriel 0.126 0.110 0.121 0.137

Spcialisation technologique 0.051 0.040 0.042 0.037

Entreprise Pharmaceutique -0.445 -0.470 -0.466 -0.455

Ou dans le cadre de la survie des firmes:

Premirement, la somme des probabilits conditionnelles doccurrence

Deuximement, pour k modalits diffrentes, nous navons besoin

Quatrimement, lestimation dun modle multinomial revient estimer

Par convention, la modalit 0 est la modalit de base

On voit bien que le logit binomial est un cas particulier du

On doit maintenant spcifier la fonction f(.). Elle dcoule de la

f (yi ) p 0 dYi p1dYi p jdYi p k dYi p jdYi

mlogit y x1 x2 x3 xk [if] [weight] [, options]

Options : noconstant : estime le modle sans constante

Bloc des description de lajustement

Paramtres estims, erreurs

Dans Stata, la modalit de rfrence est celle

La probabilit de rachat dcroit-elle

La probabilit de rachat est elle moins

lincom [boughtout]entry_spin [death]entry_spin

Attention la nouvelle catgorie