Sunteți pe pagina 1din 15

Isaiariki miyatake medina r1171-1 Lic.

Alejandro Chamas De los Rios

Ingeniería Comercial
Econometría I
COM – 05223
Práctica Nª 5
5.1 Con ayuda de los datos del archivo SLEEP75.WF1 se obtiene la ecuación estimada
sleep = 3,840.83 - .163 totwrk - 11.71 educ - 8.70 age + .128 age2 + 87.75 male
(235.11) (.018) (5.86) (11.21) (.134) (34.33)
n = 706, R = .123, 𝑅 = .117.
2 2

La variable sleep es la cantidad total de minutos, por semana, dormidos durante la


noche, totwrk es la cantidad total de minutos que se trabajó por semana, educ y age
(edad) están dadas en años y male (hombre) es una binaria para género.

i) Permaneciendo todo lo demás constante, ¿hay alguna evidencia de que los


hombres duerman más que las mujeres? ¿Qué tan fuerte es esa evidencia?
R.- Permaneciendo todo lo demás constante si hay evidencia que los
hombres duermen más que las mujeres ya que tenemos una evidencia de
tan fuerte de 87,75.
ii) ¿Hay un costo de oportunidad estadísticamente significativo entre trabajar
y dormir? ¿Cuál es el costo de oportunidad estimado?
El costo de oportunidad es de -9.78
iii) ¿Qué otra regresión necesita correr para probar la hipótesis nula de que,
manteniendo todos los demás factores constantes, la edad no afecta el
dormir?
sleep = B0 +B1totwrk – B2educ + B3male

5.2 Las ecuaciones siguientes se estimaron empleando los datos del archivo
BWGHT.WF1:
log(bwght) = 4.66 - .0044 cigs + .0093 log( faminc) + .016 parity + .027 male + .055
white
(.22) (.0009) (.0059) (.006) (.010) (.013)
n = 1,388, R2 = .0472
y
log(bwght) = 4.65 - .0052 cigs + .0110 log( faminc) + .017 parity
(.38) (.0010) (.0085) (.006)
+ .034 male + .045 white - .0030 motheduc + .0032 fatheduc
(.011) (.015) (.0030) (.0026)
n = 1,191, R2 = .0493.

Las variables se han definido como en el ejemplo 4.9, pero se ha agregado una variable
binaria que indica si el niño es varón (male) y que indica si el niño se clasifica como
blanco (white).
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

i) Interprete el coeficiente de la variable cigs en la primera ecuación. En


particular, ¿qué efecto tiene sobre el peso al nacer que la madre haya
fumado 10 cigarros más por día?
Disminuye un 4.4%
ii) En la primera ecuación, permaneciendo todos los demás factores
constantes, ¿cuánto más se predice que pese un niño blanco en
comparación con uno no blanco? ¿Es esta diferencia significativa?

iii) Analice el efecto estimado y la significancia estadística de motheduc.


iv) |Con base en la información dada, ¿por qué no puede usted calcular el
estadístico F para la significancia conjunta de motheduc y fatheduc? ¿Qué
tendría que hacer para calcular este estadístico F?

5.3 Con ayuda de los datos del archivo GPA2.WF1 se obtuvo la ecuación estimada
siguiente:
sat = 1,028.10 +19.30 hsize -2.19 hsize2 -45.09 female -169.81 black +62.31
female*black
(6.29) (3.83) (.53) (4.29) (12.71) (18.15)
2
n = 4,137, R = .0858.
La variable sat es la puntuación combinada en el examen de admisión (SAT), hsize es la
cantidad de alumnos, dada en cientos, que en la escuela del estudiante terminaron con
el bachillerato, female es una variable binaria para el género femenino y black es una
variable binaria para raza, que es igual a uno para negros y cero para los no negros.
i) ¿Existe alguna evidencia fuerte de que hsize2 deba ser incluida en el
modelo? Con base en esta ecuación, ¿cuál es el tamaño óptimo de una
escuela?
H0 βhsize^2=0
T = -2.19/0.53=4.13 => es estadísticamente significativo
Δsat/Δsize= 19.30-4.38size =0
Size= 19.30/4.38 = 4.40*100
Size = 440
El taño optimo es de 440 alumnos

ii) Manteniendo hsize constante, ¿cuál es la diferencia estimada en la


puntuación del SAT entre mujeres no negras y hombres no negros? ¿Qué
tan estadísticamente significativa es esta diferencia?
La diferencia es 45.09 entre mujeres no negras y hombres no negros.
T= 45.09/4.29=10.51
Es estadísticamente significativo.

iii) ¿Cuál es la diferencia estimada en la puntuación del SAT entre hombres no


negros y hombres negros? Pruebe la hipótesis nula de que no hay
diferencia entre estas puntuaciones contra la alternativa de que si hay
diferencia.
la diferencia es 169.81
t= 169.81/12.71=13.36
es estadísticamente significativo
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

iv) ¿Cuál es la diferencia estimada en la puntuación del SAT entre mujeres


negras y mujeres no negras? ¿Qué se necesita hacer para probar si esta
diferencia es estadísticamente significativa?
sat = 1,028.10 +19.30 hsize -2.19 hsize2 -45.09 female -169.81 black +62.31
female*black
(-45.09*1-169.81*1+62.31*1*1)-(-45.05*1-169.81*0+62.31*1*0))
Dif= 107.54
5.4 Una ecuación que explica el sueldo de los presidentes de consejos de
administración es:
̂
𝑅𝑅𝑅(𝑅𝑅𝑅𝑅𝑅𝑅) = 4.59 +.257 log(sales) +.011 roe +.158 finance +.181 consprod -.283
utility
(.30) (.032) (.004) (.089) (.085) (.099)
n = 209, R2 = .357.
Los datos que se emplearon son los del archivo CEOSAL1.WF1, donde finance,
consprod y utility son variables binarias que corresponden a las industrias financiera,
de productos de consumo y de servicios. La industria que se ha omitido es la del
transporte.
i) Calcule la diferencia porcentual aproximada entre los sueldos estimados de
las industrias de servicios y de transporte, manteniendo sales y roe
constantes. ¿Es esta diferencia estadísticamente significativa al nivel de
significancia de 1%?
ii) ¿Cuál es la diferencia porcentual aproximada entre los sueldos estimados
de la industria de productos de consumo y en el sector financiero? De una
ecuación que permita probar si esta diferencia es estadísticamente
significativa.

5.5 Use el ejemplo 7.2 de Wooldridge. Sea noPC una variable binaria igual a uno si el
estudiante no posee una PC e igual a cero en caso contrario.
i) Si en la ecuación (7.6) se usa noPC en lugar de PC, .que pasa con el
intercepto de la ecuación estimada? ¿Cuál será el coeficiente de noPC?
̂
(Sugerencia: escriba PC = 1 _ noPC y sustituya esto en la ecuación 𝑅𝑅𝑅𝑅𝑅𝑅
=𝑅̂0 + 𝑅
̂ 0 PC + 𝑅
̂ 1 hsGPA + 𝑅
̂ 2 ACT.).
ii) ¿Qué ocurre con la R-cuadrada si en lugar de PC se usa noPC?
iii) ¿Deben incluirse ambas, PC y noPC como variables independientes en el
modelo? Explique.

E J E R C I C I O S E N COM P U TADOR A
5.6 Para este ejercicio emplee los datos del archivo WAGE2.WF1.
i) Estime el modelo:
log(wage) = β0 +β1educ +β2exper +β3tenure +β4married +β5black +β6south
+β7urban + u
y de el resultado en la forma habitual. Manteniendo todos los demás factores
constantes,

Dependent Variable: LWAGE


Method: Least Squares
Date: 04/21/18 Time: 21:02
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

Sample: 1 935
Included observations: 935

Variable Coefficient Std. Error t-Statistic Prob.

C 5.395497 0.113225 47.65286 0.0000


EDUC 0.065431 0.006250 10.46826 0.0000
EXPER 0.014043 0.003185 4.408852 0.0000
TENURE 0.011747 0.002453 4.788999 0.0000
MARRIED 0.199417 0.039050 5.106691 0.0000
BLACK -0.188350 0.037667 -5.000445 0.0000
SOUTH -0.090904 0.026249 -3.463194 0.0006
URBAN 0.183912 0.026958 6.822087 0.0000

R-squared 0.252558 Mean dependent var 6.779004


Adjusted R-squared 0.246914 S.D. dependent var 0.421144
S.E. of regression 0.365471 Akaike info criterion 0.833260
Sum squared resid 123.8185 Schwarz criterion 0.874676
Log likelihood -381.5489 Hannan-Quinn criter. 0.849052
F-statistic 44.74707 Durbin-Watson stat 1.822637
Prob(F-statistic) 0.000000

Log(wage)= 5.395 + 0.065educ + 0.014exper + 0.0117tenure + 0.1994married


– 0.188 black – 0.091south + 0.184urban
N= 935 R2= 0.252558
ii) ¿cuál es la diferencia aproximada entre el salario mensual de negros y no
negros? ¿Es esta diferencia estadísticamente significativa?
si existe diferencia ya que los trabajadores negros ganan un 18,8 % menos que los
trabajadores blancos y con estos datos irrelevantes podemos observar que existe
discriminación por la raza
iii) Agregue a esta ecuación las variables exper2 y tenure2 y muestre que no son
conjuntamente significativas al nivel de 20%.

H0: β8=β9=0
Dependent Variable: LWAGE
Method: Least Squares
Date: 04/10/18 Time: 11:09
Sample: 1 935
Included observations: 935

Variable Coefficient Std. Error t-Statistic Prob.

C 5.358676 0.125914 42.55812 0.0000


EDUC 0.064276 0.006311 10.18400 0.0000
EXPER 0.017215 0.012614 1.364745 0.1727
TENURE 0.024929 0.008130 3.066434 0.0022
MARRIED 0.198547 0.039110 5.076585 0.0000
BLACK -0.190664 0.037701 -5.057241 0.0000
SOUTH -0.091215 0.026236 -3.476774 0.0005
URBAN 0.185424 0.026959 6.878121 0.0000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

EXPER*EXPER -0.000114 0.000532 -0.213963 0.8306


TENURE*TENURE -0.000796 0.000471 -1.690924 0.0912

R-squared 0.254958 Mean dependent var 6.779004


Adjusted R-squared 0.247709 S.D. dependent var 0.421144

no son significativas ya que están fuera del nivel de significancia

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 1.489807 (2, 925) 0.2260


Chi-square 2.979615 2 0.2254

Null Hypothesis: C(9)=C(10)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(9) -0.000114 0.000532


C(10) -0.000796 0.000471

Por lo tanto, aceptamos la hipótesis nula de que los exper2 y tenure2


conjuntamente no sean estadísticamente significativas para un para el nivel de
20%.
iv) Amplíe el modelo original de manera que el rendimiento a la educación
dependa de la raza y pruebe si en realidad el rendimiento de la educación
depende de la raza.

v) Partiendo nuevamente del modelo original, permita que los salarios difieran
entre cuatro grupos: casados negros, casados no negros, solteros negros y
solteros no negros. ¿Cuál es la diferencia de salario estimada entre negros
casados y no negros casados?

5.7 Para este ejercicio use la base de datos SLEEP75.WF1. La ecuación de interés es
sleep = β0 + β1totwrk + β2educ + β3age + β4age2 + β5yngkid + u.
i) Estime esta ecuación por separado para hombres y mujeres y de los
resultados de la manera habitual. ¿Hay diferencias importantes entre las
dos ecuaciones estimadas?
Regresión para mujeres
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

Dependent Variable: SLEEP


Method: Least Squares
Date: 04/10/18 Time: 10:14
Sample: 1 306
Included observations: 306

Variable Coefficient Std. Error t-Statistic Prob.

C 4238.729 384.8923 11.01277 0.0000


TOTWRK -0.139950 0.027659 -5.059738 0.0000
EDUC -10.20514 9.588848 -1.064271 0.2881
AGE -30.35657 18.53091 -1.638159 0.1024
AGESQ 0.367941 0.223340 1.647447 0.1005
YNGKID -118.2826 93.18757 -1.269295 0.2053

R-squared 0.097678 Mean dependent var 3284.588


Adjusted R-squared 0.082639 S.D. dependent var 456.2504
S.E. of regression 436.9919 Akaike info criterion 15.01712
Sum squared resid 57288576 Schwarz criterion 15.09013
Log likelihood -2291.619 Hannan-Quinn criter. 15.04632
F-statistic 6.495092 Durbin-Watson stat 1.931310
Prob(F-statistic) 0.000009

Regresión para hombres


Dependent Variable: SLEEP
Method: Least Squares
Date: 04/10/18 Time: 10:18
Sample: 1 400
Included observations: 400

Variable Coefficient Std. Error t-Statistic Prob.

C 3648.208 310.0393 11.76692 0.0000


TOTWRK -0.182123 0.024486 -7.437990 0.0000
EDUC -13.05238 7.414218 -1.760453 0.0791
AGE 7.156591 14.32037 0.499749 0.6175
AGESQ -0.044767 0.168405 -0.265831 0.7905
YNGKID 60.38021 59.02278 1.022998 0.3069

R-squared 0.156228 Mean dependent var 3252.408


Adjusted R-squared 0.145520 S.D. dependent var 435.1998
S.E. of regression 402.2903 Akaike info criterion 14.84711
Sum squared resid 63763979 Schwarz criterion 14.90698
Log likelihood -2963.422 Hannan-Quinn criter. 14.87082
F-statistic 14.59014 Durbin-Watson stat 2.060775
Prob(F-statistic) 0.000000

Regresión de hombres y mujeres


Dependent Variable: SLEEP
Method: Least Squares
Date: 04/10/18 Time: 10:21
Sample: 1 706
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

Included observations: 706

Variable Coefficient Std. Error t-Statistic Prob.

C 3825.375 240.2585 15.92191 0.0000


TOTWRK -0.146046 0.016881 -8.651575 0.0000
EDUC -11.13772 5.890168 -1.890900 0.0591
AGE -8.123949 11.37049 -0.714477 0.4752
AGESQ 0.126287 0.135186 0.934172 0.3505
YNGKID 17.15441 50.00839 0.343031 0.7317

R-squared 0.114711 Mean dependent var 3266.356


Adjusted R-squared 0.108388 S.D. dependent var 444.4134
S.E. of regression 419.6384 Akaike info criterion 14.92513
Sum squared resid 1.23E+08 Schwarz criterion 14.96388
Log likelihood -5262.569 Hannan-Quinn criter. 14.94010
F-statistic 18.14051 Durbin-Watson stat 1.938666
Prob(F-statistic) 0.000000

𝑅𝑅𝑅−(𝑅𝑅𝑅𝑅 +𝑅𝑅𝑅𝑅 )/𝑅


F= 𝑅𝑅𝑅 chow
𝑅−2(𝑅+1)
ii) Realice la prueba de Chow para la igualdad entre los parámetros para
hombres y mujeres en la ecuación del sueño. Utilice la forma de la prueba
en la que se agrega male (hombre) y los términos de interacción
male*totwrk, …, male*yngkid y se usa el conjunto completo de
observaciones. ¿Cuáles son los gdl pertinentes en esta prueba? ¿Debe
rechazarse la hipótesis nula al nivel de significancia de 5%?

iii) Ahora tome en consideración interceptos diferentes entre hombres y


mujeres y determine si los términos de interacción en los que parece male
son conjuntamente significativos.
iv) Dados los resultados de los incisos ii) y iii), ¿cuál es el modelo final?
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

5.8 Para este ejercicio emplee los datos del archivo 401KSUBS.WF1.
i) Calcule promedio, desviación estándar y los valores mínimo y máximo de
nettfa en la muestra.

Desviacion estándar = 63.96384


Minimo = -502.3020
Máximo = 1536.798

ii) Pruebe la hipótesis de que el nettfa promedio no difiere de acuerdo con la


elegibilidad para un plan 401(k): emplee una alternativa de dos colas. ¿Cuál
es el monto en dólares de la diferencia estimada?

ls nettfa c e401k

Dependent Variable: NETTFA


Method: Least Squares
Date: 04/21/18 Time: 10:04
Sample: 1 9275
Included observations: 9275

Variable Coefficient Std. Error t-Statistic Prob.

C 11.67677 0.843041 13.85079 0.0000


E401K 18.85832 1.346275 14.00778 0.0000

R-squared 0.020722 Mean dependent var 19.07168


Adjusted R-squared 0.020616 S.D. dependent var 63.96384
S.E. of regression 63.30106 Akaike info criterion 11.13390
Sum squared resid 37157140 Schwarz criterion 11.13544
Log likelihood -51631.45 Hannan-Quinn criter. 11.13442
F-statistic 196.2178 Durbin-Watson stat 1.911650
Prob(F-statistic) 0.000000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

H0 β1= 0
Wald Test:
Equation: Untitled

Test Statistic Value Df Probability

t-statistic 14.00778 9273 0.0000


F-statistic 196.2178 (1, 9273) 0.0000
Chi-square 196.2178 1 0.0000

Por lo tanto rechazamos la hipótesis nula de que e401k no tenga efecto sobre neffta,
es decir β1 es estadísticamente significativo.

La diferencia entre una persona elegible para el plan 401k es de 18.858,32 dólares. Es
coeficiente de 401K es estadísticamente significativo.

iii) En un modelo de regresión simple, e401k no es exógeno: como mínimo


varía de acuerdo con el ingreso y con la edad. Estime un modelo de
regresión lineal múltiple para nettfa que como variables explicativas incluya
ingreso, edad y e401k. Las variables ingreso y edad deben aparecer en
forma cuadrática. Ahora, ¿cuál es el efecto en dólares de la elegibilidad a un
plan 401(k)?
Dependent Variable: NETTFA
Method: Least Squares
Date: 04/22/18 Time: 10:32
Sample: 1 9275
Included observations: 9275

Variable Coefficient Std. Error t-Statistic Prob.

C 23.08520 9.959705 2.317860 0.0205


INC -0.278465 0.074539 -3.735853 0.0002
INCSQ 0.010260 0.000587 17.48083 0.0000
AGE -1.971886 0.483377 -4.079392 0.0000
AGESQ 0.034764 0.005549 6.265187 0.0000
E401K 9.704688 1.277406 7.597182 0.0000

R-squared 0.201806 Mean dependent var 19.07168


Adjusted R-squared 0.201375 S.D. dependent var 63.96384
S.E. of regression 57.16180 Akaike info criterion 10.93030
Sum squared resid 30286189 Schwarz criterion 10.93491
Log likelihood -50683.24 Hannan-Quinn criter. 10.93186
F-statistic 468.6928 Durbin-Watson stat 1.940335
Prob(F-statistic) 0.000000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

Nettfa = 23.08520 – 0.2784inc + 0.01026incsq – 1.971886age + 0.03476agsq +


9.704688e4012k
La diferencia entre una persona elegible para el plan 401k es de 9704,688 dólares. Es
coeficiente de 401K es estadísticamente significativo. Ya que al agregar más variables
significativas nuestro coeficiente va variar.

iv) Al modelo estimado en el inciso iii), agregue las interacciones e401k・(age -


41) y e401k・(age - 41)2. Observe que en la muestra, la edad promedio es
aproximadamente 41 años, de manera que en el nuevo modelo, el
coeficiente de e401k es el efecto estimado de la elegibilidad para el plan
401(k) a la edad promedio. ¿Cuál de los términos de interacción es
significativo?
Dependent Variable: NETTFA
Method: Least Squares
Date: 04/22/18 Time: 10:38
Sample: 1 9275
Included observations: 9275

Variable Coefficient Std. Error t-Statistic Prob.

C 34.58411 12.18630 2.837951 0.0046


INC -0.278699 0.074439 -3.743972 0.0002
INCSQ 0.010231 0.000586 17.45294 0.0000
AGE -2.316929 0.590872 -3.921206 0.0001
AGESQ 0.036246 0.006781 5.345103 0.0000
E401K 9.959844 1.718524 5.795581 0.0000
E401K*(AGE-41) 0.654154 0.131330 4.981004 0.0000
E401K*(AGE-41)^2 -0.003789 0.011627 -0.325843 0.7446

R-squared 0.204183 Mean dependent var 19.07168


Adjusted R-squared 0.203581 S.D. dependent var 63.96384
S.E. of regression 57.08279 Akaike info criterion 10.92774
Sum squared resid 30196010 Schwarz criterion 10.93390
Log likelihood -50669.42 Hannan-Quinn criter. 10.92984
F-statistic 339.6616 Durbin-Watson stat 1.940778
Prob(F-statistic) 0.000000

nettfa = 34.58 – 0.278inc + 0.010incsq – 2.317age + 0.036agsq + 9.9598e401k +


0.654E401K*(AGE-41) – 0.003789 E401K*(AGE-41)^2
PRIMER TERMINO

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic 4.981004 9267 0.0000


F-statistic 24.81040 (1, 9267) 0.0000
Chi-square 24.81040 1 0.0000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

SEGUNDO TERMINO
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic -0.325843 9267 0.7446


F-statistic 0.106173 (1, 9267) 0.7446
Chi-square 0.106173 1 0.7445

El primer término es estadísticamente significativo ya que tenemos rechazamos que β 6


sea igual a cero.
v) Compare las estimaciones de los incisos iii) y iv), ¿difieren mucho los
efectos estimados de la elegibilidad para el plan 401(k) a la edad de 41
años? Explique.
iii) 9704,688 iv) 9959.844 => 255.156
No diere demasiando porque es tan solo 255.156 dólares por persona al agregar
nuevas variables explicativas.
vi) Ahora elimine del modelo los términos de interacción, pero defina cinco
variables binarias para tamaño de la familia: fsize1, fsize2, fsize3, fsize4 y
fsize5. La variable fsize5 es uno para familias que tengan de cinco o más
miembros. Incluya las variables binarias del tamaño de familia al modelo
estimado en el inciso iii); no olvide elegir un grupo base. ¿Las variables
binarias son significativas al nivel de 1%?.
Dependent Variable: NETTFA
Method: Least Squares
Date: 04/22/18 Time: 11:11
Sample: 1 9275
Included observations: 9275

Variable Coefficient Std. Error t-Statistic Prob.

C 16.33660 10.11569 1.614976 0.1064


E401K 9.455226 1.277822 7.399484 0.0000
INC -0.239868 0.075493 -3.177337 0.0015
INCSQ 0.010045 0.000589 17.04198 0.0000
AGE -1.494896 0.494640 -3.022189 0.0025
AGESQ 0.028996 0.005699 5.087760 0.0000
FSIZE2 -0.858935 1.818043 -0.472451 0.6366
FSIZE3 -4.665168 1.876849 -2.485639 0.0129
FSIZE4 -6.314752 1.867991 -3.380504 0.0007
FSIZE5 -7.360889 2.100614 -3.504161 0.0005

R-squared 0.203677 Mean dependent var 19.07168


Adjusted R-squared 0.202903 S.D. dependent var 63.96384
S.E. of regression 57.10710 Akaike info criterion 10.92881
Sum squared resid 30215207 Schwarz criterion 10.93650
Log likelihood -50672.36 Hannan-Quinn criter. 10.93143
F-statistic 263.3023 Durbin-Watson stat 1.938894
Prob(F-statistic) 0.000000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

H0; α1+

F(4,9265)=5.44 => R H0 => LOS DELTAS SON ESTADISTICAMENTE SIGNIFICATIVOS EN


CONJUNTO AL 1%

vii) Ahora, realice una prueba Chow para el modelo


nettfa = β0 +β1inc +β2inc2 +β3age +β4age2 +β5e401k + u
para las cinco categorías de tamaños de familias, considerando diferencias en el
intercepto. La suma restringida de residuales cuadrados, SRCr, se obtiene
del inciso vi) porque en esa regresión se supone que todas las pendientes
son iguales. La suma no restringida de residuales cuadrados es SRCur = SRC1
+SRC2 + ... + SRC5, donde SRCf es la suma de residuales cuadrados para la
ecuación estimada usando solo el tamaño f de la familia. Debe convencerse
de que en el modelo no restringido hay 30 parámetros (5 interceptos más
25 pendientes) y 10 parámetros en el modelo restringido (5 interceptos
más 5 pendientes). Por tanto, la cantidad de restricciones que se prueban
es q = 20, y los gdl para el modelo no restringido son 9,275 - 30 = 9,245.

Dependent Variable: NETTFA


Method: Least Squares
Date: 04/22/18 Time: 10:40
Sample: 1 9275
Included observations: 9275

Variable Coefficient Std. Error t-Statistic Prob.

C 23.08520 9.959705 2.317860 0.0205


INC -0.278465 0.074539 -3.735853 0.0002
INCSQ 0.010260 0.000587 17.48083 0.0000
AGE -1.971886 0.483377 -4.079392 0.0000
AGESQ 0.034764 0.005549 6.265187 0.0000
E401K 9.704688 1.277406 7.597182 0.0000

R-squared 0.201806 Mean dependent var 19.07168


Adjusted R-squared 0.201375 S.D. dependent var 63.96384
S.E. of regression 57.16180 Akaike info criterion 10.93030
Sum squared resid 30286189 Schwarz criterion 10.93491
Log likelihood -50683.24 Hannan-Quinn criter. 10.93186
F-statistic 468.6928 Durbin-Watson stat 1.960199
Prob(F-statistic) 0.000000

Chow Breakpoint Test: 1240 3230 5059 7258


Null Hypothesis: No breaks at specified breakpoints
Varying regressors: All equation variables
Equation Sample: 1 9275

F-statistic 3.857986 Prob. F(24,9245) 0.0000


Log likelihood ratio 92.43003 Prob. Chi-Square(24) 0.0000
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

Wald Statistic 92.59166 Prob. Chi-Square(24) 0.0000

Por lo tanto rechazamos la hipótesis nula de que existan pendientes iguales a cero, es
decir existen pendientes distintas de cero. Obteniendo un F = 3.8579 Y Con un p.value
igual a 0.000.
El tamaño de la familia influye en la posesión de activos financieros
5.9 Para responder esta pregunta, utilice los datos del archivo APPLE.WF1.
i) Defina una variable binaria ecobuy = 1 si ecolbs > 0 y ecobuy = 0 si ecolbs =
0. En otras palabras, ecobuy indica si, a los precios dados, una familia
comprara manzanas ecológicas. ¿Cuál es la proporción de familias que
asegura que comprara manzanas eco etiquetadas?
(660/100%)*(412/x)=100%*412/660
X = 0.624
X=62.4%

ii) Estime el modelo de probabilidad lineal:


ecobuy =β0 +β1ecoprc +β2 regprc +β3 faminc +β4 hhsize +β5 educ +β6 age + u,
y dé los resultados de la manera habitual. Interprete cuidadosamente los
coeficientes de las variables de precio (ecoprc es el precio de las manzanas
eco etiquetadas y regprc el de las manzanas regulares).
-0.8026*5=-4.0
Si los precios de las manzanas regulares suben entonces la probabilidad de vender más
manzanas ecológicas sube. Manteniendo todo lo demás constante.
Cuando mis precios suben 5bs mi probabilidad de que p(y=1.5) de vender van a vajar
4%

i) ¿Son conjuntamente significativas las variables que no corresponden a


precios en el MPL? (Emplee el estadístico F usual, aun cuando no sea valido
cuando existe heterocedasticidad.) ¿Cuál es la variable explicativa, además
de las variables relacionadas con el precio, que parece tener un efecto más
importante sobre la decisión de comprar manzanas ecológicas? ¿Le parece
que esto tiene sentido?
H0= β3= β4= β5= β6=0
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 4.427551 (4, 653) 0.0015


Chi-square 17.71020 4 0.0014

Por lo tanto se rechaza la hipótesis nula de que las variables sean igual 0 es decir
son estadísticamente significativas.
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

iii) En el modelo del inciso ii) sustituya faminc por log(faminc). ¿Qué modelo se
ajusta mejor a los datos, el modelo con faminc o el modelo con log(faminc)?
Interprete el coeficiente de log(faminc).
Dependent Variable: ECOBUY
Method: Least Squares
Date: 04/22/18 Time: 10:22
Sample: 1 660
Included observations: 660

Variable Coefficient Std. Error t-Statistic Prob.

C 0.303752 0.178960 1.697313 0.0901


ECOPRC -0.800666 0.109298 -7.325526 0.0000
REGPRC 0.721377 0.131520 5.484938 0.0000
LOG(FAMINC) 0.044516 0.028724 1.549798 0.1217
HHSIZE 0.022700 0.012543 1.809781 0.0708
EDUC 0.023093 0.008451 2.732643 0.0065
AGE -0.000387 0.001252 -0.308795 0.7576

R-squared 0.111611 Mean dependent var 0.624242


Adjusted R-squared 0.103448 S.D. dependent var 0.484685
S.E. of regression 0.458931 Akaike info criterion 1.290716
Sum squared resid 137.5334 Schwarz criterion 1.338361
Log likelihood -418.9364 Hannan-Quinn criter. 1.309184
F-statistic 13.67302 Durbin-Watson stat 2.088499
Prob(F-statistic) 0.000000

Aplicando log a faminc se ajusta mejor al modelo porque nuestros errores se


aproximan mucho más a 1.
iv) En la estimación del inciso iv), ¿cuántas probabilidades estimadas son
negativas? ¿Cuántas son mayores a uno? ¿Debe preocuparle?

Hay dos individuos que se pasan del 1% y no son importantes porque solo son
2/660 individuos.
No existen probabilidades negativas.

Algunas guías para Respuestas.


5.4 i) estadístico t=-2.86, ii) =-24.7%, iii)la diferencia es 0.023. Una ecuación que podría
ser estimada para obtener el error estándar tiene como grupo base finance.
̂ 0 = 1.26 y 𝑅
5.5 i) 𝑅 ̂ 0=.157. El coeficiente en noPC es -.157.
Isaiariki miyatake medina r1171-1 Lic. Alejandro Chamas De los Rios

5.6 i) los hombres de raza negra ganan 18.8% menos. Ii) el estadístico F con 2 y 925 gdl
es 1.49. iii) El coeficiente de la interacción es -.226. iv) escogemos soltero como el
grupo base y obtenemnos una diferencia de -0.18 entre negros casados y no negros
casados.
5.7 ii) El estadístico F (con 6 y 694 gdl) es 2.12. iii) el estadístico F (5 y 694 gdl) es 1.26.
5.8 i) promedio es 19.072. ii) regresión entre nettfa sobre e401k: 𝑅 ̂ ek01k=18.858…. una
familia elefible para un plan 401(k) tiene $18,858 más de activos fincncieros netos. Iii)
una familia elegible para 401(k) tiene $9,705 más de riqueza que una familia no
elegible. Iv) el coeficiente de la interacción es .654. v) el efecto de e401k en iii) es el
mismo para todas las edades 9,705, el efecto en la parte iv) es 9,960 es el efecto sobre
la edad promedio (41). vi) tomando fsize1 como grupo base estimamos la ecuación y el
F estadístico es 5.44.vii) el SSR de vi) es 30,215,207.5. La SSR de ur es 29,985,400. Esl
estadístico de Chow es 3.54
5.9 i) 0.624. ii) si ecoprc, incrementa en 10 ctvs (0.10) la probabilidad de comprar
manzanas eco etiquetadas cae por .080. iii)el Test F, con y 653 gdl es 4.43. iv) el
modelo con log(faminc) tine un R cuadrado más alto en .112. v) el rgango de
probabilidades va de 0.185 a 1.051, existen dos probabildiades mayores a 1. Vi) usando
la regla estandar de predicción, se predice uno cuando 𝑅𝑅𝑅𝑅𝑅𝑅 ̂ i ≥ .5 y cero en otro
caso, nos otorga la fracción predicha para ecobuy=0 como = .411. para ecobuy=1 es del
82.5%

S-ar putea să vă placă și