Sunteți pe pagina 1din 7

Modelo de regresión lineal simple

Cali-Julio/2019

Estadísti a Apli ada II

Tarea 2

1, a 1, b
Bradley Campo Hurtado , Karen Daniela López Villegas

1 Es uela de Estadísti a, Universidad del Valle, Cali, Colombia

1. Introdu ión

El Análisis de regresión lineal simple permite estable er la rela ión que se


produ e entre una variable dependiente y una variable independiente, así mismo, es
posible estimar los oe ientes de regresión del modelo y evaluar mediante pruebas
de hipótesis si éstos son signi ativos o no. Por otra parte, es importante probar
la alidad de ajuste para determinar si realmente se está ajustando y des ribiendo
orre tamente a la variable dependiente, por último se tiene que la intera ión se
da uando la aso ia ión entre dos variables varía según los diferentes niveles de
otra u otras variables. El siguiente trabajo ontiene informa ión a er a de modelos
lineales simples y múltiples planteados a partir de la ne esidad de ono er uales
son las variables que mejor des riben a la variable salario, todo esto apli ado a 534
datos muestreados de la En uesta de Pobla ión A tual (CPS) de Estados Unidos,
los datos ontienen informa ión a er a de 11 variables tales omo el salario y
otras ara terísti as in luyendo el sexo, años de estudio, o upa ión, entre otras.
En este do umento se tratarán algunas de ellas tales omo: Salario omo variable
de respuesta, Años de estudio y Sexo omo ovariables. A ada uno de los modelos
planteados se le evaluará la alidad, se al ularán intervalos de onanza para los
oe ientes de regresión de uno de ellos y además se medirá si hay intera ión
entre las variables sexo y años de estudio.

2. Punto 1

El modelo ajustado que se obtuvo entre la variable de respuesta Salario y la


variable de predi ión Años de Estudio fue el siguiente:
a Universidad del Valle. E-mail: bradley. ampo orreounivalle.edu. o
b Universidad del Valle. E-mail: karen.daniela.lopez orreounivalle.edu. o

1
2 Bradley Campo Hurtado & Karen Daniela López Villegas

Tabla 1: Modelo ajustado 1


Coe ientes Estima ión Valor-p
Inter epto βˆ0 -0.74598 0.476
Estudios βˆ1 0.75046 < 2 · 10−16

Modelo ajustado 1:
Y = −0.74598 + 0.75046Estudios (1)
Y= Salario en dólares por hora trabajada

3. Punto 2

Juzgue la alidad del modelo ajustado, in luyendo al menos su interpreta ión


del R2 , de los valores-p obtenidos y de los oe ientes de regresión.

Tabla 2: Coe ientes del modelo ajustado 1


R2 R2 ajustado Valor-p aso iado a la prueba F
0.1459 0.1443 < 2.2 · 10−16

Lo primero que se interpretará para evaluar la alidad del modelo ajustado será
el valor p que está aso iado a la siguiente prueba de hipótesis: H0 : β0 = β1 = 0
Vs H1 : βj 6= 0 al menos para algún j, uyo resultado fue < 2.2 · 10−16 lo que es
menor al nivel de signi an ia α = 0.05 y es posible inferir que al menos uno de
los betas es diferente de ero y tiene sentido seguir on las interpreta iones. Por
otro lado se en uentran los valores del R2 y Rajustado
2
que son 0.1459 y 0.1443 res-
pe tivamente, teniendo en uenta la deni ión de oe iente de determina ión se
puede de ir que estos valores al ser lejanos de 1, indi an que el modelo no presenta
un buen ajuste, es de ir, no es pre iso y no esta des ribiendo orre tamente a la
variable predi tora en este aso al Salario. Por lo que se puede llegar a proponer
otro modelo on mejor ajuste.

En uanto a los oe ientes de regresión del modelo ajustado 1, se interpretarán


los valores p que están aso iados a las pruebas de hipótesis H0 : βi = 0 vs H1 :
βi 6= 0 on α = 0.05 para i=0,1. Se puede inferir para β0 que no hay eviden ia
muestral su iente para armar que éste es diferente de ero y por lo tanto no
sería signi ativo en el modelo, por otro lado esta β1 quien tiene un valor p mayor
al α estable ido y por lo que se puede de ir que hay eviden ia muestral su iente
para armar que β1 es diferente de ero, por ende sería signi ativo en el modelo.
Por ultimo, se dirá de las estima iones que por ada año que estudie un individuo
su salario aumentará en 0.75046 dólares por hora, teniendo en uenta, que el valor
mínimo en la muestra obtenida es de 2 años de estudio no tendría sentido ha er
una interpreta ión para el inter epto.

Modelo de regresión lineal simple


El modelo de regresión lineal simple 3

4. Punto 3

Construya e interprete los intervalos del 95 % de onanza para β0 y β1 .

q
< βj >1−α % = {βˆj ± t(n−p;α/2) · Cjj · σˆ2 }; Donde Cjj es (X T X)−1 y
σˆ2 = 22.60039

q
< β0 >95 % = {βˆ0 ± t(534−2;0.025) · C00 · σˆ2 }
= {−2.7997043; 1.3077449}

q
< β1 >95 % = {βˆ1 ± t(534−2;0.025) · C11 · σˆ2 }
= {0.5957936; 0.9051279}

En este aso, se tiene para β0 un intervalo de onanza que presenta más amplitud
on respe to de β1 , además ontiene el ero lo ual no es un buen indi ador ya
que el parámetro no esta exento de tomar di ho valor y por lo tanto no sería
signi ativo en el modelo. Por otra parte, el intervalo para β1 no es tan amplio
omo el de β0 y no ontiene al ero, lo que es bueno ya que una pendiente ero
querría de ir que no hay rela ión lineal entre Salario y años de estudio, del intervalo
es posible armar on un 95 % de onanza que por ada año de estudio adi ional,
el salario in rementa entre {0.5957936; 0.9051279} dólares por hora.

5. Punto 4

Adi ione ahora la variable sexo al modelo e interprete uidadosamente sus


resultados. ¾Es este modelo mejor que el anterior? ¾Por qué?

Tabla 3: Modelo ajustado 2


Coe ientes Estima ión Valor-p
Inter epto βˆ0 0.21783 0.834
Estudios βˆ1 0.75128 < 2 · 10−16
SexoMujer βˆ2 -2.12406 1.96 · 10−07

Modelo ajustado 2:

Y = 0.21783 + 0.75128Estudios − 2.12406SexoM ujer (2)

Y= Salario en dólares por hora trabajada

Modelo de regresión lineal simple


4 Bradley Campo Hurtado & Karen Daniela López Villegas

Tabla 4: Coe ientes del modelo ajustado 2


R2 R2 ajustado Valor-p aso iado a la prueba F
0.1884 0.1853 < 2.2 · 10−16

Al igual que on el modelo anterior se tendrán en uenta los mismos aspe tos
para evaluar la alidad, en uanto al valor p aso iado a la prueba antes men ionada
( H0 : β0 = β1 = 0 Vs H1 : βj 6= 0 al menos para algún j) se obtuvo un resultado
menor a 2.2·10−16 lo ual indi a que on un nivel de signi an ia α = 0.05 al menos
uno de los betas in luidos en el modelo es diferente de ero. Para los resultados
de los oe ientes de determina ión se obtuvo que R2 = 0.1884 y R2 ajustado
=0.1853, aunque estos valores son bajos, tienen un in remento alrededor de 0.04
on respe to a los valores arrojados por el modelo 1, por lo que se podría llegar a
pensar que este modelo presenta mejor ajuste que el anterior, ademas puede llegar
a umplir on el objetivo de des ribir un po o mejor a la variable Salario y por
lo tanto es el mejor. Revisando los valores p aso iados a ada uno de los betas se
en ontró que las estima iones βˆ1 (Estudios) y βˆ2 (SexoMujer) son signi ativas en
el modelo.
En uanto a los oe ientes de regresión se tiene que una mujer disminuye su
salario en 2.12406 dólares por hora on respe to al de un hombre, por otro lado
se tiene que por ada año de estudio el individuo aumentará su salario en 0.75128
dólares por hora.

6. Punto 5

¾Puede on luirse de sus resultados que los salarios de hombres y mujeres son
iguales?¾Por qué?

q
< β2 >95 % = {βˆ2 ± t(534−2;0.025) · C22 · σˆ2 }
= {−2.9153971; −1.3327164}

Del intervalo de onanza para β2 , se puede argüir on un 95 % de onanza que


en promedio el salario de una mujer disminuye entre {−2.9153971; −1.3327164}
dólares por hora on respe to al de un hombre.

Modelo de regresión lineal simple


El modelo de regresión lineal simple 5

40

30

sexo
Salario

hombre
mujer
20

10

5 10 15
Años de Estudios

Figura 1: Salario Vs años de estudio y sexo

De la grá a se puede ver que la diferen ia entre la re ta de hombres y mujeres


es signi ativa. Además, a medida que in rementan los años de estudio el salario
aumenta en ambos sexos (en algunos asos). Sin embargo, el sexo femenino presenta
una remunera ión más baja, en efe to el salario de la mujer por hora disminuye
2.12406 on respe to al de un hombre.

7. Punto 6

Intera ión estudios-sexo

Tabla 5: Modelo ajustado 3


Coe ientes Estima ión Valor-p
Inter epto βˆ0 1.10457 0.4008
Estudios βˆ1 0.68315 1.32e−11
Sexomujer βˆ2 -4.37045 0.0365
Estudios:SexoMujer βˆ3 0.17253 0.2727

Modelo ajustado 3:

Y = 1.10457+0.68315Estudios−4.37045SexoM ujer+0.17253Estudios∗SexoM ujer

Modelo de regresión lineal simple


6 Bradley Campo Hurtado & Karen Daniela López Villegas

Tabla 6: Coe ientes del modelo ajustado 3


R2 R2 ajustado Valor-p aso iado a la prueba F
0.1902 0.1856 < 2.2e−16

40

30

sexo
Salario

hombre
mujer
20

10

5 10 15
Años de Estudios

Figura 2: Intera ión entre estudios-sexo

Se realiza la intera ión entre las variables años de estudio y el sexo on el n


de determinar si entre ellas existe algún tipo de rela ión que permita des ribir la
variable de respuesta salario, de a uerdo a los modelos planteados anteriormente
sin tener en uenta la intera ión, se ha demostrado que di has variables han sido
inuyentes. Al analizar la grá a se observa que no existe algún tipo de intera ión
entre ellas, además β3 obtuvo un valor p alto, es de ir, que al añadir esta variable
al modelo no es signi ativo en ontraste on los demás, por lo tanto, no hay
eviden ia para suponer que alguno de los dos sexos tiene mayor ingreso, ya que no
presenta un punto donde se eviden ie un ambio salarial entre los dos géneros.

Para el análisis del modelo se tiene en uenta la prueba de hipótesis H0 : βi = 0


vs H1 : βi 6= 0 on α = 0.05 para i=0,1,2,3, se analiza ada valor p y se dedu e que
β0 y β3 no son signi ativos en el modelo. No obstante, on ayuda del oe iente
de determina ión se ono e la apa idad expli ativa de las variables predi toras a
la variable de respuesta salario, se obtuvo un R2 = 0.1902 y RAjustado
2
= 0.1856 al
ser valores pequeños se puede inferir que el modelo no presenta un buen ajuste y
no des ribe de manera a ertada la variable predi tora. De a uerdo a los resultados
men ionados, se puede on luir que este modelo no es el mejor.

Modelo de regresión lineal simple


El modelo de regresión lineal simple 7

Referen ias

Candia, R., Caiozzi, A. et al. (2005), `Intervalos de onanza', Revista médi a de


Chile 133(9), 11111115.
Fran is o, L. J. (n.d.), `Coe iente de determina ión (r uadrado)',
urlhttps://e onomipedia. om/deni iones/r- uadrado- oe iente-
determina ion.html.
Mario, M. M. (2018), `Coe iente de orrela ión en r',
urlhttps://vivaelsoftwarelibre. om/ oe iente-de- orrela ion-en-r/.
Montgomery, Douglas y Pe k, E. y. V. G. G. (2006), Introdu ión al análisis de
regresión lineal.

Modelo de regresión lineal simple

S-ar putea să vă placă și