Documente Academic
Documente Profesional
Documente Cultură
El investigador suele tener razones tericas o prcticas para creer que determinada variable es causalmente dependiente de una o ms variables distintas. Si hay suficientes observaciones empricas sobre estas variables, el anlisis de regresin es un mtodo apropiado para describir la estructura, fuerza y sentido exacto de esta asociacin.
= b0 + b1x1 + bnxn
donde los coeficientes b0 y b1, bn, son los factores que definen la variacin promedio de y, para cada valor de x. Estimada esta funcin terica a partir de los datos, cabe preguntarse qu tan bien se ajusta a la distribucin real.
En el caso de asumir una recta, se admite que existe una proporcin entre la diferencia de dos valores A y la diferencia entre dos valores de B. A ese factor de ajuste entre ambas series se le llama pendiente de la recta, y se asume que es constante a lo largo de toda la recta.
y = a + bx
Las variables aleatorias j deben tener una varianza finita 2 que es constante para todos los valores de xj . (Supuesto 4 o de homocedasticidad)
El ingreso horario de los ocupados (entre 25 y 45 aos) no se ve afectados por el sexo sino que depende de la cantidad de aos de instruccin
60
40
20
Sexo
Mujer 0 0 10 20 Varn
Model 1 2
Variables Removed , ,
a. All requested variables entered. b. Dependent Variable: Ingreso horario de la ocupacin ppal
Model Summary
Model 1 2
a. Predictors: (Constant), Sexo (dummy: 0=Varn) b. Predictors: (Constant), Sexo (dummy: 0=Varn), Aos de estudio (aprox.)
Model 1
F 2,061
Sig. ,151 a
765,683
,000 b
a. Predictors: (Constant), Sexo (dummy: 0=Varn) b. Predictors: (Constant), Sexo (dummy: 0=Varn), Aos de estudio (aprox.) c. Dependent Variable: Ingreso horario de la ocupacin ppal
Model 1 2
(Constant) Sexo (dummy: 0=Varn) (Constant) Sexo (dummy: 0=Varn) Aos de estudio (aprox.)
Unstandardized Coefficients B Std. Error 3,476 ,043 -,0941 ,066 ,271 ,091 -,426 ,062 ,306 ,008
La regresin lineal no siempre da buenos resultados, porque a veces la relacin entre Y y X no es lineal sino que exhibe algn grado de curvatura. La estimacin directa de los parmetros de funciones no-lineales es un proceso complicado. No obstante, a veces se pueden aplicar las tcnicas de regresin lineal por medio de transformaciones de las variables originales.
Hacer el diagrama de dispersin de las dos variables y evaluar si el patrn resultante sigue la forma lineal o alguna otra funcin. Identificada dicha funcin, substituir los valores de una variable con sus valores cuadrados, raz cuadrada, logartmicos o con alguna otra modificacin, y hacer de nuevo la matriz de correlacin. Identificar la funcin que mejor ajuste por medio de un paquete estadstico y determinar los coeficientes para la construccin de esa ecuacin. FUNCIONES NO LINEALES
Exponencial:
Logartmica:
Polinmica:
y = a + bx
y = a + log b x
y = a + b x + c x2
FUNCIONES NO LINEALES
Exponenciales
Logartmicas
Y = AXb Si aplicamos logaritmos, esta funcin tambin puede ser expresada como: log(Y) = log(A) + b.log(X). En lugar de calcular la regresin de Y contra X, calculamos la regresin del logaritmo de Y contra el logaritmo de X. Este modelo es interesante, porque el exponente b en una funcin exponencial mide la elasticidad de Y respecto de X.
Pearson Correlation Sig. (2-tailed) N Sexo (dummy: 0=Varn) Pearson Correlation Sig. (2-tailed) N Aos de estudio (aprox.) Pearson Correlation Sig. (2-tailed) N
Frequency
,0 22 ,0 20 ,0 18 ,0 16 ,0 14 ,0 12 ,0 10
0 0, ,0 -2
0 8, 0 6, 0 4, 0 2,
Normal P-P Plot of Regres sion Standardized Res . Dep. Var.: Ingres o horario de la ocupacin ppal
20
,75
10
,50
,25
-10 -4 -3 -2 -1 0
0,00
0,00
,25
,50
,75
1,00
b Model Summary
Model 1
a. Predictors: (Constant), Sexo (dummy: 0=Varn), Aos de estudio (aprox.) b. Dependent Variable: Ingreso horario de la ocupacin ppal
DE ESTIMACIN?
OUTLIERS
que
afectan
la
Recodificacin de las variables independientes y/o transformacin LOGSTICA de la variable dependiente. Estratificacin del anlisis a partir de usar una variable independiente como CRITERIO PARA DIVIDIR a la poblacin en grupos comparables.
Model 1
Modelo Original
a. Predictors: (Constant), Aos de estudio (aprox.), Sexo (dummy 1-Varn) b. Dependent Variable: Ingreso horario de la ocupacin ppal
b Model Summary
Model 1
a. Predictors: (Constant), Aos de estudio (aprox.), Sexo (dummy 1-Varn) b. Dependent Variable: Ingreso horario de la ocupacin ppal
Model 1 2
a. Predictors: (Constant), Sexo (dummy 1-Varn) b. Predictors: (Constant), Sexo (dummy 1-Varn), Aos de estudio (aprox.) c. Dependent Variable: L_INGHOR
2000
1000
Frequency
00 0, 0 ,0 -1 0 ,0 -2 0 ,0 -3 0 ,0 -4 0 ,0 -5 0 ,0 -6
00 5, 00 4, 00 3, 00 2, 00 1,
4
,75
0
Expected Cum Prob
,50
-2
,25
-4 -6 -3 -2 -1 0
0,00
0,00
,25
,50
,75
1,00
L_INGHOR
Pearson Correlation Sig. (2-tailed) N Sexo (dummy 1-Varn) Pearson Correlation Sig. (2-tailed) N Aos de estudio (aprox.) Pearson Correlation Sig. (2-tailed) N
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
Model 1
F 4,689
Sig. ,030 a
1122,596
,000 b
a. Predictors: (Constant), Sexo (dummy 1-Varn) b. Predictors: (Constant), Sexo (dummy 1-Varn), Aos de estudio (aprox.) c. Dependent Variable: L_INGHOR
Model 1 2
(Constant) Sexo (dummy 1-Varn) (Constant) Sexo (dummy 1-Varn) Aos de estudio (aprox.)
Unstandardized Coefficients B Std. Error ,976 ,011 -,0314 ,014 ,0557 ,022 ,0549 ,013 ,0796 ,002