Documente Academic
Documente Profesional
Documente Cultură
ANLISIS DE REGRESIN.
4. Cada una de las frases siguientes contiene un error, explique en cada caso qu es lo
que est mal.
a. "Existe una alta correlacin entre el sexo de los trabajadores en Talca y su salario".
b. "Se encontr una alta correlacin (r=1,09) entre las evaluaciones de los
estudiantes a los profesores y los salarios de los acadmicos".
c. "La correlacin entre el tamao familiar y los metros cuadrados del hogar es
r=0,65 metros cuadrados".
a. Para estudiar la correlacin que pueda existir entre las dos variables, analice el
grfico de dispersin.
b. Cul es la correlacin entre las dos variables? Interprete su valor.
c. Si todos los puntos observados coincidieran en una lnea recta: Cul sera el grado
de correlacin de ambas concentraciones de oxgeno en tal caso? Qu significacin
prctica tendra ese hecho? Significara esto que la concentracin de oxgeno en
ambos tipos de sangre es la misma?
Salidas SPSS:
Estadsticos descriptivos
Correlaciones
Sangre Sangre
Arterial Venosa
Sangre Arterial Correlacin de Pearson 1 ,720**
Sig. (bilateral) ,000
N 30 30
Sangre Venosa Correlacin de Pearson ,720** 1
Sig. (bilateral) ,000
N 30 30
**. La correlacin es significativa al nivel 0,01 (bilateral).
Estadsticos descriptivos
Correlaciones
DURACION RENDIMIENTO
DURACION Correlacin de Pearson 1 -,940**
Sig. (bilateral) ,000
RENDIMIENTO Correlacin de Pearson -,940** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).
Coeficientesa
Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) 5,207 ,471 11,047 ,000
DURACION -,034 ,004 -7,768 ,000
a. Variable dependiente: RENDIMIENTO
2,5
2,0
RENDIMIENTO
1,5
1,0
0,5
0,0
90 100 110 120 130 140 150
DURACION
0,3
0,2
Unstandardized Residual
0,1
0,0
-0,1
-0,2
-0,3
-0,4
90 100 110 120 130 140 150
DURACION
10. Un Psiclogo ha construido un cuestionario para medir depresin. Para comparar los
datos del cuestionario con los datos de los expertos, 12 individuos con
"perturbaciones emocionales" completan el cuestionario. Los individuos son adems
calificados de manera independiente por dos siquiatras expertos, de acuerdo con el
grado de depresin determinado por cada uno como resultado de entrevistas
detalladas. Los valores mayores indican a una mayor depresin.
Individuo Cuestionario Siquiatra A Siquiatra B
1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3
Use las salidas de SPSS adjuntas, comente los grficos de dispersin y conteste:
a. Cul es la correlacin entre los datos de los dos siquiatras?
Cuestionario
Siquiatra A
Siquiatra B
Correlaciones
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13
Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3
Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3
Nota de Ofertas de
egreso trabajo
Nota de egreso Correlacin de Pearson 1 .962**
Sig. (bilateral) .000
N 13 13
Ofertas de trabajo Correlacin de Pearson .962** 1
Sig. (bilateral) .000
N 13 13
**. La correlacin es significativa al nivel 0,01 (bilateral).
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33.037 1 33.037 136.842 .000a
Residual 2.656 11 .241
Total 35.692 12
a. Variables predictoras: (Constante), Nota
b. Variable dependiente: Ofertas
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) -8.799 1.005 -8.757 .000
Nota 2.166 .185 .962 11.698 .000
a. Variable dependiente: Ofertas
12. Un Investigador cree que la inteligencia de los nios, medida a travs del
coeficiente intelectual (CI en puntos), depende del nmero de hermanos. Toma una
muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados
aparecen en la salida adjunta:
Estadsticos descriptivos
Correlaciones
CI HERMANOS
CI Correlacin de Pearson 1 -,904**
Sig. (bilateral) ,000
HERMANOS Correlacin de Pearson -,904** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).
Coeficientesa
Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) 117,750 2,132 55,227 ,000
HERMANOS -4,733 ,622 -7,604 ,000
a. Variable dependiente: CI
120
110
CI
100
90
0 1 2 3 4 5 6
HERMANOS
10
5
Unstandardized Residual
-5
-10
0 1 2 3 4 5 6
HERMANOS
13. Se desea saber si existe alguna relacin entre la ingestin y la absorcin de grasas
en lactantes desnutridos. Se realizan 20 determinaciones de ingestin y absorcin
cuyos resultados se muestran en la tabla que sigue:
Estadsticos descriptivos
Correlaciones
INGESTION ABSORCION
INGESTION Correlacin de Pearson 1 ,866**
Sig. (bilateral) ,000
ABSORCION Correlacin de Pearson ,866** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).
Coeficientesa
Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) -,143 ,217 -,659 ,518
INGESTION ,836 ,114 7,353 ,000
a. Variable dependiente: ABSORCION
2,5
2,0
ABSORCION
1,5
1,0
0,5
1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8
INGESTION
0,4
0,2
Unstandardized Residual
0,0
-0,2
-0,4
-0,6
1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8
INGESTION
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13
Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3
Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3
Correlaciones
Nota de Ofertas de
egreso trabajo
Nota de egreso Correlacin de Pearson 1 .962**
Sig. (bilateral) .000
N 13 13
Ofertas de trabajo Correlacin de Pearson .962** 1
Sig. (bilateral) .000
N 13 13
**. La correlacin es significativa al nivel 0,01 (bilateral).
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33.037 1 33.037 136.842 .000a
Residual 2.656 11 .241
Total 35.692 12
a. Variables predictoras: (Constante), Nota
b. Variable dependiente: Ofertas
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) -8.799 1.005 -8.757 .000
Nota 2.166 .185 .962 11.698 .000
a. Variable dependiente: Ofertas
Correlaciones
Cantidad de
nombres que
Edad en aos recuerda
Edad en aos Correlacin de Pearson 1 -.988**
Sig. (bilateral) .000
N 24 24
Cantidad de nombres Correlacin de Pearson -.988** 1
que recuerda Sig. (bilateral) .000
N 24 24
**. La correlacin es significativa al nivel 0,01 (bilateral).
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 32.794 .850 38.587 .000
Edad en aos -.370 .012 -.988 -30.023 .000
a. Variable dependiente: Cantidad de nombres que recuerda
16. En un estudio diseado para analizar los efectos de aadir avena a la dieta
estadounidense tradicional, se dividieron aleatoriamente los individuos en dos
grupos diferentes. Dos veces al da, el primer grupo sustituy con avena otros
alimentos que contenan carbohidratos. Los miembros del segundo grupo no
hicieron cambios en su dieta. Un resultado interesante es el nivel de colesterol en la
sangre de cada individuo ocho semanas despus de que comenz el estudio. Las
variables explicativas que podran afectar esta respuesta incluyen el tipo de dieta, el
grado de colesterol en la sangre al inicio del estudio, el ndice de masa corporal y el
sexo. Los coeficientes calculados y los errores estndares del modelo de regresin
mltiple que contiene estas cuatro variables explicativas aparecen a continuacin:
17. En una investigacin de nios con bajo peso al nacer se encontr una relacin lineal
significativa entre la presin arterial sistlica y las semanas de gestacin. Tambin
se mide el ndice apgar a los 5 minutos para cada nio (el ndice del apgar es un
indicador del estado general de salud de un nio 5 minutos despus del nacimiento,
aunque en realidad es una medicin ordinal, a menudo se considera continua).
a. Interprete el grfico de dispersin adjunto que relaciona la presin sistlica y el
ndice apgar. Aparece alguna relacin lineal entre estas dos variables?
90
80
70
60
50
40
Presin Sistlica
30
20
10
-2 0 2 4 6 8 10
Apgar
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1151.364 2 575.682 4.764 .011a
Residual 11721.996 97 120.845
Total 12873.360 99
a. Variables predictoras: (Constante), Apgar, Edad Gestacional
b. Variable dependiente: Presin Sistlica
Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Lmite
Modelo B Error tp. Beta t Sig. Lmite inferior superior
1 (Constante) 9.803 12.663 .774 .441 -15.329 34.936
Edad Gestacional 1.185 .442 .263 2.678 .009 .307 2.063
Apgar .488 .461 .104 1.057 .293 -.428 1.403
a. Variable dependiente: Presin Sistlica
c. Cul es la presin arterial sistlica media de la poblacin de nios con bajo peso al
nacer cuyo periodo de gestacin sea de 31 semanas y cuyo ndice apgar de 7?
d. Haga comentarios sobre la magnitud de R cuadrado. Mejora la inclusin del ndice
apgar de 5 minutos en el modelo que ya contiene el periodo de gestacin, su
capacidad para predecir la presin arterial sistlica?
e. Interprete el grfico de residuos en funcin de los valores ajustados de presin
arterial sistlica. Qu le dice este grfico sobre el ajuste del modelo a los datos
observados?
14 30
12
20
10
10
Unstandardized Residual
8
0
6
4 -10
Frecuencia
-1
-1
-.5
0.
.5
1.
1.
2.
2.
3.
3.
00
00
50
00
50
00
50
.0
.5
.0
30 40 50 60
0
0
a
Diagnsticos por caso
Presin Valor
Nmero de caso Residuo tip. Sistlica pronosticado Residuo bruto
16 3.586 87 47.58 39.42
a. Variable dependiente: Presin Sistlica
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1113.143 2 556.571 5.264 .007a
Residual 10150.514 96 105.735
Total 11263.657 98
a. Variables predictoras: (Constante), Apgar, Edad Gestacional
b. Variable dependiente: Presin Sistlica
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 9.683 11.845 .817 .416
Edad Gestacional 1.186 .414 .282 2.867 .005
Apgar .436 .432 .099 1.010 .315
a. Variable dependiente: Presin Sistlica
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1061.735 2 530.867 4.360 .015a
Residual 11811.625 97 121.769
Total 12873.360 99
a. Variables predictoras: (Constante), SEXOIND, Edad Gestacional
b. Variable dependiente: Presin Sistlica
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 10.007 12.723 .787 .433
Edad Gestacional 1.263 .438 .281 2.885 .005
SEXOIND 1.356 2.223 .059 .610 .543
a. Variable dependiente: Presin Sistlica
90
80
70
60
50
40
Presin Sistlica
30
20
10
22 24 26 28 30 32 34 36
Edad Gestacional
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 14.981 15.242 .983 .328
Edad Gestacional 1.090 .525 .242 2.075 .041
SEXOIND -15.157 27.743 -.663 -.546 .586
INTERAC .571 .957 .726 .597 .552
a. Variable dependiente: Presin Sistlica
Model Summaryb
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 1382.376 3 460.792 .795 .515a
Residual 9277.424 16 579.839
Total 10659.800 19
a. Predictors: (Constant), MRICOUNT, HEIGHT, WEIGHT
b. Dependent Variable: IQ
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 35.775 190.361 .188 .853
WEIGHT -.131 .432 -.094 -.303 .766
HEIGHT -.720 2.914 -.070 -.247 .808
MRICOUNT 1.638E-04 .000 .387 1.479 .159
a. Dependent Variable: IQ
90
80
70
60
50
40
Final Exam Score
30
20
10
0
-1 0 1 2 3 4 5 6 7 8
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 6352.682 2 3176.341 30.342 .000a
Residual 2303.058 22 104.684
Total 8655.740 24
a. Predictors: (Constant), MISSED, MIDTERM
b. Dependent Variable: FINAL
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 51.949 14.179 3.664 .001
MIDTERM .977 .326 .385 2.994 .007
MISSED -4.839 1.051 -.592 -4.604 .000
a. Dependent Variable: FINAL
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33359.248 4 8339.812 59.826 .000a
Residual 139681.083 1002 139.402
Total 173040.331 1006
a. Variables predictoras: (Constante), Glicemia, Tabaquismo, Presin arterial
sistlica, Edad en aos
b. Variable dependiente: Permetro de cintura en cms
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 53.997 2.552 21.162 .000
Edad en aos .083 .031 .089 2.677 .008
Tabaquismo 1.866 .792 .069 2.357 .019
Presin arterial sistlica .180 .020 .287 8.793 .000
Glicemia .106 .015 .210 7.024 .000
a. Variable dependiente: Permetro de cintura en cms
Coeficientes(a)
Coeficientes no Coeficientes
Modelo estandarizados estandarizados
B Error tp. Beta t Sig.
1 (Constante) .851 .044 19.249 .000
NPZ-8 -.006 .003 -.460 -1.888 .079
VIH -.038 .033 -.372 -1.137 .273
CD4 (x100) .002 .003 .172 .511 .617
ADC -.061 .021 -.663 -2.853 .012
a Variable dependiente: PBV
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin .023 4 .006 5.294 .007a
Residual .016 15 .001
Total .039 19
a. Variables predictoras: (Constante), ADC, CD4 (x100), NPZ-8, VIH
b. Variable dependiente: PBV
Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Estadstico gl Sig. Estadstico gl Sig.
Residuos .105 20 .200* .970 20 .747
*. Este es un lmite inferior de la significacin verdadera.
a. Correccin de la significacin de Lilliefors