Sunteți pe pagina 1din 25

EJERCICIOS PROPUESTOS

ANLISIS DE REGRESIN.

1. Interprete cada uno de los siguientes coeficientes de correlacin y use grficos de


dispersin para representar como se vera cada una de las relaciones entre dos
variables (X, Y) cualesquiera:
a. r = -1,0.
b. r = 0,05.
c. r = 0,85.

2. Si el coeficiente de correlacin para los datos de la tabla es 0,97, responda a las


preguntas siguientes, primero sin realizar ningn clculo y despus, comprobar las
respuestas haciendo los clculos necesarios con su calculadora el programa SPSS.
X 2 3 4 5 6
Y 5 7 8 13 14
Revise los grficos de dispersin correspondientes y responda cmo cambiara este
coeficiente si:
a. Sumamos 3 a la variable X.
b. Sumamos 3 en ambas variables.
c. Multiplicamos la variable X por 2.
d. Intercambiamos todos los valores de X por los de Y.
e. Cambiamos el ltimo valor de X por el de Y.
f. Sumamos 10 a ambas variables pero slo en el primer punto observado.

3. La correlacin lineal de X con Y es r=0,60; la correlacin de X con W es de


r=-0,80. Con cul de las variables Y W, es mayor el grado de asociacin lineal?

4. Cada una de las frases siguientes contiene un error, explique en cada caso qu es lo
que est mal.
a. "Existe una alta correlacin entre el sexo de los trabajadores en Talca y su salario".
b. "Se encontr una alta correlacin (r=1,09) entre las evaluaciones de los
estudiantes a los profesores y los salarios de los acadmicos".
c. "La correlacin entre el tamao familiar y los metros cuadrados del hogar es
r=0,65 metros cuadrados".

5. La correlacin entre la estatura del padre y la de su hijo hombre adulto es de 0,52.


Esto nos dice que:
a. Padres ms altos que la media de estatura tienden a tener hijos que son ms altos
que la media de estatura.
b. Padres ms altos que la media de estatura tienden a tener hijos que son ms bajos
que la media de estatura
c. Los hijos son, en promedio, ms altos que sus padres
d. 52% de todos los hijos son ms altos que sus padres
e. Casi no hay relacin entre la estatura de padres e hijos.

ANLISIS DE REGRESIN PGINA 1 DE 25


EJERCICIOS PROPUESTOS

6. En un curso de introduccin a la sociologa, un profesor hace dos exmenes. El


profesor quiere determinar si las calificaciones de los estudiantes en el segundo
examen estn correlacionadas con las calificaciones del primero. Para facilitar los
clculos, se elige una muestra de ocho estudiantes. Sus calificaciones aparecen en
la siguiente tabla.
Estudiante 1 2 3 4 5 6 7 8
Examen 1 60 75 70 72 54 83 80 65
Examen 2 60 100 80 68 73 97 85 90

a. Construya un grfico de dispersin para estos datos, utilizando la calificacin del


primer examen como la variable X. Parece lineal la relacin?
b. Suponga que existe una relacin lineal entre las calificaciones de los dos exmenes,
calcule el valor r de Pearson.

7. Con el fin de estudiar la relacin que existe entre la concentracin de oxgeno


(volumen por ciento) de la sangre arterial y de la sangre venosa, se hicieron
determinaciones simultneas en 30 individuos normales, con los siguientes
resultados:

Individuo Sangre Individuo Sangre


N Arterial (X) Venosa (Y) N Arterial (X) Venosa (Y)
1 18,2 11,4 16 20,6 13,5
2 20,5 14,0 17 20,8 14,4
3 20,9 15,1 18 18,7 13,8
4 18,5 12,0 19 19,6 11,7
5 21,9 14,6 20 17,5 10,6
6 18,4 12,0 21 18,8 13,2
7 17,4 11,3 22 18,8 12,5
8 22,3 15,3 23 20,9 12,5
9 20,4 11,9 24 20,0 13,9
10 18,2 12,7 25 19,4 11,9
11 19,3 12,7 26 20,4 14,2
12 20,3 12,8 27 20,1 13,3
13 18,3 12,2 28 20,1 12,6
14 20,3 14,8 29 19,0 14,5
15 20,3 13,4 30 18,6 11,9

a. Para estudiar la correlacin que pueda existir entre las dos variables, analice el
grfico de dispersin.
b. Cul es la correlacin entre las dos variables? Interprete su valor.
c. Si todos los puntos observados coincidieran en una lnea recta: Cul sera el grado
de correlacin de ambas concentraciones de oxgeno en tal caso? Qu significacin
prctica tendra ese hecho? Significara esto que la concentracin de oxgeno en
ambos tipos de sangre es la misma?
Salidas SPSS:
Estadsticos descriptivos

N Mnimo Mximo Media Desv. tp.


Sangre Arterial 30 17,40 22,30 19,6167 1,22758
Sangre Venosa 30 10,60 15,30 13,0233 1,23419

ANLISIS DE REGRESIN PGINA 2 DE 25


EJERCICIOS PROPUESTOS

Correlaciones

Sangre Sangre
Arterial Venosa
Sangre Arterial Correlacin de Pearson 1 ,720**
Sig. (bilateral) ,000
N 30 30
Sangre Venosa Correlacin de Pearson ,720** 1
Sig. (bilateral) ,000
N 30 30
**. La correlacin es significativa al nivel 0,01 (bilateral).

8. El crecimiento de los nios desde la infancia a la adolescencia generalmente sigue


un patrn lineal. Se calcul una recta de regresin mediante el mtodo de mnimos
cuadrados con datos de alturas de nias norteamericanas de 4 a 9 aos y el
resultado fue: Intercepto a=80 y pendiente b=6. La variable dependiente Y es la
altura en centmetros y X es la edad en aos.
a. Interprete los valores estimados del intercepto y de la pendiente.
b. Cul ser la altura predicha de una nia de 8 aos?
c. Cul ser la altura predicha de una mujer de 25 aos? Comente el resultado.

9. En 1991 se public un trabajo Diseando plantas en climas difciles en la revista


Field Crops Research, los datos usados en la investigacin son:
Duracin 92 92 96 100 102 102 106 106 121 143
Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3

Con X=La duracin de la cosecha de porotos de soya en das, Y=Rendimiento de la


cosecha en toneladas por hectrea. Se tiene la siguiente salida de SPSS:

ANLISIS DE REGRESIN PGINA 3 DE 25


EJERCICIOS PROPUESTOS

Estadsticos descriptivos

N Mnimo Mximo Media Desv. tp.


DURACION 10 92,00 143,00 106,0000 15,47040
RENDIMIENTO 10 ,30 2,30 1,5800 ,56332

Correlaciones

DURACION RENDIMIENTO
DURACION Correlacin de Pearson 1 -,940**
Sig. (bilateral) ,000
RENDIMIENTO Correlacin de Pearson -,940** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).

Coeficientesa

Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) 5,207 ,471 11,047 ,000
DURACION -,034 ,004 -7,768 ,000
a. Variable dependiente: RENDIMIENTO

2,5

2,0
RENDIMIENTO

1,5

1,0

0,5

0,0
90 100 110 120 130 140 150
DURACION

ANLISIS DE REGRESIN PGINA 4 DE 25


EJERCICIOS PROPUESTOS

0,3

0,2

Unstandardized Residual
0,1

0,0

-0,1

-0,2

-0,3

-0,4
90 100 110 120 130 140 150
DURACION

a. Estime la recta de regresin mediante el mtodo de mnimos cuadrados. Interprete


los estimadores en el contexto de la pregunta.
b. Existe una relacin lineal entre la duracin y el rendimiento de la cosecha?
c. Verifique los supuestos.
d. Estime el rendimiento si la duracin de la cosecha fue de 104 das.

10. Un Psiclogo ha construido un cuestionario para medir depresin. Para comparar los
datos del cuestionario con los datos de los expertos, 12 individuos con
"perturbaciones emocionales" completan el cuestionario. Los individuos son adems
calificados de manera independiente por dos siquiatras expertos, de acuerdo con el
grado de depresin determinado por cada uno como resultado de entrevistas
detalladas. Los valores mayores indican a una mayor depresin.
Individuo Cuestionario Siquiatra A Siquiatra B
1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3
Use las salidas de SPSS adjuntas, comente los grficos de dispersin y conteste:
a. Cul es la correlacin entre los datos de los dos siquiatras?

ANLISIS DE REGRESIN PGINA 5 DE 25


EJERCICIOS PROPUESTOS

b. Cul es la correlacin entre las calificaciones cuestionario y los datos de cada


siquiatra?
c. Informe de su anlisis al Psiclogo.

Grficos de dispersin para depresin

Cuestionario

Siquiatra A

Siquiatra B

Correlaciones

Cuestionario Siquiatra A Siquiatra B


Cuestionario Correlacin de Pearson 1 .697* .750**
Sig. (bilateral) . .012 .005
N 12 12 12
Siquiatra A Correlacin de Pearson .697* 1 .846**
Sig. (bilateral) .012 . .001
N 12 12 12
Siquiatra B Correlacin de Pearson .750** .846** 1
Sig. (bilateral) .005 .001 .
N 12 12 12
*. La correlacin es significante al nivel 0,05 (bilateral).
**. La correlacin es significativa al nivel 0,01 (bilateral).

11. El Centro de Alumnos de la Escuela de Psicologa de la Universidad de Talca,


manifiestan su preocupacin al momento de egresar de los estudios en las
posibilidades de las ofertas laborales. Despus de varias discusiones, se pidi
realizar un estudio estadstico para determinar si las notas con que egresan los
alumnos puede explicar el nmero de ofertas laborales que ellos reciben despus de
titularse. Para ello, se recopil la informacin de 13 alumnos recin titulados,
obtenindose los siguientes datos:

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13
Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3
Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3

ANLISIS DE REGRESIN PGINA 6 DE 25


EJERCICIOS PROPUESTOS

A partir de las salidas de SPSS adjuntas:


a. Obtenga el coeficiente de correlacin entre ambas variables. Interprete el resultado.
b. Encuentre la recta de regresin de mnimos cuadrados.
c. Interprete los valores estimados del intercepto y la pendiente de la recta de
regresin.
d. Calcule el residuo para la primera observacin (x=6,1; y=4).
e. Bosqueje el grfico de residuos que usted esperara encontrar si este anlisis de
regresin lineal cumple el supuesto de linealidad (no es necesario hacer los
clculos).
f. Si un estudiante egresa con una nota 5,9, Cuntas ofertas laborales esperara
recibir?
Correlaciones

Nota de Ofertas de
egreso trabajo
Nota de egreso Correlacin de Pearson 1 .962**
Sig. (bilateral) .000
N 13 13
Ofertas de trabajo Correlacin de Pearson .962** 1
Sig. (bilateral) .000
N 13 13
**. La correlacin es significativa al nivel 0,01 (bilateral).

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33.037 1 33.037 136.842 .000a
Residual 2.656 11 .241
Total 35.692 12
a. Variables predictoras: (Constante), Nota
b. Variable dependiente: Ofertas

ANLISIS DE REGRESIN PGINA 7 DE 25


EJERCICIOS PROPUESTOS

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) -8.799 1.005 -8.757 .000
Nota 2.166 .185 .962 11.698 .000
a. Variable dependiente: Ofertas

12. Un Investigador cree que la inteligencia de los nios, medida a travs del
coeficiente intelectual (CI en puntos), depende del nmero de hermanos. Toma una
muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados
aparecen en la salida adjunta:

CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90


Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6

Estadsticos descriptivos

N Mnimo Mximo Media Desv. tp.


CI 15 90,00 120,00 103,8667 9,59067
HERMANOS 15 ,00 6,00 2,9333 1,83095

Correlaciones

CI HERMANOS
CI Correlacin de Pearson 1 -,904**
Sig. (bilateral) ,000
HERMANOS Correlacin de Pearson -,904** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).

Coeficientesa

Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) 117,750 2,132 55,227 ,000
HERMANOS -4,733 ,622 -7,604 ,000
a. Variable dependiente: CI

ANLISIS DE REGRESIN PGINA 8 DE 25


EJERCICIOS PROPUESTOS

120

110

CI

100

90
0 1 2 3 4 5 6
HERMANOS

10

5
Unstandardized Residual

-5

-10
0 1 2 3 4 5 6
HERMANOS

a. Encuentre e interprete el coeficiente de correlacin r.


b. Encuentre e interprete el coeficiente de determinacin r2.
c. En este problema, cul de los dos coeficientes encontrados en (a) y (b) usara?
d. D la ecuacin de la recta de regresin. Interprete los estimadores en el contexto
de la pregunta.
e. Es significativo el modelo ajustado? Use un nivel de significacin del 5%.
f. Verifique los supuestos de regresin.

ANLISIS DE REGRESIN PGINA 9 DE 25


EJERCICIOS PROPUESTOS

13. Se desea saber si existe alguna relacin entre la ingestin y la absorcin de grasas
en lactantes desnutridos. Se realizan 20 determinaciones de ingestin y absorcin
cuyos resultados se muestran en la tabla que sigue:

INGESTIN Y ABSORCIN DE GRASAS EN 20 LACTANTES DESNUTRIDOS:


Caso N Ingestin Absorcin Caso N Ingestin Absorcin
(X) (Y) (X) (Y)
1 1,4 0,7 11 2,0 1,4
2 1,6 1,2 12 1,4 1,1
3 2,1 1,6 13 1,9 1,5
4 1,7 1,1 14 1,8 1,3
5 1,8 1,3 15 1,9 1,5
6 2,6 2,0 16 1,6 1,4
7 1,5 1,2 17 1,9 1,7
8 2,5 1,5 18 2,1 1,7
9 2,7 2,4 19 1,6 1,3
10 1,8 1,5 20 1,6 1,1

Estadsticos descriptivos

N Mnimo Mximo Media Desv. tp.


INGESTION 20 1,4 2,7 1,875 ,3740
ABSORCION 20 ,7 2,4 1,425 ,3611

Correlaciones

INGESTION ABSORCION
INGESTION Correlacin de Pearson 1 ,866**
Sig. (bilateral) ,000
ABSORCION Correlacin de Pearson ,866** 1
Sig. (bilateral) ,000
**. La correlacin es significativa al nivel 0,01 (bilateral).

Coeficientesa

Coeficientes no
estandarizados
Modelo B Error tp. t Sig.
1 (Constante) -,143 ,217 -,659 ,518
INGESTION ,836 ,114 7,353 ,000
a. Variable dependiente: ABSORCION

ANLISIS DE REGRESIN PGINA 10 DE 25


EJERCICIOS PROPUESTOS

2,5

2,0

ABSORCION

1,5

1,0

0,5
1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8
INGESTION

0,4

0,2
Unstandardized Residual

0,0

-0,2

-0,4

-0,6
1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8
INGESTION

a. Estime a y b mediante el mtodo de mnimos cuadrados. Interprete los coeficientes


de regresin.
b. Es significativo el modelo ajustado? Use un nivel de significacin del 5%.
c. Encuentre e interprete el coeficiente de determinacin r2.
d. Verifique los supuestos de la regresin.

ANLISIS DE REGRESIN PGINA 11 DE 25


EJERCICIOS PROPUESTOS

14. El Centro de Alumnos de la Escuela de Psicologa de la Universidad de Talca,


manifiestan su preocupacin al momento de egresar de los estudios en las
posibilidades de las ofertas laborales. Despus de varias discusiones, se pidi
realizar un estudio estadstico para determinar si las notas con que egresan los
alumnos puede explicar el nmero de ofertas laborales que ellos reciben despus de
titularse. Para ello, se recopil la informacin de 13 alumnos recin titulados,
obtenindose los siguientes datos:

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13
Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3
Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3

A partir de las salidas de SPSS adjuntas:


a. Obtenga el coeficiente de correlacin entre ambas variables. Interprete el resultado.
b. Encuentre la recta de regresin de mnimos cuadrados.
c. Interprete los valores estimados del intercepto y la pendiente de la recta de
regresin.
d. Es significativo el modelo ajustado? Use un nivel de significacin del 5%.
e. Encuentre e interprete el coeficiente de determinacin r2.
f. Calcule el residuo para la primera observacin (x=6,1; y=4).
g. Bosqueje el grfico de residuos que usted esperara encontrar si este anlisis de
regresin lineal cumple el supuesto de linealidad (no es necesario hacer los
clculos).
h. Si un estudiante egresa con una nota 5,9, Cuntas ofertas laborales esperara
recibir?

Correlaciones

Nota de Ofertas de
egreso trabajo
Nota de egreso Correlacin de Pearson 1 .962**
Sig. (bilateral) .000
N 13 13
Ofertas de trabajo Correlacin de Pearson .962** 1
Sig. (bilateral) .000
N 13 13
**. La correlacin es significativa al nivel 0,01 (bilateral).

ANLISIS DE REGRESIN PGINA 12 DE 25


EJERCICIOS PROPUESTOS

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33.037 1 33.037 136.842 .000a
Residual 2.656 11 .241
Total 35.692 12
a. Variables predictoras: (Constante), Nota
b. Variable dependiente: Ofertas

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) -8.799 1.005 -8.757 .000
Nota 2.166 .185 .962 11.698 .000
a. Variable dependiente: Ofertas

15. PRDIDA DE LA MEMORIA.


Despus de los 50 aos de edad, algunas personas comienzan a tener dificultad
para recordar fechas, nombres y otros datos. En algunos casos, haciendo un
esfuerzo mental es posible recordar esa informacin, pero en otros el olvido es
permanente. En un grupo de 20 sujetos, se les pidi que escribieran en una hoja el
nombre de 15 familiares de amistades, y luego realizaran el ejercicio de recordar
el nombre de las personas que haba registrado en el papel. Considerando las
siguientes salidas del SPSS:

Correlaciones

Cantidad de
nombres que
Edad en aos recuerda
Edad en aos Correlacin de Pearson 1 -.988**
Sig. (bilateral) .000
N 24 24
Cantidad de nombres Correlacin de Pearson -.988** 1
que recuerda Sig. (bilateral) .000
N 24 24
**. La correlacin es significativa al nivel 0,01 (bilateral).

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 32.794 .850 38.587 .000
Edad en aos -.370 .012 -.988 -30.023 .000
a. Variable dependiente: Cantidad de nombres que recuerda

ANLISIS DE REGRESIN PGINA 13 DE 25


EJERCICIOS PROPUESTOS

a. Comente el Diagrama de Dispersin en conjunto con el coeficiente de correlacin.


b. Determine el modelo de regresin lineal, en que la cantidad de nombres que
recuerde el sujeto dependa de su edad.
c. Interprete ambos coeficientes del modelo de regresin lineal obtenidos en (b).
d. Si una persona tiene 61 aos de edad, Cuntas palabras estimamos que va a
recordar?
e. Es significativo el modelo ajustado? Use un nivel de significacin del 5%.
f. Encuentre e interprete el coeficiente de determinacin r2.
g. Realice el anlisis del supuesto de la linealidad del modelo ajustado. Comente.
h. Si se tuviera una nueva observacin de una persona de 80 aos de edad que
recuerda 9 nombres, qu efecto tendra este nuevo dato sobre la pendiente que se
determin en (b), aumentara, se mantendra disminuira? Justifique.

ANLISIS DE REGRESIN PGINA 14 DE 25


EJERCICIOS PROPUESTOS

16. En un estudio diseado para analizar los efectos de aadir avena a la dieta
estadounidense tradicional, se dividieron aleatoriamente los individuos en dos
grupos diferentes. Dos veces al da, el primer grupo sustituy con avena otros
alimentos que contenan carbohidratos. Los miembros del segundo grupo no
hicieron cambios en su dieta. Un resultado interesante es el nivel de colesterol en la
sangre de cada individuo ocho semanas despus de que comenz el estudio. Las
variables explicativas que podran afectar esta respuesta incluyen el tipo de dieta, el
grado de colesterol en la sangre al inicio del estudio, el ndice de masa corporal y el
sexo. Los coeficientes calculados y los errores estndares del modelo de regresin
mltiple que contiene estas cuatro variables explicativas aparecen a continuacin:

Variable Coeficiente Error estndar t Valor_p


Dietas -11,25 4,33 0,0126
Colesterol inicio 0,85 0,07 <0,001
ndice de masa corporal 0,23 0,65 0,724
Sexo -3,02 4,42 0,498

a. Si el estudio se llev a cabo en 50 individuos, lleve a cabo pruebas de hiptesis nula


que indiquen que cada uno de los cuatro coeficientes en la ecuacin de regresin de
poblacin es igual a 0. En el nivel de significancia 0,05, Cul de las variables
explicativas afecta el nivel de colesterol en la sangre ocho semanas despus de que
inici el estudio?
b. Si en ndice de masa corporal de un individuo se incrementara en 1 kg/m2 y los
valores de las dems variables explicativas permanecen constantes, Qu ocurrira
con el nivel de colesterol en la sangre?
c. Si en ndice de masa corporal de un individuo se incrementara en 10 kg/m2 y los
valores de las dems variables explicativas permanecen constantes, Qu ocurrira
con el nivel de colesterol en la sangre?
d. La variable indicadora de sexo se codifica de modo que el 1 represente un hombre y
0 una mujer. Quin probablemente tendr un nivel de colesterol en la sangre ms
alto ocho semanas despus de comenzado el estudio, un hombre una mujer?
Cunto ms alto sera en promedio?

17. En una investigacin de nios con bajo peso al nacer se encontr una relacin lineal
significativa entre la presin arterial sistlica y las semanas de gestacin. Tambin
se mide el ndice apgar a los 5 minutos para cada nio (el ndice del apgar es un
indicador del estado general de salud de un nio 5 minutos despus del nacimiento,
aunque en realidad es una medicin ordinal, a menudo se considera continua).
a. Interprete el grfico de dispersin adjunto que relaciona la presin sistlica y el
ndice apgar. Aparece alguna relacin lineal entre estas dos variables?

ANLISIS DE REGRESIN PGINA 15 DE 25


EJERCICIOS PROPUESTOS

90

80

70

60

50

40

Presin Sistlica
30

20

10
-2 0 2 4 6 8 10

Apgar

b. Con la presin arterial sistlica como respuesta, el periodo de gestacin y el ndice


apgar como explicativas ajuste el modelo de mnimos cuadrados, interprete los
coeficientes y haga un breve resumen de los significados de los resultados.

Resumen del modelob

R cuadrado Error tp. de la


Modelo R R cuadrado corregida estimacin
1 .299a .089 .071 10.993
a. Variables predictoras: (Constante), Apgar, Edad Gestacional
b. Variable dependiente: Presin Sistlica

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1151.364 2 575.682 4.764 .011a
Residual 11721.996 97 120.845
Total 12873.360 99
a. Variables predictoras: (Constante), Apgar, Edad Gestacional
b. Variable dependiente: Presin Sistlica

Coeficientesa

Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Lmite
Modelo B Error tp. Beta t Sig. Lmite inferior superior
1 (Constante) 9.803 12.663 .774 .441 -15.329 34.936
Edad Gestacional 1.185 .442 .263 2.678 .009 .307 2.063
Apgar .488 .461 .104 1.057 .293 -.428 1.403
a. Variable dependiente: Presin Sistlica

ANLISIS DE REGRESIN PGINA 16 DE 25


EJERCICIOS PROPUESTOS

c. Cul es la presin arterial sistlica media de la poblacin de nios con bajo peso al
nacer cuyo periodo de gestacin sea de 31 semanas y cuyo ndice apgar de 7?
d. Haga comentarios sobre la magnitud de R cuadrado. Mejora la inclusin del ndice
apgar de 5 minutos en el modelo que ya contiene el periodo de gestacin, su
capacidad para predecir la presin arterial sistlica?
e. Interprete el grfico de residuos en funcin de los valores ajustados de presin
arterial sistlica. Qu le dice este grfico sobre el ajuste del modelo a los datos
observados?

Histograma de residuos Grfico de residuos vs predichos


16 40

14 30

12
20

10
10

Unstandardized Residual
8

0
6

4 -10
Frecuencia

Desv. tp. = .99


2 Media = 0.00 -20
0 N = 100.00
-30
-2

-1

-1

-.5

0.

.5

1.

1.

2.

2.

3.

3.
00

00

50

00

50

00

50
.0

.5

.0

30 40 50 60
0
0

Regresin Residuo tipificado Unstandardized Predicted Value

f. En el grfico de residuos aparece un valor de residuo grande. Qu debemos hacer?

a
Diagnsticos por caso

Presin Valor
Nmero de caso Residuo tip. Sistlica pronosticado Residuo bruto
16 3.586 87 47.58 39.42
a. Variable dependiente: Presin Sistlica

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1113.143 2 556.571 5.264 .007a
Residual 10150.514 96 105.735
Total 11263.657 98
a. Variables predictoras: (Constante), Apgar, Edad Gestacional
b. Variable dependiente: Presin Sistlica

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 9.683 11.845 .817 .416
Edad Gestacional 1.186 .414 .282 2.867 .005
Apgar .436 .432 .099 1.010 .315
a. Variable dependiente: Presin Sistlica

ANLISIS DE REGRESIN PGINA 17 DE 25


EJERCICIOS PROPUESTOS

g. Se incluy la variable sexo (donde 1 representa un hombre y 0 una mujer) en el


modelo que contiene slo a las semanas de gestacin. Dados dos nios con idntico
periodo de gestacin, un hombre y una mujer, Cul de ellos tender a tener la
presin arterial sistlica ms alta? Por cunto en promedio?

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1061.735 2 530.867 4.360 .015a
Residual 11811.625 97 121.769
Total 12873.360 99
a. Variables predictoras: (Constante), SEXOIND, Edad Gestacional
b. Variable dependiente: Presin Sistlica

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 10.007 12.723 .787 .433
Edad Gestacional 1.263 .438 .281 2.885 .005
SEXOIND 1.356 2.223 .059 .610 .543
a. Variable dependiente: Presin Sistlica

h. Construya un grfico de dispersin de la presin arterial sistlica en funcin del


periodo de gestacin. En el grfico trace por separado dos rectas de regresin
correspondientes a hombre y mujeres. Es la diferencia de sexo en la presin
arterial sistlica significativamente distinta de 0?

90

80

70

60

50

40
Presin Sistlica

30

20

10
22 24 26 28 30 32 34 36

Edad Gestacional

ANLISIS DE REGRESIN PGINA 18 DE 25


EJERCICIOS PROPUESTOS

i. Incluya en el modelo una tercera variable explicativa que constituya la interaccin


entre el periodo de gestacin y el sexo. Tiene el periodo de gestacin un efecto
distinto en la presin arterial sistlica segn el sexo del nio?

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 14.981 15.242 .983 .328
Edad Gestacional 1.090 .525 .242 2.075 .041
SEXOIND -15.157 27.743 -.663 -.546 .586
INTERAC .571 .957 .726 .597 .552
a. Variable dependiente: Presin Sistlica

18. Prediciendo la Capacidad Mental.


Estarn el tamao y peso de su cerebro relacionados con su capacidad mental? Se
mide la escala global de CI basado en Wechsler como variable respuesta. Adems
se tienen tres variables explicativas, el peso corporal (en libras), la estatura (en
pulgadas) y el MRI (resonancia magntica por imgenes). El modelo de regresin
lineal mltiple es:
CI = 0 + 1(MRI) + 2(Peso) + 3(Estatura) +
Se tiene una muestra de 20 mujeres y la salida de anlisis con SPPS es:

Model Summaryb

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .360a .130 -.034 24.08
a. Predictors: (Constant), MRICOUNT, HEIGHT, WEIGHT
b. Dependent Variable: IQ

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 1382.376 3 460.792 .795 .515a
Residual 9277.424 16 579.839
Total 10659.800 19
a. Predictors: (Constant), MRICOUNT, HEIGHT, WEIGHT
b. Dependent Variable: IQ

Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 35.775 190.361 .188 .853
WEIGHT -.131 .432 -.094 -.303 .766
HEIGHT -.720 2.914 -.070 -.247 .808
MRICOUNT 1.638E-04 .000 .387 1.479 .159
a. Dependent Variable: IQ

ANLISIS DE REGRESIN PGINA 19 DE 25


EJERCICIOS PROPUESTOS

a. Escriba la recta de regresin mltiple estimada.


b. D el valor del R2 e interprtelo en trminos del problema de regresin.
c. D un estimador de la desviacin estndar poblacional de y/x.
d. Examine los tests t de los coeficientes de regresin. Para cada test formule la
hiptesis, valor del test, valor_p, decisin y conclusin.

19. Prediciendo puntajes en examen final.


Se investiga la relacin entre los puntajes de un examen final con el puntaje de una
prueba parcial y el nmero de clases que falt un alumno. Se tienen datos de 25
estudiantes, se adjunta anlisis en SPSS.
Figura1: Grfico de dispersin de puntaje en el examen e inasistencia a clases.
100

90

80

70

60

50

40
Final Exam Score

30

20

10

0
-1 0 1 2 3 4 5 6 7 8

Number of Missed Classes

a. Escriba el modelo de regresin lineal mltiple.


b. Escriba la recta de regresin mltiple estimada.
c. D el valor del R2 e interprtelo en trminos del problema de regresin.
d. D un estimador de la desviacin estndar poblacional de y/x.
e. Indique a qu hiptesis corresponde el test F.
f. Examine los tests t de los coeficientes de regresin. Para cada test formule la
hiptesis, valor del test, valor_p, decisin y conclusin.
g. Qu supuestos se deben cumplir para la utilizacin de este modelo.
Model Summaryb

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .857a .734 .710 10.2315
a. Predictors: (Constant), MISSED, MIDTERM
b. Dependent Variable: FINAL

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 6352.682 2 3176.341 30.342 .000a
Residual 2303.058 22 104.684
Total 8655.740 24
a. Predictors: (Constant), MISSED, MIDTERM
b. Dependent Variable: FINAL

ANLISIS DE REGRESIN PGINA 20 DE 25


EJERCICIOS PROPUESTOS

Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 51.949 14.179 3.664 .001
MIDTERM .977 .326 .385 2.994 .007
MISSED -4.839 1.051 -.592 -4.604 .000
a. Dependent Variable: FINAL

20. En general use un 5% como nivel de significacin.


El programa de investigacin de factores de riesgo de enfermedades
cardiovasculares (PIFRECV) de la Universidad de Talca, realiz una encuesta en la
ciudad de Talca a 1006 adultos entre 18 y 74 aos de edad. Se desea analizar la
relacin entre el Permetro de cintura (en centmetros) y la edad (en aos), glicemia
(en mg/dl), presin arterial sistlica (en mmHg) y tabaquismo (codificado como
1=fuma y 0=no fuma).
Usando los resultados de SPSS adjuntos:
a. Escriba la recta de regresin mltiple estimada.
b. Cul sera el Permetro de cintura estimado de un sujeto fumador de 19 aos, con
120 ml de glicemia y 137 mmHg de presin arterial sistlica?
c. Interprete los coeficientes de regresin ajustados en relacin con el problema.
d. A partir de la tabla de ANOVA adjunta calcule e interprete el coeficiente de
determinacin
e. Indique a qu hiptesis corresponde el test F de la tabla ANOVA. Qu concluye?
f. Analice la significancia de los coeficientes de regresin. Comente el resultado en
general.
ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 33359.248 4 8339.812 59.826 .000a
Residual 139681.083 1002 139.402
Total 173040.331 1006
a. Variables predictoras: (Constante), Glicemia, Tabaquismo, Presin arterial
sistlica, Edad en aos
b. Variable dependiente: Permetro de cintura en cms

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 53.997 2.552 21.162 .000
Edad en aos .083 .031 .089 2.677 .008
Tabaquismo 1.866 .792 .069 2.357 .019
Presin arterial sistlica .180 .020 .287 8.793 .000
Glicemia .106 .015 .210 7.024 .000
a. Variable dependiente: Permetro de cintura en cms

ANLISIS DE REGRESIN PGINA 21 DE 25


EJERCICIOS PROPUESTOS

21. Use un 10% como nivel de significacin.


Sohil et al. (2002) realizaron un estudio cuyo fin era determinar si la funcin
neuropsicolgica en las personas infectadas con VIH se correlaciona con la prdida
de volumen cerebral. El desempeo neuropsicolgico se evalu mediante la
aplicacin de una serie de pruebas del funcionamiento neuropsicolgico (NPZ-8), en
tanto que el volumen cerebral fue medido como el porcentaje del volumen
parenquimatoso del cerebro obtenido mediante una resonancia magntica (PBV).
La tabla adjunta muestra mediciones del volumen parenquimatoso del cerebro
(PBV, Parenchymal Brain Volumen en ingls), del funcionamiento neuropsicolgico
(NPZ-8), del estado VIH (1: Positivo, 0: Negativo), de si el paciente ha manifestado
o no la etapa del complejo demencial del SIDA (ADC, AIDS Demetia Complex en
ingls, 1: positivo y 0: negativo) y del estado del sistema inmunitario (CD4,
cantidad de linfocitos medido en cientos) de los sujetos que participaron en el
estudio.
Los bajos valores PBV indican menos volumen cerebral, en tanto que puntuaciones
NPZ-8 ms bajas indican un mejor funcionamiento neuropsicolgico. Un valor ADC
positivo indica que se ha diagnosticado el complejo demencial del SIDA. Los
conteos CD4 ms altos se asocian con un mejor funcionamiento del sistema
inmunitario.

Sujeto PBV NPZ-8 VIH ADC CD4 (x100)


1 0,776 12 1 1 0,16
2 0,792 5 1 1 3,24
3 0,76 3 1 1 2,56
4 0,76 5 1 1 5,63
5 0,804 2 1 1 3,21
6 0,808 6 1 1 1,9
7 0,854 8 1 1 8,5
8 0,803 0 1 0 3,55
9 0,831 3 1 0 4,65
10 0,826 0 1 0 5,19
11 0,786 0 1 0 0,87
12 0,882 7 1 0 1,08
13 0,889 3 1 0 1,9
14 0,817 0 1 0 5,73
15 0,805 0 1 0 10,32
16 0,886 0 0 0 13,11
17 0,833 0 0 0 12
18 0,851 1 0 0 14,89
19 0,897 0 0 0 12,18
20 0,901 0 0 0 13,89

Usando los resultados de SPSS adjuntos:


a. Escriba la ecuacin de regresin mltiple estimada.
b. Interprete los coeficientes de regresin ajustados en relacin con el problema.
c. Interprete el coeficiente de determinacin.
d. Indique a qu hiptesis corresponde el test F de la tabla ANOVA. Qu concluye?
e. Analice la significancia de los coeficientes de regresin. Comente el resultado en
general.
f. Verifique los supuestos correspondientes (linealidad, colinealidad, residuos).

ANLISIS DE REGRESIN PGINA 22 DE 25


EJERCICIOS PROPUESTOS

Resumen del modelob

R cuadrado Error tp. de la


Modelo R R cuadrado corregida estimacin
1 .765a .585 .475 .032664
a. Variables predictoras: (Constante), ADC, CD4 (x100), NPZ-8,
VIH
b. Variable dependiente: PBV

Coeficientes(a)
Coeficientes no Coeficientes
Modelo estandarizados estandarizados
B Error tp. Beta t Sig.
1 (Constante) .851 .044 19.249 .000
NPZ-8 -.006 .003 -.460 -1.888 .079
VIH -.038 .033 -.372 -1.137 .273
CD4 (x100) .002 .003 .172 .511 .617
ADC -.061 .021 -.663 -2.853 .012
a Variable dependiente: PBV

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin .023 4 .006 5.294 .007a
Residual .016 15 .001
Total .039 19
a. Variables predictoras: (Constante), ADC, CD4 (x100), NPZ-8, VIH
b. Variable dependiente: PBV

ANLISIS DE REGRESIN PGINA 23 DE 25


EJERCICIOS PROPUESTOS

ANLISIS DE REGRESIN PGINA 24 DE 25


EJERCICIOS PROPUESTOS

Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Estadstico gl Sig. Estadstico gl Sig.
Residuos .105 20 .200* .970 20 .747
*. Este es un lmite inferior de la significacin verdadera.
a. Correccin de la significacin de Lilliefors

ANLISIS DE REGRESIN PGINA 25 DE 25

S-ar putea să vă placă și