Documente Academic
Documente Profesional
Documente Cultură
2
61 61 personas n personas
PREGUNTA DE INVESTIGACIN: Los estudiantes universitarios ven ms pelculas que
las personas retiradas?
PIEDADA TOCAGON PGINA 1 DE 35
Audiencia
Muestra de
estudiantes
Muestra de
personas
jubiladas
j
Poblacin
de gente
joven
(Estudiante
s)
Poblacin de
gente mayor
(Jubilados)
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
1 PASO.- HIPTESIS
1
1
: No hay diferencia en el nmero promedio de pelculas
que ven l os estudiantes y las personas retiradas
: Los estudiantes universitarios
x
x
>
X2
X2
Ho
Ho ven ms pelculas
que las personas retiradas
2 PASO.- DISTRIBUCIN MUESTRAL
( ) ( )
( ) ( ) ( ) ( )
( )
( ) ( )
__ __
__ __
__ __
__ __
__ __
2 2
1 1 2 2
1 2
1 2
1 2 1 2
1 2
1 2
1 2
1 2
1 1
2
61 1 6.86 61 1 6.86
61 61
61 61 2 61 61
823,2 122
120 3721
2.6192 0.18107
0.4743
x x
X X
X X
X X
X X
X X
n S n S
n n
S
n n n n
S
S
S
S
+
+
+
+
+
La distribucin a utilizarse es t
Los grados de libertad es
2 n n
2 1
+
= 61 + 61 2 = 120 grados de libertad
PIEDADA TOCAGON PGINA 2 DE 35
= 0.05
2 x 1 x
0.05 p <
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
3 PASO.- NIVEL DE SIGNIFICANCIA
= 0.05. Una cola. Punto crtico 1.658
4 PASO.- OBSERVACION
Efecto de la prueba:
__ __
1 2 23.45 21.79 1.66 X X
Estadstico de prueba
__ __
1 2
__ __
1 2
__ __
1 2 1.66
3.5
0.4743
X X
X X
X X
t
S
5 PASO.- DECISION DE RECHAZO
( ) __ __
1 2
ES DECIR 3.5 1.658
X X
t t
2
1 2
1.45
104 110
x
S
n adolecentes n adolecentes
PREGUNTA DE INVESTIGACIN: Poseen los adolescentes con mentores una
autoestima ms alta que los que no los tienen?
PIEDADA TOCAGON PGINA 4 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
1 PASO.- HIPTESIS
1 2
1 2
:
sin
:
x X
x X
Ho No hay diferencia en el autoestima entre adol escentes
con tutor y adolescentes tutor
Ho Los adolescentes con tutor tienen un autoe
>
sin
stima ms alto
que los adolescentes tutor
2 PASO.- DISTRIBUCIN MUESTRAL.- Si la Ho es verdadera y las muestras de 104
adolescentes con tutor y 110 adolescentes sin tutor se extraen repetidamente de sus
poblaciones, las diferencias entre las medias muestrales
__ __
1 2 X X
se centrarn alrededor
de cero como una distribucin t aproximadamente normal con gl = 104 + 110 2 = 212, y
un error calculado como se indica a continuacin.
PIEDADA TOCAGON PGINA 5 DE 35
Adolescent
es
Muestra de
adolescentes
Muestra de
personas
jubiladas
j
Poblacin
de
adolescent
es con
mentor
Poblacin de
adolescentes
sin mentor
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
( ) ( )
( ) ( ) ( ) ( )
( )
__ __
__ __
__ __
__ __
__ __
2 2
1 1 2 2
1 2
1 2
1 2 1 2
2 2
1 2
1 2
1 2
1 2
1 1
2
104 1 1.39 110 1 1.45
104 110
104 110 2 104 110
428.1788 214
212 11440
2.019711 0.0187063
0.19437
x x
X X
X X
X X
X X
X X
n S n S
n n
S
n n n n
S
S
S
S
+
+
+
+
+
5 PASO.- DECISION DE RECHAZO
( ) __ __
1 2
ES DECIR 17.13 1.64
X X
t t
<
Ho
Ho
2 PASO.- DISTRIBUCIN MUESTRAL
__
7.49
2.6481
8
D
D
S
S
n
La distribucin t a utilizarse con 1 n grados de libertad es: 8 1 = 7
PIEDADA TOCAGON PGINA 9 DE 35
Poblacin objetivo
Personas con sobrepeso
X = Peso en libras de
los pacientes
D = diferencias de los
pesos antes y despus
del programa
Muestra
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
3 PASO.- NIVEL DE SIGNIFICANCIA
= 0.01. Una cola. Punto crtico 2.998
4 PASO.- OBSERVACION
Efecto de la prueba:
__
6.125 0 6.125
D
D
Estadstico de prueba
__
__
__
6.125
2.313
2.6481
D
D
D
t
S
5 PASO.- DECISION DE RECHAZO
( ) __
ES DECIR 2.313 2.998
D
t t
PIEDADA TOCAGON PGINA 12 DE 35
0 1 2 3 4 5 12 13
= 0.05
Valor calculado
12.14
3.88 F
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
4 PASO.- OBSERVACION
TODASLA COLUMNASA: MEDIA TOTAL=206/15= 13.73
A B C A B C A B C TOTAL
Y
MEDIA
TOTAL
EFECTO
PRINCIPAL
ERROR Y
MEDIA
TOTAL
EFECTO
PRINCIPAL
ERROR Y
MEDIA
TOTAL
EFECTO
PRINCIPA
L
ERROR
11 13.73 -2.73 0.00 15 13.73 0.07 1.20 16 13.73 2.67 -0.40
9 13.73 -2.73 -2.00 13 13.73 0.07 -0.80 19 13.73 2.67 2.60
13 13.73 -2.73 2.00 14 13.73 0.07 0.20 17 13.73 2.67 0.60
12 13.73 -2.73 1.00 16 13.73 0.07 2.20 15 13.73 2.67 -1.40
10 13.73 -2.73 -1.00 11 13.73 0.07 -2.80 15 13.73 2.67 -1.40
TOTAL 55 69 82 206
MEDIA GRUPO (NORMAL) = MEDIA GRUPO (CASI OBESO) = MEDIA GRUPO (OBESO) =
=55/5= 11.00 =69/5= 13.80 =82/5= 16.40
RANGONORMAL CASI OBESO OBESO
Efectos de la prueba:
__
__
__
__
13.73
11
13.80
16.40
TOTAL
NORMAL
CASI OBESO
OBESO
MEDIA TOTAL Y
MEDIAS GRUPALES
Y
Y
Y
__ __
__ __
CASI OBESO
__ __
OBESO
PRINCIPAL PARA GRUPO NORMAL 11 13.73 2.73
PRINCIPAL PARA CASI OBESO 13.80 13.73 0.0667
PRINCIPAL PARA OBESO 16.40 13.
NORMAL TOTAL
TOTAL
TOTAL
EFECTO Y Y
EFECTO Y Y
EFECTO Y Y
73 2.667
Suma de cuadrados entre los grupos y dentro de los grupos
PIEDADA TOCAGON PGINA 13 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
( ) ( ) ( )
2
__ __
2 2 2
Suma de cuadrados entre los grupos
5 2.73 5 0.0667 5 2.667
37.26 0.0222 35.55
72.83
TOTAL
E GRUPO
SC Y Y
_
,
+ +
+ +
( ) ( )
( )
( ) ( )
( )
( ) ( ) ( )
( )
2
__ __
2 2 2 2
2 2 2 2 2 2
2 2 2
2 2
T
Suma de cuadrados dentro de los grupos
0 2 2 1 1 1.2 0.80 0.2 2.20 2.8
0.40 2.6 0.6 1.4 1.4
10 14.8 11.2
36
Variacin Total SC
cadacaso GRUPO
D
D
D
D
E
SC Y Y
SC
SC
SC
SC SC
_
,
+ + + + + + + + +
+ + + + +
+ +
T
72.83 36
SC 108.83
D
+
36.42
Estadstico de prueba 12.14
3
E
D
CM
F
CM
5 PASO.- DECISION DE RECHAZO
( ) Es decir 12.14 3.88
OBSERVADA
F F
]
Respuesta a la pregunta: si afecta la obesidad en la satisfaccin con respecto a la
apariencia corporal.
Las personas con mayor peso tienen mayor insatisfaccin corporal
EJERCICIO 2
PIEDADA TOCAGON PGINA 15 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
Al investigar sobre los peligros de la cafena, un investigador agrega dos tipos de cafena
(la del caf y la del chocolate) al suministro de agua de grupos de ratas de laboratorio.
Por lo general, esta especie sobrevive cerca de 13 meses. Afecta la cafena el tiempo
de vida de las ratas? Pruebe la hiptesis con los siguientes datos. Asumir la igualdad de
las varianzas poblacionales. Nivel de significancia = 0.05.
Grupo de tratamiento Das que vivi la rata
Cafena de caf: 398, 372, 413, 419, 408, 393, 387, 414
Cafena de chocolate: 401, 389, 413, 396, 406, 378, 382, 417
Control (sin cafena): 412, 386, 394, 409, 415, 401, 384, 398
PREGUNTA DE INVESTIGACIN:
Afecta la cafena el tiempo de vida de las ratas?
Especificaciones: Variables: Y = Das que vivi la rata
X = Grupo de tratamiento, variable independiente nominal con tres categoras.
Muestra: n = 24 de los cuales Cafena de caf (8), Cafena de chocolate (8) y Control (sin
cafena) (8)
1 PASO.- HIPTESIS
( ) ( ) ( )
( ) ( )
cafe chocolate Sin cafena
cafe chocolate Sin cafe
: EFECTOS PRINCIPALES 0
No existe relacin entre los das que vi ve la rata y el tipo de cafena
:
Y Cafeina Y Cafeina Y
A Y Cafeina Y Cafeina Y
Ho
H
( ) na
EFECTOS PRINCIPALES 0
Si existe relacin entre los das que vi ve la rata y el tipo de cafena
2 PASO.- DISTRIBUCIN MUESTRAL
Si la Ho es verdadera y se extraen repetidamente muestras de tamao 8 de las
poblaciones de ratas de laboratorio, la distribucin adquiere la forma de la distribucin F
con,
PIEDADA TOCAGON PGINA 16 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
1 3 1 2
24 3 21
B
D
gl K
gl n K
3 PASO.- NIVEL DE SIGNIFICANCIA
= 0.05. No direccional. Punto crtico
( ) 2;21
3.47
gl
F
4 PASO.- OBSERVACION
PIEDADA TOCAGON PGINA 17 DE 35
0 1 2 3 4 5
6
= 0.05
Valor calculado
0.084
3.47 F
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
TODASLA COLUMNASA: MEDIA TOTAL=9585/24= 399.375
A B C A B C A B C TOTAL
Y
MEDIA
TOTAL
EFECTO
PRINCIPAL
ERROR Y
MEDIA
TOTAL
EFECTO
PRINCIPAL
ERROR Y
MEDIA
TOTAL
EFECTO
PRINCIPA
L
ERROR
398 399.38 1.125 -2.50 401 399.38 -1.625 3.25 412 399.38 0.50 12.13
372 399.38 1.125 -28.50 389 399.38 -1.625 -8.75 386 399.38 0.50 -13.88
413 399.38 1.125 12.50 413 399.38 -1.625 15.25 394 399.38 0.50 -5.88
419 399.38 1.125 18.50 396 399.38 -1.625 -1.75 409 399.38 0.50 9.13
408 399.38 1.125 7.50 406 399.38 -1.625 8.25 415 399.38 0.50 15.13
393 399.38 1.125 -7.50 378 399.38 -1.625 -19.75 401 399.38 0.50 1.13
387 399.38 1.125 -13.50 382 399.38 -1.625 -15.75 384 399.38 0.50 -15.88
414 399.38 1.125 13.50 417 399.38 -1.625 19.25 398 399.38 0.50 -1.88
TOTAL 3204 3182 3199 9585
MEDIA GRUPO(CAFEI. CAFE) = MEDIA GRUPO(CAFEIN. CHOCOLA) =MEDIA GRUPO (SIN CAFEINA) =
=3204/8= 400.50 =3182/8= 397.75 =3199/8= 399.875
CAFEINADECAF CAFEINADECHOCOLATE SINCAFEINA
Efectos de la prueba:
__
__
.
__
.
__
.
399.375
400.5
397.75
399.875
TOTAL
CAFEI CAFE
CAFEI CHOCO
SIN CAFEI
MEDIA TOTAL Y
MEDIAS GRUPALES
Y
Y
Y
__ __
__ __
CHOCO
PRINCIPAL PARA GRUPO CAFEI. CAFE 400.50 399.375 1.125
PRINCIPAL PARA GRUPO CAFEI. CHOCOL 397.75 399.375 1.625
PRINCIPAL PARA GRUPO SIN CAF
CAFE TOTAL
TOTAL
EFECTO Y Y
EFECTO Y Y
EFECTO
__ __
SIN CAFEI. EI. 399.875 399.375 0.5 TOTAL Y Y
Suma de cuadrados entre los grupos y dentro de los grupos
PIEDADA TOCAGON PGINA 18 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
( ) ( ) ( )
2
__ __
2 2 2
2
__ __
Suma de cuadrados entre los grupos
8 1.125 8 1.625 8 0.5
10.125 21.125 2
33.25
Suma de cuadrados dentro de los grupos
1794 1399.5 942.8
TOTAL
E GRUPO
cadacaso GRUPO
D
SC Y Y
SC Y Y
_
,
+ +
+ +
_
,
+ +
T
75
4136.375
Variacin Total SC 33.25 4136.375
4169.625
E D
SC SC
+ +
16.625
Estadstico de prueba 0.084
196.97
E
D
CM
F
CM
5 PASO.- DECISION DE RECHAZO
( ) ES DECIR 0.084 3.47
OBSERVADA
F F
1
1
1
]
Respuesta a la pregunta: No existe una relacin entre el tipo de cafena y el tiempo que
sobreviven las ratas. Por lo tanto no habra relacin entre la cafena y el tiempo de vida de
las ratas de laboratorio.
ACTIVIDAD DE APRENDIZAJE 2.3.
EJERCICIO 1
PIEDADA TOCAGON PGINA 20 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
Ud. entrevista a estudiantes y profesores de una universidad para evaluar el apoyo para
modificar el formato de interaccin en clase del estilo de conferencia al estilo de
discusin. De acuerdo con los siguientes datos, determine si existe una diferencia
significativa en las proporciones de estudiantes y profesores que apoyan el cambio de
formato de clase. Usar = 0.01.
Profesores Estudiantes
________________________________________________________________
Apoya el estilo de discusin 90 602
Apoya el estilo de conferencia 55 210
Profesores Estudiantes TOTAL
Apoya el estilo de
discusin
90 602 692
Apoya el estilo de
conferencia
55 210 265
TOTAL 145 812 957
La proporcin de Estudiantes que apoyan el cambio es 602/812 = 0,7413
Mientras que la proporcin de Profesores que apoyan el cambio es 90 /145 = 0.6206
Hiptesis
2
2
0: 0 No existe diferencia significativa entre la proporcin de
estudiantes y profesores que apoyan el cambio
: 0 Si existe diferencia significativa entre la proporcin de
estudiantes y pro
A
H
H
>
fesores que apoyan el cambio.
Distribucin muestral
PIEDADA TOCAGON PGINA 21 DE 35
= 0.01
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
Nivel de significancia es 0.01 y con ( )( ) ( )( ) 1 1 2 1 2 1 c 1 r- df , el valor crtico de la
prueba Chi cuadrada es = 6.64
Observaciones
O E (O-E) ( )
2
E O
( )
E
E O
2
>
Distribucin muestral
Nivel de significancia es 0.05 y con ( )( ) ( )( ) 1 1 2 1 2 1 c 1 r- df , el valor crtico de
la prueba Chi cuadrada es =3.84
Observaciones
PIEDADA TOCAGON PGINA 23 DE 35
0 1 2 3 4 5
6
= 0.05
84 . 3 a
2
4.59
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
O E (O-E) ( )
2
E O
( )
E
E O
2
Distribucin muestral
Si la Ho es verdadera y se toman repetidamente muestras de tamao 8 de la poblacin,
las combinaciones de ratones que sobreviven y los que no, se ajustan a la distribucin
binomial con P = 0.5 y Q = 0.5; n = 8.
Nivel de significancia es 0.01 de una cola, con n = 8, el estadstico de prueba es:
Los siguientes son los coeficientes del tringulo de Pascal.
( )
1445 . 0
256
37
256
28
256
8
256
1
Q Q P 8 Q P 28 Q P 561 Q P 70 Q P 56 Q P 28 Q P 8 P 1 Q P
8 7 6 2 5 3 4 4 3 5 2 6 7 8
8
+ +
+ + + + + + + + +
PIEDADA TOCAGON PGINA 25 DE 35
Poblacin objetivo:
Ratones genticamente
infectados
Pu = P(sobreviven) = 0.5
Qu = P (no sobreviven) = 0.5
Muestra
M
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
Efecto de la prueba: seis sobreviven seis meses y dos no sobreviven; dos ms de lo
esperado.
p es 0.1445
Decisin de rechazo: no rechazamos la hiptesis nula porque
> p
, es decir
0.144 > 0.01
Interpretacin.- Parece que sin tratamiento o con tratamiento la tasa de sobrevivencia es
la misma
La aparente supervivencia en una mayor proporcin (6 de 8), se debe al error de
muestreo aleatorio.
EJERCICIO 4
Usar el tringulo de Pascal para presentar rpidamente las siguientes probabilidades
relativas al lanzamiento de monedas. En este ejercicio no es necesario escribir las
ecuaciones.
a) p(de lanzar ocho monedas y obtener slo sellos) = 1/256 = 0.0039
b) p(de lanzar 5 monedas y obtener dos caras y tres sellos) = 10/32 = 0.3125
p (de lanzar 4 monedas y obtener dos caras y dos cruces) = 6/16 = 0.375
ACTIVIDAD DE APRENDIZAJE 2.4.
EJERCICIO 1
Los estudios muestran que en los distritos escolares existe una correlacin entre las
borracheras en preparatoria y las borracheras en las escuelas secundarias. Con el fin de
replicar el estudio se entrevista a los estudiantes de 12 distritos en relacin con su
conducta de consumo de bebidas alcohlicas. Ud. mide las borracheras en la escuela
como el porcentaje de estudiantes que indican que consumen cinco o ms bebidas en
una salida por lo menos una vez durante los pasados 12 meses. En seguida, se calcula
el porcentaje de estudiantes en la escuela que lo hicieron.
PIEDADA TOCAGON PGINA 26 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
a) Cul es la variable independiente y cul es la variable dependiente? Trazar el
diagrama de dispersin de Y regresionada a partir de X.
Distritos con Porcentaje de borracheras Porcentaje de borracheras
la escuela en la preparatoria en la secundaria
1 16 13
2 15 11
3 19 7
4 18 15
5 15 8
6 18 12
7 14 9
8 12 7
9 10 16
10 19 14
11 12 12
12 16 12
Variable Independiente (X): Porcentaje de borracheras en la secundaria
Variable Independiente (Y): Porcentaje de borracheras en la preparatoria
PIEDADA TOCAGON PGINA 27 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
b) Calcular los estadsticos de la recta de regresin y trazar la recta.
PORCENTAJE
DE
BORRACHERAS
EN LA
SECUNDARIA
(X)
PORCENTAJE
DE
BORRACHERA
S EN LA
PREPARATORI
A (Y)
13 16 1.67 0.67 1.11 2.78 0.44
11 15 -0.33 -0.33 0.11 0.11 0.11
7 19 -4.33 3.67 -15.89 18.78 13.44
15 18 3.67 2.67 9.78 13.44 7.11
8 15 -3.33 -0.33 1.11 11.11 0.11
12 18 0.67 2.67 1.78 0.44 7.11
9 14 -2.33 -1.33 3.11 5.44 1.78
7 12 -4.33 -3.33 14.44 18.78 11.11
16 10 4.67 -5.33 -24.89 21.78 28.44
14 19 2.67 3.67 9.78 7.11 13.44
12 12 0.67 -3.33 -2.22 0.44 11.11
12 16 0.67 0.67 0.44 0.44 0.44
136.00 184.00 0.00 0.00 -1.33 100.67 94.67
MEDIA MEDIA
11.3333 15.3333
2
1.333
100.67
0.0132
__ __
__
X X Y Y
b
X X
b
b
_ _
, ,
( ) ( ) 15.33 0.0132 11.333
15.48
__ __
a Y b X
a
a
( ) 15.48 0.0132
+
'
Y a bX
'
Y X
Los valores de Y estimados con la ecuacin de regresin son:
PIEDADA TOCAGON PGINA 28 DE 35
2
__
Y Y
,
_
2
__
X X
,
_
__
X X
__
Y Y
,
_
,
_
_ _ _ _
Y Y X X
'
Y
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
PORCENTAJE DE
BORRACHERAS EN
LA SECUNDARIA (X)
13 15.3118
11 15.3382
7 15.3910
15 15.2854
8 15.3778
12 15.3250
9 15.3646
7 15.3910
16 15.2722
14 15.2986
12 15.3250
12 15.3250
PIEDADA TOCAGON PGINA 29 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
( ) ( )
2 2
1.33333
100.67 94.67
1.33333
9530.11
0 01365
__ __
__ __
X X Y Y
r
X X Y Y
r
r
r ,
_ _
, ,
_ _
, ,
De acuerdo al coeficiente de correlacin, existe una mnima relacin entre el porcentaje
de borrachera en la secundaria y el porcentaje de borrachera en la preparatoria.
c) Notar las coordenadas extremas del diagrama de dispersin. Identificarlas en la
hoja de clculo.
Las coordenadas extremas en este caso corresponde a los puntos (7;19) y (16; 10)
DISTRITOS
CON LA
ESCUELA
PORCENTAJE
DE
BORRACHERAS
EN LA
PREPARATORIA
PORCENTAJE
DE
BORRACHERAS
EN LA
SECUNDARIA
1 16 13
2 15 11
3 19 7
4 18 15
5 15 8
6 18 12
7 14 9
8 12 7
9 10 16
10 19 14
11 12 12
12 16 12
PIEDADA TOCAGON PGINA 30 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
d) Volver a calcular la r de Pearson sin estas coordenadas extremas.
PORCENTAJE
DE
BORRACHERAS
EN LA
SECUNDARIA
(X)
PORCENTAJE
DE
BORRACHERA
S EN LA
PREPARATORI
A (Y)
13 16 1.70 0.50 0.85 2.89 0.25
11 15 -0.30 -0.50 0.15 0.09 0.25
15 18 3.70 2.50 9.25 13.69 6.25
8 15 -3.30 -0.50 1.65 10.89 0.25
12 18 0.70 2.50 1.75 0.49 6.25
9 14 -2.30 -1.50 3.45 5.29 2.25
7 12 -4.30 -3.50 15.05 18.49 12.25
14 19 2.70 3.50 9.45 7.29 12.25
12 12 0.70 -3.50 -2.45 0.49 12.25
12 16 0.70 0.50 0.35 0.49 0.25
113 155 0.00 0.00 39.50 60.10 52.50
MEDIA MEDIA
11.3 15.5
( ) ( )
2 2
39.50
60.10 52.50
39.50
3155.25
0 703
__ __
__ __
X X Y Y
r
X X Y Y
r
r
r ,
_ _
, ,
_ _
, ,
PIEDADA TOCAGON PGINA 31 DE 35
2
__
Y Y
,
_
2
__
X X
,
_
__
X X
__
Y Y
,
_
,
_
_ _ _ _
Y Y X X
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
e) Comentar sobre el efecto de las coordenadas extremas en los clculos del
coeficiente de correlacin r de Pearson.
Las coordenadas extremas en unos casos debilitan o reducen los coeficientes de
correlacin y en otros casos inflan este coeficiente.
En este caso debilit el coeficiente de regresin.
Para evitar este problema es preciso observar en el diagrama de dispersin los valores
que se salen del patrn de comportamiento (Valores extremos), y pueden excluirse del
anlisis con justificacin.
EJERCICIO 2
Se est estudiando el desarrollo de la habilidad de pianistas de 14 aos de edad en un
club y se quiere saber si el tiempo de pertenencia al club (X) se relaciona con la cantidad
de premios ganados (Y) en recitales de competencia.
Aos en el club de msica (X) Premios y trofeos de mrito (Y)
________________________________________________________________
4 5
PIEDADA TOCAGON PGINA 32 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
6 6
2 1
3 4
2 7
1 2
3 3
5 4
4 4
a) Trazar el diagrama de dispersin de y regresionada a partir de X.
b) Calcular el coeficiente de correlacin bivariada r de Pearson.
Aos en el club
de msica
(X)
Premios y
trofeos de
mrito
(Y)
4 5 0.67 1.00 0.67 0.44 1.00
6 6 2.67 2.00 5.33 7.11 4.00
2 1 -1.33 -3.00 4.00 1.78 9.00
3 4 -0.33 0.00 0.00 0.11 0.00
2 7 -1.33 3.00 -4.00 1.78 9.00
1 2 -2.33 -2.00 4.67 5.44 4.00
PIEDADA TOCAGON PGINA 33 DE 35
2
__
Y Y
,
_
2
__
X X
,
_
__
X X
__
Y Y
,
_
,
_
_ _ _ _
Y Y X X
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
3 3 -0.33 -1.00 0.33 0.11 1.00
5 4 1.67 0.00 0.00 2.78 0.00
4 4 0.67 0.00 0.00 0.44 0.00
30.00 36.00 0.00 0.00 11.00 20.00 28.00
MEDIA MEDIA
3.33 4.0
( ) ( )
2 2
11
20 28
11
560
0 4648
__ __
__ __
X X Y Y
r
X X Y Y
r
r
r ,
_ _
, ,
_ _
, ,
c) Notar las coordenadas extremas en el diagrama de dispersin. Identificarlas en
la hoja de clculo.
Las coordenadas extremas en este caso corresponden al punto (2; 7)
Aos en el club de msica (X) Premios y trofeos de mrito (Y)
________________________________________________________________
4 5
6 6
2 1
3 4
2 7
1 2
3 3
5 4
4 4
d) Volver a calcular la r de Pearson sin estas coordenadas extremas.
PIEDADA TOCAGON PGINA 34 DE 35
ESTADISTICA INFERENCIAL SEGUNDO PARCIAL
Aos en el club
de msica
(X)
Premios y
trofeos de
mrito
(Y)
4 5 0.50 1.38 0.69 0.25 1.89
6 6 2.50 2.38 5.94 6.25 5.64
2 1 -1.50 -2.63 3.94 2.25 6.89
3 4 -0.50 0.38 -0.19 0.25 0.14
1 2 -2.50 -1.63 4.06 6.25 2.64
3 3 -0.50 -0.63 0.31 0.25 0.39
5 4 1.50 0.38 0.56 2.25 0.14
4 4 0.50 0.38 0.19 0.25 0.14
28.00 29.00 0.00 0.00 15.50 18.00 17.88
MEDIA MEDIA
3.50 3.6
( ) ( )
2 2
15.50
18 17.88
15.5
321.84
0 86399
__ __
__ __
X X Y Y
r
X X Y Y
r
r
r ,
_ _
, ,
_ _
, ,
e) Comentar sobre el efecto de una coordenada extrema del coeficiente de
correlacin r de Pearson.
Este punto extremo debilit el coeficiente de correlacin. Con la exclusin del punto el
coeficiente de correlacin subi de 0.4648 a 0.8639, el cual se ajusta de mejor manera a
la realidad.
PIEDADA TOCAGON PGINA 35 DE 35
2
__
Y Y
,
_
2
__
X X
,
_
__
X X
__
Y Y
,
_
,
_
_ _ _ _
Y Y X X