Documente Academic
Documente Profesional
Documente Cultură
Horario: miércoles 4 - 6 pm
Problema N°1:
Una compañía de desarrollos inmobiliarios considera la inversión en un centro comercial en las
afueras de Atlanta. Se evalúan tres terrenos. El ingreso de los pobladores de la zona aledaña al
centro comercial es de especial importancia. Se selecciona una muestra aleatoria de cuatro
familias que viven cerca de cada terreno. A continuación se presentan los resultados
muestrales. A un nivel de significancia de 0.05 ¿Se puede concluir la compañía que hay
diferencia en los ingresos promedios?
Solución:
A) H0: 𝜇1 = 𝜇2 = 𝜇3
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para el punto F(0.05,2,9):
Gráfica de distribución
F; df1=2; df2=9
1.0
0.8
Densidad
0.6
0.4
0.2
0.05
0.0
0 4.256
X
E) Haciendo los cálculos respectivos:
8552
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 61283 − = 364.25
12
FV SC GL MC F
Tratamiento 276.5 2 138.25 14.1795
Error 87.75 9 9.75
Total 364.25 11
COMPROBACION EN MINITAB:
ANOVA de un solo factor: Southwyck; Franklin; Old
Orcchard
Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05
Se presupuso igualdad de varianzas para el análisis.
Problema N°2:
Nielsen Research desea incorporar un programa de educación física en las escuelas publicas,
para ayudar a los niños con problemas de obesidad a perder peso. Para comparar las
diferentes rutinas se hace la siguiente prueba: se toman 45 alumnos con problemas de
sobrepeso de distintas escuelas de la ciudad y son sometidos a 3 diferentes tipos de rutina. Se
mandan 15 alumnos para cada rutina.
¿Existe alguna diferencia entre los pesos perdidos promedios de os tres tipos de rutina? Use
un nivel de significancia de 0.05
SOLUCION:
A) H0: 𝜇1 = 𝜇2 = 𝜇3
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para F(0.05,2,42):
Gráfica de distribución
F; df1=2; df2=42
1.0
0.8
Densidad
0.6
0.4
0.2
0.05
0.0
0 3.220
X
E) Hacemos los cálculos respectivos para obtener la tabla de ANOVA:
FV SC GL MC F
Tratamiento 11.6853 2 5.84266 9.916
Error 24.7466 42 0.5892
Total 36.432 44
COMPROBACION EN MINITAB:
Problema N°1:
Una empresa opera 24 horas al día, cinco días a la semana. Los trabajadores cambian de turno
cada semana. La gerencia esta interesada en saber si hay alguna diferencia en el numero de
unidades producidas cuando los empleados laboran en diversos turnos. Se seleccionó una
muestra de cinco obreros y se registró su producción en cada turno. Al nivel de significancia de
0.05, ¿Se puede concluir que hay diferencia en la producción media por turno o en la
producción media por trabajador?
SOLUCION:
A) H0: 𝜇𝑀 = 𝜇𝑇 = 𝜇𝑁
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para F(0.05,2,8)
Gráfica de distribución
F; df1=2; df2=8
1.0
Densidad 0.8
0.6
0.4
0.2
0.05
0.0
0 4.459
X
A) H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para F(0.05,4,8)
Gráfica de distribución
F; df1=4; df2=8
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 3.838
X
Ahora después de haber realizado los cálculos respectivos, construiremos la siguiente tabla
ANOVA:
FV SC GL MC F
Tratamiento 62.533 2 31.266 Ftrat=5.7546
Bloques 33.73 4 8.433 Fbloque=1.5521
Error 43.466 8 5.433
Total 139.733 14
CALCULOS EN MINITAB:
INTERPRETACIÓN:
TRATAMIENTO:
El Ftrat pertenece a la región critica, por lo tanto se rechaza la H0 y se acepta el Ha.
Entonces se concluye que si existe diferencia significativa en el número de unidades de
promedio producidas cuando los empleados laboran en turnos distintos.
BLOQUE:
Restaurante
Semana Metro Interestatal Universidad Rio
1 124 160 320 190
2 234 220 340 230
3 430 290 290 240
4 105 245 310 170
5 240 205 280 180
6 310 260 270 205
SOLUCION
A) H0: 𝜇𝑀 = 𝜇𝑇 = 𝜇𝑁
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para F(0.05,3,15)
Gráfica de distribución
F; df1=3; df2=15
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 3.287
X
2. PRUEBA DE HIPOSESIS PARA SEMANAS(BLOQUE)
A) H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
Ha: Al menos una es diferente
B) 𝛼 = 0.05
C) Estadístico: F
D) Para F(0.05,5,15)
Gráfica de distribución
F; df1=5; df2=15
0.8
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 2.901
X
Ahora después de haber realizado los cálculos respectivos, construiremos la siguiente tabla
ANOVA:
FV SC GL MC F
Tratamiento 31533 3 10511 Ftra=2.865
Bloques 35402.83 5 7080.567 Fblo=1.93
Error 55033.5 15 3668.9
Total 121969.33 23
CALCULOS EN MINITAB:
INTERPRETACIÓN:
TRATAMIENTO:
El Ftra pertenece a la región de aceptación, por lo tanto se acepta la H0 y se rechaza la
Ha. Entonces se concluye que NO existe diferencia significativa en el número de
hamburguesas vendidas promedio en cada restaurante.
BLOQUE:
PROBLEMA 1
Un consultor está interesado en el grado de dispersión con que un nuevo índice de
desempeño laboral mide lo que es importante para una corporación. Una forma de
salario (en miles de dólares) y el índice de evaluación del trabajo (1 a 10, donde 10 es la
mejor calificación.
regresión.
SOLUCION:
IET(X) Salario(Y) X2 XY Y2
9 36 81 324 1296
7 25 49 175 625
8 33 64 264 1089
4 15 16 60 225
7 28 49 196 784
5 19 25 95 361
5 20 25 100 400
6 22 36 132 484
∑𝑿 ∑𝑌 ∑ 𝑋2 ∑ 𝑋𝑌 ∑ 𝑌2
a. Coeficiente de correlación
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟=
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 ][𝑛 ∑ 𝑦 2 − (𝑦)2 ]
8𝑥345 − 51𝑥198
𝑟=
√[8𝑥1346 − 512 ][8𝑥198 − 1982 ]
𝑟 = 0.9853
c. Coeficiente de la no determinación
1 − 𝑟 2 = 1 − 0.9709 = 0.0291
d. Ecuación de regresión
𝑦 = 𝑎 + 𝑏𝑥
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
8𝑥1346 − 51𝑥198
𝑏=
8𝑥345 − 512
𝑏 = 4.2138
∑𝑦 𝑏∑𝑥
𝑎= −
𝑛 𝑛
198 4.2138𝑥51
𝑎= −
8 8
𝑎 = −2.1130
30
25
y
20
15
4 5 6 7 8 9
Gráfica de la línea ajustada x
Entonces la ecuación de regresión estimada es:
𝑦 = −2.1130 + 4.2138𝑥
Resultados en el Minitab:
Análisis de regresión
∑ 𝑦 2 − 𝑎 ∑ 𝑦 − 𝑏 ∑ 𝑥𝑦
𝑆𝑦𝑥 = √
𝑛−2
𝑆𝑦𝑥 = 1.3291
Interpretación: Alrededor de la línea de dispersión están dispersos 1.3291.
2) 𝛼 = 0.05
3) t-student
4) Grafica de la RA y RC
𝑏 − 𝛽1
𝑡=
𝑆𝑏
𝑆𝑦𝑥
𝑆𝑏1 =
2
√∑ 𝑥 2 − (∑ 𝑥)
𝑛
1.3291
𝑆𝑏1 =
2
√345 − 51
8
𝑆𝑏1 = 0.2981
4.2138 − 0
𝑡=
0.2981
𝑡 = 14.1355
𝑡𝑘 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
2) 𝛼 = 0.05
3) t-student
4) Grafica de la RA y RC
𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
0.9853√8 − 2
𝑡=
√1 − 0.98532
𝑡 = 14.1277
𝑡𝑘 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
el salario.
h. Intervalo de confianza de 𝛽1
𝑏 − 𝑡(0.05,10−2) 𝑆𝑏1 ≤ 𝛽1 ≤ 𝑏 + 𝑡(0.05,10−2) 𝑆𝑏1
3.4843 ≤ 𝛽1 ≤ 4.9432
𝑦 = −2.1130 + 4.2138𝑥
𝑦 = 23.1698
Intervalo de confianza
1 (𝑥 − 𝑥̅ )
𝐼𝐶 = 𝑦̂ ± 𝑡(0.05,10−8) 𝑆𝑦𝑥 √ +
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛
1 (6 − 6.375)2
𝐼𝐶 = 23.1698 ± 2.447𝑥1.3291√ +
8 512
345 − 8
𝐼𝐶: [21.9878,24.3518]
Interpretación: El intervalo de confianza del 95% para el valor del salario para
Intervalo de predicción
1 (𝑥 − 𝑥̅ )2
𝐼𝑃 = 𝑦̂ ± 𝑡(0.05,10−8) 𝑆𝑦𝑥 √1 + +
𝑛 (∑ 𝑥)2
∑ 𝑥2 −
𝑛
1 (6 − 6.375)2
𝐼𝑃 = 23.1698 ± 2.447𝑥1.3291√1 + +
8 512
345 − 8
𝐼𝑃: [19.7094,26.6302]
Interpretación: Un índice de evaluación en el trabajo de 6 hará que los valores
j. Análisis de influencia
X Y RESID-T HI COOK
En la tabla
PROBLEMA 2
El señor james McWhinney, presidente de la empresa Daniel-James Financial Service,
considera que existe relación entre el número de entrevistas con clientes y el importe en
dólares de las ventas. Para documentar este aserto, recopiló la siguiente información
muestral. La columna muestra el valor de las ventas (en miles de dólares) del mes en
regresión.
SOLUCIÓN:
Nro. Ventas X2 XY Y2
Contactos(X) (Y)
14 24 196 336 576
12 14 144 168 196
20 28 400 560 784
16 30 256 480 900
46 80 2116 3680 6400
23 30 529 690 900
48 90 2304 4320 8100
50 85 2500 4250 7225
55 120 3025 6600 14400
50 110 2500 5500 12100
∑𝑿 ∑𝑌 ∑ 𝑋2 ∑ 𝑋𝑌 ∑ 𝑌2
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟=
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 ][𝑛 ∑ 𝑦 2 − (𝑦)2 ]
10𝑥26584 − 334𝑥611
𝑟=
√[10𝑥13970 − 3342 ][10𝑥51581 − 6112 ]
𝑟 =0.9754
𝑟 2 = 0.97542 = 0.9514
c. Coeficiente de la no determinación
1 − 𝑟 2 = 1 − 0.9514 = 0.0486
d. Ecuación de regresión
𝑦 = 𝑎 + 𝑏𝑥
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
10𝑥26584 − 334𝑥611
𝑏=
10𝑥13970 − 3342
𝑏 = 2.1946
∑𝑦 𝑏∑𝑥
𝑎= −
𝑛 𝑛
611 2.1946𝑥334
𝑎= −
10 10
𝑎 = −12.1996
𝑦 = −12.1996 + 2.1946𝑥
Resultados en el Minitab:
120 S 9,31045
R-cuad. 95,1%
R-cuad.(ajustado) 94,5%
100
80
60
y
40
20
0
10 20 30 40 50 60
x
Análisis de regresión
∑ 𝑦 2 − 𝑎 ∑ 𝑦 − 𝑏 ∑ 𝑥𝑦
𝑆𝑦𝑥 = √
𝑛−2
𝑆𝑦𝑥 = 9.3120
regresión en 9.3120.
2) 𝛼 = 0.05
3) t-student
4) Grafica de la RA y RC
𝑆𝑦𝑥
𝑆𝑏1 =
2
√∑ 𝑥 2 − (∑ 𝑥)
𝑛
9.3120
𝑆𝑏1 =
2
√13970 − 334
10
𝑆𝑏1 = 0.1755
2.1946 − 0
𝑡=
0.1755
𝑡 = 12.5048
𝑡𝑘 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
ventas
2) 𝛼 = 0.05
3) t-student
4) Grafica de la RA y RC
𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
0.9754√10 − 2
𝑡=
√1 − 0.97542
𝑡 = 12.5151
𝑡𝑘 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
ventas.
h. Intervalo de confianza de 𝛽1
1.7899 ≤ 𝛽1 ≤ 2.5993
𝑦 = −12.1996 + 2.1946𝑥
Intervalo de confianza
1 (𝑥 − 𝑥̅ )
𝐼𝐶 = 𝑦̂ ± 𝑡(0.05,10−8) 𝑆𝑦𝑥 √ +
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛
1 (40 − 33.4)2
𝐼𝐶 = 75.5844 ± 2.306𝑥9.3120√ +
10 3342
13970 − 10
𝐼𝐶: [68.2873,82.8815]
82.8815.
Intervalo de predicción
1 (𝑥 − 𝑥̅ )2
𝐼𝑃 = 𝑦̂ ± 𝑡(0.05,10−8) 𝑆𝑦𝑥 √1 + +
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛
1 (40 − 33.4)2
𝐼𝑃 = 75.5844 ± 2.306𝑥9.3120√1 + +
10 3342
13970 − 10
𝐼𝑃: [52.9049,98.2639]
Interpretación: Una cantidad de 40 contactos hará que los valores de las ventas
j. Análisis de influencia
X Y RES-T HI COOK
En la tabla