Documente Academic
Documente Profesional
Documente Cultură
Dra. MARLENE
INVESTIGACIÓN EMPRESARIAL ASTUDILLO VICENTE.
PRUEBA DE HIPÓTESIS
VIDEOCONFERENCIA 3
Hipótesis Estadística
Prueba de hipótesis
Regresión lineal y Correlación
Chi cuadrado
En una
investigación la
hipótesis alterna
Una hipótesis se denota por Ha,
estadística es es un enunciado
una sobre la población
afirmación a investigar.
acerca de un
La hipótesis
parámetro La hipótesis nula sometida a
poblacional se denota por H0, prueba se llama
es la negación de hipótesis nula y
la hipótesis se denota H0
alterna.
EJEMPLO
H0: el ingreso medio de las mujeres es igual al ingreso medio de
los hombres.
Ha: el ingreso medio de las mujeres es diferente que el de los
hombres.
H0: XM = XH
Ha: XM ≠ XH
H0: el ingreso medio de las mujeres es mayor al ingreso medio de
los hombres.
Ha: el ingreso medio de las mujeres es menor que el de los
hombres.
H0: XM ≥ XH
Ha: XM < XH
EJEMPLO
1. El tiempo promedio de duración de una determinada marca
de pilas es de 96 horas. NS= 5%=0.05 Z= 1,96
_ _
H0 : X = 96 Ha : X < 96
Curva de distribución
normal
0,025
0,025
-1,96 1,96
EJEMPLO
Curva de distribución
normal
NS= 1%=0.01 Z= 2,57
-1,64
EJEMPLO
2,57
PRUEBA DE HIPÓTESIS
Una empresa fabrica miles de focos de luz,
diariamente, se espera que los focos tengan una vida
de 1 000 horas ya que cuando se venden, eso es lo que
se ofrece a los compradores.
ALGUNAS QUEJAS DE
DUDAS CLIENTES
NO ES POSIBLE
SE TOMA UNA
PROBAR TODOS
MUESTRA
LOS FOCOS
Entonces lo que la empresa quiere probar es que:
V F
Esta afirmación cuya veracidad se Prueba se llama
HIPÓTESIS
HIPÓTESIS NULA:
La vida media de los focos es 1 000 horas
HIPÓTESIS ALTERNATIVA:
La vida media de los focos es menor que 1 000 horas
Simbólicamente se representa:
H0 : µ = 1 000
Ha : µ < 1 000
Si m = 24
Se prueban
Se calcula la vida media
X = 970 horas
En base a estos resultados:
Es así
Si a partir de la población se extraen 3 muestras y en cada
muestra se halla la media
NS = 10% Z = 1,64
NS= 5% Z= 1,96
NS= 1% Z= 2,57
TIPOS DE ERRORES
EMPRESARIO DISTRIBUIDOR DE
ELECTRODOMESTICOS
CUESTIONARIO
COMPRAS ONLINE
n= 50
30 realizaron compras
P= ?
¿O el porcentaje es menor?
PRUEBA DE HIPÓTESIS
3 situaciones
H0 : X = µ H0: X ≥ µ H0: X ≤ µ
Ha: X < µ Ha: X < µ Ha: X > µ
NIVEL DE SIGNIFICANCIA
Es la probabilidad de cometer el error tipo I, este
valor debe ser pequeño
1
2
3
El valor de Z depende del grado de confianza
NS= 5% Z= 1,96
NS= 1% Z= 2,57
Valor de t se busca en la tabla de la siguiente
manera:
Ejemplo
Si n = 20
α= 0,025
gl = n- 1 = 19
Tc = 2,093
Paso 5: llegar a una decisión
Para z:
Si |Zc | > | Zt |
- Se rechaza la hipótesis nula H0 y
se acepta la hipótesis alternativa H1.
Si |Zc | ≤ | Zt |
- Se acepta la hipótesis nula H0
PRUEBA DE HIPÓTESIS PARA LA MEDIA
Para t :
Si |tc | > | tt |
- Se rechaza la hipótesis nula H0 y
se acepta la hipótesis alternativa H1.
Si |tc | ≤ | tt |
- Se acepta la hipótesis nula H0
EJEMPLO
α = 5%
DATOS X = 47,3 MEDIA MUESTRAL
0,025
0,025
-1,96 1,96
PASO 4 Paso 4: Identificar el valor estadístico de prueba
= σ /√n
Z = 47,3 – 50
5,7 / √150 µ = 50
α = 5%
Z= -2,7 X = 47,3
5,7 / 12,25 S = 5,7
Z = -2,7 n = 150
0,47
Z= -5,74
DATOS
PASO 5 Z= -5,74
0,25
0,25
-1,96 1,96
INTERPRETACIÓN.
r
INTERPRETACIÓN.
DIAGRAMA DE DISPERSIÓN
ANÁLISIS DE REGRESIÓN SIMPLE
y= α + ßx + e
Donde:
Y es la variable dependiente
X es la variable independiente.
ß es el coeficiente de regresión
α es el intercepto
e es una variable aleatoria con media 0 y varianza σ²y/x.
INTERPRETACIÒN DEL COEFICIENTE DE
CORRELACIÓN
R2 = r²*100
Mide la bondad de ajuste de los
puntos a la recta
0≤ R2 ≤ 100%
ERROR ESTÁNDAR DE LA ESTIMACIÓN.
EJEMPLO 4
Se colocan los
datos en la
siguiente
tabla
Xi * Yi X 2 Y2
Se colocan los
siguientes
datos
Xi * Yi
Se suman
las
columnas
∑=
Se halla el valor de “a” y “b”
Y = a + bX aplicando las formulas
a= ∑Y - b ∑ x 156 - -3,1774 28
___ ___ = ----- --- = 40,827
n n 6 6
y = a + bX ( se reemplaza a y “b”)
Y = 40,827 - 3,17 X
C) Calcular el coeficiente de correlación.
d) Coeficiente de determinación
R2 = (-0,96)2 = 0,9216
e) Pronosticar la distancia si el numero de clientes es 10
Y =
Mide el grado de concordancia entre los pares de frecuencias observadas y esperadas de las
celdas, dado que la Ho sea verdadera.
PRUEBA DE INDEPENDENCIA
FORMULA DE TRABAJO
2° Nivel de significancia
α= 5% = 0,05
3° Estadístico : chi cuadrado
con v= ( r-1) ( K-1)
( 2-1) (2-1) = 1 grados de libertad
4° Se halla la región critica
Para nivel de significancia 0,05 y 1 grado de libertad
X20,95 = se busca en la tabla
5% = 0,05
Grado de libertad
X20,95 = 3,8415
Se rechazará H0 si el valor calculado del
e1 = 47 x 69 = 32,43 e2 = 53 x 69 = 36,57
100 100
SIN DEPRESIÓN CON DEPRESIÓN TOTAL Suma de
DEPORTISTA 38 9 47 la fila
NO DEPORTISTA 31 22 53
TOTAL 69 31 100
gran
Suma de la total
columna
e3 = 47 x 31 = 14,57 e4 = 53 x 31 = 16,43
100 100
La tabla quedaría de la siguiente manera:
X2c = 42,579
7° Interpretación
X2 > Valor crítico
42,579 > 3,84
Por lo tanto como el valor del estadístico es superior al
valor crítico, concluimos que debemos rechazar la hipótesis
de independencia y por lo tanto asumir: hay evidencia
estadística para concluir que el conocimiento del grupo de
enfermedades depende del principal campo de estudio de los
estudiantes de bachillerato.
PRUEBA DE HOMOGENEIDAD
DEFECTUOSOS 16 24 9 49
2° Nivel de significancia
α= 5% = 0,05
3° Estadístico : chi cuadrado
con v= ( r-1) ( K-1)
( 2-1) (3-1) = 2 grados de libertad
J0 = 9,7683
.
7° Interpretación
X2 > Valor crítico
J0 > 5,99
9,7683 > 5,9915
Por lo tanto como el valor del estadístico es superior al
valor crítico, concluimos que debemos rechazar la hipótesis
de homogeneidad.
EJEMPLO 8
Estamos interesados en estudiar la fiabilidad de cierto componente informático
con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos
una muestra de 100 componentes de cada uno de los 3 distribuidores que nos
sirven el producto comprobando el número de defectuosos en cada lote. La
siguiente tabla muestra el número de defectuosos en para cada uno de los
distribuidores.
Realizar un contraste de homogeneidad y obtener las conclusiones sobre la relación entre las
variables.
SOLUCIÓN:
Debemos realizar un contraste de homogeneidad para concluir si entre los
distribuidores existen diferencias de fiabilidad referente al mismo componente.
5% = 0,05
Grado de libertad
X2 = 8,96
X2 >Valor crítico
8,96 > 5,9915
j