Sunteți pe pagina 1din 45

INFERENCIA ESTADÍSTICA

FASE 3 - PRUEBA DE HIPÓTESIS Y ANOVA

Presentado por:
Francisco Javier Arregui Quintero
Codigo: 1.059.063.753

Grupo: 46

Presentado a:
Alvaro Alberto Huertas Cabrera

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
2019
TIPO DE MUESTREO: Sistemático

Muestreo en que los n elementos de la muestra se seleccionan tomando aleatoriamente un númer


primero que va a formar parte de la mue

Características:
1) Una lista completa de la población
2) La población ordenada y la muestra también estará ordenada
Esta es la forma o cada cuanto se selecciona un elemento
K= N/n
K= fracción sistemática (o cada cuanto se toma el elemento de la población)
N= Tamaño de la población
n= Tamaño de la muestra (Calculado ya anteriormente)

K= N/n
N= 1190
n= 38
K= 31.32 se redondea

K= 31 Seleccione la muestra cada 31 elementos


Alea= 29 Se escoge un número aleatorio entre 1 y K.
Fijo= 5 Copie y pegue el número aleatorio como valor para que no e

1) Rellene una columna que empiece desde 1 hasta n

2) Luego, empieze la 2da columna con el número que encontró entre 1 y K,

LISTO! Esta es la lista de personas que van a conformar su muestra, recuer

3) Copie y pegue los nombres de las variables de la población

4) Use la función =BUSCARV(C36;Población!$A$6:$Q$918;2;0) esto es par


261 elementos que va a incluir en la muestra. El número 2, corresponde a la

Crioscopia (°C) Departamento

28 842 -0.51 4
29 873 -0.57 4
30 904 -0.5 4
31 935 -0.52 4
32 966 -0.51 4
33 997 -0.54 4
34 1028 -0.5 4
35 1059 -0.52 4
36 1090 -0.5 4
37 1121 -0.53 4
38 1152 -0.48 4
TIPO DE MUESTREO: Sistemático

tomando aleatoriamente un número i, que designará, en una lista o población de N elementos, al


ero que va a formar parte de la muestra.

ento de la población)

ada 31 elementos
eatorio entre 1 y K.
o aleatorio como valor para que no este cambiando

sde 1 hasta n

l número que encontró entre 1 y K, es decir el que corresponde al valor fijo

van a conformar su muestra, recuerde que es importante mantener la constante K

iables de la población

ción!$A$6:$Q$918;2;0) esto es para que no tenga que pasar manualmente la información de los
estra. El número 2, corresponde a la columna de la variable, en este caso Municipio

Densidad (g/ml) % Proteína % Grasa % Sólidos


totales
0.95 3.3 3 11.7
1.02 3.3 2.9 12.1
1.06 3.3 3.1 12.4
1.06 3.2 2.9 11.9
1.11 3.2 3 11.1
0.99 3 2.9 11.8
1.03 3.2 3 11.4
1.01 3.1 3.1 11.9
1.06 3.2 2.9 11.7
1.05 3.1 3.2 11.8
1.11 3.1 3 11.7
Nota: Solo se emplea este muestreo para n<50%, si n>50% se debe de
aleatorio simple.

Células somáticas (células/ml Peroxidasa Fosfatasa


de leche)
1897932 2 2
1891669 2 2
1893990 2 2
1897948 2 2
1913151 2 2
1886323 1 1
1901369 1 1
1877060 2 2
1892042 2 2
1894139 2 2
1909317 2 2
reo para n<50%, si n>50% se debe de proceder a realizar un muestreo
aleatorio simple.

Tipo de leche Temperatura Costo Prueba de Temperatura de


yodo recepcion
2 1 484 2 1
2 2 724 2 1
1 1 983 2 1
1 1 704 2 1
1 1 767 2 1
2 1 901 2 2
1 3 455 2 1
1 1 1043 2 1
1 2 558 2 2
4 2 912 2 2
4 1 691 2 1
Satisfacción

2
1
2
2
2
2
2
2
2
2
2
Unificación de respuestas

¿Cuáles son las partes por las que está conformada una prueba de hipótesis?
Una prueba estadística de hipótesis esta formada de cinco partes:
La hipótesis nula, denotada por Hₒ

La hipótesis alternativa, denotada por Hₐ

El estadístico de prueba y su valor p


La región de rechazo
Conclusión
¿Como decide el investigador si debe de rechazar o aceptar H0?
Se decide a partir de la regla de decision o el criterio de rechazo. Esta depende del tipo de hipotesis
alterna que se tenga: cola derecha (>) , cola izquierda (<) o bilateral (≠). Luego despues de calcular
el estadistico de prueba, este se compara con un estadistico de tabla (critico) el cual es la referencia
para la regla de decision y para establecer la region de rechazo. luego si el estadistico de prueba
esta en la region de rechazo se rechaza la hipotesis nula. por otro lado tambien se puede realizar el
calculo del valor p, que es la probabilidad de que la regla de decision sea cierta bajo la hipotesis
nula. el valor p se compara con un nivel de significancia α, si este es menor al nivel de significancia
se rechaza Ho)

¿A qué se le conoce como error tipo I?


Error Tipo I: Es el error que se comete cuando el investigador no acepta la hipótesis nula
(Ho) siendo ésta verdadera en la población. Ejemplo: Cuando un investigador necesita
saber las causas por las cuales una población determinada presenta altos niveles de
deserción escolar. Plantea como hipótesis nula que se debe a causas culturales; sin
embargo, este mismo investigador rechaza su propia hipótesis; sin embargo, se comprueba
que era cierta.
Definición y características principales del análisis de varianza.
Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más poblaciones
son iguales. Los ANOVA evalúan la importancia de uno o más factores al comparar las medias de la
variable de respuesta en los diferentes niveles de los factores. La hipótesis nula establece que todas
las medias de la población (medias de los niveles de los factores) son iguales mientras que la
hipótesis alternativa establece que al menos una es diferente.
Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al menos un factor
categórico con dos o más niveles. Los análisis ANOVA requieren datos de poblaciones que sigan una
distribución aproximadamente normal con varianzas iguales entre los niveles de factores. Sin
embargo, los procedimientos de ANOVA funcionan bastante bien incluso cuando se viola el
supuesto de normalidad, a menos que una o más de las distribuciones sean muy asimétricas o si las
varianzas son bastante diferentes. Las transformaciones del conjunto de datos original pueden
corregir estas violaciones.

¿Cuándo y como aplicar un análisis de varianza?


Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis,
aunque se aceptan ligeras desviaciones de las condiciones ideales:1. Cada conjunto de
datos debe ser independiente del resto. 2. Los resultados obtenidos para cada conjunto
deben seguir una distribución normal. 3. Las varianzas de cada conjunto de datos no deben
diferir de forma significativa. Cuando se utiliza la técnica anova se deben cumplir los
siguientes supuestos: 1. Las personas de los diversos subgrupos deben seleccionarse
mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. 2. La
varianza de los subgrupos debe ser homogénea. 3. Las muestras que constituyen los grupos
ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto,
generen estimaciones de varianza independientes, la razón de las varianzas inter e intra no
adoptará la distribución F.
¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué.
Claro que es importante pues nos permitira determinar la importancia de un determinado valor
dentro de la poblacion estudiada. Por ejemplo al analizar si el nivel academico es importante en la
definicion del salario, el analisis ANOVA es el metodo adecuado, pues a travez de la comparacion de
mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. 2. La
varianza de los subgrupos debe ser homogénea. 3. Las muestras que constituyen los grupos
ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto,
generen estimaciones de varianza independientes, la razón de las varianzas inter e intra no
adoptará la distribución F.
¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué.
Claro que es importante pues nos permitira determinar la importancia de un determinado valor
dentro de la poblacion estudiada. Por ejemplo al analizar si el nivel academico es importante en la
definicion del salario, el analisis ANOVA es el metodo adecuado, pues a travez de la comparacion de
la media nos dira si existe o no un efecto de del nivel academico sobre el sueldo devengado de la
muestra.
Fase 3 Pruebas de Hipotesis
Datos
Tamaño de la muestra = 38
Media Muestral promedio= -0.5222857
Desviación estandar= 0.02352542
Promedio de la variable X= 1.03
Paso 1: Describir la hipótesis

H0: media de la densidad del tipo de leche pasteurizada es mayor o igual a 1,03

H1: media de la densidad del tipo de leche pasteurizada es menor a 1,03

Escrito en forma simbólica:

H0 : µ > = 1,03
H1: µ < 1,03
(Prueba Unilateral izquierda)

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a= 0.05

Paso 3: Estadístico de prueba (o calculado)

𝒁_𝒑𝒓𝒖𝒆𝒃𝒂=(𝒙 ̅−
𝝁)/(𝒔/√𝒏)

Zprueba= -406.75

Paso 4: Estadístico teórico

Zteórico= -1.645 -1.645

Paso 5: Tomar la decisión

Se rechaza la hipótesis nula (Ho) porque el valor de Zprueba es menor a Z teórico


Se rechaza la hipótesis nula (Ho) porque el valor de Zprueba es menor a Z teórico

Conclusión:

La media de la densidad del tipo de leche pasteurizada es menor a 1,03


potesis

a. Una PH para probar si la media de la densidad del tip


pasteurizada es mayor o igual a 1,03 g/ml. (Prueba unilate

s mayor o igual a 1,03

s menor a 1,03

nilateral izquierda)

se va a trabajar

p-valor

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎
𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
ba es menor a Z teórico
ba es menor a Z teórico

menor a 1,03
si la media de la densidad del tipo de leche
igual a 1,03 g/ml. (Prueba unilateral izquierda)
Tabla de distribucion normal
Fase 3 Pruebas de Hipotesis
Datos
Tamaño de la muestra = 38
proveedores con prueba de peroxidasa = 6
(p) % proveedores con prueba de peroxidasa = 16%
(P) Proporción= 90%
Paso 1: Describir la hipótesis
H0: % de proveedores con prueba de peroxidasa es positiva es mayor al 90%
H1: % de proveedores con prueba de peroxidasa es positiva es menor al 90%

Escrito en forma simbólica:

H0 : P > = 90%
(Prueba Unilateral derecha)

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a =0.05

Paso 3: Estadístico de prueba (o calculado)


p- P
Proporción de la
muestra
Zprueba= Proporción
P(1- P) Poblacional

Zprueba= -15.25

Paso 4: Estadístico teórico (tablas)

Zteórico= 1.645

Paso 5: Tomar la decisión

Se rechaza la H0 porque Zprueba es menor que Zteorico y al realizar la grafica, se ubica en la zona
sombreada.
Se rechaza la H0 porque Zprueba es menor que Zteorico y al realizar la grafica, se ubica en la zona
sombreada.

Conclusión:

Se tiene que el valor de prueba es menor que el valor teórico por tanto se rechaza la hipotesis nula y por
tanto el % de proveedores con prueba de peroxidasa es positiva es menor a 90%
Una PH para la proporción, para probar si él % de proveedores con prue
peroxidasa es positiva es mayor al 90%. (Prueba Unilateral derecha

al 90%
al 90%

teral derecha)

16%
90%

p-valor
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟≤𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0


𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟>𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0

grafica, se ubica en la zona


o se rechaza la hipotesis nula y por
nor a 90%
él % de proveedores con prueba de
%. (Prueba Unilateral derecha)
Fase 3 Pruebas de Hipotesis

Datos
MEDIA POBLACIONAL

MEDIAS MUESTRALES
Crioscopia Crioscopia El promedio de células somáticas para el tipo de leche pasteurizada
(°C) (°C)
-0.54 -0.49 Media muestral= -0.522272727273
-0.52 -0.52 Desviación muestral= 0.02245245096
-0.54 -0.55 Tamaño de muestra( n1)= 22
-0.57 -0.49
-0.49 -0.53
El promedio de células somáticas para el tipo de leche pasteurizada e
H0: esterilizada.
-0.52 -0.48
-0.52
El promedio de células somáticas para el tipo de leche pasteurizada n
Ha: esterilizada.
-0.52
-0.52
-0.49 Ho : 𝜇_1 = 𝜇_2
Ha : 𝜇_1 ≠ 𝜇_2
-0.54 Donde
BILATER
-0.58 𝜇_1: promedio de células somáticas para el tipo de leche
-0.52 pasteurizada
𝜇_2: promedio de células somáticas para el tipo de leche
-0.53 esterilizada
-0.51
-0.53
-0.5 Paso 2: Establecer el nivel de significancia con el que se va a trabajar
-0.52
a = 0.05
-0.51
-0.5 Paso 3: Estadístico de prueba (o calculado)
-0.52
-0.5

Paso 4: Estadístico teórico (tablas)


Zteórico= -1.96

Paso 5: Tomar la decisión


Se acepta H0 porque el valor de Zprueba está dentro de la zona de aceptación.

Conclusión:
El promedio de células somáticas para el tipo de leche pasteurizada es igual al tipo de l
Pruebas de Hipotesis

Datos
Una PH para la diferencia de medias, para p
0 somáticas para el tipo de leche pasteurizada e
DIAS MUESTRALES (Prueba bilate
El promedio de células somáticas para tipo de leche esterilizada.

Media Muestral= -0.51


Desviación Muestral = 0.027568097504181
Tamaño de muestra(n2)= 6

para el tipo de leche pasteurizada es igual al tipo de leche

para el tipo de leche pasteurizada no es igual al tipo de leche

BILATERAL

ue se va a trabajar

Zprueba= -1.00
1.96

ro de la zona de aceptación.

che pasteurizada es igual al tipo de leche esterilizada


la diferencia de medias, para probar que el promedio de células
el tipo de leche pasteurizada es igual al tipo de leche esterilizada.
(Prueba bilateral)
Fase 3 Pruebas de Hipotesis
Datos
Departamento 1 Departamento 2 PROVEEDORES DEPARTAMENTO 1 PROVEEDORES DEPARTAMENTO 2
Peroxidasa Peroxidasa n1 = 10 n 2=
1 2
2 1 DEPARTAMENTO 1, NIVEL "SATISFECHO" DEPARTAMENT
2 2 X1= 2 X2=
2 2 P1= 20% P2=
2 Proporción Ponderada Pc
2 PC= 21%
2 1-PC= 79%
1
2 Paso 1: Describir la hipótesis
proveedores con peroxidasa positiva en el departamento 1 es igual a
Ho: peroxidasa positiva en el departamento 2.
2

Ha:
proveedores con peroxidasa positiva en el departamento 1 es mayo
peroxidasa positiva en el departamento 2.

Escrito en forma simbólica:


Ho : P1 = P2
Ha: P1 > P2

Donde
(Prueba Unil
P1: PROVEEDORES DEPARTAMENTO 1
P2: PROVEEDORES DEPARTAMENTO 2

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba (o calculado)

P1 - P2
Zprueba=
PC (1- PC ) PC (1- PC )
+
n1 n2

Zprueba= -0.05
0.242752078113806
Paso 4: Estadístico teórico (tablas)

Zteórico= -1.960

Paso 5: Tomar la decisión

No se rechaza la H0 porque el valor de Zprueba està en la zo

Conclusión:

El % de proveedores con peroxidasa positiva en el departamento 1 es meno


peroxidasa positiva en el departamento 2 .
as de Hipotesis

ORES DEPARTAMENTO 2 TOTAL


a. Una PH para la diferencia de proporciones, para prob
4 14 con peroxidasa positiva en el departamento 1 es igua
peroxidasa positiva en el departamento 2. (Prueb
DEPARTAMENTO 2 NIVEL "SATISFECHO"
1
25%

epartamento 1 es igual al % de proveedores con

epartamento 1 es mayor al % de proveedores con

(Prueba Unilateral derecha)

ue se va a trabajar

= -0.205971460217775
1.960

de Zprueba està en la zona de aceptación.

epartamento 1 es menor al % de proveedores con con


e proporciones, para probar que él % de proveedores
l departamento 1 es igual al % de proveedores con
el departamento 2. (Prueba unilateral derecha)
Evaluar si el “costo” depende del “departamento” del cual es recibida la leche.

Departamento 1
Costo promedio proveedor 1
Costo promedio proveedor 2
Costo promedio proveedor 3
Costo promedio proveedor 4
Costo promedio proveedor 5

Paso 1: Describir la hipótesis

H0: El costo depende del departamento del cual es recibida la leche


H1: El costo no depende del departamento del cual es recibida la leche

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba F (o calculado)

Departamento 1
Observación 1 357
Observación 2 843
Observación 3 1042
Observación 4 601
Observación 5 543

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta
357 4
796 4
484 4

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados
Entre grupos 8265.5
Dentro de los grupos 231268.5
Total 239534

Paso 5: Tomar la decisión

El estadístico de prueba F es menor al valor crítico, por tanto, Se acepta la Ho


rtamento” del cual es recibida la leche. La organización de los datos a trabajar debe ser así:

Departamento 3 Departamento 4
Costo promedio proveedor 6 Costo promedio proveedor 11
Costo promedio proveedor 7 Costo promedio proveedor 12
Costo promedio proveedor 8 Costo promedio proveedor 13
Costo promedio proveedor 9 Costo promedio proveedor 14
Costo promedio proveedor 10 Costo promedio proveedor 15

ento del cual es recibida la leche


amento del cual es recibida la leche

e se va a trabajar

Departamento 3 Departamento 4
796 484
768 724
732 983
860 704
925 767

Suma Promedio Varianza


3029 757.25 52917.5833
3285 821.25 7688.91667
3178 794.5 16483

Grados de libertad Promedio de los cuadrados F


2 4132.75 0.1608293
9 25696.5
11

No rechazar Ho
0.160829295818497

Rechazar Ho
4.25649472909375

ítico, por tanto, Se acepta la Ho


bajar debe ser así:

Probabilidad Valor crítico para F


0.853831012832477 4.25649472909375
Referencias.

Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva, teoría de la
probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide. pp. 313 -328. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=314&docID=11231145&tm=1492554719817

Gutiérrez,H. (2013). Capítulo 4: Elementos de Inferencia Estadística Control estadístico de la calidad y


Seis Sigma.(3a. ed.) McGraw-Hill Interamericana. pp. 72- 90. Recuperado
de http://bibliotecavirtual.unad.edu.co:2053/?il=280

Matus, R., Hernández, M., & García, E. (2010). Estadística. México, D.F., MX: Instituto Politécnico
Nacional. pp. 65-84. Recuperado de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=76&docID=10365616&tm=1492555215945

Espejo, M. I., Fernández, P. F., & López, S. M. (2016). Inferencia estadística: teoría y problemas (2a. ed.).
Madrid, ESPAÑA: Servicio de Publicaciones de la Universidad de Cádiz. pp. 147-178. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=184&docID=11245681&tm=1492555413858

Espejo, M. I., Fernández, P. F., & López, S. M. (2016). Inferencia estadística: teoría y problemas (2a. ed.).
Madrid, ESPAÑA: Servicio de Publicaciones de la Universidad de Cádiz. pp. 81-102.  Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=7&docID=11245681&tm=1492556558891

Güeto, L. R. (2018). Base de datos Inferencia Estadística_474.xls. Colombia.Recuperado


de https://docs.google.com/spreadsheets/d/1_Y0fd_J34NNICb6cnZyPdH9Pk1yy4sCKD3HAk91zSyc/edit#
gid=805947158

Sánchez, J. T. (2017). Paso 3_Formato ejemplo prueba de hipótesis y Anova.xls [Archivo de video].
Recuperado dehttps://drive.google.com/file/d/0B1mha95hD80CdlYxOGIyUGI5LXM/view?usp=sharing

Sierra, J. (2013). Anova -Tukey  [Archivo de video]. Recuperado


de https://vimeo.com/59756490

Sierra, J. (2013). Anova -Tukey - InfoStat  [Archivo de video]. Recuperado


de https://vimeo.com/59763666

Sánchez, J. T. (2017). 100403 OVI2 pruebas de hipótesis [Archivo de video].


Recuperado de https://www.youtube.com/watch?v=Km5tj4XIz5I

Caliman, D. M. (2017). Hipótesis de prueba para la media [Archivo de video]


Colombia. Recuperado de https://www.youtube.com/watch?v=pdEKsfK0Nhk

Caliman, D. M. (2017). Hipótesis de prueba para diferencia de medias [Archivo de


video]. Recuperado de  https://www.youtube.com/watch?v=pdEKsfK0Nhk

González, J. R. (2017). Video tutorial prueba de hipótesis (Proporción y


media) [Archivo de video]. Recuperado de https://www.youtube.com/watch?
v=pdEKsfK0Nhk

Huertas, A. A. (2017). Análisis de Varianza Anova [Archivo de video]. Recuperado


de https://www.youtube.com/watch?v=pdEKsfK0Nhk 
media) [Archivo de video]. Recuperado de https://www.youtube.com/watch?
v=pdEKsfK0Nhk

Huertas, A. A. (2017). Análisis de Varianza Anova [Archivo de video]. Recuperado


de https://www.youtube.com/watch?v=pdEKsfK0Nhk 
oría de la
Recuperado

e la calidad y

litécnico
eader.action?

lemas (2a. ed.).


cuperado

lemas (2a. ed.).


uperado

HAk91zSyc/edit#

de video].
usp=sharing

ado

deo].

ideo]
0Nhk

Archivo de
hk

atch?

ecuperado
atch?

ecuperado

S-ar putea să vă placă și