Sunteți pe pagina 1din 22

INFERENCIA ESTADÍSTICA

Fase 4 - ANOVA

Presentado por:

Grupo:

Presentado a:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
2020
Definición y características principales del análisis de varianza
El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La
en una muestra única, obtenida a partir de cada población. El análisis de varianza puede servir para determinar si las diferenc
medias muestrales revelan las verdaderas diferencias entre los valores medios de cada una de las poblaciones, o si las diferen
los valores medios de la muestra son más indicativas de una variabilidad de muestreo.

¿Cuándo y cómo aplicar un análisis de varianza?


Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F y su significación. El estadístico F o F-test (se llam
estadístico Ronald Fisher) se obtiene al estimar la variación de las medias entre los grupos de la variable independiente y divi
estimación de la variación de las medias dentro de los grupos. El cálculo del estadístico F es algo complejo de entender, pero
dividir la variación entre los grupos por la variación dentro de los grupos. Si las medias entre los grupos varían mucho y la me
grupo varía poco, es decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de F será más alto, y por
variables estarán relacionadas. En conclusión, cuanto más difieren las medias de la variable dependiente entre los grupos de
independiente, más alto será el valor de F. Si hacemos varios análisis de ANOVA de un factor, aquel con F más alto indicará qu
diferencias y por tanto una relación más fuerte entre las variables.

¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué
Totalmente útil la aplicabilidad de la varianza ya que esta suele utilizar los estadísticos para estimar los parámetros de una po
vez generar un coeficiente claro de dispersión en los datos obtenidos ya que esta generaliza y a la misma vez clarifica los dato
el estudio.
más poblaciones son iguales. La prueba se basa
r para determinar si las diferencias entre las
e las poblaciones, o si las diferencias entre

El estadístico F o F-test (se llama F en honor al


la variable independiente y dividirla por la
go complejo de entender, pero lo que hace es
os grupos varían mucho y la media dentro de un
el valor de F será más alto, y por tanto, las
ependiente entre los grupos de la variable
aquel con F más alto indicará que hay más

stimar los parámetros de una población. Y a su


a la misma vez clarifica los datos necesarios en
TIPO DE MUESTREO: Sistemáti

Muestreo en que los n elementos de la muestra se seleccionan tomando aleatoriamente un núm


primero que va a formar parte de la m

Características:
1) Una lista completa de la población
2) La población ordenada y la muestra también estará ordenada
Esta es la forma o cada cuanto se selecciona un elemento
K= N/n
K= fracción sistemática (o cada cuanto se toma el elemento de la población)
N= Tamaño de la población
n= Tamaño de la muestra (Calculado ya anteriormente)

K= N/n
N= 2989
n= 360
K= 8.30 se redondea

K= 8 Seleccione la muestra cada 31 elementos


Alea= 3 Se escoge un número aleatorio entre 1 y K.
Fijo= 6 Copie y pegue el número aleatorio como valor para que

1) Rellene una columna que empiece desde 1 hasta n

2) Luego, empieze la 2da columna con el número que encontró entre 1

LISTO! Esta es la lista de personas que van a conformar su muestra, rec

3) Copie y pegue los nombres de las variables de la población

4) Use la función =BUSCARV(C36;Población!$A$6:$Q$918;2;0) esto es


261 elementos que va a incluir en la muestra. El número 2, corresponde

DATOS % Sólidos
# Departamento
POBLACION totales

232 1854 11.7 6


235 1878 11.4 6
243 1942 11.9 6
267 2134 12.4 6
268 2142 12 6
271 2166 11.7 6
272 2174 12.1 6
273 2182 12 6
274 2190 11.8 6
275 2198 12.6 6
276 2206 11.6 6
279 2230 11.6 6
282 2254 11.9 6
290 2318 11.4 6
291 2326 12 6
296 2366 11.8 6
299 2390 11.7 6
301 2406 11.8 6
303 2422 12.2 6
310 2478 11.8 6
315 2518 12.3 6
319 2550 11.7 6
322 2574 11.9 6
328 2622 11.8 6
330 2638 12.2 6
331 2646 11.8 6
332 2654 11.9 6
334 2670 11.4 6
335 2678 11.5 6
344 2750 12.1 6
348 2782 11.7 6
350 2798 11.7 6
351 2806 11.8 6
PO DE MUESTREO: Sistemático

omando aleatoriamente un número i, que designará, en una lista o población de N elementos, al


o que va a formar parte de la muestra.

de la población)

ada 31 elementos
eatorio entre 1 y K.
o aleatorio como valor para que no este cambiando

sde 1 hasta n

l número que encontró entre 1 y K, es decir el que corresponde al valor fijo

van a conformar su muestra, recuerde que es importante mantener la constante K

iables de la población

ción!$A$6:$Q$918;2;0) esto es para que no tenga que pasar manualmente la información de los
estra. El número 2, corresponde a la columna de la variable, en este caso Municipio

Densidad (g/ml) Crioscopia (°C) % Proteína % Grasa

0.96 -0.54 3.2 2.9


1.02 -0.57 3.2 3.1
1.02 -0.54 3.1 3
1.02 -0.52 3.2 3.1
1 -0.54 3 3.1
1.07 -0.53 3.2 3
0.92 -0.56 3.2 3
1 -0.54 3.2 3
1.02 -0.54 3.3 3.1
1.03 -0.52 3.3 2.9
1.01 -0.53 3.2 2.9
1.05 -0.51 3.2 3.1
1.05 -0.56 3.3 2.9
1 -0.54 3 3
1.02 -0.52 3 3
1.07 -0.55 3.1 2.9
1 -0.55 3.1 3.2
1.08 -0.51 3.2 2.9
0.95 -0.55 3.2 3.1
1.03 -0.51 3.3 3
0.89 -0.52 3.2 2.8
1.06 -0.54 3 2.9
1.05 -0.51 3.2 3
1.14 -0.53 3.2 3.2
1.01 -0.55 3.3 3
1.15 -0.55 3.3 3.1
1.06 -0.52 3.2 3.1
1.04 -0.54 3.1 3
1.06 -0.54 3 2.9
1.06 -0.52 3.2 3.1
1.07 -0.55 3.3 3
1.07 -0.54 3.4 3
1.05 -0.56 3.2 3
Nota: Solo se emplea este muestreo para n<50%, si n>50% se debe de
aleatorio simple.

Células somáticas (células/ml


Peroxidasa Fosfatasa
de leche)

1899116 2 2
1895859 2 2
1882989 2 2
1900760 2 1
1896044 2 2
1897050 2 2
1903316 1 2
1902072 2 2
1902011 2 2
1902896 2 2
1894773 2 2
1906072 2 2
1890390 2 2
1887420 2 2
1883601 1 2
1907209 2 2
1907802 2 2
1892318 2 2
1903088 1 2
1912085 2 2
1918867 2 2
1893104 2 2
1896422 2 2
1912525 2 2
1898416 1 2
1892297 2 2
1886423 2 2
1885021 2 2
1901516 2 2
1876624 2 2
1894686 2 2
1898557 2 2
1886083 2 2
reo para n<50%, si n>50% se debe de proceder a realizar un muestreo
aleatorio simple.

Prueba de Temperatura de
Tipo de leche Temperatura Costo
yodo recepcion

4 1 742 1 1
2 1 647 2 1
2 1 847 2 1
1 2 932 2 1
1 3 537 2 1
3 2 526 2 1
1 1 567 2 1
4 2 788 2 1
2 2 656 2 1
1 2 865 2 1
1 1 571 2 1
4 2 513 2 1
1 3 613 2 1
2 1 515 2 1
1 2 721 2 1
2 3 477 1 1
1 1 862 2 1
1 1 516 2 1
1 2 646 2 1
1 2 940 2 1
1 1 1020 2 1
3 1 556 2 1
1 2 690 2 1
1 2 473 2 2
4 1 884 2 1
1 2 575 2 2
4 1 426 2 1
1 2 615 2 2
1 1 945 2 1
4 1 749 2 1
1 3 543 2 1
1 1 653 2 2
1 2 531 2 1
Satisfacción

2
2
2
2
3
2
2
1
2
1
2
2
2
2
2
2
1
2
2
2
4
2
4
3
2
2
2
2
2
2
2
2
2
Evaluar si el “costo” depende del “departamento” del cual es recibida la leche.

Departamento 2
Costo promedio proveedor 1
Costo promedio proveedor 2
Costo promedio proveedor 3
Costo promedio proveedor 4
Costo promedio proveedor 5

Paso 1: Describir la hipótesis

H0: El costo depende del departamento del cual es recibida la leche


H1: El costo no depende del departamento del cual es recibida la leche

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba F (o calculado)

Departamento 1
Observación 1 637
Observación 2 667
Observación 3 938
Observación 4 596
Observación 5 821

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta
Departamento 1 5
Departamento 2 5
Departamento 3 5

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados
Entre grupos 60962.5333333334
Dentro de los grupos 332562.8

Total 393525.333333333
Valor crítico para F 3.88529383465239

Paso 5: Tomar la decisión

Se acepta la hipotesis nula al ser el p-valor mayor al nivel de significancio por lo


departamento del cual es recibida la leche, la prueba ANOVA se realizo con un n
rtamento” del cual es recibida la leche. La organización de los datos a trabajar debe ser así:

Departamento 4 Departamento 6
Costo promedio proveedor 6 Costo promedio proveedor 11
Costo promedio proveedor 7 Costo promedio proveedor 12
Costo promedio proveedor 8 Costo promedio proveedor 13
Costo promedio proveedor 9 Costo promedio proveedor 14
Costo promedio proveedor 10 Costo promedio proveedor 15

ento del cual es recibida la leche


amento del cual es recibida la leche

e se va a trabajar

Departamento 2 Departamento 3
557 418
395 796
648 887
501 571
788 490

Suma Promedio Varianza


3659 731.8 20525.7
2889 577.8 22214.7
3162 632.4 40400.3

Grados de libertad Promedio de los cuadrados F


2 30481.2666666667 1.09986805
12 27713.5666666667

14
No rechazar Ho
1.09986805499593

Rechazar Ho
3.88529383465239

alor mayor al nivel de significancio por lo tanto el costo depende del


che, la prueba ANOVA se realizo con un nivel de significancia del 5%
bajar debe ser así:

Probabilidad Valor crítico para F


0.364255263030892 3.88529383465239
CONCLUSIONES
Estableciendo un nivel de confianza recomendado del 5% se realizo la prueba ANOVA, que determino que
la variable costo depende del departamento de donde proviende la leche, podemos concluir que a este
factor se le pueden agregar muchos aspectos como lo es el transporte, distancia, y manejo que se le debe
aplicar a la leche para que lleguen en optimas condiciones para su procesamiento.
Se debe evaluar cual es mas favorable para su procesamiento y posterior comercializacion sin que afecte la
produccion ya puede ser por retardos en la adquision de la leche o porque el producto no llegue en las
condiciones òptimas.
VA, que determino que
s concluir que a este
manejo que se le debe

zacion sin que afecte la


cto no llegue en las
Referencias

Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva,


teoría de la probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide.
Pp. 269 -298. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=270&docID=11231145&tm=1492552074909

Sánchez, J. T. (2017). Introducción a la Inferencia. [OVI] Colombia. Recuperado


de http://hdl.handle.net/10596/10566

Silva, A. L. C. (1993). Muestreo para la investigación en ciencias de la salud. Madrid,


ES: Ediciones Díaz de Santos. Pp. 1- 6. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=18&docID=10189879&tm=1492552993701

S-ar putea să vă placă și