Sunteți pe pagina 1din 14

INFERENCIA ESTADISTICA

100403A _611

FASE COLABORATIVA
FASE 4

PRESENTADO POR:
CATHERINE SILVA OBANDO

PRESENTADO A:
LUIS ROBERTO GUETO

UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA


VILLAVICENCIO
2019
Células
Densidad Crioscopia % Proteína % Grasa % Sólidos somáticas Peroxidasa
Region (g/ml) (°C) totales (células/ml
de leche)
2 0.96 -0.57 3.4 3 12.0 1894349 1
2 1.02 -0.52 3.1 2.9 12.1 1901694 1
2 1.07 -0.52 3.4 3 11.8 1898196 2
2 1.06 -0.56 3 3 11.9 1893214 2
2 1.03 -0.51 2.9 3 11.6 1902357 2
2 1.03 -0.56 3.2 3.2 11.7 1901288 2
2 1.12 -0.54 3 2.9 12.2 1894246 2
2 1.12 -0.5 3.2 2.9 11.3 1894373 1
2 1.06 -0.54 3.2 2.9 12.3 1913724 2
2 0.95 -0.58 3.1 3 11.4 1905216 2
2 1 -0.51 3.2 2.9 11.9 1910548 2
2 1.01 -0.56 3.1 3.1 11.5 1904383 2
2 1.05 -0.56 3.1 2.9 12.0 1916710 2
2 0.98 -0.54 3.3 2.9 12.0 1892506 1
2 1.01 -0.54 3.2 3 11.4 1922642 2
Tipo de Temperatu Prueba de Temperatu Satisfacció
Fosfatasa Costo ra de
leche ra yodo n
recepcion

2 4 1 796 2 1 2
1 3 1 1100 2 1 2
2 1 1 758 2 2 2
2 4 1 542 2 1 2
2 1 1 640 2 1 2
2 3 2 784 2 2 2
2 4 2 664 2 1 2
2 4 2 761 2 1 2
2 4 2 959 1 2 2
2 1 2 514 2 1 1
2 1 3 419 2 2 2
2 1 3 677 2 1 2
2 2 3 1044 2 1 2
2 1 3 557 2 1 2
2 2 3 623 2 1 2
1. Definición y características principales del análisis de varianza
Es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está
particionada en ciertos componentes debidos a diferentes variables explicativas.

Característica
Es continua
Es asintótica
Sus valores no pueden ser negativos
Tiene sesgo positivo
Existe una familia de distribuciones F. cada vez que cambian los grados de libertad, ya sea en el
denominador; se crea una nueva distribución.

2. ¿Cuándo y cómo aplicar un análisis de varianza?


Cuando se quiere compara más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t
de student
Sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio,
considerando el valor medio de esta.

4. ¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué
El análisis de varianza determina entre lo que quiero conseguir con lo que realmente puedo alcanzar o he
alcanzado en cuanto a los ingresos y beneficios tanto a nivel educativo como comercial.
varianza está

sea en el

ontraste basado en la t

ácter aleatorio,


uedo alcanzar o he
l.
3. Explique cada uno de los modelos de análisis de varianza. De ejemplos.
Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k poblaciones distintas y fijas.

Ejemplo: se busca medir el impacto en el uso de la insulina en personas con problemas de diabetes,
comparándola con una dieta sin azúcar. Para ello se selecciona al azar 12 diabéticos y se distribuyen
aleatoriamente en 4 grupos aleatoriamente al primero de ellos no se le suministra el medicamento ni se le
restringe en el consumo de azúcar, al segundo con una dieta pobre en azúcar, al tercero una dieta sin azúcar
y al cuarto con insulina los niveles de azúcar en sangre de los 29 al finalizar los tratamientos son:

Grupo 1 Grupo 2 Grupo 3 Grupo 4


360 mg/dl 240 mg/dl 230 mg/dl 204 mg/dl
355 mg/dl 238 mg/dl 234 mg/dl 210 mg/dl
340 mg/dl 245 mg/dl 241 mg/dl 220 mg/dl

Calculando los totales y los cuadrados de los totales divididos por el número de observaciones:
Grupo 1 Grupo 2 Grupo 3 Grupo 4 total Sum2/n
Suma 1055 723 705 634 31,172 809,640.75
Sum /n
2
371,008.30 174,243 165,675 133,985.30 511,003.60

Calculamos los cuadrados de las observaciones y su total


Grupo 1 Grupo 2 Grupo 3 Grupo 4
129,600 57,600 52,900 41,616
126,025 56,644 54,756 44,100
115,600 60,025 58,081 48,400
371,225 174,269 165,737 134,116 845,347

A partir de estas cantidades básicas calculamos la suma de cuadrados


SC (total)= 845.347-809.640,75= 35.706,25
SC (intra) = 845.347 – 511.003,6 =334.343,4
SC (entre) = 511.003,6 - 809.640,75 = -298.637,15

Los cuadrados medios serán:


CM (entre)= -298.637,15 /3 =-99.545,7
CM (intra) = 334.343,4 /8 =41.792,925
Por consiguiente el estadístico de contraste vale:
F= -99.545,7/41.792,925=-2,4
erta aun nivel de confianza de 95% es de 4,1, por consiguiente se acepta la hipótesis nula y se concluye que los resultados de los
blaciones distintas y fijas.

de diabetes,
se distribuyen
edicamento ni se le
una dieta sin azúcar
ientos son:

aciones:

cluye que los resultados de los valores arrojados del tratamiento son diferentes.
Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han seleccionado aleatoriamente de un conju
SCE=∑▒∑▒(𝑋 _ ̅ 𝑖𝑗−𝑋  ̿ )^2
5
n Enero Febrero Marzo Abril Mayo
1 18 15 20 30 16 4
2 20 10 14 25 12 0
3 29 22 26 10 14 81
4 11 13 29 15 20 81
5 13 20 12 20 23 49
6 26 26 23 18 10 36
7 23 23 15 14 14 9
r= 7 20 18.42857 19.8571 18.8571 15.5714
Promedio 18.543 TABLA DE ANOVA
Fuente de
Entre
variación Sumade cuadrados
muestras
 
𝐶𝑀𝑇�=∑10_𝑖𝑗▒(� _��−�  
(Tratamient )^2
os)
Dentro de
muestras SCE=∑▒∑▒(𝑋_𝑖−𝑋 _ ̅ 𝑗 )^2
(error)
SC𝑇=∑24_(𝑖=1)^𝑛▒(𝑋_𝑖−
Variación 𝑋  ̅ )^2
total

�_0
4,02

�_1

0 0,59
onado aleatoriamente de un conjunto de m>k poblaciones.
SCE=∑▒∑▒(𝑋 _ ̅ 𝑖𝑗−𝑋  ̿ )^2 SC𝑇=∑24_(𝑖=1)^𝑛▒(𝑋_𝑖−
𝑋  ̅ )^2

11.755102 0.02040816 124.163265 0.18367347 0.29469388 12.5518367 2.12326531 131.266122


71.0408163 34.3061224 37.7346939 12.755102 2.12326531 72.9804082 20.637551 41.6946939
12.755102 37.7346939 78.4489796 2.46938776 109.351837 11.9518367 55.6089796 72.9804082
29.4693878 83.5918367 14.877551 19.6122449 56.8946939 30.7232653 109.351837 12.5518367
2.46938776 61.7346939 1.30612245 55.1836735 30.7232653 2.12326531 42.8089796 2.12326531
57.3265306 9.87755102 0.73469388 31.0408163 55.6089796 55.6089796 19.8661224 0.29469388
20.8979592 23.5918367 23.5918367 2.46938776 19.8661224 19.8661224 12.5518367 20.637551

TABLA DE ANOVA TABLA DE ANOVA


Grados de Cuadrado Fuente de Sumade Grados de Cuadrado
libertad medio Valor F Entre
variación cuadrados libertad medio
muestras
C-1 𝑆𝐶𝑇�/(𝑐−1) 𝐶𝑀𝑇�/𝐶𝑀� (Tratamient 4
os) 89.5428571 22.3857143
Dentro de
n-C SCE/(𝑛−𝑐) muestras 30
(error) 1121.14286 37.3714286
n-1 Variación 34 �_(4,30,01=4,02)
total 1210.68571
1210.68571
6.46612245
42.8089796
20.637551
2.12326531
19.8661224
72.9804082
20.637551

Valor F

0.59900612

�_(4,30,01=4,02)
�_0=El promedio de grasa del departamento 1 con una temperatura 1,2, y 3 son iguales

�_1=El promedio de grasa del departamento 1 con una temperatura 1, 2 y 3 son diferentes

Temperatura Temperatura SCE=∑▒∑▒(𝑋  ̅_𝑖𝑗−𝑋  ̿ )^


Temperatura 1
N° 2 3

(Alta) (Media) (Baja)


1 2.975 2.9875 2.96875
2 2.96875 2.96875 2.98125
3 2.975 2.96875 2.96875
4 2.975 2.96875 2.96875
5 2.975 2.975 2.975
r= 5 2.97375 2.97375 2.9725
Promedio 2.97333
TABLA DE ANOVA
Cuadrado
Fuente de variación Sumade cuadrados Grados de libertad medio
𝐶𝑀𝑇�=∑2_𝑖𝑗▒(𝑋  ̅_𝑖𝑗−𝑋  ̿ 𝑆𝐶𝑇�/(𝑐−1) 𝐶𝑀𝑇�/𝐶𝑀�
Entre muestras )^2 C-1
(Tratamientos)
SCE=∑▒∑▒(𝑋_𝑖−𝑋 _ ̅ 𝑗 )^2
SCE/(𝑛−𝑐)

Dentro de muestras n-C


(error)
SC𝑇=∑_(𝑖=1)^𝑛▒(𝑋_𝑖−𝑋  ̅
Variación total )^2 n-1

0.05
�_0
3,885

�_1

0 0,07
SCE=∑▒∑▒(𝑋  ̅_𝑖𝑗−𝑋  ̿ )^2 SC𝑇=∑_(𝑖=1)^𝑛▒(𝑋_𝑖−𝑋  ̅
)^2

1.5625E-06 0.00018906 1.40625E-05 2.777778E-06 0.000200694 2.10069444E-05


0.000025 0.000025 7.65625E-05 2.100694E-05 2.100694E-05 6.26736111E-05
1.5625E-06 0.000025 1.40625E-05 2.777778E-06 2.100694E-05 2.10069444E-05
1.5625E-06 0.000025 1.40625E-05 2.777778E-06 2.100694E-05 2.10069444E-05
1.5625E-06 1.5625E-06 0.00000625 2.777778E-06 2.777778E-06 2.77777778E-06

TABLA DE ANOVA
Valor F Fuente de Sumade Grados de Cuadrado
variación cuadrados libertad medio Valor F
𝐶𝑀𝑇�/𝐶𝑀�
Entre muestras 2
(Tratamientos) 5.208333E-06 2.604167E-06 0.0740740741

Dentro de 12
muestras (error) 0.000421875 3.515625E-05

Variación total 14 �_(2,12,0,05=3,885)


0.000427083
0.000427083

Conclusión: elvalor de 0,07 se encuentra en la zona de aceptacón por lo tanto el promedio


de grasa del departamento 1 con una temperatura alta, media y baja son igulas como lo
plantea la hipotesis nula
0,05=3,885)