Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA Y PROBABILIDAD
ANALISIS DE VARIANZA
...............................
T1 .. T2 .. T3 .. T .1..
LIMA, 2019
Estadística y Probabilidad
Dra. Sara Adelina Arana López
INTRODUC CION
Es evidente que la conclusión de que con renta alta el consumo es mayor que con renta
media es más rotundo en la provincia B que en la A. En la provincia A existen familias
de renta media con un consumo superior a otras familias de renta alta aunque en
promedio X 21 X 11 . Esta situación no se produce en la provincia B donde todas las
Estadística y Probabilidad
Dra. Sara Adelina Arana López
ANALISIS DE VARIANZA
RELACION F
Cuando las medias poblacionales son diferentes existe un efecto de tratamiento y las
desviaciones intermuestrales pueden ser grandes comparadas con las desviaciones
debido al error dentro de una muestra. Por lo tanto el valor de F, que es una relación
entre la variación debida al tratamiento y la variación debido al error, aumentara.
PROCEDIMIENTO
Tratamientos
1 2 3 ……. K
...............................
T .. T2 .. T3 .. T .1..
Total : T .1 1 T ..2 T .3 T. K T ...
Medias: X .1 X .2 X .3 X .K X ..
2. Supuestos
Junto con las suposiciones que fundamenta el análisis, se presenta el modelo
de cada diseño estudiado.
Estadística y Probabilidad
Dra. Sara Adelina Arana López
xij j ij
i= 1, 2,3,…, nj j= 1,2,…, k
3. Hipótesis
H 0 : 1 2 ... k
H A : no todas las Muestras son iguales
H0 : j 0 , j 1,2,.....k
H A : no todas las j 0
4. Estadística de prueba
Es el cálculo de la razón de las varianzas (R.V.), son las mismas
6. Regla de decisión
Es rechazar la Ho, si el valor calculado para R.V. es mayor o igual que el valor
critico de F con un nivel alfa
Estadística y Probabilidad
Dra. Sara Adelina Arana López
Sumas de cuadrados
a. Sumas de cuadrados para el total
b. Suma de cuadrados entre de los grupos
c. Suma de cuadrados dentro grupos
Grados de libertad
a. Grados de libertad para el total : n-1
b. Grados de libertad entre grupos (muestras) : k - 1
c. Grados de libertad dentro de los grupos n- k
Cuadrados medios
a. Cuadrados medios entre grupos : CME = SCE/k-1
b. Cuadrado medio dentro de los grupos : CMD = SCD/n – k
8. Decisión estadística
Comparar la R.V. Calculada con el valor crítico de F (se obtiene en la tabla) con
los grados de libertad ( k – 1)/(n – k)
Si R.V. Es mayor o igual al valor crítico de F la hipótesis nula se rechaza.
R.V . Ftabla
9. Conclusión
Si se rechaza se concluye que no todas las medias son iguales.
10. Cálculo del valor p
Estadística y Probabilidad
Dra. Sara Adelina Arana López
EJEMPLO
Tratamientos
Programa 1 Programa 2 Programa
85 80 82
72 84 80
83 81 85
80 78 90
…. 82 88
Total : 320 405 425 T .. 1150
n: 4 5 5 n.. = 14
Medias: 80 81 85 X .. 82.14
Estadística y Probabilidad
Dra. Sara Adelina Arana López
CUALITATIVAS INDEPENDIENTES
INTRODUCCION
nombre de indicativas y solo cuando se trata de dos valores se les llama dicotómicas
(como 0,1).
Aplicativo
El gerente de una cadena de almacenes desea estudiar la relación entre gastos medios
de sus clientes y las variables que podrían explicar el nivel de dic hos gastos, elige la
renta como variable explicativa, pero también considera el sexo de sus clientes, que
podría representar un papel en la explicación en sus gastos. Renta y gastos en soles y
sexo.
Yˆ b0 b1 X 1 b2 X 2
Yˆ 12.21X 1 0.791 5.11X 2
El uso de la variable ficticio sexo dará lugar a dos rectas de regresión, una para hombres
y otra para mujeres. Las rectas tienen l misma pendiente, pero diferentes ordenadas en
el origen. Es decir la ecuación da lugar a dos rectas de regresión paralelas, que inician
con valores diferentes.
Como se ha codificado a hombres con cero, la ecuación será:
Yˆ b0 b1 X 1 b2 X 2
Yˆ 12.21X 1 0.791 5.11(0) 2
Yˆ 12.21X 0.791
1
COMPROBACIÓN DE LA NORMALIDAD
Procedimiento
i 0.5
Yi X Sˆ R ,
1
i 1,2, . . . , n
n
3. Representar : i , Yi
Herramientas
Gráficos de residuos:
Frente a valores previstos
Frente a tratamientos (o factor,etc.)
Contrastes formales:
Bartlett, Cochran, Hartley, Levene
Estadística y Probabilidad
Dra. Sara Adelina Arana López
HETEROCEDASTICIDAD:
a veces la dispersión aumenta conforme la media crece.
En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero