Sunteți pe pagina 1din 19

ANOVA a una vía

ANOVA: prueba paramétrica que se emplea para probar si dos o más


poblaciones tienen la misma media.

Enfoques del análisis de varianza

a) ANOVA a una vía

b) ANOVA a dos vías

c) Análisis factorial

d) Diseño en cuadrado latino.


ANOVA a una vía

Suposiciones esenciales para el empleo de ANOVA:

a) Todas las poblaciones involucradas son normales.

b) Todas las poblaciones tienen la misma varianza.


(homocedasticidad).

c) Las muestras se seleccionan independientemente.


ANOVA a una vía

Prueba de hipótesis empleando ANOVA:

Ho: 𝜇1 = 𝜇2 =…=𝜇𝑛
Ha: 𝜇1 ≠ 𝜇2 ≠…≠ 𝜇𝑛

La distribución de probabilidad que se emplea en


ANOVA se conoce como distribución F.
Pasos para el cálculo de ANOVA

1) Determinar una estimación de la varianza de la


población a partir de la varianza entre las medias de
las muestras.

2) Determinar una segunda estimación de la varianza


de la población a partir de la varianza dentro de las
muestras.

3) Comparar estas dos estimaciones. Si su valor es


aproximadamente igual, se acepta la hipótesis nula.
Uso de la distribución F en ANOVA

Características de una distribución F:

a) Existe una familia de distribuciones F.


b) La distribución F es continua.
c) La distribución F no puede ser negativa.
d) Tiene sesgo positivo.
e) Es asintótica
Uso de la distribución F en ANOVA
Ji – cuadrado (χ2 ) como prueba de independencia

Ji cuadrado es una prueba no paramétrica que índica


si dos variables generalmente cualitativas (nominales
u ordinales) se relacionan entre sí.

Ho: Las variables son independientes entre sí. (las


variables no se relacionan entre sí).

Ha: Las variables son dependientes entre sí. (las


variables se relacionan entre sí)
Conceptos básicos empleados en Ji-Cuadrado

Tabla de contingencia: tabla que resume de manera


simultánea dos variables de interés de escala nominal.

Frecuencia observada: frecuencia que se encuentra en


la tabla original de contingencias.

Frecuencia esperada: frecuencia que esperaríamos ver


en una tabla de contingencias o distribución de
frecuencias si la hipótesis nula es verdadera.
Fórmulas utilizadas en Ji - Cuadrado

Valor observado de la prueba:

2
2
(𝑓𝑜 − 𝑓𝑒 )
χ =෍
𝑓𝑒

Frecuencia esperada:
(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑖𝑙𝑎𝑠)(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠)
𝑓𝑒 =
𝐺𝑟𝑎𝑛 𝑡𝑜𝑡𝑎𝑙
Distribución Ji - Cuadrado
Distribución Ji - Cuadrado

Valor crítico de ji – cuadrada depende de:

a) gl = (Número de filas – 1) (Número de columnas – 1)

b) Nivel de significancia: únicamente se


presenta en el extremo derecho del
gráfico.
Características de la distribución ji - cuadrada

a) Los valores de ji – cuadrado nunca son


negativos.

b) Existe una familia de distribuciones de ji –


cuadrada.

c) La distribución ji cuadrada tiene un sesgo


positivo.
Regresión lineal y Correlación

Regresión lineal: método que se emplea para estimar


una variable llamada dependiente a partir de una
variable conocida llamada independiente.

Análisis de correlación: conjunto de técnicas que


miden el grado de asociación entre dos variables.

Ecuación de regresión: ecuación que expresa la


relación lineal entre dos variables.
Supuestos del modelo de regresión lineal

a) Linealidad: la ecuación de regresión adopta una forma


en particular.

b) Independencia: los residuos son independientes entre


sí.

c) Homocedasticidad: para cada valor de la variable


independiente la varianza de los residuos es constante.

d) Normalidad: para cada valor de la variable


independiente los residuos se distribuyen normalmente
con media igual a cero.
Ecuación de Regresión Lineal

Ecuación lineal: y = a + bx

y : Variable dependiente
x: Variable independiente
a: Intercepto en el eje y
b: Pendiente de la recta

Si b>0: la regresión es lineal directa


Si b<0: la regresión es lineal inversa
Si b=0: la regresión es constante
Coeficiente de correlación (Pearson)

Describe la fuerza de relación entre dos conjuntos de


variables en escala de intervalo o de razón.

-1 ≤ r ≤ 1

a) Un valor cercano a 0 indica que hay poca relación


entre las variables.

a) Un valor cercano a -1 o bien a 1 indica una fuerte


relación entre las variables.
Coeficiente de determinación y error estándar de la
estimación

Proporciona la variación total en la variable


dependiente Y que se explica por la variable
independiente X.

0 ≤ 𝑟2 ≤ 1

El error estándar de la estimación (𝑠𝑦.𝑥) ) mide la


dispersión de los valores observados respecto a la recta
de regresión.
Gráfico de dispersión

Muestra la relación entre los valores reales y la línea de


regresión.
Muchas gracias.
Dios les bendiga.

S-ar putea să vă placă și