Sunteți pe pagina 1din 16

Análisis de datos

Actividad.4
Proyecto integrador etapa 2

PROF: Luis García saldivar


CELSO NORIEGA yanas

24-JUNIO-2018
SALTILLO COAHUILA
ANALS DE VARIANZA

El análisis de varianza es una herramienta estadística que permite probar la igualdad de tres
o más medias poblacionales con los datos obtenidos con muestras de cada una de estas
poblaciones.

Con el análisis de varianza podemos hacer inferencias acerca de si nuestras muestras se


tomaron de poblaciones que tienen la misma media. Algunos ejemplos donde podemos
aplicar este análisis son:
 Para una empresa que produce varios tipos de Gasolinas.
 Compara loa ingresos recibidos en el primer año por lo egresados de cuatro
universidades de alguna cuidada.
 En una empresa donde se fabrica varios tipos de asiento para saber cuál es el de mayor
demanda.

Es un número real relacionado con la varianza, que mide la variación


debida al "factor", "tratamiento" o tipo de situación estudiado.

Es un número real relacionado con la varianza, que mide la variación


dentro de cada "factor", "tratamiento" o tipo de situación.

El principal objetivo del análisis de varianza es identificar el factor o los factores que
producen la variabilidad en un conjunto de datos. Si un solo factor (variable independiente)
es el que produce esta variabilidad, entonces el análisis de varianza recibe el nombre de
análisis de varianza de un solo factor.
Cada factor está asociado con un conjunto particular de datos (muestra) o tratamientos
(variable dependiente).
El análisis de varianza está fundamentado en una comparación de dos estimaciones diferentes
de la varianza (σ)2 de una población total.
• La primera consiste en determinar un cálculo de la varianza entre las medias muéstrales
(medias de los tratamientos).
• La segunda, realizar un cálculo de la varianza dentro de las muestras; es decir, calcular la
varianza dentro de cada tratamiento.

PRUEA DE TURKEY
Sirve para probar todas las diferencias entre medias de tratamientos de una experiencia. La
única exigencia es que el número de repeticiones sea constante en todos los tratamientos.
Este método no sirve para comparar las medias de los tratamientos, dos a dos e pocas palabra
para evaluar la hipótesis.

ANÁLISIS DE VARIANZA PARA DOS FACTORES

En el análisis de varianza para un factor se considera que sólo un factor influye en las
unidades experimentales; sin embargo, con frecuencia se observa que un segundo factor
exterior puede influenciar el comportamiento de estas unidades experimentales.
Un análisis estadístico que considera simultáneamente ambos factores recibe el nombre de
análisis de varianza con dos factores (Two-Way Anova).
En el análisis de varianza con dos factores, la suma de cuadrados total se divide en tres partes:
• La suma de cuadrados entre muestras (tratamientos) (scm).
• La suma de cuadrados dentro de las muestras (scdm).
• Suma de cuadrados de bloques (scb).
Por tanto la suma de cuadrados total (sct) será:

sct = scm + scdm + scb

PRUEBA DE HIPÓTESIS PARA ANOVA CON DOS FACTORES MEDIANTE EL


ESTADÍSTICO F

Una vez que contamos con las tres estimaciones de la varianza de la población, el siguiente
paso es compararlas mediante el cálculo de los cocientes siguientes:
A continuación se nuestra un ejemplo de variación extraido de
http://wpd.ugr.es/~bioestad/guia-spss/practica-7/
EJEMPOLO:
La contaminación es uno de los problemas ambientales más importantes que afectan a nuestro
mundo. En las grandes ciudades, la contaminación del aire se debe a los escapes de gases de
los motores de explosión, a los aparatos domésticos de la calefacción, a las industrias,… El
aire contaminado nos afecta en nuestro vivir diario, manifestándose de diferentes formas en
nuestro organismo. Con objeto de comprobar la contaminación del aire en una determinada
ciudad, se ha realizado un estudio en el que se han analizado las concentraciones de
monóxido de carbono (CO) durante cinco días de la semana (lunes, martes, miércoles, jueves
y viernes).

En primer lugar describimos los cinco grupos que tenemos que comparar, los cinco días de
la semana, la variable respuesta es la concentración de CO en estos días de la semana. Cada
día de la semana tiene ocho unidades, en total tenemos 40 observaciones.
Para la descripción de los cinco grupos comenzamos realizando un análisis descriptivo.
Para ello, se selecciona, en el menú principal, Analizar/Comparar medias/medias.

Se introduce en el campo Lista de dependientes: La variable respuesta Concentración_CO y


en el campo Factor: el factor Día semana. Pulsando Aceptar se obtiene la Tabla ANOVA

Se introduce en el campo Lista de dependientes: La variable respuesta Concentración_CO y


en el campo Lista de independientes: el factor Día semana. Se pulsa Opciones y se selecciona
Número de casos, Media, Desviación típica, Mínimo, Máximo y Desviación Error de la
media.
Pulsar Continuar y Aceptar y se obtiene la siguiente salida

donde se presentan los cinco grupos dispuestos en forma comparativa. A simple vista se
puede observar que el valor medio de estos grupos es numéricamente distinto, de hecho la
media del día lunes tiene un valor medio casi equivalente al doble de la media del viernes.
Por tanto, nuestra hipótesis se centra en comprobar si la concentración de CO es
significativamente distinta en los cinco grupos. Para responder a esta hipótesis recurrimos al
Análisis de la Varianza de un factor y realizamos el contraste de igualdad de medias.

Mediante SPSS dicho contraste se puede ejecutar de dos formas:

Se selecciona, en el menú principal, Analizar/Comparar medias/ANOVA de un factor…


Se introduce en el campo Lista de dependientes: La variable respuesta Concentración_CO y
en el campo Factor: el factor Día semana. Pulsando Aceptar se obtiene la Tabla ANOVA

http://wpd.ugr.es/~bioestad/guia-spss/practica-7/

EJEMPLO DE DOS FACTORES


(http://www.dm.uba.ar/materias/optativas/metodos_no_parametricos/2004/2/NoparI10L.pdf

Ejemplo: 12 amas de casa son seleccionadas para participar en un experimento de siembra.


A cada una de ellas se le pide que seleccione cuatro parcelas idénticas en su jardín y plante
4 tipos distintos de césped, uno en cada parcela. Después de cierto periodo, se les pide que
ordenen los 4 tipos de césped por orden de preferencia, asignando el número 1 al césped
menos preferido, 2 al siguiente, etc. La hipótesis nula implica que no hay diferencias entre
las preferencias de los tipos de césped. Los resultados obtenidos son los siguientes:
Como hay empates, calculamos el valor del estadístico modificado
A1 =356.5 C1 = 356.5 T1 =8.097

Y obtenemos p-valor Por lo tanto, a nivel 0.05, se rechaza la


hipótesis nula.
Calculemos el estadístico T2.

Como la región crítica de nivel 0.05 de la distribución F con 3 y 33 grados de libertad


corresponde a valores del estadístico mayores que 2.90, se rechaza la hipótesis nula. El
correspondiente p-valor es:

Procesamiento con S-PLUS: Los datos se ingresaron en un data set denominado


“cesped” que contiene 3 variables: tipo (grupos o categorías), ama (bloque) y pref.
S-PLUS no utiliza el estadístico T2 sino T1:
Friedman rank sum test data: pref and tipo and ama from data set cesped
Friedman chi-square = 8.0973, df = 3, p-value = 0.044
alternative hypothesis: two.sided
http://www.dm.uba.ar/materias/optativas/metodos_no_parametricos/2004/2/NoparI10L.pdf
APLICACIONES
SigmaStat
SigmaStat proporciona una amplia gama de análisis estadísticos poderosos y fáciles de usar
diseñados específicamente para satisfacer las necesidades de los científicos e ingenieros de
investigación.

Con las características del programa, se le guía por el proceso de elegir la prueba adecuada
para analizar sus datos, ejecutar la prueba e interpretar los resultados en el informe de la
prueba.
http://software.scientec.com.mx/sigmastat-el-software-de-analisis-estadistico-ha-regresado/

MacAnova
Por Benjamín Segura

MacAnova es una excelente herramienta de análisis y cálculo estadístico (análisis de varianza


y modelos relacionados, álgebra de matrices, análisis de series temporales, etc...) que integra
además una tabla de datos y un conjunto de algoritmos con parámetros para seleccionar.

Características y funciones principales de MacAnova

La aplicación apuesta por integrar la matriz de datos de forma directa en el programa y en


realizar los distintos cálculos estadísticas a través de cuadros de diálogo, asemejándose al
conocido paquete SPSS.
Presenta un amplio catálogo de pruebas con amplias funciones en edición de celdas.
Presenta varias limitaciones, como por ejemplo, aquellas relacionadas con el diseño de los
cuadros de diálogo y de la matriz de datos, los cuales, no resultan ergonómicos, y además, la
aplicación presenta en ocasiones problemas en reconocer el formato en el que están expuestas
las cifras.
Presenta una interfaz gráfica bastante limitada y poco agradable, y además de tener pocos
gráficos no permite tampoco exportarlos.
https://www.portalprogramas.com/macanova/

MINITAB
Minitab es un programa de estadísticas que te permite ingresar datos rápidamente y ejecutar
una variedad de análisis en ellos. Puedes preparar gráficas y calcular la regresión con rapidez,
además el ingreso de datos funciona de manera muy similar a Excel. Minitab puede requerir
mucho trabajo en lo que respecta a cálculos estadísticos.
Herramienta de apoyo

Se mide la contaminación de un rio analizando la cantidad de oxigeno que contiene en


disolución el agua. Se toman muestras en cuatro lugares diferentes del rio (10, 25, 50, y 100
Km del nacimiento), obteniéndose los siguientes datos.

100 Km 50 Km 25 Km 10 Km
4.8 6 5.9 6.3
5.2 6.2 6.1 6.6
5 6.1 6.3 6.4
4.7 5.8 6.1 6.4
5.1 5.9 6 6.5
.
En seguida no vamos a daos en EXEL
Seleccionar análisis de varianza de un
factor.

Seleccionar las columnas


Nos da el resultado de la varianza de un factor
Biografía
Rodríguez, J. y Pierdant, A. (2014). Estadística aplicada II: estadística en administración
para la toma de decisiones.
https://www.youtube.com/watch?v=IwGhPhVtmZc
http://wpd.ugr.es/~bioestad/guia-spss/practica-7/
http://software.scientec.com.mx/sigmastat-el-software-de-analisis-estadistico-ha-regresado/
https://es.wikihow.com/usar-Minitab
“moore” 2002/1/21 ANÁLISIS DE LA VARIANZA DE UN FACTOR: COMPARACIÓN DE VARIAS MEDIAS

S-ar putea să vă placă și