Sunteți pe pagina 1din 11

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL

Tema: Anlisis estadstico de un conjunto de datos de temperatura y humedad. MEDIA


En matemticas y estadstica, la media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadsticos muestrales. Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin.

DESVIACIN DE LA MEDIA En estadstica la desviacin absoluta promedio o, sencillamente desviacin media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula

VARIANZA
En teora de probabilidad, la varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media.

DESVIACIN ESTNDAR
La desviacin estndar o desviacin tpica (denotada con el smbolo o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersin para variables de razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raz cuadrada de

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable.

MODA En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de datos. Hablaremos de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. MEDIANA
En el mbito de la estadstica, la mediana representa el valor de la variable de posicin central en un conjunto de datos ordenados. En un conjunto de valores ordenados, la mediana es el valor medio. Corresponde al percentil 50 o segundo cuartil (P50 o Q2). Los pasos para obtener la mediana son: 1. Se deben ordenar los valores en orden ascendente 2. Se debe encontrar el valor o valores medios.

COVARIANZA Es una medida del grado en que dos variables aleatorias se mueven en la misma direccin o en direcciones opuestas la una respecto a la otra. En otras palabras, si dos variables aleatorias generalmente se mueven en la misma direccin se dir que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas, se dir que tienen una covarianza negativa. La covarianza se mide como el valor que se espera de los productos de las desviaciones de dos variables aleatorias respecto a sus correspondientes medias. La covarianza se representa por sxy o xy. La covarianza indica el sentido de la correlacin entre las variables Si xy > 0 la correlacin es directa. Si xy < 0 la correlacin es inversa.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


La covarianza muestral puede calcularse mediante:

Una frmula alternativa para la covarianza:

Signo de la covarianza: Naturaleza de la relacin. Si es positivo entonces x y y se mueven en la misma direccin. Si es negativo entonces x y y se mueven en direcciones opuestas. Tamao de la covarianza: Fuerza de la relacin. Si es grande entonces la relacin es fuerte. Si es pequea entonces la relacin es dbil o inexistente.

COEFICIENTE DE CORRELACIN Indica la fuerza y la direccin de una relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra. El coeficiente de correlacin lineal se expresa mediante la letra r.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL

Propiedades 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin.

3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1(1 r 1) 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. CARTAS DE CONTROL Las cartas de control son la herramienta ms poderosa para analizar la variacin en la mayora de los procesos y son de dos tipos. Las causas comunes o aleatorias se deben a la variacin natural del proceso. Las causas especiales o atribuibles son por ejemplo: un mal ajuste de mquina, errores del operador, defectos en materias primas.

Se dice que un proceso est bajo Control Estadstico cuando presenta causas comunes nicamente. Cuando ocurre esto tenemos un proceso estable y predecible. Las cartas de control para variables es cualquier caracterstica medible tal como una longitud, peso, temperatura, etc. Elaboracin de Cartas de control (variables)

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


Paso 1: Colectar los datos, se toma una muestra (subgrupo) de 2 a 10 piezas consecutivas y se anotan los resultados de la medicin (se recomienda tomar 5). Se realizan las muestras de 20 a 25 subgrupos. Paso 2: Calcular el promedio X y R (rango) para cada subgrupo.

Paso 3: Calcular el rango promedio (R) y el promedio de proceso de cada grupo. Paso 4: Calcular los limites de control.

Paso 5: Seleccionar la escala para las graficas de control. Paso 6: Trazar la grafica de control. Paso 7: Analizar la grafica de control. Ejemplo:

DISTRIBUCIN DE PROBABILIDAD

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


Toda distribucin de probabilidad es generada por una variable aleatoria x, la que puede ser de dos tipos: DISCRETAS: discreta porque solo puede tomar valores enteros y un nmero finito de ellos. CONTINUAS: continua porque puede tomar tanto valores enteros como fraccionarios y un nmero infinito de ellos.

Distribucin normal Es una distribucin simtrica cuyos valores se mueven en todo el eje real. Depende de dos parmetros, la media y la desviacin estndar . Se simboliza por N ( , ).

Viene definida de la siguiente manera:

Es tambin conocida como distribucin Gausiana o distribucin de Laplace-Gauss. Cuando la distribucin normal tiene como parmetros =0 y =1 recibe el nombre de distribucin normal estndar.

VALORES DIVERGENTES Se lo utiliza para representar los valores que se encuentran separados del grupo de datos de medicin se los denomina ms comnmente valores atpicos.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


Un valor atpico es una observacin con un valor que no parece corresponderse con el resto de los valores en el grupo de datos. Para determinar si es un valor atpico existe varios mtodos como: El mtodo de Q-Dixon El mtodo de Pearson y Hartley El mtodo de Nalimov

Se debe tener en cuenta que las pruebas estadsticas se utilizan para identificar valores atpicos, no para retirarlos del grupo de datos. Mtodo de Q-Dixon La prueba de Dixon utiliza relaciones de los espacios entre datos de diferentes modos segn la cantidad de valores en el grupo de datos. Esta prueba se utiliza para un numero de muestras entre 3 a 30 para un nmero mayor se utiliza el mtodo de Pearson y Hartley. Para calcula Q se realiza de la siguiente manera:

Consultar una tabla de valores Q. Donde N es el nmero de observaciones, es el nivel de importancia: Si el valor calculado de Q es mayor que el umbral crtico el valor de datos correspondiente x 1 es considerado como un valor atpico

Mtodo Nalimov Es otro mtodo para identificar los valores atpicos de un grupo de muestras, este mtodo es utilizado mayormente en Alemania.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


Pasos: 1.-Obtener un valor particular x 1 . Se considera que es un valor atpico si la estadstica q supera el umbral crtico q crtico para un determinado nivel de significacin. 2.- Calcular: x = De todos los valores, incluido el valor x 1. s =Desviacin estndar de todos los valores.

3.- Calcular:

Donde: n = es el nmero de valores 4.- Obtener q mediante la frmula:

5.- Grado de libertad. El nmero de grados de libertad se define como f = n-2 (tabla segn Kaiser / Gottschalk ).

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL

ANLISIS DE RESULTADOS La media es el valor representativo del conjunto de datos, tomados de la temperatura y humedad. La desviacin media indica, si las distintas muestras estn alejadas del promedio, cuanto mayor sea el valor mayor ser la variabilidad para nuestro caso la desviacin media es de 5,82 esto indica que el conjunto de datos es ms homogneo que variable.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


La desviacin estndar obtenida en temperatura es 7,28 lo que indica que los valores de las muestras no se encuentran muy alejados del promedio. De acuerdo al coeficiente de correlacin obtenido (-0,812), la relacin entre la humedad y la temperatura de entrada es fuerte e inversa ya que esta valor se aproxima a -1, lo que indica que la direccin de las variables es opuesta. Lo que es comprobado tambin con el valor de la covarianza (-54,519). Mediante el anlisis de la carta de control de temperatura se puede determinar que los promedios superan el valor de los lmites calculados para la media. En la grafica de control de rango se puede observar un dato inusual que genera un pico nico que sobrepasa los lmites. El grafico de la distribucin normal o GAUSS, se ve afectada por la comparacin de los valores obtenidos de la media, moda, mediana. Es decir: Si la media=moda=mediana, se tiene una distribucin normal simtrica. Si la media>media, se tiene una distribucin normal asimtrica con cola a la derecha (sesgada a la derecha). Si media < mediana, la distribucin es asimtrica con cola a la izquierda (sesgada a la izquierda).

En nuestro caso el promedio de la humedad es mayor que su mediana, como resultado se tiene una distribucin normal asimtrica con cola a la derecha (sesgada a la derecha). Utilizando los mtodos de Q-Dixon y Nalimov se analizo el valor divergente propuesto en este caso 49, para esto se utilizo 20 muestra y a=0,05 obteniendo como resultado: 1.- Mtodo Q-Dixon: la hiptesis resulta ser un valor no atpico, es decir el valor se encuentra dentro del rango. 2.- Mtodo de Nalimov: la hiptesis resulta ser un valor atpico, es decir el valor no se encuentra dentro del rango. CONCLUSIONES El promedio se ve afectado por valores muy altos o muy bajos. La mediana no se ve alterada por los valores altos o bajos que se encuentren dentro de las muestras analizadas. La media, mediana y moda, representan tres mtodos diferentes para encontrar el valor del centro. La desviacin estndar es un valor positivo, ser mayor mientras los valores se encuentren alejados al promedio.

UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE-EL


Observando la grafica de control obtenida de la temperatura, se concluye que la misma no est bajo control, debido a que los puntos salen de los lmites de control. Los criterios de aceptacin dependen de la frecuencia del dato tomado como hiptesis, el cual ser descartado o aceptado dependiendo de su probabilidad.

RECOMENDACIONES Se recomienda que cuando la distribucin normal es sesgada no se utilice la media como punto central, sino utilizar la mediana.

BIBLIOGRAFA http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica http://www.ucv.cl/web/estadistica/desvmedia.htm http://www.slideshare.net/EnriqueMorosini/el-concepto-de-varianza http://es.wikipedia.org/wiki/Moda_(estad%C3%ADstica) http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/Ciencias_Politic as/2012/clase_magistral_6_2012.pdf http://www.monografias.com/trabajos93/analisis-correlacion-empleando-excel-ygraph/analisis-correlacion-empleando-excel-y-graph.shtml http://www.ditutor.com/estadistica_2/correlacion_estadistica.html http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase2.pdf

S-ar putea să vă placă și