CURSO DE GEOESTADISTICA I TEMA 5: MEDIDAS DE TENDENCIA CENTRAL RELACIONADAS A POTENCIAS Y LEYES Por: Ing. MSc. Roger Gonzales Aliaga
Puno, Marzo del 2012
MEDIDAS DE TENDENCIA CENTRAL RELACIONADAS
A POTENCIAS Y LEYES 1. Medidas de tendencia o posicin central Media aritmtica o promedio Mediana Moda Otras medidas de posicin central 2. Medidas de posicin no centrales Cuartil Decil Percentil
MEDIDAS DE TENDENCIA CENTRAL RELACIONADAS A
POTENCIAS Y LEYES Los aspectos relevantes de una muestra son generalmente descritos usando medidas de posicin y de dispersin. Estas medidas, sirven para aproximar los parmetros de posicin y de dispersin de una variable. Las medidas de posicin son funciones de los datos de una muestra que miden, segn diferentes criterios, el centro de la distribucin de frecuencias en la muestra; tambin son llamadas medidas de tendencia central. Las ms usadas para este fin son: la media muestral ( x ), los cuantiles (xp), la mediana muestral (me) y el modo muestral o moda (mo). Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas caractersticas de una serie de datos. Las medidas de posicin son de dos tipos: a) Medidas de posicin o tendencia central: son valores numricos en torno a los cuales se agrupan, en menor a mayor medida los valores de una variable estadstica. Estos valores numricos usados son la media aritmtica, la mediana y la moda. b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de la serie. Estos son los percentiles, deciles y cuartiles.
1. MEDIDAS DE TENDENCIA O POSICION CENTRAL
Media aritmtica o promedio (X) Es el valor promedio de un conjunto de datos numricos (variable cuantitativa). Se obtiene dividiendo la suma de todos los datos entre el numero total de datos. Una debilidad de la media aritmtica es que es sensible a valores extremos de la distribucin. -Para datos no tabulados o no agrupados, se define como el cociente que se obtiene al dividir la suma de los valores de la variable por el n de observaciones. Su frmula es la siguiente:
1. MEDIDAS DE TENDENCIA O POSICION CENTRAL
-Para datos tabulados o agrupados, se define como el valor promedio de un conjunto de datos numricos. Es igual al cociente de la suma de los productos de cada frecuencia absoluta con su respectiva marca de clase, entre el total de datos.
1. MEDIDAS DE TENDENCIA O POSICION CENTRAL
Mediana (Me) para datos agrupados es el valor numrico que ocupa la posicin central de la muestra, y por tanto deja la 50 % de ella sobre dicho valor y al otro 50% por debajo de el. Para hallar el intervalo donde se ubica la mediana se aplica la formula: n/2, donde n=numero de datos.
1. MEDIDAS DE TENDENCIA O POSICION CENTRAL
Moda (Mo) para datos agrupados, es el valor de la variable que mas veces se repite; es decir, el que tiene mayor frecuencia absoluta. Dependiendo de los datos, es posible que la moda no exista, y tambin que pueda hacer mas de una.
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Son medidas que permiten determinar la proporcin de la poblacin de una variable estadstica cuyos valores estadsticos son menores o iguales que un valor tomado como referencia. Son tiles para describir el comportamiento de una poblacin y surgen como una extensin del concepto de la mediana. Recordemos que la mediana divide a un conjunto de datos ordenados, en dos partes de igual tamao; al ampliar este concepto nos interesa encontrar otros estadgrafos que dividan al conjunto de datos ordenados en mas partes de igual tamao. Las medidas de tendencia no centra, son: - Decil - Cuartil - Percentil
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Decil, son estadgrafos que dividen a un conjunto de datos ordenados, en diez partes iguales en tamao, cada parte contiene el 10% de los datos, como mximo; los deciles son nueve y en el quinto decil se ubica la mediana. Si dividimos y ordenamos los datos de menor a mayor tendramos el grafico siguiente:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Adems se observa que:
La formula con la que se calcula el decil es:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Cuartil, este estadgrafo divide una conjunto de datos, ordenados en cuatro partes iguales de tamao, cada parte contiene el 25% de los datos, como mximo. Los cuartiles son tres y el segundo cuartil coincide con la mediana. En un conjunto de datos ordenados en un segmento seria de la siguiente manera:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
El calculo del cuartil se hace con la siguiente formula:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Percentiles, son valores que dividen al conjunto de datos ordenados en cien partes iguales (en %) y de igual tamao. Cada parte contiene el 1% del total de datos, como mximo. Los percentiles son noventa y nueve y el cincuentavo percentil coincide con la mediana. El percentil se denota por Pj, donde j=1; 2;3;99 para el calculo de los percentiles los datos deben estar ordenados.
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Imaginemos que los datos estn ordenados de menor a mayor en una segmento como el que sigue:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
Del grfico anterior se deduce:
2. MEDIDAS DE LOCALIZACION O TENDENCIA NO CENTRAL
EJEMPLO 4:
4. GRAFICO DE CAJA BIGOTES O BOX PLOT
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra. Para su realizacin se representan tres cuartiles (Q1, Q2 y Q3) y los valores mnimo y mximo de los datos, sobre un rectngulo, alineado horizontal o verticalmente. Construccin de un diagrama de bigotes Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y, por lo tanto su relacin con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
4. GRAFICO DE CAJA BIGOTES O BOX PLOT
Ejemplo Utilizaremos la distribucin de leyes (%) de 20 muestras obtenidas en un socavn por muestreo sistemtico de canales, esto en una veta de Cu-Au ubicada en el Departamento de Arequipa, la estructura contiene minerales como calcosina, covelina y Au. 36, 25, 37, 24, 39, 20, 36, 45, 31, 31, 39, 24, 29, 23, 41, 40, 33, 24, 34, 40 Para calcular los parmetros estadsticos, lo primero es ordenar la distribucin de leyes 20, 23, 24, 24, 24, 25, 29, 31, 31, 33, 34, 36, 36, 37, 39, 39, 40, 40, 41, 45 Luego se calcula los cuartiles Q1, el cuartil primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5 Q2, el segundo cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,5
4. GRAFICO DE CAJA BIGOTES O BOX PLOT
Q3 , el tercer cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39 Dibujar la caja de bigotes
El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)
La primera parte de la caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).
4. GRAFICO DE CAJA BIGOTES O BOX PLOT
Que informacin se obtiene del diagrama Podemos obtener abundante informacin de una distribucin a partir de esta representacin. Veamos algunas: La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las leyes comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; indica que por ello el 25% de las leyes mas bajas estn ms concentrados que el 25% de las leyes altas o valores altos. El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 % de Cu. La mediana de las leyes es la siguiente: me= Q2 = (33 + 34)/ 2 =33,5