CAMPUS DE BARBULA, AGOSTO 2014 MEDIDAS DE DISPERSIN Y DE FORMA
LA AMPLITUD TOTAL Es una colocacin de los datos numricos tomados en orden creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los nmeros se llama rango o recorrido de datos. Es el lmite dentro del cual estn comprendidos todos los valores dela serie de datos, en otras palabras, es el nmero de diferentes valores que toma la variable en un estudio o investigacin dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con la letra R. Intervalo de clase Los intervalos de clase se emplean si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.
RANGO O RECORRIDO DE LA VARIABLE
En estadstica descriptiva se denomina rango estadstico (R) o recorrido estadstico al intervalo entre el valor mximo y el valor mnimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto. El rango es la separacin que existe entre los valores extremos de la variable (el valor mayor y el valor menor de la distribucin). Se denomina rango o recorrido de una funcin al conjunto de los valores reales que toma la variable y o f(x). Las relaciones y las funciones describen la interaccin entre variables que estn ligadas. Estas relaciones incluyen valores independientes y entradas, que son las variables que pueden ser manipuladas por las circunstancias. Tambin incluyen valores dependientes y salidas, que son las variables determinadas por los valores independientes. Existe otro par de componentes que debemos considerar cuando hablamos de relaciones, se llaman dominio y rango. El dominio de una funcin o relacin es el conjunto de todos los valores independientes posibles que una relacin puede tener. Es la coleccin de todas las entradas posibles. El rango de una funcin o relacin es el conjunto de todos los valores dependientes posibles que la relacin puede producir. Es la coleccin de todas las salidas posibles. Al poner a todas las entradas y las salidas en grupos separados, el dominio y el rango nos permiten encontrar y explorar patrones en cada tipo de variable.
AMPLITUD INTERCUARTIL En estadstica descriptiva, se le llama rango intercuartlico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribucin. Es una medida de la dispersin estadstica. A diferencia del rango, se trata de un estadstico robusto. El rango intercuartlico es una medida de variabilidad adecuada cuando la medida de posicin central empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil El rango intercuartil es la distancia entre el primer y tercer cuartiles. Es algunas veces llamado la dispersin H y es una medida estable de desembolso. Se obtiene al evaluar Q 3 Q 1 . El rango semi-intercuartil es un medio de la diferencia entre el primer y tercer cuartiles. Es la mitad de la distancia requerida para cubrir la mitad de las cuentas. El rango semi-intercuartil es afectado muy poco por cuentas extremas. Esto lo hace una buena medida de dispersin para distribuciones sesgadas. Se obtiene evaluando. El rango cuartil medio es el valor numrico a la mitad entre el primer y tercer cuartiles. Es la mitad de la suma del primer y tercer cuartiles. Se obtiene evaluando. (La mediana, el rango medio y cuartil medio no siempre son el mismo valor, aunque pueden serlo.)
DESVIACIN TIPICA O ESTANDAR La desviacin estndar (o desviacin tpica) es una medida de dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Es una medida (cuadrtica) de lo que se apartan los datos de su media, y por tanto, se mide en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones. Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza.
COEFICIENTE DE VARIACION El coeficiente de variacin permite comparar la dispersin entre dos poblaciones distintas e incluso, comparar la variacin producto de dos variables diferentes (que pueden provenir de una misma poblacin). Estas variables podran tener unidades diferentes, por ejemplo, podremos determinar si los datos tomados al medir el volumen de llenado de un envase de cierto lquido varan ms que los datos tomados al medir la temperatura del lquido contenido en el envase al salir al consumidor. El volumen los mediremos en centmetros cbicos y la temperatura en grados centgrados. El coeficiente de variacin elimina la dimensionalidad de las variables y tiene en cuenta la proporcin existente entre una medida de tendencia y la desviacin tpica o estndar. Es una medida que se emplea fundamentalmente para. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida. Por ejemplo, kilogramos y centmetros. Comparar la variabilidad entre dos grupos de datos obtenidos por dos o ms personas distintas. Comparar dos grupos de datos que tienen distinta media Determinar si cierta media es consistente con cierta varianza.
RELACION ENTRE LA MEDIA ARITMETICA Y LA DESVACION TIPICA
La media aritmtica y la desviacin tpica son los parmetros ms utilizados para resumir una coleccin de datos. La media es el valor que resulta de compensar unos datos con otros, para conseguir que todos los datos sean iguales. Tambin podramos decir que es el valor que resulta de repartir por igual el total entre todos. Por ello, desde un punto de vista grfico, la media aritmtica coincide con el "punto de equilibrio" del histograma o, en su caso, del diagrama de barras de la distribucin. Encontraramos la media en la proyeccin de su centro de gravedad sobre el eje horizontal. Por su parte la desviacin tpica nos proporciona informacin sobre cmo estn distribuidos los datos alrededor de la media: lo alejados (dispersos) o cercanos que estn de la misma. La forma de la grfica nos permitir, por tanto, hacernos una idea aproximada del valor de la desviacin tpica de la distribucin que se representa.
COEFICIENTE DE DIFICULTAD DE UNA PRUEBA Al hablar del coeficiente de dificultad de un puerto de montaa estamos intentando dar un valor objetivo y universalizable a algo que es puramente personal y subjetivo: qu es ms duro, esto es, qu implica una mayor dificultad de ascensin, una rampa continuada de un kilmetro. al diez por ciento o un alto de tres kilmetros. Al cinco por ciento de pendiente media? Probablemente muchos de los que nos estis leyendo ya habris optado por una de las dos respuestas, no es as? Pero si pudisemos saber todas las respuestas comprobaramos cmo no es tan fcil ponerse de acuerdo. De ah que si sois aficionados a estos temas de las altimetras habris observado la enorme diversidad de coeficientes que los artfices de las mismas nos presentan. Para algunos de ellos el Mortirolo italiano ser ms duro que la Gamonal, cuando para otros un puerto de exagerada longitud como pudiera ser la subida al Veleta (Sierra Nevada), con sus ms de 40 km., se convertir en el de mayor dureza del Estado. Las propias cifras que reflejan ese grado de dificultad difieren enormemente y para algunas el acercarse al 100 supone un nivel de dureza excesivo, cuando para otras esa cifra sirve para puertos de 2 categora.
DISTRIBUCIN NORMAL En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico de una funcin gaussiana. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica descriptiva slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos.
COEFICIENTE CURTOSIS En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las medidas de curtosis tratan de estudiar la proporcin de la varianza que se explica por la combinacin de datos extremos respecto a la media en contraposicin con datos poco alejados de la misma. Una mayor curtosis implica una mayor concentracin de datos muy cerca de la media de la distribucin coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma. Esto explica una forma de la distribucin de frecuencias con colas muy elevadas y un con un centro muy apuntado.
ESCALAS NORMALIZADAS Escalas normalizadas Las escalas pueden ser de tres tipos: - Escala de reduccin: se reducen proporcionalmente todas las medidas. - Escala de ampliacin: se amplan proporcionalmente todas las medidas. - Escala natural: las medidas del dibujo son las mismas que en la realidad. Aunque en teora sea posible utilizar cualquier valor de escala (siempre que sta sea un nmero entero), en la prctica se recomienda el uso de ciertos valores normalizados. Esta recomendacin tiene por objeto facilitar la lectura de dimensiones mediante el uso de reglas o escalmetros. Aun as, conviene saber que no todas las escalas contenidas en los escalmetros pueden considerarse normalizadas, aunque su uso est perfectamente indicado. MATRIZ DE CORRELACIONES La matriz de correlacin R es una matriz cuadrada n n constituida por los coeficientes de correlacin de cada pareja de variables; de manera que tendr unos en su diagonal principal, y en los elementos no diagonales (i,j) los correspondientes coeficientes de correlacin rij . La matriz de correlacin ser, obviamente, simtrica, y conservar las propiedades de ser definida-positiva y tener un determinante no negativo, (adems el determinante ser siempre menor o igual que 1). Puede considerarse como la matriz de varianzas entre las variables tipificadas. COEFICIENTE DE DETERMINACIN Una importante medida estadstica igual al cuadrado del coeficiente de correlacin. Se utiliza a menudo como medida de la eficacia de la cobertura en cuyo caso se mide el porcentaje de la variacin en el precio de una posicin al contado explicada por la variacin en el precio del instrumento de cobertura. Se puede obtener como R2 a partir de una regresin lineal sencilla.