Sunteți pe pagina 1din 10

Medidas Estadísticas

Medidas de tendencia central: Media, Mediana, Moda


Ahora nos ocuparemos exclusivamente de las variables
cuantitativas, puesto que con los atributos no se pueden
realizar operaciones aritméticas. Como hemos estudiado,
las variables estadísticas cuantitativas se dividen o
clasifican en discretas o continuas, por lo que
necesitaremos precisar cómo se calculan dichas medidas
en cada caso.
Las medidas estadísticas pretenden "resumir" la
información de la "muestra" para poder tener así un mejor
conocimiento de la población.
Las medidas de tendencia central corresponden a
valores que generalmente se ubican en la parte central
de un conjunto de datos. (Ellas permiten analizar los
datos en torno a un valor central). Entre éstas están la
media aritmética, la moda y la mediana.

_
a) Media
aritmética
(X
)
Es aquella medida que se obtiene al dividir la suma de
todos los valores de una variable por la frecuencia
total. En palabras más simples, corresponde a la suma
de un conjunto de datos dividida por el número total de
dichos datos.

X = suma de = x1 + x2 +
todos los x3 + x4
valores + ......
número
total de n
datos
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas:
4, 7, 7, 2, 5, 3
n = 6 (número total de datos )

4+7
+7+
28
X = 2+5 = = 4,8
+3
6 6
La media aritmética de las notas de esa asignatura es
4,8. Este número representa el promedio.
Ejemplo 2:
Cuando se tienen muchos datos es más conveniente
agruparlos en una tabla de frecuencias y luego calcular la
media aritmética. El siguiente cuadro lo ilustra.

Largo Frecuencia Largo por


(en absoluta Frecuencia
m) absoluta

3 10 5 . 10 =
50

6 15 6 . 15 =
90

7 20 7 . 20 =
140

8 12 8 . 12 =
96

9 6 9 . 6 = 54

Frecuencia total = 430


63

430
X = = 6,825
63
Se debe recordar que la frecuencia absoluta indica
cuántas veces se repite cada valor, por lo tanto, la tabla
es una manera más corta de anotar los datos (si la
frecuencia absoluta es 10, significa que el valor a que
corresponde se repite 10 veces).
b) Moda (Mo)
Es la medida que indica cual dato tiene la mayor
frecuencia en un conjunto de datos, o sea, cual se repite
más.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que
corresponden a las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es
3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se
repita, por lo tanto, este conjunto de valores no tiene
moda.
c) Mediana (Med)
Es el valor central de un conjunto de valores ordenados
en forma creciente o decreciente. Dicho en otras
palabras, la Mediana corresponde al valor que deja igual
número de valores antes y después de él en un conjunto
de datos agrupados.
Según el número de valores que se tengan se pueden
presentar dos casos:
- Si el número de valores es impar, la Mediana
corresponderá al valor central de dicho conjunto de
datos.
- Si el número de valores es par, la Mediana
corresponderá al promedio de los dos valores centrales
(los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a
mayor, se tiene:
1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en
este conjunto de datos impares.
Ejemplo 2:
El siguiente conjunto de datos está ordenado en forma
decreciente, de mayor a menor, y corresponde a un
conjunto de valores pares, por lo tanto, la Med será el
promedio de los valores centrales.
21, 19, 18, 15, 13, 11 ,10, 9, 5, 3

13 +
24
Med = 11 = = 12
2 2
Ejemplo 3:

En el gráfico de barras (que tiene un número par de


columnas) los valores centrales son 72 y 77, por lo tanto,
la

Med 72
149 = 74,5
= + 77 = Med =
2
Medidas de Dispersión
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la
variable a un cierto valor central, o que permiten identificar la concentración de los datos en un
cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.

A) El desvío estándar
Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de
valores absolutos, poseen la misma media. Una medida diferencial para identificar esos
conjuntos de datos es la concentración o dispersión alrededor de la media.

A 1) Desvío estándar para datos sin agrupar


Una manera que aparece como muy natural para construir una medida de dispersión sería
promediar las desviaciones de la media, pero como vimos
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de
manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas
cantidades recibe el nombre de desvío estándar, o desviación típica y es representada por la
siguiente fórmula:

La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan
medido con escalas de intervalos o razones.

A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a
su media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se
entiende entonces que cuando este valor es más pequeño, las diferencias de los valores
respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de
observaciones es más “homogeneo” que si el valor de la desviación estándar fuera más
grande. O sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor
homogeneidad.

A 2) Desvío estándar para datos agrupados


A 2.1) Cálculo usando las frecuencias absolutas

A 2.2) Cálculo usando las frecuencias relativas

B) Varianza

El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por .


La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la
media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos
respecto de cualquier otro valor que no sea la media aritmética.

Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado.

Precisamente la manera de simbolizarla es .

Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
C) El coeficiente de variación:
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos,
etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de
una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este
coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a
escalas de razón.

Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el
llamado coeficiente de variación

(las barras del denominador representan el valor absoluto, es decir, indican que debe
prescindirse de la unidad de medida de la media). A menor coeficiente de variación
consideraremos que la distribución de la variable medida es más homogénea.

D) El coeficiente de asimetría
Otro rasgo interesante en una distribución de frecuencias es si los datos aparecen ubicados
simétricamente o no respecto de la media. Si queremos cuantificar la simetría, es necesario
conservar la información acerca tanto del signo como de la distancia de cada dato a la media –
centro de simetría-. Este razonamiento lleva a utilizar una potencia impar de las desviaciones.

En el caso en que el coeficiente valga cero la distribución es simétrica alrededor de la media.


Los valores positivos, indicarán distribuciones con mayor sesgo a la derecha y los valores
negativos indicarán un mayor sesgo a la izquierda.

D 1) Coeficiente de Asimetría para datos sin agrupar


El coeficiente de asimetría se define como

D 2) Coeficiente de Asimetría para datos agrupados


D 2.1) Cálculo usando las frecuencias absolutas

D 2.2) Cálculo usando las frecuencias relativas


E) Coeficiente de apuntamiento
Otra característica relevante en una distribución es su apuntamiento o kurtosis, que describe lo
picuda o plana que es la distribución, es decir si los datos se concentran demasiado o no,
comparados con un modelo de distribución llamado distribución normal.

 La distribución se denominará leptocúrtica cuando el CAp > 0 (más apuntada que la


normal)
 La distribución se denominará mesocúrtica cuando el Cap = 0 (normal)
 La distribución se denominará platicúrtica cuando Cap < 0 (menos apuntada que la
normal)

E 1) Coeficiente de Apuntamiento para datos sin agrupar

E 2) Coeficiente de Apuntamiento para datos agrupados


E 2.1) Cálculo usando frecuencias absolutas

E 2.2) Cálculo usando frecuencias relativas

F) Rango intercuartílico:
El rango intercuartílico RI es, sencillamente, la diferencia entre el tercer y el primer cuartil, es
decir
Esto nos dice en cuántas unidades de los valores que toma la variable se concentra el
cincuenta por ciento central de los casos

S-ar putea să vă placă și