Sunteți pe pagina 1din 9

¿Qué es la mediana?

La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor.

La mediana se representa por M_e

La mediana se puede hallar solo para variables cuantitativas.

Ejemplo de cálculo simple de la mediana

1Ordenamos los datos de menor a mayor.

2Si la serie tiene un número impar de medidas la mediana es la puntuación central


de la misma

2,3,4,4,5,5,5,6,6 M_e=5

3Si la serie tiene un número par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.

7,8,9,10,11,12 \displaystyle M_e=\frac{9+10}{2}=\frac{19}{2}=9.5

Fórmula y cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta


la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre.

\displaystyle M_e=L_{i}+\cfrac{\cfrac{N}{2}-F_{i-1}}{f_{i}}\cdot a_{i}

L_{i} es el límite inferior de la clase donde se encuentra la mediana

\cfrac{N}{2} es la semisuma de las frecuencias absolutas

f_{i} es la frecuencia absoluta de la clase mediana

F_{i-1} es la frecuencia acumulada anterior a la clase mediana

a_{i} es la amplitud de la clase


La mediana es independiente de las amplitudes de los intervalos

Ejemplo de cálculo de la mediana para distribución estadística

Calcular la mediana de una distribución estadística que viene dada por la siguiente
tabla:

f_{i}
[60,63) 5
[63,66) 18
[66,69) 42
[69,72) 27
[72,75) 8

En primer lugar crearemos una nueva columna con los valores de la frecuencia
acumulada:

En la primera casilla colocamos la primera frecuencia absoluta. En la segunda


casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia
absoluta correspondiente y así sucesivamente hasta la última, que tiene que se
igual a N(100)

f_{i} F_{i}
[60,63) 5 5
[63,66) 18 23
[66,69) 42 65
[69,72) 27 92
[72,75) 8 100
100

Buscamos el intervalo donde se encuentra la mediana, para ello dividimos la N por 2


porque la mediana es el valor central

\cfrac{100}{2}=50

Buscamos en la columna de las frecuencias acumuladas (f_{i}) el intervalo que


contiene a 50

Clase de la mediana: [66,69)

Aplicaremos la fórmula para el cálculo de la mediana para datos agrupados,


extrayendo los siguientes datos:
L_{i}=66

\cfrac{100}{2}=50

f_{i}=42

L_{i-1}=23

a_{i}=3

M_e=1,85+\cfrac{\cfrac{23}{2}-8}{8}\cdot 0,05=1,872

LA MEDIANA
---
Consideramos una variable discreta X cuyas observaciones en una tabla estadística
han sido ordenadas de menor a mayor. Llamaremos mediana, Medal primer valor de la
variable que deja por debajo de sí al de las observaciones. Por tanto, si n es el
número de observaciones, la mediana corresponderá a la observación [n/2]+1.
---
En el caso de variables continuas, las clases vienen dadas por intervalos, y aquí
la fórmula de la mediana se complica un poco más (pero no demasiado): Sea (li-1,li]
el intervalo donde hemos encontrado que por debajo están el de las observaciones.
Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas,
mediante la expresión

---
Observación

Entre las propiedades de la mediana, vamos a destacar las siguientes:

* Como medida descriptiva, tiene la ventaja de no estar afectada por las


observaciones extremas, ya que no depende de los valores que toma la variable, sino
del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas.

* Es de cálculo rápido y de interpretación sencilla.

* A diferencia de la media, la mediana de una variable discreta es siempre un


valor de la variable que estudiamos (ej. La mediana de una variable número de hijos
toma siempre valores enteros).

* El mayor defecto de la mediana es que tiene unas propiedades matemáticas


complicadas, lo que hace que sea muy difícil de utilizar en inferencia estadística.

* Es función de los intervalos escogidos.

* Puede ser calculada aunque el intervalo inferior o el superior no tenga límites.

---
Ejemplo

Sea X una variable discreta que ha presentado sobre una muestra las modalidades

\begin{displaymath}X \leadsto 2,5,7,9,12 \Longrightarrow \overline{x}=7, \qquad


{M_{ed}}= 7
\end{displaymath}

Si cambiamos la última observación por otra anormalmente grande, esto no afecta a


la mediana, pero si a la media:

\begin{displaymath}X \leadsto 2,5,7,9,125 \Longrightarrow \overline{x}= 29,6;


\qquad {M_{ed}}= 7
\end{displaymath}
En este caso la media no es un posible valor de la variable (discreta), y se ha
visto muy afectada por la observación extrema. Este no ha sido el caso para la
mediana.
Medidas de centralización: media, moda y mediana
Media aritmética, media o promedio
Es el valor que correspondería a cada uno de los datos de la distribución si su
suma total se repartiera por igual. Una desventaja de la media es que se ve
influenciada por los valores extremos. Es un valor comprendido entre los extremos
de la distribución. La media no tiene por qué ser igual a uno de los valores de los
datos.

Moda Mo
La moda es el valor que aparece con mayor frecuencia dentro de una muestra. Para
que la moda pueda ser usada es necesario tener una cantidad suficiente de datos.
Una muestra puede tener más de una moda o no tener ninguna. En general es una
medida de tendencia central poco eficaz ya que si las frecuencias se concentran
fuertemente en algunos valores al tomar uno de ellos como representante, los
restantes pueden no quedar bien representados, pues no se tienen en cuenta todos
los datos en el cálculo de la moda. Sin embargo, es la única característica de
valor central que podemos tomar para las variables cualitativas.

Mediana
Es el valor central de una serie de datos, para poder encontrar la mediana es
indispensable que los datos estén ordenados. La mediana no se ve afectada por los
valores extremos.

Fórmulas
Desviación típica

Medidas de dispersión: varianza, desviación típica y rango


Varianza y desviación típica
Lo que hace la varianza es establecer la dispersión de la variable aleatoria.

La desviación típica, también llamada desviación estándar , es una medida de


dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores
concretos del promedio en una distribución de datos. La desviación estándar de un
conjunto de datos es una medida de cuánto se desvían los datos de su media. Esta
medida es mas estable que el recorrido y toma en consideración el valor de cada
dato.
Fórmulas

Desviación típica

En estadística, la desviación típica (también conocida como desviación estándar y


representada de forma abreviada por la letra griega minúscula sigma σ o la letra
latina s, así como por las siglas SD -de standard deviation- en algunos textos
traducidos del inglés) es una medida que se usa para cuantificar la variación o
dispersión de un conjunto de datos numéricos.1

Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre
un rango de valores más amplio.
Consideraciones generales
Fórmulas fundamentales

Variable aleatoria discreta:2

{\displaystyle \mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}}{\displaystyle \mu ={\frac


{1}{N}}\sum _{i=1}^{N}x_{i}} (Media aritmética)
{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}}
{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}}
(Población completa)
{\displaystyle s={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}}
{\displaystyle s={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}}
(Muestra de una población)
Expresiones equivalentes:

{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\left((\sum _{i=1}^{N}x_{i}^{2})-N\mu


^{2}\right)}}}{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\left((\sum
_{i=1}^{N}x_{i}^{2})-N\mu ^{2}\right)}}} (Población completa)
{\displaystyle s={\sqrt {{\frac {1}{N-1}}\left((\sum _{i=1}^{N}x_{i}^{2})-N\mu
^{2}\right)}}}{\displaystyle s={\sqrt {{\frac {1}{N-1}}\left((\sum
_{i=1}^{N}x_{i}^{2})-N\mu ^{2}\right)}}} (Muestra de una población)
Variable aleatoria continua:

{\displaystyle \sigma ={\sqrt {\int _{\mathbf {X} }(x-\mu )^{2}\,p(x)\,{\rm


{d}}x}},{\rm {\ \ donde\ \ }}\mu =\int _{\mathbf {X} }x\,p(x)\,{\rm {d}}x,}
{\displaystyle \sigma ={\sqrt {\int _{\mathbf {X} }(x-\mu )^{2}\,p(x)\,{\rm
{d}}x}},{\rm {\ \ donde\ \ }}\mu =\int _{\mathbf {X} }x\,p(x)\,{\rm {d}}x,}
La desviación estándar de una variable aleatoria, población estadística, conjunto
de datos o distribución de probabilidad es la raíz cuadrada de su varianza. Es
algebráicamente más simple, aunque en la práctica menos robusta, que la desviación
media.34Una propiedad útil de la desviación estándar es que, a diferencia de la
varianza, se expresa en las mismas unidades que los datos a partir de los que se
calcula.

Además de expresar la variabilidad de una población, la desviación estándar se usa


comúnmente para medir la fiabilidad de las conclusiones estadísticas. Por ejemplo,
el margen de error en los datos de los sondeos de opinión se determina calculando
la desviación estándar esperada en los resultados si la misma encuesta se llevara a
cabo varias veces. Esta interpretación de la desviación estándar a menudo se
denomina "error estándar" de la estimación o "error estándar de la media" (cuando
se refiere a una media). Se calcula como la desviación estándar de todas las medias
que se calcularían a partir de esa población si se extrajera un número infinito de
muestras y se calculase la media para cada muestra.

Es muy importante tener en cuenta que la desviación estándar de una población y el


error estándar de una estadística obtenida a partir de esa población (como la
media) son bastante diferentes, pero están relacionados (relacionados por la
inversa de la raíz cuadrada del número de observaciones). El margen de error de una
encuesta se calcula a partir del error estándar de la media (o, alternativamente,
del producto de la desviación estándar de la población y la inversa de la raíz
cuadrada del tamaño de la muestra, que es lo mismo) y es por lo general,
aproximadamente el doble de la desviación estándar: la mitad del ancho de un
intervalo de confianza del 95 por ciento.

En ciencia, muchos investigadores analizan la desviación estándar de los datos


experimentales, y solo los efectos que se alejan mucho más de dos desviaciones
estándar de lo que sería esperable, se consideran estadísticamente significativos:
el error aleatorio normal o la variación en las mediciones se distinguen de esta
manera de los efectos genuinos o asociaciones probables. En finanzas también es un
indicador importante, puesto que la desviación estándar de la tasa de retorno de
una inversión da una medida de su volatilidad.

Cuando solo está disponible una muestra de datos de una población, el término
desviación estándar de la muestra o desviación estándar muestral, puede referirse a
la cantidad mencionada anteriormente aplicada a esos datos, o también a una
cantidad sobre la que se realiza un ajuste que sirve de estimación no sesgada de la
desviación estándar de la población (es decir, de la desviación estándar de toda la
población).

S-ar putea să vă placă și