Sunteți pe pagina 1din 12

Parmetros Estadsticos de

Posicin, Dispersin y Forma

Apellidos, nombre
Departamento

Martnez Gmez, Mnica (momargo@eio.upv.es)


Mar Benlloch, Manuel (mamaben@eio.upv.es)
Estadstica, Investigacin Operativa

Centro

Aplicadas y Calidad
Universidad Politcnica de Valencia

1.Resumen de las ideas clave


En este artculo docente se van a describir aquellas medidas o estadsticos que
permiten sintetizar la informacin existente en los datos de una muestra de una
Parmetros Estadsticos de Posicin, Dispersin y Forma

manera sencilla y fcil de interpretar. En variables de tipo continuo, ello se consigue


con la estimacin de tres tipos de medidas: posicin o tendencia central, dispersin
y forma de la distribucin. La finalidad del presente artculo docente es elaborar una
especie de catlogo al que acudir para conocer y caracterizar la distribucin de mis
datos y comparar distintas muestras entre s.

2.Introduccin
Qu es lo primero que conviene hacer con los datos estadsticos de una variable
aleatoria (V.A.) de tipo continuo continua? Qu sentido prctico puede tener el
resumir la informacin obtenida de un conjunto de datos de una V.A. continua en
varios parmetros estadsticos?
La estructura que vas a seguir es la siguiente: en primer lugar leers los objetivos
que tienes que conseguir; a continuacin trabajars la definicin y caractersticas
de cada uno de los parmetros, haciendo especial relevancia en el tipo de
distribucin para las que son ms adecuados. Para ello,

resolvers algunos

ejemplos prcticos que te ayudarn a comprenderlo mejor. Finalmente, en el cierre,


se te matizan los conceptos bsicos de aprendizaje con respecto a dichos
parmetros y sus aplicaciones prcticas.

3.Objetivos

Detectar el tipo de distribucin que siguen las variables a partir de la


estimacin de los parmetros descriptivos.

Conocer en torno a que valor (centro) se agrupan los datos.

Identificar si los datos se concentran en torno a un nmero de manera ms


concentrada o ms dispersa.

Conocer si la distribucin de mis datos sigue una pauta de variabilidad


normal, o por el contrario, presenta cierta asimetra o curtosis.

Parmetros Estadsticos de Posicin, Dispersin y Forma

4.Definicin y caractersticas de los


parmetros estadsticos
4.1. Por qu es importante sintetizar la informacin
de unos datos en lo que se conoce como parmetros
estadsticos?
Normalmente, al efectuar un estudio estadstico de una V.A,

los datos que nos

encontramos son muy numerosos y estn desordenados. En consecuencia, es


necesario efectuar un proceso de reduccin y ordenacin, que me permitan
manejarlos de manera ms sencilla y prctica.

Este proceso, va a conllevar una

prdida de la informacin ofrecida originalmente por los datos, que puede llevar a
errores. Sin embargo, sto va a permitir la caracterizacin de los datos y sobre todo,
la comparacin de distintas muestras entre s.
Un parmetro estadstico es un nmero que resume la ingente cantidad de datos
que pueden derivarse del estudio de una variable estadstica. El clculo de este
nmero est bien definido, usualmente mediante una frmula aritmtica obtenida a
partir de datos de la poblacin.
Existen principalmente

tres tipos

de parmetros

estadsticos:

de posicin,

dispersin y forma.

4.2. Parmetros de Posicin


Permiten identificar el valor en torno al cual se agrupan mayoritariamente los datos,
es decir, cuyo valor es representativo de todos ellos. Pueden ser de dos tipos:

Medidas de tendencia central: media, mediana y moda.

Medidas de posicin no central: cuartiles, deciles y perceptiles.

Este tipo de parmetros no tiene por qu coincidir con un valor exacto de la


variable, y no deben usarse con carcter general para hacer pronsticos. La
eleccin de un parmetro u otro, depender de cada caso particular y de la
distribucin que siga la variable, pero podemos concluir que en el caso de que los
datos sigan una distribucin normal, la media aritmtica es el parmetro ms
Parmetros Estadsticos de Posicin, Dispersin y Forma

representativo, mientras que si presenta cierta asimetra conviene ms utilizar la


mediana. La moda slo es adecuada en el caso de variables cualitativas.
1. Media Aritmtica
Es probablemente el ms conocido y usado en la prctica, pero slo en el
caso de V.A continas. La media de una variable X se denota por

x , y se calcula

como se indica a continuacin. Dado un conjunto de datos numricos x1, x2, , xn, la
media no es ms que la suma de todos los datos dividido por el nmero total de
valores:
N

i 1

La media cumple una serie de propiedades bsicas:


a) Si a cada uno de los valores de una variable se le suma una constante K, la
media se ver incrementada en esa misma constante:
N

xK

x K
i 1

b) Si a cada uno de los valores de una variable se le multiplica por una


constante, K, la media queda multiplicada por esa constante:
N

x K

x K
i 1

c) Si una variable Y es una transformada lineal de otra variable X, es decir,


Y=a+bX, la media de Y es tambin la transformada lineal de la media de X,
es decir, y =a+b x .
d) La suma de las desviaciones de todos los valores de la variable respecto a su
media es cero:
N

(x
i 1

x) 0

e) Si una variable Z es la suma de dos variables X e Y, la media de Z es


tambin la suma de las medias de las variables X e Y, es decir, si Z=X+Y
entonces

z =x

+y.

Parmetros Estadsticos de Posicin, Dispersin y Forma

En general, la media no ser un buen parmetro de posicin cuando la distribucin


de los datos sea asimtrica, al ser muy sensible a los valores extremos de la
variable.
2. Mediana
La mediana es un valor de la variable que deja por debajo de s a la mitad de los
datos, una vez que estos estn ordenados de menor a mayor.

La mediana se

denota por Me y se calcula de manera sencilla. Ordenados los datos de menor a


mayor, Me es:

Si N es un nmero impar, entonces Me es el valor que ocupa la posicin

N 1
de la lista de datos ordenados. Dmonos cuenta que en este caso,
2
quedarn el mismo nmero de datos a un lado y al otro de la mediana.

Si N es un nmero par, no tenemos un dato central. En ese caso,


tomamos la media de los dos datos centrales y que s dejan el mismo
nmero de valores a un lado y al otro, es decir, la mediana ser la media
de los datos que ocupan las posiciones

N
N
1 de la lista de datos
y
2
2

ordenados.
La mediana es menos sensible que la media a oscilaciones de los valores de la
variable y no se ve afectada por la dispersin. De hecho, es ms representativa que
la media aritmtica cuando los datos son es bastante heterogneos o asimtricos.
Por ejemplo: Sea la variable aleatoria nmeros de televisores por hogar. Se
realiza una encuesta en 13 hogares, obtenindose los siguientes resultados:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1
Hallar la mediana de los mismos.
El primer paso es ordenar los datos de menor a mayor: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3,
3, 4
Como n es 13, impar, Me ser igual a 2, de manera que queden 6 datos por debajo
y 6 por encima de dicha posicin.

3. Moda
Parmetros Estadsticos de Posicin, Dispersin y Forma

La moda, representada por Mo, es otro parmetro de posicin que se calcula


simplemente como el valor que ms se repite en la muestra, es decir, el valor con
una mayor frecuencia. En consecuencia, no siempre se sita hacia el centro de la
distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la variable
presenten la misma frecuencia. Por otro lado, la moda puede no existir cuando en
un conjunto de datos, todos stos son diferentes entre s y no hay ningn dato que
se repita ms de una vez.
4. Medidas de posicin no central
Se trata de valores de la variable estadstica que dejan por debajo de s
determinada cantidad de los datos. Mientras que la mediana deja por debajo de s
al 50% de la distribucin, los cuantiles pueden hacerlo con cualquier otro
porcentaje. Los ms frecuentemente utilizados son cuartiles, si se divide la cantidad
de datos en cuatro partes. A estos cuartiles se les denomina y representa de la
siguiente manera:
Primer cuartil, C1. Valor que deja por debajo el 25% de los datos y por encima
el 75% de los datos.
Segundo cuartil, C2. Coincide con la mediana. Deja el 50% de los valores por
debajo y por encima.
Tercer cuartil, C3. Valor que deja por debajo el 75% de los datos y por encima el
25% de los datos.
Para calcular C1 y C3, ordenados los datos de menor a mayor, se procede de la
siguiente forma:

Si N es un nmero par, entonces C1 es la mediana de los N/2 primeros datos


y C3 la mediana de los N/2 ltimos datos.

Si N es un nmero impar, entonces tenemos dos posibilidades:

N 1
N 1
es impar. C1 es la mediana de los primeros
datos. C3 es la
2
2
mediana de los ltimos

N 1
datos.
2

N 1
N 1
es par. C1 es la mediana de los primeros
+C2 datos y C3 la
2
2
mediana de los ltimos

N 1
+C2 datos
2

Parmetros Estadsticos de Posicin, Dispersin y Forma

Por ejemplo: Los siguientes datos muestran el nmero de despedidos que se han
producido en 15 empresas del sector del automvil durante el ao 2010:
3
3

5
6

9
1

6
4

5
5

6
0

4
2

3
2

2
6

6
3

4
0

2
5

3
4

8
4

Hallar los cuartiles.

Lo primero que debemos hacer es ordenar los datos de menor a mayor:


1

2
5

2
6

3
2

3
3

3
4

4
0

4
2

5
5

5
6

6
0

6
3

6
4

8
4

9
1

Se trata de un nmero impar de datos, luego la mediana es el valor central que


ocupa la posicin (N+1)/2 o en nuestro caso (15+1)/2=8, es decir, el dato 42.
Para el primer y el tercer cuartil, tenemos que N es impar (15) y que (N-1)/2=7 es
impar. Por tanto, el primer cuartil C1 es la media de los primeros (N-1)/2 datos,
como son 7 datos, ser entonces el dato central de los primeros (N-1)/2 datos, o el
dato 4. Luego C1=32
Para C3 seguimos el mismo procedimiento, con lo que C3=63.

4.3. Parmetros de Dispersin


Las medidas de posicin resumen la distribucin de datos, pero resultan
insuficientes y simplifican excesivamente la informacin. Estas medidas adquieren
verdadero significado cuando van acompaadas de otras que informen sobre la
heterogeneidad de los datos. Estas medidas se conocen como parmetros de
dispersin y miden en qu medida los datos se agrupan entorno a un valor central.
Hay medidas de dispersin absolutas, entre las cuales se encuentran la varianza, la
desviacin tpica o el recorrido y medidas de dispersin relativas, como el
coeficiente de variacin. Las medidas absolutas tienen que ir acompaadas de un
parmetro de posicin, normalmente la media, y no permiten comparaciones entre
distintas muestras. Las medidas relativas suelen ser adimensionales por lo que
permiten la comparacin entre distintas muestras. Los estadsticos de dispersin
ms relevantes son:
1. Recorrido o Rango
Parmetros Estadsticos de Posicin, Dispersin y Forma

Es la medida de dispersin ms sencilla de calcular. Es la diferencia entre el mayor


y el menor valor que toma la variable. Es una medida poco precisa ya que slo toma
en consideracin un par de observaciones y puede verse afectada por valores
extremos.
Por ejemplo: Hallar el rango de los datos 2, 9, 8, 9, 15, 21, 5, 20.
El Rango quedara 21-2=19.
2. Intervalo Intercuartlico
Se define como la diferencia entre el tercer y primer cuartil. En ese rango estn, por
la propia definicin de los cuartiles, el 50% de las observaciones. Este tipo de
medidas tambin se usa para determinar valores atpicos.
Por ejemplo: Hallar el Intervalo Intercuartlico de los datos 2, 9, 8, 15, 21, 5, 20.
Para el clculo de los cuartiles debemos ordenar los datos de menor a mayor: 2, 5,
8, 9, 15, 20, 21. El C1 ser igual a 5 y el C3 igual a 20, con lo que el Intervalo
Intercuartlico tendr un valor de 15.
3. Varianza y Desviacin Tpica
La varianza se define como:
N

S2
donde

xi x

i 1

N 1

x es el valor de la media aritmtica y xi el valor de cada dato.

Para evitar el inconveniente de que est expresado en las mismas unidades que la
media pero elevadas al cuadrado, suele utilizarse la desviacin tpica (S), que no es
ms que la raz cuadrada de la varianza:
N

x x
i 1

N 1

La varianza cumple tres propiedades bsicas:

La varianza y la desviacin tpica no varan si a cada valor de la variable se le


suma una constante. Es decir, si Y=a+X entonces, SY2 S X2

Parmetros Estadsticos de Posicin, Dispersin y Forma

Si una variable Z es la suma de dos variables X e Y, la varianza de Z es la suma


de las varianzas de X e Y, es decir, si Z=X+Y entonces, S Z2 S X2 SY2

Siguiendo lo anterior, si una variable Y es una transformada lineal de otra


variable X, es decir, Y=a+bX, la varianza de Y es tambin la transformada lineal
de la varianza de X, esto es S Y2 b 2 S X2 .

Por ejemplo: La varianza y desviacin tpica de los datos 2, 9, 8, 15, 21, 5, 20,
seran respectivamente 49,18 y 6,82.
4. Coeficiente de Variacin de Pearson
Se define como cociente entre la desviacin tpica y la media:

CV

S
x

Se interpreta como el nmero de veces que la media est contenida en la


desviacin tpica. Suele darse su valor en tanto por ciento, multiplicando el
resultado anterior por 100. De este modo se obtiene un porcentaje de la
variabilidad.

4.4. Parmetros de Forma


Las variables aleatorias continuas presentan frecuentemente una pauta de
variabilidad que se caracteriza por el hecho de que los datos tienden a acumularse
en torno a un valor central, que coincide con la media, decreciendo su frecuencia de
forma aproximadamente simtrica a medida que se alejan por ambos lados de
dicho valor. Los histogramas de estas variables continuas tienen forma de campana
de Gauss, que es el modelo matemtico de la distribucin normal, siendo la
distribucin que con ms frecuencia aparece en multitud fenmenos reales.

Imagen 1. La funcin de densidad de una distribucin normal


Fuente: http://personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm

Parmetros Estadsticos de Posicin, Dispersin y Forma

Los parmetros de forma son indicativos de la forma tpica que presenta la grfica o
histograma de los datos, es decir de cmo se distribuyen. Entre ellas destacan el
coeficiente de asimetra y curtosis.
1. Coeficiente de Asimetra
Las medidas de asimetra permiten conocer si los datos estn dispuestos de forma
simtrica en torno a un valor central de posicin, que generalmente es la media
aritmtica.
Para saber qu grado de asimetra presentan los datos es necesario el llamado
Coeficiente de Asimetra (C.A), que se define como:
N

CA

x
i 1

( N 1)S 3

Si unos datos son simtricos, lo son respecto a su media y la suma de los cubos de
las desviaciones de los datos respecto a su media ser nula.
Por el contrario, tendremos una asimetra positiva (C.A > 0), cuando la media est
a la derecha de la mediana y grficamente se obtiene un histograma en forma de L
con una cola hacia la derecha, como se muestra en la figura 2. As mismo, existe
asimetra negativa (C.A <0) la media sea inferior a la mediana y el histograma
resultante tiene una forma caracterstica de J, con cola hacia la izquierda.

Imagen 2. Tipos de Asimetra


Fuente: http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico

2. Coeficiente de Curtosis o Apuntamiento (C.C)


Con este parmetro se pretende medir cmo se reparten las frecuencias relativas
de los datos entre el centro y los extremos, tomando como comparacin la campana
de Gauss. Miden si los valores se concentran ms o menos frecuentemente en torno
a la media respecto de lo que cabra esperar en una distribucin normal
Se define como:
Parmetros Estadsticos de Posicin, Dispersin y Forma

10

CC

xi x

i 1

( N 1)S 4

Existen 3 grandes categoras de curtosis:


Distribucin platicrtica (apuntamiento negativo) (CC<3): indica que en las
colas o extremos hay ms casos acumulados que en las colas de una
distribucin normal, es decir, datos alejados de la media que aparecen con
una frecuencia excesiva, respecto de una distribucin normal. Presentan un
histograma simtrico pero ms aplanada que una campana de gauss, como
se muestra en la figura 3.
Distribucin leptocrtica (apuntamiento positivo) (CC>3): se produce cuando
datos alejados de la media aparecen con una frecuencia menor a lo que
sera esperable. Presentan un histograma simtrico pero ms apuntado que
una campana de gauss, como se muestra en la figura 3.
Distribucin mesocrtica (apuntamiento normal): coincide con la distribucin
normal.

Imagen 3. Tipos de curtosis


Fuente: http://www.spssfree.com/spss/curso/5-19.gif

Por ejemplo: el coeficiente de asimetra y de curstosis de los datos 2, 9, 8, 15, 21,


5, 20, seran respectivamente 0,22 y -1,64, es decir prcticamente normal respecto
del punto de vista de la asimetra y ligeramente planicrtico.
En este objeto de aprendizaje se han visto los principales parmetros de

posicin,
dispersin y que me permitan resumir la informacin de los mismos y
5.
Cierre
comparar las distribuciones de distintas variables.

Recuerda que hemos desarrollado, y ejemplificado los parmetros de posicin y


dispersin que se esquematizan a continuacin, y se ha definido para qu tipos
de distribuciones son ms adecuados cada uno de ellos.

Parmetros Estadsticos de Posicin, Dispersin y Forma

11

Tambin se hemos definido los principales parmetros de forma, que me van a


permitir conocer si mis datos siguen una distribucin normal. Se ha definido,
ejemplificado y grafiado los dos ms importantes: el coeficiente de asimetra y
el coeficiente de curtosis.
Recordar que todos los parmetros que se han definido en este objeto son
medidas objetivas, es decir, que su valor a de ser siempre el mismo, aunque lo
estimen distintas personas.

6. Bibliografa
6.1. Libros:
[1] Esteban Garca, J., Bachero Nebot, J. M., Blasco Blasco, O. M., Coll Serrano, V.,
Dez Garca, R., Ivars Escortell, A., Lpez Rodrguez, M. I., Rojo Olivas, C. y Ruiz
Ponce, F. (2005). Estadstica Descriptiva y Nociones de Probabilidad. Thomson.
ISBN 84-9732-374-2.
[2] Martn-Pliego Lpez, F. J. (2004). Introduccin a la Estadstica Econmica y
Empresarial. 3 edicin. Thomson. ISBN 84-9732-316-5.
[3] Martnez-Gmez, M.; Ruz, R. y Vallada, E. Introduccin a la Estadstica para
Licenciados en Administracin y Direccin de Empresas. (2010). Editorial UPV.
ISBN 978-84-8363-521-6
[4] Mendenhall, W.; Reinmuth, J.E. (1978). Estadstica para administracin y
economa. (Ed.) Grupo Editorial Iberoamericana. ISBN 968-7270-13-6.
[5] Montiel, A.M.; Rius, F.; Barn F.J. (1997). Elementos bsicos de Estadstica
Econmica y Empresarial. (2 Ed.) Prentice Hall, Madrid.
[6] Pea, D. (2001). Fundamentos de Estadstica. (Ed.) Alianza Editorial, S.A.
Madrid. ISBN: 84-206-8696-4.
[7] Romero, R y Znica, L.R. (1993). Estadstica (Proyecto de Innovacin
Educativa). SPUPV-93.637.

6.2. Referencias de fuentes electrnicas:


[9] http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico
[10] http://www2.uca.es/serv/ai/formacion/spss/Imprimir/10frec.pdf
[11] http://ocw.uv.es/ciencias-de-la-salud/pruebas-1/1-3/t_05nuevo2.pdf
[12] http://www.spssfree.com/spss/curso/5-19.gif

Parmetros Estadsticos de Posicin, Dispersin y Forma

12

S-ar putea să vă placă și