Sunteți pe pagina 1din 28

TEMA 2

ESTADSTICA DESCRIPTIVA PARA UNA VARIABLE

TCNICAS ESTADSTICAS
Las tcnicas de estadstica descriptiva que pueden aplicarse sobre las tablas de datos dependen de la naturaleza de las variables implicadas:
Tcnicas para variables cualitativas Tcnicas para variables cuantitativas

VARIABLES CUALITATIVAS
Lo nico que podemos hacer con las variables cualitativas es contar cuntas veces aparece cada una de sus modalidades en un conjunto de individuos. Slo cabe hacer RECUENTOS y CLCULO DE PORCENTAJES.

FRECUENCIAS ABSOLUTAS Y RELATIVAS

Frecuencias absolutas: recuento del nmero de individuos que pertenecen a cada una de las modalidades de la variable. Frecuencias relativas: clculo del porcentaje de individuos que pertenecen a cada una de las modalidades de la variable.

FRECUENCIAS ACUMULADAS
Slo tienen sentido en el caso de variables de tipo ordinal. Pueden ser absolutas o relativas. Representan el nmero (o porcentaje) de pertenecientes a cada modalidad de la variable ordinal o a las anteriores.
Ejemplo: Personas de clase media o menos, es decir de clase baja o clase media.

REPRESENTACIONES GRFICAS
La fundamental es el grfico de barras (no confundir con un histograma). Caben otras representaciones como pictogramas, grficos de sectores, etctera.

VARIABLES CUANTITATIVAS
Medidas de posicin. Medidas de dispersin Medidas de simetra Representaciones grficas

LAS MEDIDAS RESUMEN


Nos dan una idea de cmo son los valores de la variable que estamos estudiando. Veremos dos tipos:
Medidas de posicin o de tendencia central Medidas de dispersin

MEDIDAS DE POSICIN
Nos dan una idea acerca de los valores centrales de la variable, aquellos alrededor de los cuales se acumulan los dems. Hay tres medidas de posicin fundamentales:
Media aritmtica Mediana Moda

MEDIA ARITMTICA
Es la medida de posicin ms popular Es muy sensible a la existencia de datos extremos (menos robusta que la mediana).
N

X
X =
i =1

MEDIANA
Es aquel valor de la variable que es mayor que la mitad de las observaciones y menor que la otra mitad. En caso de que el nmero de observaciones sea par, es la media aritmtica de los dos valores centrales. Es una medida muy robusta, esto es, poco sensible a la existencia de valores extremos. Es un caso particular del concepto de PERCENTIL Mediana vs. media

MODA
Es el valor de la variable que ms se repite Se habla de variables unimodales y multimodales Es la menos empleada de las medidas de posicin

MEDIDAS DE DISPERSIN
Nos dan una idea acerca de la heterogeneidad de la variable. Estudiamos tres medidas de dispersin:
Varianza Desviacin estndar o tpica Coeficiente de variacin

VARIANZA
Es la medida de dispersin ms popular junto con la desviacin estndar. Siempre toma valores no negativos. Cuanto mayor sea su valor mayor es la heterogeneidad de la variable.
2 X 2 ( ) X i X i =1 N

MENOS VARIANZA

MS VARIANZA

DESVIACIN ESTNDAR
La varianza est en unidades al cuadrado. Por eso se calcula su raz cuadrada, la desviacin estndar (o desviacin tpica).

2 = X = X

(X
i =1

X )

COEFICIENTE DE VARIACIN
Ni la varianza ni la desviacin estndar estn acotadas. Es necesario contar con un coeficiente relativo: el coeficiente de variacin. ES ADIMENCIONAL.
Ejemplo: elefantes y gatos:

Un CV superior a 20% indica heterogeneidad

MEDIDAS DE ASIMETRA
Asimetra positiva: cuando existen unos pocos valores extremadamente elevados y la mayora son bajos.
El ndice de asimetra es positivo La media es mayor que la mediana

Asimetra negativa: cuando existen unos pocos valores extremadamente bajos y la mayora son altos.
El ndice de asimetra es negativo La media es menor que la mediana

Variable simtrica:
ndice de asimetra cero La media coincide con la mediana

MEDIDAS DE ASIMETRA
ASIMETRA POSITIVA

ASIMETRA NEGATIVA

SIMETRA

1. ASIMETRA Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

JGM.03/09/04

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:
)

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media. Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.
JGM.03/09/04

2. CURTOSIS Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

JGM.03/09/04

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente.

JGM.03/09/04

FUNCIN DE DENSIDAD (II)


Para ser funcin de densidad, una funcin R->R debe cumplir dos propiedades:
Tomar siempre valores positivos. El rea que encierra bajo ella vale 1.

Un ejemplo muy comn de funcin de densidad es la distribucin NORMAL.

LA DISTRIBUCIN NORMAL

Es unimodal, y la moda y la mediana coinciden con la media. Es simtrica alrededor de la media. Nunca toca el eje de abscisas (es asinttica) El rea bajo la funcin es 1.

LA DISTRIBUCIN NORMAL

Q3-Q1= 1.33 DESV. STD. %CV<20% RANGO= 6 DESV.. STD.

LA DISTRIBUCIN NORMAL (II)


Tiene dos parmetros que la determinan inequvocamente:
Media Varianza 2

Por tanto, existen infinitas distribuciones normales. La tipificacin nos permite emplear una nica tabla.

Los parmetros son:


La media poblacional, La varianza poblacional, 2

JGM.03/09/04

TIPIFICACIN
Es el proceso de convertir una variable normal cualquiera en una normal estndar La puntuacin Z mide la lejana de un individuo respecto a la media y la compara con la lejana respecto a la media del conjunto de todos los individuos. A partir de la tipificacin (y consultando las tablas adecuadas) podemos calcular probabilidades.

X X

S-ar putea să vă placă și