Sunteți pe pagina 1din 12

INDICE

1. INTRODUCCIÓN ............................................................................................................. 3
2. MEDIDAS DE DISPERSIÓN ........................................................................................... 3
2.1. RECORRIDO DE LA VARIABLE ............................................................................ 3
2.2. RECORRIDO INTERCUARTILICO ......................................................................... 4
2.3. VARIANZA Y DESVIACION ESTANDAR .............................................................. 4
2.3.1. LA VARIANZA ................................................................................................. 4
2.3.2. LA DESVIACION ESTANDAR ........................................................................ 5
2.4. COEFICIENTE DE VARIACIÓN .....................................................................................8
3. INDICE DE ASIMETRÍA ...........................................................................................................8
4. CURTOSIS ..................................................................................................................................9
5. DIAGRAMA DE CAJA ............................................................................................................10
BIBLIOGRAFIA................................................................................................................................12
1. INTRODUCCIÓN
Las medidas de tendencia central no son suficientes para describir un conjunto de valores
de alguna variable estadística. Los promedios determinan el centro, pero nada indican
acerca de cómo están situados los datos respecto al centro. En primer lugar se necesita una
medida del grado de dispersión o variabilidad con respecto al centro con la finalidad de
ampliar la descripción de los datos o de comparar dos o más series de datos

En segundo lugar, se necesita una medida del grado de asimetría o deformación en ambos
lados del centro de una serie de datos, con el fin de describir la forma de la distribución de
los datos. Esta medida se denomina índice de asimetría. En tercer lugar se necesita una
medida que nos permita comparar el apuntamiento o curtosis de distribuciones simétricas
con respecto a la distribución simétrica normal. Esta medida se denomina índice de
apuntamiento o curtosis.

2. MEDIDAS DE DISPERSIÓN
Las medidas de dispersión o variabilidad son números que miden el grado de separación de
los datos con respecto a un valor central, que generalmente es la media aritmética.

- Las principales medidas de dispersión son:


 el rango o recorrido
 el rango intercuartil
 la varianza
 la desviación estándar
 y el coeficiente de variación.

2.1. RECORRIDO DE LA VARIABLE

El recorrido “R” de la variable es la diferencia entre los 2 extremos, es decir:

R=XMAX –XMIN

EJEMPLO:

2,2,7,7,7,8,8,8,8,9,9,9,14

XMAX=14 Xmin=2 R=14-2=12


2.2. RECORRIDO INTERCUARTILICO
SE define como la diferencia entre el tercer y primer cuantil(o también la diferencia entre los
percentiles 75avo y 25avo).Es decir:

RI=Q3-Q1 RI=P75-P25

RECORRIDO INTERCUARTILICO

¼ DE ELEMENTOS ¼ ELEMENTOS
X(1) . X(N)

OBS MENOR 1ER CUARTIL 2DO CUARTIL 3ER CUARTIL OBS MAYOR

Q1=P25 Q2=P50 Q3=P75

EJEMPLO

1. 2,2,7, 7,7,8,8,8,8,9, 9,9,14

Q1 Q3

RI=Q3-Q1=9-7=2

2. 2,3,4, 5,6,7,8,9,10,11, 12,13,14


Q1 Q3

RI= Q3-Q1 =11.5-4.5=7

2.3. VARIANZA Y DESVIACION ESTANDAR


La varianza, es una medida que cuantifíca el grado de dispersión o de variación de los
valores de una variable cuantitativa con respecto a su media aritmética. Si los valores
tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores
tienden a distribuirse lejos de la media, la varianza será grande.
2
La varianza calculada a partir de una muestra será denotada por s y refonda a una
población se denotará por σ2 .

Definición.

2.3.1. LA VARIANZA se define como la media aritmética de los cuadrados de


las diferencias de los datos con respecto a su media aritmética.
Definición.

2.3.2. LA DESVIACION ESTANDAR es la raíz cuadrada positiva de la


varianza La desviación estándar calculada a partir de una muestra se
denotará por s y referida a la población por σ. Esto es,

s =√S2 σ =√σ2

Cálculo de la varianza

Varianza de datos no tabulados

La varianza de n valores x ¡, x 2,...,x n , de alguna vanable cuantitativa X cuya media es x ,


es el nú mero:

EJEMPLO:

Los ingresos quincenales en dólares de 45 alumnos

SOLUCION:

Luego, la varianza es el numero


Mientras que la desviación estándar es

Observar que la varianza está en $2, mientras que la desviación estándar está en $.

Varianza de datos tabulados

Variable discreta

La varianza de n valores de una variable estadística discreta X que se clasifican en k valores


distintos x 1, x2…. xk con frecuencias absolutas respectivas f1,f2,….fk y cuya media aritmética
es x se calcula utilizando la fórmula:

Ejemplo

Calcular la varianza y la desviación estándar del número de hijos de la muestra de 20 familias

Solución:

Entonces
Luego la varianza es el numero

La desviación estándar

Varianza de datos tabulados por intervalos

La varianza de n valores de alguna variable X, tabulados en k intervalos, con marcas de


clases m1 , m 2 …..m¡. , frecuencias absolutas respectivas f1,f2.... f k \ con media x es el
número:

Ejemplo

Luego, la varianza es el número


La desviación estándar es:

2.4. COEFICIENTE DE VARIACIÓN


Definición. El coeficiente de variación, C. V. es una medida de dispersión relativa (libre de
unidades de medidas), que se define como la desviación estándar dividido por la media
aritmética. Esto es,

El coeficiente de variación se utiliza para comparar la variabilidad de dos o más series de


datos que tengan medias iguales o diferentes o que tengan unidades de medida iguales o
diferentes (por decir, una serie en kilogramos y otra serie en metros).

Por dar un ejemplo, si dos secciones H1 y H2 de matemática I, tienen la misma desviación


estándar igual a 14, no podemos concluir que los dos horarios tienen la misma variabilidad.
Así mismo, si las desviaciones estándares de H1 y H2 son iguales a 2 y 4 respectivamente
no podemos concluir que las notas de H2 son más dispersas que las de H l. La variabilidad
depende de las medias de los dos grupos. Si la media del horario H l es 16 y la media del
horario H2 es 11, los coeficientes de variación respectivos son:

3. INDICE DE ASIMETRÍA

Definición. Se dice que una distribución de frecuencias es simétrica, si los intervalos


equidistantes del intervalo central tienen iguales frecuencias. También se dice que una
distribución es simétrica si su curva de frecuencias es simétrica con respecto al centro de
los datos. Dos distribuciones pueden tener la misma media y la misma desviación estándar,
pero pueden diferir en el grado de asimetría. Si la distribución es simétrica, entonces, la
media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden
la distribución tiene que ser asimétrica.

Interpretación. Si la distribución de los datos es simétrica, As = 0 . De la figura donde se


observa, además, que coinciden los tres promedios: x = Me = Mo . Si As 0 ,
la distribución es asimétrica. Además, es asimétrica positiva o sesgada a la derecha, si /4 s
> 0 , (Fig. 3.1 b donde Mo < Me < x ). Y, es asimétrica negativa o sesgada a la izquierda si
Av < 0 (Fig. 3.1.c donde x < Me < Mo )

Por ejemplo, la distribución de los 45 ingresos quincenales del ejemplo 1.3 tabulados en
ocho intervalos tiene asimetría negativa:

4. CURTOSIS
La curtosis es la propiedad de una distribución de frecuencias por la cual se compara la
dispersión de los datos observados cercanos al valor central con la dispersión de los datos
cercanos a ambos extremos de la distribución.

La curtosis se mide en comparación a la curva simétrica normal o mesocúrtica

Una curva simétrica con curtosis mayor que de la normal es denominada curva leptocúrtica

Una curva simétrica con curtosis menor que de la normal es denominada curva platicúrtica

Curtosis basado en percentiles

Esta medida de curtosis es muy poco usada por ser muy inestable. Sin embargo, describe
muy bien el concepto.
En una curva normal, el cociente del rango intercuartil (percentil 75 menos el percentil 25)
entre la diferencia del percentil 90 menos el percentil 10 es aproximadamente igual 0.5. A
medida que P75 -P25 y P90 – P10 sean iguales (valor del cociente casi uno), la distribución
será leptocúrtica, y a medida que P75 — P25 sea cada vez más pequeño con respecto a
P90-P10 (valor del cociente casi cero) la distribución será platicúrtica

La curtosis utilizando percentiles se define por el cociente:

Interpretación. Si la distribución es normal K tiende a 0. Si K tiende a 0.5, es leptocúrtica, y


si A" tiende a -0.5, es platicúrtica.

Por ejemplo

la distribución de los 45 ingresos quincenales del tabulados en 8 intervalos tiene curtosis K


= (66.75- 5 3 .4 ) /( 7 3 .5 - 4 5 )-0 .5 = -0.03. Sin embargo, no se puede relacionarla con una
distribución normal, porque ésta distribución de frecuencias no es simétrica.

5. DIAGRAMA DE CAJA

Existe Una gran variedad de gráficas estadísticas para extraer información acerca de las
propiedades de un conjunto de datos. Una gráfica útil para reflejar propiedades de los datos
es la gráfica de caja (“box plots”) que se basa en la mediana (o en la media), los cuartiles y
valores extremos. La caja representa el rango intercuartil que encierra el 50% de los valores
y tiene la mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P75 (cuartil superior) y el percentil 25, P25 (cuartil inferior).
Además de la caja se incluye la extensión de los datos mediante segmentos que se
extienden de la caja hacia el valor máximo (U) y hacia el valor mínimo \L) de los datos. Este
recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se indica en
la figura que sigue.

De un gráfico de cajas, se obtiene información de los datos acerca de: La centralización


(Observando la ubicación de la mediana) La dispersión o variabilidad (mediante el rango
intercuartil: RI = P75 - P25) La asimetría (comparando: Me — P2s con P15 — Me) Las colas
(por la longitud de los segmentos que salen de los lados de la caja)
BIBLIOGRAFIA

- Estadistica descriptiva (CONCEPTOS Y APLICACIONES) RUFINO MOYA C.

- ESTADISTICA Descriptiva e Inferencia Quinta Edición Manuel Córdova Zamora

S-ar putea să vă placă și