Sunteți pe pagina 1din 28

I NTEGRANTES

o J O S E LY N M O N T E N E G R O R E A L P E
o R O N N Y A L E J A N D R O P E R A L T A
o C A R L O S Q U I J I J E G U A R A N D A
o F R E D D Y A L V A R A D O C O L O M A
o F R A N K L A S L U I S A S S O R I A N O
o C E S A R L I N D A O G A R C I A
o K E V I N S A L A Z A R B E N AV I D E Z
2013
MEDIDAS DE FORMA DE LA
DISTRIBUCION
En trabajos propios de algunos disciplinas surge con frecuencia la necesidad de
calcular una medida que muestre las directrices de la dispersin respecto a su centro y
que complementan la descripcin de las distribuciones de frecuencias estas
caractersticas se llaman: Asimetra ( que significa no tener simetra) y curtosis o
apuntamiento . Las medidas de dispersin solo indican la magnitud de las variaciones
pero no dan informacin acerca de la direccin de las variaciones.

MEDIDAS DE ASIMETRIA
El concepto de asimetra de una distribucin indica la deformacin horizontal de
las distribuciones de frecuencias es una idea que hemos utilizado anteriormente.
Una distribucin es asimtrica, como sabemos, cuando su curva (o polgono) de
frecuencias es simtrica respecto al eje vertical, es decir si se le puede doblar a lo
largo del eje vertical , de manera que coincidan los dos lados.
En caso de polgonos de frecuencia unimodales simtricas como sabemos la
media aritmtica, la mediana y la moda, coinciden


X= X = Xmo X mo < X < X
ASIMETRIA POSITIVA
se dir que una distribucin de frecuencias unimodal presenta asimetra positiva
o a la derecha, si tiene una ramificacin mas extendida hacia la derecha o hacia
valores grandes de la varale, en este caso la media aritmtica es mayor que la
moda. La mediana por el hecho de dividir el conjunto de observaciones en dos
partes iguales quedara comprendida entre ambas.


.


ASIMETRA NEGATIVA
Se dir que una distribucin de frecuencias unimodal presenta asimetra negativa
o a izquierda, si tiene una ramificacin mas extendida hacia la izquierda o hacia
valores pequeos de la variable . La media aritmtica es menor que la moda la
mediana por la misma razn anterior permanecer en el centro.








MEDIDAS DE TENDENCIA NO CENTRAL
En estadstica descriptiva, las medidas de posicin no
centrales permiten conocer otros puntos
caractersticos de la distribucin que no son los
valores centrales.



Entre las medidas de posicin no centrales ms
importantes tenemos:
Cuartiles, que dividen la distribucin en 4 partes iguales
Deciles, que dividen la distribucin en 10 partes iguales
Percentiles, que dividen la distribucin en 100 partes iguales.


CUARTILES
Los cuartiles son los 3 valores de un conjunto de datos que
lo dividen en 4 partes iguales.

El primer cuartil es ese valor debajo del cual clasifica el 25
% de la observaciones, y sobre el cual puede encontrarse
el 75 % restante.

El segundo cuartil es justo la mitad, la mitad de las
observaciones esta por debajo y la otra mitad por
encima, en este sentido, es lo mismo que la mediana.

El tercer cuartil es el valor debajo del cual est el 75 % de
las observaciones y encima del cual pueden encontrarse
el 25% restante
CUARTILES
Para calcular los cuartiles, en primer lugar, debemos
tener ordenado el arreglo de datos de menor a
mayor.

A continuacin debe utilizarse la siguiente frmula que
nos seala la ubicacin del cuartil deseado en el
arreglo de datos.



Una vez obtenido el valor de Q, se debe seguir una de
las 3 reglas a continuacin:
CUARTILES
Regla 1: Si el resultado es un nmero entero, entonces
el cuartil es igual al valor clasificado. Por ejemplo, si
el tamao de la muestra es n = 7, el primer cuartil Q
es igual a (7+1)/4 = 2, entonces Q seria el segundo
valor del conjunto de datos ordenados.

Regla 2: Si el resultado es una fraccin de mitad (2.5,
4.5,etc) entonces el cuartil es igual al promedio de
los valores clasificados correspondientes. Por
ejemplo si el tamao de la muestra es n = 9, el
primer cuartil seria Q es igual al valor clasificado
como (9+1)/4 = 2.5, la mitad entre los valores
clasificados como segundo o tercero.
CUARTILES
Regla 3: Si el resultado no es nmero entero ni
fraccin de mitad, se redondea al entero ms
cercano y se selecciona ese valor clasificado. Por
ejemplo si el tamao de la muestra es n = 10, el
primer cuartil Q es igual a (10+1)/4 = valor
clasificado como 2.75 , por lo tanto se redondeara a
3 y ese valor es la posicin de Q
CUARTILES
Ej.: Encuentre los 3 cuartiles en el siguiente grupo de datos:
3.2, 5.4, 1.8, 4.3, 4.1, 5.2, 1.7, 6.1, 6.3, 3.2, 3.6, 2.4, 1.9, 4.9,
1.5, 2.2, 0.6, 6.2, 2.6, 3.3.
En primer lugar se debe ordenar el arreglo anterior de
datos, quedando de la siguiente forma: 0.6, 1.5, 1.7, 1.8,
1.9, 2.2, 2.4, 2.6, 3.2, 3.2, 3.3, 3.6, 4.1, 4.3, 4.9, 5.2, 5.4, 6.1,
6.2, 6.3
Entonces Q = 1*(20+1)/4 = 5.25 , luego usando la regla 3
tenemos que el Q se encuentra en la posicin 5 dando
1.9
Q = 2*(20+1)/4 = 10.5 , por la regla 2, promedio entre la
posicin 10 y 11 tenemos que (3.2 + 3.3)/2 = 3.25
Q = 3*(20+1)/4 = 15.75 , redondeamos a posicin 16,
entonces Q3 es 5.2
CUARTILES
Ahora para calcular los cuartiles para datos agrupados,
debemos recurrir a la siguiente frmula, idntica salvo
por un detalle para el clculo de la mediana para datos
agrupados:



Donde = limite inferior de la clase cuartil.
N = n de datos.
F = frecuencia acumulada de la clase que antecede a
la clase cuartil.
L = longitud de clase cuartil.
= frecuencia absoluta de la clase cuartil

CUARTILES
Ej.: Se tiene la siguiente tabla de frecuencia agrupada
en 6 clases. Encuentre el tercer cuartil.






Para comenzar, es necesario encontrar la clase que
contiene al tercer cuartil (p=3), por lo tanto, es
necesario encontrar con la frmula (p*N)/4 el valor
3*50/4 = 37.5 en la tabla de frecuencia acumuladas
Limites Frecuencia Abs. Frecuencia Acum.
49.5 59.5 3 3
59.5 69.5 7 10
69.5 79.5 18 28
79.5 89.5 12 40
89.5 99.5 8 48
99.5 109.5 2 50
CUARTILES
Dado que este valor se encuentra en la clase 4, esta es
nuestra clase cuartil y se procede a reemplazar en la
frmula correspondiente:
MEDIDAS DE ASIMETRA









Asimtrica positiva (o derechas); la suma de las desviaciones positivas > la
suma de las desviaciones con signo negativo

Asimtrica negativa (o a la izquierda); la suma de las desviaciones
positivas < la suma de las desviaciones con signo negativo

La desventaja con esta medida es que no es invariante ante un cambio de
escala.

=
=
n
i
i
i
N
n
x x m
1
3
3
) (
negativa asimtrica m si
positiva asimtrica m si
simtrica n distribuci m si
0
0
0
3
3
3
<
>
=
MEDIDAS DE ASIMETRA
Coeficiente de asimetra de R.A. Fisher




El coeficiente de asimetra de Fisher es la
expresin anterior dividida por el cubo
de la desviacin tpica. La desviacin
tpica, es positiva, as el signo viene de
.
2 / 3
1
2
1
3
3
3
1
) (
) (
(

= =

=
=
n
i
i
i
n
i
i
i
N
n
x x
N
n
x x
S
m
g
negativa asimtrica g si
positiva asimtrica g si
simtrica n distribuci g si
0
0
0
1
1
1
<
>
=
3
m
MEDIDAS DE ASIMETRA
Coeficiente de asimetra de Pearson





El coeficiente est pensado para distribuciones
campaniformas, unimodales y moderadamente
asimtricas.
Una distribucin campaniforme simtrica; Me Mo x = = .
Una distribucin campaniforme asimtrica positiva; 0 > Mo x .
Una distribucin campaniforme asimtrica negativa; 0 < Mo x .
S
Mo x
A
P

=
negativa asimtrica A si
positiva asimtrica A si
simtrica n distribuci A si
P
P
P
0
0
0
<
>
=
) ( 3 Me x Mo x ~ S
Me x
A
P
) ( 3
=
MEDIDAS DE ASIMETRA
Coeficiente de asimetra de Bowley
1 3
1 3
2
C C
Me C C
A
B

+
=
negativa asimtrica A si
positiva asimtrica A si
simtrica n distribuci A si
B
B
B
0
0
0
<
>
=
MEDIDAS DE ASIMETRA
Coeficiente absoluto de asimetra

S
Me C C
A
A
2
1 3
+
=
DIAGRAMA DE CAJA Y VALORES ATIPICOS
El diagrama de caja es una representacin semigrafica de una distribucin construida
para mostrar sus caractersticas principales, como por ejemplo la forma resultan
bastante utilices cuando el tamao de la muestra no es muy grande y los histogramas
no muestran bien su forma. Tambin para sealar los posibles datos atpicos, es decir
aquellos observaciones que parecen ser distintas de las dems.
DIAGRAMAS DE CAJA Y BIGOTES
Los diagramas de caja y bigotes son una presentacin
visual que describe varias caractersticas importantes, al
mismo tiempo, tales como la simetra y la dispersin.

Para su realizacin se representan los 3 cuartiles y los
valores mnimo y mximo de los datos, sobre un
rectngulo, alineado horizontalmente o verticalmente.

Una grfica de este tipo consiste en una caja rectangular,
donde los lados ms largos muestran el recorrido
intercuartlico ( Q Q). Este rectngulo esta dividido
por un segmento vertical que indica donde se posiciona
la mediana. Los valores extremos se unen por segmentos
con los extremos de la caja, y se denominan bigotes.
Veamos un ejemplo
CONSTRUCCIN DE UNA DIAGRAMA DE CAJA
DIAGRAMA DE CAJA


1.5 (Q3-Q1) 1.5 (Q3- Q1) Valores Atpicos

RI 1.5 RI

Xmin Q1 Me=Q2 Q3
1, con este diagrama se puede visualizar la simetra o asimetra de la distribucin as mirando la
caja:
2. Si la lnea trazada en la mediana esta en el centro de la caja la distribucin de los datos tiende
a ser simtrica.
2. Si la lnea de la mediana se acerca al limite inferior de la caja hay indicios de asimetra positiva
o ala derecha.
3. Si la lnea de la mediana se acerca al limite inferior de la caja hay indicios de asimetra positiva
o ala derecha
4. Si la lnea de la mediana esta cerca del limite superior de la caja es una indicacin de
asimetra negativa o a la izquierda.
Mirando las lneas su longitud relativa puede usarc tambin como indicacin de asimetra as:
1. Sil a lnea que se extiende desde el limite superior de la caja al mximo valor de la variable es
mas larga, los datos presentan asimetra a derecha.
Si es mas larga la lnea que va desde el limite inferior de la caja hasta el mnimo valor hay
indicios de asimetra a la izquierda.


EJEMPLO
Cada da de la primera quincena de enero atracan en un puerto pesquero el siguiente numero de
lanchas pesqueras.
95 89 77 87 81 89 92 103
87 82 80 100 79 74 83
Dibuje un diagrama de caja para estudiar la forma de la distribucin de los datos
SOLUCIN
El diagrama de caja es:




74 80 84 92 103
DIAGRAMAS DE CAJA Y BIGOTES
Ej.: Se tiene la edad de 20 personas y se desea saber la
distribucin de ellas: 36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40. Construya un
diagrama de caja y bigotes.

En primer lugar se deben ordenar los datos para poder
calcular los 3 cuartiles.
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40
41 45

Q
1
, el cuartil Primero es el valor mayor que el 25% de
los valores de la distribucin. Como N = 20 resulta
que (N+1)/4 = 5.25; el primer cuartil viene
determinado por el redondeo a la quinta posicin:
DIAGRAMAS DE CAJA Y BIGOTES
Q
1
= 24

Q
2
, el Segundo Cuartil es, evidentemente, la mediana de la
distribucin, es el valor de la variable que ocupa el lugar
central en un conjunto de datos ordenados. Como
(N+1)/2 = 10.5; la mediana es la media aritmtica de la
posicin 10 y 11:

Q
2
= (33 + 34)/ 2 =33,5

Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de
los valores de la distribucin. En nuestro caso, como
3(N+1)/ 4 = 15.75, eso se traduce a posicin 16 por el
redondeo:

Q
3
= 39
DIAGRAMAS DE CAJA Y BIGOTES
Ahora se dibuja la caja y bigotes:




Podemos obtener abundante informacin de una
distribucin a partir de estas representaciones. Veamos
alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la
poblacin est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmn, Q
1
) es ms corto que el de la derecha;
por ello el 25% de los ms jvenes estn ms concentrados que el 25%
de los mayores.
El rango intercuartlico = Q
3
- Q
1
= 14,5; es decir, el 50% de la poblacin
est comprendido en 14,5 aos.

S-ar putea să vă placă și