Documente Academic
Documente Profesional
Documente Cultură
\
|
~
100
Paso 3.
a) Si (i) no es entero, utilizando las reglas de
redondeo, se lleva al prximo numero entero. El
valor entero inmediato mayor que (i) indica la
posicin donde se encuentra el percentil. Esto
significa que si (i) = 3.5, el percentil se encuentra
en la posicin 4 de los datos.
b) Si (i) es entero, el percentil es el promedio de
los valores de los datos ubicados en los lugares i e
(i + 1).
EJEMPLO
Como ejemplo de este procedimiento, determina el
percentil 75 de los datos sobre las edades del siguiente
un grupo de ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30,
28, 27.
Paso 1. Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
Paso 2. Calcule el ndice (i):
Paso 3. Como (i) no es entero, redondeamos al prximo entero
mayor que 7.5, o sea, el lugar 8.
Al referirnos a los datos del ejemplo, vemos que el percentil 75
es el valor del dato ubicado en la posicin nmero 8, que en este
caso es 27.
19 20 21 22 23 25 26 27 28 30
Nota. Recuerda que (i) nos indica el lugar del dato donde se
encuentra el percentil que estamos buscando.
n
P
i
|
.
|
\
|
~
100
5 . 7 10
100
75
~
|
.
|
\
|
~ i
CMO SE INTERPRETA EL PERCENTIL EN
ESTE EJEMPLO?
Significa que el 75% de las edades son menores
de 27 aos y el 25% restante (100-p) es mayor
de 27 aos.
Los cuartiles se definen de la siguiente manera:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (tambin la mediana)
Q3 = tercer cuartil, o percentil 75
Los cuartiles dividen los datos en cuatro partes.
Cada una de las partes representa una cuarta parte, o
el 25% de las observaciones. Los cuartiles son
percentiles especficos; por consiguiente, los pasos
para calcular los percentiles los podemos emplear
para calcular los cuartiles.
CUARTILES
PASOS PARA CALCULAR LOS CUARTILES
A continuacin se presenta un conjunto de datos con los
siguientes valores:
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
Cmo identificamos los cuartiles en este ejemplo?
Se Utilizarn los mismos pasos para identificar los percentiles:
Paso 1. Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30
Paso 2. Determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (tambin mediana)
Q3 = tercer cuartil, o percentil 75
Primer Cuartil:
Q1 = primer cuartil, o percentil 25
= 2.5
Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 2.5, o sea 3. Al referirnos a los datos vemos
que el primer cuartil est ubicado en la posicin 3 de los datos
que este caso es 11. El primer cuartil en los datos se divide de
la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=1
10
100
25
|
.
|
\
|
~ i
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (tambin la mediana)
= 5
Como (i) es un nmero entero, el segundo cuartil es el
promedio de los valores de los datos que estn en las
posiciones i e (i+1), que en este caso es,
(14+15)2 = 14.5,
entonces, el segundo cuartil en los datos se divide as:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
10
100
50
|
.
|
\
|
~ i
Tercer cuartil:
Q3 = tercer cuartil, o percentil 75
= 7.5
Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 7.5, o sea 8. Al referirnos a los datos,
vemos que el tercer cuartil est ubicado en posicin 8 de los
datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20
10
100
75
|
.
|
\
|
~ i
50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395
8 14 17 21
2 9 11 12 14
8 15 17 22
4 9 11 12 14
9 15 18 23
4 9 11 12
10 15 18 23
7 9 11 12
12 16 18 23
7 9 12 12
12 16 19 24
8 9 12 12
13 16 19 25
8 9 12 13
14 17 19 27
8 9 12 13
14 17 20
8 9 12 14
14 17 20
8 10 12 14
Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
Muestra 2. Pesos de bultos
transportados por un correo (kgs)
Muestra 3. Escolaridad de los habitantes
adultos de un condominio (aos).
Ejemplo 5. Clculo del cuartil 1.
Muestra 1 Muestra 2 Muestra 3
nm. de
datos
n = 45 38 42
25*n/100 11.25
9.5
10.5
ubicacin del
cuartil Q
1
El cuartil 1 es la
observacin de
orden 12
El cuartil 1 es la
observacin de
orden 10
El cuartil 1 es la
observacin de
orden 11
Cuartil Q
1
150 M$ 14 kilos 9 aos
Ejemplo 6. Clculo del cuartil 2 o mediana.
Observar que el cuartil 2 es igual a la mediana, del ejemplo 2, en todos los
casos.
Muestra 1 Muestra 2 Muestra 3
50*n/100 22.5 19 21
ubicacin del
cuartil Q
2
El cuartil 2 es la
observacin de
orden 23
El cuartil 2 es el
promedio de las
obs. de lugares 19
y 20
El cuartil 2 es el
promedio de las
obs. de lugares 21
y 22
Cuartil Q
2
185 M$ 17 kilos 11 aos
Ejemplo 7. Clculo del cuartil 3.
Muestra 1 Muestra 2 Muestra 3
75*n/100 33.75 28.5 31.5
ubicacin del
cuartil Q
3
El cuartil 3 es la
observacin de
orden 34
El cuartil 3 es la
observacin de
orden 29
El cuartil 3 es la
observacin de
orden 32
Cuartil Q
3
290 M$ 20 kilos 12 aos
Quintiles y Deciles
Quintiles. Son los percentiles de orden 20, 40,
60 y 80. Dividen la muestra ordenada en cinco
grupos de igual tamao.
Deciles. Son los percentiles de orden 10, 20,
30, 40, 50, 60,70, 80 y 90. Dividen la muestra
ordenada en diez grupos de igual tamao.
Figura 5. Representacin de Cuartiles y Quintiles en un conjunto de datos simtrico
Describen el grado de dispersin de los datos, es decir,
cun separados se encuentran, como opuesto a datos que
estn muy concentrados o cercanos entre s. Las ms
conocidas son las siguientes:
-Rango
-Desviacin estndar
-Varianza
-Coeficiente de variabilidad
Medidas de Dispersin
Rango
Es la diferencia entre el mayor valor y el menor.
Depende slo de dos observaciones, y
justamente de las ms extremas, por lo que, en
general es una muy mala medida de dispersin.
Rango o Amplitud = Valor Max. Valor Min.
50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395
8 14 17 21
2 9 11 12 14
8 15 17 22
4 9 11 12 14
9 15 18 23
4 9 11 12
10 15 18 23
7 9 11 12
12 16 18 23
7 9 12 12
12 16 19 24
8 9 12 12
13 16 19 25
8 9 12 13
14 17 19 27
8 9 12 13
14 17 20
8 9 12 14
14 17 20
8 10 12 14
Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
Muestra 2. Pesos de bultos
transportados por un correo (kgs)
Muestra 3. Escolaridad de los habitantes
adultos de un condominio (aos).
Ejemplo 8. Clculo del rango.
Muestra 1
(Ingresos)
Muestra 2
(Pesos)
Muestra 3
(Escolaridad)
Mnimo 50 8 2
Mximo 510 27 14
Rango 510-50=460 M$ 27-8=19 kgs. 14-2=12 aos
Rango Intercuantil
Es la diferencia entre el cuartil tres y cuartil uno.
Rango Intercuartil (RI)= Q3 Q1
Pasos para calcular el Rango Intercuantil
Ejemplo:
Determine el rango intercuartil para los datos siguientes;
30, 40, 35, 5, 10, 20, 15, 30 y 45
Paso 1. Ordenar los datos de forma ascendente.
5 10 15 20 30 30 35 40 45
Paso 2. Calcular los cuartiles Q3 y Q1:
Q3 = 75 percentil
Q1 = 25 percentil
Nota: Utilizar el mismo procedimiento para percentiles.
Cuartil uno:
Q1 = 25 percentil
= = 2.25
Como (i) no es un entero, redondeamos al
prximo entero mayor que 2.25, o sea 3. As, que
Q1 est ubicado en la posicin tres (3) de los
datos, que en este ejemplo es 15.
5 10 15 20 30 30 35 40 45
n
P
i
|
.
|
\
|
~
100
9
100
25
|
.
|
\
|
~ i
Q1 = 15
Cuartil tres:
Q3 = 75 percentil
= = 6.75
Como (i) no es un entero, redondeamos al
prximo entero mayor que 6.75, o sea 7. As, que
Q1 est ubicado en la posicin siete (7) de los
datos, que en este ejemplo es 40.
5 10 15 20 30 30 35 40 45
n
P
i
|
.
|
\
|
~
100
9
100
75
|
.
|
\
|
~ i
Q3 = 40
Paso 3. Ahora, podemos sustituir los valores de
los cuartiles en la frmula.
Rango Intercuartil = Q3 Q1
RI = Q3 Q1
40 15 = 25
Varianza
La varianza es otra medida de dispersin que se basa en
la diferencia entre el valor de cada dato (Xi) y la media
(X). La diferencia entre cada dato (Xi) y su media (X)
para una muestra se llama desviacin con respecto a la
media o promedio y se expresa con la siguiente
frmula:
Para calcular la varianza, las desviaciones respecto a la
media se elevan al cuadrado y se dividen entre (N 1).
(Xi X)
Frmula para calcular la varianza:
S =
Ejemplo:
Se tienen los siguientes datos:
15, 12, 18, 20 y 25.
Paso 1. Calculamos la media:
= = 18
2
1
) (
N
x x
i
2
N
x
x
=
5
25 20 18 15 12 + + + +
Paso 2. Se buscar la desviacin estndar
respecto a la media ( ), que es la diferencia
entre cada valor de (Xi) y el promedio ( ) luego,
calculamos la sumatoria ( )
2
:
Xi X ( ) ( )
2
12 18 -6 36
15 18 -3 9
18 18 0 0
20 18 2 4
25 18 7 49
total 98
x x
i
x
x x
i
x x
i
x x
i
Ahora, sustituimos las variables de la frmula por los
valores obtenidos como se presenta a continuacin:
S = = = = 24.5
2
1
) (
N
x x
i
2
1 5
98
4
98
Desviacin Estndar
Es una medida de la variabilidad de un conjunto
de datos. Se calcula sacando la raz cuadrada de
la varianza. Nos indica cunto tienden a alejarse
los datos del promedio. Si los datos son de una
muestra, la desviacin estndar se representa
como:
S = 2
s
En el ejemplo anterior la desviacin estndar es:
S =
S =
S = 4.95
2
s
5 . 24
1. Se ha seleccionado una muestra con los
siguientes valores:
10, 15, 12, 18 y 20
Calcule el rango y rango intercuartil.
2. Con valores de:
6, 12, 14, 8, 10, 5, 15 y 10
Determine la varianza y la desviacin estndar.
Resuelve los siguientes ejercicios.
1. Se ha obtenido una muestra con valores:
35, 28, 20, 30, 22, 26, 24 y 15
Calcule la varianza y desviacin estndar.
2. Con los valores de los datos:
18, 11, 10,15 y 14
Determine el rango y rango intercuartil.
Coeficiente de Variacin
Es el cociente entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media
Es frecuente indicarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces:
CV =20/80 = 0,25 = 25% (variabilidad relativa)
CV S
X
Ejemplo: En una investigacin se observa el nivel de la
hemoglobina de pacientes de la costa (grupo A), y de la sierra
(grupo B). Si calculamos la media aritmtica y desviacin tpica
para ambos grupos obtenindose los resultados siguientes:
Regin Promedio Desviacin Estndar
A. Costa XA = 12,25 SA = 2,3
B. Sierra XB = 15,0 SB = 5,8
Calculamos el coeficiente de variacin para cada grupo y
obtenemos:
CVA % = 2,3 x 100 = 0,1878 x 100 = 18,78 %
12,25
CVB % = 5,8 x 100 = 0,3867 x 100 = 38,67 %
15
Comparando los coeficientes de variacin de ambos grupos podemos
concluir que el grupo de la sierra presenta mayor variabilidad en sus
mediciones de hemoglobina (Hb)
CV % S x 100
X
Como un complemento a la posicin y la dispersin
de una muestra de datos, puede ser til describir
algunas caractersticas de su forma
Existen 2 formas:
Asimetra o sesgo
Apuntamiento o curtosis
Medidas de Forma
Asimetra o Sesgo
Una distribucin es simtrica si la
mitad izquierda de su distribucin
es la imagen especular de su
mitad derecha.
En las distribuciones simtricas
media y mediana coinciden. Si
slo hay una moda tambin
coincide
La asimetra es positiva o
negativa en funcin de a qu lado
se encuentra la cola de la
distribucin.
Las discrepancias entre las
medidas de centralizacin son
indicacin de asimetra.
As<0
As=0
As>0
Asimetra Negativa a
la Izquierda
Simtrica Asimetra Positiva a la
Derecha.
Apuntamiento o Curtosis
Nos indica el grado de concentracin que presentan los valores
alrededor de la zona central de la distribucin. Mide si los valores
de la distribucin estn ms o menos concentrados alrededor de
los valores medios de la muestra
Mesocrtica (como la normal): K = 0
Platicrtica (aplanada): K < 0 Leptocrtica (apuntada): K > 0