Sunteți pe pagina 1din 66

Las medidas de resumen sirven para describir en forma

resumida un conjunto de datos que constituyen una


muestra tomada de alguna poblacin.

Podemos distinguir cuatro grupos de medidas de
resumen: las medidas de centro, las medidas de
posicin, (las de centro son casos especiales de estas
ltimas), las medidas de dispersin y las medidas de
forma.

Supngase que se dispone de una muestra de
observaciones x1, x2, ... xn . Con estas observaciones se
efectuarn los clculos de todas las medidas de resumen
que se presentan a continuacin.
Medidas de Resumen



Medidas de Tendencia Central
Son medidas que pretenden indicar dnde est lo
que se podra considerar como el centro de la
masa de datos. Las ms conocidas son las
siguientes:
-Media o Promedio
-Mediana
-Moda
n
x
x
n
i
i
=
=
1
Es igual a la suma de todas las observaciones, dividida
por el nmero de observaciones. Se usa el smbolo para
representar la media.

El promedio est dado por la frmula:
Promedio o Media (Me)
A modo de ejemplo, se dispone de tres muestras de datos con las
que se obtendrn las medidas de resumen. Los tres estn
ordenados de menor a mayor, por columnas.
Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395

8 14 17 21

2 9 11 12 14
8 15 17 22

4 9 11 12 14
9 15 18 23

4 9 11 12
10 15 18 23

7 9 11 12
12 16 18 23

7 9 12 12
12 16 19 24

8 9 12 12
13 16 19 25

8 9 12 13
14 17 19 27

8 9 12 13
14 17 20

8 9 12 14
14 17 20

8 10 12 14

Muestra 3. Escolaridad de los
habitantes adultos de un
condominio (aos).
Muestra 2. Pesos de
bultos transportados
por un correo (kgs).

El promedio es una medida muy influenciada por valores
extremos. Por lo tanto, si los datos presentan mucha
asimetra, el promedio resulta distorsionado.

Ejemplo 1. Clculo del promedio con los datos presentados al
inicio:

Muestra 1 Muestra 2 Muestra 3
Suma de los datos 10130 645 425
Nmero de datos n = 45 38 42
Promedio 10130/45 =
225.1 M$
645/38 = 17.0
kilos
425/42 = 10.1
aos

Propiedades de la Media:







Considera todos los valores.
Por eso es atrada por los valores extremos.
Puede representar a todos los datos.

Es nica. La serie tiene una media.

Su clculo es simple.
Es un nmero tal que al menos el 50% de las
observaciones son menores o iguales a l, y al menos el
50% son mayores o iguales a l. La mediana es muy
resistente a valores extremos. La representamos por el
smbolo Mn.

Se calcula de la siguiente forma:

1- Se ordenan las observaciones, de menor a mayor.
2- Si el nmero n de observaciones es impar, la
mediana es la que queda exactamente al centro.
3- Si el nmero de observaciones es par, la mediana es
el promedio de las dos observaciones centrales.
Mediana (Mn)
Valor central de una serie de nmeros.
La mediana divide a la serie en dos subconjuntos iguales
No se deja afectar por los extremos









0 1 2 3 4 5 6 7 8 9 10 1112 13 14 15 16 17 18 19 20 21 22 23 24 25
valores
F
r
e
c
u
e
n
c
i
a

Distribucin de una serie de valores
Mediana = n + 1
2
Es el valor de la variable que divide a las observaciones en dos
grupos con el mismo nmero de individuos (percentil 50).
Si el nmero de datos es par, se elige la media de los dos datos
centrales
Mn es 5
Si el nmero de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8
Si el nmero de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8
Mn es (4+5)/2 = 4,5
Figura 4. Comparacin entre promedios y medianas en distintos casos.
Ejemplo 2. Clculo de la mediana:

Muestra 1 Muestra 2 Muestra 3
Nmero de datos n = 45 38 42
Ubicacin de la
mediana
La mediana es la
observacin de
orden 23
La mediana es el
promedio de las
observaciones 19 y 20
La mediana es el
promedio de las
observaciones 21 y 22
Mediana Mn = 185 M$ Mn = (17+17)/2 = 17
kilos
Mn = (11+11)/2 = 11
aos

50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395

8 14 17 21

2 9 11 12 14
8 15 17 22

4 9 11 12 14
9 15 18 23

4 9 11 12
10 15 18 23

7 9 11 12
12 16 18 23

7 9 12 12
12 16 19 24

8 9 12 12
13 16 19 25

8 9 12 13
14 17 19 27

8 9 12 13
14 17 20

8 9 12 14
14 17 20

8 10 12 14

Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
Muestra 2. Pesos de bultos
transportados por un correo (kgs)

Muestra 3. Escolaridad de los habitantes
adultos de un condominio (aos).
Comparando con el ejemplo 1, se puede ver que el
promedio es mayor que la mediana cuando hay sesgo
hacia la derecha. Las observaciones extremas influyen
ms sobre el promedio que sobre la mediana, y lo
desplazan a la derecha.
En el caso simtrico, ambas medidas coinciden.
Y cuando hay sesgo a la izquierda, el promedio est ms
a la izquierda que la mediana.
Las edades de una muestra de 5 estudiantes
universitarios son:
21, 25, 19, 20, 22
Ordenando los datos en orden ascendente:
19, 20, 21, 22, 25.
La mediana es 21.

Las estaturas de 4 jugadores de basketball en cm son:
185, 182, 200, 187
Ordenando lo datos en orden ascendente:
182, 185, 187, 200.
La mediana es 186
Caractersticas
til para medidas nominales y ordinales
No se afecta por valores extremos
Se puede utilizar con clases abiertas
Puede no existir o no ser nica
Es el valor de la variable con mayor frecuencia
datos sin agrupar
297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629
Mo = 455
Moda (Mo)
Poblacin o Muestra
Moda
Frec Frec.



Clase Frecuenc. acumul. relativa
%

1 a 100 8 8 17.8
101 a 200 18 26 40.0
201 a 300 9 35 20.0
301 a 400 5 40 11.1
401 a 500 4 44 8.9
501 a 600 1 45 2.2
total 45 -- 100


Figura 1. Ingresos de empleados. Tabla de frecuencias e histograma.
Frec Frec.



Clase Frecuenc. acumul. relativa
%

7 a 9 3 3 7.9
10 a 12 3 6 7.9
13 a 15 8 14 21.0
16 a 18 11 25 28.9
19 a 21 6 31 15.8
22 a 24 5 36 13.2
25 a 27 2 38 5.3
total 38 -- 100


Frec Frec.



Clase Frecuenc. acumul. relativa
%

1 a 2 1 1 2.4
3 a 4 2 3 4.7
5 a 6 0 3 0
7 a 8 7 10 16.7
9 a 10 10 20 23.8
11 a 12 16 36 38.1
13 a 14 6 42 14.3
total 42 -- 100

Distribucin Sesgada a la Derecha
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
Mediana
Media
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
Mediana
Media
Distribucin Sesgada a la Izquierda
0
10
20
30
40
50
60
70
80
90
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
Mediana
Media
Distribucin Simtrica
CUAL MEDIDA DE TENDENCIA
CENTRAL USAR?
Se debe considerar:
Escala de Medicin
Forma de la Distribucin
MEDIA
Datos Numricos y distribuciones Simtricas
MEDIANA
Datos Ordinales o Numricos con distribuciones
Sesgadas
MODA
Datos Nominales y distribuciones bimodales
Medidas de Posicin
Los Cuantilos

En algunas ocasiones es importante obtener valores que dividan el
conjunto de datos en fracciones especificas. La mediana divide el
conjunto de datos en dos partes iguales, la mitad de los valores son
inferiores a la mediana y la otra mitad son superiores. Si cada una
de estas mitades se volviera a dividir por la mitad, el conjunto
quedara dividido en cuatro partes y cada parte se llamara cuartilo.
Pero el conjunto puede dividirse tambin por 10 (deciles) o por 100
(centiles o percentiles) y todos se llaman cuantilos.
Tanto la mediana, como los cuartilos y los deciles pueden
expresarse como percentiles.
25% 25% 25% 25%
Datos ordenados en forma creciente
Min
Max
Q1
Q2 Q3
Los centiles dividen la distribucin (ordenada) de datos en 100
partes. Cada parte contiene 1/100 de las puntuaciones.

El Centil 60, por ejemplo, es aquella puntuacin que deja por
debajo de s el 60% de los datos. El Centil 15 es aquella puntuacin
que deja por debajo de s el 15% de los datos.
Los centiles son cuantiles que dividen la distribucin en 100
partes. Hay otros cuantiles. Uno de ellos es la mediana, que divide
la distribucin en dos partes (Mediana = Centil 50)

Otros cuantiles son los deciles (Decil 1=Centil 10) y los cuartiles
(Cuartil 1 = Centil 25, Cuartil 2 = Mediana, Cuartil 3 = Centil 75)

PASOS PARA CACULAR EL
PERCENTIL

Para calcular el percentil debe seguir los siguientes pasos:

Paso 1.
Ordene los datos de manera ascendente.
Paso 2.
Calcule un ndice (i)




en donde:
(p) es el percentil de inters
(n) es el nmero de datos u observaciones.
n
P
i
|
.
|

\
|
~
100
Paso 3.
a) Si (i) no es entero, utilizando las reglas de
redondeo, se lleva al prximo numero entero. El
valor entero inmediato mayor que (i) indica la
posicin donde se encuentra el percentil. Esto
significa que si (i) = 3.5, el percentil se encuentra
en la posicin 4 de los datos.
b) Si (i) es entero, el percentil es el promedio de
los valores de los datos ubicados en los lugares i e
(i + 1).
EJEMPLO
Como ejemplo de este procedimiento, determina el
percentil 75 de los datos sobre las edades del siguiente
un grupo de ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30,
28, 27.

Paso 1. Ordene los datos en orden ascendente:

19 20 21 22 23 25 26 27 28 30

Paso 2. Calcule el ndice (i):



Paso 3. Como (i) no es entero, redondeamos al prximo entero
mayor que 7.5, o sea, el lugar 8.
Al referirnos a los datos del ejemplo, vemos que el percentil 75
es el valor del dato ubicado en la posicin nmero 8, que en este
caso es 27.
19 20 21 22 23 25 26 27 28 30

Nota. Recuerda que (i) nos indica el lugar del dato donde se
encuentra el percentil que estamos buscando.

n
P
i
|
.
|

\
|
~
100
5 . 7 10
100
75
~
|
.
|

\
|
~ i
CMO SE INTERPRETA EL PERCENTIL EN
ESTE EJEMPLO?
Significa que el 75% de las edades son menores
de 27 aos y el 25% restante (100-p) es mayor
de 27 aos.



Los cuartiles se definen de la siguiente manera:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (tambin la mediana)
Q3 = tercer cuartil, o percentil 75
Los cuartiles dividen los datos en cuatro partes.
Cada una de las partes representa una cuarta parte, o
el 25% de las observaciones. Los cuartiles son
percentiles especficos; por consiguiente, los pasos
para calcular los percentiles los podemos emplear
para calcular los cuartiles.
CUARTILES
PASOS PARA CALCULAR LOS CUARTILES
A continuacin se presenta un conjunto de datos con los
siguientes valores:
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.

Cmo identificamos los cuartiles en este ejemplo?
Se Utilizarn los mismos pasos para identificar los percentiles:
Paso 1. Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30

Paso 2. Determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (tambin mediana)
Q3 = tercer cuartil, o percentil 75
Primer Cuartil:
Q1 = primer cuartil, o percentil 25

= 2.5

Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 2.5, o sea 3. Al referirnos a los datos vemos
que el primer cuartil est ubicado en la posicin 3 de los datos
que este caso es 11. El primer cuartil en los datos se divide de
la siguiente forma:

5 8 11 12 14 15 18 20 25 30
Q1=1

10
100
25
|
.
|

\
|
~ i
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (tambin la mediana)

= 5

Como (i) es un nmero entero, el segundo cuartil es el
promedio de los valores de los datos que estn en las
posiciones i e (i+1), que en este caso es,
(14+15)2 = 14.5,
entonces, el segundo cuartil en los datos se divide as:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
10
100
50
|
.
|

\
|
~ i
Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

= 7.5

Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 7.5, o sea 8. Al referirnos a los datos,
vemos que el tercer cuartil est ubicado en posicin 8 de los
datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20
10
100
75
|
.
|

\
|
~ i
50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395

8 14 17 21

2 9 11 12 14
8 15 17 22

4 9 11 12 14
9 15 18 23

4 9 11 12
10 15 18 23

7 9 11 12
12 16 18 23

7 9 12 12
12 16 19 24

8 9 12 12
13 16 19 25

8 9 12 13
14 17 19 27

8 9 12 13
14 17 20

8 9 12 14
14 17 20

8 10 12 14

Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
Muestra 2. Pesos de bultos
transportados por un correo (kgs)

Muestra 3. Escolaridad de los habitantes
adultos de un condominio (aos).
Ejemplo 5. Clculo del cuartil 1.

Muestra 1 Muestra 2 Muestra 3
nm. de
datos
n = 45 38 42
25*n/100 11.25

9.5

10.5

ubicacin del
cuartil Q
1
El cuartil 1 es la
observacin de
orden 12
El cuartil 1 es la
observacin de
orden 10
El cuartil 1 es la
observacin de
orden 11
Cuartil Q
1
150 M$ 14 kilos 9 aos

Ejemplo 6. Clculo del cuartil 2 o mediana.
Observar que el cuartil 2 es igual a la mediana, del ejemplo 2, en todos los
casos.

Muestra 1 Muestra 2 Muestra 3
50*n/100 22.5 19 21
ubicacin del
cuartil Q
2

El cuartil 2 es la
observacin de
orden 23
El cuartil 2 es el
promedio de las
obs. de lugares 19
y 20
El cuartil 2 es el
promedio de las
obs. de lugares 21
y 22
Cuartil Q
2
185 M$ 17 kilos 11 aos

Ejemplo 7. Clculo del cuartil 3.

Muestra 1 Muestra 2 Muestra 3
75*n/100 33.75 28.5 31.5
ubicacin del
cuartil Q
3

El cuartil 3 es la
observacin de
orden 34
El cuartil 3 es la
observacin de
orden 29
El cuartil 3 es la
observacin de
orden 32
Cuartil Q
3
290 M$ 20 kilos 12 aos

Quintiles y Deciles
Quintiles. Son los percentiles de orden 20, 40,
60 y 80. Dividen la muestra ordenada en cinco
grupos de igual tamao.

Deciles. Son los percentiles de orden 10, 20,
30, 40, 50, 60,70, 80 y 90. Dividen la muestra
ordenada en diez grupos de igual tamao.
Figura 5. Representacin de Cuartiles y Quintiles en un conjunto de datos simtrico
Describen el grado de dispersin de los datos, es decir,
cun separados se encuentran, como opuesto a datos que
estn muy concentrados o cercanos entre s. Las ms
conocidas son las siguientes:
-Rango
-Desviacin estndar
-Varianza
-Coeficiente de variabilidad
Medidas de Dispersin
Rango
Es la diferencia entre el mayor valor y el menor.
Depende slo de dos observaciones, y
justamente de las ms extremas, por lo que, en
general es una muy mala medida de dispersin.
Rango o Amplitud = Valor Max. Valor Min.
50 140 175 270 430
50 150 180 280 450
80 150 185 285 460
80 150 190 290 500
90 150 190 295 510
90 150 195 350
90 150 250 350
95 150 250 365
130 160 250 370
140 170 250 395

8 14 17 21

2 9 11 12 14
8 15 17 22

4 9 11 12 14
9 15 18 23

4 9 11 12
10 15 18 23

7 9 11 12
12 16 18 23

7 9 12 12
12 16 19 24

8 9 12 12
13 16 19 25

8 9 12 13
14 17 19 27

8 9 12 13
14 17 20

8 9 12 14
14 17 20

8 10 12 14

Muestra 1. Ingresos de 45 empleados de una firma (miles de soles).
Muestra 2. Pesos de bultos
transportados por un correo (kgs)

Muestra 3. Escolaridad de los habitantes
adultos de un condominio (aos).
Ejemplo 8. Clculo del rango.
Muestra 1
(Ingresos)
Muestra 2
(Pesos)
Muestra 3
(Escolaridad)
Mnimo 50 8 2
Mximo 510 27 14
Rango 510-50=460 M$ 27-8=19 kgs. 14-2=12 aos
Rango Intercuantil
Es la diferencia entre el cuartil tres y cuartil uno.
Rango Intercuartil (RI)= Q3 Q1
Pasos para calcular el Rango Intercuantil
Ejemplo:
Determine el rango intercuartil para los datos siguientes;
30, 40, 35, 5, 10, 20, 15, 30 y 45
Paso 1. Ordenar los datos de forma ascendente.
5 10 15 20 30 30 35 40 45
Paso 2. Calcular los cuartiles Q3 y Q1:
Q3 = 75 percentil
Q1 = 25 percentil
Nota: Utilizar el mismo procedimiento para percentiles.
Cuartil uno:
Q1 = 25 percentil

= = 2.25

Como (i) no es un entero, redondeamos al
prximo entero mayor que 2.25, o sea 3. As, que
Q1 est ubicado en la posicin tres (3) de los
datos, que en este ejemplo es 15.
5 10 15 20 30 30 35 40 45

n
P
i
|
.
|

\
|
~
100
9
100
25
|
.
|

\
|
~ i
Q1 = 15
Cuartil tres:
Q3 = 75 percentil

= = 6.75

Como (i) no es un entero, redondeamos al
prximo entero mayor que 6.75, o sea 7. As, que
Q1 est ubicado en la posicin siete (7) de los
datos, que en este ejemplo es 40.
5 10 15 20 30 30 35 40 45

n
P
i
|
.
|

\
|
~
100
9
100
75
|
.
|

\
|
~ i
Q3 = 40
Paso 3. Ahora, podemos sustituir los valores de
los cuartiles en la frmula.

Rango Intercuartil = Q3 Q1

RI = Q3 Q1
40 15 = 25
Varianza
La varianza es otra medida de dispersin que se basa en
la diferencia entre el valor de cada dato (Xi) y la media
(X). La diferencia entre cada dato (Xi) y su media (X)
para una muestra se llama desviacin con respecto a la
media o promedio y se expresa con la siguiente
frmula:


Para calcular la varianza, las desviaciones respecto a la
media se elevan al cuadrado y se dividen entre (N 1).
(Xi X)
Frmula para calcular la varianza:

S =

Ejemplo:

Se tienen los siguientes datos:
15, 12, 18, 20 y 25.
Paso 1. Calculamos la media:


= = 18

2
1
) (
N
x x
i
2
N
x
x

=
5
25 20 18 15 12 + + + +
Paso 2. Se buscar la desviacin estndar
respecto a la media ( ), que es la diferencia
entre cada valor de (Xi) y el promedio ( ) luego,
calculamos la sumatoria ( )
2
:

Xi X ( ) ( )
2

12 18 -6 36
15 18 -3 9
18 18 0 0
20 18 2 4
25 18 7 49
total 98

x x
i

x
x x
i

x x
i

x x
i

Ahora, sustituimos las variables de la frmula por los
valores obtenidos como se presenta a continuacin:

S = = = = 24.5





2
1
) (
N
x x
i
2
1 5
98
4
98
Desviacin Estndar
Es una medida de la variabilidad de un conjunto
de datos. Se calcula sacando la raz cuadrada de
la varianza. Nos indica cunto tienden a alejarse
los datos del promedio. Si los datos son de una
muestra, la desviacin estndar se representa
como:
S = 2
s

En el ejemplo anterior la desviacin estndar es:

S =

S =

S = 4.95
2
s
5 . 24
1. Se ha seleccionado una muestra con los
siguientes valores:
10, 15, 12, 18 y 20
Calcule el rango y rango intercuartil.

2. Con valores de:
6, 12, 14, 8, 10, 5, 15 y 10
Determine la varianza y la desviacin estndar.
Resuelve los siguientes ejercicios.

1. Se ha obtenido una muestra con valores:
35, 28, 20, 30, 22, 26, 24 y 15
Calcule la varianza y desviacin estndar.

2. Con los valores de los datos:
18, 11, 10,15 y 14
Determine el rango y rango intercuartil.
Coeficiente de Variacin
Es el cociente entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de


qu tamao tiene con respecto a la media


Es frecuente indicarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces:

CV =20/80 = 0,25 = 25% (variabilidad relativa)
CV S
X
Ejemplo: En una investigacin se observa el nivel de la
hemoglobina de pacientes de la costa (grupo A), y de la sierra
(grupo B). Si calculamos la media aritmtica y desviacin tpica
para ambos grupos obtenindose los resultados siguientes:
Regin Promedio Desviacin Estndar
A. Costa XA = 12,25 SA = 2,3
B. Sierra XB = 15,0 SB = 5,8
Calculamos el coeficiente de variacin para cada grupo y
obtenemos:
CVA % = 2,3 x 100 = 0,1878 x 100 = 18,78 %
12,25

CVB % = 5,8 x 100 = 0,3867 x 100 = 38,67 %
15

Comparando los coeficientes de variacin de ambos grupos podemos
concluir que el grupo de la sierra presenta mayor variabilidad en sus
mediciones de hemoglobina (Hb)
CV % S x 100
X
Como un complemento a la posicin y la dispersin
de una muestra de datos, puede ser til describir
algunas caractersticas de su forma
Existen 2 formas:

Asimetra o sesgo
Apuntamiento o curtosis
Medidas de Forma
Asimetra o Sesgo
Una distribucin es simtrica si la
mitad izquierda de su distribucin
es la imagen especular de su
mitad derecha.

En las distribuciones simtricas
media y mediana coinciden. Si
slo hay una moda tambin
coincide

La asimetra es positiva o
negativa en funcin de a qu lado
se encuentra la cola de la
distribucin.

Las discrepancias entre las
medidas de centralizacin son
indicacin de asimetra.
As<0

As=0

As>0

Asimetra Negativa a
la Izquierda
Simtrica Asimetra Positiva a la
Derecha.
Apuntamiento o Curtosis
Nos indica el grado de concentracin que presentan los valores
alrededor de la zona central de la distribucin. Mide si los valores
de la distribucin estn ms o menos concentrados alrededor de
los valores medios de la muestra
Mesocrtica (como la normal): K = 0
Platicrtica (aplanada): K < 0 Leptocrtica (apuntada): K > 0

S-ar putea să vă placă și