Sunteți pe pagina 1din 29

Medidas de tendencia central

Medidas de localización

Probabilidad y estadística fundamental

Universidad Nacional de Colombia


Medidas de tendencia central
Medidas de localización
Contenidos

1 Medidas de tendencia central

2 Medidas de localización
Medidas de tendencia central
Medidas de localización
Contenidos

1 Medidas de tendencia central

2 Medidas de localización
Medidas de tendencia central
Medidas de localización
Media para datos en una distribución de frecuencias
Las deniciones y ejemplos anteriores se reeren a los datos crudos,
es decir, los datos sin agrupar. Cuando se tienen datos agrupados
en intervalos de frecuencia se debe ver que:
Es probable que no conozcamos los valores exactos de una
clase en particular.
Para hacer posibles los cálculos posibles, se pretende suponer
que todos los valores muestrales sean iguales a la marca de
clase, que se denota mcj .
Dicha marca de clase se repetirá tantas veces como la
frecuencia absoluta.
Por tanto:
Pm
j=1 mcj fj mc1 f1 + ... + mcm fm
x̄ = =
n n
Es la media aritmética para datos agrupados en intervalo o de una
distribución de frecuencias.
Medidas de tendencia central
Medidas de localización
Ejemplo
Se evaluaron las puntuaciones en una escala de dolor físico para un
grupo de 60 personas con cierta condición médica. Las
puntuaciones se agruparon en cinco intervalos y se obtiene la
información siguiente:
Intervalos Frecuencia fj Marca clase mcj mcj ∗ fj
099 21 49.5 1039.5
100199 12 149.5 1794.0
200299 14 249.5 3493.0
300399 3 349.5 1048.5
400499 10 449.5 4495.0
Por tanto:
1039.5 + 1794 + 3493 + 1048.5 + 4495
x̄ = = 197.83
60
Medidas de tendencia central
Medidas de localización
Ejemplo
Se midió el contenido de nicotina en una muestra aleatoria de 40
cigarrillos. Los datos agrupados se presentan en la tabla siguiente:

Clase (Intervalo de clase) fj rj mcj Aj fj /Aj hj /Aj


[0,72 - 1,025) 2 0,05 0,87 0,31 6,56 0,16
[1,025 - 1,33) 2 0,05 1,18 0,31 6,56 0,16
[1,33 - 1,635) 6 0,15 1,48 0,31 19,67 0,49
[1,635 - 1,94) 19 0,48 1,79 0,31 62,30 1,56
[1,94 - 2,245) 6 0,15 2,09 0,31 19,67 0,49
[2,245 - 2,55] 5 0,125 2,40 0,31 16,39 0,41
Medidas de tendencia central
Medidas de localización

Media (datos agrupados)


Pm
j=1 mcj fj mc1 f1 + ... + mcm fm
x̄ = =
n n

2(0.87) + 2(1.18) + 6(1.48) + 19(1.79) + 6(2.09) + 5(2.40)


= = 1.79
40
Los datos crudos son
1.09,1.92,2.31,1.79,2.28,1.74,1.47,1.97,0.85,1.24,1.58,2.03,1.70,2.17,
2.55,2.11,1.86,1.90,1.68,1.51,1.64,0.72,1.69,1.85,1.82,1.79,2.46,1.88,
2.08,1.67,1.37,1.93,1.40,1.64,2.09,1.75,1.63,2.37,1.75,1.69 y su
media es:
1.09 + 1.92 + ... + 2.37 + 1.75 + 1.69
x̄ = = 1.77
40
Medidas de tendencia central
Medidas de localización
Mediana datos agrupados
En este caso, al agruparse los datos se tienen que realizar
aproximaciones para obtener el valor de la mediana.

En primer lugar, se busca el intervalo donde se haya acumulado la


mitad de los datos. Corresponde a la primera categoría en dónde la
frecuencia acumulada Fj sea mayor o igual a la mitad de los datos
n/2, y se aplica la siguiente fórmula:
n 
− Fj−1
med(x) = x̃ = lij + Aj  2 
fj

lij : Límite inferior clase elegida (clase mediana), Aj : Amplitud


intervalo elegido, fj : Frecuencia absoluta de la clase elegida, Fj−1 :
Frecuencia absoluta acumulada de la clase previa (anterior) a la
elegida.
Medidas de tendencia central
Medidas de localización
Ejemplo
Se determinó la cantidad de contaminación por aluminio (ppm) en
plástico de cierto tipo con una muestra de 120 probetas de plástico
y se obtuvieron los siguientes datos:

contaminación frecuencia marca clase frecuencia


(ppm) acumulada

[30, 60) 35 45 35
[60, 90) 28 75 63
[90, 130) 19 110 82
[130, 180) 15 155 97
[180, 210] 23 195 120
Medidas de tendencia central
Medidas de localización

La la de color corresponde al intervalo (categoría) en donde la


frecuencia acumulada es mayor o igual a n/2 = 120/2 = 60 y es
llamada la clase mediana. De ese modo, la mediana es:
n 
− Fj−1
med(x) = x̃ = lij + Aj  2 
fj
120
 
− 35
= 60 + 30  2
 
28

= 86.79
Medidas de tendencia central
Medidas de localización
Ejemplo
Cierto artículo de investigación reportó las siguientes mediciones
discretas sobre el tiempo de inducción de oxidación (min) de varios
aceites comerciales:

tiempo de frecuencia marca clase frecuencia


inducción acumulada

87 - 100 4 93,5 4
101 - 119 10 110 14
120 - 135 25 127,5 39
136 - 145 20 140,5 59
147 - 170 10 158,5 69
Medidas de tendencia central
Medidas de localización
Moda datos agrupados

Sucede algo similar que con la mediana, aproximar su valor.

Se escoge la categoría con mayor frecuencia y se aplica la fórmula:


 
fj − fj−1
Mo(x) = lij + Aj
(fj − fj−1 ) + (fj − fj+1 )
lij : Límite inferior clase elegida (clase modal), Aj : Amplitud
intervalo elegido, fj : Frecuencia absoluta de la clase elegida, fj−1 :
Frecuencia absoluta de la clase previa (anterior) a la elegida,fj+1 :
Frecuencia absoluta de la clase posterior (siguiente) a la elegida.
Medidas de tendencia central
Medidas de localización
Ejemplo
Se determinó la cantidad de contaminación por aluminio (ppm) en
plástico de cierto tipo con una muestra de 120 probetas de plástico
y se obtuvieron los siguientes datos:

contaminación frecuencia marca clase frecuencia


(ppm) acumulada

[30, 60) 35 45 35
[60, 90) 28 75 63
[90, 130) 19 110 82
[130, 180) 15 155 97
[180, 210] 23 195 120
Medidas de tendencia central
Medidas de localización

La la de color corresponde al intervalo (categoría) de mayor


frecuencia absoluta y es llamada la clase modal. De ese modo, la
moda es:
 
fj − fj−1
Mo(x) =lij + Aj
(fj − fj−1 ) + (fj − fj+1 )
35 − 0
 
= 30 + 30
(35 − 0) + (35 − 28)
= 55
Medidas de tendencia central
Medidas de localización
Ejemplo
Cierto artículo de investigación reportó las siguientes mediciones
discretas sobre el tiempo de inducción de oxidación (min) de varios
aceites comerciales:

tiempo de frecuencia marca clase frecuencia


inducción acumulada

87 - 100 4 93,5 4
101 - 119 10 110 14
120 - 135 25 127,5 39
136 - 145 20 140,5 59
147 - 170 10 158,5 69
Medidas de tendencia central
Medidas de localización

La la de color corresponde al intervalo (categoría) de mayor


frecuencia absoluta y es llamada la clase modal. De ese modo, la
moda es:
 
fj − fj−1
Mo(x) =lij + Aj
(fj − fj−1 ) + (fj − fj+1 )
25 − 10
 
= 120 + 15
(25 − 10) + (25 − 20)
= 131.25
Medidas de tendencia central
Medidas de localización
Medidas de localización

Además de buscar un valor representativo general del conunto de


datos, usualmente tambien resulta como información importante el
orden o posición de una observación entre todos los valores (datos)
de una variable cuantitativa.

En este caso la posición determina el dato de interés y permitirá ver


la disposición de los datos por porcentajes elegidos.

Para encontrarlas, generalmente se ordenan los datos de forma


ascendente.
Medidas de tendencia central
Medidas de localización
Cuartiles

Son valores de la variable que dividen al conuunto de datos en


cuartos. Es decir, distribuye los datos en segmentos de
aproximadamente 25 % cada uno, luego de realizar la ordenación de
los mismos.

Primer cuartil (Q1 ): Es el valor debajo del cual queda el 25 %


de los datos. Visto de otra forma, deja el 75 % de los datos por
encima de él.

Segundo cuartil (Q2 ): Un valor debajo del cual queda el 50 %


de los datos. Es la mediana.
Medidas de tendencia central
Medidas de localización

Tercer cuartil (Q3 ): Número debajo del cual queda el 75 % de


los datos. Es decir, por encima de este valor debe quedar 25 %
de datos.

El proceso para encontrar un percentil se basa en buscar primero la


posición del dato de acuerdo al porcentaje deseado, luego de
ordenar los datos.
Medidas de tendencia central
Medidas de localización

Para el primer cuartil, se busca la posición 0.25n y si n es impar


se toma el dato en esa posición. Si n es par, se promedian los
datos en las posiciones 0.25n y la siguiente 0.25n + 1.

Para el segundo cuartil (mediana), se busca la posición 0.5n y


si n es impar se toma el dato en esa posición. Si n es par, se
promedian los datos en las posiciones 0.5n y la siguiente
0.5n + 1.

Para el tercer cuartil, se busca la posición 0.75n y si n es impar


se toma el dato en esa posición. Si n es par, se promedian los
datos en las posiciones 0.75n y la siguiente 0.75n + 1
Medidas de tendencia central
Medidas de localización
Ejemplo

Según cierta revista, una propiedad importante de una bra es su


absorción del agua. Se toma una muestra aleatoria de 20 pedazos
de bra de algodón y se mide la absorción de cada uno.

Los valores de absorción son los siguientes: 18.71, 21.41, 20.72,


21.81, 19.29, 22.43, 20.17, 23.71, 19.44, 20.50, 22.85, 19.25,
21.77, 22.11, 19.77, 18.04, 21.12, 18.92, 20.33, 23.00

Los datos organizados de menor a mayor son 18.04, 18.71, 18.92,


19.25, 19.29, 19.44, 19.77, 20.17, 20.33, 20.5, 20.72, 21.12, 21.41,
21.77, 21.81, 22.11, 22.43, 22.85, 23, 23.71
Medidas de tendencia central
Medidas de localización

El primer cuartil se busca en la posición 0.25(20) = 5 y como el


conjunto de datos es par, el cuartil 1 resulta del promedio de los
datos ordenados 5 y 6, es decir Q1 = (19.29 + 19.44)/2 = 19.365.

El segundo cuartil (mediana) se busca en la posición 0.5(20) = 10 y


como el conjunto de datos es par, el cuartil 2 resulta del promedio
de los datos ordenados 10 y 11, es decir
Q2 = med(x) = (20.5 + 20.72)/2 = 20.61.

El tercel cuartil se busca en la posición 0.75(20) = 15 y como el


conjunto de datos es par, el cuartil 3 resulta del promedio de los
datos ordenados 15 y 16, es decir Q3 = (21.81 + 22.11)/2 = 21.96.
Medidas de tendencia central
Medidas de localización
Ejemplo
Los siguientes son datos históricos de los sueldos diarios del
personal (dólares por persona) en 30 ocinas seleccionadas al azar
cierta región.
3.79 2.99 2.77 2.91 3.10 1.84 2.52 3.22
2.45 2.14 2.67 2.52 2.71 2.75 3.57 3.85
3.36 2.05 2.89 2.83 3.13 2.44 2.10 3.71
3.14 3.54 2.37 2.68 3.51 3.37

Los datos ordenados son:


1.84 2.05 2.1 2.14 2.37 2.44 2.45 2.52 2.52
2.67 2.68 2.71 2.75 2.77 2.83 2.89 2.91 2.99
3.1 3.13 3.14 3.22 3.36 3.37 3.51 3.54 3.57
3.71 3.79 3.85
Medidas de tendencia central
Medidas de localización

El primer cuartil se busca en la posición 0.25(30) = 7.5 y como el


conjunto de datos es par, el cuartil 1 resulta del promedio de los
datos ordenados 7 y 8, es decir Q1 = (2.45 + 2.52)/2 = 2.485.

El segundo cuartil (mediana) se busca en la posición 0.5(30) = 15 y


como el conjunto de datos es par, el cuartil 2 resulta del promedio
de los datos ordenados 15 y 16, es decir
Q2 = med(x) = (2.83 + 2.89)/2 = 2.86.

El tercel cuartil se busca en la posición 0.75(30) = 22.5 y como el


conjunto de datos es par, el cuartil 3 resulta del promedio de los
datos ordenados 22 y 23, es decir Q3 = (3.22 + 3.36)/2 = 3.29.
Medidas de tendencia central
Medidas de localización
Percentiles

Son valores que segmentan al conjunto de datos en 100 partes


iguales. El k−ésimo percentil, Pk es un valor que deja el k % de los
datos por debajo de él. De modo que además, deja el (100-k) % de
los datos por encima de él.

Los casos particulares mas conocidos son: P25 es el primer cuartil,


P50 es el segundo cuartil que es la mediana y P75 es el tercer cuartil.
Medidas de tendencia central
Medidas de localización
Percentiles

Para determinar el percentil k-ésimo de un conjunto de datos:

Se ordenan los datos de menor a mayor.

Encontrar la posición deseada con la fórmula (kn)/100 y si el


número de datos es un número impar se toma el dato en esa
posición (como puede dar no entero, se toma la parte entera
para denir la posición).

Si la cantidad de datos es par, se promedian los datos en las


posiciones (kn)/100 y (kn)/100 + 1 (si el valor no da entero,
se promedian las posiciones por debajo y por encima del valor).
Medidas de tendencia central
Medidas de localización
Ejemplo

Los valores de incremento de precios en 2005 de los 24 países de la


Organización para la Cooperación y el Desarrollo Económicos
(OCDE) fueron:
2.2 7.6 2.9 4.6 4.1 3.9 7.4 5.3 20.1 2.3
3.2 5.1 5.5 32.7 9.1 1.7 3.2 5.8 16.3 40.5
15.9 5.9 6.7 3.4

Determinar los cuartiles y los percentiles 12 y 88.


Medidas de tendencia central
Medidas de localización
El listado de datos ordenados es la siguiente: 1.7, 2.2, 2.3, 2.9,
3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6,
9.1, 15.9, 16.3, 20.1, 32.7, 40.5.

El percentil 12 se buscaa en la posición 12(24)/100 = 2.88.


Como el número de observaciones es par y el número obtenido
de la posición no es entero, se obtiene el promedio de los datos
en las posiciones 2 y 3:
x(2) + x(3) 2.2 + 2.3
P12 = = = 2.25
2 2

El percentil 88 se busca en la posición 88(24)/100 = 21.12.


Como el número de observaciones es par y el número obtenido
de la posición no es entero,se promedian los datos en las
posiciones 21 y 22:
x(21) + x(22) 16.3 + 20.1
P88 = = = 18.2
2 2
Medidas de tendencia central
Medidas de localización
Ejemplo

Los siguientes datos corresponden a mediciones acerca de la


resistencia (en kiloNewtons) de tubos circulares con tapones
soldados en sus extremos: 96,96,102,102,102,104,104,108,126,126,
128,128,140,156,160.

El percentil 40 se busca en la posición 40(15)/100 = 6. Luego

P40 = 104

. El percentil 80 se busca en la posición 80(15)/100 = 12. Luego

P80 = 128

S-ar putea să vă placă și