Sunteți pe pagina 1din 20

Materia: Probabilidad y estadstica

Unidad I: Estadstica descriptiva


Trabajo: Investigacin de las medidas de posicin (deciles y percentiles).
Fecha de entrega: 02 de marzo del 2016

ndice
Introduccin. Pg. 1
Medidas
de
posicin Pg. 2
..
Medidas de posicin para datos no agrupados
Deciles.
Percentiles..
Medidas de posicin para datos agrupados
Deciles..

Pg. 2
Pg. 4
Pg. 8

Percentiles... Pg. 12
Conclusin.. Pg. 17
Referencias bibliogrficas Pg. 17

Introduccin
Las medidas de posicin juegan un papel muy importante en el rea de la estadstica,
ya que indican el lugar o como su nombre lo indica es la posicin que ocupa un
determinado dato en un conjunto ordenado de datos y por lo tanto estas medidas
permiten analizar a profundidad el comportamiento de los mismos de una forma ms
precisa ya que desglosa la unidad en partes para su debido anlisis.
Existen tres medidas de posicin ms usadas para el estudio de los datos en
estadstica que abarcan los datos agrupados y los no agrupados, los cuales llevan el
nombre de cuartiles, deciles y percentiles; estas medidas presentan frmulas para
obtener los datos los cuales son casi similares entre unas a otras pero en este caso
solo abordaremos a los deciles y percentiles propiamente, la primera suele dividir sus
datos en diez partes mientras que la segunda lo hace en cien partes de las que cada
una presenta un determinado porcentaje del total de elementos que se deseen estudiar.
Ciertas medidas tienen prioridades especficas o mejor dicho, para el clculo de los
mismos se estandarizan una metodologa cuyos pasos indican propiedades esenciales
para la obtencin de los resultados, cabe mencionar que el tamao de los pedazos con
los que se est trabajando influye para determinar la posicin del decil o percentil que
se quiera obtener. Cuando se trabaja con datos agrupados la naturaleza del clculo
cambia considerablemente ya que el procedimiento es otro, en esta parte los datos se
clasifican en clases para determinar la posicin del mismo y poder trabajarlos en dicha
modalidad.

Medidas de posicin
Las medidas de tendencia central son en realidad, un caso particular de un tipo de
medidas ms amplias, llamadas de posicin.
Estas medidas de posicin, tienen tambin la propiedad de ubicarse entre los dos
extremos de variacin de los datos, pero ya no necesariamente hacia el centro del
intervalo como las de tendencia central. Se utilizan principalmente para indicar la
posicin relativa de un dato dentro del conjunto.
As por ejemplo, si alguien nos informa que en la prueba de admisin a una
Universidad, un determinado alumno obtuvo 453 puntos; esta informacin es
insuficiente, si no conocemos la escala utilizada, y las calificaciones obtenidas por los
dems alumnos.
En un caso como el anterior, una informacin mucho ms precisa, sera que nos
informaran que este alumno ocup el tercer lugar dentro de dos mil aspirantes, pues de
esta manera, tendramos la posicin relativa el alumno dentro del grupo, y sabramos
que la calificacin obtenida por l, es significativamente alta en comparacin con la del
resto de los aspirantes.
Las medidas a estudiar en este captulo, buscan justamente este objetivo, de medir o
indicar la posicin relativa de un dato dentro del conjunto.

Medidas de posicin para datos no agrupados


Deciles
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez
partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los
deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, y as
sucesivamente. D5 corresponde a la mediana.
Para calcular la posicin de los deciles se utiliza la siguiente frmula:

k(n 1)
10

Donde:
k = corresponde a la posicin del decil que se desee hallar.
n= Es el total de datos que se sta estudiando.
Si al momento de hacer los clculos para hallar la posicin del decil para cualquiera de
los casos y el resultado tiene punto decimal como 3.6 se realiza lo siguiente; se toman
en cuenta los datos que se encuentren en la posicin 3 y 4 de la serie ordenada,
posteriormente se halla la diferencia entre ambos datos, el valor de la diferencia se
multiplica por el punto decimal excedente del resultado de la frmula, es decir, de 3.6 el
excedente es 0.6 y por ltimo el resultado de la multiplicacin se le suma a la posicin
del entero, es decir, cuyo dato ocupa la posicin 3 en este caso y este ser el valor del
decil.
Para comprender ms la explicacin anterior veamos el siguiente ejemplo.

Ejemplo:
Los datos que se relacionan a continuacin son un grupo de presiones arteriales
sistlicas medidas en mm de Hg correspondientes a un grupo de pacientes:

120, 160, 150, 110, 170, 130, 125, 140, 125, 145

Paso 1. Ordenamos los datos de menor a mayor:


x1 = 110, x2= 1 20, x3 = 125, x4 = 125, x5 = 130, x6 = 140, x7 = 145,
x8 = 150, x9 = 160, x10 = 170

Paso 2: Calculemos el decil 2 del conjunto de datos.

k(n 1) 2(11)

2.2
10
10

Paso 3: Como este nmero es decimal, se consideran las observaciones de las


posiciones 2 y 3, es decir: x2 = 120 y x3 = 125 Realizamos la diferencia: 125-120=5
Este resultado lo multiplicamos por la parte decimal 0.2, as: (0.2) (5)=1 Finalmente,
este resultado se lo agregamos a la observacin de la posicin 2: 120+1=121 Es
decir: D2 = 121

Esto es, de los 10 pacientes el 20% de ellos tiene presiones arteriales sistlicas
menores a 121 medidas en mm de Hg.

Percentiles
Dado un conjunto de datos, se define como percentil p, a aquel valor Pp, que supera
al p% de los datos a lo ms, y simultneamente es superado por el (100 - p) % de los
datos a lo ms.

En esta definicin, el trmino a lo ms, es muy importante, pues significa que como
mximo el p% de los datos son estrictamente menores que el percentil Pp, y que como
mximo el (100 - p) % son estrictamente mayores que l. As por ejemplo, si en un
grupo de personas el percentil 70 de las estaturas es de 1.73 metros; esto significa que
a lo sumo el 70% de las personas es ms baja que 1,73, y que a lo sumo el 30%, es
ms alta que 1.73.

Clculo de percentiles para datos no agrupados


Supongamos que tener un conjunto de datos sin agrupar {X 1, X2, X3,......, Xn}. Para
calcular Pp, es necesario seguir los siguientes pasos:
1) Ordenarlos de menor a mayor. Los datos ordenados se designaran por {X (1), X (2),
X (3),......, X (n)}.
2) Calcular el p % de n. Al hacer este clculo, puede ocurrir que resulte o no un
nmero entero.
3) Si el p% de n, no resulta entero entonces Pp es nico, y es el valor que ocupa la
posicin entera siguiente dentro del conjunto de datos ordenados de menor a
mayor.

Es decir, si:

np
N
100

En la notacin anterior

np
100

P x
p

, entonces:

np

100

significa parte entera de

np
100

En caso de que el p% de n resulte entero, se toma como Pp, al punto medio entre el

dato que ocupe la posicin

Es decir, si

np
N
100

np
100

, y el siguiente.

, entonces:

np

100

np
1
100

La justificacin de este procedimiento ser considerada a continuacin, mediante la


aplicacin de la definicin de percentil, en los ejemplos siguientes:
Ejemplo 1:
Al medir las estaturas de 9 personas, se encuentran los siguientes resultados: 1.83,
1.72, 1.76, 1.62, 1.56, 1.78, 1.60, 1.66 y 1.58. Encuentre el percentil 30.
Solucin: Se ordenan de menor a mayor:
1.56, 1.58, 1.60, 1.62, 1.66, 1.72, 1.76, 1.78, 1.83.
A continuacin se calcula el 30 % de 9, que resulta ser 2.70. Como 2.70 no es entero,
entonces el percentil 30 es el valor que ocupa la posicin entera siguiente, es decir, la
tercera que corresponde al valor 1.60.
En conclusin P30 = 1.60.
Este valor 1.60 es el nico que cumple con la definicin de percentil 30, pues supera a
2 valores de 9 que es menos del 30%, y es superado 6 valores de 9, que es menos del
70%.
Cualquier otro valor diferente de 1.60, perteneciente o no al conjunto de datos,
sobrepasa el 30% por debajo, o el 70% por encima.
Ya se explic, en la Seccin V.4, que el valor de una medida de tendencia central, como
por ejemplo, la media o la mediana, no tiene necesariamente que pertenecer al
conjunto de datos.
Esta misma explicacin, es vlida para las medidas de posicin; y as por ejemplo, 1.59
no pertenece al conjunto de datos, pero pudiera ser percentil.
En este caso 1.59 no cumple los requisitos para ser percentil 30, pues es superado por
7 datos de 9, que representan ms del 70%.
Un valor mayor que 1.60 tampoco pudiera ser percentil 30, pues superara a 3 datos de
9, que constituyen ms del 30%. Por las consideraciones anteriores, el nico en cumplir
con la definicin es 1.60.

Ejemplo 2:
Al tomar a 20 alumnos un examen de Matemticas, las calificaciones fueron: 54, 21, 34,
78, 93, 45, 66, 38, 50, 87, 63, 88, 31, 62, 96, 80, 71, 59, 35 y 42 . Halle el percentil 60
de las calificaciones obtenidas.
Solucin:
Se comienza ordenndolas de menor a mayor.
21, 31, 34, 35, 38, 42, 45, 50, 54, 59, 62, 63, 66, 71, 78, 80, 87, 88, 93, 96. En este
paso, de existir valores repetidos, hay que colocar cada uno tantas veces como se
repita.
Como se est buscando el percentil 60, se calcula el 60% de 20, que resulta ser un
nmero entero 12.
En este caso, existen infinitos percentiles 60, que son todos aquellos valores
comprendidos entre el que ocupa la posicin 12 y el que ocupa la posicin 13, ambos
inclusive, es decir, todos los valores comprendidos en el intervalo cerrado [63, 66].
En efecto, el valor 63 es un percentil 60, pues supera a 11 datos de 20 que representan
el 55% de los datos (no sobrepasa el 60%), y es superado por 8 datos de 20 que
representan exactamente el 40%.
El valor 66, tambin es percentil 60, pues supera a 12 datos de 20, que equivalen al
60% (no lo sobrepasa), y es superado por 7 datos de 20 que constituyen el 35% (no
sobrepasa el 40%).
Cualquier valor comprendido entre 63 y 66, aunque no pertenezca al conjunto de datos,
tambin cumple con la definicin, pues por ejemplo, 64 supera a 12 datos de 20 (60%),
y es superado por 8 datos de 20 (40%).
Por este motivo, al existir infinitos percentiles 60, se toma como representante de todos

60

ellos, al punto medio del intervalo, y por tanto:

63 66
64.50
2

Algunos autores, recomiendan en este caso, tomar como percentil, a aquel valor que
divide al intervalo, en la misma razn que lo hace el percentil con los datos, y as por
ejemplo, en un caso como el anterior, se tomara como percentil 60, a aquel valor que
divide al intervalo [63, 66], en la razn 60:40, y por lo tanto, bajo este criterio:

60

63

60
(66 63) 64.80
100

A pesar de que este ltimo criterio es ms lgico, el criterio de tomar el punto medio es
el ms difundido, y es que generalmente se utiliza para dar el percentil en caso de que
el p% de n resulte entero, y existan infinitos percentiles.

Ejemplo 3:
El peso en kilogramos , de un grupo de 15 personas es el siguiente : 75, 56, 66, 75, 61,
66, 78, 83, 60, 66, 56, 60, 9, 56 y 70.
Hallar el percentil 25 y el percentil 80 de los datos.
Solucin:
Al ordenar de menor a mayor, hay algunos valores que se repiten. Estos se colocan
tantas veces como se repitan.
56, 56, 56, 60, 60, 61, 66, 66, 66, 70, 75, 75, 78, 83, 91.
Para hallar P25, se calcula el 25 % de 15, que es 3.75. Como este valor no es entero,
entonces P25, es el que ocupe la cuarta posicin

P25=60.

Para hallar P80, se calcula el 80 % de 15, que es 12. Como este valor es entero,
entonces P80, es la media entre los que ocupen la dcima segunda y la dcima tercera

posicin

80

75 78
76.50.
2
8

Se deja al lector la verificacin de que estos valores cumplen con las definiciones
correspondientes.

Medidas de posicin para datos agrupados


Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.

Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra

k(N)
10

, k= 1, 2,.9, en la tabla

de las frecuencias acumuladas.


Frmula:

D L
k

k.N

Fi1

10

(ai)

k=1,2,9

Li = Es el lmite inferior de la clase donde se encuentra la mediana.


N = Es la suma de las frecuencias absolutas.
Fi-1= Es la frecuencia acumulada anterior a la clase mediana.
fi = Frecuencia
ai = Es la amplitud de la clase.
Ejemplo:
fi

Fi
9

[50, 60)
[60, 70)
[70, 80)
[80, 90)
[90,100)
[100,110)
[110, 120)

8
10
16
14
10
5
2
65

8
18
34
48
58
63
65

Datos:

Amplitud de la clase

Ls Li
x

x x

Lo anterior explica que al restar el lmite superior con el lmite inferior o viceversa de
una clase, la diferencia ser siempre positiva aunque de un valor negativo.
ai = 50-60= -10=10
Clculo del primer decil
k(N)
10

65(1)
6.5
10

D L
k

D 50
1

k.N

Fi1

10

(ai)

(6.5 0)
(10) 58.12
8

Clculo del segundo decil


65(2)
13
10

10

60

(13 8)
(10) 65
10

Clculo del tercer decil


65(3)
19.5
10

70

(19.5 18)
(10) 70.94
16

Clculo del cuarto decil


65(4)
26
10

70

(26 18)
(10) 75
16

Clculo del quinto decil


65(5)
32.5
10

70

(32.5 18)
(10) 79.06
16

Clculo de sexto decil


65(6)
39
10

80

(39 34)
(10) 83.57
14

Clculo de sptimo decil

11

65(7)
45.5
10

80

(45.5 34)
(10) 88.21
14

Clculo del octavo decil


65(8)
52
10

90

(52 48)
(10) 94
10

Clculo del noveno decil


65(9)
58.5
10

100

(58.5 58)
(10) 101
5

Percentiles
Cuando los datos estn agrupados en una tabla de frecuencias, la determinacin del
percentil Pp, se puede hacer grficamente, entrando el eje vertical de la Ojiva de
frecuencias relativas porcentuales acumuladas con el p%, y leyendo en el eje
horizontal el valor correspondiente a Pp, tal como se muestra en la figura:

12

El valor as determinado, es obviamente el percentil P p, pues supera exactamente al p%


de los valores, y es superado por el (100 - p) % restante. Para determinar
analticamente al percentil Pp, se sigue un procedimiento de interpolacin anlogo al ya
visto para determinar la mediana, que consiste en plantear una semejanza de tringulos
dentro del intervalo que contiene al percentil buscado P p, y que da por resultado la
siguiente expresin:

P L
p

i1

p% Hi1%
(c)
hi %

Donde:
Li-1 = Lmite real inferior del intervalo donde cae el percentil.
Hi-1 = Frecuencia relativa porcentual acumulada hasta el intervalo anterior.
hi = Frecuencia relativa del intervalo donde cae el percentil.
C = Ancho de clase.
El intervalo donde cae el percentil, es aquel en donde la frecuencia relativa porcentual
acumulada alcanza el p%.
Si se multiplica numerador y denominador por n, se obtiene una frmula ms cmoda
para calcular el percentil Pp, en funcin de las frecuencias absolutas:

P L
p

i1

np
Fi1
100

(c)

Donde:
Li-1 = Lmite real inferior del intervalo donde cae el percentil.
13

Fi-1 = Frecuencia absoluta acumulada hasta el intervalo anterior.


fi

= Frecuencia absoluta del intervalo donde cae el percentil.

= Ancho de clase.

En el caso de intervalos con diferente amplitud, la interpolacin dentro de la Ojiva es


igual que cuando se tienen intervalos con igual amplitud; slo que ahora, la frmula se
modifica pues en lugar de c, se tiene ci, que corresponde a la amplitud del intervalo
donde cae el percentil buscado.
np

100 Fi1 ( )

ci
Pp Li1

Para intervalos con diferente amplitud:

Tanto en el caso de intervalos con igual amplitud, como en el de diferente amplitud, al


hacer la interpolacin se ha supuesto que los datos se distribuyen de manera uniforme
dentro de cada intervalo, y que en consecuencia, el crecimiento de la Ojiva es lineal,
lo cual es obviamente una aproximacin.
Ejemplo 4:
Determinar el percentil 40 y el percentil 75, en la siguiente distribucin de frecuencias:
Clase
Frecuenci
a

10-19

20-29

30-39

40-49

50-59

60-69

70-79

12

26

25

65

40

28

Solucin:
Se construye la tabla de frecuencias acumuladas, con sus respectivos lmites reales.
Lmites
reales

19.50

29.50

39.50

49.50

59.50

69.50

79.50
14

Frecuenci
a

12

38

93

154

194

222

226

acumulada
Existen 226 datos y se quiere encontrar el Percentil 40; por tanto, hay que calcular el
40% de 226, que resulta ser 90.40.
El intervalo donde cae P40 es el tercero, pues en l en donde se alcanza esta frecuencia
acumulada. Este intervalo comienza con una frecuencia acumulada de 38, y termina
con una de 93.

P L
p

i1

np
Fi1
100

(c)

226x40
38
100
(10) 39.03
P40 29.50
55

El resultado anterior significa que en el conjunto de datos, el 40% de ellos es menor que
el valor 39.03, y el 60% restante mayor que 39.03.
Para hallar el percentil 75, se procede de manera anloga, y se encuentra que ste se
encuentra en el 5 intervalo, pues comienza con una frecuencia acumulada de 154 y
termina con una de 194. El 75% de 226, que es 169.50 se ubica entre los lmites de
frecuencia acumulada de este intervalo.
226 x75
154
100
(10) 53.38
P75 49.50
40
Ejemplo 5:
La siguiente tabla muestra la antigedad en aos, del personal dentro de una empresa.
Aos
frecuenci

0a1
850

1a3
380

3a5
210

5a8
110

8 a 15
100

15 a 20
80

20 a 30
90

a
Al firmar el contrato colectivo, se conviene en darle un bono por antigedad equivalente
al 80% de su sueldo, a los empleados que estn en el grupo 10% ms antiguo, al 50%
de su sueldo, al grupo que est en el siguiente 30% ms antiguo, y al 30% de sueldo, al
15

grupo del 40% siguiente en antigedad.


Encontrar la antigedad que debe tener el empleado, para recibir cada uno de estos
bonos.
Solucin:
Los empleados que reciben un bono equivalente al 80% de su sueldo son los que estn
del Percentil 90 hacia arriba, pues ellos representan el 10% ms antiguo.
Los que reciben un bono equivalente al 50% de su sueldo, son los que estn entre el
Percentil 60 y el Percentil 90 en antigedad, pues ellos representan el 30% siguiente
en antigedad.
Por ltimo, los que reciben un bono equivalente al 30% de su sueldo, son aquellos que
tienen una antigedad comprendida entre el Percentil 20 y el Percentil 60, pues este
grupo representa el 40% siguiente en antigedad.
Los que se encuentren por debajo del Percentil 20 son los empleados con menor
antigedad, no reciben este bono, y representan el 20% del personal. Para calcular
estos percentiles, se elabora la tabla de frecuencias absolutas acumuladas.
Antigeda

Menor

Menor

Menor

Menor

Menor

Menor

Menor

que 1

que 3

que 5

que 8

que

que

que

Frecuencia

850

1230

1440

1550

15
1650

20
1730

30
1760

Como en total hay 1760 empleados, el percentil 20 se ubica en el primer intervalo, pues
el 20% de 1760 es 352.
np
1760x20
Fi1
0
100
100
(ci) P20 0
(1) 0.41 aos 151 das
Pp Li1
850
fi

P60 cae en el segundo intervalo, pues el 60% de 1760 es 1056; mientras que el P 90 cae
en el quinto intervalo, pues el 90% de 1760 es 1584.
Haciendo los clculos se tiene:

16

1760X60
850
100

(2) 2.08 aos 2 aos y un mes


P60
380
1760X90
1550
100

(7) 10.38 aos 10 aos y 5 meses


P90
100
La conclusin es entonces, que los empleados con una antigedad menor 151 das 5
meses, no reciben bono, los de antigedad comprendida entre 5 meses y 2 aos con un
mes reciben un bono equivalente al 30% de sueldo, los de antigedad comprendida
entre 2 aos con un mes y 10 aos con cinco meses, un bono del 50% de su sueldo, y
los de antigedad 10 aos con cinco meses o ms, un bono del 80% de su sueldo.

Conclusin:
17

Las medidas de posicin son herramientas fundamentales en la estadstica sobre todo


cuando se realiza un estudio del mismo, as hemos abordado dos medidas en este caso
las cuales son los deciles y percentiles para datos agrupados y no agrupados que nos
permitieron estudiar de forma ms clara y en especfico un conjunto de datos hablando
en trminos numricos propiamente.
Las medidas de tendencia central muestran una informacin bsica del contenido de los
datos, en cambio las medidas de posicin nos permiten ver ms all de la informacin
bsica estas medidas nos brindan una visin ms detallada y con precisin podemos
interpretar los datos con respecto al problema o la situacin que se sta estudiando,
cabe mencionar que son clculos no muy complejos pero si suelen ser bastante
laborioso y muy vulnerables ya que la forma en que se manipulen los datos influye en el
resultado final que se quiera obtener.

Referencias bibliogrficas.
Documentos en lnea.
ngel Francisco Arvelo Lujn, A. A. (2006). Medidas de posicin. Extrado el 19 de
febrero de 2016 desde www.arvelo.com.ve.
Esmeralda Ballesteros Doncel, A. A. (junio de 2012). Cuaderno didctico. Extrado el 19
de febrero de 2016 desde www.cuariles/deciles/percentiles.com/pdf.

18

S-ar putea să vă placă și