Documente Academic
Documente Profesional
Documente Cultură
= I
-1
+ C
Paso 7: Calcular los lmites superiores restando una unidad de precisin al lmite inferior de la clase
siguiente: S
= I
+1
u, o sumando la amplitud al lmite superior anterior: S
= S
-1
+ C
Paso 8: Contar el nmero de observaciones en los datos que pertenecen a cada intervalo de clase, para
obtener la frecuencia absoluta (n
n
=1
n
Si se tiene todos los valores de una poblacin, el promedio de la poblacin es la suma de todos los
valores dividida por cuntos son.
El promedio de la poblacin se denota por la letra Griega (mu): p =
x
i
N
i=1
N
Ejemplo 1: Nmero promedio de acciones con variacin. Los datos siguientes son el nmero acciones
con variacin positiva en una muestra aleatoria de 10 das:
2, 3, 0, 2, 1, 0, 3, 0, 1, 4
13
El promedio de estas 10 observaciones es:
Supongamos que una observacin en el ltimo da se anot como 40 en vez de 4. Qu le pasar al
promedio?
Notar que 9 de las 10 observaciones son menores que el promedio. El promedio es sensible a
las observaciones extremas. La mayora de los mtodos grficos nos ayudarn de detectar
observaciones extremas.
Media para datos tabulados: Si los datos estn tabulados en una tabla de distribucin de frecuencias,
entonces la media se debe calcular como:
x =
n
k
=1
n
Siendo x
i
el valor de la variable en el intervalo i-simo si esta es cuantitativa discreta, y resulta ser la
marca de clase si la variable esta tabulada en intervalos.
Ejemplo 2: Calcular el promedio para el ejemplo de las horas trabajadas por semana.
Media Aritmtica Ponderada: En la definicin de media aritmtica, el peso o ponderacin de cada
observacin es la misma (1n), pero hay casos en que esta ponderacin es distinta. En tal caso el
promedio se estima a partir de la siguiente frmula:
x
p
=
w
k
=1
w
k
=1
Ejemplo 3: Un alumno saca un 4,0 - 5,1 - 2,8 en sus pruebas parciales, un 5,9 en controles y un 2,1 en
su examen final. Las notas tienen una ponderacin de 10%, 15%, 30%, 25% y 20% respectivamente.
Cul es la calificacin final del alumno?
Ejemplo 4: Si el examen final de un curso cuenta 3 veces ms que una evaluacin parcial, y un
estudiante tiene calificaciones de 85 en el examen y parciales de 70 y 90, su calificacin media es:
Ejemplo 5: Combinando Promedios el promedio de 3 estudiantes es 5,4 y el promedio de otros 4
estudiantes es 6,7. Cul es el promedio de los 7 estudiantes?
Media geomtrica: La media geomtrica puede utilizarse para mostrar los cambios porcentuales en una
serie de nmeros positivos. Como tal, tiene una amplia aplicacin en los negocios y en la economa,
debido a que con frecuencia se est interesado en establecer el cambio porcentual en las ventas, en el
producto nacional bruto o en cualquier serie econmica. La media geomtrica proporciona una medida
precisa de un cambio porcentual promedio en una serie de nmeros.
La media geomtrica (MG) se halla tomando la raz ensima del producto de n nmeros. As,
H0 = x
1
x
2
x
n
n
14
La media geomtrica se utiliza con ms frecuencia para calcular la tasa de crecimiento porcentual
promedio de algunas series dadas, a travs del tiempo.
Ejemplo 6: El director ejecutivo de White Airlines desea determinar la tasa de crecimiento promedio en
los ingresos con base en las cifras dadas en la tabla. Si la tasa de crecimiento promedio es menor que el
promedio industrial del 10%, se asumir una nueva campaa publicitaria.
Ao Ingreso (US$)
2006 55.000
2007 55.000
2008 66.000
2009 60.000
2010 78.000
Observaciones:
Un promedio NO es siempre representativo
El promedio tambin se define como el punto de equilibrio, el
punto donde distribucin se balancea.
Si la distribucin es simtrica, el promedio ser exactamente el
centro de la distribucin.
Si la observacin ms grande se mueve a la derecha, el promedio
se mueve con la observacin extrema
Si la distribucin es sesgada, vamos a querer usar
una medida que sea ms resistentepara mostrar el
centro. La medida de tendencia central que es ms
resistente a los valores extremos es la mediana.
Mean =2
1 2 3
Mean =2.5
1 2 5
Mean =4
1 2 11
15
Mediana
Definicin:
La mediana de un conjunto de n observaciones, ordenadas de menor a mayor, es un valor tal que la
mitad de las observaciones son menores o iguales que tal valor y la mitad de las observaciones son
mayores o iguales que ese valor.
Pasos para encontrar la mediana de datos NO agrupados:
1. Ordenar los datos de menor a mayor;
2. Calcular la posicin de la mediana: (n+1)/2, donde n es el nmero de observaciones
3. a) Si el nmero de observaciones es impar, la mediana es la observacin del medio.
b) Si el nmero de observaciones es par, la mediana es el promedio de las dos observaciones del
medio.
Ejemplo 7:
a) El conjunto de nmeros 3, 4, 4, 5, 6, 8, 8, 8, 10 tiene mediana
b) El conjunto de nmeros 5, 5, 7, 9, 11, 12, 15, 18 tiene mediana
Ejemplo 8: El nmero de ventas en una confitera en 20 das son:
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51
Ejemplo 9: Encuentre la mediana del nmero de cuotas impagas en la muestra de 10 clientes de una
tienda de retail.
Cliente 1 2 3 4 5 6 7 8 9 10
Nmero de cuentas impagas 2 3 0 1 4 0 3 0 1 2
a) Ordenar las observaciones de menor a mayor
b) Calcular (n+1)/2
c) Obtener la Mediana
d) Qu le pasa a la mediana si la quinta observacin en la lista se anota incorrectamente como 40 en
vez de 4?
e) Qu le pasa a la mediana si la tercera observacin en la lista se anota incorrectamente como 20 en
vez de 0?
Nota: La mediana es resistente (robusta), es decir, no cambia o cambia muy poco con
observaciones extremas.
Mediana para datos agrupados: la mediana obtenida por interpolacin viene dada por la siguiente
expresin: Primero se debe hallar la clase mediana de la distribucin de frecuencias; La clase mediana
es la clase cuya frecuencia acumulada es mayor o igual que
n
2
, entonces:
16
Hc = I
md
+_
n
2
N
n
md
_ C
Donde:
I
md
= Lmite inferior de la clase del intervalo mediano.
n = nmero de datos (frecuencia total)
N
b
+
u
_ C
Donde:
I
mo
= Lmite inferior de la clase modal.
u
= es la diferencia entre la frecuencia de la clase modal y la clase que antecede
b
= es la diferencia entre la frecuencia de la clase modal y la clase que sigue
C = amplitud de clase del intervalo modal
17
Ejemplo 13: Calcular el promedio, la mediana y la moda de los datos de la tabla de frecuencia de
pasajeros para New Airlines.
Clases n
i
50 59 3
60 69 7
70 79 18
80 89 12
90 99 8
100-109 2
Observaciones sobre la Media, Mediana y Moda
Si la distribucin de frecuencias de la variable es simtrica estas tres medidas coinciden.
Ejemplo 14: La siguiente tabla muestra la distribucin de frecuencia de los sueldos (en miles de pesos)
que reciben 150 empleados en una empresa.
Clases n
i
120 160 20
160 200 30
200 240 50
240 280 30
280 320 20
Calcule el promedio, la mediana y la moda de los sueldos de los trabajadores de esta empresa.
Nota: La media es muy influenciable por los valores extremos, por lo cual se recomienda que
cuando una distribucin es demasiado asimtrica se utilice la mediana, como medida de
tendencia central.
Diferentes medidas pueden dar diferentes impresiones
El promedio, la mediana y la moda representan tres mtodos diferentes para encontrar EL valor del
centro. Estos tres valores pueden ser un mismo valor pero a menudo son distintos. Cuando son
distintos, pueden servir para diferentes interpretaciones de los datos que queremos resumir.
Ejemplo 15: Considere el ingreso mensual de cinco familias en un barrio:
$120.000 $120.000 $300.000 $900.000 $1.000.000
a) Cul es el ingreso tpico de este grupo?
b) El ingreso mensual promedio es:
c) La mediana del ingreso mensual es:
d) La moda del ingreso mensual es:
e) Si usted est tratando de promover el barrio qu medida usara?
f) Si usted est tratando que bajen las contribuciones qu medida usara?
18
Ejemplo 16: Pensamiento crtico y medidas de tendencia central
Para cada uno de los siguientes ejercicios podemos calcular medidas de tendencia central como la
media y la mediana. Identifique una razn importante por la que, en estos casos, la media y la mediana
no son estadsticos que puedan servir de manera precisa y efectiva como medidas de tendencia central.
Cdigos postales: 12601; 90210; 02116; 76177; 19102
Clasificaciones de los niveles de estrs de distintos empleos: 1; 2; 3; 7; 9
Los sujetos encuestados se codifican de la siguiente manera segn la preferencia de club: 1 ( U.
de Chile), 2 (U. Catlica), 3 (Colo-colo), 4 (Palestino) o 5 (U. Espaola).
Ejemplo 17: Su firma est introduciendo un nuevo chip de computador del cual se promociona que
realiza clculos estadsticos mucho ms rpidamente que los que actualmente se encuentran en el
mercado. Se hacen veinte clculos diferentes, produciendo los tiempos en segundos que se ven ms
adelante. Aunque usted no puede tergiversar su producto, usted desea presentar los resultados de la
manera ms favorable para su empresa. Determine la media, la mediana y la moda. Comente los
beneficios relativos de utilizar cada estadstico.
3,2 4,1 6,3 1,9 0,6
5,4 5,2 3,2 4,9 6,2
1,8 1,7 3,6 1,5 2,6
4,3 6,1 2,4 2,2 3,3
Ejemplo 18: Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos 4 meses. Dadas las ventas que se ven aqu, cul programa
de publicidad parece producir el crecimiento promedio ms alto en ventas mensuales?
Mes Plan 1 Plan 2
Enero 1.657.000 4.735.000
Febrero 1.998.000 5.012.000
Marzo 2.267.000 5.479.000
Abril 3.432.000 5.589.000
Los trminos usados para describir la forma de una distribucin son:
Simtrica: La distribucin puede ser dividida en dos partes alrededor de un valor central y cada
parte es el reflejo de la otra.
Sesgada: Un lado de la distribucin se alarga ms que el otro. La direccin del sesgo es la
direccin del lado ms largo.
Unimodal: La distribucin tiene un nico mximo que muestra el o los valores ms comunes en
los datos.
Bimodal: La distribucin tiene dos mximos. Esto resulta a menudo cuando la muestra proviene
de dos poblaciones.
Uniforme: Los valores posibles tienen la misma frecuencia.
19
Medidas de dispersin (variacin)
Las medidas de posicin por si solas, no son suficientes para describir las distribuciones, ya que ellas
no consideran la variabilidad de estas. Al comparar dos o ms distribuciones puede suceder que estas
tengan el mismo promedio, pero que la dispersin de los valores observados no sea la misma.
Las medidas de tendencia central son tiles pero nos dan una interpretacin parcial de los datos.
Ejemplo19: Analizaremos los tiempos de espera de los clientes en tres bancos diferentes. En el primer
banco, el gerente controla de forma muy cuidadosa los tiempos de espera modificando el nmero de
cajeros segn sea necesario. En el segundo banco, todos los clientes esperan en una sola fila y son
atendidos por los cajeros disponibles. En el tercer banco hay una fila para cada ventanilla. A
continuacin se muestran los tiempos de espera (en minutos) especficos de los clientes,
Construya un grfico para la situacin de cada banco y analice.
Ejemplo 20: Considere los dos siguientes conjuntos de datos, del nmero de unidades producidas por
dos operarios, a Ud. la gerencia le solicitar realizar una recomendacin para un ascenso A quin
recomienda Ud.?
Operario 1: 55, 56, 57, 58, 59, 60, 60, 60, 61, 62, 63, 64, 65
Operario 2: 35, 40, 45, 50, 55, 60, 60, 60, 65, 70, 75, 80, 85
Las medidas de dispersin son las siguientes:
Rango o Amplitud
Si la variable no est tabulada en intervalos el rango se define como la diferencia entre el valor mximo
y el valor mnimo, de los valores observados.
R = x
mux
x
mn
Rango o Amplitud para datos tabulados en intervalos
X
X X X X X X X
X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X
20 21 22 23 24 25 26 27 28 29 30 20 21 22 23 24 25 26 27 28 29 30
Cliente
1 2 3
Banco 1 6 6 6
Banco 2 4 7 7
Banco 3 4 1 13
20
Analice cuales podran ser las ventajas y desventajas del rango como medida de variabilidad.
Si la variable est tabulada en intervalos el rango o amplitud se define de la siguiente forma:
1
I S Rango
k
=
Nota: Aunque el rango es la medida de dispersin ms fcil de calcular, casi nunca se usa como la
nica medida de dispersin. La razn es que se basa slo en dos de las observaciones y, por
consiguiente est muy influido por los valores extremos de los datos.
Varianza (Var(X))
La varianza es una medida de la dispersin que emplea todos los datos. Se basa en la diferencia entre el
valor de cada observacin (x
i
) y la media. La diferencia entre cada x
i
y la media, se llama desviacin
respecto al promedio. Para calcular la varianza, las desviaciones respecto al promedio se elevan al
cuadrado.
Si x
1
, x
2
, . . . , x
2
denota una muestra de n observaciones, la varianza muestral se denota por:
s
2
=
(x
x )
2
n 1
La desviacin estndar muestral, denotada por s , es la raz cuadrada de la varianza: s = s
2
La desviacin estndar poblacional, se denota por la letra Griega (sigma), es la raz cuadrada de la
varianza poblacional y se calcula como:
o =
o
2
=
_
(x
p)
2
N
Sea X una variable cuantitativa y sea x
1
, x
2
,..., x
n
una muestra de tamao n de observaciones de la
variable.
Ejemplo 21: El siguiente conjunto de datos entrega en nmero de ausentes durante 20 das en cierta
empresa, obtenga la varianza:
0, 2, 1, 1, 0, 0, 1, 1, 2, 3, 0, 1, 3, 2, 1, 1, 0, 0, 1, 2
Varianza para datos tabulados: Si los datos estn tabulados, la varianza muestral se define como sigue:
s
2
=
n
(x
x )
2
n 1
Y la varianza poblacional
o
2
=
n
(x
p)
2
N
21
Y para desarrollar de forma ms prctica el clculo se utiliza la expresin, para la varianza muestral:
s
2
=
n
2
n 1
(x )
2
Y la varianza poblacional
o
2
=
n
2
N
(p)
2
Ejemplo 22: Calcular la varianza para los ejercicios anteriores.
Desviacin Estndar
Es una medida de la dispersin de las observaciones a la media. Es un promedio de la distancia de las
observaciones a la media
Ejemplo 23: Recordemos los datos de cuotas impagas en la muestra de 10 clientes de una tienda de
retail:
Cliente 1 2 3 4 5 6 7 8 9 10
Nmero de cuentas impagas 2 3 0 1 4 0 3 0 1 2
La desviacin estndar muestral es entonces:
Interpretacin
Pensemos la desviacin estndar como aproximadamente un promedio de las distancias de las
observaciones a la media.
Si todas las observaciones son iguales, entonces la desviacin estndar es cero.
La desviacin estndar es positiva y mientras ms alejados estn los valores del promedio, mayor ser
la desviacin estndar.
0 1 2 3 4 5 6 7
mean=4
deviation = -4
deviation =1
deviation = 3
22
Notas:
La varianza y la desviacin estndar no son medidas de variabilidad distintas, debido a que la
ltima no puede determinarse a menos que se conozca la primera.
A menudo se prefiere la desviacin estndar en relacin con la varianza, porque se expresa en
las mismas unidades fsicas de las observaciones.
Una aproximacin (referencial) al valor de la desviacin estndar es el Rango dividido en 4.
S
R
4
As como el promedio es una medida de tendencia central que no es resistente a las
observaciones extremas, la desviacin estndar, que usa el promedio en su definicin, tampoco
es una medida de dispersin resistente a valores extremos.
Tenemos argumentos estadsticos para demostrar porque dividimos por n 1 en vez de n en el
denominador de la desviacin estndar muestral.
Coeficiente de Variacin (CV(X)):
En algunos casos nos puede interesar una medida estadstica descriptiva que indique lo grande que es la
desviacin estndar en comparacin con la media. El coeficiente de variacin es una medida relativa de
variabilidad, porque evala la desviacin estndar en relacin con la media, y se calcula como sigue:
C. I. (x) =
s
x
Aplicaciones del Coeficiente de Variacin, comparar la variabilidad de dos distribuciones de una
misma variable con unidades distintas.
Ejemplo 24: En un curso de 20 alumnos se midi la estatura (en cm.) y el peso (en kg.), obtenindose la
siguiente informacin:
Estatura Peso
Promedio 135 24,8
Desviacin
estndar
30 8,3
Qu distribucin tiene mayor variabilidad?, o bien, se puede preguntar: Qu distribucin es ms
heterognea?
Regla Emprica:
Una regla til para interpretar los valores de una desviacin estndar es la regla emprica. Esta regla
establece que las siguientes propiedades se aplican a conjuntos de datos con una distribucin
aproximadamente normal.
23
Entonces, para cualquier distribucin Normal se cumple que:
68,3% de las observaciones se encontrarn a una desviacin estndar de la media
95,4% de las observaciones se encontrarn a dos desviaciones estndar de la media
99,7% de las observaciones se encontrarn a tres desviaciones estndar de la media
Teorema de Chebyshev
Otro indicador es el teorema de Chebyshev que calcula la proporcin (o fraccin) de cualquier conjunto
de datos que est dentro de K desviaciones estndar a partir de la media siempre es al menos 1 1
K
2
, donde K es cualquier nmero positivo mayor que 1.
Para K= 2 y K= 3 tenemos las siguientes aseveraciones, respectivamente:
Al menos 3/4 (o el 75%) de todos los valores estn dentro de 2 desviaciones estndar de la
media.
Al menos 8/9 (o el 89%) de todos los valores estn dentro de 3 desviaciones estndar de la
media.
El teorema de Chebyshev, en vez de limitarse a conjuntos de datos con distribuciones normales, se
aplica a cualquier conjunto de datos, pero sus resultados son muy aproximados. Como los resultados
son lmites inferiores (al menos), este teorema tiene una utilidad limitada.
Ejercicios 2: Conocimientos estadsticos y pensamiento crtico
1. Variacin. Por qu la desviacin estndar se considera una medida de variacin? Describa con
sus propias palabras las caractersticas de un conjunto de datos medido con la desviacin
estndar.
2. Comparacin de la variacin. Cules datos cree usted que tengan mayor variacin: las
puntuaciones de CI de 30 estudiantes de un curso de estadstica o las puntuaciones de CI de 30
individuos que ven una pelcula? Por qu?
3. Valor infrecuente? Un profesor de estadstica aplica un examen que tiene una media de 4,5 y
una desviacin estndar de 0,8. Un estudiante obtiene una calificacin de 6,5 en el examen. En
este contexto, la calificacin de 6,5 es poco comn? Por qu?
4. Enunciado correcto? En el libro How to Lie with Charts, Gerald E. Dones escribe que la
desviacin estndar suele definirse como ms o menos la diferencia entre la puntuacin ms alta
y la media, y la puntuacin ms baja y la media. Por ejemplo, si la media es 1, el valor ms alto
es 3 y el valor ms bajo es 1. La desviacin estndar es 2. Es correcto este enunciado?
Por qu?
24
5. Percepcin del tiempo. Algunos estudiantes de estadstica participaron en un experimento que
intentaba probar su capacidad para determinar el transcurso de 1 minuto (o 60 segundos). A
continuacin se presentan los resultados en segundos. Identifique al menos una buena razn por
la que la desviacin estndar de esta muestra no sera un buen estimado de la desviacin
estndar de la poblacin de adultos.
53 52 75 62 68 58 49 49
6. Giser del Tatio. Abajo se indican los intervalos (en minutos) entre las erupciones del giser del
Tatio en la regin de Antofagasta. Con base en los resultados, es poco comn un intervalo de
100 minutos?
98 92 95 87 96 90 65 92 95 93 98 94
7. Exactitud del pronstico del clima. En un anlisis de la exactitud del pronstico del clima se
comparan las temperaturas mximas reales con las temperaturas mximas pronosticadas un da
anterior y con las temperaturas mximas pronosticadas cinco das antes. Ms abajo se sealan
los errores entre las temperaturas pronosticadas y las temperaturas mximas reales para das
consecutivos en Santiago. La desviacin estndar sugiere que las temperaturas pronosticadas
un da antes son ms exactas que las pronosticadas cinco das antes, como se esperara?
(real) (pronosticada un da antes) 2 2 0 0 -3 -3 1 -2 8 1 0 -1 0 1
(real) (pronosticada cinco das antes) 0 -3 2 5 -6 -9 4 -1 6 -2 -2 -1 6 -4
8. Regla emprica. Las estaturas de un grupo de hombres tienen una distribucin normal, con una
media de 176 cm y una desviacin estndar de 7 cm. Por medio de la regla emprica,
a. cul es el porcentaje aproximado de hombres entre 169 cm y 183 cm?
b. cul es el porcentaje aproximado de hombres entre 155 cm y 197 cm?
25
Medidas de posicin relativa
Aunque la varianza y la desviacin estndar son las medidas de dispersin ms tiles en anlisis
estadstico, existen otras tcnicas con las cuales puede medirse la dispersin de un conjunto de datos.
Estas medidas adicionales de dispersin o posicin relativa son los cuartiles, los deciles y los
percentiles.
Definicin: Las medidas de posicin relativa son medidas que describen la posicin que tiene un
valor especfico en relacin con el resto de los datos.
Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El primer cuartil es
ese valor debajo del cual clasifica el 25% de las observaciones, y sobre el cual puede encontrarse el
75% restante.
El segundo cuartil es justo la mitad. La mitad de las observaciones estn por debajo y la mitad por
encima; en este sentido, es lo mismo que la mediana.
El tercer cuartil es el valor debajo del cual est el 75% de las observaciones y encima del cual puede
encontrarse el 25% restante. La determinacin de cuartiles con frecuencia es de utilidad.
Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los percentiles en 100 partes.
Ejemplo 25: Si su nota estuvo en el percentil 84, entonces el 84% de las notas fueron inferiores a la
suya y el 16% superiores.
Vale la pena destacar que los datos han sido puestos en una serie ordenada. El lugar del P-simo
percentil se halla. Ubicacin del percentil:
I
p
= (n +1)
P
1uu
Donde:
I
p
= lugar del percentil en la serie ordenada de los datos
n = nmero de observaciones
P = Percentil a calcular
Ejemplo 26: Para ilustrar el clculo de percentiles, se asume que se tienen observaciones para el
nmero de acciones correspondientes a 50 acciones transadas en la Bolsa de Valores de Santiago, como
se muestra en la tabla. Se desea calcular el percentil 25, para las acciones; se debe hallar primero su
ubicacin en la serie ordenada.
3 10 19 27 34 38 48 56 67 74
4 12 20 29 34 39 48 59 67 74
7 14 21 31 36 43 52 62 69 76
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80
26
El valor resultante de 12,75 dice que el percentil 25 est ubicado al 75% del trayecto comprendido
entre la doceava observacin, que es 20 y la treceava observacin que es 21. Por lo tanto el Percentil 25
es P2S =
20+21
2
= 2u,S 21, por criterio de aproximacin.
Ejemplo 27: Calcular para el nmero de acciones transadas (tabla anterior): el cuartil 3, el sexto decil y
el percentil 35.
Rango entre cuartiles
Una medida nica de dispersin es el rango o recorrido intercuartlico. El RQ es la diferencia entre
el tercer cuartil y el primer cuartil. La mitad de las observaciones se clasifican dentro de este rango.
Consta del 50% de la mitad de las observaciones y corta el 25% inferior y el 25% superior de los
puntos de datos. Como resultado, el RQ proporciona una medida de dispersin que no est muy
influenciada por unas cuantas observaciones extremas.
Por definicin, la diferencia entre el tercer cuartil y el primer cuartil se llama rango entre cuartiles,
denotado por:
R =
3
1
.
El rango entre cuartiles mide la variabilidad de la mitad central de los datos.
Notas:
Cuando el nmero de observaciones es impar, la observacin del medio es la mediana. Esta
observacin no se incluye luego en los clculos de Q
1
y Q
3
.
Pueden encontrar diferentes frmulas en libros, calculadoras o computadores, pero todas estas
frmulas se basan en el mismo concepto.
Si la distribucin es simtrica, los cuartiles deben estar a la misma distancia de la mediana.
Ejemplo 28: Los datos presentados son el nmero de ventas en una confitera en 20 das son:
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51
Determine el Rango entre cuartiles (RQ) y analice su resultado.
Percentiles para datos agrupados: Corresponden a medidas de orden, que dividen a la muestra en
forma ordenada en grupos de igual tamao. Su frmula para datos tabulados es la siguiente:
Denotemos por P
= I
+_
n i
1uu
N
n
md
_ C
Donde:
I
p
= Lmite inferior de la clase del intervalo que contiene el percentil i
n = nmero de datos (frecuencia total)
N