Documente Academic
Documente Profesional
Documente Cultură
1. Estadígrafos de posición:
Los estadígrafos de posición o de tendencia central son valores que se ubican al centro de
un conjunto de datos ordenados según su magnitud. Existen varios de estos estadígrafos y
se estudiaran de a uno, considerando si los datos se tienen no tabulados o tabulados.
1.1 Media aritmética o promedio:
- datos no tabulados: se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el n° de observaciones.
Su fórmula es la siguiente:
- datos tabulados: se usara los 40 datos de sueldo (tabla 2) en este caso se usa
la siguiente fórmula:
También se llama media ponderada.
Ej. Un inversionista tiene 1.200 acciones cuyo valor promedio es $34 y 800 acciones cuyo
valor promedio es $45. El valor promedio de las 2.000 acciones es:
b) La media de los valores que son multiplicados por una constante es igual a la constante
por la media de los datos.
Ej. 10 sueldos en miles de personas.
Supongamos que se produce un aumento de un 10% a todos los sueldos ¿cómo varia el
promedio?
Otra forma:
1.2. Mediana:
Es otra medida de posición o tendencia central. Se define como aquel valor de la variable
que supera la mitad de las observaciones y a su vez es superado por la otra mitad de ellas.
Por esta razón, se la considera como el valor central, ya que se divide a los datos en 2
grupos (las observaciones deben estar ordenadas de mayor a menor).
- Datos no tabulados: se ordenan las observaciones de menor a mayor y se ubica el valor
central. Si la constante de datos (n) es par, se promedian los 2 valores centrales. En cambio,
si n es impar habrá solo un valor en el centro.
donde
Para encontrar el intervalo donde está “Me”, se debe calcular n/2 y buscar en la columna F i,
el valor que sugiere n/2.
Ej.: tabla 2
- Datos tabulados: en este caso no es fácil visualizar el valor con mayor frecuencia ya que
se encuentra dentro de un intervalo. Para buscar la moda se usa la siguiente fórmula:
Análogamente, los valores que dividen los datos en diez partes iguales se llaman deciles y
se representan por D1, D2, D3,……….D9, mientras que los valores que dividen los datos en
cien partes iguales se llaman percentiles y se representan por P 1, P2,………..P99. El quinto
decil y el quincuagésimo percentil se corresponden con la mediana. Los percentiles P 25 y P75
se corresponden con el primer y tercer cuartil, respectivamente.
La interpretación, por ejemplo del Q 1 es: el valor 4 supera el 25% de los datos y es superado
por el 75% de las observaciones restantes (ordenadas de mayor a menor).
- Datos tabulados: se usa la misma fórmula que se ocupó en la mediana, con una pequeña
modificación.
Primero calculamos
Buscamos en la columna Ni el valor que supere el 10, en este caso es el 3 er intervalo (en ese
intervalo se busca el cuartil 1)
El 25% de las personas de la muestra gana menos de $82.850 y el 75% superior gana más
de $82.850 (ordenados 2 sueldos de >a<).
Usando el mismo ejemplo, calculamos el decil 8.
Rango
El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos
ellos.
Ejemplo: El rango de los números 2, 3, 3, 5, 5, 5, 8, 10,12 es 12 – 2 = 10.
Donde N f j f . Esta forma es útil para datos agrupados donde las diferentes X j
j 1
X j a
u otro promedio en lugar de la media. Una propiedad interesante de la suma j 1 es
que es mínima cuando a es la mediana, es decir, la desviación media respecto de la
mediana es mínima.
Sería más apropiado utilizar el término desviación media absoluta que el de desviación
media.
Rango intercuartil
Al estudiar el rango, vimos que era muy influenciable por los valores extremos; para eliminar
la influencia de los extremos en estadística se suele analizar la situación del intermedio de la
distribución y a esto se refiere el rango intercuartil que es la diferencia entre el tercer cuartil
Q3 y el primero Q1.
………………………(3)
…………………………………………………………………………………..(4)
A pesar de que el rango intercuartil y la desviación cuartil, como medidas de la variabilidad
de las observaciones son mas adecuadas que el rango, presentan varios inconvenientes que
demeritan su uso. Así:
1. No toma en consideración todos los valores de la distribución y puede ocurrir que los
valores inferiores a Q1 o superiores a Q2 estén muy compactos o muy dispersos, y el valor de
Q sería el mismo.
2. No es posible, conociendo solo Q, hacer la ubicación precisa de una observación dentro
de la distribución.
3. Al igual que la mediana, que es el segundo cuartil, no tiene propiedades que les permitan
intervenir en las relaciones matemáticas que utiliza la estadística.
Rango entre percentiles: 10-90 de una serie de datos viene definido por:
Rango percentil 10-90 = P90 - P10…………………………………….(5)
Donde P10 y P90 son los percentiles décimo y nonagésimo de los datos. El rango
1
semipercentilico 10-90, P90 P10 , puede también emplearse aunque su empleo no es
2
corriente.
s X X .................................(7)
N N N
___
Donde x representa las desviaciones de cada uno de los números X j de la media X .
Así, s es la raíz cuadrada del cuadrado medio de las desviaciones a la media, o como a
veces se le llama, raíz del cuadrado medio de las desviaciones.
Si X1, X2, ………XK se presentan con frecuencias f1, f2, ……..fK, respectivamente, la
desviación típica puede escribirse como:
2 2
N
___
___
fj X j X
fX X
fx 2
___
2
s
j 1
X X .................................(6)
N N N
k
N fj f
Donde j 1
. En esta forma se emplea para datos agrupados.
A veces, la desviación típica de los datos de una muestra viene definida con (N-1) en lugar
de N en los denominadores de las expresiones (5) y (6), por que el valor resultante
representa un estimador mejor de la desviación típica de una población de la que se ha
tomado una muestra. Para valores grandes de N ( por ejemplo, N >30), prácticamente no
hay diferencia entre las dos definiciones. También, cuando se necesita un estimador mejor,
puede obtenerse siempre multiplicando la desviación típica calculada con la primera
N
definición por . De aquí que se acostumbra a utilizar la primera definición.
N 1
Varianza
La varianza de un conjunto de datos se define como el cuadrado de la desviación típica y
viene dada, por tanto, por s2 en (5) y (6).
Cuando es necesario distinguir la desviación típica de una población de la desviación típica
de una muestra sacada de esta población, se emplea el símbolo s para la última y para la
primera. Así, s2 y 2 representarían la varianza muestral y la varianza poblacional,
respectivamente.
X a
N
2
j
1. La desviación típica puede definirse como j 1
s
N
Donde a es un promedio que puede ser distinto de la media aritmética. De todas las
___
desviaciones típicas, la mínima es aquella para la que a X .
___
Si la dispersión absoluta es la desviación típica s y el promedio es la media X , la
dispersión relativa se conoce por coeficiente de variación o coeficiente de dispersión dado
por:
s
Coeficiente.de. var iaciòn V ___
X ……………………………………………………(9)
Basado en los cuartiles, adopta la forma del gráfico de abajo. En él se reflejan los cuartiles 1º
y 3º y la mediana, junto a los extremos inferior y superior:
Ejercicios Propuestos
1.) La tabla muestra una distribución de frecuencias de los salarios semanales en dólares de 65
empleados de la Compañía P & R.
Número de
Salarios (dólares) empleados
$ 50,00 - $ 59,99 8
60,00 - 69,99 10
70,00 - 79,99 16
80,00 - 89,99 14
90,00 - 99,99 10
100,00 - 109,99 5
110,00 - 119,99 2
Total 65
Hallar: a) La media, la mediana y la moda, b) Los cuartiles Q 1, Q2, Q3 y c) los deciles D1, D2, D3,……….D5, de
los salarios de los 65 empleados de la compañía P y R., d) El percentil P 82, e) Utilizar la fórmula empírica
para hallar el salario modal de los 65 empleados de la Compañía P y R.
3.) Demostrar que los resultados de los problemas 1 y 2 pueden obtenerse a partir de una ojiva
porcentual.
4.) La tabla muestra una distribución de la carga máxima en toneladas cortas (1 tonelada = 2000 libras)
que soportan ciertos cables producidos por una compañía.
Máximo de carga
(toneladas de Número de
carga) cables
9,3 - 9,7 2
9,8 - 10,2 5
10,3 - 10,7 12
10,8 - 11,2 17
11,3 - 11,7 14
11,8 - 12,2 6
12,3 - 12,7 3
12,8 - 13,2 1
Total 60
Determinar: a) La media de la carga máxima, b) La mediana para las cargas máximas de los cables, c) La
moda de la carga máxima de los cables, d) Hallar los Q 1, Q2, Q3 , e) Hallar los P10, P90, P25, P75 , interpretando
los resultados.
5.) La tabla muestra una distribución de la edad de los cabezas de familia en Estados Unidos, durante el
año 1957.
c) Hallar (1) el segundo decil, (2) el cuarto decil, (3) EL 90ª percentil y (4) el 68ª percentil,
interpretando los resultados.
6.) a) ¿Pueden todos los cuartiles y deciles ser expresados como percentiles?, b) ¿Pueden todos los
cuantiles ser expresados como percentiles?. Explicarlo.
7.) Interpretar los resultados del problema anterior mediante: a) un histograma porcentual, b) un
polígono de frecuencias acumuladas, c) una ojiva porcentual.
8.) Hallar el rango de cada una de las series de números: (a) 12, 6, 7, 3, 15, 10, 18, 5, (b) 9, 3, 8, 8, 9,
8, 9, 18.
9.) Hallar la desviación media de las series de números del problema anterior.
10.) Hallar la desviación media de las alturas de los 100 estudiantes de la Universidad XYZ
11) Hallar el rango semiintercuartilico para la distribución de las alturas de los estudiantes de la
Universidad XYZ.
13) Hallar el rango semiintercuartilico para los salarios de los 65 empleados de la compañía P&R, del
problema 1.
14) Hallar el rango entre percentiles 10-90 de las alturas de los estudiantes de la Universidad XYZ.
15) Hallar la desviación típica de cada una de las dos series de números del problema 9.
17) Hallar la desviación típica de las alturas de los 100 estudiantes de la Universidad XYZ.
18) Aplicar la corrección de Sheppard para determinar la desviación típica de los datos del problema
de los 100 estudiantes de la Universidad XYZ.
19) Aplicar la corrección de Sheppard para determinar la desviación típica de los datos del problema
de los 65 empleados de la Compañía P & R.
20) La tabla muestra el cociente de inteligencia (I.Q) de 480 alumnos de una cierta escuela elemental.
Hallar: (a) la media, (b) la desviación típica, (c) aplicar la corrección de Sheppard.
Problemas Varios
1) Un fabricante de tubos de televisión tiene dos tipos de tubos, A y B. Los tubos tienen unas
___ ___
duraciones medias respectivas de X 1,495 horas y X 1,875 horas, y desviaciones típicas
A B
s A 280 horas y s B 310 horas. ¿Qué tubo tiene la mayor (a) dispersión absoluta, (b)
dispersión relativa.
2) Halla los coeficientes de variación V para los datos del problema 11 y 1 del Ejercitario anterior,
utilizando en ambos las desviaciones típicas corregidas y no corregidas.
3) Dada las siguientes series de números: a) 5, 3, 8, 4, 6, 12, 4, 3, b) 8772, 6453, 10624, 8628, 9434,
6351. Hallar: a) las desviaciones medias, b) las desviaciones típicas, c) las varianzas, d) coeficientes
de variación.
4) La tabla muestra la distribución de los diámetros de las cabezas de remaches fabricados por una
compañía.
Hallar: a) las tres medidas de tendencia central, b) el Q 3, P27, D8, interpretando cada resultado c) la
desviación media, c) la desviación típica, d) la varianza, e) la corrección de shepard, f) verificar si
cumplen las relaciones empíricas en las desviaciones y g) coeficiente de variación.
5) La tabla muestra la distribución de frecuencias por grupo de edades en el periodo del 2002 en el
país
Hallar: a) las tres medidas de tendencia central, b) el Q 2, P35, D9, interpretando cada resultado c) la
desviación media, c) la desviación típica, d) la varianza, e) la corrección de shepard, f) verificar si cumplen
las relaciones empíricas en las desviaciones y g) coeficiente de variación.