Documente Academic
Documente Profesional
Documente Cultură
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Media aritmtica
Media ponderada
Media geomtrica
Media armnica
Mediana
Moda
Se debe tener en cuenta que estas medidas de posicin o medidas de tendencia se usan cuando se estn
observando variables cuantitativas.
De las medidas antes mencionadas, nos centraremos en:
Media Aritmtica
La media aritmtica es lo que viene a la mente de la mayora de las personas cuando se menciona la palabra
"promedio". Es la ms importante de las medidas de tendencia central.
Si los datos pertenecen a una muestra, la media aritmtica se denota con , si los datos son de una
poblacin, se denota con la letra griega (mu) .
El procedimiento para calcular la media aritmtica es el mismo, independientemente si el conjunto de datos se
refiere a las observaciones de una muestra o a todos los valores de una poblacin.
Es la suma de los valores de un conjunto de observaciones dividido por el nmero total de ellos.
=1
; =
=1
Por ejemplo, las notas obtenidas por una clase de 20 alumnos en un examen de Estadstica y ordenadas de
menor a mayor son : 1, 2, 2, 3, 3, 4, 4, 4, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 9.
Su media se calcula as:
=
1+2+2+3+3+4+4+4+5+5+6+6+6+6+7+7+8+8+9+9
20
105
20
= 5,25
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Nota: No debe interpretarse a la media como punto medio de los datos. La media representa el punto de equilibrio de las
observaciones, el cual no tiene que ser igual al punto medio.
Ejemplo: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6. Obtener la nota promedio.
En este caso la media es un buen representante del rendimiento acadmico del alumno.
Ejemplo: Una empresa tiene 5 empleados, sus sueldos en pesos son: 3000, 3000, 3000, 3000, 30000.
Entonces la media es: = 8400.
El dueo de la empresa dira orgulloso El sueldo promedio de los empleados en mi empresa es de $ 8400 al
mes!
Pero claramente, la media no es un buen representante de este conjunto de datos, dado que hay 4
empleados que ganan slo 3000 y slo uno que gana 30000.
En general cuando la muestra tenga valores alejados entre si, la media no ser un buen representante del
conjunto de datos.
Desventaja de la media aritmtica
Puede ser afectada por los valores extremos; por lo que si alguno de los valores es extremadamente grande o
extremadamente pequeo, la media no es el promedio apropiado para representar a esa serie de datos.
Media Ponderada
( )
UNIVERSIDAD DE CONGRESO
Evaluacin
1
2
3
4
Calificacin
89
75
62
52
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Ponderacin
0,10
0,20
0,30
0,40
Obtendr un promedio ponderado de 68,3 puntos. Si en cambio, todas las evaluaciones poseen la misma
importancia, entonces el promedio o media aritmtica sera 69,5 puntos.
=
89 + 75 + 62 + 52
= 69,5
4
( )
Si las clases de la distribucin de frecuencias son intervalos, el agrupamiento hace que se pierda informacin
y por lo tanto, la media resultante es una aproximacin. El uso de los puntos medios de clase (marcas de
clase) los considera como promedios de clase, que representan a la clase respectiva, lo cual no siempre se
cumple. Sin embargo, si no se dispone de datos originales, no existe otra alternativa razonable. Adems la
aproximacin de esta frmula a la verdadera media es generalmente buena.
Ejemplo: En un test realizado a un grupo de 42 personas se h an obtenido las puntuaciones que
muestra la tabla. Calcular la puntuacin media.
[ ,
[10,
[20,
[30,
[40,
[50,
[60,
[70,
)
20)
30)
40)
50)
60)
70)
80)
15
25
35
45
55
65
75
1
8
10
9
8
4
2
N=42
*
15
200
350
405
440
260
150
1820
1820
= 43,33
42
Mediana
La mediana de una coleccin de datos, que previamente han sido ordenados, es aqul valor ms central o
que est ms en el centro del conjunto de datos. En otras palabras, la mediana es mayor que
aproximadamente la mitad de los datos y menor que (aproximadamente) la otra mitad. As se tiene que
aproximadamente, 50% de las observaciones se encuentran por arriba y 50% (aproximadamente), por debajo
de ella, o sea que se forman dos subconjuntos que contienen la misma cantidad de datos. Por ser el valor
central, los valores extremos no afectan su valor.
Cuando se tiene un n impar de observaciones, la es el valor del medio. En el caso de que la cantidad de
observaciones sea par, entonces no existe un nmero que se encuentre en el centro; por lo tanto se calcula
como el promedio de los dos valores que se encuentran en el centro de la muestra ordenada.
Apuntes de Teora: Unidad_2
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Propiedades de la mediana
1. Hay solo una mediana en una serie de datos.
2. No es afectada por los valores extremos (altos o bajos).
3. Puede ser calculada en distribuciones con escala de razn, intervalar y ordinal.
Datos no agrupados o conjunto de datos
Ejemplos
o Para n impar.
Notas de un alumno A: 10, 8,
Datos ordenados:
6, 7,
La mediana de las notas es 8.
o Para n par
Notas de un alumno B: 10, 8,
Datos ordenados:
6, 7,
La mediana de las notas es: 8,5
7, 9, 10, 7, 6.
7, 8, 9, 10, 10.
7, 9, 10, 7, 6, 9.
7, 8, 9, 9, 10, 10.
En el ejemplo anterior de la empresa con 5 empleados la mediana sera igual a $ 3000, por lo tanto sera un
mejor representante del conjunto de datos. La mediana no es afectada por valores alejados ni es afectada por
asimetra.
Datos Agrupados
Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conocemos los datos
originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos:
1. Calcular:
Orden de la mediana: =
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace
encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que n / 2.
3. Aplicando la siguiente frmula con los valores del intervalo mediano:
= + 2
61,5
64,5
67,5
70,5
73,5
5
18
42
27
8
100
5
23
65
92
100
+
= 50,5
Clase mediana: 66 - 69
Apuntes de Teora: Unidad_2
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
+1
50,5 23
2
= +
= 66 + 3
= 67,96
42
Modo o Moda
Es aquel o aquellos valor de la variable x que ocurren con mayor frecuencia en el conjunto. Es el valor que
ms se repite.
La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal y
nominal.
Propiedades de la moda
1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y de razn).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cul es el valor
representativo de la serie de datos?
Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada por la marca de clase
del intervalo que contenga la frecuencia de clase ms grande. Si hay dos intervalos contiguos con frecuencia
mxima la moda ser la media aritmtica de las dos marcas de clase. Si hay dos o ms intervalos no
contiguos con frecuencia de clase mxima habr dos o ms modas que sers las marcas de clase de dichos
intervalos.
= +
1 + 2
1 =
2 =
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Si los datos son homogneos las distribuciones son simtricas y la media es igual a la mediana y la moda.
En la distribucin asimtrica a derecha o positiva el orden es: MO ME MEDIA.
En la distribucin asimtrica a izquierda o negativa el orden es: MEDIA ME MO.
La mediana grficamente es el valor de x que corresponde a la recta vertical que divide un histograma en dos
partes de igual rea.
MEDIDAS DE POSICIN NO CENTRALES: CUANTILES
Los CUANTILES son medidas de posicin que determinan la ubicacin de los valores que dividen un conjunto
de observaciones en partes iguales. Dividen a la distribucin en un cierto nmero de partes, de manera que
en cada una de ellas, existe el mismo nmero de valores de la variable.
CUARTILES, DECILES Y PERCENTILES
CUARTILES ( ), dividen a la distribucin en cuatro partes iguales (tres divisiones):
corresponden al 25%, 50%, 75%.
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
= 1, 2, 3 4
( )
: 1, 2, , 10
10
( )
: 1, 2, , 100
100
Recordar:
- El , , 1 , nos muestran la posicin de , , .
- Usar n para un conjunto de datos impares y n+1 para datos pares.
Ejemplo: Calcular los cuartiles de la siguiente serie estadstica: 3, 5, 2, 7, 6, 4, 9, 1.
1 Ordenamos la serie: 1, 2, 3, 4, 5, 6, 7, 9.
1(8+1)
4
= 2,25 ; 2 =
2(8+1)
4
= 4,5 ; 3 =
3(8+1)
4
= 6,75
Ejemplo: En la siguiente distribucin de notas, hallar Me, Q1, Q3, P80, P90 y P99
xi
fi
F
1
7
7
2
15
22
3
41
63
4
52
115
5
104
219
6
69
288
7
26
314
8
13
327
9
19
346
10
14
360
= 2 = 50 = 5 ; 1 = 25 = 4 ; 3 = 75 = 6 ; 80 = 6,5 ; 90 = 8 ; 99 = 10
( )
: 1,2,3,4
4
= +
( )
=
: 1,2, ,10
10
= +
( )
=
: 1,2, ,100
100
= +
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
35 =
(3565)
100
35 = 70 +
= 22,75 ; 60 =
(6065)
100
22,75 18
10 = 72,97
16
xi
55
65
75
85
95
105
115
fi
8
10
16
14
10
5
2
65
F
8
18
34
48
58
63
65
= 39
;
60 = 80 +
39 34
10 = 83,57
14
= 1,73
(2)
= 1,73
En (2) se dice que los datos estn ms dispersos, porque hay mayor distancia entre cada valor y la . Es decir
hay mayor variabilidad de los datos.
Apuntes de Teora: Unidad_2
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Recordar
Calidad en la informacin y variacin estn relacionadas inversamente. Cuanto ms grande es la variacin en
los datos, ms baja es la calidad de los datos (informacin).
Rango o Recorrido o Alcance
Es la diferencia entre el valor mayor y el valor menor. Sirve como medida de dispersin slo si hay pocas
observaciones. No ms de 10 valores. No sirve cuando hay valores atpicos. Se usa mucho para estudios de
control de calidad.
Siguiendo con el ltimo ejemplo:
R1 = 1,74 - 1,72 = 0,02
R2 = 1,81 - 1,65 = 0,16
El segundo conjunto tiene mayor rango; por lo tanto los valores estn ms dispersos respecto de la .
Varianza
Es una medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia media aritmtica.
Cuando ms lejos estn las xi de su propia media aritmtica, mayor es la varianza; cuando ms cerca estn
las xi a su media, menor es la varianza.
Es la media aritmtica de los cuadrados de las desviaciones. Se define y expresa matemticamente de la
siguiente manera:
Para muestras con n 30
Para datos no
agrupados:
Para datos
agrupados:
x
n
i 1
x
n
s2
i 1
i 1
fi
x
k
s
2
n 1
n
k
i 1
fi
n 1
Desviacin Estndar
Es la raz cuadrada de la varianza. La unidad de medida de la varianza est alterada por los cuadrados de las
diferencias de los datos con la media; por eso se calcula la desviacin estndar o desviacin tpica.
= 2
Para muestras con n 30
Para datos no
agrupados:
Para datos
agrupados:
x
n
i 1
i 1
n
k
fi
i 1
n 1
x
k
i 1
fi
n 1
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
100
Ejemplo: El entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la prxima
competencia de estilo libre. Segn los tiempos en segundos que obtuvieron los postulantes de las cinco
ltimas carreras de 100 m de estilo libre, qu nadador le conviene elegir?
Diego
Toms
Sergio
61,7
61,5
60,7
61,7
62,9
62,4
62,3
62,9
62,7
62,9
63,7
62,7
63,1
63,7
63,2
Diego
Toms
Sergio
moda
61,7
mediana
62,3
Albailes
6.290
7.375
5.750
7.500
Carpinteros
5.900
7.020
5.370
6.660
Electricistas
7.500
7.600
6.700
7.335
Pintores
7.170
6.735
4.750
6.110
Determine cul es la ocupacin en la que existe la mayor variacin en los salarios bsicos y cul es la que
muestra la menor variacin. Para hacer estas comparaciones deber utilizar el coeficiente de variacin (CV).
10
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
Medidas de forma
Las medidas de forma de una distribucin se pueden clasificar en dos grandes grupos o bloques: medidas de
asimetra y medidas de curtosis.
Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, segn sea sta
discreta o continua, por el valor de la media, esta vertical, se transforma en eje de simetra, decimos que la
distribucin es simtrica.
Diremos entonces, que es simtrica, cuando a ambos lados de la media aritmtica exista el mismo n de
valores de la variable, equidistantes de dicha media dos a dos, y tales que, cada par de valores equidistantes
tiene la misma frecuencia absoluta. En caso contrario, dicha distribucin ser asimtrica o diremos que
presenta asimetra.
Estas medidas comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama
de barras de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden
ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin
es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias; entre ellas mencionaremos al
Coeficiente de Asimetra de Pearson, que se obtiene a partir de:
-
=
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo
cuando existe asimetra a la izquierda.
11
UNIVERSIDAD DE CONGRESO
TECNOLOGA DE GESTIN
ESTADSTICA DESCRIPTIVA UNIVARIADA
12