Documente Academic
Documente Profesional
Documente Cultură
MODA
La moda es el valor que aparece con mayor frecuencia en la serie de datos. As
por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
La moda es una medida muy natural para describir un conjunto de datos; su
concepto se adquiere fcilmente: es la altura ms corriente, es la velocidad ms
comn, etc. Adems tiene la ventaja de que no se ve afectada por la presencia de
valores altos o bajos.
La principal limitacin esta en el hecho de que requiere un nmero suficiente de
observaciones para que se manifieste o se defina claramente.
Otros inconvenientes son que puede darse el caso de que una determinada serie
no tenga moda o que tenga varias modas.
Por ejemplo:
L, K, M, O, N (no hay moda)
5, 6, 10, 5, 8, 6, 7, 4 (2 modas)
MEDIANA
La mediana toma en cuenta la posicin de los datos y se define como el valor
central de una serie de datos o, ms especficamente, como un valor tal que no
ms de la mitad de las observaciones son menores que l y no ms de la mitad
mayores.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina
el valor central de la serie y esa es la mediana. Si el nmero de datos es par,
existirn dos valores centrales y entonces la mediana se obtiene sacando el
promedio de ellos.
Por ejemplo:
Clculo ponderado
Nmero x
Nmero x
Frecuencia
Producto (fx)
10
10
40
13
13
39
14
14
14
15
15
15
108
Suma = 52
52/4 = 13
108/9 = 12
Media Geomtrica
La media geomtrica es la raz ensima del producto de todos los valores de la
serie.
Como este sistema de clculo resulta muy difcil de emplear, mxime cuando son
nmeros grandes o largas series de datos, en la prctica se recurre a los
logaritmos.
xg = antilog (S log xi)/n
as la xg del ejemplo se calculara as:
xg
xg
antilog
antilog
xg
log
4
(0.477
4
=
+
+
log
0.602
log
+
antilog
0.954
+
+
log
12
1.079
)
)
(3.11)
4
xg = antilog 0.78
xg = 6
Media Armnica
La media armnica se define como el recproco de la media aritmtica de los
recprocos de los valores.
Xa = 3
Clculo de las medidas de posicin en datos agrupados
Cuando los datos estn agrupados en distribucin de frecuencias las frmulas
varan un poco.
Clases
fx
29.5-34.5
32
32
34.5-39.5
37
111
39.5-44.5
42
12
336
44.5-49.5
47
21
423
49.5-54.5
52
28
364
54.5-59.5
57
32
228
59.5-64.5
62
35
186
64.5-69.5
67
38
201
69.5-74.5
72
40
144
40
2025
Total
Donde:
x
es
el
punto
medio
f
es
la
frecuencia
F
es
la
frecuencia
fx es el producto del punto medio por la frecuencia absoluta
de
clase
absoluta
acumulada
Donde:
L
=
Limite
inferior
de
la
clase
modal.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
C = Intervalo de clase.
Por ejemplo:
Primero se localiza la clase modal que es aquella en la que hay la mayor densidad
de frecuencia por unidad de intervalo y luego aplicar la formula.
La
clase
es:
44.5
49.5
Entonces:
Mo
=
1+2
44.5
Donde:
n
=
Nmero
total
L
=
Limite
inferior
de
la
clase
que
f
=
Frecuencia
de
la
clase
que
F = Frecuencia acumulada "menos de"
C = Intervalo de clase.
de
observaciones.
contiene
la
mediana.
contiene
la
mediana.
de la clase anterior.
=
n
S
40
fx
2025
50.62
Donde:
Pm
=
Percentil
m.
m
=
Nmero
del
percentil
deseado.
n
=
Nmero
total
de
observaciones.
L
=
Limite
inferior
de
la
clase
donde
est
el
percentil.
f
=
Frecuencia
de
la
clase
que
contiene
el
percentil.
F = Frecuencia acumulada de la clase anterior a la que contiene el percentil
C = Intervalo de clase.
Clculo del P72
Primero se determina la clase donde est el percentil deseado as:
m/100 * n = 72/100 * 40 = 28.8
O sea que el P72 es el 28.8 trmino de la serie y ste queda en la clase 54.5 59.5.
P72
54.5
4
28.8
28
55.5
A estos indicadores les llamamos medidas de dispersin, por cuanto que estn
referidos a la variabilidad que exhiben los valores de las observaciones, ya que si
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un
valor representativo, las medidas de dispersin nos dicen hasta que punto estas
medidas de tendencia central son representativas como sntesis de la informacin.
Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad
de los valores de la distribucin respecto al valor central. Distinguimos entre
medidas de dispersin absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirn comparar varias muestras.
1.5.1 Rango
Se denomina rango estadstico (R) o recorrido estadstico al intervalo de menor
tamao que contiene a los datos; es calculable mediante la resta del valor mnimo
al valor mximo; por ello, comparte unidades con los datos. Permite obtener una
idea de la dispersin de los datos.
Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura
tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155
es posible ordenar los datos como sigue:
x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185
donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos.
De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o,
lo que es lo mismo:
R = x(k) x(1)
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30
justo slo hay dos valores en los datos, :a,b, y hay exactamente
la mitad de datos igual a :a y :b
1.5.3 Varianza
En teora de probabilidad, la varianza (2) de una variable aleatoria es una medida
de su dispersin definida como la esperanza del cuadrado de la desviacin de
dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado. La
desviacin estndar, la raz cuadrada de la varianza, es una medida de dispersin
alternativa expresada en las mismas unidades.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y se desaconseja su uso cuando las distribuciones de las variables
aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras
medidas de dispersin ms robustas.
El trmino varianza fue acuado por Ronald Fisher en un artculo de 1918 titulado
The Correlation Between Relatives on the Supposition of Mendelian Inheritance.
Varianza o coeficiente de Variacin es la variable aleatoria x tiene media = E(X)
se define la varianza Var(X) (tambin representada como o, simplemente 2) de
X como
Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin
tpica es una medida (cuadrtica) que informa de la media de distancias que
tienen los datos respecto de su media aritmtica, expresada en las mismas
unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
representan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones
La varianza representa la media aritmtica de las desviaciones con respecto a la
media que son elevadas al cuadrado.
Si atendemos a la coleccin completa de datos (la poblacin en su totalidad)
obtenemos la varianza poblacional; y si por el contrario prestamos atencin slo a
una muestra de la poblacin, obtenemos en su lugar la varianza muestral. Las
expresiones de estas medidas son las que aparecen a continuacin.
Expresin de la varianza muestral:
Demostracin
obtenemos
con a como
y s como
adems se puede tener una mejor tendencia de
medida al desarrollar las formulas indicadas pero se tiene que tener en cuenta la
media, mediana y moda
Propiedades y aplicaciones
El coeficiente de variacin es tpicamente menor que uno.
Para su mejor interpretacin se lo expresa como porcentaje.
Depende de la desviacin tpica y en mayor medida de la media aritmtica, dado
que cuando sta es 0 o muy prxima a este valor C.V. pierde significado, ya que
puede dar valores muy grandes, que no necesariamente implican dispersin de
datos.
El coeficiente de variacin es comn en varios campos de la probabilidad aplicada,
como teora de renovacin y teora de colas. En estos campos la distribucin
exponencial es a menudo ms importante que la distribucin normal. La
desviacin tpica de una distribucin exponencial es igual a su media, por lo que
su coeficiente de variacin es 1. Las distribuciones con un C.V. menor que uno,
como la distribucin de Erlang se consideran de "baja varianza", mientras que
aquellas con un C.V. mayor que uno, como la distribucin hiperexponencial se
consideran de "alta varianza". Algunas frmulas en estos campos se expresan
usando el cuadrado del coeficiente de variacin, abreviado como S.C.V. (por
sus siglas en ingls).