Sunteți pe pagina 1din 6

ESTADISTICA DESCRIPTIVA

LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia


en cuatro partes iguales. Se designa por el símbolo Qc en la que c corresponde a los
valores 1, 2 y 3. El Qi es el valor debajo del cual queda el 25 % de los datos; Q 3 deja el
75 % de los datos y Q2 divide la distribución de frecuencia en dos partes iguales, un 50 %
que esta por debajo de los valores de Q2 y otro 50 % que esta por encima del valor de
Q2. El Q2 es igual a la mediana.
CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad
practica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una
distribución de frecuencia existe un método por análisis gráfico y otro por determinación
numérica, por fines prácticos en esta cátedra se utilizara él último método. Para calcular
los cuartiles por el método numérico se procede de la siguiente manera:

1. Se localiza la posición del cuartil solicitado aplicando la formula de posición:


cn
Qc = —, en donde c viene a ser el número del cuartil solicitado, n corresponde al
número total de datos de la distribución y 4 corresponde al número de cuartiles que

cn
2. Se determina la posición que ocupa el cuartil mediante la formula: Qc el
~4 ,
presenta una distribución de frecuencia.
resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo cual
se conseguirá en la clase donde la frecuencia acumulada Fi que sea igual o superior
a este resultado. Luego se aplica la formula:
Donde,
cn
F,(¿-
4
Q Li + i) Ic.
f
i
cn
= Posición que ocupa el cuartil en la distribución de frecuencia.
4
c = corresponde al número del cuartil solicitado: 1,2 3.
Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil.
F( = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil. fi
= Frecuencia absoluta de clase donde se encuentra el cuartil.

Prof. Simón Cabrera página 1 de 32


ESTADISTICA DESCRIPTIVA

MEDIDAS DE DISPERSION INTRODUCCIÓN


La utilización de una medida de posición escogida para representar a los datos no indica
otras características que el conjunto de observaciones que posee. No todas las
observaciones son iguales a la medida de posición tomada o seleccionada; en general
los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos índices
o medidas que indiquen la variabilidad o dispersión del conjunto de observaciones que se
estudian.

Una medida de variabilidad es un numero que nos indica el grado de dispersión en un


conjunto de datos. Si el valor es pequeño (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos (homogénea). Por el contrario, un gran valor
nos indica poca uniformidad (heterogénea). Cuando es cero quiere decir que todos los
datos son iguales.

Las medidas de dispersión se clasifican en dos grupos:

• Medidas de Dispersión Absoluta.

Son aquellas que vienen expresadas en las mismas unidades originales que indican
la serie de datos. Entre las medidas de dispersión absoluta se encuentran: el rango,
el rango intercuartilico, la desviación media, la varianza y la desviación típica.

• Medidas de Dispersión Relativas.

Estas medidas vienen expresadas en valores abstractos o porcentajes; su principal


función es la de determinar entre varias distribuciones la de mayor o menor
dispersión. La medida de dispersión relativa de mayor importancia es el coeficiente
de variación.

RANGO O RECORRIDO.

Es la medida de dispersión mas sencilla y se define como la diferencia entre el valor mas
alto menos el valor mas pequeño y se designa por R. Es decir, R = Xmax-Xmin para datos
no agrupados. Si los datos están agrupados en K clases el rango será la diferencia entre
el limite superior de la K-esima clase menos el limite inferior de la primera clase.

El rango nos dará una primera idea sobre las dispersión de los datos ya que si su valor
es pequeño nos indicará una gran concentración de los datos, y si por el contrario su valor
es grande nos puede indicar una gran variabilidad o dispersión de los datos.

Prof. Simón Cabrera página 2 de 32


ESTADISTICA DESCRIPTIVA

RANGOS ESPECIALES
El rango nos da una idea de la dispersión total de las observaciones, por lo tanto puede
estar afectada por valores extremos dando en consecuencia una idea de alta dispersión.
Por tal motivo, se han definido otros rangos que tratan de subsanar este problema.

RANGO ÍNTERCUARTILICO. Se define como la diferencia entre el cuartil tres(Q3) y el


cuartil uno(Q1) de una distribución de frecuencia y se expresa así: RI = Q3 - Q1.

RANGO SEMI-ÍNTERCUARTILICA. Es la diferencia entre el Q3 y el Q1 dividido entre


dos:
RSI = Q ~ Ql .
2

Si los valores de la RI o RSI son pequeños indica una alta concentración de los datos de
la distribución en los valores centrales de la serie de datos. Estas medidas se utilizan para
comparar los grados de variación de los valores centrales en diferentes distribuciones de
frecuencias. Los mismos no son afectados por los valores extremos, no se adaptan a la
manipulación algebraica, por tal motivo son de poco utilidad.

DESVIACIÓN MEDIA. La desviación media de un conjunto de n observaciones x1, x2, x3,.


. .xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto a la
media aritmética o la mediana. Si se denomina como DM a la desviación media, entonces
su formula matemática será la siguiente:
N N

X |x - x | x Kl
DM = ----
N N

Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuación,


debido a que la primera propiedad de la media aritmética establece que los desvíos (di)
de una serie con respecto a la media aritmética siempre son iguales a cero, es decir: di =
0.

Cuando los datos están en una distribución de clases o agrupados se aplica la siguiente
formula:

X IX- x \f, X f,\d,


DM
n
= -------
n

En esta formula x es el punto medio de cada clase y fi es la frecuencia de cada clase. La


Desviación Media a pesar de que para su cálculo se toman todas las observaciones de
la serie, por el motivo de no tomar en cuenta los signos de las desviaciones (di), es de
difícil manejo algebraico. Su utilización en estadística es muy reducida o casi nula, su
importancia es meramente histórica, ya que de esta formula es la que da origen a la
desviación típica o estándar.

Prof. Simón Cabrera página 3 de 32


ESTADISTICA DESCRIPTIVA

VARIANZA

Una manera de resolver el problema de los signos de las desviaciones respecto de la


media aritmética es elevándolos al cuadrado y luego sumar todos los resultados
obtenidos. Esta suma se puede considerar como una medida de la dispersión total de los
valores. Aquellos que estén mas alejados de la media aritmética tendrán un aporte mayor
a esta suma de cuadrados.
Su mayor utilidad se presenta en la estadística inductiva y se puede interpretar como una
medida de variación promedio (o el promedio de la suma de los cuadrados). Se obtiene
dividiendo la variación total entre el numero de unidades o medidas. Se designa por la
letra S2 su formula de calculo es al siguiente:
DESVIACIÓN TIPICA
X (X , - X):
S para datos no agrupados
: n

S
X f ,(X, - X): XfX2 _
------- -— ----- X 2 para datos agrupados
n n
S=
X (X , - Para datos no agrupados
V 2 n
X)
Como la varianza es el promedio de los desvíos respecto de la media elevados al
cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una medida
de dispersión en las unidades originales se le extrae la raíz cuadrada (positiva) a la
varianza, obteniendo así otra medida de dispersión denominada desviación típica o
estándar, la cual se
designara por S y X2 X
será igual a :
f
X (X, - 1J1
-X2 Para datos agrupados
2 n
X) f
n
INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA

La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona
la variación de los datos con respecto a la media aritmética, su valor se encuentra en
relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor
desviación típica, y a menor dispersión, menor desviación típica.
Su mayor utilidad se presenta en una distribución normal, ya que en dicha distribución
en el intervalo determinado por X ±G se encuentra el 68. 27% de los datos de la
serie; en el intervalo determinado por la X ± 2<T se encuentra el 95,45% de los datos
y entre la X ± 3<T se encuentra la casi totalidad de los datos, es decir, el 99,73% de los
datos; además, existe una regla general de gran utilidad para la comprobación de los
cálculos que dice: "una oscilación igual a seis veces la G, centrada en la media comprende
aproximadamente el 99% de los datos”.

Prof. Simón Cabrera página 4 de 32


ESTADISTICA DESCRIPTIVA

Ejemplo:

Los siguientes datos corresponden al número de panes consumidos por un grupo de


familias de una urbanización de la ciudad, durante una semana determinada.

Clases
30—32
f i10
33—35 18
36—38 60
39—41 10
42—44 0
80
45—47 14
48—50 6
28
Z 8
Solución:
Clases
f i Xi f iX i fX 2
30—32 10 31 310 9610
33—35 18 34 612 20808
36—38 60 37 2220 82140
39—41 100 40 4000 160000
42—44 80 43 3440 147920
45—47 14 46 644 29624
48—50 6 49 294 14404
11520 464508
Z 288

11520
40.0.
n 288

r
2 _Z -2 464508 11520 ^2
2 2
12.8
S X _
288 V 288
n 8
_

2 11520
S _. Z f X 1 ÍZ f X i ' 464508 (
"i 2
n 288 V 288 y
n
vy

_ V1612.88 -1600 = V 12.88 _


_ 3.59.
3.59.
Interpretación. - E l resultado obtenido indica que en promedio, el consumo de pan de
trigo del grupo de familias de esa urbanización se dispersa con respecto a su media
aritmética en una cantidad igual a 3.59.

Prof. Simón Cabrera página 5 de 32


ESTADISTICA DESCRIPTIVA

DISPERSIÓN RELATIVA

Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las
dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas
condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero,
cuando hay que establecer comparaciones entre distintas muestras, será necesario
expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes.

Las medidas de dispersión relativas permiten comparar grupos de series distintas en


cuanto a su variación, independientemente de las unidades en que se midan las
diferentes características en consideración. Generalmente las medidas de dispersión
relativas se expresan en porcentajes, facilitando así el estudio con medidas procedentes
de otras series de valores La dispersión relativa viene a ser igual a la dispersión absoluta
dividida entre el promedio.

Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de


variación de Pearson, este es un índice de variabilidad sin dimensiones, lo que permite la
comparación entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variación de Pearson se designa con las letras CV. La formula
matemática es:

CV = -£x100

Una serie de valores será más dispersa que otra mientras su CV sea mayor.

Ejemplo:
La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro.
Determine el CV de cada uno y diga cuál de ellos presenta mayor variación y cuál la
menor.

Producto X S Unidades CV
1 45 5 Bs. 11.11 %
2 450 40 Bs. 8.87 %
3 4500 350 Bs. 7.78 %

Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál


presenta mayor o menor variación

CV = Sx100/ X

CV(1) = 5x100/45 = 11.11 %.

CV(2 ) = 40x100/450 = 8.87 %.

CV(3 ) = 350x100/4500 = 7.78 %.


Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de los
tres productos el que menos varia es ese; por otro lado el de mayor dispersión o
variabilidad es el producto 1.

Prof. Simón Cabrera página 6 de 32

S-ar putea să vă placă și