Sunteți pe pagina 1din 17

DISTRIBUCIONES UNIDIMENSIONALES

MEDIDAS DE RESUMEN
Aquellas que con un solo valor representan y describen las características relevantes de la
variable. Las más usuales son:
A. MEDIDAS DE TENDENCIA CENTRAL
B. MEDIDAS DE ´POSICION O CUANTILES
C. MEDIDAS DE DISPERSION
D. MEDIDAS DE FORMA
A. MEDIDAS DE TENDENCIA CENTRAL
Son medidas que tienden al centro de la distribución. Las mas usuales son:
 MEDIA ARITMETICA
 MEDIANA
 MODA
MEDIA ARITMETICA

Es la medida más importante de todas las medidas de tendencia central. Se calcula de la


siguiente manera:
 Datos no agrupados:
n

�x i
X = i =1

n
Donde:
X : Media aritmética de la muestra
xi : valos de las observaciones individuales
n: N° total de datos
 Datos no agrupados(Tablas de frecuencias)
K

�y n i i
Y = i =1

n
Y : : Media aritmética de la muestra
yi : Clase o marca de clase i- esima
ni : Frecuencia absoluta simple de la clase o marca de clase

PROPIEDADES DE LA MEDIA ARITMETICA


 Se encuentra afectada por los valores extremos(valores grandes o pequeños)
 Se presta a manipulaciones algebraicas posteriores
 No es aplicable para variables cualitativas.

EJEMPLOS
1. Calcular e interpretar el promedio de una muestra de las edades de 12 estudiantes:

15 10 25 30 13 16 19 22 24 17 28 23
SOLUCION:
Cálculos según la formula a usar:
n=
n

�x
i =1
i =

�x i
X = i =1
= =
n

Interpretacion:
En promedio los estudiantes tienen…………años de edad, aproximadamente.

2. Con la información contenida en la tabla N° 3, calcular e interpretar la media


aritmética:
CALIFICACIONES
Y ´
i 1  Y ´i  Yi ni

TOTAL

SOLUCION:
1°) disposición de la información en la siguiente tabla, según la formula:

CALIFICACIONES
Y ´
i 1  Y ´i  Yi ni Y*ni

TOTAL

Luego, la media aritmética de los datos será:


K

�y n i i
Y = i =1
= =
n

Interpretacion:

LA MEDIANA
Es Aquella medida que divide a un conjunto de datos ordenados en dos partes
aproximadamente iguales a 50%. Se calcula de la siguiente manera:
 Datos no agrupados: a
a) Si n es un numero impar: el valor de la mediana es el valor que ocupa la posición
n+1
2

Me = x n +1
2
b) Si n es un numero par: el valor de la mediana es la media aritmética de los
n n+2
valores que ocupan las posiciones y
2 2
xn + xn+2
Me = 2 2

2
 Datos no agrupados (Tablas de frecuencias)

Se usa la siguiente formula:


n / 2  N j 1 �

Me = LI + � �* C j
� nj �
Donde:

n
: Factor de localización de la Me
2
N j 1 : Frecuencia absoluta acumulada del intervalo anterior que contiene a la
mediana
ni : Frecuencia absoluta simple del intervalo mediano
LI: Limite inferior del intervalo que contiene a la mediana
C j : Limite inferior del intervalo que contiene a la mediana.

PROPIEDADES DE LA MEDIANA

 No esta afectada por los valores extremos( altos y bajos)


 No se presta a manipulaciones algebraicas posteriores
 Es aplicable para variables cualitativas ordinales.

EJEMPLOS:

1. Calcular e interpretar el promedio de una muestra de las edades de 12 estudiantes:

15 10 25 30 13 16 19 22 24 17 28 23

SOLUCION:

1°) Ordenamiento ascendente de los datos

X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30

2°) n=12, es un numero par.


Calculo de los dos valores centrales:
Xn =
Primer valor central :
2

X n+2 =
Segundo valor central:
2

Luego, la mediana será:


x n + x n+ 2
Me = 2 2
= =
2

Interpretación:

2. Con la información contenida en la tabla N° 3, calcular e interpretar la mediana:

SOLUCIÓN:

1°) disposición de la información en la siguiente tabla, según la formula:

CALIFICACIONES
Y ´
i 1  Y ´i  ni Ni

TOTAL --

2°) Cálculos:

n 35
= = 17,5 , esta contenido en N j =
2 2
N j 1 =
nj =
LI=
Cj =
Luego, la mediana de la información será:

n / 2  N j 1 �

Me = LI + � �* C j =
� nj �
Interpretación:

LA MODA

Es el valor mas frecuente en una serie de datos. Una distribución de datos puede o no tener
moda.
Si una distribución no tiene moda, esta se denomina distribución AMODAL.
Si una distribución tiene una moda, esta se denomina distribución UNIMODAL
Si una distribución tiene dos o mas modas, esta se denomina distribución MULTIMODAL.
La moda se calcula de la siguiente manera:

 EN DATOS NO AGRUPADOS
Valor (ó valores) de la variable con mayor frecuencia

 EN DATOS AGRUPADOS
� d �
M O = LI + � 1 �* C j
d1 + d 2 �

Donde:
nj :
Máxima frecuencia (factor de localización de la moda)
d1 = n j  n j 1
d1 = n j  n j +1
LI : Limite inferior del intervalo que contiene a la moda
Cj
: Amplitud del intervalo que contiene a la moda

PROPIEDADES DE LA MODA
 La moda se puede usar como una localización tanto para datos cualitativos como
cuantitativos

EJEMPLOS:
1. Calcular e interpretar la moda en la siguiente distribución de datos:

X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30, 15
M O = 15
Interpretacion: la edad que se repite con mayor frecuencia es de 15 años.

2. Con la información contenida en la tabla N° 3, calcular e interpretar la mediana:

SOLUCIÓN:

1°) disposición de la información en la siguiente tabla, según la formula:

CALIFICACIONES
Y ´
i 1  Y ´i  ni

TOTAL
2°) Cálculos:
nj =
d1 = n j  n j 1 =
d1 = n j  n j +1 =
LI =
Cj =

Luego la moda, queda como sigue:

� d �
M O = LI + � 1 �* C j
d1 + d 2 �

Interpretacion:

ESCOGIMIENTO ENTRE LA MEDIA MEDIANA Y MODA

1. EN DISTRIBUCIONES SIMETRICAS
Una distribución es simetrica, cuando cada par de valores equidistantes de un valor
central, tienen las mismas frecuencias.
En las distribuciones simétricas la media, mediana y moda son iguales. Es decir:
X = Me = Mo
En este tipo de distribuciones la media aritmética es la más adecuada.

2. EN DISTRIBUCIONES ASIMETRICAS
2.1. EN DISTRIBUCIONES ASIMETRICAS SESGADAS A LA DERECHA, SE
TIENE LA RELACION:
X > Me > Mo

Gráficamente:

2.2. EN DISTRIBUCIONES ASIMETRICAS SESGADAS A LA IZQUIERDA,


SE TIENE LA RELACION:

X < Me < Mo
Gráficamente:

Nota: Es preciso indicar que en distribuciones asimétricas la mediana es la más


adecuada. La moda se usa para saber cual o cuales son los valores mas
frecuentes en una distribución de datos.
B. MEDIDAS DE POSICIÓN
Dividen a un conjunto de datos ordenados en partes aproximadamente iguales. También se
les denomina los cuantiles. Las medidas más usuales: los cuartiles, los deciles y los
percentiles, que en cierta forma son una extensión de la mediana.

LOS CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
aproximadamente iguales a 25%. Se denotan por Qi ; con i=1,2,3
Gráficamente:

Q1 : Es el PRIMER CUARTIL, significa que el 25% de los datos son menores o iguales a él; y
el 75% restante son mayores que él.
Q2 : es la MEDIANA

Q3 : Es el TERCER CUARTIL, significa que el 75% de los datos son menores o iguales a él;
y el 25% restante son mayores que él.

CALCULO EN DATOS NO AGRUPADOS:


Procedimiento:
1°) Ordenamiento ascendente de los datos
�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�4 �
ordenada.
�n + 1 � Q = X �n +1 �
i) Si i * � �es un entero, entonces i i*� �
� 4 � �4 �

�n + 1 �
ii) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�4 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.

CALCULO EN DATOS AGRUPADOS:


�n �
i  N j 1 �

Qi = LI + �4 �c j i= 1,2,3
� nj �
� �
Donde:
LI = Límite real inferior de la clase del cuartil i
in
Factor de localización del
4
N j 1 = Frecuencia acumulada de la clase que antecede a la clase del cuartil i.

n j = Frecuencia de la clase del cuartil i

C j = Longitud del intervalo de la clase del cuartil i

n: numero total de datos

LOS DECILES
Los deciles son los nueve valores que dividen al conjunto de datos ordenados en diez partes
aproximadamente iguales a 10%. Se denotan por Di ; con i=1,2,....,9
Gráficamente:

D1 : Es el PRIMER DECIL, significa que el 10% de los datos son menores o iguales a él; y el
90% restante son mayores que él.
D5 : es la MEDIANA

.
.
.
D9 : Es el NOVENO DECIL, significa que el 90% de los datos son menores o iguales a él; y
el 10% restante son mayores que él.

CALCULO EN DATOS NO AGRUPADOS:


Procedimiento:
1°) Ordenamiento ascendente de los datos
�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�10 �
ordenada.
�n + 1 � D = X �n +1 �
iii) Si i * � �es un entero, entonces i i*� �
�10 � �10 �

�n + 1 �
iv) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�10 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.
CALCULO EN DATOS AGRUPADOS:
�n �
�i  N j 1 �
Di = LI + �10 �c j i = 1, 2, ... , 9 ,
� n j �
� �
Donde:
LI = Límite real inferior de la clase del decil i
in
Factor de localización del
10
N j 1 = Frecuencia acumulada de la clase que antecede a la clase del decil i.

n j = Frecuencia de la clase del decil i

C j = Longitud del intervalo de la clase del decil i

n: numero total de datos

LOS PERCENTILES
Los percentiles son los noventinueve valores que dividen al conjunto de datos ordenados en
CIEN partes aproximadamente iguales a 1%. Se denotan por Pi ; con i=1,2,....,99
Gráficamente:

P1 : Es el PRIMER DECIL, significa que el 1% de los datos son menores o iguales a él; y el
99% restante son mayores que él.
P50 : es la MEDIANA
.
.
.
D99 : Es el NOVENTINUEVE PERCENTIL, significa que el 99% de los datos son menores
o iguales a él; y el 1% restante son mayores que él.
CALCULO EN DATOS NO AGRUPADOS:
Procedimiento:
1°) Ordenamiento ascendente de los datos
�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�100 �
ordenada.
�n + 1 � P = X �n +1 �
v) Si i * � �es un entero, entonces i i*� �
�100 � �100 �
�n + 1 �
vi) Si i * � �no es un entero, se hace una interpolación lineal entre los dos valores
�100 �
correspondientes a las dos observaciones entre los cuales se encuentra la fracción.

CALCULO EN DATOS AGRUPADOS:


� n �
�i  N j 1 �
Pi = LI + �100 �c j i = 1, 2, ... , 99 ,
� n j �
� �
Donde:
LI = Límite real inferior de la clase del percentil i
in
Factor de localización del
100
N j 1 = Frecuencia acumulada de la clase que antecede a la clase del percentil i.

n j = Frecuencia de la clase del percentil i

C j = Longitud del intervalo de la clase del percentil i

n: numero total de datos


EJEMPLOS:
1. Calcular e interpretar el primer cuartil, el sétimo decil y el percentil sesenta con las
edades de una muestra de 13 estudiantes.
15 10 25 30 13 16 19 22 24 17 28 23 32

SOLUCION
Procedimiento:
1°) Ordenamiento ascendente de los datos
X j :10, 13, 15, 16, 17, 19, 22, 23, 24, 25, 28, 30, 32

CALCULO DEL PRIMER CUARTIL ( Q1 )

�n + 1 �
2° Localización del punto de posición que corresponde a la i * � � observación
�4 �
ordenada.
�n + 1 � 13 + 1
i *� �= = 3,5 , no es un entero
�4 � 4
Haremos una interpolación para encontrar el valor del Q1
3� � 15

Q1  15 3,5  3
3,5 � Q1 = Q1 = 15,5
16  15 43

4� � 16
INTERPRETACION:

CALCULO DEL SETIMO DECIL ( D7 )

�n + 1 �
2° Localización del punto de posición que corresponde a la 7 * � � observación
�10 �
ordenada.
�n + 1 � 13 + 1
i *� �= 7 = 9,8 , no es un entero
�4 � 10

Haremos una interpolación para encontrar el valor del D7


9� � 24

D7  24 9,8  9
9,8 � D7 = Q1 = 24,8
25  24 10  9

10� � 25

INTERPRETACION:

CALCULO DEL PERCENTIL 60 ( P60 )

�n + 1 �
2° Localización del punto de posición que corresponde a la 60 * � � observación
�100 �
ordenada.
�n + 1 � 13 + 1
60 * � �= 60 = 8, 4 , no es un entero
�100 � 100

Haremos una interpolación para encontrar el valor del D7


8� � 22

P60  22 8, 4  8
8, 4 � P60 = Q1 = 22,8
23  22 98

9� � 23
INTERPRETACION:

2. Con la información contenida en la tabla N°3, calcular e interpretar el tercer cuartil, el


octavo decil y el percentil noventa.
� n �
3*  N j 1 �
� 4
CALCULO DEL TERCER CUARTIL: Q3 = LI + � �c j
� nj �
� �
1°) Disposición de la información según la formula de aplicación.

CALIFICACIONES
Y 
ni
Ni
´
i 1  Y ´i

TOTAL --

2°) Cálculos:
n 35
3 = 3 = , esta contenido en N j =
4 4
N j 1 =
nj =
LI=
Cj =
Luego, el tercer cuartil de la información será:

� n �
3*  N j 1 �

Q3 = LI + � 4 �c j =
� n j �
� �
INTERPRETACION:

� n �
8 *  N j 1 �
� 10
CALCULO DEL OCTAVO DECIL: D8 = LI + � �c j
� nj �
� �
1°) Disposición de la información según la formula de aplicación.
CALIFICACIONES
Y 
ni
Ni
´
i 1 Y ´
i

TOTAL --

2°) Cálculos:
n 35
8 = 8 = , esta contenido en N j =
10 10
N j 1 =
nj =
LI=
Cj =
Luego, el OCTAVO DECIL de la información será:

� n �
8 *  N j 1 �

D8 = LI + � 10 �c j =
� nj �
� �

INTERPRETACION:
� n �
90 *
�  N j 1 �
100
CALCULO DEL PERCENTIL NOVENTA: P90 = LI + � �c j
� n j �
� �
1°) Disposición de la información según la formula de aplicación.

CALIFICACIONES
Y  Y ´i 
ni
´ Ni
i 1

TOTAL --

2°) Cálculos:
n 35
90 = 90 = , esta contenido en N j =
100 100
N j 1 =
nj =
LI=
Cj =
Luego, el percentil noventa será:

� n �
� 100  N j 1 �
90 *
P90 = LI + � �cj =
� nj �
� �

INTERPRETACION:

C. MEDIDAS DE DISPERSIÓN

1. MEDIDAS DE DISPERSIÓN RESPECTO A LA MEDIA ARITMÉTICA

Son medidas que expresan el alejamiento o acercamiento de cada uno de los datos con
respecto a la media aritmética

 VARIANZA: Es aquella medida que consiste en dividir todas las diferencias


cuadráticas de cada uno de los datos con respecto a su media aritmética. Es decir que
es el promedio de todas las desviaciones cuadráticas. Se calcula de la siguiente
manera:

- CALCULO EN DATOS NO AGRUPADOS


n

�( x i  X )2
s2 = i =1

2
�n
n

� x ��xi 2
i �
FORMULA PRÁCTICA: SX =
2 i =1
 �i =1 �
n �n �
� �
� �

- CALCULO EN DATOS AGRUPADOS


K

�( y i  Y ) 2 * ni
s2 = i =1

n
2
�K
K

� y * ni ��yi * ni 2
i �
FORMULA PRÁCTICA: S y2 = i =1  �i =1 �
n � n �
� �
� �
PROPIEDADES DE LA VARIANZA

1. La varianza siempre es positiva( s 2 �0)


2. Es la medida mas importante de todo el análisis estadístico
3. Se presta a manipulaciones algebraicas posteriores.

 DESVIACIÓN TÍPICA O ESTÁNDAR


s = S2
Para datos no agrupados:
2
n
�n �
� x
i
2
��xi �
Sx = i =1
 �i =1 �
n �n �
� �
� �

Para datos agrupados:

2
K
�K �
� y2
i * ni ��yi * ni �
Sy = i =1
 �i =1 �
n � n �
� �
� �

 COEFICIENTE DE VARIACIÓN DE PEARSON


s
CV =
x
s
Expresado en porcentaje: CV ( X )% = *100
x

Si:
CV ( X )% �50% , la distribución tiene una BAJA dispersión, y consecuentemente la
media aritmética tiene una ALTA REPRESENTATIVIDAD.

CV ( X )% > 50% , la distribución tiene una ALTA dispersión, y consecuentemente la


media aritmética tiene una BAJA REPRESENTATIVIDAD.

D. MEDIDAS DE FORMA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

MEDIDAS DE ASIMETRÍA

Son aquellas medidas que miden e indican el grado de deformación de las distribuciones
de frecuencias con respecto al eje horizontal del sistema de coordenadas. Una de las
medidas más importantes es el coeficiente de asimetría de Pearson, que se calcula de la
siguiente manera:
X  Mo
CA =
S
Si:
CA > 0, La distribución es asimétrica a la derecha (la distribución tiene cola a la
derecha)

CA < 0, La distribución es asimétrica a la izquierda (la distribución tiene cola a la


izquierda.

CA = 0, La distribución es simétrica

EJEMPLOS:

Con la información contenida en la tabla N°3, calcular e interpretar la varianza,


desviación estándar, el coeficiente de variación, el coeficiente de asimetría.

Solución:

CALIFICACIONES Yi
Y 
ni
Ni
´
i 1 Y ´
i

TOTAL

CALCULO DE LA VARIANZA:
1°) Disposición de la información según la formula practica a aplicar:

CALIFICACIONES Yi ni Yi 2 * ni
Y ´
i 1  Y ´i 
Yi * ni

TOTAL

La varianza es:

2
K
�K �
� y * ni ��yi * ni
2
i �
S y2 = i =1  �i =1 �=
n � n �
� �
� �
Interpretación:
CALCULO DE LA DESVIACIÓN ESTANDAR:

S y = S y2 =

Interpretación:

CALCULO DEL COEFICIENTE DE VARIACIÓN:

Sy
CV ( y  % = *100 =
Y

Interpretación:

CLCULO DEL COEFICIENTE DE ASIMETRIA:

Y  Mo
CA = =
SY

Interpretación:

S-ar putea să vă placă și