Sunteți pe pagina 1din 26

CAPITULO II

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION DE VARIABLES


CUANTITATIVAS

SUMATORIAS
Definido mediante la notación  , suma de elementos i = 1 hasta “n”.
n

 Xi  X  X  ...  X
i 1
1 2 n

Ejm. 06: Supóngase que se selecciona n = 5 compañías mineras del total del país. Sus
tasas de ganancias, como porcentaje de precio de venta de sus concentrados son
respectivamente: 12.2, 10.8, 10.4, 12.1, y 11.3. Represente simbólicamente estas
cantidades como: X1, X2, X3, X4, X5 respectivamente.
Hallar:
5
a)  Xi = 12.2 + 10.8 + 10.4 + 12.1 + 11.3 = 56.8
i 1
5

b)  Xi (12.2  10.8  10.4  12.1  11.3) 56.8


i 1
   11.36
5 5 5
5
c) X
i 1
i
2
 (12.2)2  (10.8)2  (10.4)2  (12.1)2  (11.3) 2  647.74

MEDIDAS DE TENDENCIA CENTRAL

Es un índice de localización central empleado en la descripción de las distribuciones de


frecuencias. También sirve como una base para medir y evaluar valores extremos (altos ó
bajos).

Tipos de promedio.- Son:

a) La media aritmética ó media


b) La mediana
c) La moda
d) La media geométrica
e) La media cuadrática
f) La media armónica, etc.

1
2.1. MEDIA ARITMETICA O MEDIA

2.1.1 MEDIA ARITMETICA – DATOS NO AGRUPADOS  X 


n N

 Xi ,  Xi ; Xi = X1, X2, …, Xn. Valores de la variable X


X  i 1
  i 1
n N
n = número de elementos u observaciones.
µ = Media poblacional.
N = Tamaño de la población.

Ejemplo: Hallar la media aritmética de las observaciones: 3, 4, 7, 8, 2.


n

�Xi
X  i 1
Solución n
3 4 7 8 2
  4.8
5

2.1.2 MEDIA ARITMETICA – DATOS AGRUPADOS  X 


k

fX i i k
; Xi = X1, X2, …, Xk; Valores de X ponderados
X  i 1

n
; ó X  h X
i 1
i i

fi = f1, f2, f3, …, fk; Frecuencias absolutas


k
n   fi
i 1
hi = h1, h2, h3, …, hk; Frec. relativas respectivas

Ejm. 07: Dada la siguiente distribución:


Xi 1 2 3 4 5 Determinar la media aritmética.
fi 1 3 4 2 2
Solución:
Xi fi fi Xi
1 1 1
2 3 6
3 4 12
4 2 8
5 2 10
TOTAL 12 37
k

La media aritmética de estos datos será: fX i i


k
n   fi
X  i 1
; i 1
n

37
 3.08 X 
12
Ejm. 08: Determinar la media aritmética de la distribución.

2
Miles S/. Ingreso familiar [ 2, 4 > [ 4, 6 > [ 6, 8 > [ 8, 10 > [ 10, 12 >
N° de familias 5 10 14 8 3
Solución: Los intervalos de clase son representados por sus marcas de clase.
MARCA DE CLASE
CLASES fi Xi fi X i
[2, 4> 5 3 15
[4, 6> 10 5 50
[6, 8> 14 7 98
[ 8 , 10 > 8 9 72
[10 , 12 > 3 11 33
TOTAL 40 268
k

Tenemos: fX i i
268 Rpta. Ingreso familiar en miles de soles S/. 6,700.00
X  i 1
  6.7;
n 40

2.1.3 PROPIEDADES DE LA MEDIA ARITMETICA (Completar las propiedades)


k
1)  f (X
i 1
i i  X )  0;

2)

3)

4)

5)

6)
2.2. MEDIA PONDERADA ( X P )

3
r

n X  n X  ...  nr X r
n X j J r
XP  1 1 2 2
n1  n2  ...  nr
 j 1

n
; donde : n  n
i 1
j

 PX i i
XP  i 1
r
; Si : P1 , P2 ,...; Pr , Pesos asociados. X : X 1 , X 2 ,..., X r , Valores de la var iable X
P i 1
i

Ejm. 09: Sí los porcentajes de mujeres en 3 escuelas profesionales diferentes son:


ESCUELA PROFESIONAL N° de alumnos % de mujeres Pi Xi
A48 50 2400
B60 70 4200
C30 40 1200
138 7,800
Hallar el porcentaje global de mujeres en las tres escuelas profesionales.

(50%) 48  (70%) 60  (40%)30 7800


Solución: X P    56.5%
48  60  30 138
El porcentaje global de mujeres en las tres escuelas es de 56.5%.

Ejm. 10: Determinar la evaluación final del alumno Juan Pérez en el curso de Estadística
quién tiene: 08 en examen parcial y 12 en el final; el examen parcial tiene peso 1 y el final
peso 2.
Solución:
CALIFICACIONES PESOS
EXAMENES XiPi
Xi Pi
Parcial 08 1 08
Final 12 2 24
TOTALES 20 3 32
2

PX i i
32
XP  i 1
2
  10.67; La evaluación de Juan Perez es 10.67
3
P
i 1
i

2.3. MEDIANA X%  
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma
ascendente ó descendente en dos grupos de igual número de observaciones.
X% Med ( X ) mediana

Caso 1.- La variable es discreta y n (# de observaciones) es impar, rango de orden


 n  1
2
Ejm. 11: Hallar la mediana del siguiente conjunto de datos: {3, 6, 8, 2, 1}
Solución: En orden creciente tenemos: 1, 2, 3, 6, 8
X1 X2 X3 X4 X5; → n es impar (n = 5)
El valor que ocupa el rango:
 n  1   5  1  3ro.  3
2 2

4
Existen dos observaciones mayores que 3 y dos observaciones menores que 3 (el número
de observaciones mayores que la mediana es igual al número de observaciones menores
que ella).

Caso 2.- La variable es discreta, n es par, la mediana es el promedio aritmético de los dos
valores centrales que equidistan de los extremos.
n n Xn  Xn
y  1 : X% 2 2
1

2 2 2

Ejm.12: Considere las observaciones muestrales: 24, 37, 41, 82, 68, 63

Solución: En orden creciente: 24, 37, 41, 63, 68, 82;


n 6
n = 6, los valores que ocupan las posiciones: = ≈ 3ro. → 41
2 2
n 6
 1   1  4to. → 63
2 2

 41  63
La mediana es entre 41 y 63, el cuál es:  
X% Med X% 
2
 52 .

Caso 3.- La variable es continua, el problema consiste en determinar un punto dentro del
intervalo en que está comprendida la mediana.
n
1er. Paso: Calcular , Variable continua para “n” es par ó impar.
2

n
2do. Paso: Fk-1 < < Fk; Fk, Frecuencia acumulada.
2

3er. Paso: Utilizar la fórmula:

�n �
� 2  Fk 1 �
X%  lmed � � * Cmed ;
� Fk  Fk 1 �
� �
� �
Donde:
lmed = Límite inferior del intervalo de clase que contiene a la mediana
n = Tamaño de la muestra
Cmed = Amplitud de clase que contiene a la mediana.
Fk = Frecuencia acumulada de la clase q´ contiene a la mediana
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a la mediana.

Ejm. 13: Dada la distribución:

5
Clases [ 35, 45 > [ 45, 55 > [ 55, 65 > [ 65, 75 > [ 75, 85 > [ 85, 95 >
fi 5 12 18 14 6 3
Hallar la mediana X% . 
Solución: Tenemos
CLASES fi Fi
[ 35 , 45 > 5 5
[ 45 , 55 > 12 17
[ 55 , 65 > 18 35 ← clase que contiene a la mediana
[ 65 , 75 > 14 49
[ 75 , 85 > 6 55
[ 55 , 95 > 3 58
TOTAL n = 58
n 58
Paso 1): = ≈ 29vo → está en la 29va. Posición.
2 2

Paso 2): Identificación de la clase q’ contiene a la mediana por la frecuencia


acumulada (Fi):
n
Fk-1 < < Fk
2
F3-1 = 17 < 29 < F3 = 35
F2 = 17 < 29 < F3 = 35; La clase q’ contiene a la mediana es el 3ro.

�n �
� 2  Fk 1 �  29  17 
Paso3) : X%  lmed  � � * Cmed = 55 +   *10
� Fk  Fk 1 �  35  17 
� �
� �
= 61.67

2.3.1 Propiedades de la Mediana


k k
1) 
i 1
fi X i  X  f
i 1
i X i  A ; para cualquier observación A del conjunto.

 n 
  Fk 1 
2) La fórmula: X%  lmed   2  * Cmed ;
 Fk  Fk 1 
 
En términos de las frecuencias relativas acumuladas será:
�n �
� 2  H k 1 �
X%  lmed  � � * Cmed ;
� H k  H k 1 �
� �
� �
Completar las propiedades de la Mediana:

6
3)

4)

5)

6)

7)

2.4. CUARTILES  Qi 
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales.
0% 25% 50% 75% 100%
________________________________________________________________
Q1 Q2 Q3

Q1 = 1er. Cuartil, deja 25% de observ. menores o iguales a él y 75% superiores a él


Q2 = 2do. Cuartil, coincide con la mediana.
Q3 = 3er. Cuartil, deja 75% de las observaciones inferiores ó iguales a él y el 25% de éstas
superiores a él.

Determinación de Q1:
1er. Paso.- Calculamos n/4
2do. Paso.- Identificación de la clase que contiene a Q1, por la siguiente
n
desigualdad: Fk-1 ≤ < Fk
4
3er. Paso.- Aplicamos la siguiente fórmula:
�1n � �1n �
� 4  Fk 1 � � 4  H k 1 �
Q1  lQ1  � �* CQ1 ó Q1  lQ1  � �* CQ1 (frecuencias relativas)
� Fk  Fk 1 � � H k  H k 1 �
� � � �
� � � �
Donde:
lQ1 = Límite inferior de la clase que contiene a Q1.
n = Tamaño de la muestra
CQ1 = Amplitud de clase que contiene a Q1.
Fk = Frecuencia acumulada de la clase que contiene al primer
cuartil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a Q1
Determinación de Q3:

7
3n
1er. Paso.- Calculamos
4
2do. Paso.- Identificamos la clase que contiene a Q3, por medio de las frecuencias
acumuladas:
3n
Fj-1 ≤ < Fj
4
3er. Paso.- Aplicamos la siguiente fórmula:
� 3n � � 3n �
� 4  F j 1 � � 4  H j 1 �
Q3  lQ3  � �* CQ3 ó Q3  lQ3  � �* CQ3 ; en frec. relativas
� F j  Fj 1 � � H j  H j 1 �
� � � �
� � � �

Donde:
lQ 3 = Límite inferior de la clase que contiene a Q3
n = Tamaño de la muestra
CQ3 = Amplitud de clase que contiene a Q3.
Fj = Frecuencia acumulada de la clase que contiene a Q3.
Fj-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que
contiene a Q3

Ejm. 14: Dada la siguiente distribución, determinar los cuartiles Q1 y Q3.


Intervalos de clase [ 4, 14 > [ 14, 24 > [ 24, 34 > [ 34, 44 > [ 44, 54 >
fi 6 18 23 8 3
Solución: Tenemos
CLASES fi Fi
[ 4 , 14 > 6 6
[ 14 , 24 > 18 24 ← Clase que contiene a Q1
[ 24 , 34 > 23 47 ← Clase que contiene a Q2, Q3
[ 34 , 44 > 8 55
[ 44 , 54 > 3 58
TOTAL n = 58

Para Q1:
Paso 1): n/4 = 58/4 = 14.5 → está en la 14.5va. Posición.
Paso 2): Identificamos la clase q´ contienen a Q1 por medio de frecuencia
acumulada (Fi)
n
F1 < = 14.5 < 24 = F2; el intervalo de clase q’ contiene a Q1 es [14, 24 >
4
n 
 4  Fk 1   14.5  6 
Paso3): Q1  lQ1    * CQ1  14    * 10  18.72
 Fk  Fk 1   24  6 
 
Para Q3:

8
3n 3*58
Paso 1): = = 43.5 → está en la 43.5va. Posición.
4 4
Paso 2): Identificamos la clase q’ contienen a Q3 por medio de frecuencia
acumulada (Fi)
3n
F2 = 24 < = 43.5 < 47 = F3; el intervalo clase q’ contiene a Q3 es [24,34>
4
 3n 
 4  Fk 1   43.5  24 
Paso 3): Q3  lQ3    * CQ3  24    * 10  32.48
 Fk  Fk 1   47  24 
 

25%_____ 25% _______ 25% _______ 25% _______


4 Q1 = 18.72 Q2 = 26.17 Q3 = 32.48 54

Para Q2:
El cálculo del 2do. cuartil será igual al procedimiento de la mediana, pasos de la
mediana:
1ro.- n/2; n/2 = 58/2 = 29 → está en la 29va. Posición.
2do.- Fk-1 ≤ n/2 < Fk
F2=24 < n/2=29 < F3=47; El intervalo de clase q’ contiene a Q2:
[24, 34 >
 n 
 2  Fk 1 
3er.- Por definición de la mediana: Q2  lQ2    * CQ2
 Fk  Fk 1 
 
 29  24 
 24    *10  26.17
 47  24 

2.5. DECILES (Di)


Valores que dividen a un conjunto de datos ordenados en forma ascendente ó descendente
en 10 partes iguales.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9

D1 = 1er. Decil, deja 10% de las observaciones menores o iguales a él.

D2 = 2do. Decil, deja 20% de las observaciones menores o iguales a él


.
.
D9 = 9no. Decil, deja 90% de observaciones menores o iguales a él y el 10% superiores a él.
PASOS:
i xn
1ro.) Calculamos ; i  1, 2,...,9
10

2do.) Identificamos la clase que contiene los Di por medio de la frecuencia acumulada:

9
Fk-1 ≤ (i x n)/10 < Fk

 i xn 
 10  Fk 1 
3ro.) Se aplica: Di  lDi    * CDi
 Fk  Fk 1 
 
Donde: lDi = Límite inferior de la clase que contiene a Di, i = 1, 2, . . ., 9
n = Tamaño de la muestra
CDi = Amplitud de clase que contiene a Di.
Fk = Frecuencia acumulada de la clase que contiene al i-ésimo decil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que contiene
a Di.

2.6. PERCENTILES (Pi)


Son valores que dividen la muestra ordenada en forma ascendente ó descendente en 100
partes iguales.

0% 1% 2% 50% 98% 99% 100%

P1 P2 P50 P98 P99


P1 = 1er. percentil, deja 1% de las observaciones menores ó iguales a él y el 99%
superiores a él.
.
.
.
P99 = 99avo. Percentil, deja 99% de las observaciones menores ó iguales a él y el 1%
superiores a él.

Cálculo de percentiles:
i xn
1ro.) Calculamos ; i  1, 2,...,98,99.
100

2do.) Identificamos la clase que contiene los Pi por medio de la frecuencia


acumulada:
Fk-1 ≤ (i x n)/100 < Fk
 i xn 
 100  Fk 1 
3ro.) Se aplica: Pi  lPi    * C Pi
 Fk  Fk 1 
 
Donde: lPi = Límite inferior de la clase que contiene a Pi, i = 1, 2, 3, . . ., 99
n = Tamaño de la muestra
CPi = Amplitud de clase que contiene a Pi.
Fk = Frecuencia acumulada de la clase que contiene a Pi.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que
contiene a Pi.

10
Ejm. 15: Determine el 4to. Decil y el 72vo. Percentil de la siguiente distribución de
frecuencias.
INTERVALOS fi Fi
[ 40 , 50 > 8 8
[ 50 , 60 > 20 28
[ 60 , 70 > 30 58 ← Clase de D4
[ 70 , 80 > 40 98 ← Clase de P72
[ 80 , 90 > 10 108
[ 90 , 100 > 2 110
TOTAL n = 110

Solución:
Cálculo de D4: Cálculo de P72:
i x n 4 x 110 i x n 72 x 110
1er. Paso.-   44   79.2
10 10 100 100

2do. Paso.- Identificación de la clase de D4 y P72 por medio de las frecuencias acumuladas:

D4: F2=28 < 44 < 58=F3 P72: F3=58 < 79.2 < 98=F4

3er. Paso.- Por definición de D4 y P72 tenemos sus cálculos respectivos:

 4n 
 10  Fk 1   44  28 
Para D4: D4  lD4    * CD4  60    *10  60  5.33  65.33
 Fk  Fk 1   58  28 
 

Para P72:
 72 n 
 100  Fk 1   79.2  58 
P72  lP72    * CP72  70    *10  70  5.3  75.3
 Fk  Fk 1   98  58 
 

Rpta. D4: El valor 65.33 divide la muestra en dos partes: una con 40% de los elementos y
la otra con 60% de elementos.
P72: El valor 75.3 indica que 72% de la distribución está debajo de él y 28% superior a él.
(

2.7. La Moda X  Mo 
Es un valor de la variable que tiene la más alta frecuencia, el valor más frecuente de la
distribución. La moda no siempre existe y no siempre es única. Se tiene:
i) La distribución que tiene una sola moda: “unimodal”
ii) La distribución que tiene dos modas: “bimodal”
iii) La distribución que tiene más de dos modas: “multimodal”

Ejm. 16: Considere la distribución de los pesos de 14 muestras de Oro (grs):

11
63, 67, 70, 69, 81, 57, 63, 73, 68, 63, 71, 71, 71, 83

Solución: 63 y 71 ocurren 3 veces, y el resto una vez. La moda estas muestras es:
X = 63 grs. y X = 71 grs. (distribución bimodal)

Ejemplo: Considere los pesos (Kgrs) de Slurrex en 9 taladros de minería.


82, 65, 59, 74, 60, 67, 71, 73, 70
Solución: No definen una moda.

2.7.1 Propiedades de la Moda:


1) El valor de la moda es independiente de los valores extremos
2) La moda es inestable, varía sí se cambia el intervalo de clase.
3) Es limitado cuando no se dispone de un gran número de valores.
4) Es el valor típico, y por ello el promedio más descriptivo.
5) La moda no se presta a manipulaciones algebraicas posteriores.

2.7.2 Cálculo de la Moda: Datos agrupados en intervalos de clase.


1er. Proceso: Fórmula Czuber
1ro) Identificación de la clase modal (de mayor frecuencia)
(  1 
2do) Fórmula: X  M 0  lMo    * CMo
 1   2 
(
Donde: X  Mo = Moda
lMo = Límite inferior clase modal
Δ1 = fMo – f1 (f1 = frecuencia de clase anterior a la clase modal).
fMo = frecuencia de la clase modal
Δ2 = fMo – f2 (f2 = frecuencia de clase posterior a la clase modal).
CMo = Amplitud de la clase modal.

Ejm. 17: Determinar la moda de la siguiente distribución:


Intervalos de clase fi
[0, 1> 3
[1, 2> 10
[2, 3> 17
[3, 4> 8
[ 4,5> 5
TOTAL n = 43
Solución:
1ro) Intervalo de Clase de mayor frecuencia absoluta (17), es [2, 3 >
2do) Por Czuber:
(  1 
X  M 0  lMo    * CMo
 1   2 
Δ1 = 17 – 10 = 7;
Δ2 = 17 – 8 = 9;
CMo = 1

12
 7 
 2    *1
 79
 2.44

fi

Clase
2do. Proceso: Gráfica de la moda; construir el histograma de la distribución: identificar la
clase modal (clase con  altura) y diseñar la construcción.
2.8. MEDIA GEOMÉTRICA. ( X G )
Sean x1; …; xk valores de la variable X, asociadas a f1, f2, …, fk, respectivamente. La media
geométrica de “X”:
k
XG  G  n
x1f1 .x 2f 2 ... xkf k ; n=  fi
i 1

f log x  f 2 log10 x2  ...  f k log10 xk


Aplicando log.: log10 ( X G ) = log10 (G) = 1 10 1
n
k

�f i log10 xi
 i 1

n
�i �
��f i log10 xi �
Anti log. X G  Anti log. G  Anti log �i 1 �
� n �
� �
� �

Ejm. 18: Los datos en la tabla corresponden al análisis ambiental de la empresa minera
“X”, de hidroxiprolina absorbidos por un gramo de masa intestinal analizados en distintos
trabajadores:
Mgr hidroxiprolina 77.3 61.2 82.4 75.9 61 70.2 65
Numero de trabajador 3 10 15 13 8 5 2
Se pide: a) Cuantos trabajadores son analizadores
b) Calcular la X G de la distribución

13
c) Cuál es la moda.

Solución: Tabla de frecuencias


Xi fi Log fi log X i
Xi
61.0 8 1.785 14.280
61.2 10 1.787 17.870
65 2 1.813 3.626
70.2 5 1.846 9.230
75.9 13 1.880 24.440
77.3 3 1.888 5.660
82.4 15 1.916 28.740
a) Total 56 12.915 103.850 Número de trabajadores analizados:
7
n   fi  56
i 1

 7 
  f i log10 X i 
b) X G  G  Anti log  i 1 
 n 
 
 
 103.850 
X G  G  Anti log   = 71.53
 56 
(
c) X  M o  82.4 (se identifica de la mayor frecuencia absoluta).
2.9. MEDIA ARMÓNICA. ( X H )
Sean “X1, X2, …., XK,”; valores de la variable X, asociados a las frecuencias absolutas f 1, f2,
..., fk; respectivamente. La media armónica de X es:
n n
XH  H   k k
f 1  f 2  ...  f k n =  fi .
x1 x2 xk fi ;
i 1 xi
i 1

La ( X H ) como la ( X G ) , solo es aplicable a ciertos problemas.


2.9.1 Propiedades de la Media Armónica
1) La X H se basa en todas las observaciones por lo que esta afectado por los valores
de la variable. Da a valores grandes un peso menor frente a media geométrica, a
valores pequeñas de un peso mayor que el que da la media aritmética, la media
geométrica.
2) La X H es indeterminado si alguien valor de la variable es cero.
3) La X H se presta a manipulaciones algebraicas posteriores.
4) H  G  X , solo de la misma serie y cuando los términos no son iguales.

Ejm. 19: Un equipo liviano de mina recorre los 10 kilómetros a razón de 30 km/h, y los 10
km, siguientes a razón de 60 km/h. Determinar la velocidad media durante todo el
recorrido.
30  60
Solución: Si X = = 45km/h.
2

14
Pero la velocidad media es: la distancia total recorrida por el tiempo durante el proyecto.
A razón de 30 km/ h, gasta 20 minutos en 10 kilómetros iniciales, y a razón de 60 km/h,
gastó 10 minutos. Por tanto la unidad equipo liviano recorrió un total de 20 km en 20 + 10
= 30 min.  0.5 horas a velocidad media de:
20
= 40 km/h
0.5
n n
XH  H  
ie) Media Armónica entre dos velocidades: f1  f 2  ...  f k k

x1 x2 xk f
i 1
i
xi

2 2 120
XH   
(1/ 30)  (1/ 60) (3 / 60) 3
 40 km / h
2.10. MEDIA CUADRÁTICA ( X C )
Sean: x1, x2, ..., xK, valores de la variable X, asociadas a las frecuencias absolutas f 1, f2, ...,
fK, respectivamente. La media cuadrática de “X” es:
1
� k
� 2 k

f x  f 2 x 2  ...  f k x
2 2 2 �� fi xi2 � �f x i i
2
k

XC  1 1 k
 �i 1 � i 1 ; n= f 1

n � n � n i 1


� �

Observación.- la relación entre las medias es: H  G  X
Ejm. 20: En una distribución de frecuencias se multiplican los valores de la variable por 3
y se obtiene una media aritmética de 54; sí se suma 5 a los valores de la variable, se
obtiene una media cuadrática de 24. Calcule la media cuadrática de la variable original.

Solución: Sea “xi” valores de la variable X


1
�k 2 �
2 k

f x  f 2 x 2  ...  f k x
2 2 2 �� f i xi � �f x i i
2

XC  1 1 k
 �i 1 � i 1

n � n � n

� �

i) 3xi = yi → Y  3 X  54
54
X 
3
X  18
ii) Sí xi + 5 = Zi
k

→ Z C = Media cuadrática original= Z C  f i Z i2


 i 1

15
k

ZC  f i Z i2
 i 1
 24
n
n

Z 
2
 f i Z i2
  24 
C 2
 i 1

n
Z 
2
C

n n n

 f i  xi  5   fi  xi2  10 xi  25  fx  10 fi xi  f i 25 
2 2
i i
 i 1
 i 1
 i 1
 576
n n n
n

 
ZC
2
 fx 2
i i  10 f i xi  f i 25 
 i 1
 576
n
� f i xi2 �� f i xi � �� fi �
Z 
2
  10 � � 25  576
C
n � n � � � �

� � �n �

 Z   � nf x
2
2
 10  18   25  1  576
i i
C

Z   � f x
2
2
i i
C  371
n

ZC  371
� f i xi2
n
Z C  19.26
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN

Son los que cuantifican el grado de concentración o de dispersión de los valores de la


variable de un promedio o valor central de la distribución. Las medidas de dispersión se
necesitan para:
a) Para verificar la confiabilidad de los promedios y
b) Sirve como base para el control de la vocación misma,
Alta dispersión  Baja concentración
Baja dispersión  Alta concentración

2.11. DESVIACIÓN MEDIA O PROMEDIO


Sean x1, x2, ..., xK valores de la variable X, con f1, ..., fk. La desviación media de X respecto
a un promedio “p” es:
k

DM (p) = �
i 1
fi X i  p
; donde n = f
k

i
i 1
n

La desviación;
Respecto a la media aritmética es:

16
k

�f i Xi  X
; ó DM  X  
k

�h Xi  X
DM  X   i 1
i 1
i

Respecto a la mediana es:


k

�f X i  X% k

 
DM X%  i 1
i
; ó   �h
DM X%  i X i  X%
i 1
n

Donde: h1, h2, …, hk, son frecuencias relativas

2.11.1 Propiedades de la desviación media.

1.

2.

3.

4.

Intervalos [0, 2 > [2, 4 > [4, 6 > [6, 8 > [8,10> [10, 12> [12, 14> [14, 16> [16, 18> [18, 20>
N° Estud. 1 2 2 3 6 12 10 8 4 2
Ejm. 21: La siguiente distribución muestra las notas finales en Estadística, obtenida por 50
estudiantes de la Facultad de Ing. de Minas de la UNA.

1) Hallar la Desviación Media con respecto a la Media aritmética.


2) Hallar la Desviación Media con respecto a la Mediana.

Solución:
1) Desviación Media con respecto a la Media aritmética
k

f i Xi  X
DM  X   i 1

Completando la tabla de distribución de frecuencias.


Intervalos
de clase
fi hi Xi fi X i Xi  X fi X i  X hi X i  X

17
 0, 2 > 1 1 1 10.6 10.6
 2, 4 > 2 3 6 8.6 17.2
 4, 6 > 2 5 10 6.6 13.2
 6, 8 > 3 7 21 4.6 13.8
 8, 10 > 6 9 54 2.6 15.6
10, 12 > 12 11 132 0.6 7.2
12, 14 > 10 13 130 1.4 14.0

14, 16 > 8 15 120 3.4 27.2

16, 18 > 4 17 68 5.4 21.6

18, 20 > 2 19 38 7.4 14.8


Total 50 580 155.2

10

Se tiene: n
10

f  50 X =
 fi X i
580
i 1
i i 1
  11 .6
n 50

�f i Xi  X
155.2
DM  X   i 1
  3.104
n 50

DM  X   3.104

2) Desviación Media con respecto a la Mediana. (propuesto)


k

�f i X i  X%
 
DM X%  i 1

Completar la tabla de distribución de frecuencias.


Intervalos
fi Fi hi Hi Xi X i  X% f i X i  X% hi X i  X%
de clase
 0, 2 > 1 1 1 10.83 10.83
 2, 4 > 2 3 3 8.83 17.66
 4, 6 > 2 5 5 6.83 13.66
 6, 8 > 3 8 7 4.83 14.49
 8, 10 > 6 14 9 2.83 16.98
10, 12 > 12 26 11 0.83 9.96
12, 14 > 10 36 13 1.17 11.7

18
14, 16 > 8 44 15 3.17 25.36
16, 18 > 4 48 17 5.17 20.68
18, 20 > 2 50 19 7.17 14.34
Total 50 155.66

Mediana:
n 50
Paso 1) = ≈ 25vo → está en la 25va. Posición.
2 2

Paso 2) Clase q’ contiene a la mediana por la frecuencia acumulada (Fi):


n
Fk-1 < < Fk; F5 = 14 < 25 < F6 = 26; clase q’ contiene a la mediana es 6to.
2
�n �
�2  Fk 1 � �25  14 �
Paso 3) X%  lmed  � �* Cmed  10  � *2

� Fk  Fk 1 � � 26  14 �
� �
� �
 11.83

Desviación Media con respecto a la Mediana:


k

�f i X i  X%
155.66
 
DM X%  i 1

n

50
 3.113

 
DM X%  3.113
2.11.2 DESVIACION ABSOLUTA MEDIA (MAD).

MAD  Mediana de X i  Mediana de X i

Ejm. Considere el siguiente conjunto de valores: 1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6


Calcular la Desviación Absoluta Media (MAD).

Solución:
MAD  Mediana de X i  Mediana de X i ; n = 12

� �
X n  �X n � X 6to   X 7 mo. 
por definición:
%
X 2 � 2
1
� 2
2

3 4
X%  3.5
2

19
�1  3.5 ; 2  3.5 ; 2  3.5 ; 3  3.5 ; 3  3.5 , 3  3.5 ; 4  3.5 ; �
� �
MAD  Mediana de � �
�4  3.5 ; 4  3.5 ; 5  3.5 , 5  3.5 ; 6  3.5 �
MAD  Mediana de { 2.5; 1.5; 1.5; 0.5; 0.5; 0.5; 0.5; 0.5; 0.5; 1.5; 1.5; 2.5}

MAD  Mediana de { 0.5; 0.5; 0.5; 0.5; 0.5; 0.5; 1.5; 1.5; 1.5; 1.5; 2.5; 2.5} ; n =12

� �
X n  �X n � X 6to   X 7 mo. 
1 
X% 2 � 2 � 2
2

0.5  1.5
X% 1
2
MAD  1

2.12. VARIANZA Y DESVIACIÓN ESTÁNDAR


Sea X1, X2, …, Xk, valores de la variable “X”, con f 1, f2, …, fk respectivamente. La
Varianza muestral de X está dado por:
k

 f (X i i  X )2
n
Var. X   S 2   hi  X i  X 
2
t 1

n 1 n 1

k
Donde: n  f
i 1
i ; y h1 , h2 , ... , hk = frecuencias relativas.
Observación 1: La varianza en términos de la media poblacional “μ”:
k

 f (X i i   )2
N= f
k
es el tamaño de la población.
2  i 1
; i 1
i

N
Observación 2: Una fórmula alternativa para la Varianza muestral es:
k

 fi ( Xi  X ) 2
S2  i 1
;
n

20
Observación 3: Si S2 = 0,  los Xi coinciden con la media X , esto es que todas las
observaciones están concentradas en un mismo punto, por lo que la dispersión es nula.
La desviación estándar o típica de los valores de la variable “X” se define:
k

 f (X i i  X )2
S2   var( x )   i 1

n 1

2.12.1 Propiedades de la varianza y desviación estándar


1) Var (x) = S2 > 0; sí cste. “C”. Var[C] = 0
2) Var (x + C) = Var (x);
3) Var (CX) = C2 Var (X), C = Cte.
4) Var (CX + b) = C2 Var (X), C y b Cte.
5) Sean X 1 y X 2 las medias de dos submuestras de tamaño n1 y n2 y sean S12 y S 22
las varianzas correspondientes. La varianza de la muestra de tamaño n = n 1 + n2 está
dado:
S2 
1
n 1

(n1  1) S12  ( n2  1) S 22  n1 ( x1  x p ) 2  n2 ( x 2  x p ) 2 
donde: x p es la media ponderada de X 1 y X 2.

L L

La propiedad.  (ni  1) Si2  ni ( X i  X p )2


……………………… (*)
S2  i 1
 i 1

n 1 n 1
El primer y segundo término de (*) se llaman intravarianza e intervarianza respectivamente.
(Complete las propiedades propuestas)
6) .

7) .

8) Para distribuciones simétricas resulta:

a) El 68.27% de los casos están comprendidos entre X -S y X +S

68.27%

x
-S +S
X

21
b) El 95.45% de los casos están comprendidos entre X -2S y X +2S, esto es
aproximadamente 95% de los casos están situados dentro de dos unidades de
desviación estándar de la media.

95.45%

x
+2S

c)
X -2S
E
M
El 99.75%
X
de los casos están comprendidos entre X -3S y X +3S
BE
D
Eq
uat
ion 99.73%
.3
-

x
-3S +3S
X
2.12.2 MÉTODOS ABREVIADOS PARA EL CÁLCULO DE LA VARIANZA Y DESVIACIÓN
ESTÁNDAR
A) Primer método abreviado.- Uso de las siguientes fórmulas:

1  k  1 k 2
S2   
n  1  i 1
fi X i2  nX 2 

y S  
n  1  i1
fiX i
2
 n X 

Ejm. 22: Calcular la varianza y la desviación estándar de la siguiente distribución


muestral.
Xi 5 7 8 9 11
fi 2 3 5 4 2
k

Solución: S2 
1  k
 

fi X i2  nX 2  ; fX i i
; también n   f i
k

n  1  i 1  X 
i 1
i 1
n
Completando la distribución de frecuencias:
Xi fi fiXi fiX i2

22
5 2 10 50
7 3 21 147
8 5 40 320
9 4 36 324
11 2 22 242
Total n = 16 129 1083

129
X   8.1  X 2  65.61
16
1
 S 2   1083  16(65.61) 
15
= 2.216 → S = 1.49

B) Segundo método abreviado.- Sea Ot (origen de trabajo), y sea:


di = Xi – Ot; i = 1, 2, …, k

Las desviaciones de Xt respecto a Ot, se tiene:


Xi = di + Ot
Luego: X  Ot 
 fi di  O  d
t
n
1  k  1 k
S2   
n  1  i 1
f i ( X i  X )2  
 n 1
 f (d
i 1
i i  Ot  Ot  d )2

1 k 1  k 
S2  
n  1 i 1
f i ( X i  X ) 2
=   
n  1  i 1
f i di2  nd 2 

1  k 
S   
n  1  i 1
f i di2  nd 2 

C) Tercer método abreviado.- Para calcular la varianza se siguen los siguientes pasos:

1er. Paso: Cambio de la variable de X a U, utilizando:

X i  Ot
Ui  ; Donde: i = 1, 2, …, k
C
Ot = Origen de trabajo entre los puntos
medios de las clases.
C = Amplitud de clase
Ui = Valores transformados
Xi = Valores originales de la variable

2do. Paso: Se calcula la media aritmética: ( X )


 k 
  fi U i 
X  Ot  C  i 1   Ot  CU
 n 
 
 

23
3er. Paso: Cálculo de la Varianza: (S2)
1 k 1  k 
S2  
n  1 i 1
f i ( X i  X ) 2
  
n  1  i 1
f i (Ot  CU i  Ot  CU )2 

1 k C2 k
  i i
n  1 i 1
f (CU  CU ) 2
  fi (U i  U )2
n  1 i 1

C2  k 2
S2   
n  1  i 1
 
f iU i2  n U  y

1  k 2
S C  
n  1  i 1
 
f iU i2  n U 

Ejm. 23: Dada la distribución de frecuencias de 147 estudiantes según su edad. Calcule la
desviación estándar “S”.
Edad [ 20, 30 > [ 30, 40 > [ 40, 50 > [ 50, 60 > [ 60, 70 >
N° Estudiantes 15 22 45 40 25
Solución: Para cálculos ordenados, conviene considerar los siguientes pasos:
Resultados que necesitamos para desarrollar las fórmulas por 2do. y 3er. Método
Abreviado.

1er. Paso:
Sean: Ot = 45 (marca de clase de intervalo que tiene la más alta frecuencia)

di = Xi – Ot,
Marca de
Intervalo fi di fi d i f i di2
Clase Xi
[ 20, 30 > 15 25 -20 -300 6,000
[ 30, 40 > 22 35 -10 -220 2,200
-520
[ 40, 50 > 45 45 0 900
0
[ 50, 60 > 40 55 10 400 4,000
[ 60, 70 > 25 65 20 500 10,000
n=
TOTAL 380 22,200
147

2do. Paso:
Por el 2do. Método Abreviado:

24
1  k 
S   
n  1  i 1
f i d i2  nd 2 

1
S   22, 200  150(2.533) 2   11.939
149

3er. Paso:
Por el 3er. Método Abreviado:
X  Ot
Ui  i ; C = 10
C
Marca de
Intervalo fi Ui fi U i f iU i2
Clase Xi
[ 20, 30 > 15 25 -2 -30 60
[ 30, 40 > 22 35 -1 -22 22
-52
[ 40, 50 > 45 45 0 0
90
[ 50, 60 > 40 55 1 40 40
[ 60, 70 > 25 65 2 50 100
n=
TOTAL 38 222
147

1  k 2
S C  
n  1  i 1
 
f iU i2  n U 

1  
2
 38 
S  10  222  150     10 1.4253
149   150  

S  11.939
2.13. MEDIDAS DE DISPERSIÓN RELATIVA
Coeficiente de Variación ó Coeficiente de Dispersión, expresado como un porcentaje.
S
C.V . 
X
Ejm. 24: El C.V. de ingreso de 200 personas de una empresa minera es 57% al reajustar
según ley, todos los sueldos en S/. 1,100.00, éste C.V. es ahora de 50% sin embargo la
empresa fija un mínimo de S/. 7,100.00. Antes del reajuste habían 35 personas que tenían
un sueldo promedio de S/.4,000 y todos ganaban menos de S/. 6,000; con la nueva política
de la empresa, sus sueldos serán elevados a S/. 7,100. Determinar la cantidad de dinero que
necesitará mensualmente la empresa, para pago después de hacer los reajustes.

25
S
Solución: Datos: C.V. =
X

S
i) = 0.57  S = 0.57 X …………….. (1)
X
S
ii)  0.50  S  0.50( X  1,100) ……… (2)
( X  1,100)

(1) en (2):
0.57 X = 0.50 ( X + 1,100)
550
X =  7,857.14 (salario promedio antes del reajuste).
0.07

La ponderación de las medias de dos grupos:


35 personas con sueldo promedio de S/. 4,000
165 personas con sueldo promedio de X 2 que se obtendrá:

35(4,000)  165 X 2
7,857.14 = X p, =
200
luego:
(7857.14)(200) = 35(4000) + 165 X 2

1'571428  140000
X 2 =
165
X 2 = 8,675.32

Las nuevas medias aritméticas ( X ), después de los reajustes serán:


a) El 1er, grupo: n1 = 35 personas tendrá un sueldo promedio de Y 1 = S/. 7100
b) El 2do, grupo: n2 = 165 personas tendrán un sueldo promedio de
Y 2 = S/. 8,675.32 + 1,100 = 9,775.32

Por lo tanto: La cantidad que necesitará la empresa minera:


C.D. = 35 (7100 + 165(9775.32)
= S/. 1’861,427.8

26

S-ar putea să vă placă și