Sunteți pe pagina 1din 29

Plan de clase

Inicio

Competencias
Motivacin.
Saberes previos.

Medidas de dispersin. Varianza, desviacin estndar y coeficiente de


variacin.
Contenido de Grfico de caja.
sesin
Ejemplos.

Cierre

Retroalimentacin.
Autoevaluacin

CASO PRACTICO
A continuacin, se presentan las distribuciones de las calificaciones de dos bloques
(Bloque A y Bloque B) del curso Estadstica para Ingeniera I:
Bloque A:
Leaft Unit=1.0
Tallo

Hojas

55689

(12)

001112222234

10

55566789

00

27

27

2 = 4548

= 344
=1

=1

Bloque B:
Calificaciones

N de estudiantes

[5, 8>

[8, 11>

[11, 14>

[14, 17>

[17, 20]

2 = 4008.25

= 306.5
=1

=1

En cul de los dos bloques las calificaciones son ms homogneas?

Competencias

Al termino de la sesin, el
estudiante estar en capacidad
de:
Definir y calcular medidas de
dispersin.
Determinar la calidad del
estimador utilizando medidas de
dispersin apropiadas.
Interpretar un grfico de caja.
Resolver
problemas
de
aplicacin sobre los conceptos
desarrollados.

INTRODUCCIN

500

1500

2000

2050 2100

6250

Medidas de Dispersin
Las medidas de dispersin o variabilidad miden el grado de
concentracin de los datos con respecto a un valor central.
Para medir el grado de concentracin de los datos se tienen
en cuenta las desviaciones.
Las desviaciones son las diferencias entre los valores de los
datos y la media de estos.
Ejemplo
Del ejemplo anterior, tenemos:
500 2050 = -1550
1500 2050 = -550
6250 2050 = 4200

Varianza y Desviacin Estndar


Las medidas de dispersin o variabilidad que se estudiarn son:
1. Varianza (s2)
La varianza mide la dispersin de los datos con respecto a la
media.
Si los datos se encuentran cerca de la media entonces la varianza
ser pequea, en caso contrario la varianza ser grande.
2. Desviacin Estndar (s)
La desviacin estndar es la raz cuadrada de la varianza y mide la
desviacin promedio de cada observacin con respecto a la media.
Observacin
2 es la notacin de la varianza muestral y 2 es la notacin de la
varianza poblacional.

Frmulas para el clculo de la Varianza


Datos no agrupados:

=(

Obteniendo la forma abreviada:


2

=
=

=1(

)2
1

2
=1(

2 + 2 )
1

2
=1

2 =1 + =1
=
1


2
2
=1 2 =1 +
=
1
=
=

2
=1

2 + 2
1

2
=1

2 2 + 2
1

Datos agrupados:

2 =

=1

2
1

Propiedades de la Varianza
La varianza es siempre un nmero no negativo; es decir:
V(X)0.
La varianza de una constante es igual a cero; es decir:
V(k)=0, k es una constante.

Nuevo
dato

Nueva varianza

Nueva desviacin
estndar

Xb
cX
cXb

s2
c2 s2
c2s2

s
cs
cs

Coeficiente de Variacin
El Coeficiente de variacin es una medida de dispersin relativa
que nos permite comparar la variabilidad de dos o ms
conjuntos de datos, incluso cuando se encuentran en unidades
de medidas diferentes.

= %

Para tener en cuenta:


Casos:
CV 10%
10% < CV 30%
CV > 30%

Conclusin:
El conjunto de datos es homogneo.
El conjunto de datos es variable.
El conjunto de datos es heterogneo.

Ejemplo:
A continuacin, se presentan las distribuciones de las calificaciones de dos bloques
(Bloque A y Bloque B) del curso Estadstica para Ingeniera I:
Bloque A:
Leaft Unit=1.0
Tallo

Hojas

55689

(12)

001112222234

10

55566789

00

27

27

2 = 4548

= 344
=1

=1

Bloque B:
Calificaciones N de estudiantes
[5, 8>

[8, 11>

[11, 14>

[14, 17>

[17, 20]

2 = 4008.25

= 306.5
=1

=1

a) En cul de los dos bloques las calificaciones son ms homogneas?


b) Si en el Bloque B, las calificaciones se incrementan en 5% ms un punto,
la variabilidad aumenta o disminuye?
Solucin :
a) Para el aula A:
=

344
= 12.74 2 = 6.3729 = 2.5245
27
= 19.82%

Para el aula B:
=

306.5
= 12.26
25

2 = 10.44 = 3.2311

= 26.35%

En el aula A, las calificaciones son ms homogneas porque existe menor


variabilidad.
b) = 1.05 12.26 + 1 = 13.873 = 1.05 3.2311 = 3.3927
= 24.46%

El aumento del 5% de las calificaciones del bloque B, produce una


disminucin de la variabilidad.

Ejercicio Resuelto
El jefe de produccin de una empresa que fabrica focos ahorradores quiere obtener
informacin estadstica acerca del tiempo de vida de los focos producidos en sus dos
lneas de produccin. Para esto, ha tomado muestras de focos de ambas lneas,
obteniendo los siguientes resultados:
Para la lnea 1:

(en miles de horas)

N de focos
en la lnea 1

[1.05, 1.45>

[1.45, 1.85>

[1.85, 2.25>

15

[2.25, 2.65>

Totales

35

Tiempo de vida

Adems:
4
xif = 68.9500
i
i=1

4
x 2 f 140.2475
i i
i=1

Para la lnea 2:
Focos en la lnea 2 agrupados por su tiempo de vida
12

12

Frecuencia

10
8

4
2
0

1,05

1,45

1,85
Tiempo de vida

2,25

2,65

Luego de realizar los clculos necesarios, responda:


a) Cul de las dos lneas presenta tiempos de vida menos variables?
CV =
1

0.3604
1.97

= 0.1829

0.4014
CV =
= 0.2246
2
1.7875
Los focos de la lnea 1presentan tiempos de vida menos variables.

b) Para corregir los errores en la toma de los tiempos de vida en


ambas lneas, se realizan los siguientes cambios: En la lnea 1,
los tiempos se incrementaron en 10% ms 150 horas y en la
lnea 2, los tiempos se incrementaron en 600 horas. En cul de
las dos lneas, se presentan tiempos ms homogneos luego de
los cambios?
1.1x0.3604

CV =
= 0.1711
1 1.1x1.97 + 0.15
0.4014
CV2 =
= 0.1681
1.7875 + 0.6
Los focos de la lnea 2 presentan tiempos de vida ms homogneos.

Diagrama de Caja
En aos recientes se ha empleado con xito un resumen
grfico, llamado diagrama de caja, para describir varias de
las caractersticas ms destacadas de un conjunto de datos.
Entre estas caractersticas estn (1) centro, (2) dispersin,
(3) naturaleza y magnitud de cualquier desviacin respecto
a la simetra y (4) identificacin de valores atpicos,
observaciones bastante alejadas del grueso de los datos.
(Jay L. Devore, Probabilidad y Estadstica para Ingeniera y Ciencias)

Pasos para construir un Diagrama de


Cajas

Ordenar los datos de menor a mayor.


Calcular los cuartiles: Q1, Q2=Me y Q3.
Calcular la cuarta dispersin: fs= Q3 Q1.
Trazar el diagrama correspondiente.

Ejemplo 1
Valor
mnimo

12

14

Mediana
Q1

16

Valor
mximo

Q2

18

20

22

24

26

28

30

32

34

36

Minutos

Ejemplo 2
La empresa GyS manufacturas, ha evaluado el rendimiento de 15 de sus empleados
en tres sedes. Los puntajes alcanzados por los empleados se muestran en la tabla
siguiente:

En base a este grfico, responda:


En cul de las tres sedes se obtuvo puntajes ms homogneos en el 50% central?,
justifique.
En la sede 2, comparando los rangos intercuartlicos u observando el tamao de las
cajas.
Para la sede 2, qu tipo de asimetra se tiene en el 50% central de las
puntuaciones?
Tiene asimetra positiva.

Cmo se llaman los valores que estn representados por los


asteriscos?
Valores atpicos o outliers.
Para la sede 2, por qu el bigote es ms largo en el 25%
inferior en comparacin con el 25% superior?
Porque existe mayor variabilidad.
Es posible que el puntaje promedio de los empleados de la
sede 1 sea 72 puntos? Justifique.
Si, porque la distribucin presenta asimetra positiva y en este
caso el promedio es mayor que la mediana que es
aproximadamente 68 puntos.

Medidas de Asimetra
Estas medidas brindan informacin sobre la direccin horizontal que toma la
distribucin de los datos con respecto a su centro.

3 ( x Me )
Ak
s
< 0, la distribucin es asimtrica negativa o hacia la izquierda.

COEFICIENTE DE ASIMETRA

Si Ak
Si Ak = 0, la distribucin es simtrica.
Si Ak > 0, la distribucin es asimtrica positiva o hacia la derecha.

Ejemplo
Los gastos (en nuevos soles) en transporte semanal de los habitantes de la ciudad
A son:
18.1 18.5 18.7 19.9 20.4 20.5 21.1
21.3 21.3 21.5 22.0 22.0 22.2 22.4
Calcule e interprete el coeficiente de asimetra.

Solucin
Clculo de la media:
Clculo de la mediana:
Clculo de la desviacin estndar:

Por lo tanto, el coeficiente de asimetra es:


Como Ak = -1.037 es menor que cero, se concluye que la distribucin de
los gastos en transporte semanal presenta asimetra negativa.

Medidas de Curtosis
Estas medidas brindan informacin sobre la deformacin vertical de una distribucin de
frecuencias en comparacin con la curva normal.

COEFICIENTE DE KURTOSIS

KU

Si KU = 0,263 la distribucin es mesokrtica.


Si KU < 0,263 la distribucin es platikrtica.
Si KU > 0,263 la distribucin es leptokrtica

Q3 - Q1
2 ( P90 - P10 )

EJEMPLO 8
Considere los siguientes valores para P75, P25, P90 y P10:
P75 = 24
P25 = 20
P90 = 25
P10 = 18
Por lo tanto, el coeficiente de curtosis es:

Como Ku=0.286 es mayor que 0.263, se dice que la distribucin es


leptokrtica.

VERIFICANDO LO APRENDIDO

a)
b)

Los ingresos semanales de los 25


trabajadores de un hotel tienen un
coeficiente de variacin del 15%. Por
incremento del costo de vida, se decide
hacer un aumento del 20% de los
ingresos semanales ms un adicional de
60 soles; por lo que, el nuevo coeficiente
de variacin es igual al 10%.
Cul es el valor del ingreso semanal
promedio y la desviacin estndar antes
del aumento?
Cunto dinero necesita el hotel para
pagar los ingresos semanales despus
del aumento?

SNTESIS
Medidas de Dispersin

o
o
o
o
o

Cuartiles
Varianza (s2)
Desviacin Estndar (s)
Propiedades de la Varianza
Coeficiente de Variacin
Diagrama de Caja
Medidas de Asimetra
o Coeficiente de Asimetra
Medidas de Curtosis
o Coeficiente de Kurtosis

METACOGNICIN
Qu aspectos de las medidas de
dispersin te parecen interesantes?
Qu ventajas ofrece el anlisis del
Diagrama de Caja?
Qu competencias del tema podras
aplicar en tu vida diaria?

PARA REFORZAR LO APRENDIDO

RESOLVER LOS PROBLEMAS DE LA


GUA DE TRABAJO.

REFERENCIAS BIBLIOGRFICAS
1. Anderson, D. (2012) Estadstica para Negocios y Economa.
Mxico: CENGAGE Learning.
2. Chue, J. (2012) Estadstica Descriptiva y Probabilidades. Lima:
Universidad de Lima.
3. Lind, D. (2012) Estadstica Aplicada a los Negocios y la
Economa. Mxico: Mc Graw Hill.

S-ar putea să vă placă și