Sunteți pe pagina 1din 19

Donde: k es el percentil y n es la cantidad de observaciones.

UNIDAD 2:
MEDIDAS BSICAS ESTADSTICAS.

Si la posicin del percentil es un nmero entero, el percentil buscado ser el


promedio de los valores de los datos ubicados en los lugares i e i +1.

Si la posicin del percentil no es un valor entero, entonces el valor se redondea a


ms y la posicin de ste nmero entero es el valor del percentil.

Logros
Describir la posicin de datos numricos
Describir la tendencia central de los datos numricos
Describir la variacin de los datos numricos
Describir la forma de una distribucin
Introducir la grfica de caja y bigotes de los datos numricos como una
herramienta para describir las caractersticas de los datos numricos
Calcular medidas descriptivas de resumen a partir de una poblacin.

Ejemplo 1 A continuacin se presentan los sueldos mensuales (en soles) de 12 periodistas.


2710

Semana 6

2755

2850

2880

2880

2890

2920

2940

2950

3050

3130

3325

a. Determine el percentil 25
b. Determine el percentil 85

MEDIDAS DE POSICIN: CUANTILES


Cuartiles

Solucin: X: sueldo mensuales (en S/.) de 12 periodistas


Observe que los datos ya se encuentran ordenados.

Se denomina as a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2
y Q3 respectivamente.

a. Percentil 25

25
x12 3
100
i es un nmero entero, entonces el percentil buscado ser el promedio de los valores de
los datos ubicados en los lugares 3 y 4.
i

Deciles
Se denomina as a cada uno de los nueve percentiles: P10, P20, P90 y se les denota como
D1, D2,, D9 respectivamente.

2850 2880
P25
2865
2

Percentiles

Interpretacin El 25%de los periodistas recibe un sueldo de a loms 2865 soles

El percentil k-simo Pk es un valor tal que a lo ms el k por ciento de las observaciones son
menores o iguales que este valor.

b. Percentil 85
85
x12 10,3
100
Redondeando a ms se tiene que i = 11, por tanto su valor ser P85 = 3130
i

Interpretacin El 85%de los periodistas recibe un sueldo de a loms 3130 soles

Percentil de datos no agrupados

Ejercicio 1 Una compaa Publicitaria solicit al rea de Recursos Humanos informacin


sobre las ventas (en miles de soles) obtenidas durante el ltimo mes de los 10 nuevos
vendedores. Los resultados se muestran a continuacin:

1300

Ordene los datos de manera ascendente o descendente.


Calcule la posicin i del percentil

1210

950

1200

1910

700

1300

1020

1500

870

a. Calcule e interprete el valor del cuartil 3, percentil 80 y decil 6.

Percentil de datos agrupados


Identificamos la clase o intervalo en que se encuentra el percentil Pk mirando en la columna
de las frecuencias relativas acumuladas.
El valor del percentil se determina por la siguiente expresin:
En primer lugar buscamos la clase donde se encuentra el percentil
b. Cul debe ser el valor de la venta mnima que debe tener el vendedor nuevo para
pertenecer al 15% de los que ms venden?

1. La clase del percentil debe ser

kn
Nk
100

2. Luego el percentil estar dado por la frmula

kn

100 N i 1
100 Fi 1
Pk Li
A Li
A
ni
fi

Orden del percentil

Li

N i 1
ni
n, A
fi

c. Cul debe ser el valor de la venta mxima de un vendedor nuevo para pertenecer al 15%
de los vendedores con las ms bajas ventas?

Fi-1

k 1, 2,...99

Lmite inferior del intervalo que contiene al percentil


Frecuencia acumulada considerada al intervalo donde se encuentra
Frecuencia del intervalo que contiene el percentil
n:Nmero de mediciones

A:amplitud del intervalo

Frecuencia relativa del intervalo que contiene el percentil


Frecuencia relativa acumulada considerada anterior al intervalo donde se
encuentra el percentil

Ejemplo 1 Al aplicar una evaluacin de Teora poltica a un grupo de 138 alumnos se


obtuvieron los siguientes puntajes, organizado en la siguiente distribucin de frecuencias.

Ejemplo 2.

Dada la distribucin de frecuencias absolutas acumuladas:


N de personas:
Fr absoluta

[0, 2)

N de personas acumuladas:
Frec acumulada
4

[2, 4)

11

[4, 6)

24

[6, 8)

34

[8, 10)

40

edad
Resultados de evaluacin
intervalos

ni

Ni

40-45

45-50

12

50-55

15

27

55-60

24

51

Entre qu valores se encuentran las 10 edades centrales?

60-65

31

82

65-70

19

101

40 100

x 25%
x
Solucin Ubicacin Si 10

70-75

16

117

75-80

10

127

80-85

135

85-90

138

Los 10 alumnos representan el 25% central de la distribucin.


37.5%

25%/2=12.5
50%

62.5%

Fuente: CHAMILLO

Determinar el 25% superior:

Debemos hallar P 37.5 y P62.5.

Solucin:

Hallando las posiciones


37.5
entonces
i
* 40 15
100

Sea X: puntajes de alumnos en la evaluacin de Teora Poltica

Calculando el cuartil Q 3=P75


En primer lugar buscamos la clase o intervalo donde se encuentra el percentil k=1, 2,3
usamos:

kn
100

1. Para determinar el intervalo donde est ubicado el P75 dividimos:

62.5
* 40 25
100

. P37.5 4

15 11
* 2 4.61
13

P62..5 6

entonces

25 24
* 2 6.2
10

Las 10 edades centrales de las personas estn en el intervalo: [4,61; 6,2] aos

75n 3*138

103.5
100
4

Ejercicio 2 La distribucin de frecuencias de precios de venta de los vehculos en Mazda es

se halla en el sptimo intervalo empieza en 102 y termina en 117


edad

2. Aplicando frmula:

75n

100 Ni 1
103.5 101
P75 Li
A 70
5 70.78 71
ni
16

Todos los alumnos con puntaje superior a 71 se hallan en el 25% superior, es decir, se
encuentran en el tercio superior.

Frecuencia

[12, 15)

[15, 18)

23

[18, 21)

17

[21, 24)

18

[24, 27)

[27, 30)

[30, 33)

[33, 36)

Responda
a) Un 50% de los vehculos se
vendieron por menos de que
cantidad?
b) Veinticinco de los vehculos
se vendieron por menos de qu
cantidad?

MEDIDAS DE TENDENCIA CENTRAL

Grupo 2
Datos agrupados

Las medidas de tendencia central se refieren al valor que representa a los datos de
una determinada variable
La caracterstica ms importante que describe o resume un grupo de datos es su
VALOR CENTRAL.
Se debe recordar que estas medidas de tendencia central si son medidas en la
poblacin se denominan Parmetros (=media poblacional, =desviacin
poblacional, P: proporcin poblacional) y si son medidas en una muestra son
llamados Estadsticos ( x :media , s:desviacin estndar, p:proporcin).

Empresa A. Nmero de errores al ensamblar el producto


Nmero de errores Nmero de obreros

La moda de un conjunto de datos observados de una variable es el valor que se presenta


con mayor frecuencia.

0
25
3
45
5
60
8
28
Fuente: Gerencia de Produccin. Empresa A

Caractersticas de la moda
La moda se puede calcular para datos medidos en cualquier escala de medicin.
El valor de la moda no se ve afectado por valores extremos.
La moda no siempre es un valor nico. Una serie de datos puede tener dos modas
(bimodal) o ms modas (multimodal).

MODA DE DATOS AGRUPADOS EN INTERVALOS

MODA DE DATOS NO AGRUPADOS

Identifique la clase con mayor frecuencia (clase modal).


Obtenga el valor de la moda mediante la expresin:

Agrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.

d1
ni ni 1
M o Lmo
A
A Lmo
d1 d 2
(ni ni 1 ) (ni ni 1 )

Ejercicio 3
Calcule e interprete la moda de los siguientes datos, que representa el
nmero de artculos comprados por 15 clientes de cierto supermercado tomados de dos das
en la semana.

Ni 1
Lmo
A
Ni 1 Ni 1

Grupo 1
Datos agrupados

11

Ejercicio 4
En la empresa A, se midi el nmero de errores por da que cometieron
158 obreros al ensamblar un determinado producto. Calcule e interprete la moda del
nmero de errores por obrero.

MODA

Donde
Lmo : lmite inferior de la clase modal

d1: diferencia entre las frecuencias de las clases modal y precedente


d2: diferencia entre las frecuencias de las clases modal y siguiente
A: amplitud de clase
Ejemplo 3
La siguiente informacin corresponde al tiempo de duracin (en horas) de
40 dispositivos electrnicos fabricados en la planta A de la zona de Ate-Vitarte.
Intervalo
de clase
[27 - 28.5 >
[28.5 - 30 >
[30 - 31.5 >
[31.5 - 33 >
[33 - 34.5 >

Frec.
absoluta
ni
4
4
14
12
6

Ni

4
8
22
34
40

ni ni 1
M o Lmo
A
(ni ni 1 ) (ni ni 1 )
14 4

30
1.5
14 4 14 12

OBSERVACIONES
a) Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda
2, 2, 3, 3, 6, 6, 9, 9
b) Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el
promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8

Mo = 4

RESOLVAMOS El National Bank seleccion una muestra de 40 cuentas de cheques de


estudiantes. A continuacin se presentan los saldos (en soles) a fin de mes
404
87
703
968

74
234
125
712

234
68
350
503

149
489
440
489

279
57
37
327

215
185
252
608

123
141
27
358

55
758
521
425

43
72
302
303

321
863
127
203

a. Coloque los datos en una distribucin de frecuencias usando como S/.100 como ancho y
S/. 0 como punto de partida.
b. Trace la ojiva de frecuencias porcentuales acumuladas
c. El banco considera como cliente preferido a un estudiante con un alto saldo final de
S/.400 o ms en la cuenta. Estime el porcentaje de clientes preferidos
Interprete cada resultado

MEDIANA
Es el percentil 50.

Si n es Par, hay dos trminos centrales,

xn , xn
2

Valor que se encuentra en la parte media o central de un grupo de datos ordenados. As,
esta mediana dividir al conjunto de datos en dos grupos con igual cantidad de datos
observados. El 50% de los datos con valores menores o iguales a la mediana y el otro 50%
restante con valores mayores a la mediana

3
4

5
6

1 la mediana ser la media de esos dos

valores
Ejercicio 5
Los siguientes datos indican el nmero de averas que se registraron en
las computadoras del centro de cmputo en la ltima semana.
2
5
1
4
Calcule la mediana del conjunto de datos e interprete.

Caractersticas de la mediana
1
2

Se puede calcular para variables medidas en escala ordinal, intervalo o razn.


La mediana es un estadstico que no se ve afectada por valores extremos. Por eso
se le utiliza cuando hay datos inusuales o el polgono de frecuencias no es muy
simtrico.
La mediana slo depende del nmero de datos ordenados y no del valor de los
datos. Por lo tanto no es sesgada por algn valor grande o pequeo.
La mediana puede ser calculada para distribuciones de frecuencia con intervalos
de diferente amplitud, siempre que se pueda determinar el lmite inferior del
intervalo de la mediana, Li
La mediana puede ser calculada para variables con valores en escala ordinal.
La suma de las diferencias (en valor absoluto) de n datos con respecto a su
mediana es mnima. En el caso de datos sin tabular, S (c)

Ejercicio 6
El tiempo de servicios de 8 profesores de la UTP fue tomado en cuenta
para el prximo aumento de sueldo que se va a efectuar a fin de mes, por la Oficina de
personal.
12
8
5
3
4
2
8
4
Calcule la mediana del conjunto de datos e interprete.

x c
i 1

MEDIANA PARA DATOS NO AGRUPADOS:


Calcule la posicin i de la mediana usando la siguiente frmula:
i=

n
, donde n es el tamao de muestra
2

Ejercicio 7
A continuacin, el jefe de control de calidad de una fbrica de
componentes electrnicos registra el nmero de componentes defectuosos en un lote de 20
artculos producidos:

Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posicin de


la mediana.

Registro de componentes electrnicos


Nmero de componentes
defectuosos
0
1
2
3
TOTAL
Fuente: La empresa

Si i es entero, la mediana es el promedio de los valores de los datos ubicados en los lugares
i e i+1.
Si n es Impar, hay un trmino central, el trmino

xn
2

que ser el valor de la mediana.

Nmero de artculos
producidos
3
5
9
3
20

Nmero acumulado de
artculos producidos

Calcule e interprete la mediana de la variable en estudio

MEDIANA PARA DATOS AGRUPADOS


MEDIA :

50n

50

100 N i 1
100 Fi 1
Me P50 Li
A Li
A
n
f
i
i

0.5 H i 1
Li
A k 50
hi

La media aritmtica o promedio de un conjunto de valores n es igual a la suma de cada


uno de las observaciones dividido entre el nmero de las n observaciones
CLCULO DE LA MEDIA ARITMTICA
Depender de la naturaleza de la variable y de cmo se encuentran los datos (sin agrupar y
agrupados)

Ejercicio 8
El contador en jefe de la empresa A quiere preparar un informe acerca de
las cuentas por cobrar de la compaa. A continuacin se presenta una distribucin de
frecuencias que muestra la cantidad sobresaliente

DATOS

Marca
clase

0 , 2000 ]

de

ni

Sin agrupar

15

] 4000 , 6000]

18

] 6000 , 8000 ]

10

] 8000 , 10000 ]

40

] 10000 , 12000]

Ni

V. C. CONTINUA
n

Xi

i 1

xn

i i

i 1

xi fi
i 1

] 2000 , 4000 ]

V. C. DISCRETA
n

Informe cuentas por cobrar


Cantidad (en $)

Agrupados

m .n
i

i 1

mi fi
i 1

mi: marcas de clase

Ejercicio 9
(Variables Discretas)
El fin de semana se ha registrado el nmero de
componentes electrnicos defectuosos producidos por una planta de ensamblaje de una
importante empresa proveedora de insumos y componentes electrnicos. El inspector de
control de calidad registr el nmero de componentes defectuosos en su ltima inspeccin
diaria:
3 2
5
6
1
4
2
5

Fuente: Gerencia de Recursos Humanos. Empresa A


a) Determine la mediana de la cantidad
b) Cul es el monto modal adecuado?

Cul es el nmero promedio de componentes defectuosos que el inspector registr en su


ltima inspeccin diaria?
La frmula a utilizar es:

x
i 1

Ejercicio 12
Se presenta a continuacin la informacin de una muestra de empleados
de cierta compaa.

Ejercicio 10
Con el fin de mejorar el tiempo de ensamblaje (en minutos) que tarda una
mquina en ensamblar equipos electrnicos, un supervisor registr los tiempos de las 7
ltimas mquinas ensambladas del turno maana:
13.2
15.2
16.3
16.1
17.8
Cul es el tiempo promedio de ensamblaje en el turno maana?

18.6

19.5

Solucin:
Calcule e interprete el promedio de cada una de las variables.

Ejercicio 11
Una importante empresa brinda soporte y servicio en software de
aplicacin, con especial nfasis en software educativo. Con el fin de consolidarse en el
mercado, lanz una agresiva campaa de marketing con el fin de elevar el nmero de
paquetes de software educativo vendido.
El siguiente cuadro muestra el nmero de paquetes de software educativo vendidos los 28
das de Febrero. Cul es el nmero promedio de paquetes de software vendido esos das?
Si en el mes de Enero se vendieron en promedio 13 paquetes, se podra concluir que la
campaa de marketing ha sido exitosa.

Ejercicio 13
En el distrito A se tom una muestra aleatoria a las jvenes y se les
pregunt por su estatura, en centmetros, obtenindose los siguientes resultados.

FEBRERO
L
M
M
J
V
S
D
5
3
2
1
0
2
3
1
5
4
3
2
1
0
2
1
3
4
5
2
4
4
3
1
2
3
4
5
Organice la informacin adecuadamente y realice las operaciones apropiadas para el
clculo de la media aritmtica del conjunto de datos.

Distrito A. Estaturas de una muestra de 800 jvenes


Estatura(en cm)
Marca de clase mi
ni
fi
[
,
]

Ni

Fi
0,48

0,32
0,95
800

Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

El directorio acoge parcialmente la peticin rebajando los salarios en un 10%, lo que es


aceptado. Se pide calcular la media aritmtica de la nueva distribucin de los salarios.

Complete la tabla de distribucin de frecuencias y calcule la estatura media.


Solucin: Tenemos
si
y
=
2.5x
x 100000
y 2.5x 100 2.5 *100,000 100 250,100

100

entonces

Por tanto es el salario que solicita el sindicato.


El salario propuesto por el directorio es z y 10% y 0.9 y entonces la media de la
nueva distribucin de salarios es

z 0.9 y 0.9 * 250,100 225,090

Propiedades de la media aritmtica

Ejercicio 14

1. Para un conjunto dado de observaciones, la media es nica.

a. Si se realiza un aumento del 6% de todos los precios, calcule el nuevo precio medio los
jeans.
b. Si se aument seis nuevos soles a todos los precios, calcule el nuevo precio medio de los
jeans.
c. Si se hace una oferta y se rebaja 6 nuevos soles y, adems, 6% a todos los precios,
calcule el nuevo precio medio de los jeans.

2. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media


queda multiplicada o dividida por dicho nmero y sumada o restada por otro nmero. Si
y = cx +-k entonces y c x +k
y c x -k
n

3.

x
i 1

En una tienda el precio medio de los jeans es de 74 nuevos soles.

nx

4. La suma de las desviaciones (diferencias) entre los valores de la variable x y su media


n

aritmtica x es cero, esto es

n (x
i 1

x) 0

5. La suma de los cuadrados de las desviaciones entre los valores de la variable x y de su


media aritmtica es mnima, para cualquier constante B, esto es
2

ni xi x ni xi B
k

i 1

i 1

Ejemplo 6

Ejemplo 5
(propiedad 2) En una empresa donde los salarios tienen una media
S/.100 000 el sindicato solicita que cada salario xi se transforme en y mediante la siguiente
relacin

Dado el conjunto de datos

media es 5
Demostraremos las propiedades 3 y 4

y = 2.5x + 100

1 , 3 , 3, 5, 5, 5, 7, 7, 9 Sabemos que la

( x x) 1 5 (3 5) (3 5) (5 5) (5 5) (5 5) (7 5) (7 5) (9 5)

clase, cuando los datos se han agrupado en intervalos de clase menor que o mayor

i 1

que siempre que puedan determinarse los puntos medios(marcas)de los intervalos

4 2 2 0 0 0 2 2 4 0

x
i 1

x
9

i 1

i 1

x 1 5 3 5 3 5 5 5 5 5 5 5 7 5 7 5 9 5
2

Ejemplo 9

x ni xi B

= 48
Para B=7

Intervalos

frecuencia

Menor o igual a 20

20,25

50

25 o ms

10

20

MEDIA ARITMTICA PONDERADA


Dados n datos x1, x2,, xn con pesos w1, w2,, wn la media aritmtica ponderada de los
datos es:

2
2
2
2
2
2
2
2
2
2
xi B 1 7 3 7 3 7 5 7 5 7 5 7 7 7 7 7 9 7
i 1

= 84 luego 48< 84

xp

La media aritmtica tiene por desventajas

w x
i 1
n

w
i 1

1. La media aritmtica queda fuertemente afectada o sesgada por la presencia de

Si todos los pesos son iguales, entonces

i i

xp x

valores extremos
Ejemplo 7

Ejercicio 15
Calcule la nota final de un alumno del curso de Estadstica de Estudios
Generales que tiene como notas las siguientes: 12, prctica calificada 4 = 15, examen
parcial = 12 y examen final = 10.

La media aritmtica de los grupos

a) 55 , 56, 57, 58, 59, 60


es igual a

b) 55, 56, 57,58,59,100

c)55, 56, 57, 58, 59,0

x 2 345 / 6 57.5

x 2 385 / 6 64.2

x 3 285 / 6 47.5

Ejemplo 8
Supongamos que tenemos una distribucin con los siguientes das de
hospitalizacin de heridos por accidente medidos en das:
5

25

72

66

75

70

110

La media es igual a 74 das, es una medida de centralizacin poco representativa de la


distribucin.
2. La media aritmtica no puede calcularse en las distribuciones que tienen intervalos de
clase de amplitud diferente incluso ,de extremos abiertos en la primera clase y ultima

10

MEDIA ARMNICA

MEDIA GEOMTRICA

Dados n datos x1, x2,, xn la media armnica de los datos se define como:

M .A

Dados n datos x1, x2,, xn

la media geomtrica de los datos se define como:

MG n X 1 X 2 ... X n

1
i 1 x
i
n

Ejemplo 11
La tasa de inters mensual que se pag por un prstamo recibido por 3
meses fue cambiando mes a mes; en el primer mes se pag un inters de 15%, en el
segundo mes 10% y en el tercer mes 16%. La tasa de inters promedio mensual que se
pag es:
Mes 1
2
3
Tasa 0.15 0.10 0.16

Ejemplo 10
Un auto va de Lima a Chosica con una velocidad constante de 20 Km/h y
regresa con una velocidad constante de 40 Km/h. Encontrar la velocidad promedio del
auto.

Vp

eT e1 e2
ee
2

26, 66km / h
e
e
1
1
tT
t1 t2

20 40 20 40

Factor 1.15 1.10 1.16

Ejemplo 21
Calcular el rendimiento promedio para el caso de tres automviles que
recorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente:
Auto
Rendimiento(km/galn)

M .A

n
i 1

1
ni
xi

A
50

B
62.4

M.G= xG

C
77.6

3 1.15 *1.10 *1.16 3 1.4674 1.136

M.G = (13.6% mensual)

Ejemplo 12
El Producto Bruto Interno de un pas durante los ltimos cinco aos tuvo
la siguiente evolucin
Ao
1
2 3 4
5
PBI% +5 0 -1 +2 +4

500 500 500


3
3

500 500 500


1
1
1
0.0489121

...
50 62.4 77.6 50 62.4
77.6

La tasa de crecimiento anual promedio del PBI sera:

xG 5 1.05 *1.00 * 0.99 *1.02 *1.04 1.0197

61.334

1.0197-1=1.974503846

G = (1.97% anual)

Kilmetros (CONSTANTE)/ Galn

FORMA DE LA DISTRIBUCIN (UNIMODAL) DE UNA VARIABLE

M .A

1
1
i1 x ni
i
n

1500
61.334
24.4561

Verificacin:
Auto Km Rendimiento Total
A
500
50
B
500
62.4
C
500
77.6
Total
1500

galones

10
8.0128
6.4433
24.4561

Adems de las medidas de tendencia central y dispersin, podemos estar


interesados en saber la forma que presenta el conjunto de datos que se est
analizando.
Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por
encima de la media, se dice que la distribucin es simtrica.
Si los datos por debajo de la media son ms frecuentes que aquellos por encima de
la media o viceversa, se dice que la distribucin es asimtrica.

Relacin entre media, mediana y moda


Para una distribucin unimodal, es decir, que tenga una sola moda, se cumplen de manera
general las siguientes relaciones.
Para una distribucin simtrica: Moda= Mediana = X

11

Para una distribucin asimtrica positiva: Moda< Mediana<

Para una distribucin asimtrica negativa:

Ejercicio 16

X < Mediana < Moda

Un grupo de alumnos de Publicidad se interes en analizar el tiempo (en segundos) que


tardan las personas en recordar al supermercado cuyo eslogan es Precios ms bajos
siempre. Este trabajo se aplic en el distrito Amrica de la ciudad de Lima, los resultados
obtenidos se muestran a continuacin.
Tiempo
(en segundos)

9,00
11,80

7,80
3,40

10,30
5,10

9,20

5,60

7,40

7,30

5,00

12,40

5,10

Determine y grafique la forma de la distribucin de los tiempos de recordacin del slogan


en este distrito.

Sesgo izquierdo o negativo

Simetra o sesgo nulo

Sesgo derecho o positivo

Ejemplo 13
Un estudiante de la carrera de marketing revis durante 11 das el ranking del Instituto
Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuacin se
presenta el listado que elabor de acuerdo al nmero de visitas por da a la pgina web
www.netjoven.pe
Nmero de visitas
por da a la pg web

4000

3200

3600

3500

3000

3250

2900

3400

3450

2800

3200

Solucin
A partir de las medidas de tendencia central indique la relacin y grafique la forma de la
distribucin del nmero de visitas.
Media =
Mediana =
Moda =

Ejercicio 17 Se toma una muestra de20 analistas financieros y se les pide que hagan una
prediccin sobre las ganancias por accin de cierta empresa para el prximo ao. Los
resultados aparecen resumidos en la siguiente tabla:

3300
3250
3200

Prediccin
($
por accin)
[9.45 , 10.45 ]

Como el valor de la moda < mediana < media


3200 < 3250 < 3300,
entonces la distribucin del nmero de visitas por da es asimtrica positiva.

]10.45,10.95]
]10.95, 11.45 ]
] 11.45, 11.95]
[11.95,12.45 ]

12

Nmero de
analistas

a. Dibujar un histograma
b. Hallar las frecuencias relativas de la muestra
d. Hallar e interpretar las frecuencias relativas acumuladas de ala muestra
e. Estimar la media muestral de la prediccin
f. Estimar la mediana de la prediccin
g. Cul es la clase modal?
h. Qu forma tiene la distribucin de la prediccin?

Semana 7
MEDIDAS DE VARIABILIDAD

Con las medidas de tendencia central es posible determinar el valor central de una
distribucin, pero no indican qu tan cercanos o lejanos estn los datos de dicho
valor central.
Las medidas de variabilidad indican cun alejados estn los valores de una
variable del valor que los representa y por lo tanto permiten evaluar la
confiabilidad de ese valor central.
Cuando la medida de dispersin tiene un valor pequeo, los datos estn
concentrados alrededor de la medida central, en cambio si la medida de dispersin
tiene un valor grande, los datos no estn concentrados alrededor de la medida
central.

Varianza Para datos simples


VARIANZA Se define como el promedio de los cuadrados de las desviaciones de los
datos respecto de su media aritmtica.
La varianza mide el grado de dispersin o variacin de los valores de una variable
con respecto a su media aritmtica.

Las unidades de la varianza son las unidades de los datos al cuadrado

Se denota por V(X), 2(varianza poblacional), s 2(varianza muestral).


Poblacin

Muestra

(x
i 1

x)

Se usa **

s2

(x
i 1

x)

2
i

nx

n 1

Propiedades de la transformacin: y = KX+B donde K Y B son constantes


La varianza de una constante es cero
V(B) = 0
La varianza de una variable multiplicada por una constante equivale a la varianza
de la variable multiplicada por dicha constante elevada al cuadrado:

13

Solucin
V(kX) = k2 V(X)
En general, para dos constantes a y b tenemos:
V(KX b) = K

Pginas web
www.netjoven.pe

Desviacin estndar

www.mujeractiva.com

V(X)
Ejercicio 2

DESVIACIN ESTNDAR s

A continuacin se presenta la informacin de una muestra aleatoria de 16 profesionales


egresados de la carrera de la FAYN.

Es la raz cuadrada positiva de la varianza.

Las unidades de la desviacin estndar son las mismas unidades de la variable.

Se denota por (desviacin estndar poblacional), (desviacin estndar muestral).

N
1
2
3
4
5
6
7
8

Caractersticas de la varianza y la desviacin estndar

La varianza y la desviacin estndar son nmeros reales no negativos.

Se pueden calcular para variables medidas en escala de intervalo o razn.

Se ven afectadas por valores extremos.

La varianza es expresada en unidades cuadrticas a las unidades de los datos,


mientras que la desviacin estndar es expresada en las mismas unidades de los
datos.

Ejercicio 1

Sexo

Un estudiante de la carrera de Comunicaciones revis durante 11 das el ranking del


Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A
continuacin se presenta el listado que elabor de acuerdo al nmero de visitas por da a la
pgina web www.netjoven.pe
4000

3200

3600

3500

3000

3250

2900

3400

3450

2800

4300

4700

4400

4200

4200

4200

4100

4100

N
9
10
11
12
13
14
15

Edad 2

X:Edad
22

Sexo

s
Mujer=

Total

Total

3200

s
3200

Estatura
154
154
156
184
173
170
176
188

s
Hombre=

Adems, la cantidad de visitas a la pgina web www.mujeractiva.com se presenta a


continuacin:
N de visitas por da
a la pgina web
www.mujeractiva.com

Edad
22
33
21
34
21
24
30
26

Sexo
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Mujer

Edad
27
31
18
28
35
28
39

Estatura
198
161
182
173
187
161
172

Calcule el valor de la desviacin estndar de la edad y de la estatura, en centmetros, para


el grupo de hombres y para el grupo de mujeres. Usando la frmula **

USANDO LA CALCULADORA

N de visitas por da
a la pgina web
www.netjoven.pe

Sexo
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer

4300

s=

Calcule el valor de la desviacin estndar de ambas pginas web. Usando la calculadora

14

2
i

nx

n 1

Y:Edad

Edad2

Sexo

X:Estatura

Estatura

Sexo

Y:Estatura

Sobrepeso
(en libras)

Estatura

s
Hombre=
s
Mujer=

mi
zvvzv

mi2

Frecuencia
ni

0a6

14

6 a 12

42

12 a 18

58

18 a 24

28

24 a 30

ni mi2

nimi

Total

Total

Total
Amplitud =

2
i

nx

S2

n 1

ni (mi 2 )

( ni mi ) 2

n 1

s s2

s=

La desviacin tpica estimada es


VARIANZA PARA DATOS AGRUPADOS

S2

n (m x )
i

n 1

S2

n (m
i

( ni mi )

n 1

CALCULAMOS la media y la varianza de los rendimientos


corregidas por el nivel de inflacin

n (m
i

) nx

Clases
mi
ni
nimi
-39.95% a -19.95%
-19.95 a 0.05%
0.05% a 20.05%
20.05% a 40.05%
40.05% a 60.05%
Total
Solucin
Sea X: rendimientos de unas acciones corregidas por el nivel de inflacin
Hallando la media

n 1

Ejercicio 3
. Las cuestiones de salud son de inters para directores o gerentes de
empresa, en especial porque evalan el costo de seguro mdico. En un reciente estudio de
150 ejecutivos de la empresa Telemax, una gran organizacin aseguradora y financiera
localizada en el suroeste , aparecieron las cifras de sobrepeso en libras de los ejecutivos.
Calcule la amplitud y la desviacin estndar. Interprete.
Sobrepeso
(en libras)
0a6

Frecuencia
:ni
14

6 a 12

42

12 a 18

58

18 a 24

28

24 a 30

de unas

acciones

nimi2

m .n
i

i 1

Interpretacin: Los rendimientos promedio de unas acciones corregidas por el nivel de

Solucin

inflacin son

15

Hallando la varianza

n (m

) nx

n 1

N de visitas por da
a la pgina web
www.mujeractiva.com

por el nivel de inflacin es


COEFICIENTE DE VARIACIN
Las medidas de variacin estudiadas son medidas de variacin absolutas pues estas se
expresan en las mismas unidades que la variable original (excepto la varianza que se
expresa en unidades al cuadrado).

Muestra

s
x100%
x

3600

3500

3000

3250

2900

3400

3450

2800

4200

4100

4100

Promedio

Desviacin Estndar

Coeficiente
Variacin

www.netjoven.pe

3300

342,78

10,39%

www.mujeractiva.com

4170

383,12

9,19%

Gnero

4300

de

Gnero
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer

Edad
22
33
21
34
21
24
30
26

Estatura
154
154
156
184
173
170
176
188

N
9
10
11
12
13
14
15

Gnero
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Mujer

Edad
27
31
18
28
35
28
39

Estatura
198
161
182
173
187
161
172

Promedio

Desviacin estndar

Coeficiente de variacin

Hombre
Mujer

Ejercicio 4
Un estudiante de la carrera de Comunicaciones revis durante 11 das el
ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A
continuacin se presenta el listado que elabor de acuerdo al nmero de visitas por da a la
pgina web www.netjoven.pe
3200

4200

a. Qu gnero presenta mayor variabilidad en la estatura? Justifique numricamente

El coeficiente de variacin se calcula en variables medidas en escala de razn.

4000

4200

Pginas web

N
1
2
3
4
5
6
7
8

Es til al comparar la variabilidad de dos o ms series de datos que se expresan en


distintas o iguales unidades, pero difieren a tal punto que una comparacin directa
de las respectivas desviaciones estndar no es muy til, por ejemplo, cuando las
medias estn muy distantes.

N de visitas por da
a la pgina web
www.netjoven.pe

4400

Ejercicio 5 A continuacin se presenta la informacin de una muestra aleatoria de 16


profesionales egresados de la carrera de Ciencias de la Comunicacin.

Caractersticas del coeficiente de variacin

4700

Los datos ms homogneos, en cuanto al nmero de visitas por da, se encuentra en la


pgina web www.mujeractiva .com , por tener menor valor de coeficiente de variabilidad.

El coeficiente de variacin es una medida de dispersin relativa libre de unidades por lo


que es til para comparar la variabilidad de dos o ms grupos de datos expresados en
distintas unidades de medida

CV

4300

Solucin

Interpretacin: La varianza estimada de los rendimientos de unas acciones corregidas

Poblacin

CV x100%

3200

Por lo tanto, el gnero que presenta mayor variabilidad es porque

3200

b. Qu gnero presenta menor dispersin en la edad? Justifique numricamente


Gnero

Si decide comparar la cantidad de visitas a la pgina web www.mujeractiva.com Cul de


las dos pginas web tiene datos ms homogneos? Justifique numricamente.

Hombre
Mujer

16

Promedio

Desviacin estndar

Coeficiente de variacin

Por lo tanto, el gnero que presenta menor dispersin esporque

Se puede calcular en variables medidas en escala de intervalo o razn

No se ve afectado por valores extremos.

Ejercicio 6 Ante la pregunta sobre el nmero de hijos por familia, una muestra de 12
hogares marc las respuestas mostradas a continuacin:

RANGO
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la
diferencia entre dato mayor (Xmax) y el dato menor (Xmin)

2
1
2
4
1
3
2
Calcule e interprete el valor del rango intercuartil.

Solucin
El percentil 75 es igual a y el percentil 25 es igual
luego el valor del rango intercuartil es .
Esto significa que

Caractersticas del rango

Se puede calcular en variables medidas en escala de intervalo o razn

Se ve muy afectado por valores extremos.

CALCULAMOS Se han de comparar la dispersin en los precios anuales de acciones que


se venden en menos de $10 y la dispersin en los precios de aquellas que se venden por
arriba de $60.El precio medio de las acciones que se venden a menos de $10 es $5.25 y la
desviacin estndar es de $1.52. El precio medio de las acciones que se negocian a ms de
$60 es $92.50 y su desviacin estndar es de $5.28
a. Por qu debe utilizarse el coeficiente de variacin para comparar la dispersin d los
datos?
b. Calcule los coeficientes de variacin Cul es su conclusin?

Ejemplo 1
Ante la pregunta sobre el nmero de hijos por familia, una muestra de 12
hogares marc las respuestas mostradas a continuacin:
2

Calcule e interprete el valor del rango.


Solucin
El rango R = mximo mnimo = 5 - 0 = 5
Esto significa, que el rango o amplitud para el nmero de hijos por familia en la muestra de
12 hogares es 5 hijos.
RANGO INTERCUARTIL
Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El
rango intercuartil elimina la influencia de los valores extremos.
Rango intercuartil = RIC = P75 P25
Caractersticas del rango intercuartil

17

Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como
referencia los valores de los cuartiles como medidas de posicin, la mediana como medida
de tendencia central y el valor del rango intercuartil como medida de dispersin. Adems,
permite apreciar la forma de la distribucin de los datos (simtrica o asimtrica).

Ejemplo 2
Se seleccion una muestra de 45 viviendas y se registr el monto cobrado
por la empresa proveedora por consumo de luz en el ltimo mes. Obtenga un diagrama de
cajas para mostrar la distribucin de los montos cobrados.

Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera dato
atpico a cualquier valor que est:

a ms de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil

a menos de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil


Pasos para trazar un diagrama de cajas

107,0

45,0

59,8

65,7

87,4

97,1

98,1

99,2

99,5

99,6

99,7

102,4

108,2

108,7

109,2

109,3

109,9

111,4

112,1

112,6

112,9

115,0

115,4

116,4

119,6

124,0

120,6

121,5

122,1

122,7

124,0

124,5

124,9

125,1

125,2

127,1

107,3

107,3

107,3

98,8

98,8

98,8

106,3

106,3

106,3

Solucin, Usando el paquete estadstico Minitab hallamos los estadsticos necesarios.


Comprueba que en verdad salen estos resultados! Sugerencia no agrupes los datos!!

Se traza un rectngulo con los extremos en el primer y tercer cuartil

En la caja se traza una recta vertical en el lugar de la mediana.

Se ubican los lmites mediante el rango intercuartil


el lmite superior est a 1,5(RIC) arriba (o a la derecha) de Q3
el lmite inferior est a 1,5(RIC) debajo (o a la izquierda) de Q1

Se trazan los bigotes desde los extremos de la caja hasta los valores mnimo y
mximo dentro de

los lmites inferior y superior.

Se marcan con un asterisco (*) las localizaciones de los valores atpicos.

Media Desv.Est. Varianza CoefVar Mnimo


104.97
22.12
489.34
21.07
10.70
Mximo
127.10

La siguiente figura presenta un diagrama de cajas con datos hipotticos.

18

Rango
116.40

IQR
20.7

Q1 Mediana
Q3
99.35
108.70 120.10

Diagramas de caja comparativos


Una ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite
la fcil comparacin visual de las caractersticas de varios conjuntos de datos.
Los diagramas de caja permiten comparar las distribuciones de los valores de una variable
cuantitativa en los diferentes niveles de otra variable cualitativa.
Ejercicio 7
Se desea comparar el resultado de la primera prctica de tres horarios de
Estadstica y Probabilidades, para lo cual, se tienen los siguientes resultados. Construya un
diagrama de cajas que permita comparar las notas en los tres horarios .
H1

0
13

2
14

3
14

4
15

11
15

11
15

12
15

12
15

12
15

12
20

12
20

12

12

13

13

H2

11
16

12
16

12
16

12
16

13
17

13
17

14
18

14
18

14
18

14
18

14

14

15

15

16

H3

0
14

0
15

1
15

3
16

3
16

4
16

5
17

10
17

11
17

11

12

12

13

13

13

19

S-ar putea să vă placă și