Documente Academic
Documente Profesional
Documente Cultură
UNIDAD 2:
MEDIDAS BSICAS ESTADSTICAS.
Logros
Describir la posicin de datos numricos
Describir la tendencia central de los datos numricos
Describir la variacin de los datos numricos
Describir la forma de una distribucin
Introducir la grfica de caja y bigotes de los datos numricos como una
herramienta para describir las caractersticas de los datos numricos
Calcular medidas descriptivas de resumen a partir de una poblacin.
Semana 6
2755
2850
2880
2880
2890
2920
2940
2950
3050
3130
3325
a. Determine el percentil 25
b. Determine el percentil 85
Se denomina as a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2
y Q3 respectivamente.
a. Percentil 25
25
x12 3
100
i es un nmero entero, entonces el percentil buscado ser el promedio de los valores de
los datos ubicados en los lugares 3 y 4.
i
Deciles
Se denomina as a cada uno de los nueve percentiles: P10, P20, P90 y se les denota como
D1, D2,, D9 respectivamente.
2850 2880
P25
2865
2
Percentiles
El percentil k-simo Pk es un valor tal que a lo ms el k por ciento de las observaciones son
menores o iguales que este valor.
b. Percentil 85
85
x12 10,3
100
Redondeando a ms se tiene que i = 11, por tanto su valor ser P85 = 3130
i
1300
1210
950
1200
1910
700
1300
1020
1500
870
kn
Nk
100
kn
100 N i 1
100 Fi 1
Pk Li
A Li
A
ni
fi
Li
N i 1
ni
n, A
fi
c. Cul debe ser el valor de la venta mxima de un vendedor nuevo para pertenecer al 15%
de los vendedores con las ms bajas ventas?
Fi-1
k 1, 2,...99
Ejemplo 2.
[0, 2)
N de personas acumuladas:
Frec acumulada
4
[2, 4)
11
[4, 6)
24
[6, 8)
34
[8, 10)
40
edad
Resultados de evaluacin
intervalos
ni
Ni
40-45
45-50
12
50-55
15
27
55-60
24
51
60-65
31
82
65-70
19
101
40 100
x 25%
x
Solucin Ubicacin Si 10
70-75
16
117
75-80
10
127
80-85
135
85-90
138
25%/2=12.5
50%
62.5%
Fuente: CHAMILLO
Solucin:
kn
100
62.5
* 40 25
100
. P37.5 4
15 11
* 2 4.61
13
P62..5 6
entonces
25 24
* 2 6.2
10
Las 10 edades centrales de las personas estn en el intervalo: [4,61; 6,2] aos
75n 3*138
103.5
100
4
2. Aplicando frmula:
75n
100 Ni 1
103.5 101
P75 Li
A 70
5 70.78 71
ni
16
Todos los alumnos con puntaje superior a 71 se hallan en el 25% superior, es decir, se
encuentran en el tercio superior.
Frecuencia
[12, 15)
[15, 18)
23
[18, 21)
17
[21, 24)
18
[24, 27)
[27, 30)
[30, 33)
[33, 36)
Responda
a) Un 50% de los vehculos se
vendieron por menos de que
cantidad?
b) Veinticinco de los vehculos
se vendieron por menos de qu
cantidad?
Grupo 2
Datos agrupados
Las medidas de tendencia central se refieren al valor que representa a los datos de
una determinada variable
La caracterstica ms importante que describe o resume un grupo de datos es su
VALOR CENTRAL.
Se debe recordar que estas medidas de tendencia central si son medidas en la
poblacin se denominan Parmetros (=media poblacional, =desviacin
poblacional, P: proporcin poblacional) y si son medidas en una muestra son
llamados Estadsticos ( x :media , s:desviacin estndar, p:proporcin).
0
25
3
45
5
60
8
28
Fuente: Gerencia de Produccin. Empresa A
Caractersticas de la moda
La moda se puede calcular para datos medidos en cualquier escala de medicin.
El valor de la moda no se ve afectado por valores extremos.
La moda no siempre es un valor nico. Una serie de datos puede tener dos modas
(bimodal) o ms modas (multimodal).
Agrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.
d1
ni ni 1
M o Lmo
A
A Lmo
d1 d 2
(ni ni 1 ) (ni ni 1 )
Ejercicio 3
Calcule e interprete la moda de los siguientes datos, que representa el
nmero de artculos comprados por 15 clientes de cierto supermercado tomados de dos das
en la semana.
Ni 1
Lmo
A
Ni 1 Ni 1
Grupo 1
Datos agrupados
11
Ejercicio 4
En la empresa A, se midi el nmero de errores por da que cometieron
158 obreros al ensamblar un determinado producto. Calcule e interprete la moda del
nmero de errores por obrero.
MODA
Donde
Lmo : lmite inferior de la clase modal
Frec.
absoluta
ni
4
4
14
12
6
Ni
4
8
22
34
40
ni ni 1
M o Lmo
A
(ni ni 1 ) (ni ni 1 )
14 4
30
1.5
14 4 14 12
OBSERVACIONES
a) Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda
2, 2, 3, 3, 6, 6, 9, 9
b) Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el
promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8
Mo = 4
74
234
125
712
234
68
350
503
149
489
440
489
279
57
37
327
215
185
252
608
123
141
27
358
55
758
521
425
43
72
302
303
321
863
127
203
a. Coloque los datos en una distribucin de frecuencias usando como S/.100 como ancho y
S/. 0 como punto de partida.
b. Trace la ojiva de frecuencias porcentuales acumuladas
c. El banco considera como cliente preferido a un estudiante con un alto saldo final de
S/.400 o ms en la cuenta. Estime el porcentaje de clientes preferidos
Interprete cada resultado
MEDIANA
Es el percentil 50.
xn , xn
2
Valor que se encuentra en la parte media o central de un grupo de datos ordenados. As,
esta mediana dividir al conjunto de datos en dos grupos con igual cantidad de datos
observados. El 50% de los datos con valores menores o iguales a la mediana y el otro 50%
restante con valores mayores a la mediana
3
4
5
6
valores
Ejercicio 5
Los siguientes datos indican el nmero de averas que se registraron en
las computadoras del centro de cmputo en la ltima semana.
2
5
1
4
Calcule la mediana del conjunto de datos e interprete.
Caractersticas de la mediana
1
2
Ejercicio 6
El tiempo de servicios de 8 profesores de la UTP fue tomado en cuenta
para el prximo aumento de sueldo que se va a efectuar a fin de mes, por la Oficina de
personal.
12
8
5
3
4
2
8
4
Calcule la mediana del conjunto de datos e interprete.
x c
i 1
n
, donde n es el tamao de muestra
2
Ejercicio 7
A continuacin, el jefe de control de calidad de una fbrica de
componentes electrnicos registra el nmero de componentes defectuosos en un lote de 20
artculos producidos:
Si i es entero, la mediana es el promedio de los valores de los datos ubicados en los lugares
i e i+1.
Si n es Impar, hay un trmino central, el trmino
xn
2
Nmero de artculos
producidos
3
5
9
3
20
Nmero acumulado de
artculos producidos
50n
50
100 N i 1
100 Fi 1
Me P50 Li
A Li
A
n
f
i
i
0.5 H i 1
Li
A k 50
hi
Ejercicio 8
El contador en jefe de la empresa A quiere preparar un informe acerca de
las cuentas por cobrar de la compaa. A continuacin se presenta una distribucin de
frecuencias que muestra la cantidad sobresaliente
DATOS
Marca
clase
0 , 2000 ]
de
ni
Sin agrupar
15
] 4000 , 6000]
18
] 6000 , 8000 ]
10
] 8000 , 10000 ]
40
] 10000 , 12000]
Ni
V. C. CONTINUA
n
Xi
i 1
xn
i i
i 1
xi fi
i 1
] 2000 , 4000 ]
V. C. DISCRETA
n
Agrupados
m .n
i
i 1
mi fi
i 1
Ejercicio 9
(Variables Discretas)
El fin de semana se ha registrado el nmero de
componentes electrnicos defectuosos producidos por una planta de ensamblaje de una
importante empresa proveedora de insumos y componentes electrnicos. El inspector de
control de calidad registr el nmero de componentes defectuosos en su ltima inspeccin
diaria:
3 2
5
6
1
4
2
5
x
i 1
Ejercicio 12
Se presenta a continuacin la informacin de una muestra de empleados
de cierta compaa.
Ejercicio 10
Con el fin de mejorar el tiempo de ensamblaje (en minutos) que tarda una
mquina en ensamblar equipos electrnicos, un supervisor registr los tiempos de las 7
ltimas mquinas ensambladas del turno maana:
13.2
15.2
16.3
16.1
17.8
Cul es el tiempo promedio de ensamblaje en el turno maana?
18.6
19.5
Solucin:
Calcule e interprete el promedio de cada una de las variables.
Ejercicio 11
Una importante empresa brinda soporte y servicio en software de
aplicacin, con especial nfasis en software educativo. Con el fin de consolidarse en el
mercado, lanz una agresiva campaa de marketing con el fin de elevar el nmero de
paquetes de software educativo vendido.
El siguiente cuadro muestra el nmero de paquetes de software educativo vendidos los 28
das de Febrero. Cul es el nmero promedio de paquetes de software vendido esos das?
Si en el mes de Enero se vendieron en promedio 13 paquetes, se podra concluir que la
campaa de marketing ha sido exitosa.
Ejercicio 13
En el distrito A se tom una muestra aleatoria a las jvenes y se les
pregunt por su estatura, en centmetros, obtenindose los siguientes resultados.
FEBRERO
L
M
M
J
V
S
D
5
3
2
1
0
2
3
1
5
4
3
2
1
0
2
1
3
4
5
2
4
4
3
1
2
3
4
5
Organice la informacin adecuadamente y realice las operaciones apropiadas para el
clculo de la media aritmtica del conjunto de datos.
Ni
Fi
0,48
0,32
0,95
800
100
entonces
Ejercicio 14
a. Si se realiza un aumento del 6% de todos los precios, calcule el nuevo precio medio los
jeans.
b. Si se aument seis nuevos soles a todos los precios, calcule el nuevo precio medio de los
jeans.
c. Si se hace una oferta y se rebaja 6 nuevos soles y, adems, 6% a todos los precios,
calcule el nuevo precio medio de los jeans.
3.
x
i 1
nx
n (x
i 1
x) 0
ni xi x ni xi B
k
i 1
i 1
Ejemplo 6
Ejemplo 5
(propiedad 2) En una empresa donde los salarios tienen una media
S/.100 000 el sindicato solicita que cada salario xi se transforme en y mediante la siguiente
relacin
media es 5
Demostraremos las propiedades 3 y 4
y = 2.5x + 100
1 , 3 , 3, 5, 5, 5, 7, 7, 9 Sabemos que la
( x x) 1 5 (3 5) (3 5) (5 5) (5 5) (5 5) (7 5) (7 5) (9 5)
clase, cuando los datos se han agrupado en intervalos de clase menor que o mayor
i 1
que siempre que puedan determinarse los puntos medios(marcas)de los intervalos
4 2 2 0 0 0 2 2 4 0
x
i 1
x
9
i 1
i 1
x 1 5 3 5 3 5 5 5 5 5 5 5 7 5 7 5 9 5
2
Ejemplo 9
x ni xi B
= 48
Para B=7
Intervalos
frecuencia
Menor o igual a 20
20,25
50
25 o ms
10
20
2
2
2
2
2
2
2
2
2
2
xi B 1 7 3 7 3 7 5 7 5 7 5 7 7 7 7 7 9 7
i 1
= 84 luego 48< 84
xp
w x
i 1
n
w
i 1
i i
xp x
valores extremos
Ejemplo 7
Ejercicio 15
Calcule la nota final de un alumno del curso de Estadstica de Estudios
Generales que tiene como notas las siguientes: 12, prctica calificada 4 = 15, examen
parcial = 12 y examen final = 10.
x 2 345 / 6 57.5
x 2 385 / 6 64.2
x 3 285 / 6 47.5
Ejemplo 8
Supongamos que tenemos una distribucin con los siguientes das de
hospitalizacin de heridos por accidente medidos en das:
5
25
72
66
75
70
110
10
MEDIA ARMNICA
MEDIA GEOMTRICA
Dados n datos x1, x2,, xn la media armnica de los datos se define como:
M .A
MG n X 1 X 2 ... X n
1
i 1 x
i
n
Ejemplo 11
La tasa de inters mensual que se pag por un prstamo recibido por 3
meses fue cambiando mes a mes; en el primer mes se pag un inters de 15%, en el
segundo mes 10% y en el tercer mes 16%. La tasa de inters promedio mensual que se
pag es:
Mes 1
2
3
Tasa 0.15 0.10 0.16
Ejemplo 10
Un auto va de Lima a Chosica con una velocidad constante de 20 Km/h y
regresa con una velocidad constante de 40 Km/h. Encontrar la velocidad promedio del
auto.
Vp
eT e1 e2
ee
2
26, 66km / h
e
e
1
1
tT
t1 t2
20 40 20 40
Ejemplo 21
Calcular el rendimiento promedio para el caso de tres automviles que
recorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente:
Auto
Rendimiento(km/galn)
M .A
n
i 1
1
ni
xi
A
50
B
62.4
M.G= xG
C
77.6
Ejemplo 12
El Producto Bruto Interno de un pas durante los ltimos cinco aos tuvo
la siguiente evolucin
Ao
1
2 3 4
5
PBI% +5 0 -1 +2 +4
...
50 62.4 77.6 50 62.4
77.6
61.334
1.0197-1=1.974503846
G = (1.97% anual)
M .A
1
1
i1 x ni
i
n
1500
61.334
24.4561
Verificacin:
Auto Km Rendimiento Total
A
500
50
B
500
62.4
C
500
77.6
Total
1500
galones
10
8.0128
6.4433
24.4561
11
Ejercicio 16
9,00
11,80
7,80
3,40
10,30
5,10
9,20
5,60
7,40
7,30
5,00
12,40
5,10
Ejemplo 13
Un estudiante de la carrera de marketing revis durante 11 das el ranking del Instituto
Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuacin se
presenta el listado que elabor de acuerdo al nmero de visitas por da a la pgina web
www.netjoven.pe
Nmero de visitas
por da a la pg web
4000
3200
3600
3500
3000
3250
2900
3400
3450
2800
3200
Solucin
A partir de las medidas de tendencia central indique la relacin y grafique la forma de la
distribucin del nmero de visitas.
Media =
Mediana =
Moda =
Ejercicio 17 Se toma una muestra de20 analistas financieros y se les pide que hagan una
prediccin sobre las ganancias por accin de cierta empresa para el prximo ao. Los
resultados aparecen resumidos en la siguiente tabla:
3300
3250
3200
Prediccin
($
por accin)
[9.45 , 10.45 ]
]10.45,10.95]
]10.95, 11.45 ]
] 11.45, 11.95]
[11.95,12.45 ]
12
Nmero de
analistas
a. Dibujar un histograma
b. Hallar las frecuencias relativas de la muestra
d. Hallar e interpretar las frecuencias relativas acumuladas de ala muestra
e. Estimar la media muestral de la prediccin
f. Estimar la mediana de la prediccin
g. Cul es la clase modal?
h. Qu forma tiene la distribucin de la prediccin?
Semana 7
MEDIDAS DE VARIABILIDAD
Con las medidas de tendencia central es posible determinar el valor central de una
distribucin, pero no indican qu tan cercanos o lejanos estn los datos de dicho
valor central.
Las medidas de variabilidad indican cun alejados estn los valores de una
variable del valor que los representa y por lo tanto permiten evaluar la
confiabilidad de ese valor central.
Cuando la medida de dispersin tiene un valor pequeo, los datos estn
concentrados alrededor de la medida central, en cambio si la medida de dispersin
tiene un valor grande, los datos no estn concentrados alrededor de la medida
central.
Muestra
(x
i 1
x)
Se usa **
s2
(x
i 1
x)
2
i
nx
n 1
13
Solucin
V(kX) = k2 V(X)
En general, para dos constantes a y b tenemos:
V(KX b) = K
Pginas web
www.netjoven.pe
Desviacin estndar
www.mujeractiva.com
V(X)
Ejercicio 2
DESVIACIN ESTNDAR s
N
1
2
3
4
5
6
7
8
Ejercicio 1
Sexo
3200
3600
3500
3000
3250
2900
3400
3450
2800
4300
4700
4400
4200
4200
4200
4100
4100
N
9
10
11
12
13
14
15
Edad 2
X:Edad
22
Sexo
s
Mujer=
Total
Total
3200
s
3200
Estatura
154
154
156
184
173
170
176
188
s
Hombre=
Edad
22
33
21
34
21
24
30
26
Sexo
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Mujer
Edad
27
31
18
28
35
28
39
Estatura
198
161
182
173
187
161
172
USANDO LA CALCULADORA
N de visitas por da
a la pgina web
www.netjoven.pe
Sexo
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
4300
s=
14
2
i
nx
n 1
Y:Edad
Edad2
Sexo
X:Estatura
Estatura
Sexo
Y:Estatura
Sobrepeso
(en libras)
Estatura
s
Hombre=
s
Mujer=
mi
zvvzv
mi2
Frecuencia
ni
0a6
14
6 a 12
42
12 a 18
58
18 a 24
28
24 a 30
ni mi2
nimi
Total
Total
Total
Amplitud =
2
i
nx
S2
n 1
ni (mi 2 )
( ni mi ) 2
n 1
s s2
s=
S2
n (m x )
i
n 1
S2
n (m
i
( ni mi )
n 1
n (m
i
) nx
Clases
mi
ni
nimi
-39.95% a -19.95%
-19.95 a 0.05%
0.05% a 20.05%
20.05% a 40.05%
40.05% a 60.05%
Total
Solucin
Sea X: rendimientos de unas acciones corregidas por el nivel de inflacin
Hallando la media
n 1
Ejercicio 3
. Las cuestiones de salud son de inters para directores o gerentes de
empresa, en especial porque evalan el costo de seguro mdico. En un reciente estudio de
150 ejecutivos de la empresa Telemax, una gran organizacin aseguradora y financiera
localizada en el suroeste , aparecieron las cifras de sobrepeso en libras de los ejecutivos.
Calcule la amplitud y la desviacin estndar. Interprete.
Sobrepeso
(en libras)
0a6
Frecuencia
:ni
14
6 a 12
42
12 a 18
58
18 a 24
28
24 a 30
de unas
acciones
nimi2
m .n
i
i 1
Solucin
inflacin son
15
Hallando la varianza
n (m
) nx
n 1
N de visitas por da
a la pgina web
www.mujeractiva.com
Muestra
s
x100%
x
3600
3500
3000
3250
2900
3400
3450
2800
4200
4100
4100
Promedio
Desviacin Estndar
Coeficiente
Variacin
www.netjoven.pe
3300
342,78
10,39%
www.mujeractiva.com
4170
383,12
9,19%
Gnero
4300
de
Gnero
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Edad
22
33
21
34
21
24
30
26
Estatura
154
154
156
184
173
170
176
188
N
9
10
11
12
13
14
15
Gnero
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Mujer
Edad
27
31
18
28
35
28
39
Estatura
198
161
182
173
187
161
172
Promedio
Desviacin estndar
Coeficiente de variacin
Hombre
Mujer
Ejercicio 4
Un estudiante de la carrera de Comunicaciones revis durante 11 das el
ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A
continuacin se presenta el listado que elabor de acuerdo al nmero de visitas por da a la
pgina web www.netjoven.pe
3200
4200
4000
4200
Pginas web
N
1
2
3
4
5
6
7
8
N de visitas por da
a la pgina web
www.netjoven.pe
4400
4700
CV
4300
Solucin
Poblacin
CV x100%
3200
3200
Hombre
Mujer
16
Promedio
Desviacin estndar
Coeficiente de variacin
Ejercicio 6 Ante la pregunta sobre el nmero de hijos por familia, una muestra de 12
hogares marc las respuestas mostradas a continuacin:
RANGO
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la
diferencia entre dato mayor (Xmax) y el dato menor (Xmin)
2
1
2
4
1
3
2
Calcule e interprete el valor del rango intercuartil.
Solucin
El percentil 75 es igual a y el percentil 25 es igual
luego el valor del rango intercuartil es .
Esto significa que
Ejemplo 1
Ante la pregunta sobre el nmero de hijos por familia, una muestra de 12
hogares marc las respuestas mostradas a continuacin:
2
17
Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como
referencia los valores de los cuartiles como medidas de posicin, la mediana como medida
de tendencia central y el valor del rango intercuartil como medida de dispersin. Adems,
permite apreciar la forma de la distribucin de los datos (simtrica o asimtrica).
Ejemplo 2
Se seleccion una muestra de 45 viviendas y se registr el monto cobrado
por la empresa proveedora por consumo de luz en el ltimo mes. Obtenga un diagrama de
cajas para mostrar la distribucin de los montos cobrados.
Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera dato
atpico a cualquier valor que est:
107,0
45,0
59,8
65,7
87,4
97,1
98,1
99,2
99,5
99,6
99,7
102,4
108,2
108,7
109,2
109,3
109,9
111,4
112,1
112,6
112,9
115,0
115,4
116,4
119,6
124,0
120,6
121,5
122,1
122,7
124,0
124,5
124,9
125,1
125,2
127,1
107,3
107,3
107,3
98,8
98,8
98,8
106,3
106,3
106,3
Se trazan los bigotes desde los extremos de la caja hasta los valores mnimo y
mximo dentro de
18
Rango
116.40
IQR
20.7
Q1 Mediana
Q3
99.35
108.70 120.10
0
13
2
14
3
14
4
15
11
15
11
15
12
15
12
15
12
15
12
20
12
20
12
12
13
13
H2
11
16
12
16
12
16
12
16
13
17
13
17
14
18
14
18
14
18
14
18
14
14
15
15
16
H3
0
14
0
15
1
15
3
16
3
16
4
16
5
17
10
17
11
17
11
12
12
13
13
13
19