Documente Academic
Documente Profesional
Documente Cultură
Marzo de 2013
Prólogo
Este trabajo corresponde a la séptima edición de las notas de clases del curso de
Estadı́stica impartidas por el autor a los alumnos de la Facultad de Estudios Generales
Letras de la Pontificia Universidad Católica del Perú.
En esta edición se han corregido los errores encontrados y mejorado algunos ejemplos y
ejercicios propuestos. Se han mantenido enumerados los capı́tulos y secciones. También se
trata brevemente de la función generadora de momentos. Sin embargo, considero todavı́a
inconcluso el trabajo y continuaré la tarea de revisión del texto.
Agradezco a mi colega Richard Chávez por su valiosa ayuda y comentarios sobre los
temas de finanzas aquı́ tratados.
Finalmente, quiero advertir a los alumnos que este texto no debe sustituir a los principales
manuales del tema, ni a las clases, ni a sus propios apuntes, que espero ahora puedan hacer
en mejores condiciones. La lectura de la bibliografı́a sobre el tema es necesaria y valiosa para
un mejor aprendizaje.
1. Probabilidad 7
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
La regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2. Variable aleatoria 39
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3
4 Profesor José Flores Delgado Estadı́stica
4
Profesor José Flores Delgado ÍNDICE
5
6 Profesor José Flores Delgado Estadı́stica
Bibliografı́a 165
6
1. Probabilidad
1.1. Introducción
El objetivo es cuantificar las posibilidades que tengan ciertos eventos inciertos. Sin duda,
el evento incierto de mayor importancia para la estadı́stica ocurre cuando se infiere algo a
partir de solo una muestra, en este caso, es importante averiguar la veracidad o el grado de
credibilidad que se le pudiera dar a dicha generalización, por eso la probabilidad es de suma
importancia para la estadı́stica.
Es importante señalar que muchas veces se debe tomar una decisión en un contexto de
incertidumbre, en estos casos, la probabilidad resulta muy útil para evaluar los riesgos.
Ejemplo 1.1. Un lote contiene unidades que pueden tener algún defecto. Se escogerán dos
unidades al azar y se determinará si estas tienen algún defecto. Podemos considerar como
espacio muestral a Ω = { (0; 0), (0; 1), (1; 0), (1; 1) }, con la convención siguiente: el primer
componente de cada par ordenado representa el estado de la primera unidad y el segundo el
de la otra, además 0 significa que la unidad no tiene defectos y 1 que tiene alguno.
Definición 1.3. Evento Es cualquier subconjunto del espacio muestral1 . Es decir, salvo el
caso del evento φ, un evento es cualquier conjunto de resultados del experimento.
7
8 Profesor José Flores Delgado Estadı́stica
Definición 1.4. Diremos que un evento ocurre cuando al realizar el experimento el resultado
obtenido es uno del evento.
a) A ∪ B es el evento que ocurre si, y solo si, al menos uno de los dos eventos ocurre.
b) A ∩ B es el evento que ocurre si, y solo si, ambos eventos ocurren.
4. Si A es un evento de Ω, entonces:
Ac = Ω − A es el evento complementario de A y este ocurre si, y solo si, A no ocurre.
Ejemplo 1.3. Un inspector deberá revisar 3 trabajos, cualquiera de estos puede haber
satisfecho las especificaciones requeridas. Definamos los eventos Ai : el trabajo i satisfizo las
especificaciones, i = 1, 2, 3.
8
Profesor José Flores Delgado Probabilidad 9
Como ya se ha dicho la probabilidad debe procurar reflejar las posibilidades que tienen de
ocurrir los eventos, ası́, como los eventos provienen de distintos experimentos, existen muchas
formas de asignar una probabilidad. A continuación veamos cuándo una asignación de
probabilidades a los eventos de un espacio muestral se considera, en efecto, una probabilidad.
La definición de Kolmogorov establece cuáles son las condiciones mı́nimas que debe satisfacer
toda asignación o regla de probabilidades a fin de lograr todo un conjunto de propiedades.
Definición 1.5. Una probabilidad es una transformación, P , que asigna a cada evento,
A, de un espacio muestral, Ω, un número real: P (A) y que satisface las tres propiedades
siguientes, llamadas axiomas de probabilidad:
o, en notación abreviada:
∞
] ∞
X
P Aj = P (Aj )
j=1 j=1
#(A)
P (A) = , para cada evento A de Ω.
#(Ω)
Observación 1.1. Esta asignación es adecuada, pues, al ser cada resultado igualmente
probable de ocurrir, deberı́a tenerse que la probabilidad de un evento sea proporcional al
número de resultados que este tenga (a mayores resultados, mayor probabilidad); la división
entre el número de resultados posibles se hace para estandarizar, es decir, a fin de que toda
probabilidad esté entre 0 y 1.
9
10 Profesor José Flores Delgado Estadı́stica
Ejemplo 1.5. En el ejemplo 1.1 tenemos que el espacio muestral es finito, pues #(Ω) = 4.
Supongamos que cada resultado sea igualmente posible. Por lo tanto, es adecuado asignar
probabilidades de la manera clásica, es decir:
#(A)
P (A) = , ∀A ⊂ Ω.
4
#(A1 ) 2
a) La probabilidad de que ambas unidades estén igual es P (A1 ) = 4
= 4
= 12 .
#(A2 ) 2
b) La probabilidad de que la segunda unidad no tenga defectos es P (A2 ) = 4
= 4
= 12 .
#(A3 )
c) La probabilidad de que las dos unidades no tengan defectos es P (A3 ) = 4
= 14 .
A continuación veamos algunas de las demás propiedades que se derivan de las tres
básicas.
Observación 1.2. Las dos últimas propiedades se generalizan para tres o más eventos, como
se enuncian en la propiedad que se da después del ejemplo siguiente y en el primer ejercicio
propuesto, respectivamente.
10
Profesor José Flores Delgado Probabilidad 11
P (Ac ∩ B) ] (A ∩ B c ) = P (Ac ∩ B) + P (A ∩ B c ) = 0, 29 + 0, 19 = 0, 48
11
12 Profesor José Flores Delgado Estadı́stica
Ejemplo 1.7. Para producir cierto bien se usa solo uno de tres procedimientos principales
existentes (1, 2 y 3) y, opcionalmente, uno secundario (4). La probabilidad de usar el
procedimiento 1 es de 0,6; la probabilidad de usar el procedimiento 1 con el secundario
es igual a 0,24. La probabilidad de usar el procedimiento 2 sin el procedimiento secundario
es de 0,06. La probabilidad de usar el procedimiento 3 es de 0,25; y la probabilidad de usar
el procedimiento secundario con este procedimiento es de 0,16.
Obtengamos la probabilidad de usar el procedimiento secundario:
Estos eventos nos permiten expresar los datos dados con las notaciones necesarias para usar
las propiedades de la probabilidad:
12
Profesor José Flores Delgado Probabilidad 13
Como ya sabemos, una probabilidad P definida sobre los eventos de Ω cuantifica las
posibilidades que tienen de ocurrir dichos eventos. Sucede que en el transcurrir del tiempo
podemos ir recibiendo información que modifique el estado de incertidumbre que se tenı́a
sobre el experimento antes de realizarlo. Por ejemplo, si en una empresa el 70 % de los
proyectos que llegan se desarrollan a tiempo; entonces, podemos decir que si un proyecto
llega hay una probabilidad de 0, 7 de desarrollarlo a tiempo; sin embargo, resulta que
algunos proyectos llegan solo con un mes de anticipación, ¿se podrá decir que estos tienen la
misma probabilidad de ser desarrollados a tiempo? El conocimiento de esta información a lo
mejor afectará las probabilidades anteriores, por lo tanto, hay la necesidad de actualizar las
probabilidades iniciales con base en el conocimiento de la nueva información adquirida, dicho
de otro modo, este conocimiento nos debe llevar a un aprendizaje que se concreta o expresa
en una nueva regla de asignación de probabilidades, digamos P 0 . Dicha información nueva
es expresada como la ocurrencia de un evento B; y la nueva asignación de probabilidades P 0
es llamada “probabilidad condicional dado que ocurrió B” y se la define para cada evento
A, a partir de la probabilidad P, anterior a la información recibida, como:
P (A ∩ B)
P 0 (A) =
P (B)
Además, se suele denotar a esta nueva asignación de probabilidades, P 0 , como P ( / B), es
decir, para cada evento A de Ω se tiene que:
P (A ∩ B)
P (A/ B) =
P (B)
Obsérvese que para la asignación clásica resulta:
#(A∩B)
P (A ∩ B) #(Ω) #(A ∩ B)
P (A/ B) = = #(B)
=
P (B) #(B)
#(Ω)
Por lo que se interpreta como la probabilidad de que ocurra A, cuando el espacio Ω se reduce
al evento B.
13
14 Profesor José Flores Delgado Estadı́stica
A2. P (Ω/ B) = 1.
En general:
Ejemplo 1.8. Una empresa del paı́s se encuentra en cierto estado financiero si posee dos
caracterı́sticas, c1 y c2 ; la probabilidad de que posea c1 es de 0,9. Además, una de cada cuatro
empresas, que posee la caracterı́stica c1 , también posee la c2 .
Usaremos la regla anterior para calcular la probabilidad de que una de estas empresas,
escogida arbitrariamente, se encuentre en dicho estado financiero:
14
Profesor José Flores Delgado Probabilidad 15
15
16 Profesor José Flores Delgado Estadı́stica
En este caso los porcentajes se refieren a las probabilidades frecuenciales, y la pregunta puede
ser resuelta con porcentajes y un poco de razonamiento con aritmética; pero se trata de usar
las propiedades de probabilidad que ya hemos visto, como lo haremos a continuación:
A1 A2 A3 Total
B P (B ∩ A1 ) P (B ∩ A2 ) P (B ∩ A3 ) P (B)
Bc P (B c ∩ A1 ) P (B c ∩ A2 ) P (B c ∩ A3 ) P (B c )
Totales P (A1 ) = 0, 3 P (A2 ) = 0, 2 P (A3 ) = 0, 5 1
16
Profesor José Flores Delgado Probabilidad 17
P (B) = P (B ∩ A1 ) + P (B ∩ A2 ) + P (B ∩ A3 )
= P (A1 ) P (B/ A1 ) + P (A2 ) P (B/ A2 ) + P (A3 ) P (B/ A3 )
= (0,3)(0,01) + (0,2)(0,03) + (0,5)(0,04)
= 0,029
Las probabilidades de la primera fila del cuadro, o la de cada rama del árbol, pueden ser
completadas usando la regla del producto, P (B ∩ Ai ) = P (Ai )P (B/Ai ), ası́ obtenemos:
A1 A2 A3 Total
B P (B ∩ A1 ) = 0, 003 P (B ∩ A2 ) = 0, 006 P (B ∩ A3 ) = 0, 02 P (B) = 0, 029
Bc P (B c ∩ A1 ) P (B c ∩ A2 ) P (B c ∩ A3 ) P (B c )
Totales P (A1 ) = 0, 3 P (A2 ) = 0, 2 P (A3 ) = 0, 5 1
Y:
17
18 Profesor José Flores Delgado Estadı́stica
1.5. Independencia
Definición 1.6. Dado un espacio muestral Ω, sobre cuyos eventos se tiene definida una regla
de asignación de probabilidades P, se dice que dos eventos A y B son independientes, si:
P (A/ B) = P (A).
O, equivalentemente, si:
P (B/ A) = P (B).
Ası́, esto significa que el conocimiento de la ocurrencia de uno de los eventos no altera la
probabilidad de que ocurra el otro.
En este caso es razonable suponer que los eventos anteriores sean independientes, pues, la
ocurrencia de uno de ellos no altera la probabilidad de ocurrir el otro. Es decir, si denotamos
por A al primer evento, y por B al segundo, es claro que:
Supongamos que la probabilidad de que ocurra el primer evento antes mencionado sea 0,1,
y 0,05 la del segundo. Entonces, la probabilidad de que, durante el primer año, ocurra una
demanda muy baja y que la fábrica se vuelva anticuada, puede obtenerse a partir de la regla
del producto y el concepto de independencia, ası́, obtenemos que:
a) Ac y B; b) A y B c ; y c) Ac y B c .
18
Profesor José Flores Delgado Probabilidad 19
Observación 1.6. Ası́, podemos decir que dos eventos son independientes, si la probabilidad
de que ocurra uno de ellos no se altera aun sabiendo si ocurrió, o si no ocurrió el otro.
Ası́, por ejemplo, si se consideran n de tales eventos, digamos, Ai1 , Ai2 , . . . Ain , entonces:
P (Ai1 ∩ Ai2 . . . ∩ Ain ) = P (Ai1 )P (Ai2 / Ai1 )P (Ai3 / Ai1 ∩ Ai2 ) . . . P (Ain / Ai1 ∩ . . . ∩ Ain−1 )
P (A∩B) = P (A)P (B), P (A∩C) = P (A)P (C), P (B ∩C) = P (B)P (C) y P (A∩B ∩C) =
P (A)P (B)P (C).
Ejemplo 1.12. Sea Ω = {1, 2, 3, 4} y los eventos A = {1, 4}, B = {2, 4} y C = {3, 4}.
Si consideremos la probabilidad clásica, tenemos que:
Sin embargo, P (A ∩ B ∩ C) 6= P (A)P (B)P (C). Es decir, estos tres eventos no son
conjuntamente independientes; pero dos cualesquiera de estos sı́ lo son.
b) Por lo menos en uno de los años de este perı́odo la demanda sea muy baja.
19
20 Profesor José Flores Delgado Estadı́stica
e) Por lo menos en dos años de este perı́odo la demanda sea muy baja.
c) Aquı́, el evento que interesa es: (A1 ∩ Ac2 ∩ Ac3 ) ] (Ac1 ∩ A2 ∩ Ac3 ) ] (Ac1 ∩ Ac2 ∩ A3 ).
Cuya probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos
excluyentes anteriores, es decir:
P (A1 ∩ Ac2 ∩ Ac3 ) = P (A1 )P (Ac2 )P (Ac3 ) = (0, 1)(1 − 0, 1)(1 − 0, 1) = (0, 1)(1 − 0, 1)2
P (Ac1 ∩ A2 ∩ Ac3 ) = P (Ac1 )P (A2 )P (Ac3 ) = (1 − 0, 1)(0, 1)(1 − 0, 1) = (0, 1)(1 − 0, 1)2
P (Ac1 ∩ Ac2 ∩ A3 ) = P (Ac1 )P (Ac2 )P (A3 ) = (1 − 0, 1)(1 − 0, 1)(0, 1) = (0, 1)(1 − 0, 1)2
Por lo tanto, la probabilidad que interesa es: 3(0, 1)(1 − 0, 1)2 = 3(0, 1)(0, 9)2 .
d) Aquı́, el evento que interesa es: (A1 ∩ A2 ∩ Ac3 ) ] (A1 ∩ Ac2 ∩ A3 ) ] (Ac1 ∩ A2 ∩ A3 ).
Cuya probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos
excluyentes anteriores, es decir:
20
Profesor José Flores Delgado Probabilidad 21
P (A1 ∩ A2 ∩ Ac3 ) = P (A1 )P (A2 )P (Ac3 ) = (0, 1)(0, 1)(1 − 0, 1) = (0, 1)2 (1 − 0, 1)
P (A1 ∩ Ac2 ∩ A3 ) = P (A1 )P (Ac2 )P (A3 ) = (0, 1)(1 − 0, 1)(0, 1) = (0, 1)2 (1 − 0, 1)
P (Ac1 ∩ A2 ∩ A3 ) = P (Ac1 )P (A2 )P (A3 ) = (1 − 0, 1)(0, 1)(0, 1) = (0, 1)2 (1 − 0, 1)
Por lo tanto, la probabilidad que interesa es: 3(0, 1)2 (1 − 0, 1) = 3(0, 1)2 (0, 9).
e) Aquı́ el evento que interesa es la reunión del anterior, D, con el primero, A, es decir:
Como fue visto en el ejemplo 1.4, para calcular la probabilidad clásica de un evento se
requiere contar su número de resultados. Existen técnicas que facilitan el conteo, estas son
parte del llamado análisis combinatorio, a continuación describiremos brevemente algunas.
21
22 Profesor José Flores Delgado Estadı́stica
Ejemplo 1.14. Entre 20 empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras
15 del tipo ‘b’, se toma una muestra al azar de 4 de estas. Podemos describir el espacio
muestral asociado a este experimento, Ω, como el conjunto de subconjuntos de tamaño 4 que
se pueden determinar con 20 elementos.
Describamos dos eventos para ilustrar el uso del número combinatorio en el conteo:
En este caso el subconjunto elegido, además de ser de cuatro elementos, estos deben ser solo
del conjunto {1, 2, 3, 4, 5}, por lo tanto, A1 tiene:
5 5!
= = 5 resultados o elementos,
4 4! 1!
cualquiera de estos resultados determina la ocurrencia del evento A1 . Es decir, hay 5
posibilidades, entre 4 845, de que ocurra A1 .
b) Seleccionar solo empresas del tipo b. Entonces, el grupo de 4 empresas debe estar integrado
solo por 4 de las seis del tipo b que hay en total, ası́, este evento, digamos A2 , tiene:
15 15! 12 × 13 × 14 × 15
= = = 1 365 resultados o elementos.
4 4! 11! 1×2×3×4
En este caso hay 1 365 posibilidades, entre 4 845, de que ocurra A2 . Ası́, la probabilidad de
seleccionar solo empresas del tipo b es de 1 365 en 4 845.
22
Profesor José Flores Delgado Probabilidad 23
Ejemplo 1.15. En el mismo ejemplo anterior veamos dos eventos más para ilustrar las dos
técnicas vistas del análisis combinatorio:
a) A3 : Seleccionar solo tres empresas del tipo a. Ahora se completa el grupo de modo
que tenga tres empresas del tipo a y solo una del tipo b. Para determinar el número
de resultados que tiene este evento podemos, por ejemplo, describir sus elementos
enumerándolos abreviadamente y como una matriz de m filas y n columnas, de este
modo el producto m × n nos dará el número de resultados, veamos:
{1, 2, 3, 6}, {1, 2, 3, 7}, . . . {1, 2, 3, 20},
{1, 2, 4, 6}, {1, 2, 4, 7},
. . . {1, 2, 4, 20},
A3 =
... ... . . . ...
{3, 4, 5, 6}, {3, 4, 5, 7}, {3, 4, 5, 20}
. . .
Notemos que se han listado los resultados anteriores siguiendo un orden adecuado,
como para evitar dejar afuera alguno de ellos. También observemos que en este arreglo
el número de filas y el de columnas lo obtenemos usando el número combinatorio. En
efecto, como una fila es determinada por las tres empresas del tipo a que se hayan
elegido, hay 53 = 3!2!
5!
= 10 filas. Similarmente, cada columna es determinada por la
empresa del tipo b que se haya escogido, ası́, hay 15 15!
1
= 1!14! = 15 columnas. Entonces,
el número de casillas que hay en el arreglo anterior es 10 × 15 = 150 (por el principio
de la multiplicación), luego, el evento A3 tiene 150 resultados. Por lo tanto, hay 150
posibilidades, entre 4 845, de que ocurra A3 .
23
24 Profesor José Flores Delgado Estadı́stica
Ejemplo 1.16. En el contexto del ejemplo 1.14, supongamos ahora que en cada una de las
próximas semanas se visitará una empresa distinta y escogida aleatoriamente. Y nos interesa
obtener la probabilidad de que en la primera y cuarta semana se visite a una empresa del
tipo a.
Ahora el espacio muestral no estará integrado por subconjuntos o grupos de tamaño 4, sino
por cuartetos (grupo ordenado de tamaño 4), es decir:
Puesto que la primera empresa que visitar puede ser cualquiera de las 20, la segunda
cualquiera de las 19 restantes, la tercera cualquiera de las 18 restantes, y finalmente la cuarta
empresa por visitar puede ser cualquiera de las 17 restantes; entonces, por el principio de la
multiplicación, el número de resultados posibles lo podemos obtener mediante el producto
siguiente: #(Ω) = 20 x 19 x 18 x 17 = 116 280. Nuestro evento de interés lo podemos denotar
por E y describirlo como:
La primera empresa que visitar puede ser cualquiera de las 5 del tipo a, la cuarta cualquiera
de las 4 del tipo a restantes, la segunda empresa por visitar puede ser cualquiera de las 18
empresas restantes (entre las del tipo a y b), y la tercera cualquiera de las 17 restantes.
Entonces tenemos que #(E) = 5x4 × 18 × 17 = 6 120. Luego, P (E) = #(E) #(Ω)
6 120
= 116 280
1
= 19 .
Observación 1.10. Si m y n son dos números naturales, con m mayor o igual que n, al
número:
m!
Pnm = = m(m − 1) . . . (m − (n − 1))
(m − n)!
se le denomina número de permutaciones de m en n y nos da el número de n-tuplas (grupos
ordenados de tamaño n) que se pueden obtener a partir de m elementos.
24
Profesor José Flores Delgado Probabilidad 25
una región. Esta región puede ser un intervalo (por ejemplo de tiempo), un área o un volumen.
En este caso una manera natural de asignar probabilidades a los eventos del espacio muestral
(la región) es la siguiente:
medida de A
P (A) =
medida de Ω
esto para cada evento, A, de Ω.
Ejemplo 1.17. El precio del bien A varı́a aleatoria y uniformemente entre 100 y 200 soles,
y el precio del bien B varı́a entre 200 y 300 soles de manera aleatoria y uniformemente para
cualquiera que sea el precio del bien A.
Una persona que desea adquirir una unidad de cada bien dispone de un presupuesto de 450
soles. Se quiere cuantificar el riesgo que corre esta persona de no conseguir su objetivo.
Con la interpretación siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del
bien A es x soles y el del bien B es y soles.
La persona desea que su presupuesto de 450 soles alcance, es decir, que ocurra el evento
siguiente: E = { (x; y) ∈ Ω/ x + y ≤ 450} Y lo podemos representar gráficamente junto al
espacio muestral como sigue:
Por la condición del problema, cada resultado se distribuye indistintamente en toda la región
Ω, luego, la asignación de probabilidades adecuada para cada evento, A, de Ω es
b) La probabilidad de que una familia tengo ingresos anuales entre 1 y 1,5 um es 0, 13.
26
Profesor José Flores Delgado Probabilidad 27
Ejercicio 1.1.
P (A1 ∪ . . . ∪ An )
Xn XX XX
= P (Ai ) − P (Ai ∩ Aj ) + P (Ai ∩ Aj ∩ Ak ) + . . . + (−1)n+1 P (A1 ∩ . . . ∩ An ).
i=1 i<j i<j<k
P (A1 ∪A2 ∪A3 ) = P (A1 )+P (A2 )+P (A3 )−P (A1 ∩A2 )−P (A1 ∩A3 )−P (A2 ∩A3 )+P (A1 ∩A2 ∩A3 ).
Ejercicio 1.2.
Cierto agente invierte en dos acciones con la meta de ganar más de lo previsto, en por lo
menos una. La probabilidad de que gane más de lo previsto en la primera es de 0,3; y la de
que solo gane más de lo previsto en la segunda es de 0,2.
Cuantifique la confianza en lograr la meta.
Ejercicio 1.3.
En un supermercado los compradores tienen que elegir una de tres opciones de pago:
con dinero en efectivo, con crédito proporcionado por el supermercado y con crédito
proporcionado por otra entidad. La probabilidad de que un comprador pague con dinero
en efectivo es de 0,5. La probabilidad de que un comprador pague con crédito proporcionado
por el supermercado es de 0,3. El supermercado propone a los compradores una donación al
momento de pagar. La probabilidad de que un comprador pague con dinero en efectivo
y acepte donar es de 0,1. La probabilidad de que un comprador pague con crédito
proporcionado por el supermercado y no acepte donar es de 0,05. La probabilidad de que un
comprador pague con crédito crédito proporcionado por otra entidad y acepte donar es de
0,15.
a) Exprese los datos dados con eventos previamente definidos e identifique una partición
conveniente del espacio muestral.
27
28 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.4.
1 3
Q(A) = P1 (A) + P2 (A) .
4 4
b) Halle Q(Ω).
Ejercicio 1.5.
Sea P una probabilidad definida para los eventos de Ω. Sea C un evento tal que P (C) > 0.
Se define, para cada evento A de Ω :
P (A ∩ C)
Q(A) = .
P (C)
b) Halle Q(Ω).
Ejercicio 1.6.
c) Halle la probabilidad de que por lo menos dos de los tres eventos ocurran.
d) Halle la probabilidad de que por lo menos uno de los tres eventos no ocurra.
28
Profesor José Flores Delgado Probabilidad 29
Ejercicio 1.7.
Si P (A ∩ B c ∩ C) = 0, 8 y P (A ∩ B c ∩ C ∩ Dc ) = 0, 5.
a) Halle P (A ∩ B c ∩ C ∩ D).
b) Halle P (Ac ∪ B ∪ C c ∪ Dc ).
Ejercicio 1.8.
Las aguas pueden clasificarse, según su dureza, en cuatro tipos: blanda (cuando contiene
máximo 75 mg/L de CaCO3 ), moderadamente dura (cuando contiene entre 75 y 150 mg/L
de CaCO3 ), dura (cuando contiene más de 150 y hasta 300 mg/L de CaCO3 ) y muy dura
(cuando contiene más de 300 mg/L de CaCO3 ).
a) Exprese los datos dados con eventos previamente definidos e identifique una partición
conveniente del espacio muestral.
b) ¿Cuál es la probabilidad de que el jabón alcance los resultados esperados y sea usado
con aguas blandas?
c) ¿Cuál es la probabilidad de que el jabón alcance los resultados esperados y sea usado
con aguas muy duras?
29
30 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.9.
Un trastorno se manifiesta si, y solo si, se presentan por lo menos dos de tres sı́ntomas: s1 ,
s2 y s3 . La probabilidad de que se presenten los sı́ntomas s1 y s2 es de 0,56. La probabilidad
de que se presenten estos tres sı́ntomas es de 0,504. La probabilidad de que se presenten los
sı́ntomas s1 y s3 pero no s2 es de 0,105. La probabilidad de que se presenten los sı́ntomas s2
y s3 pero no s1 es de 0,117.
a) Exprese los datos dados con eventos previamente definidos e identifique una partición
del espacio muestral.
Ejercicio 1.10.
Ejercicio 1.11.
En la producción de cierto bien se puede usar, por lo menos, uno de tres procedimientos
secundarios (1, 2 y 3), cada uno de estos tiene una probabilidad de 0,55 de ser usado. La
probabilidad de que se usen el procedimiento 1 y 2 durante la producción es de 0,2. Los
procedimientos 1 y 3 son utilizados durante la producción, con probabilidad 0,25; lo mismo
ocurre cuando se usan los procedimientos 2 y 3. Además, la probabilidad de usar los tres
procedimientos en la producción es de 0,01.
a) Use los eventos Ai , antes definidos, y operaciones de conjuntos para expresar cada uno
de los eventos siguientes:
30
Profesor José Flores Delgado Probabilidad 31
Ejercicio 1.12.
Una entidad crediticia califica a las empresas de cierto grupo para otorgarles un crédito si, y
solo si, estas poseen al menos una de tres caracterı́sticas (s1 , s2 , s3 ). La probabilidad de que
una de estas empresas posea una sola de las caracterı́sticas es de 0,28 y la probabilidad de
que posea solo dos, de 0,67. Considere los eventos Ni : la cantidad de estas caracterı́sticas
que posee una empresa es igual a i, para i = 0, 1, 2, 3.
a) Use los eventos antes definidos para expresar los eventos siguientes:
c) Determine la probabilidad de que una empresa de este grupo no califique para el crédito
o bien califique por tener las tres caracterı́sticas.
d) Suponga que la probabilidad de que una empresa de este grupo califique para el crédito
sea de 0,96. ¿Cuál serı́a la probabilidad de que una de las empresas del grupo posea
las tres caracterı́sticas?
Ejercicio 1.13.
31
32 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.14.
d) Halle la probabilidad de que la demanda sea óptima y se logre los resultados deseados.
Ejercicio 1.15.
Ejercicio 1.16.
Con el fin de ganar 5 000 soles un inversionista realizará una de tres opciones. La probabilidad
de que se realice la opción 1 es 0,3. Si se realiza la opción 1, la probabilidad de ganar 5 000
soles es 0,4. Si se realiza la opción 2, lo cual ocurre con probabilidad 0,2, la probabilidad de
ganar 5 000 soles es 0,1. Cuando se realiza la opción 3, la probabilidad de ganar 5 000 soles
es 0,25. Cuantificar la confianza del inversionista en esta situación.
Ejercicio 1.17.
En el contexto del ejemplo 1.8, suponga ahora que una empresa se encuentra en dicho estado
financiero si también posee la caracterı́stica c3 . Si, además de la información ya dada, se sabe
que el 75 % de las empresas, que poseen las caracterı́sticas c1 y c2 , también presenta la c3 ;
¿cuál es la probabilidad de que una empresa se encuentre en este estado financiero?
32
Profesor José Flores Delgado Probabilidad 33
Ejercicio 1.18.
En la identificación de una cerámica2 , de cierto lugar arqueológico, esta puede ser preincaica,
con probabilidad 0,3, o bien incaica. Para ayudar a la identificación de esta cerámica se
observa si posee cierta caracterı́stica distintiva. Si la cerámica es preincaica, la probabilidad
que que posea la caracterı́stica distintiva es de 0,6; pero si la cerámica es incaica, la
probabilidad solo es de 0,1.
Ejercicio 1.19.
Estudios acerca de la calidad han determinado que un producto tiene un problema de calidad
cuando presentan los tres defectos siguientes: 1 (mala presentación), 2 (contenido) y 3 (peso).
La probabilidad de que el producto posea el defecto 1 es 0,05. Una de cada cuatro unidades
del producto que presentan el defecto 1, también presentan el defecto 2. Además, se sabe
que el 75 % de las unidades del producto, que presentan los defectos 1 y 2, también presenta
el defecto 3. Determine la probabilidad de que uno de los artı́culos del producto presente un
problema de calidad.
Ejercicio 1.20.
El economista obtendrá un beneficio si, y solo si, los tres proyectos resultaran exitosos. Halle
la probabilidad de que este economista obtenga un beneficio.
Ejercicio 1.21.
33
34 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.22.
Ejercicio 1.23.
Ejercicio 1.24.
Ejercicio 1.25.
El economista obtendrá un beneficio si, y solo si, por lo menos dos de los tres proyectos
resultaran exitosos. Cuantifique el riesgo que correrá al realizar los proyectos.
Ejercicio 1.26.
d) Si se ganó 5 000 soles, ¿cuál inversión es la más probable de haber sido realizada?
34
Profesor José Flores Delgado Probabilidad 35
Ejercicio 1.27.
– si se gana entre 20 mil y 40 mil soles, la probabilidad de que se logre la meta es de 0,6;
b) Si se logró la meta, ¿en cuál de los tres rangos mencionados es más probable que se
encuentre la ganancia en la operación? Recuerde justificar.
Ejercicio 1.29.
Las inversiones financieras (de resultados inciertos) han sido clasificadas, según el riesgo de
perder, en tres tipos: de riesgo bajo, de riesgo normal y de riesgo alto. Según las estadı́sticas,
la probabilidad de realizar una inversión de riesgo bajo es de 0,5 y la de realizar una inversión
de riesgo normal es de 0,3. Si la inversión es de riesgo bajo, la probabilidad de perder es de
0,1. La probabilidad de perder en una inversión de riesgo normal es de 0,15. Solo en una de
cada cinco inversiones, de riesgo alto, no se pierde.
35
36 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.30.
En la producción de cierto bien se usa solo uno de tres procedimientos principales (1, 2 y
3) y opcionalmente, por lo menos, uno de dos procedimientos secundarios (4 y 5). Si se usa
el procedimiento 1, lo cual ocurre con probabilidad 0,6, cada uno de los procedimientos
secundarios tiene una probabilidad igual a 0,4 de ser usado; en este mismo caso, la
probabilidad de que se usen ambos procedimientos es de 0,2. Si se usa el procedimiento
2, pueden usarse los procedimientos secundarios (4 y 5) de manera independiente cada uno
y con probabilidades 0,2 y 0,3, respectivamente. El procedimiento 3 puede usarse con una
probabilidad de 0,25, en este caso, la probabilidad de usar al menos uno de los procesos
secundarios es 0,85.
Ejercicio 1.31.
e) Por lo menos uno, de los cuatro clientes, decida comprar un artı́culo en promoción.
Ejercicio 1.32.
a) Estos eventos son excluyentes y cada uno tiene una probabilidad de 0,1.
b) Estos eventos son independientes y cada uno tiene una probabilidad de 0,1.
36
Profesor José Flores Delgado Probabilidad 37
Ejercicio 1.33.
d) Para un agente financiero resulta rentable la inversión en las cinco operaciones si, y
solo si, gana en por lo menos una de las tres primeras y gana en las dos últimas. Halle
la probabilidad de que resulte rentable la inversión en las cinco operaciones.
Ejercicio 1.34.
Ejercicio 1.35.
b) ¿Cuál es la probabilidad de que ocurra una pérdida a causa únicamente del evento E1 ?
c) ¿Cuál es la probabilidad de que ocurra una pérdida a causa únicamente del evento E2 ?
37
38 Profesor José Flores Delgado Estadı́stica
Ejercicio 1.36.
En una obra hay seis operarios, cada uno puede cometer algún error con una probabilidad de
0,05 e independientemente de los demás operarios. Calcular sus respectivas probabilidades:
Con fines de auditorı́a sobre 18 empresas aseguradoras que funcionan en nuestro medio (entre
las cuales tenemos a El Pacı́fico Peruano Suiza, Genarali Perú y La Positiva) se tomará una
muestra aleatoria de 5 de ellas. Determine la probabilidad de los eventos siguientes:
a) Que la muestra solo tenga una de las tres empresas antes citadas.
b) Que la muestra solo tenga dos de las tres empresas antes citadas.
d) Que la muestra incluya al menos una de las tres empresas antes citadas.
Ejercicio 1.39.
b) Halle el presupuesto mı́nimo necesario para garantizar, con una probabilidad mayor o
igual que 0,95, la adquisición de una unidad de cada bien.
38
2. Variable aleatoria
2.1. Introducción
Si tenemos una variable, X, para la cual desconocemos cómo asume sus valores, podemos
cuantificar esta incertidumbre asignando probabilidades sobre sus valores, de este modo se
tendrá un mejor conocimiento del comportamiento de ella. Esta asignación debe ser tal que
nos permita obtener la probabilidad de que la variable X asuma valores sobre cualquier
subconjunto, A, de valores posibles, es decir, P (X ∈ A). También es posible obtener un
modelo o función que nos dé tal asignación de probabilidades que permita una descripción
de la variable. A continuación formalizamos un poco más lo anterior.
Definición 2.1. Sea Ω un espacio muestral asociado a un experimento aleatorio. Una
variable aleatoria es una función, X, que transforma cada resultado, ω, del espacio muestral,
en un número real X(ω).
X: Ω→R
ω 7→ X(ω)
Observación 2.1. ¿Qué interpretación podemos dar a esta definición formal? Para
averiguarlo pongámonos en el papel de una persona que recibe u observa los valores de la
variable, para ella estos valores tendrán una naturaleza aleatoria, puesto que estos se originan
al transformar los resultados de un experimento aleatorio en números. El experimento que
da la aleatoriedad resulta, para dicha persona, como una “caja negra”, pues dicha persona
solo recibe los valores y no observa el experimento mismo, por lo tanto, para tener una
descripción de ella tendrá que hacerlo de manera indirecta y no a través del experimento
aleatorio mismo.
Ejemplo 2.1. En el contexto del ejemplo 1.14 del capı́tulo anterior, en donde se tienen 20
empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras 15 del tipo ‘b’, se toma una
muestra al azar de 4 de estas. Entonces, el espacio muestral asociado a este experimento es:
con la interpretación que las empresas están identificadas por los números naturales del 1 al
20 y los primeros 5 identifican a las del tipo a.
39
40 Profesor José Flores Delgado Estadı́stica
Veamos cómo se generan los valores de X a partir del experimento aleatorio que la origina,
es decir, entremos a la caja negra, pues en este caso es muy simple hacerlo.
{X = 4} = {{1, 2, 3, 4}, {1, 2, 3, 5}, {1, 2, 4, 5}, {1, 3, 4, 5}, {2, 3, 4, 5}}.
Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el
número 4, es decir, X(ω) = 4, ya que han sido seleccionadas cuatro de las empresas del tipo
a. Son 54 = 5 resultados que se convierten en el valor 4.
A continuación hagamos lo mismo para el resto de los valores posibles de esta variable:
{1, 2, 3, 6}, {1, 2, 3, 7}, . . . {1, 2, 3, 20},
{1, 2, 4, 6},
{1, 2, 4, 7}, . . . {1, 2, 4, 20},
{X = 3} =
... ... ... ...
{3, 4, 5, 6}, {3, 4, 5, 7}, . . . {3, 4, 5, 20}
En este caso todo resultado, ω, de este evento tiene la propiedad de ser transformado en el
número 3, es decir, X(ω) = 3, ya que han sido seleccionadas tres de las empresas del tipo a.
Son 53 × 15
1
= 10x15 = 150 resultados que se convierten en el valor 3.
{1, 2, 6, 7}, {1, 2, 6, 8}, . . . {1, 2, 19, 20},
{1, 3, 6, 7}, {1, 3, 6, 8},
. . . {1, 3, 19, 20},
{X = 2} =
... ... . . . ...
{4, 5, 6, 7}, {4, 5, 6, 8}, {4, 5, 19, 20}
. . .
Aquı́, todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número
2, es decir, X(ω) = 2, pues solo han sido seleccionadas dos de las empresas del tipo a. Son
5 15
2
× 2
= 10 × 15 = 150 resultados que se convierten en el valor 2.
{1, 2, 3, 6}, {1, 2, 3, 7}, . . . {1, 2, 3, 20},
{1, 2, 4, 6}, {1, 2, 4, 7},
. . . {1, 2, 4, 20},
{X = 1} =
... ... . . . ...
{3, 4, 5, 6}, {3, 4, 5, 7}, {3, 4, 5, 20}
. . .
Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el
número 1, es decir, X(ω) = 1, pues solo ha sido seleccionada una de las empresas del tipo
a. Son 51 × 15
3
= 5 × 455 = 2 275 resultados que se convierten en el valor 1.
40
Profesor José Flores Delgado Variable aleatoria 41
Finalmente:
{X = 0} = { {6, 7, 8, 9}, {6, 7, 8, 10}, . . . . , {6, 7, 8, 20}, . . . . , {17, 18, 19, 20} }.
Todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 0,
es decir, X(ω) = 0, ya que no han sido seleccionadas empresas del tipo a. Son 15
4
= 1 365
resultados que se convierten en el valor 0.
Definición 2.2. El rango de una variable aleatoria X, es el conjunto de valores posibles que
puede asumir la variable. Se lo denota por RX .
Ejemplo 2.2. En el ejemplo anterior, el rango de la variable aleatoria X es RX =
{0, 1, 2, 3, 4}.
Definición 2.3. Se dice que una variable aleatoria es discreta, si su rango es un conjunto
discreto; y continua, si su rango es un conjunto continuo.
Ejemplo 2.3. La variable aleatoria X, del ejemplo 1, es discreta.
Ejemplo 2.4. En el ejemplo 1.17 del tema anterior, en donde el precio del bien A varı́a
aleatoria y uniformemente entre 100 y 200 soles, y el precio del bien B varı́a entre 200 y 300
soles, el espacio muestral es: Ω = { (x; y) ∈ R2 / 100 ≤ x ≤ 200, 200 ≤ y ≤ 300} Con la
interpretación siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del bien A
es x soles y el del bien B es y soles.
Consideremos ahora la variable T definida como el precio total para adquirir una unidad de
cada uno de estos productos. Entonces, cada resultado posible, ω = (x, y), es transformado
por esta variable, T , en el número T ((x, y)) = x + y. Ası́, esta variable solo puede asumir
valores entre 300 y 500, es decir, RT = [300, 500]. Por lo tanto, T es una variable aleatoria
continua. Esto último se ilustra en la figura siguiente:
Observación 2.2. Los dos ejemplos anteriores ilustran de manera sencilla el concepto de
variable aleatoria. En la aplicación práctica encontramos variables que se generan de modo
complejo y en estas situaciones usamos un modelo probabilı́stico para describirlas, esta forma
de hacerlo se describirá a continuación.
41
42 Profesor José Flores Delgado Estadı́stica
Nótese también que si en la muestra se consideran solamente los valores no repetidos, digamos
P
x1 , . . . xk , y f r(x1 ), . . . , f r(xk ) sus respectivas frecuencias relativas; entonces, p̄ = f r(x).
x∈A
Ası́, en la muestra se usan las frecuencias relativas obtenidas, f r(x), pero para la población
estas frecuencias relativas son reemplazadas por los valores proporcionados por el modelo
probabilı́stico, f (x).
42
Profesor José Flores Delgado Variable aleatoria 43
En la tabla siguiente se muestran los valores de f (x) = P (X = x), para cada valor posible
de X :
x 0 1 2 3 4
15 5 15 5 15 5 15 5
4 1
f (x) 20
20
3 2
20
2 3
20
1 4
20
4 4 4 4 4
Veamos cómo obtener las probabilidades de algunos eventos relacionados con esta variable
X, a partir de su modelo probabilı́stico f .
(53)(4−3
15
)
iii) La probabilidad de seleccionar tres empresas del tipo a es: P (X = 3) = f (3) = 20
(4)
43
44 Profesor José Flores Delgado Estadı́stica
Ejemplo 2.6. El ingreso en soles, en un sector, se considera una variable aleatoria continua,
X, cuyo modelo probabilı́stico está dado por:
0, 0008x/1500,
si 0 ≤ x < 1500
f (x) = 0, 002 − 0, 0008x/1000, si 1500 ≤ x ≤ 2500
0, en otro caso
También calculemos la probabilidad de que un trabajador gane 2000 soles o menos, es decir,
la probabilidad P (X ≤ 2000). En este conviene usar el complemento:
Z 2500
P (X ≤ 2000) = 1 − P (X > 2000) = 1 − (0, 002 − 0, 0008x/1000) dx = 1 − 0, 1 = 0, 9.
2000
44
Profesor José Flores Delgado Variable aleatoria 45
P
4. Si X es discreta, se tiene que: f (x) = 1.
x∈RX
R
5. Si X es continua, se tiene que: f (x)dx = 1.
RX
Ejemplo 2.7. Para nuestro ejemplo 2.1 (con los datos del ejemplo 2.5) como X es discreta:
P 4
P
E(X) = xf (x) = xf (x)
x∈RX x=0
= 0f (0) + 1f (1) + 2f (2) + 3f (3) + 4f (4)
(5)(15) (5)(15) (5)(15) (5)(15)
= 0 + 1 1 20 3 + 2 2 20 2 + 3 3 20 1 + 4 4 20 0
(4) (4) (4) (4)
=1
45
46 Profesor José Flores Delgado Estadı́stica
Observación 2.7. Cuando se registra u observa una gran cantidad de valores de una variable
aleatoria, la media de todos estos es aproximadamente igual a la esperanza de la variable.
N
Más formalmente, si para cada n ∈ + , X1 , . . . , Xn es una muestra aleatoria de X y
n
X̄ = n1
P
Xj (la media de la muestra); entonces, un resultado conocido por la Ley Fuerte de
j=1
los Grandes Números, establece que, con probabilidad 1, lı́m X̄ = E(X). De allı́ el nombre
n→∞
e importancia del valor esperado o media, pues, con este valor podemos anticipar lo que
ocurrirá en promedio.
Ejemplo 2.8. En el contexto del Ejemplo 2.6, la media o valor esperado de los ingresos es:
Z Z 1500 Z 2500
xf (x) dx = xf (x) dx + xf (x) dx
R 0 1500
X
Z 1500 Z 2500
= x(0, 0008x/1500)dx + x(0, 002 − 0,0008x/1000)dx
0 1500
= 600 + 733, 33 = 1333, 33
Sea X una variable aleatoria, con modelo probabilı́stico f (x), y g : RX → R una función.
X
Entonces, la esperanza de la variable aleatoria g(X) puede obtenerse usando la distribución
de probabilidades de X, según sea esta discreta o continua, como se indica a continuación:
P
g(x)f (x); si X es discreta.
x∈RX X
E(g(X)) = Z
g(x)f (x)dx; si X es continua.
X
RX
Observación 2.8. Esta propiedad es muy importante: desde el punto de vista práctico, pues,
al establecer que con el modelo probabilı́stico de una variable aleatoria se puede determinar
el valor esperado de cualquier función de esta, entonces no es necesario determinar el modelo
para la variable que es función de otra cuyo modelo es conocido; y desde el punto de vista
teórico, pues, permite deducir otras propiedades del valor esperado relacionadas con funciones
de una variable aleatoria, como las que se darán más adelante.
P
Observe también que, en el caso discreto: E(g(X)) = g(x)P (X = x).
x∈RX
Ejemplo 2.9. La demanda diaria de un artı́culo se considera una variable aleatoria discreta,
X, con modelo probabilı́stico:
2x
f (x) = , x = 1, 2, 3, 4.
6(x!)
46
Profesor José Flores Delgado Variable aleatoria 47
Como la utilidad diaria es una función g(X), usamos la propiedad anterior para averiguarlo.
Los valores de g y f se muestran en la tabla siguiente:
x 1 2 3 4
g(x) 5(1) − 3(1) = 2 5(2) − 3(0) = 10 5(2) − 3(0) = 10 5(2) − 3(0) = 10
21 22 23 24
f (x) 6(1!)
= 31 6(2!)
= 13 6(3!)
= 29 6(4!)
= 19
X 4
X
g(x)f (x) = 2 × 31 + 10 × 13 + 10 × 29 + 10 × 1 22
E g(X) = g(x)f (x) = 9
= 3
.
x∈RX x=1
Observación 2.9. Un error frecuente es pensar que E(g(X)) = g(E(X)), es decir, que para
obtener el valor esperado de una función de X, baste evaluar g en E(X). Una excepción
ocurre cuando la función g es lineal de la forma a + bX, como se verá más adelante.
X 4
X
1 1 2 1 19
Ası́: E(X) = xf (x) = xf (x) = 1 × 3
+2× 3
+3× 9
+4× 9
= 9
. Es decir, en
RX x=1
promedio, la demanda diaria es de 2,11 unidades. Además, en la tabla del ejemplo anterior
se puede apreciar que E(g(X)) 6= g(E(X)).
Ejemplo 2.11. En el contexto del ejemplo 2.9, suponga que un comerciante compra cada
unidad demandada a 3 soles, y vende cada una a 6 soles; además la venta le produce un
costo fijo de 2 soles. Ası́, la utilidad del comerciante es Y = 6X − 3X − 2 = 3X − 2. Por lo
tanto, por la propiedad anterior y el resultado del ejemplo anterior, la utilidad esperada del
comerciante es E(Y ) = E(3X − 2) = 3E(X) − 2 = 3( 19 9
) − 2 = 13
3
.
47
48 Profesor José Flores Delgado Estadı́stica
N
Ejemplo 2.12. Sea X una variable aleatoria tal que E(X m ) = m! , ∀m ∈ + ; entonces,
E(1 + 2X − 3X 2 + X 3 ) = 1 + 2E(X) − 3E(X 2 ) + E(X 3 ) = 1 + 2(1!) − 3(2!) + 3! = 3.
Ejemplo 2.13. (Teorı́a de decisiones) Un comerciante debe decidir por cuál de tres
proveedores comprar cierto producto. La demanda puede ser excelente, con probabilidad
0, 3, adecuada, con probabilidad 0, 5 ó mala con probabilidad 0, 2. Y las utilidades semanales
(en soles) correspondientes dependen del proveedor y del estado de la demanda de los
consumidores, como se muestra a continuación:
Estado de la demanda
Excelente Adecuada Mala
Proveedor
1 4000 1900 1800
2 2800 2850 1900
3 3100 2900 1200
La variable aleatoria que nos interesa está asociada a los valores del estado de la demanda,
entonces, definámosla de la manera siguiente:
1, si el estado de la demanda es excelente.
X= 2, si el estado de la demanda es adecuado.
3, si el estado de la demanda es malo.
Estos valores son arbitrarios, solo sirven para diferenciar los posibles estados de la demanda.
b) Determinemos cuál serı́a la utilidad promedio del comerciante, si este pudiera enterarse
del estado de la demanda y obviamente tomara la mejor decisión:
Como la utilidad es una función de X, el estado de la demanda, podemos usar la
propiedad anterior con g la función cuyos valores correspondientes están en la tabla
anterior. Ası́:
P
E(U ) = g(x)fX (x) = 4000 × 0, 3 + 2900 × 0, 5 + 1900 × 0, 2 = S/. 3 030.
x∈RX
c) El comerciante enfrentará esta situación durante muchas semanas, por eso, desde un
principio quiere optar por uno de los proveedores. ¿Cuál es la mejor decisión?
Por lo observado para el valor esperado, bastará comparar las utilidades esperadas,
E(Ui ), que corresponderı́an a cada decisión posible (proveedor i elegido). Ası́,
48
Profesor José Flores Delgado Variable aleatoria 49
Resultará:
X
E(U1 ) = U1 (x)fX (x) = 4000 × 0, 3 + 1900 × 0, 5 + 1800 × 0, 2 = S/. 2 550
x∈RX
X
E(U2 ) = U2 (x)fX (x) = 2800 × 0, 3 + 2850 × 0, 5 + 1900 × 0, 2 = S/. 2 645
x∈RX
X
E(U3 ) = U3 (x)fX (x) = 3100 × 0, 3 + 2900 × 0, 5 + 1200 × 0, 2 = S/. 2 620
x∈RX
Por lo tanto, la mejor decisión será optar por el segundo proveedor, ya que con este el
comerciante tendrá una mayor utilidad promedio, en este caso de S/. 2 645.
Ejemplo 2.14. Calculemos la desviación estándar de la variable X del ejemplo 2.1 (con los
datos de los ejemplos 2.5 y 2.7).
49
50 Profesor José Flores Delgado Estadı́stica
Primero calculamos E(X 2 ). Para esto basta usar la propiedad que permite obtener el valor
esperado de una función de una variable aleatoria discreta, ası́:
X 4
X
2 2
E(X ) = x f (x) = x2 f (x)
x∈RX x=0
5 15 5 15 5 15 5 15
1
= 0+1 20
3 + 4 2
20
2 + 9 3
20
1 + 16 4
20
0
4 4 4 4
= 3, 1053.
Luego σX2 = E(X 2 ) − µ2X = 3, 1053 − 12 = 2, 1053; y σX = 1,4509. Entonces, en general, los
valores de X no varı́an demasiado entorno de su media.
Nuevamente calculamos primero E(X 2 ), pero ahora usamos la propiedad que permite obtener
el valor esperado de una función de una variable aleatoria continua:
Z Z 1500 Z 2500
2 2
2
E(X ) = x f (x) dx = x f (x) dx + x2 f (x) dx
0 X 1500 X
R
X
Z 1500 Z 2500
2 0, 0008x 0,0008x
= x( )dx + x2 (0, 002 − )dx
0 1500 1500 1000
Ası́, σX2 = E(X 2 ) − µ2X = 3 408 333, 4 − (1333, 3333)2 = 26 3889, 0201 y σX = 513, 70.
En resumen, el ingreso medio del sector es de 1 333,33 soles y la desviación promedio de los
ingresos entorno de esta media es de 513,7 soles.
50
Profesor José Flores Delgado Variable aleatoria 51
P
f (y); si X es discreta.
y≤x X
FX (x) = Z x
f (y) dy; si X es continua.
X
Ejemplo 2.16. En el contexto del ejemplo 2.6, en donde el ingreso en soles, en un sector,
se considera una variable aleatoria continua, X, con densidad:
0,0008x/1500,
si 0 ≤ x < 1500.
f (x) = 0,002 − 0,0008x/1000, si 1500 ≤ x ≤ 2500.
0, si x ∈/ [ 0; 2500 ].
Rx
Obtengamos la distribución acumulada F (x) = P (X ≤ x) = f (y) dy :
x
Z Z x
8 −7 2
Si 0 < x ≤ 1500 : F (x) = P (X ≤ x) = fX (y) dy = (0, 0008y/1500)dy = x10 x .
0 3
0
Si 1500 ≤ x ≤ 2500 :
Z2500 Z 2500
F (x) = P (X ≤ x) = 1 − P (X > x) = 1 − fX (y) dy= 1 − (0, 002 − 0, 0008y/1000) dy
x
x
51
52 Profesor José Flores Delgado Estadı́stica
0, si x < 0.
8 x10−7 x2 , si 0 ≤ x < 1500.
3
⇒ F (x) =
0,002x − 4x10−7 x2 − 1,5, si 1500 ≤ x ≤ 2500.
1, si x > 2500.
Ahora veamos dos casos que ilustran cómo la distribución acumulada facilita el cálculo de
las probabilidades:
b) La probabilidad de que un trabajador gane más que el ingreso promedio (1333,33) es:
P (X > 1333, 33) = 1 − F (1333, 33) = 1 − 83 x10−7 x2 = 0, 4741.
Z 2500 Z 1500 Z 2500
0,0008x 0,002−0,0008x
Con la densidad: P (X > 1333, 33) = f (x)dx = 1500
dx + 100
dx;
1333,33 1333,33 1500
con el complemento y la densidad: P (X > 1333, 33) = 1 − P (X ≤ 1333, 33) =
Z 1333,33
0,0008x
1− 1500
dx = 1 − 0, 5259 = 0, 4741.
0
52
Profesor José Flores Delgado Variable aleatoria 53
x:
lı́m F (y) = F (x) − P (X = x)
y→x−
Observación 2.12. Las dos últimas propiedades establecen que la distribución acumulada
identifica al modelo o distribución de probabilidades.
Sean X e Y dos variables aleatorias, con Y una función de X. En algunos casos se puede
deducir el modelo probabilı́stico de Y a partir del modelo de X, una técnica para hacerlo se
detalla a continuación:
53
54 Profesor José Flores Delgado Estadı́stica
Ejemplo 2.18. Sea X una variable aleatoria positiva, cuya función de probabilidad (o
modelo probabilı́stico) está dada por fX (x) = x/210, para x = 1, . . . , 20. Sigamos la técnica
antes descrita, para determinar la función de la variable Y = 2X.
54
Profesor José Flores Delgado Variable aleatoria 55
Ejercicio 2.1.
El precio de una unidad del bien A varı́a en el conjunto { 1; 2; 3; 4 }, lo mismo ocurre con
el precio del bien B, pero además el de B nunca es mayor que el de A.
a) Interesa observar simultáneamente los precios unitarios de cada bien. Determine (por
extensión) un conjunto que describa el espacio muestral asociado.
Cierto productor fabrica un bien cuya demanda semanal, en toneladas, es una variable
aleatoria X, con rango entre 0 y 10 toneladas, y función de densidad f (x) = x/50, x ∈ RX .
Cada tonelada tiene un costo de producción de diez mil soles y un precio de venta de 25 mil
soles. Suponga que en cierta semana el productor decide fabricar cinco toneladas.
55
56 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.4.
Ejercicio 2.5.
1,
2, 2,
3, 3,
4, 4, 4, 4, 4
5, 5, 5, 5, 5,
6, 6, 6, 6, 6,
7, 7, 7, 7, 7, 7, 7, 7
8, 8, 8, 8, 8, 8, 8, 8,
9, 9, 9, 9, 9, 9, 9, 9, 9, 9
10, 10, 10, 10, 10, 10, 10, 10, 10,
a) Encuentre la proporción de veces que ocurre cada uno de los valores anteriores y la
media de estos datos e indı́quelas en la tabla siguiente:
x 1 2 3 4 5 6 7 8 9 10
p̄
b) Asuma que los valores dados correspondan a una muestra aleatoria de la variable
aleatoria X cuyo modelo probabilı́stico está dado por f (x) = x/55. Use este modelo
para completar la tabla siguiente:
x 1 2 3 4 5 6 7 8 9 10
P (X = x)
c) Diga si los resultados obtenidos en las partes anteriores están en armonı́a. Emplee la
Ley Fuerte de los Grandes Números.
d) Obtenga X̄ (la media de la muestra de estos 55 datos) y E(X) (el valor esperado de
X); luego, diga si los resultados obtenidos están en armonı́a con la Ley Fuerte de los
Grandes Números.
56
Profesor José Flores Delgado Variable aleatoria 57
Ejercicio 2.6.
Sea X una variable aleatoria continua que puede tomar cualquier valor y modelo
c
probabilı́stico dado por f (x) = 1+x 2 .
Ejercicio 2.7.
El ahorro de los habitantes de una ciudad (medido en miles de soles) es considerado una
variable aleatoria continua, X, cuyo modelo probabilı́stico está determinado por la regla
f (x) = x2 /9, 0 ≤ x ≤ 3.
a) Según este modelo probabilı́stico, ¿qué porcentaje de los habitantes de esta ciudad
ahorran más de mil soles?
b) Según este modelo probabilı́stico, ¿cuál es el ahorro promedio de los habitantes de esta
ciudad?
c) Según las autoridades, el consumo de los habitantes de la ciudad, en función del ahorro,
está dado por 1 + 4 X. Si esto es ası́, halle el consumo promedio.
d) Suponga que las autoridades han estimado un impacto en la economı́a igual a 1000X 2 .
Si es ası́, halle el valor esperado de este impacto.
Ejercicio 2.8.
Cierto productor fabrica un bien cuya demanda semanal, en kilogramos, es una variable
aleatoria X con densidad f (x) = 0, 002e−0,002x , x > 0. Cada kilogramo producido le cuesta
100 soles y lo vende a 250 soles. Toda cantidad que no logra vender el productor se pierde sin
generar un costo adicional al de su fabricación. Suponga que en cierta semana el productor
decide fabricar 500 kilogramos.
57
58 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.9.
a) Halle P (X 6= 0).
Ejercicio 2.10.
Se realizarán cinco inversiones; se sabe que por lo menos una resultará exitosa. Sea X la
variable aleatoria definida como la cantidad de inversiones que resulten exitosas. El modelo
probabilı́stico de esta variable está determinado por f (x) = c 2−x , x ∈ RX , con c una
constante.
f) Cada inversión tiene un costo de 100 soles; si la inversión resulta exitosa se gana 200
soles, pero si no resulta exitosa se pierde 150 soles. Obtenga el valor esperado de de la
utilidad que generará realizar estas cinco inversiones.
Ejercicio 2.11.
Sea X una variable aleatoria que puede asumir cualquier valor positivo y función de densidad
dada por f (x) = β e−β x , x > 0, con β > 0.
58
Profesor José Flores Delgado Variable aleatoria 59
Ejercicio 2.12.
La distribución de los ingresos, X, de los trabajadores en cierto sector laboral, está deter-
minada por la función de densidad, definida entre 0 y 10000 soles, y cuya gráfica se muestra
en la figura siguiente:
Suponga que un impuesto de solidaridad es implantado en este sector: los que ganan menos
de 2000 soles quedan exonerados; los que ganen entre 2000 y 3000 soles pagarán 10 soles, los
que ganen más de 3000 pero menos de 8000 pagarán 15 soles; y los que ganen más de 8000
soles pagarán 20 soles.
a) Halle el porcentaje de los trabajadores cuyos ingresos están entre 2000 y 4000 soles.
d) Determine el monto promedio que se pagará por este impuesto. Hágalo con el modelo
de X. Luego, use el modelo probabilı́stico de la variable aleatoria Y, definida como el
monto pagado por trabajador debido al impuesto.
Ejercicio 2.13.
El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico se considera una variable
aleatoria continua, X, con modelo probabilı́stico dado por: f (x) = 2 x/25 , 0 ≤ x ≤ 5.
c) Si ya hace un año que no ocurre tal evento, determine la probabilidad de que pasen
más de 2 años todavı́a.
d) Una persona adquiere una póliza, contra este tipo de evento, que le cuesta mil soles.
El contrato de la póliza estipula que esta vale solo por un año y cubre solamente la
primera vez que ocurra el evento, de modo que si el evento ocurre en este perı́odo la
compañı́a aseguradora le pagará una suma indemnizatoria de tres mil soles, pero no lo
volverá hacer si ocurriera nuevamente el evento.
59
60 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.14.
En cierta región se tomó una muestra aleatoria de 100 habitantes y se registró, para cada
uno de estos, el ingreso mensual (en miles de soles). Los resultados obtenidos se resumen en
la tabla siguiente:
Para realizar inferencias sobre los ingresos en la región entera se decidió considerar al ingreso
mensual (en miles de soles) de sus habitantes como una variable aleatoria continua, X, con
valores en el intervalo [0, 5] y modelo probabilı́stico dado por
2
15 x,
si 0 ≤ x ≤ 3.
1
f (x) = 1 − 5 x, si 3 < x ≤ 5.
0, en otro caso.
b) Diga si los valores observados (mostrados en la tabla anterior) parecen estar en armonı́a
con el modelo probabilı́stico considerado. Haga los cálculos que considere necesarios,
de modo que pueda sustentar su respuesta con estos y la Ley Fuerte de los Grandes
Números (aplicada a proporciones de muestras).
c) Halle E(X).
e) Para tomar en cuenta solo los ingresos de quienes ganan hasta tres mil soles, se
considera la función siguiente:
(
x, si 0 ≤ x ≤ 3.
g(x) =
0, si 3 < x.
g) El gasto en alimentos de los habitantes de esta región está dado por 1 + 12 X. Determine
el gasto promedio en alimentos en esta región.
60
Profesor José Flores Delgado Variable aleatoria 61
Ejercicio 2.15.
En el contexto del ejercicio 1.27 del capı́tulo de probabilidad, halle el rango, la función de
probabilidad, el valor esperado y la desviación estándar de la variable, X, definida como el
número de años (del perı́odo considerado) en los que la demanda es muy baja.
Ejercicio 2.16.
Suponga que la proporción diaria de veces que ciertos comerciantes evaden la entrega de
una boleta de pago es una variable aleatoria con función de densidad f (x) = 6x(1 − x),
0 ≤ x ≤ 1. Una muestra aleatoria de 100 comerciantes fue supervisada durante un dı́a y se
registró, para cada uno de estos, la proporción diaria de evasiones:
Proporción de evasiones [ 0, 0,2 [ [ 0,2, 0,4 [ [ 0,4, 0,6 [ [ 0,6, 0,8 [ [ 0,8, 1 ]
Número de comerciantes 9 26 30 25 10
Ejercicio 2.17.
El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico puede considerarse
como una variable aleatoria continua con función de densidad f (x) = 0, 1e−0,1x , x > 0.
b) Si ya hace un año que no ocurre tal evento, determine la probabilidad de que pasen
más de 2 años todavı́a.
c) ¿Encuentra extraños los resultados obtenidos en las partes anteriores? Generalice estos
considerando t años, en lugar de 2, y h años transcurridos en lugar de uno.
d) Una persona adquiere una póliza contra este tipo de evento. El contrato estipula que si
el evento ocurre antes del primer año la compañı́a aseguradora debe pagarle una suma
indemnizatoria de 3000 soles por una única vez. La póliza cuesta 5000 soles. Determine
la utilidad esperada de la aseguradora.
61
62 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.18.
Supongamos que X, la demanda diaria de un artı́culo, ha sido considerada como una variable
x
aleatoria discreta con modelo probabilı́stico: f (x) = 61 ( x!2 ), x = 1, 2, 3, 4.
c) Cada artı́culo se vende por 5 soles. Cualquier artı́culo que no se vende al cabo del
dı́a se desecha, lo cual genera una pérdida de 3 soles. El fabricante, de estos artı́culos,
fijará su producción diaria, N, que regirá a lo largo de muchos dı́as, y debe decidirlo
entre uno de los valores posibles de la demanda: 1 ó 2 ó 3 ó 4 artı́culos. ¿Cuál es su
mejor decisión?
Ejercicio 2.19.
La cantidad mensual (en toneladas) que suele vender un comerciante se considera una
variable aleatoria continua, X, con rango RX = [ 0, 5 ] y modelo probabilı́stico dado por:
f (x) = 2 x/25 , 0 ≤ x ≤ 5.
62
Profesor José Flores Delgado Variable aleatoria 63
Ejercicio 2.20.
El ingreso mensual (en miles de soles) de las familias de cierta región es una variable aleatoria
continua, X, con rango el intervalo [0; 2], y función de densidad f (x) = 1 − 21 x, 0 ≤ x ≤ 2.
Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles, con
0 ≤ y ≤ 2, se considera la función g cuya regla de correspondencia es la siguiente:
(
x, si 0 ≤ x ≤ y;
g(x) =
0, si x > y.
a) Halle h(y) = E(g(X)) : el ingreso promedio de quienes ganan hasta y miles de soles.
h(y)
b) Halle Φ(y) = : la proporción del ingreso promedio de quienes ganan hasta y
E(X)
miles de soles, respecto al ingreso promedio en la región, 0 ≤ y ≤ 2.
c) Halle el Coeficiente de Gini: 1 − 2E Φ(X) .
d) Bosqueje la Curva de Lorenz, es decir, la formada por los pares (F (x), Φ(x)). Concluya,
comparándola con la situación de distribución sin desigualdad.
Ejercicio 2.21.
d) Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles
(0 ≤ y ≤ 8), se considera la función g, con la regla de correspondencia siguiente:
(
x, si 0 ≤ x ≤ y,
g(x) =
0, si x > y.
63
64 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.22.
Sea X una variable aleatoria continua tal que P (X > 1) = 0, 2. Sea la variable aleatoria Y
tal que Y = 1, si X > 1, e Y = 0, si X 1. Determine el valor esperado de la variable Y.
Ejercicio 2.23.
El número de semanas, X, en las que una inversión es de alto riesgo, durante cierto perı́odo
c(5)x
de 8 semanas, tiene como modelo probabilı́stico a la función dada por: f (x) = , x ∈ RX .
x!
También se sabe que por lo menos en una semana (de este perı́odo) la inversión es de alto
riesgo, pero no en todas las semanas será ası́.
c) Determine la probabilidad de que en más de la mitad de las semanas (de este perı́odo)
la inversión sea de alto riesgo.
d) Determine la probabilidad de que en más de dos de las semanas (de este perı́odo) la
inversión sea de alto riesgo.
e) Halle el número promedio de semanas en las que la inversión será de alto riesgo.
Ejercicio 2.24.
64
Profesor José Flores Delgado Variable aleatoria 65
Ejercicio 2.25.
a) Un alumno con problemas de autoestima inicia su terapia un mes antes de sus exámenes
finales. ¿Cuán probable es que este tiempo sea suficiente para revertir su problema antes
de dichos exámenes?
b) Determine e interprete el valor esperado del tiempo que necesitan los pacientes para
revertir este problema.
c) El costo de la terapia (en soles) puede considerarse como una variable, Y, que depende
del tiempo necesario para revertir este problema, X, como sigue:
400, si 0, 5 ≤ X ≤ 1.
600, si 1 < X ≤ 2.
Y =
1000, si 2 < X ≤ 3.
2000, si 3 < X ≤ 4, 5.
Ejercicio 2.26.
La demanda, de cierto producto es una variable aleatoria discreta, X, con valores posibles
entre 0 y 100 unidades y función de distribución acumulada:
x(x + 1)
FX (x) = , x ∈ { 0, 1, . . . , 100 }.
10 100
La utilidad del fabricante del producto, en función de la demanda y en miles de soles,
está dada por: (
20X − 850, para X = 0, 1, . . . , 80.
g(X) =
750, para X = 81, 82, . . . , 100.
a) Determine la probabilidad de que el productor obtenga por lo menos 160 mil soles,
pero menos de 750 mil.
65
66 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.27.
Tres pacientes inician un tratamiento que durará un mes. Sea X el número de estos pacientes
que estarán curados al cabo del mes. Suponga que el modelo probabilı́stico para esta variable
está dado por: f (x) = 27 1
40 3x
, x = 0, 1, 2, 3.
a) Determine el valor esperado del número de pacientes que estarán curados al cabo del
mes.
b) Determine la desviación estándar del número de pacientes que estarán curados al cabo
del mes.
c) El costo por paciente que se recupere al cabo del mes es de tres unidades monetarias.
Cada paciente que no se recupera al cabo del mes origina un costo adicional de una
unidad monetaria. Además, hay un costo fijo de dos unidades monetarias. Halle el valor
esperado y la desviación estándar del costo total.
Ejercicio 2.28.
Al invertir una cantidad en una operación financiera se obtiene una tasa de rentabilidad, X,
modelada por la función de densidad siguiente:
(
x + c, si − 1 ≤ x < 0.
f (x) =
d − x, si 0 ≤ x ≤ 1.
con c y d constantes. Además, en tres de cada ocho inversiones se gana, pero menos del 50 %
de lo invertido.
d) Suponga que al invertir en esta operación, se quiere que en el peor de los casos se pierda
una fracción r de lo invertido. Determine el valor r para que lo anterior suceda con una
probabilidad de 0,95. Este valor r se conoce como el valor en riesgo (VaR) que tiene
una confianza del 95 %. Note que si c0 es la cantidad invertida y cf es la cantidad al
c − c0
final de la inversión; entonces, X = f . Si X > 0 : se gana; y si X < 0 : se pierde.
c0
Ejercicio 2.29.
66
Profesor José Flores Delgado Variable aleatoria 67
Ejercicio 2.30.
Una municipalidad verificará si las tiendas de su distrito cumplen una ordenanza dictada
recientemente. Con este fin, se escogerá una muestra aleatoria de 20 tiendas.La cantidad de
tiendas, en la muestra que será seleccionada, que incumplan la ordenanza es una variable
aleatoria, X, cuya función de probabilidad está dada por: f (x) = x/210, x = 0, 1, . . . , 20 .
a) Determine la probabilidad de que por lo menos cinco de las tiendas, en la muestra por
seleccionar, incumplan la ordenanza.
c) Suponga que inspeccionar cada tienda de la muestra seleccionada costará 500 soles.
Además, cada detección originará un descuento de 500 soles en el costo, pues esta
cantidad será pagada por el propietario de la tienda que incumpla la ordenanza; pero
cada tienda seleccionada que cumpla la ordenanza originará un costo adicional de 250
soles, pues el propietario de la tienda recibirá un descuento en sus tributos por este
valor. El presupuesto para llevar a cabo este muestreo es de 12 750 soles.
Ejercicio 2.31.
a) Use F solamente, sin obtener la función de probabilidad asociada f, para obtener las
probabilidades de los eventos siguientes:
67
68 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.32.
El fabricante de cierto producto debe decidir la cantidad ‘t’de toneladas que debe fabricar
mensualmente. Por estudios de mercado realizados por el fabricante sobre la demanda para el
mes siguiente, se llegó a establecer que la demanda proyectada debe considerarse una variable
aleatoria continua, pudiendo asumir valores entre 0 y 10 toneladas y función de densidad
f (x) = x/50, 0 ≤ x ≤ 10. El costo de fabricación y el precio de venta proyectados, por
cada tonelada del producto, son 10 mil y 20 mil soles, respectivamente. Además el estudio
de mercado le costó al fabricante 50 mil soles y naturalmente deberá incluirlo en sus costos.
a) Suponga que el fabricante decidiera producir una cantidad t igual a 8 toneladas, ¿cuál
serı́a la probabilidad de que gane menos de 10 mil soles?
Ejercicio 2.33.
El estudio de la demanda de un bien para el perı́odo de los próximos tres años (1, 2 y 3)
determinó que esta podrı́a ser muy baja en cualquiera de estos años, de manera independiente
y con una probabilidad de un décimo. Las decisiones que se deben tomar dependen de la
variable aleatoria X, definida como la cantidad de años (de este perı́odo) en los que la
demanda será muy baja.
a) Determine la probabilidad de que en los tres años de este perı́odo la demanda del bien
sea muy baja.
b) Determine la probabilidad de que solo en dos de los años de este perı́odo la demanda
del bien sea muy baja.
e) Halle el valor esperado de la cantidad de años (de este perı́odo) en los que la demanda
será muy baja.
f) La utilidad de cierta inversión (en miles de soles) es una función g(X), con
1000,
si x = 0.
g(x) = 1000 − 200x, si x = 1 ó 2.
1000 − 400x, si x = 3 ó 4.
68
Profesor José Flores Delgado Variable aleatoria 69
Ejercicio 2.34.
En cierta inversión la utilidad generada es una variable aleatoria, X, con valores entre 6,5 y
7,5 miles de soles y función de densidad dada por:
57 51(x − 7)2
f (x) = − ; 6, 5 ≤ x ≤ 7, 5.
40 10
a) Halle la probabilidad de que esta inversión genere más de siete mil soles de utilidad.
b) Una persona desea invertir de modo que su utilidad esperada sea de 7 mil soles. ¿Esta
inversión cumple este requerimiento?
Ejercicio 2.35.
Se debe decidir cuál debe ser el tamaño de un lote, de cierto artı́culo, que debe ser adquirido.
El tamaño posible del lote puede ser 100, 200 ó 400 unidades. Además, en cada lote, cada
unidad sin defectos genera una ganancia de 500 soles y cada unidad defectuosa origina una
pérdida de 300 soles. Por otra parte, se sabe que la proporción de unidades defectuosas, por
lote adquirido durante una semana, es una variable aleatoria discreta, X, cuya distribución
acumulada, F, tiene la gráfica siguiente:
Suponga el tamaño del lote que se adquirirá será el mismo para un perı́odo de muchas
semanas.
a) Si adquieren lotes de 100 unidades, ¿cuál será la utilidad esperada por lote?
b) Si adquieren lotes de 200 unidades, ¿cuál será la utilidad esperada por lote?
c) Si adquieren lotes de 400 unidades, ¿cuál será la utilidad esperada por lote?
69
70 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.36.
b) Halle la probabilidad de que la pérdida del fisco esté entre 7 y 9 millones de soles.
f) Determine, fY , la densidad de Y.
g) Emplee la definición del valor esperado y el resultado anterior para determinar el valor
esperado pedido en la parte e.
Ejercicio 2.37.
La demanda de cierto bien es descrita por una variable aleatoria continua X, cuya función
de distribución acumulada está dada por: FX (x) = 1 − e−x − x e−x , x > 0. La utilidad de
cierto comerciante (en miles de soles) es una función de la demanda: g(X), con g dada por:
(
1, si 0 < x ≤ 1.
g(x) =
x, si x ≥ 1.
d) Halle la probabilidad de que el comerciante gane entre 500 soles y 3 mil soles.
70
Profesor José Flores Delgado Variable aleatoria 71
Ejercicio 2.38.
Ejercicio 2.39.
Sea X es una variable aleatoria discreta con función de probabilidad dada por fX (x) =
0, 9 (0, 1)x−1 , x ∈ N+ . Se define Y = X − 1.
a) Determine E(X).
Ejercicio 2.40.
Sea X una variable aleatoria continua, positiva, con función de distribución acumulada dada
2
por FX (x) = 1 − e−4x , x > 0. Sea Y = X 2
b) Halle P (2 ≤ X ≤ 4).
Ejercicio 2.41.
2
Sea X una variable aleatoria continua tal que E(X t ) = et , ∀t ∈ R.
71
72 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.42.
√
π
Sea X una variable aleatoria continua tal que E(X m ) = 2m+1
, ∀m > 0.
b) Halle la varianza de X.
c) Halle E(4 + √5 X+ √2 X2 − √3 X 3 ).
π π π
Ejercicio 2.43.
Sea X una variable aleatoria con rango RX = R, media 3,5 y desviación estándar 0,25.
c) ¿Puede asegurarse que la media de estas utilidades sea por lo menos 35?
Ejercicio 2.44.
Sea X una variable aleatoria continua y positiva, con función de densidad f (continua) y
función de distribución acumulada F.
Si X ∼ Pareto(1; θ); es decir, f (x) = θ x−(θ+1) , x > 1, con θ > 0. Determine E(X) y
X
V (X).
72
Profesor José Flores Delgado Variable aleatoria 73
Ejercicio 2.46.
El número de clientes que llegan a un cajero automático, hasta el primero que realiza
una transferencia hacia otra cuenta, es una variable aleatoria discreta X cuya función de
distribución acumulada está dada por F (x) = 1 − (0, 6)x , x = 1, 2, . . .
a) Halle la probabilidad de que el número de clientes que lleguen al cajero, hasta el primero
que realice una transferencia hacia otra cuenta, sea mayor o igual que 2 pero menor o
igual que 20. Use solo F.
Ejercicio 2.47.
El tiempo (medido en minutos) hasta el primer automóvil que pasa contaminando el ambiente
es una variable aleatoria continua, X, cuya función de distribución acumulada está dada por
F (x) = 1 − e−2x , x > 0.
Ejercicio 2.48.
Ejercicio 2.49.
Sea X una variable aleatoria continua con función de densidad f (x) = 4x3 , 0 ≤ x ≤ 1.
X
Considere la variable Y = 5X, halle f . Use la técnica del cambio de variable descrita en la
Y
sección 2.7
73
74 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.50.
Se dice que una variable aleatoria continua y positiva, X, tiene modelo exponencial con
parámetro β (con β > 0) 1 , si su modelo probabilı́stico está dado por
a) Si X ∼ exp(β), use la técnica del cambio de variable (descrita en la sección 2.7) para
hallar e identificar el modelo probabilı́stico de Y = 71 X. Incluya los parámetros.
Ejercicio 2.51.
Se dice que una variable aleatoria continua y positiva, X, tiene modelo gamma con
parámetros α > 0 y β > 0, si su modelo probabilı́stico está dado por
β α α−1 −β x
x e
f (x) = , x > 0;
X Γ(α)
Z ∞
con Γ la función gamma, definida por Γ(z) = tz−1 e−t dt, z > 0. Esto se denota por
0
X ∼ G(α, β).
Si X ∼ G(α, β), use la técnica del cambio de variable (descrita en la sección 2.7) para hallar
e identificar el modelo probabilı́stico de Y = 2 X. Incluya los parámetros.
Ejercicio 2.52.
Se dice que una variable aleatoria continua y positiva, X, tiene modelo Weibull con
parámetros α > 0 y β > 0, si su modelo probabilı́stico está dado por
α
f (x) = β α xα−1 e−β x , x > 0.
X
74
Profesor José Flores Delgado Variable aleatoria 75
Ejercicio 2.53.
con α > 0, β > 0 y γ > 0. Si X es una variable positiva que tiene este modelo, denotamos
esto por X ∼ W g(α; β; γ).
b) Use la técnica del cambio de variable para hallar e identificar el modelo probabilı́stico
de Y = δX, con δ > 0.
Ejercicio 2.54.
con α > 0 y β > 0. Sea X una variable positiva que tiene este modelo, denotamos esto por
X ∼ expg(α; β).
Use la técnica del cambio de variable para hallar e identificar el modelo probabilı́stico de
Y = γX, con γ > 0.
Ejercicio 2.55.
Se dice que una variable aleatoria continua, X, tiene modelo normal con parámetros son µ
R
y σ 2 (con µ ∈ y σ > 0), si su modelo probabilı́stico está dado por
1 1 2
f (x) = √ e− 2 σ2 (x−µ) , −∞ < x < ∞.
X 2π σ
Si X ∼ N (µ, σ 2 ), use la técnica del cambio de variable (descrita en la sección 2.7) para
R
hallar e identificar el modelo probabilı́stico de Y = a + b X (con a ∈ y b > 0). No olvide
dar los parámetros.
2
Gupta & Kundu(1999). Theory & methods: Generalized exponential distributions. Australian and New
Zealand Journal of Statistics, 41(2), 173–188.
75
76 Profesor José Flores Delgado Estadı́stica
Ejercicio 2.56.
Sea X ∼ N (µ, σ 2 ), es decir, el modelo dado en el ejercicio 2.55. Use la técnica del cambio
de variable para hallar el modelo de Y = (X − µ)/σ. Tenga el cuenta el ejercicio 2.51 para
reconocer el modelo obtenido anteriormente.
Si X ∼ N (µ, σ 2 ), use la técnica del cambio de variable (descrita en la sección 2.7) para
R
hallar e identificar el modelo probabilı́stico de Y = a + b X (con a ∈ y b > 0). No olvide
dar los parámetros.
Ejercicio 2.57.
x 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5
F (x) 0,0190 0,0656 0,1429 0,2424 0,3528 0,4634 0,5665 0,6577 0,7350 0,7983
x 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5
F (x) 0,8488 0,8882 0,9182 0,9409 0,9576 0,9699 0,9788 0,9851 0,9897 0,9929
76
3. Modelos probabilı́sticos importantes
Nuestro punto de partida para tratar con un proceso de Bernoulli (y también con uno
de Poisson) es un evento de interés. Sucede que en determinado momento, por alguna
razón, nuestro interés se concentra en un evento incierto, por tal motivo, cuando este ocurra
podemos decir que se ha tenido éxito, ası́, podemos denominar a este evento de interés como
E: éxito; mientras que a su complemento como E c o F , que significará fracaso. En el proceso
de Bernoulli se puede decir que la observación es discreta, puesto que lo hacemos dentro de
una secuencia de ensayos u oportunidades, en cada uno de ellos puede ocurrir el evento que
nos interesa o su complemento (todo lo demás que puede ocurrir).
Ejemplo 3.1. Cuando un producto se ofrece en venta con una promoción, el promotor
de ventas está interesado en averiguar si los clientes que visitará comprarán el producto.
77
78 Profesor José Flores Delgado Estadı́stica
El promotor visitará a muchos clientes, cada uno de estos puede comprar el producto en
promoción. Cada visita origina un ensayo u oportunidad para observar si ocurre el evento
de interés: que el cliente compre el producto. Entonces, si cada cliente puede comprar el
producto independientemente de los demás y con la misma probabilidad, se tendrá un proceso
de Bernoulli.
Ahora veamos los tres modelos que se generan a partir de un proceso de Bernoulli.
Los parámetros sirven para identificar una distribución especı́fica, dentro de una familia de
distribuciones, en este caso de la forma antes indicada.
Ejemplo 3.2. En el contexto del ejemplo 1, supongamos que los registros acerca de este tipo
de promociones indican que el 75 % de los clientes suele comprar el producto cuando se da
esta promoción. Ası́, tenemos que la probabilidad de nuestro evento de interés (que el cliente
visitado compre el producto) es P (E) = 0, 75. Supongamos ahora que el promotor visite a
50 clientes, entonces, si X es el número de clientes que comprarán el producto, tenemos que:
X ∼ b(50; 0, 75).
Esto se justifica porque X puede ser vista como el número de éxitos en una secuencia de
50 eventos de un proceso de Bernoulli. Siendo ası́, tenemos que la probabilidad de que x de
estos clientes compren el producto es:
50
f (x) = P (X = x) = (0, 75)x (0, 25)50−x , x = 0, 1, . . . , 50.
x
En particular la probabilidad de que 30 clientes compren el producto es:
50
P (X = 30) = f (30) = (0, 75)30 (0, 25)50−30 = 0, 0077.
30
La media (promedio) o valor esperado del número de clientes que comprarán el producto es:
78
Profesor José Flores Delgado Modelos probabilı́sticos importantes 79
¿Entre qué valores se encontrará el grupo promedio de esta distribución? Ya sabemos que
este es el grupo de datos que está entre µX ± σX .
Por lo tanto, los datos dentro del promedio estarán entre 34, 4382 y 40, 5618 ó,
equivalentemente, entre 35 y 40. Ası́, cuando se dé esta promoción y se ofrezca a 50 clientes
en muchas ocasiones, observaremos con mayor frecuencia que el número de clientes que
comprarán este producto estará entre 35 y 40.
Obtengamos otra probabilidad, por ejemplo, la de que, a lo más, 45 de estos clientes compren
el producto en promoción es P (X ≤ 45) y conviene hallarla por el complemento:
P (X > 45)
= 0,0021.
Por ejemplo, la probabilidad de que más de 25, pero a lo sumo 40 clientes compren el
producto:
P (25 < X ≤ 40) = f (26) + · · · + f (40) = F (40) − F (25) = 0, 8363 − 0, 0001 = 0, 8362.
O la probabilidad de que compren como mı́nimo 30, pero a lo sumo 45 clientes es:
Para terminar, la probabilidad de que por lo menos 35 clientes compren el producto es:
79
80 Profesor José Flores Delgado Estadı́stica
Cada dı́a puede llevarse a cabo una operación financiera, la cual puede resultar exitosa
o fracasada. Cuando la operación es exitosa, lo cual ocurre con probabilidad 0,7, se gana
una proporción de lo invertido igual a 0,02; mientras que cuando la operación fracasa se
pierde una fracción de lo invertido igual a 0,04. El capital inicial es de 50 000 soles; y en las
sucesivas operaciones se invierte el monto que resulta de las inversiones anteriores. Además
los resultados de las operaciones financieras se asumen independientes. Por las condiciones
dadas, la secuencia de operaciones realizadas originan un proceso de Bernoulli con evento
de interés, E, que la operación sea exitosa (también pudo escogerse su complemento) con
probabilidad p = 0, 7. En particular, X, el número de operaciones que resulten exitosas,
entre n llevadas a cabo, tiene distribución binomial con parámetros n y p = 0, 7, es decir,
X ∼ b(n, 0, 7).
Esta variable X nos permite determinar cuál será el valor del capital acumulado, Y, hasta
la enésima operación. En efecto, no es difı́cil verificar que:
o, despejando X :
P (X < 8, 3057) = 1 − fX (9) + fX (10)
= 1 − 10 10
9
(0, 7)9 (0, 3)10−9 + 10
(0, 7)10 (0, 3)10−10
= 1 − 0, 1493 = 0, 8507
f (x) = P (X = x) = q x−1 p, x = 1, 2, . . .
80
Profesor José Flores Delgado Modelos probabilı́sticos importantes 81
Cuando el modelo probabilı́stico de una variable aleatoria X es de esta forma, se dice que
X tiene distribución geométrica con parámetro p. Se denotará esto por X ∼ g(p).
x
X
F (x) = P (X ≤ x) = q j−1 p = 1 − q x , x = 1, 2, . . .
j=1
Ejemplo 3.4. Continuando con el evento de interés anterior, supongamos que ahora nos
interese la variable X definida como el número de clientes que debe visitar el promotor hasta
el primero que compre el producto. Entonces, como el proceso es de Bernoulli y X puede
verse como el número de ensayos (en la secuencia de visitas) hasta lograr el primer éxito, se
tiene que X ∼ g(0, 75).
Ası́, la probabilidad de que el primer cliente, que compre el producto, sea el x-ésimo que
visite es
P (X = x) = f (x) = (0, 25)x−1 (0, 75), x = 1, 2, . . .
El valor esperado de esta variable es µX = 1/p = 1/0, 75 = 4/3 = 1, 333, por lo tanto, si
fueran muchas las visitas que haga el promotor y asumimos condiciones similares para cada
una de estas, en promedio en la primera visita el cliente comprará el producto.
En este caso, como la distribución acumulada tiene una fórmula explı́cita, podemos calcular
muchas probabilidades usando dicha fórmula:
Por ejemplo, la probabilidad de que el primer cliente que compre el producto sea por lo
menos el cuarto que visite, pero a lo más el décimo, es:
Esta propiedad afirma que si ya se han realizado m ensayos sin haber obtenido un éxito,
entonces, la probabilidad de que sean necesarios n ensayos adicionales, para lograrlo, es
exactamente igual a la probabilidad que se tenı́a antes de realizar estos m ensayos. Por lo
que se dice que la distribución no tiene memoria.
81
82 Profesor José Flores Delgado Estadı́stica
Ejemplo 3.5. Nuevamente en el contexto del proceso de Bernoulli de los ejemplos anteriores,
sea ahora la variable X definida como el número de clientes que debe visitar el promotor
hasta el tercero que compre el producto. Entonces, como el proceso es de Bernoulli y X puede
verse como el número de ensayos hasta lograr el tercer éxito, se tiene que X ∼ g(0, 75).
Ası́, la probabilidad de que el tercer cliente, que compre el producto, sea el x-ésimo visitado
es: P (X = x) = f (x) = x−1
3−1
(0, 25)x−3 (0, 75)3 , x = 3, 4, . . .
Propiedades:
a) La variable X tiene distribución geométrica con parámetro p si, y solo si, X tiene
distribución de Pascal con parámetros 1 y p.
S2. La probabilidad de que ocurra E más de una vez en una región pequeña es casi nula.
82
Profesor José Flores Delgado Modelos probabilı́sticos importantes 83
S3. Las ocurrencias de las llegadas de los automóviles que pasan contaminando el ambiente,
en regiones excluyentes, son independientes.
En este caso, los automóviles pasan contaminando el ambiente según un proceso de Poisson,
con una tasa de 2 automóviles por minuto.
e−60 (60)0
P (X = 0) = f (0) = = e−60 = 8, 8 × 10−27 .
0!
Propiedades:
84
Profesor José Flores Delgado Modelos probabilı́sticos importantes 85
Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene
distribución exponencial con parámetro β. Se denotará esto por: X ∼ exp(β).
Ejemplo 3.8. Nuevamente en el contexto del ejemplo 3.6, tenemos que la variable X,
definida como el tiempo (en minutos) que hay que esperar hasta que pase el primer vehı́culo
contaminando el ambiente, sigue una distribución exponencial con parámetro β = 2, esto
si medimos el tiempo en minutos (recuérdese que la tasa del proceso de llegadas de los
vehı́culos que contaminan el ambiente es ω = 2 vehı́culos
minuto ). Ası́, su modelo probabilı́stico
está determinado por la función f (x) = 2e−2x , x > 0; y su función de distribución acumulada
es dada por: F (x) = 1 − e−2x , x > 0. En particular, la probabilidad de que sea necesario
esperar menos de cinco minutos hasta que pase el primer vehı́culo que contamine el ambiente
es:
P (X < 5) = P (X ≤ 5) = F (5) = 1 − e−2(5) = 0, 99995.
Propiedad: esta es la única distribución continua que satisface:
85
86 Profesor José Flores Delgado Estadı́stica
Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene
distribución gamma con parámetros α y β. Se denotará esto por: X ∼ G(α, β).
Observación
Z ∞ 3.1. La función gamma, Γ, se define para todo y > 0, como: Γ(y) =
√
ty−1 e−t dt. Tiene las propiedades siguientes: Γ(y + 1) = yΓ(y); Γ(0, 5) = π y si y
0
es natural positivo Γ(y) = (y − 1)!
Ejemplo 3.9. Siguiendo con los ejemplos anteriores, si definimos la variable X como el
tiempo (en minutos) que habrá que esperar hasta que pase el quinto vehı́culo contaminando el
ambiente, tenemos que X tiene distribución gamma con parámetros α = 5 y β = 2. Podemos,
por ejemplo, obtener la probabilidad de que el quinto vehı́culo que pase contaminando el
ambiente lo haga luego de cuatro minutos:
5−1 −2(4)
X e (2(4))j
P (X > 4) = 1 − P (X ≤ 4) = 1 − F (4) = 1 − (1 − ) = 0, 0996.
j=0
j!
86
Profesor José Flores Delgado Modelos probabilı́sticos importantes 87
Observación 3.2.
b) No hay una fórmula explı́cita para la distribución acumulada; pero existen tablas para
la distribución normal estándar, ası́, para poder usarlas previamente se debe pasar
a la forma estándar, como se indica en la segunda de las propiedades que se dan a
continuación. Sin embargo, debe mencionarse que hoy en dı́a estas tablas están cayendo
en desuso, la razón es obvia: las computadoras.
87
88 Profesor José Flores Delgado Estadı́stica
c) Originalmente esta distribución fue propuesta por Karl Gauss (1777-1855) para
modelar errores (en el ejemplo siguiente se ilustra esta situación)
2. Propiedad de estandarización
X − µX
Z= ;
σX
X − µX
entonces, Z ∼ N (0, 1). Es decir: X ∼ N (µX ; σX2 ) y Z = ⇒ Z ∼ N (0, 1).
σX
Por lo tanto:
x−µX
F (x) = F ( σX
)
X Z
Ejemplo 3.11. Los ingresos en cierto sector pueden ser modelados por una variable X con
distribución normal de media 20 unidades monetarias (u.m.) y desviación estándar de 5 u.m.
88
Profesor José Flores Delgado Modelos probabilı́sticos importantes 89
primero FX (22), y tenemos dos formas de obtener esta probabilidad acumulada: con la
computadora, o con una tabla de la distribución normal estándar.
22 − 20
FX (22) = FZ = FZ (0, 4) = 0, 6554.
5
Para hacer un cálculo más, supongamos que en este sector solo los ingresos superiores a 25
u.m. están sujetos a un impuesto extraordinario; y queremos averiguar, para el sector de
trabajadores que ganan más de 22 u.m. , cuál es el porcentaje que paga este impuesto.
Las probabilidades anteriores se han obtenido usando el programa Excel; pero también
pueden obtenerse usando una tabla de la distribución normal estándar.
25−20
F (25) = F 5
= F (1) = 0, 8413;
X Z Z
22−20
F (22) = F 5
= F (0, 4) = 0, 6554.
X Z Z
n
X n
X
T ∼ N (µT ; σT2 ), con µT = µXj y σT2 = σX2 .
j
j=1 j=1
En este caso:
T − µT
Z= ∼ N (0, 1).
σT
89
90 Profesor José Flores Delgado Estadı́stica
Se dice que las variables aleatorias X1 , . . . , Xn son independientes, cuando para cada Ai ,
conjunto de valores posibles para Xi , se tiene que:
Y cuando las variables son independientes, la varianza de su suma es igual a la suma de sus
n
P Pn
varianzas, es decir: V ( Xj ) = V (Xj ).
j=1 j=1
Ejemplo 3.12. En el contexto del ejemplo anterior, supongamos que para 10 trabajadores,
cuyos ingresos son independientes, interesa determinar la probabilidad de que la suma de los
ingresos correspondientes esté entre 190 u.m. y 240 u.m.
Para este fin, consideremos las variables Xj , el ingreso del j-ésimo trabajador, j = 1, . . . , 10.
10
P
Ası́, la suma los ingresos es T = Xj ; e interesa obtener la probabilidad P (190 ≤ T ≤ 240).
j=1
Tenemos que estas variables Xj tienen distribución normal (Xj ∼ N (20, 52 )) y son
independientes, entonces podemos aplicar esta propiedad de cerradura respecto de la suma
P10
para establecer que T = Xj , también sigue una distribución normal; pero con una media,
j=1
µT , igual a la suma de las medias, es decir, µT = 200, y una varianza, σT2 , igual a la suma
de las varianzas, es decir, σT2 = 250.
Para calcular las probabilidades anteriores con la distribución normal estándar debe
considerarse la variable:
T − µT T − 200
Z= = √ .
σT 250
Ası́, FT (240) = FZ 240−200 = FZ (2, 53) = 0, 9943 y FT (190) = FZ 190−200
√
250
√
250
= FZ (−0, 63).
Ejemplo 3.13. En el contexto del ejemplo 3.10, suponga que para determinar la verdadera
longitud del objeto, µ, se realizarán n mediciones independientes con las caracterı́sticas
mencionadas. Luego, se estimará µ con la media aritmética de las mediciones efectuadas, X̄.
90
Profesor José Flores Delgado Modelos probabilı́sticos importantes 91
Solución:
a) Por lo visto en el ejemplo 3.10, cada una de las mediciones X1 , . . . , Xn tiene
distribución normal, con media µ y desviación estándar σ, además estas son
independientes, entonces, por la propiedad anterior de la distribución normal, la suma
de estas variables, T, tiene distribución normal con media µT = µX1 + . . . + µXn = n µ
y varianza σT2 = σX2 + . . . + σX2 n = n σ 2 , es decir, T ∼ N (n µ; n σ 2 ).
1
T
b) Como T ∼ N (n µ; n σ 2 ) y X̄ = es una transformación lineal de T , entonces la
n
primera propiedad de la distribución normal establece que X̄ también tiene distribución
2
normal, pero con media: µX̄ = n1 µT = µ, y varianza: σX̄2 = n12 σT2 = σn , es decir,
2
X̄ ∼ N (µ; σn ).
91
92 Profesor José Flores Delgado Estadı́stica
n
Xj , tiene aproximadamente distribución normal de media µT y varianza σT2 , con
P
T =
j=1
n n
aprox.
µXj y σT2 = σX2 , es decir, T ∼ N (µT , σT2 ).
P P
µT =
j
j=1 j=1
Ejemplo 3.14. Un inversionista recibe 100 utilidades, las cuales pueden ser consideradas
como variables aleatorias independientes de igual distribución, con una media de 5 u.m. y
una desviación estándar de 0,5 u.m. Interesa saber la probabilidad de que la utilidad total
recibida por el inversionista sea menor que 510 u.m. (el mı́nimo previsto). Para averiguar
lo deseado consideremos, como en el ejemplo anterior, las variables: Xj , la j-ésima utilidad
recibida, j = 1, . . . , 100. Como estas variables son muchas e independientes, entonces, por
la cuarta propiedad de la distribución normal (el teorema del lı́mite central), la suma de
100
P
estas, T = Xj , sigue aproximadamente una distribución normal con media µT , igual a la
j=1
suma de las medias, y varianza σT2 , igual a la suma de las varianzas, es decir, µT = 500 y
σ 2 = 25. Entonces tenemos que T ∼ N (500, 25), luego podemos obtener la probabilidad de
interés directamente con el Excel. Es decir: P (T < 510) = FT (510) = 0, 9772.
Obsérvese que, en este caso, para usar la distribución normal estándar debe considerarse la
variable:
T − µT T − 500
Z= = ∼ N (0; 1).
σT 5
510−500
FT (510) = P (T ≤ 510) = FZ 5
= FZ (2) = 0, 9772.
Ejemplo 3.15. En el contexto del ejemplo anterior, ¿cuál serı́a la probabilidad de que la
media de las utilidades recibidas sea menor o igual a 5,1 u.m.? Ahora se desea averiguar el
100
P
valor de la probabilidad P (X̄ ≤ 5, 1), con X̄ = Xj /100 = T /100.
j=1
T
Ası́: P (X̄ ≤ 5, 1) = P ( 100 ≤ 5, 1) = P (T ≤ 510) = FT (510) = FZ (2) = 0, 9772.
100
P
También puede deducirse la distribución de X̄ a partir de la de T = Xj . En efecto, como
j=1
T
X̄ = 100
y T ∼ N (500; 25), entonces, por la propiedad de linealidad de la distribución
µT 500 σ2 25
normal, tenemos que: X̄ ∼ N (µX̄ , σX̄2 ), con µX̄ = 100
= 100
= 5, y σX̄2 = T
1002
= 1002
=
0, 0025, es decir, X̄ ∼ N (5; 0, 0025).
X̄−5
Para usar la distribución normal estándar tenemos que: Z = 0,05
∼ N (0, 1). Ası́,
P (X̄ ≤ 5, 1) = FX̄ (5, 1) = FZ 5,1−5
0,05
= FZ (2) = 0, 9772.
92
Profesor José Flores Delgado Modelos probabilı́sticos importantes 93
Se dice que una variable aleatoria, X, tiene distribución lognormal si, y solo si, la
transformación logaritmo natural de X, Ln(X), tiene una distribución normal. Puede
verificar que la densidad es la siguiente:
(lnx − µ)2
f (x) = √ 1 −
x−1 e 2σ 2 , x > 0.
2πσ
Esto lo denotamos por: X ∼ logN (µ; σ 2 ).
Las constantes µ ∈ R y σ 2 > 0, son los parámetros del modelo y estos son también los
parámetros de la distribución de Ln(X), es decir, se tiene que Ln(X) ∼ N (µ, σ 2 ).
En la economı́a y las finanzas esta distribución aparece, por ejemplo, cuando el valor de cierta
inversión es el resultado de muchas variaciones ocasionadas por incrementos o reducciones
aleatorias, cada variación reduce o aumenta el valor actual en una proporción aleatoria. Esto
se conoce como la Ley de fragmentación de Kolmogorov. Una explicación de la validez de
esta ley se muestra en el ejemplo siguiente.
Ejemplo 3.16. En la enésima operación, de una serie de operaciones financieras, se invierte
el capital acumulado, cuyo valor es Xn unidades monetarias (u.m.). La tasa de rentabilidad
de esta operación se define como
Xn − Xn−1
Rn = ,
Xn−1
con Xn−1 el valor del capital acumulado disponible antes de realizar la operación.
Sigue inmediatamente que el valor del capital acumulado, Xn , en función del capital invertido
(Xn−1 ) y la tasa de rentabilidad de esta inversión (Rn ), está dada por:
Xn = (1 + Rn )Xn−1
93
94 Profesor José Flores Delgado Estadı́stica
Xn = Wn Xn−1
Entonces, podemos decir que el valor del capital al cabo de muchas operaciones (en el largo
plazo) sigue una distribución lognormal.
Para ilustrar el uso de este modelo supongamos que el valor inicial del stock sea 20 u.m. ,
que el valor esperado de la tasa instantánea de rentabilidad sea 0,2 y que la volatilidad del
stock sea 0,4. Entonces, reemplazando estos valores en la ecuación (3), tenemos que:
94
Profesor José Flores Delgado Modelos probabilı́sticos importantes 95
Ln(S5 ) − 2,795
Y para usar la normal estándar tenemos que Z = √
0,8
∼ N (0, 1).
4−2,795
Ası́: F (4) = F √
0,8
= F (1, 35) = 0, 911.
Ln(S5 ) Z Z
Si de una población con N elementos, de los cuales M son de interés, se toma una muestra
aleatoria de n elementos; y definimos X como el número de elementos de interés en la
muestra, entonces el modelo probabilı́stico de X viene dado por:
N −M
CxM Cn−x
f (x) = P (X = x) = , x = 0, 1, . . . , n.
CnN
Cuando la ley de probabilidad de una variable aleatoria X es ası́, se dice que tiene una
distribución hipergeométrica con parámetros N , M y n.
95
96 Profesor José Flores Delgado Estadı́stica
1
f (x) = , a ≤ x ≤ b.
b−a
Se dice que X tiene distribución uniforme. Denotamos esto por X ∼ U (a, b).
La gráfica de la densidad es la de una función constante:
a+b (b − a)2
Los valores esperados son: µX = y σX2 = .
2 12
x−a
La distribución acumulada: F (x) = P (X ≤ x) = , a ≤ x ≤ b.
b−a
Observación 3.8. Esta distribución es adecuada para describir a una variable que asuma
sus valores uniforme o indistintamente en un intervalo de extremos finitos.
Propiedad: Sea U una variable aleatoria con distribución uniforme en el intervalo [0, 1], es
decir, U ∼ U [0, 1], y X una variable aleatoria con distribución acumulada F.
Observación 3.9. La propiedad anterior nos dice cómo transformar una variable aleatoria
con distribución uniforme en [0, 1], U ∼ U [0, 1], en otra que tenga una distribución deseada.
Esto permite generar valores de una distribución arbitraria, a partir de valores generados de
una distribución uniforme y es la técnica más conocida en simulación. Es decir, si u1 , . . . , un
son n valores generados de una distribución uniforme entre 0 y 1, entonces, los valores
asociados a una variable X, con distribución con acumulada F, se pueden generar como
sigue.
xj = F −1 (uj ) ⇔ uj = F (xj ), j = 1, . . . , n.
96
Profesor José Flores Delgado Modelos probabilı́sticos importantes 97
Ejemplo 3.19. Simulemos 50 valores de una variable aleatoria, X, con modelo exponencial
con parámetro β = 1/4.
0,674 0,558 0,682 0,914 0,104 0,273 0,854 0,430 0,508 0,089
0,696 0,926 0,271 0,073 0,817 0,639 0,005 0,947 0,906 0,449
0,734 0,126 0,732 0,493 0,194 0,470 0,019 0,191 0,870 0,785
0,070 0,973 0,948 0,592 0,580 0,479 0,832 0,208 0,522 0,524
0,377 0,661 0,519 0,603 0,504 0,480 0,614 0,213 0,345 0,878
Luego:
4,480 3,263 4,582 9,815 0,439 1,277 7,683 2,246 2,833 0,374
4,761 10,406 1,266 0,305 6,800 4,072 0,019 11,770 9,442 2,382
5,299 0,537 5,274 2,715 0,864 2,540 0,077 0,850 8,168 6,152
0,290 14,506 11,861 3,589 3,471 2,611 7,137 0,932 2,951 2,973
1,891 4,330 2,930 3,691 2,801 2,618 3,806 0,956 1,695 8,429
Si consideramos estos datos generados como una muestra aleatoria de X existe una técnica
llamada “bondad de ajuste” para verificar que efectivamente el modelo de esta variable es uno
especificado, en este caso exponencial con parámetro β = 1/4. A continuación aplicaremos
esta técnica que requiere una muestra grande, como lo es en este caso, pero solo en la etapa
descriptiva y no en la de inferencia.
97
98 Profesor José Flores Delgado Estadı́stica
Se observa una tendencia decreciente, como ocurre en un una distribución exponencial; pero
esto -incluso en esta etapa descriptivo- aún resulta impreciso, pues esta gráfica depende del
número de intervalos y además solo esta forma del polı́gono no garantiza que la distribución
exponencial con el parámetro especificado (β = 1/4). Entonces, debemos comparar las
frecuencias observadas (las de los valores obtenidos para X) con las frecuencias esperadas,
según la distribución supuesta para X (en este caso exp (1/4)). A continuación expresamos
los valores de estos tipos de frecuencias en la tabla siguiente:
Se observa que las frecuencias observadas están próximas a las esperadas. Por lo tanto, el
modelo especificado parece ajustar a los datos; es decir, la simulación parece haber sido
adecuada. ∗ 0, 24 = 12/50; ∗∗ 0, 2492 = FX (6) − FX (3); ∗∗∗ 12, 4618 = 50 × 0, 2492.
Se observa que las frecuencias observadas están próximas de las esperadas. Por lo tanto, la
simulación parece haber sido adecuada; es decir, generado datos según el modelo especificado.
Esto se cumple, pues el método para simular lo establece y la cantidad de datos es grande.
98
Profesor José Flores Delgado Modelos probabilı́sticos importantes 99
con α > 0 y β > 0, los parámetros del modelo. Esto lo denotamos por X ∼ B(α; β).
α αβ
Los valores esperados son: µX = y σX2 = 2
.
α+β (α + β) (α + β + 1)
Observación 3.10. Esta distribución puede ser generalizada para un intervalo de extremos
arbitrarios, a < b, mediante el cambio de variable Y = a + (b − a)X. En este caso la densidad
de Y está dada por:
Γ(α + β)
fY (y) = (y − a)α−1 (b − y)β−1 /(b − a)α+β−1 , a ≤ y ≤ b.
Γ(α)Γ(β)
Además, la distribución uniforme en el intervalo de extremos 0 y 1 es un caso particular
de esta distribución. En efecto: X ∼ U (0; 1) ⇔ X ∼ B(1; 1). Ası́, el modelo beta es de
gran utilidad para modelar una variable aleatoria que asume sus valores en un intervalo de
extremos finitos y aun cuando no sea de manera uniforme, generalizando de este modo a la
distribución uniforme.
99
100 Profesor José Flores Delgado Estadı́stica
Por la propiedad que permite obtener el valor esperado de una función de una variable
aleatoria, se tiene que:
MX(t) = E(et X )
X
= etx fX (x)
x∈RX
Entonces, MX00 (0) = E(X 2 ). Generalizando, tenemos que MX(j) (0) = E(X j ).
Ejemplo 3.20. Si Z ∼ N (0; 1), entonces: MZ (t) = et
2 /2
∀t ∈ R. En efecto:
MZ (t) = E(etZ )
Z ∞
1 z2
= etz √ e − 2 dz
−∞ 2π
Z ∞
1 z2
= √ e tz− 2 dz
−∞ 2π
Z ∞
1 1 2
= √ e − 2 (z −2tz) dz
−∞ 2π
Z ∞
1 1 2 2 2
= √ e − 2 (z −2tz+t −t ) dz
−∞ 2π
Z ∞
1 1 2 1 2
= √ e − 2 (z−t) + 2 t dz
−∞ 2π
Z ∞
2 1 1 2
= e t /2 √ e − 2 (z−t) dz
2π
| −∞ {z }
1
= et
2 /2
, ∀t ∈ R.
Propiedad 1.
Si X es una variable aleatoria, con función generadora de momentos MX , e Y = a + bX;
entonces:
MY (t) = e a t MX (bt).
100
Profesor José Flores Delgado Modelos probabilı́sticos importantes 101
Ejemplo 3.21. Como se vio en el ejemplo anterior, si Z ∼ N (0; 1); entonces, MZ (t) =
2
e t /2 , ∀t ∈ R.
Ası́, si X ∼ N (µ; σ 2 ) :
X = |{z}
a + |{z}
b Z
X −µ
Z= ∼ N (0; 1) ⇒ X = µ + σ Z;
σ
luego, por la propiedad anterior MY (t) = e a t MX (bt) :
MX (t) = eµ t MZ (σ t) = e tµ eσ
2 t2 /2
= e tµ+σ
2 t2 /2
; ası́, MX (t) = e tµ+σ
2 t2 /2
, ∀t ∈ R.
Propiedad 2.
La función generadora de momentos determina unı́vocamente el modelo probabilı́stico.
Como ya hemos visto, si X ∼ N (µX ; σX2 ), su función generadora está dada por:
2 2
MX (t) = e tµ+σ t /2 , ∀t ∈ .R
Luego, como Y = a+b X, entonces, por la propiedad 1 se puede derivar la función generadora
de momentos de Y a partir de la de X :
MY (t) = e a t MX (bt)
2 2
= e a t e btµX +σX (bt) /2 , ∀bt ∈ R
2 2 2
= e at+bµX t+b σX t /2
2 2
= e (a+b µX )t+(bσX ) t /2 , ∀t ∈ R.
Propiedad 3.
101
102 Profesor José Flores Delgado Estadı́stica
tµX +σ 2 t2 /2 tµX +σ 2 t2 /2
=e 1 X1
... e n Xn
Que era lo que se querı́a demostrar, es decir, la función generadora de momentos de la suma
corresponde a la de una normal con parámetros µX1 + · · · + µXn y σX2 + · · · + σX2 n , por lo
1
tanto, este será el modelo de la suma: N (µX1 + · · · + µXn ; σX2 + · · · + σX2 n ).
1
102
Profesor José Flores Delgado Modelos probabilı́sticos importantes 103
Ejercicio 3.1.
En cierto sector del comercio, los establecimientos comerciales pueden pagar sus tributos a
tiempo, independientemente entre estos y en un porcentaje del 95 %.
Ejercicio 3.2.
b) Halle la probabilidad de que el primer vehı́culo que llegue a tiempo sea por lo menos
el vigésimo. Debe definir una variable e identificar (justificando) su modelo.
c) Halle e interprete el valor esperado del número de vehı́culos hasta el primero que llegue
a tiempo.
d) Halle la probabilidad de que el tercer vehı́culo que llegue a tiempo sea por lo menos el
quinto. Debe definir una variable e identificar (justificando) su modelo.
103
104 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.3.
Suponga que los usuarios de un sistema de información llegan de acuerdo con un proceso de
Poisson con una tasa de 2 usuarios por minuto.
Ejercicio 3.4.
Una agencia bancaria (que nunca cierra para los clientes) divide su trabajo interno en
perı́odos. Durante cada perı́odo se debe realizar cierta operación de verificación, esta se
puede realizar mal con una probabilidad de 0,9 e independientemente en cada perı́odo.
a) ¿Cuán probable es que esta operación se realice mal después del quinto perı́odo?
b) Cada vez que dicha operación se realice mal se debe registrar algunos datos en una
ficha especial. Al empezar la jornada de trabajo de diez perı́odos el administrador se
da cuenta que solo dispone de cinco de estas fichas, pero no solicita más. Determine el
número esperado de fichas que serán usadas durante esta jornada de trabajo.
Ejercicio 3.5.
Determine la probabilidad de que por lo menos dos vehı́culos lleguen a tiempo en cada una
de las situaciones siguientes:
a) hay 20 vehı́culos en total, además, se sabe que cada vehı́culo puede llegar a tiempo,
independientemente entre ellos y con una probabilidad de 0,6;
b) en un perı́odo de 2 minutos, además, se sabe que los vehı́culos llegan a tiempo según
un proceso de Poisson con una tasa de 5 vehı́culos por minuto.
104
Profesor José Flores Delgado Modelos probabilı́sticos importantes 105
Ejercicio 3.6.
d) Cada pregunta bien contestada vale 2 puntos. Determine cuánto debe descontarse por
cada pregunta mal contestada, de modo que la nota esperada de los alumnos de este
grupo sea cero.
e) Uno de estos alumnos necesita por lo menos 14 en esta prueba para aprobar el curso.
Cuantifique el riesgo que correrá. Use el valor de k obtenido en la parte anterior.
Ejercicio 3.7.
Los clientes de un banco que deben recibir un tratamiento especial llegan de acuerdo con un
proceso de Poisson con un tasa de un cliente cada 20 minutos.
b) A todo cliente que debe recibir un tratamiento especial se le entrega un premio; pero
al empezar la jornada de trabajo el administrador se da cuenta que solo dispone de
cinco de estos premios. Determine el número esperado de premios que serán entregados
durante la primera hora de atención.
c) Determine el tiempo que dispone el administrador para que, con una probabilidad de
0,9, pueda completar una pequeña labor antes de la llegada del primer cliente que deba
recibir un tratamiento especial.
d) ¿Cuál es la probabilidad de que pase más de una hora hasta la llegada del tercer cliente
que deba recibir un tratamiento especial en el banco?
105
106 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.8.
En el contexto del modelo binomial de finanzas, descrito en el ejemplo 3.3, determine el valor
esperado del capital acumulado al cabo de 10 operaciones.
n
n i n−i
Puede ser útil la fórmula del binomio de Newton: (a + b)n =
P
i
ab .
i=0
Ejercicio 3.9.
La ocurrencia de cierto evento catastrófico para la economı́a ocurre de acuerdo con un proceso
de Poisson con una tasa de uno cada cinco años.
a) Halle la probabilidad de que en una década no ocurra más de dos veces este evento.
b) Halle la probabilidad de que en, un perı́odo de cinco años, ocurra más de dos veces
este evento catastrófico.
d) ¿Cuán probable es que pasen más de 20 años hasta que ocurra tres veces dicho evento?
Ejercicio 3.10.
Cierto evento imprevisto puede ocurrir durante cada mes, con una probabilidad de 0,1 e
independientemente de otros meses.
b) Una persona adquiere una póliza contra este tipo de evento, que regirá durante los
cinco meses siguientes. El contrato estipula que si el evento ocurre antes del quinto
mes, entonces, la compañı́a aseguradora debe pagarle una suma indemnizatoria de
seis mil soles, pero no volverá hacerlo si ocurriera nuevamente; además, la persona solo
hará un único pago de diez mil soles. Determine la utilidad esperada de la aseguradora.
c) Halle la probabilidad de que el evento ocurra por tercera vez después del quinto mes.
106
Profesor José Flores Delgado Modelos probabilı́sticos importantes 107
Ejercicio 3.11.
Los pedidos llegan a cierto supermercado (que atiende las 24 horas del dı́a) según un proceso
de Poisson, con una media de cuatro pedidos por hora.
a) Desde que empezó un dı́a, ha pasado media hora y no ha llegado el primer pedido, halle
la probabilidad de que este pedido tampoco llegue durante la siguiente media hora.
b) Por dı́a el supermercado tiene un costo de 250 soles, siempre y cuando el primer
pedido llegue durante las dos primeras horas del dı́a; pero por cada hora adicional (a
las primeras dos horas del dı́a) que tarde este primer pedido, dicho costo se incrementa
en 50 soles. Determine el costo esperado por dı́a.
Ejercicio 3.12.
Se sabe que la demanda anual de un bien puede ser muy baja en cualquier año, de manera
independiente de otros años y con una probabilidad de un décimo.
b) Calcule la probabilidad de que el primer año en el que la demanda sea muy baja sea
por lo menos el quinto, pero máximo el vigésimo.
Ejercicio 3.13.
Suponga que durante un año, en cierto paı́s, los eventos catastróficos ocurren según un
proceso de Poisson con una tasa de 2 eventos por mes. Además, cada evento catastrófico
produce una daño cuya magnitud es independiente de las correspondientes a otros eventos
catastróficos y con distribución exponencial. El diseño de “prevención contra desastres”del
gobierno consideró un valor crı́tico para el daño ocasionado por una catástrofe cuando esta
es 3,5 veces la media de dicha magnitud. Obtenga la “confiabilidad del diseño prevención
contra desastres”durante el perı́odo de un año, es decir, la probabilidad de que durante dicho
perı́odo ninguna de las magnitudes de los daños que se produzcan supere el valor crı́tico2 .
107
108 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.14.
Una municipalidad verificará si las tiendas de su distrito cumplen una ordenanza dictada
recientemente. Con este fin, se escogerá una muestra aleatoria de 20 tiendas del distrito.
Además, por experiencia se sabe que el 25 % de estos establecimientos suele incumplir las
ordenanzas nuevas.
c) Determine la probabilidad de que por lo menos cinco de las tiendas, en la muestra por
seleccionar, incumplan la ordenanza.
e) Suponga que inspeccionar cada tienda de la muestra seleccionada costará 500 soles.
Además, cada detección originará un descuento de 500 soles en el costo, pues esta
cantidad será pagada por el propietario de la tienda que incumpla la ordenanza; pero
cada tienda seleccionada que cumpla la ordenanza originará un costo adicional de 250
soles, pues el propietario de la tienda recibirá un descuento en sus tributos por este
valor. Si el presupuesto para llevar a cabo este muestreo es de 12 750 soles:
Ejercicio 3.15.
Una compañı́a alquila un equipo que se puede descomponer durante un mes independien-
temente de otros meses y con probabilidad 0,2. El equipo se usará 20 meses. Cada mes le
generará un ingreso de 1000 soles (ası́ se descomponga el equipo); además cada mes en donde
se descomponga el equipo le significará un egreso de 500 soles por reparación.
b) Halle el valor esperado y la desviación estándar del número de meses en los que se
descompondrá el equipo.
d) La compañı́a desea ganar, por lo menos, 18 500 soles. Cuantifique el riesgo que correrá.
108
Profesor José Flores Delgado Modelos probabilı́sticos importantes 109
Ejercicio 3.16.
Los pedidos llegan a una central según un proceso de Poisson con una tasa de tres por
minuto.
b) Halle la probabilidad de que el primer pedido demore en llegar más de cinco minutos
pero menos de diez. Debe definir una variable e identificar (justificando) su modelo.
c) Halle la probabilidad de que el segundo pedido demore en llegar más de cinco minutos
pero menos de diez. Debe definir una variable e identificar (justificando) su modelo.
Ejercicio 3.17.
b) Halle la probabilidad de que el primer vehı́culo que llegue a tiempo sea por lo menos
el vigésimo. Debe definir una variable e identificar (justificando) su modelo.
Ejercicio 3.18.
Ejercicio 3.19.
Ejercicio 3.20.
Una operación financiera resulta rentable con una probabilidad de 0,25. Un inversionista
realizará esta operación en 20 oportunidades. Para evaluar los riesgos se supondrá que las
operaciones originan resultados independientes y que la probabilidad de que sea rentable se
mantiene constante. Determine la probabilidad de que por lo menos tres de las operaciones
resulten rentables. Debe definir una variable X e identificar, justificando, su modelo.
109
110 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.21.
Parte del trabajo de un promotor que trabaja en una Administradora de Fondos de Pensiones
(AFP) consistente en visitar a personas que están afiliadas a una AFP distinta para tratar de
convencerlos de que se cambien a esta AFP. Este promotor, según su experiencia, estima que
la probabilidad de convencer a una persona es de apenas 0,05. El promotor decide evaluar
ciertos riesgos, para esto considerará que este trabajo obedece un proceso de Bernoulli
a) Diga cuáles son las dos condiciones que se deben cumplir para que, efectivamente, el
convencer a los afiliados que visite el promotor ocurra según un proceso de Bernoulli.
Ejercicio 3.22.
b) Halle la probabilidad de que el volumen de agua que se debe revisar hasta ubicar la
primera bacteria esté entre cinco y diez cm3 .
Ejercicio 3.23.
Sea X una variable aleatoria con modelo probabilı́stico normal, con media µX y desviación
estándar σX .
110
Profesor José Flores Delgado Modelos probabilı́sticos importantes 111
Ejercicio 3.24.
El precio de una unidad del bien A es una variable aleatoria X con modelo normal de media
30 soles y desviación estándar 4 soles. El precio de una unidad del bien B es una variable
aleatoria Y con modelo normal de media 20 soles y desviación estándar 3 soles. Estas dos
variables son independientes.
a) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que 25 soles.
b) Se debe comprar una unidad del bien A y otra del bien B; halle la probabilidad de que
55 soles sean suficientes.
c) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que el de
una del bien B.
d) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que dos del
bien B.
e) Se debe comprar una unidad del bien A y dos del bien B; halle la probabilidad de que
60 soles sean suficientes.
Ejercicio 3.25.
La distribución de los tiempos necesarios para que las personas se recuperen de la dolencia
A se considera normal con media 14, 5 horas y desviación estándar 3 horas; mientras que el
tiempo necesario correspondiente a la recuperación de la dolencia B se considera normal con
media 13, 5 horas y cuarto inferior a partir de 15 horas. Suponiendo que existe independencia
entre ambos tiempos:
111
112 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.26.
b) Halle el valor en riesgo (VaR) de un grado de confianza del 95 %. Vea el ejercicio 2.28
e) En el contexto de la parte anterior, determine cuál debe ser el monto del capital que
deberá colocar el inversionista para que, con una probabilidad de 0,95 o más, la pérdida
no pase de 5,5 u.m.
f) Suponga que se realizan dos operaciones independientes con estas caracterı́sticas, pero
una de 10 u.m. y la otra de 20 u.m.
Ejercicio 3.27.
112
Profesor José Flores Delgado Modelos probabilı́sticos importantes 113
Ejercicio 3.28.
La distribución de los salarios en el sector A se considera normal con una media de 1 450
soles y una desviación estándar de 300 soles. En el sector B la distribución de los ingresos
es normal con media 1 350 soles; además el 25 % de los asalariados gana más de 1 500 soles.
d) Un promotor de créditos visita a una pareja de asalariados, uno del sector A y el otro
del B, para ofrecerles un crédito que requiere un salario conjunto de por lo menos
2 500 soles. ¿Cuál es la probabilidad de que esta pareja cumpla el requisito anterior
para poder acceder al crédito? Asuma que los salarios son independientes.
Ejercicio 3.29.
Se realizarán 100 operaciones financieras, en cada una se invertirá 10 u.m. , las tasas
de rentabilidad correspondientes son variables aleatorias con modelos probabilı́sticos
desconocidos; pero estas son independientes, cada una de las primeras 25 tiene una media
de 0,01, y cada una de las restantes 75 una media de 0,02. Cada tasa tiene una desviación
estándar de 0,3. Halle la probabilidad de que el capital final esté entre 950 y 1100 u.m.
Ejercicio 3.30.
Para el ingreso familiar en una región se considera un modelo lognormal con media 1,65
miles de soles y desviación estándar 2,16 miles de soles. En la tabla siguiente se muestra
información incompleta respecto a estos ingresos:
x es un valor del ingreso familiar y F (x) la proporción de familias con ingresos hasta x.
113
114 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.31.
El capital acumulado al cabo de una gran cantidad de operaciones financieras tiene una
distribución lognormal, su media es de 60 u.m. y su desviación estándar de 28 u.m.
Ejercicio 3.32.
Los ingresos (en miles de soles), de los trabajadores de cierto sector, son explicados por un
modelo lognormal con parámetros µ = 3 y σ 2 = 1.
Ejercicio 3.33.
c) Si Y = n − X, halle MY .
Recuerde la propiedad: si Y = a + bX, entonces, MY (t) = e a t MX (bt).
Ejercicio 3.34.
114
Profesor José Flores Delgado Modelos probabilı́sticos importantes 115
Ejercicio 3.35.
a) Demuestre que la función generadora de momentos de este modelo está dada por:
βα
MX (t) = , t < β.
(β − t)α
Ejercicio 3.36.
Ejercicio 3.37.
115
116 Profesor José Flores Delgado Estadı́stica
Ejercicio 3.38.
Ejercicio 3.39.
Sea X ∼ g(p).
pet
a) Verifique, calculando, que MX (t) = E(etX ) = 1−qet
, t < −ln q.
∞
r
ri =
P
Recuerde que si 0 < r < 1 : 1−r
.
i=1
Ejercicio 3.40.
a) Determine la probabilidad de que uno de estos empleados llegue entre las 8.00 a.m y
las 8.20 a.m.
i) en promedio, ¿cuántos de estos llegan entre las 8.00 a.m. y las 8.20 a.m. ?
ii) ¿cuál es la probabilidad de que cuatro empleados lleguen entre las 8.00 a.m y las
8.20 a.m. ?
116
4. Indicadores de concentración para medir la
desigualdad de los ingresos
Definición 4.1. Sea X una variable con densidad f, distribución acumulada F y media
µ > 0. Definimos la función Φ mediante
Z x
yf (y)dy
−∞
Φ(x) =
µ
Observación 4.1. Si X es el ingreso familiar, sigue de la definición anterior que Φ(x) puede
interpretarse como la fracción que representa el ingreso promedio (o total) de las familias con
ingresos inferiores o iguales a x, respecto al ingreso medio (o total) familiar 1 . Para entender
R∞
esto recuérdese que µ = E(X) = yf (y)dy; además, si para cada x consideramos g(y) = x,
−∞
Rx
si y ≤ x, y g(y) = 0, si y > x, entonces, E(g(X)) = g(y)f (y)dy corresponde al ingreso
−∞
promedio de las familias con ingresos menores o iguales que x2
σ 1 2
Ejemplo 4.1. Si X ∼ N (µ; σ 2 ), tenemos que Φ(x) = F (x) − √ e− 2 σ2 (x−µ) , como se
µ 2π
verifica a continuación:
Z x−µ
1 x 1 x
Z Z
1 − 1 2 (y−µ)2 1 σ 1 1 2
Φ(x) = yf (y) dy = y√ e 2σ dy = (µ + σ z) √ e− 2 z dz
µ −∞ µ −∞ 2π σ µ −∞ 2π
Z x−µ Z x−µ
σ 1 − 1 z2 σ σ 1 1 2
= √ e 2 dz + z √ e− 2 z dz
−∞ 2π µ −∞ 2π
Z x−µ
σ σ 1 1 2 σ 1 2
x−µ
=F ( σ )+ z √ e− 2 z dz = F (x) − √ e− 2 σ2 (x−µ) , con Z ∼ N (0; 1).
Z µ −∞ 2π µ 2π
En particular, Φ(x) < F (x), es decir, la fracción que representa el ingreso total de las familias
con ingresos inferiores o iguales a x (respecto al ingreso total de las familias) siempre es
menor que la proporción de familias con ingresos inferiores o iguales a x (esto último es
la interpretación de F (x)). Por lo tanto, para completar una proporción del ingreso total
(empezando con las familias de menores ingresos) siempre se requiere una proporción menor
de familias. Esta es una de las propiedades que se enuncian a continuación y que justificarán
la forma de la curva de Lorenz.
1
Véase Frankn A. Cowell 1995, pág. 138.
2
Véase la parte e del ejercicio propuesto 2.12.
117
118 Profesor José Flores Delgado Estadı́stica
5. Φ(x) < F (x), si 0 < F (x) < 1, y Φ(x) = F (x), si F (x) = 0 ó F (x) = 1.
Para justificar estas propiedades básicamente se debe notar que Φ0 (x) = xf (x)/µ, F 0 (x) =
f (x), lı́m F (x) = 0 y lı́m F (x) = 1.
x→−∞ x→∞
Definición 4.2. Sea X una variable con densidad f, distribución acumulada F y media µ.
Se define la Curva de Lorenz como la gráfica de los pares (F (x), Φ(x)), para cada x ∈ . R
Observación 4.2. La Curva de Lorenz es uno de los métodos más usados para ilustrar
la desigualdad de la distribución de los ingresos totales (riqueza) de una población, fue
introducida en 19053 . Como se han interpretado Φ(x) y F (x), esta curva muestra cuál es la
proporción del ingreso acumulado que es obtenida por cada proporción de la población.
La siguiente gráfica muestra una desigualdad en la distribución de los ingresos, esta es
la curva tı́pica de Lorenz para una distribución de ingresos con tendencia central, pero con
presencia de valores grandes concentrados en una proporción baja de familias, como ocurre,
por ejemplo, en un modelo lognormal4 :
podemos apreciar que para llegar a completar solo el 28 % de los ingresos (empezando por
los de menor valor) se tiene ya el 66 % de la población; que evidencia la distribución desigual
del ingreso en la población, la mayor parte de este se concentra en una parte muy pequeña
de la población. Obsérvese que inicialmente la diferencia entre Φ(x) y F (x) es nula (si la
proporción del ingreso acumulado es cero también lo es la proporción de la población), luego
a medida que aumenta Φ(x) esta diferencia aumenta (la desigualdad se hace mayor), pero a
partir de cierto valor disminuye (la desigualdad se hace menor) hasta ser nuevamente nula
(el ingreso total corresponde a la población completa): conforme las dos últimas propiedades.
3
Véase Frankn A. Cowell 1995, pág. 19.
4
La gráfica se ha elaborado considerando un modelo lognormal con parámetros µ = 0 y σ = 1.
118
Profesor José Flores Delgado Indicadores de concentración de los ingresos 119
La lı́nea de igualdad que se muestra corresponde a una distribución igual del ingreso entre la
población, es decir, cuando para completar determinada proporción del ingreso se requiere
la misma proporción de la población, es decir, si X es constante.
De las gráficas anteriores podemos deducir, entre otras cosas, que para llegar a completar
solo el 28 % de los ingresos (empezando por los de menor valor), en la población R2 se tiene
ya el 66 % de la población; pero en la población R1 se tiene solo el 46 %. En resumen la
distribución del ingreso en la región R2 es más desigual.
Definición 4.3. El Coeficiente de Gini, denotado G, asociado a una variable X con densidad
f se define como sigue:
G = 1 − 2E Φ(X) ;
o, equivalentemente,
Z ∞
G=1−2 Φ(x)f (x)dx
−∞
119
120 Profesor José Flores Delgado Estadı́stica
σ
Ejemplo 4.2. Si X ∼ N (µ; σ 2 ) el Coeficiente de Gini es igual a √ , como se verifica a
µ π
continuación:
G = 1 − 2E Φ(X)
σ 1 2
= 1 − 2E F (X) − √ e− 2 σ2 (X−µ) (véase el ejemplo 4.1)
µ 2π
σ 1 2
= 1 − 2E F (X) + 2 √ E e− 2 σ2 (X−µ)
µ 2π
2σ 1 2
= 1 − 2 ( 12 ) + √ E e− 2 σ2 (X−µ) ( F (X) tiene distribución uniforme en (0, 1) )
µ 2π
2σ 1 2
= √ E e− 2 σ2 (X−µ)
µ 2π
Z ∞
2σ 1 2 1 1 2
= √ e− 2 σ2 (x−µ) √ e− 2 σ2 (x−µ) dx
µ 2π −∞ 2π σ
Z ∞
2σ 1 1 2
= √ √ e− σ2 (x−µ) dx
µ 2π −∞ 2π σ
Z ∞
2σ 1 1 − 1√
(x−µ)2
= √ √ √ σ
e 2 (σ/ 2)2 dx
µ 2π 2 −∞ 2π √2
| {z }
2σ 1 1
= √ √
µ 2π 2
σ
= √ .
µ π
Ejemplo 4.3. Ası́, las distribuciones de los ingresos de dos poblaciones, R1 y R2 , son
normales con parámetros µ1 = µ2 = 5, σ1 = 1 y σ2 = 3, entonces, los coeficientes de
1 3
Gini respectivos son: G1 = √ = 0, 1128 y G2 = √ = 0, 3385. La conclusión es que
5 π 5 π
la distribución del ingreso en la población R1 es menos desigual. Lo anterior se ilustra en el
gráfico que sigue:
120
Profesor José Flores Delgado Indicadores de concentración de los ingresos 121
Observación 4.4. Un defecto que tiene este coeficiente es que dos distribuciones pueden
tener el mismo coeficiente y, sin embargo, distinto grado de desigualdad.
121
5. Estadı́stica descriptiva
Como es natural, lo primero que debemos precisar es qué es la estadı́stica; en ese sentido,
proponemos las observaciones siguientes. ¿De dónde proviene el término ‘estadı́stica’ ?
Desde tiempos muy remotos en la historia de la humanidad, 2300 años antes de Cristo,
encontramos evidencias históricas que demuestran que culturas antiguas, como la china,
la hebrea, la griega (particularmente la ateniense) y la romana, formaron censos (listas,
registros, resúmenes), por razones de estado, por ejemplo, tributarios, alimentarios y
militares. Como puede imaginarse, en aquellos tiempos remotos, el habitante común no
estaba interesado en llevar a cabo semejante tarea, es decir, esta generación de datos
resumidos era una labor o competencia exclusiva del estado; no es ahora difı́cil imaginar
que de allı́ derive el término estadı́stica, en cuanto a su acepción de censo, lista o incluso
resumen. Para ilustrar más este significado de estadı́stica, recordemos las siguientes frases
comunes:
“las estadı́sticas no mienten”
“las estadı́sticas demuestran que...”
“existen las mentiras, las grandes mentiras y las estadı́sticas”
Después de tratar del origen de la estadı́stica, veamos ahora el significado actual de esta.
Solo a fines del siglo XVII, en Alemania, es la estadı́stica considerada como ciencia, gracias
a los trabajos culminantes de Karl Friedrich Gauss. En efecto, hoy en dı́a, la estadı́stica
es considerada como una ciencia y su caracterı́stica principal, ya no es solo obtener
resúmenes; sino más bien, realizar inferencias a partir de los resultados obtenidos
de una muestra relativamente pequeña de datos. A continuación damos dos ejemplos
de esto último.
Ejemplo 5.1. Cuando estamos en épocas de elecciones, queremos saber las preferencias de
todo el electorado, pero encuestar a todos resulta imposible, por razones de tiempo y dinero.
Entonces, se recurre a tomar adecuadamente una muestra y a partir de los resultados que
se obtienen de ella, inferir lo que ocurrirá en general.
123
124 Profesor José Flores Delgado Estadı́stica
Parece claro que las inferencias que resulten de lo observado, en solo una muestra de la
población de estudio, no tienen que ser necesariamente verdaderas; sino que más bien están
acompañadas de cierto margen de error y nivel de confianza, es decir, son solo ‘estimaciones’
o aproximaciones de lo que realmente ocurre. Es precisamente la búsqueda de estas medidas
de error y de confianza para las inferencias, que convierten a la estadı́stica en una ciencia,
pues para ello usa las matemáticas y crea su propia teorı́a. El primer resultado cientı́fico en
ese sentido, data de 1818, en este se estudió la eficiencia de los estimadores estadı́sticos, lo
que se obtuvo gracias a resultados matemáticos, originales de Gauss, sobre teorı́a de los
errores.
124
Profesor José Flores Delgado Estadı́stica descriptiva 125
Definición 5.3. Población es el conjunto de unidades, personas u objetos, sobre los cuales
interesa observar una o más caracterı́sticas.
Definición 5.4. Una muestra es cualquier conjunto de una población. La muestra se llama
aleatoria, si sus integrantes han sido escogidos al azar.
125
126 Profesor José Flores Delgado Estadı́stica
Definición 5.6. Las variables se suelen clasificar como cualitativas si tienen carácter no
numérico, y cuantitativas, si representan cantidades. A su vez, las variables cuantitativas,
se subclasifican en discretas, si el conjunto de valores posibles de la variable (denominado
rango) puede ser enumerado, y en continuas, si este conjunto de valores constituye un
intervalo o reunión de intervalos.
Ejemplo 5.5. Veamos cómo se clasifican las variables dadas en el ejemplo 5.4:
La edad del elector es una variable cuantitativa y por la forma de medirla usualmente, se la
puede considerar discreta; formalmente deberı́a ser continua, pero en la práctica se mide en
años cumplidos.
El estado socioeconómico del elector es también una variable cualitativa, expresa el grupo o
estrato socioeconómico al que pertenece el elector.
El grado de instrucción del elector, también es una variable cualitativa, pues si bien representa
un grado, esto solo significa más o menos instrucción, pero no cantidad.
El ingreso mensual es una variable cuantitativa continua, pues representa una cantidad y
sus valores posibles, en teorı́a, constituyen un intervalo.
Aquı́, los números solo sirven para distinguir valores o categorı́as diferentes de la variable.
126
Profesor José Flores Delgado Estadı́stica descriptiva 127
Ejemplo 5.6. El sexo de los electores se mide a este nivel de medición o escala. Una escala
apropiada puede ser, por ejemplo, la siguiente:
0= femenino; 1 = masculino.
a= femenino; b = masculino.
Para ciertos a y b números reales, fijados previamente y con la única condición de que sean
diferentes.
Aquı́, los números, además de servir para distinguir, reflejan un orden existente entre
los valores de la variable, según el menor o mayor grado en el que se encuentre presente la
caracterı́stica.
Ejemplo 5.7. El grado de instrucción del elector, se suele medir con este nivel.
Para simplificar, supongamos que solo distingamos cuatro valores: analfabeto, primaria,
secundaria y superior. Entonces, una escala apropiada puede ser:
Para ciertos a, b, c y d números reales, fijados previamente y con la única condición de que
a < b < c < d.
Además de las caracterı́sticas anteriores, se tiene que las diferencias entre los números
asignados representan propiamente cantidades de la caracterı́stica medida. Esto se logra
definiendo una unidad de medida y un cero u origen, este último es arbitrario por no existir
naturalmente, es decir, no existe un valor que indique ausencia de la caracterı́stica que se
mide.
127
128 Profesor José Flores Delgado Estadı́stica
Ejemplo 5.8. El tiempo en el calendario actual es medido de esta forma. Para ilustrar este
tipo de escala fijémonos en el acontecimiento de tres eventos A, B y C, en el calendario
actual, como se muestra a continuación:
A B C
A.C. 0 100 200 300 400 500
Es inexacto afirmar que el tiempo transcurrido hasta B sea el doble del transcurrido hasta A,
en efecto, esto puede parecer cierto en esta escala del calendario gregoriano, donde el origen,
al no existir naturalmente, ha sido fijado arbitrariamente, es decir, no significa ausencia de
tiempo transcurrido. Sin embargo, sı́ es cierto que la diferencia entre el tiempo transcurrido
hasta el acontecimiento A y el transcurrido hasta B, es la tercera parte de la correspondiente
diferencia existente entre B y C.
Observación 5.2. Si dos escalas de intervalo son equivalentes, es decir, son útiles para medir
la misma caracterı́stica, la relación existente entre una medición, X, cualquiera, obtenida
para un elemento de la población; e Y , la correspondiente medición en el mismo elemento,
pero con la otra escala es:
Y = a + bX
Siendo a y b constantes independientes del objeto que se mide con ambas escalas. Esto es ası́,
pues b representa el posible cambio de unidad, por ejemplo de años a siglos, y a representa
el posible cambio de origen.
Ejemplo 5.9. Los ingresos del elector se miden con este nivel o escala, pues existe una
unidad de medida (soles, dólares, etc.) y existe un cero absoluto u origen natural, es decir,
un valor que, sin importar la escala de razón empleada, indica ausencia de ingresos. Por la
misma razón, el número de integrantes de la familia del elector, también se mide con este
nivel, en efecto, hay una unidad de medida (unidades, decenas, etc) y el cero es único, indica
que no hay integrantes.
Observación 5.3. Si dos escalas de razón poseen equivalencia, es decir, son útiles para medir
la misma caracterı́stica, existirá una relación entre una medición, X, cualquiera, obtenida
128
Profesor José Flores Delgado Estadı́stica descriptiva 129
Y = bX
Siendo b una constante independiente del objeto sobre el que se mide con ambas escalas.
Esto es ası́, pues b representa el posible cambio de unidad, por ejemplo de años a siglos o,
de soles a dólares, o de unidades a decenas.
A fin de poder detectar patrones de tendencia que puedan mostrar los datos disponibles, es
usual organizarlos en una distribución de frecuencias, agrupándolos en clases y determinando
las frecuencias, es decir, el número o proporción de datos correspondiente a cada una. Como
veremos a continuación, el tratamiento depende del tipo de variable, pero vale la pena señalar
que no existe una única manera de hacerlo. En todos los casos, suponemos que X es la variable
de la cual se han obtenido los n datos disponibles.
Ejemplo 5.10. El tipo de crédito directo otorgado por la banca múltiple es una variable
cualitativa de interés en la supervisión de la banca. Supongamos que se desea averiguar cómo
se han distribuido los créditos otorgados según el tipo, esta información la podemos obtener
de la página web de la superintendencia de banca y seguros. Ası́, la tabla siguiente muestra
la distribución de esta variable al 31 de mayo de 2003:
Ejemplo 5.11. La distribución del ejemplo anterior puede representarse mediante barras o
sectores circulares como se muestra a continuación:
129
130 Profesor José Flores Delgado Estadı́stica
Distribución de los deudores según el tipo de crédito adquirido. Panel izquierdo: gráfico de barras.
Panel derecho: gráfico de sectores circulares
Apreciamos claramente que la mayor parte de los créditos concedidos son de consumo, con un
82,5 % del total de créditos asignados, sigue el tipo de crédito comercial y a microempresas
(con el 15 %), y el tipo de crédito menos otorgado es el hipotecario con solo un 2,5 %.
Al valor de la variable que se presenta con mayor frecuencia se de denomina moda, entonces,
podemos decir que la moda del tipo de crédito otorgado es el tipo de consumo.
Ejemplo 5.12. A fin de estudiar el número de sucursales que tienen las empresas de cierto
ramo de la producción nacional, se tomó una muestra de 80 estas empresas y se contó el
número de sucursales que tenı́a cada una, obteniéndose los resultados siguientes:
2 4 5 4 4 4 5 3 4 5 5 2 4 1 3 5 5 3 4 4 7 5 2 4 4 5 4
5 5 7 6 5 5 6 5 4 6 4 3 4 6 4 6 4 4 5 3 4 4 4 4 5 4 6
4 4 4 6 4 4 4 4 4 5 4 4 4 6 4 5 4 5 4 4 5 4 4 5 2 4
Distribución del
número de sucursales
Sucursales Empresas Acumulado
X f F
1 1 1
2 4 5
3 5 10
4 40 50
5 20 70
6 8 78
7 2 80
130
Profesor José Flores Delgado Estadı́stica descriptiva 131
Una medida de este valor central es, por ejemplo, la moda, 4 sucursales, o la media aritmética:
n
P
xj
j=1 1(1) + 2(4) + ... + 7(2) 346
X̄ = n
= = = 4, 325.
80 80
Las estadı́sticas más usadas para determinar un valor promedio son la media aritmética, la
moda y la mediana. La mediana, me , es el valor que ocupa la posición central cuando los
datos se ordenan, por lo tanto este valor tiene la propiedad que la mitad de los datos son
menores o iguales que él. En el último ejemplo, la mediana es 4, es decir, la mitad de las
empresas tienen 4 sucursales o menos.
En este caso, los datos se agrupan en k intervalos de igual longitud o amplitud, C, luego se
determinan las frecuencias de los intervalos. También se acostumbra definir el representante
o marca de clase de cada intervalo, como el punto medio del intervalo, este servirá para
aproximar a todos los datos que se encuentren en dicho intervalo.
0,19 1,39 2,16 1,23 0,75 2,59 1,40 0,02 0,71 2,41 3,53 1,17 1,16
1,61 3,76 0,96 1,94 1,65 4,75 1,59 0,47 2,01 0,82 0,92 3,07
131
132 Profesor José Flores Delgado Estadı́stica
Obtengamos primero las estadı́sticas usadas para determinar un promedio, las cuales se
complementarán con los patrones de tendencia que se puedan detectar al organizar los datos
en una distribución de frecuencias, y más adelante veremos otras estadı́sticas que servirán
para cuantificar la variabilidad existente entre los datos y, de este modo, verificar la idoneidad
de tales promedios. Ası́, la media aritmética resulta: X̄ = (x1 + x2 + . . . + x25 )/25 =
42, 26/25 = 1, 6904, entonces, según este resultado, el tiempo promedio para efectuar las
transacciones es de 1,6904 min ; sin embargo, esto no es suficiente para garantizar que
realmente este valor sea un buen promedio. Estos datos no tienen una moda, pues no existe
uno que se repita más. La mediana de estos datos es el que ocupa la posición central (en
este caso la decimotercera), es decir, 1,4, ası́, tenemos que el 50 % de los clientes demoró 1,4
min o menos. Este último valor también puede tomarse como promedio, pero, como ya se
mencionó, debe verificarse que realmente cumpla este rol.
Ahora pasemos a la detección de los posibles patrones de tendencia, para este fin
construyamos una distribución de frecuencias con k = 6 intervalos de igual longitud. Los
datos extremos son: x(1) = 0, 02 y x(25) = 4, 75. Luego, el rango es R = 4, 75 − 0, 02 = 4, 73.
Ası́, la longitud de cada uno de los k = 6 intervalos será C = 4, 73/6 = C = 0, 78833..., pero
como no sale un valor exacto, es necesario redondear. En este caso, podemos redondear a
2 decimales (pues los datos solo tienen dos decimales, ası́, no vale la pena considerar más),
claramente el redondeo debe ser por exceso (hacia arriba), pues de otro modo el mayor
dato quedarı́a fuera. Tomamos C = 0, 79. El primer intervalo comenzarı́a en x(1) = 0, 02 y
terminarı́a en x(1) + C = 0, 02 + 0, 79 = 0, 81, el segundo empezarı́a en 0, 81 y terminarı́a
en 0, 81 + C = 1, 60; y ası́ sucesivamente, hasta haber completado los k = 6 intervalos. Con
estos intervalos se obtiene la tabla, todavı́a incompleta, de la forma siguiente:
Ahora, se distribuyen los datos uno por uno. Al final, se habrá completado la tabla de
frecuencias siguiente:
132
Profesor José Flores Delgado Estadı́stica descriptiva 133
Las otras partes de la tabla son las siguientes: xj = marca de clase del intervalo j (punto
medio del intervalo j); Fj = frecuencia acumulada hasta el intervalo j; h = f /n y H = F/n.
Con estas completamos la tabla de la distribución de frecuencias
Distribución de los tiempos para realizar las transacciones. Panel izquierdo: histograma. Panel
derecho: polı́gono
En cualquiera de estas gráficas apreciamos los patrones de tendencia que muestran los datos.
Podemos empezar por mencionar lo evidente, la variación natural de los datos, es decir, no
todos los clientes necesitan el mismo tiempo, los valores correspondientes están entre 0,02
y 4,75 min. También se puede apreciar claramente que los tiempos necesarios, para que
los clientes efectúen sus transacciones, tienden a distribuirse alrededor del intervalo entre
0,81 y 1,6, el cual sobresale en frecuencia y conforme consideramos tiempos con valores que
se alejan de este intervalo, son menos los clientes que necesitan de este tiempo, es decir,
se distingue un patrón de centralización, como es razonable. Por lo observado, la media y
mediana sı́ cumplen el papel de promedio, y algo mejor la mediana por estar en el intervalo
central. Además, existen unos pocos clientes cuyos tiempos necesarios son muy grandes en
comparación con los otros, es decir, existe una asimetrı́a o sesgo hacia valores altos.
133
134 Profesor José Flores Delgado Estadı́stica
Figura 5.1: Ojiva de la distribución de los tiempos para realizar las transacciones
Esta gráfica es de utilidad cuando, por ejemplo, queremos determinar ubicaciones relativas
en la distribución, como lo ilustra el ejemplo siguiente.
Ejemplo 5.14. Al banco le interesa saber, entre otros detalles, si necesita dar más
recomendaciones en cuanto al uso del cajero para bienestar de todos los clientes. Ası́, no
solo le interesa que los tiempos necesarios tiendan a centralizarse alrededor de un valor
razonable; sino también que no exista un sesgo indicativo de posible malestar en los clientes
que podrı́an estar esperando su turno, por mucho tiempo. En ese sentido, el banco considera
un grupo de clientes ‘crı́tico’, este lo integran aquellos que necesitan de mayores tiempos y
que constituyen la cuarta parte de los clientes. ¿A partir de qué tiempo un cliente, de la
muestra, ya es considerado dentro del grupo referido?
134
Profesor José Flores Delgado Estadı́stica descriptiva 135
El problema anterior también puede resolverse desde un punto de vista probabilı́stico, para
esto basta obtener un modelo que describa las frecuencias relativas de los tiempos necesarios
—más adelante nos ocuparemos del estudio de modelos de esta naturaleza—, podemos
considerar uno muy simple a partir de los datos de la muestra, es decir, una función H
cuya gráfica corresponde a la ojiva dada anteriormente, ası́, de allı́ observamos (o incluso
simplemente de la tabla de la distribución) que el valor buscado, x, está en el tercer intervalo,
es decir, x ∈]1, 60; 2, 39], luego, concentrando nuestra atención en este intervalo, obtenemos:
x = 2,3505. Lo anterior se ilustra a continuación:
Con esta función podemos averiguar, bajo un enfoque probabilı́stico, todo lo relacionado
con esta variable (el tiempo necesario para realizar las transacciones en el cajero), como por
ejemplo el tiempo promedio necesario, de esto nos ocuparemos en el capı́tulo de probabilidad.
135
136 Profesor José Flores Delgado Estadı́stica
Ejemplo 5.15. Cuando usted, como es de esperarse, termine satisfactoriamente sus estudios
o, haya completado buena parte de ellos, querrá empezar a trabajar o, tal vez, querrá salir
al extranjero para realizar un pos grado; entonces, tendrá que preparar su curriculum vitae,
además, probablemente tenga que rendir un examen de suficiencia en el idioma inglés y
también le tendrán que elaborar algunas cartas de recomendación. Para lo del inglés, lo
que importará será su ubicación relativa o, percentil, dentro de las notas de dicho examen;
mientras que para la carta de recomendación, será de suma importancia su percentil dentro
del grupo de notas de los alumnos de la universidad.
Definición 5.8. Gráfica de caja: es una gráfica que se obtiene con los percentiles 25, 50
y 75, junto con el menor y mayor valor de los datos. Se obtiene ası́ un buen resumen de los
datos.
A continuación hagamos la gráfica de caja que corresponde a los datos del ejemplo 5.13,
correspondientes a los tiempos necesarios para realizar una transacción en un cajero
automático. Las estadı́sticas necesarias las presentamos en la tabla siguiente:
Figura 5.2: Gráfica de caja de la distribución de los tiempos para realizar las transacciones
En esta gráfica se puede apreciar que los tiempos necesarios para realizar las transacciones
varı́an entre 0,02 min y 4,75 min, mientras que el 50 % de las tiempos centrales está entre
0,92 min y 2,16 min, esto da un rango medio de 2,48 min . Un promedio para estos tiempos
puede ser 1,4 min .
Observación 5.5. Una vez más destacamos que la distribución de los datos tiene por
finalidad primordial detectar patrones de tendencia que muestren estos datos y en particular
proponer, a partir de estos patrones, modelos para describir no solo la muestra de datos
disponibles, sino a la población entera de la que provienen estos. Las estadı́sticas (resúmenes)
de una muestra de datos disponible (media, moda, mediana, etc.) se obtienen directamente
con los propios datos, sin necesidad de la distribución de frecuencias.
136
Profesor José Flores Delgado Estadı́stica descriptiva 137
La importancia del promedio se debe a que muchas veces necesitamos saber cómo son
los datos en general y esto resulta más importante que las particularidades de cada uno. A
continuación damos algunas observaciones y propiedades de los promedios ya definidos, no
sin antes incidir una vez más que la media aritmética no es la única forma de obtener un
promedio, es la más conocida, pues, generalmente es la mejor, pero no siempre lo es.
El ejemplo 5.13 ilustra la situación de asimetrı́a hacia la derecha, razón por cual la
media resulta un poco mayor que la mediana.
137
138 Profesor José Flores Delgado Estadı́stica
7. Considerando la distancia valor absoluto, la mediana es el punto que más cerca está de
todos los datos en general, es decir, para cualquier número real x se cumple que:
n
X n
X
| xj − M e | ≤ | xj − x |.
j=1 j=1
La propiedad anterior también se enuncia diciendo que la mediana es el valor que tiene
la propiedad de minimizar la suma de los valores absolutos de las desviaciones de los
datos respecto a él.
8. Para cualesquiera a y b, que se fijen, si hacemos que cada dato xj , se transforme en:
yj = a + bxj ,
Ȳ = a + bX̄.
Esta propiedad nos dice cómo varı́a la media aritmética ante cambios en la unidad de
medida o del origen de la escala.
Ahora veamos las principales medidas de dispersión, la tendencia natural de los datos a
diferenciarse entre ellos.
La tendencia a la dispersión es la tendencia más natural en los datos, sin ella no existirı́an
problemas que resolver y significa la tendencia que tienen los datos a diferenciarse entre ellos,
a ser menos homogéneos y más heterogéneos, a estar más dispersos.
138
Profesor José Flores Delgado Estadı́stica descriptiva 139
El Rango es la diferencia entre los dos valores más extremos, es decir, entre el mayor y el
menor de los datos. Lo podemos denotar por R. Ası́, si como ya fue indicado antes, x(1) es
el menor valor y x(n) es el mayor, se tiene que:
R = x(n) − x(1)
Datos R X̄ = M e = M o
Serie 1 : 15 20 20 20 25 10 20
Serie 2 : 195 200 200 200 200 200 200 200 205 10 200
¿En cuál de las series dirı́a usted que los datos están menos dispersos?
La respuesta es en la segunda, pues puede apreciarse en ella que hay mayor cantidad de
datos parecidos a su promedio. El rango es una medida muy imprecisa. Solo cuando el rango
sea pequeño, tendremos razones para pensar que no haya mucha dispersión.
Esta medida refina al rango, pues ya no considera los dos valores más extremos; sino a los
cuartos superior e inferior, es decir, descarta los datos que queden fuera del intervalo formado
por estos percentiles y se queda sólo con el 50 % restante, o sea, el 50 % central.
La desviación estándar Se la define como una ‘distancia’ promedio de los datos respecto
a su media. Esto es, si la denotamos por S, tenemos que:
v
u n
uP
u (xj − X̄)2
t j=1
S= .
n
En esta fórmula, la raı́z cuadrada permite que esta medida se exprese en las mismas unidades
de los datos.
Esta estadı́stica es la medida de dispersión más usada, por razones similares a las que hacen
de la media la medida de resumen o promedio más usada, y naturalmente también presenta
dificultades cuando existe asimetrı́a.
139
140 Profesor José Flores Delgado Estadı́stica
S
CV = .
X̄
Al carecer de unidades, se le suele usar para comparar la dispersión existente entre dos
grupos de datos cuyas unidades no sean comparables, o cuyos promedios estén
muy distanciados por corresponder a distintas poblaciones.
Ejemplo 5.17. Veamos lo que ocurre con los datos del ejemplo 5.12. Aprovechemos para
obtener las principales estadı́sticas de estos datos con ayuda del Excel, el cual tiene los
procedimientos estadı́sticos en la opción del menú de Herramientas llamada Análisis de
datos (si esta opción no estuviera activada se puede hacerlo en los Complementos del
menú de Herramientas). En la opción Análisis de datos se pide el procedimiento Estadı́stica
descriptiva, ası́, la secuencia anterior es:
Herramientas → Análisis de datos → Estadı́stica descriptiva.
Número de sucursales
Media 4,325
Error tı́pico 0,1204
Mediana 4
Moda 4
Desviación estándar 1,077
Varianza de la muestra 1,1589
Curtosis 1,1995
Coeficiente de asimetrı́a -0,1874
Rango 6
Mı́nimo 1
Máximo 7
Suma 346
Cuenta 80
Mayor (20) 5
Menor(20) 4
Nivel de confianza(95 %) 0,2396
140
Profesor José Flores Delgado Estadı́stica descriptiva 141
Como ya hemos visto los datos están alrededor de 4. Vemos que el rango es 6, mientras
que el rango intercuartil es P75 − P25 = 5 − 4 = 1 este último indica que no es muy
grande la dispersión en el número de sucursales, al igual que la desviación estándar que
es 1,077, si queremos precisar mejor cuán grande son estas medidas de dispersión hay que
compararlas con la magnitud promedio de los datos, ası́ apreciamos que es relativamente
baja la dispersión. Entonces, por lo visto hasta ahora sobre estos datos, concluimos que el
número promedio de sucursales es 4 y es relativamente pequeña la variabilidad.
n n
x2j − nX̄ 2 x2j
P P
j=1 j=1
S2 = = − X̄ 2 .
n n
2. Para cualesquiera a y b, que se fijen, si hacemos que cada dato xj , se transforma en:
yj = a + bxj ,
SY2 = b2 SX
2
Y si b es positivo: SY = bSX .
141
142 Profesor José Flores Delgado Estadı́stica
xj − X̄
zj = .
SX
Ası́, el dato tipificado, no es más que su distancia respecto a la media del grupo; pero
expresada en términos de la desviación estándar. Especı́ficamente, el signo del dato,
ası́ tipificado, indica si el dato está por debajo o por encima de la media del grupo; y la
magnitud, en valor absoluto, indica cuán alejado está en términos del alejamiento promedio
de los datos (la desviación estándar). También es claro que al pasar los datos a esta escala,
es decir aplicando tal fórmula de transformación, los datos ası́ obtenidos preservan el orden
original.
Además de lo mencionado antes, lo más importante es que al transformar ası́ los datos,
sin que importe cuál sea la media y desviación estándar de los datos originales, los valores
resultantes tienen una media igual a cero y una desviación estándar igual a 1, de allı́ el
nombre de estandarizados. Esto último y el hecho que el orden se preserve al transformar
ası́ los datos, hace que esta transformación sea de utilidad, por ejemplo, cuando se quiere
comparar dos datos provenientes de grupos con medias muy diferentes, o si corresponden a
mediciones efectuadas en distintas escalas.
Observación 5.6. La forma anterior no es la única utilizada para estandarizar, existen otras
como la puntuación T , para la cual la media es 50 y la desviación estándar 10, no es difı́cil
verificar que la fórmula para este caso es la siguiente:
xj − X̄
T = 50 + 10.
SX
Esta es la fórmula que se utiliza para estandarizar las notas en nuestra universidad, antes
de obtener el coeficiente de rendimiento estandarizado (CRAEST).
142
Profesor José Flores Delgado Estadı́stica descriptiva 143
Resulta claro que al efectuar esta transformación el orden de mérito de los alumnos en un
determinado curso, establecido por la nota final (x), se mantiene al hacerlo con las notas
estandarizadas (T ), pero con la diferencia que ahora la media es 50 y la desviación estándar
10, lo que facilita la comparación del rendimiento de dos alumnos de diferentes facultades.
También se puede notar que si el promedio ponderado de un alumno está por debajo de la
media de su facultad (esto es x < X̄), entonces su CRAEST será menor que 50; pero si su
promedio está por arriba de la media de su facultad (esto es x > X̄), entonces su craest
será mayor que 50.
Observación 5.7. En general, si se quiere una media Ȳ = ȳ y una desviación estándar
SY = sY , la fórmula de transformación es:
xj − X̄
Y = ȳ + sy
SX
72 71 65 54 78 85 63 61 51 77 85 83 63 55 57 73 73 68 73 75 77
51 54 55 57 61 63 63 65 68 71 72 73 73 73 75 77 77 78 83 85 85
Observamos que el menor dato es 51 y el mayor 85. Para cada dato, podemos tomar la cifra
de las decenas como tallo, entonces, la otra será la hoja. Ası́, por ejemplo, para el dato 51: su
tallo es 5, su hoja 1. Tenemos, entonces, colocamos los tallos en una columna, como sigue:
5
6
7
8
5 1 4 5 7
6 1 3 3 5 8
7 1 2 3 3 5 7 7 8
8 3 5 5
143
144 Profesor José Flores Delgado Estadı́stica
Ejercicio 5.1.
Muestre dos grupos de datos para verificar que el rango es una medida de dispersión muy
imprecisa.
En ambas series el rango es 10; pero en la segunda hay mayor cantidad de datos parecidos
entre sı́.
Ejercicio 5.2.
Muestre una serie de datos para los que no exista un promedio o término medio.
Solución: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23.
No existe una estadı́stica que sirva de término medio, es decir, los datos no se parecen a un
valor en particular.
Ejercicio 5.3.
En una compañı́a la media aritmética de los sueldos es de S/. 2 500. Se proponen dos
alternativas de aumento, en la primera se propone incrementar a todos los empleados S/.
600; mientras que, en la segunda un aumento del 5 % más una bonificación de S/. 200. ¿Cuál
de las dos alternativas le representará más gasto a la compañı́a?
Solución: Para responder la pregunta, basta comparar las medias bajo cada alternativa,
pues la media es proporcional a la suma total. Veamos entonces cómo cambia la media con
cada alternativa:
144
Profesor José Flores Delgado Estadı́stica descriptiva 145
Ejercicio 5.4.
A fin de tomar diferentes decisiones sobre el tiempo que permanece inactivo un sistema de
información durante un dı́a, se le solicita a usted el valor promedio y el tiempo total de
inactividad en un perı́odo de 60 dı́as. Suponga que solo se tiene la información siguiente
sobre los tiempos registrados para cada uno de los dı́as de este perı́odo:
Proporcione lo solicitado. Si fuera el caso, mencione la información que se requiera para una
mejor respuesta.
Solución: Sean x1 . . . x60 los tiempos de inactividad correspondientes a los 60 dı́as de este
60
P
perı́odo. Entonces, el tiempo total de inactividad es xj = 60 X̄ = 60 × 8 500 = 510 000.
j=1
Pero para dar una respuesta apropiada para el tiempo promedio de inactividad, se requiere
mayor información. Podrı́amos optar por la mediana, pensando que si este valor difiere de la
media, probablemente se deba a que en algunos dı́as el tiempo de inactividad es muy grande;
pero incluso podrı́a ser que no se pueda encontrar un buen promedio o término medio para
los tiempos registrados.
Ejercicio 5.5.
A fin de mejorar el rendimiento de los alumnos, en un curso de estadı́stica, los alumnos fueron
separados en dos grupos, al primero le fue dado un curso con herramientas computacionales
modernas, al segundo un curso tradicional sin las herramientas computacionales. Al cabo
del curso ambos grupos fueron evaluados con una misma prueba, las notas correspondientes
fueron procesados con el Excel, obteniéndose las distribuciones de frecuencias siguientes:
145
146 Profesor José Flores Delgado Estadı́stica
b) Represente cada distribución con su respectiva gráfica de caja de modo que se muestre
la conclusión al problema formulado. Comente al respecto.
Solución:
a) Estadı́sticas importantes:
146
Profesor José Flores Delgado Estadı́stica descriptiva 147
El rango de variación medio de las notas fue 3 puntos, cuando se usaron herramientas
computacionales y 2 cuando no se usaron dichas herramientas.
b) Gráficas de cajas:
147
148 Profesor José Flores Delgado Estadı́stica
Ejercicio 5.1.
Redacte la conclusión dada en cada una de las partes siguientes, pero según el contexto
respectivo:
a) En un estudio sobre cambios en la conducta de drogadictos, de cierto grupo de personas,
fue registrada la edad (en años) en la cual dichas personas iniciaron el consumo de
drogas. Se concluyó que el 75 % de los datos registrados era mayor que 15.
b) En un estudio sobre cierto sector laboral, se registró el ingreso mensual (en soles) de
cada trabajador. Se concluyó que solo el 10 % de los datos registrados era superior a
3 500.
Ejercicio 5.2.
Usando una misma escala, cierta caracterı́stica ha sido medida sobre tres objetos, A, B y C,
obteniéndose los valores 0, 40 y 20, respectivamente.
a) Con esta información no se puede asegurar que la escala usada sea ordinal. Justifique
con un ejemplo.
b) Con esta información no se puede descartar que la escala usada sea ordinal. Justifique
con un ejemplo.
c) Con una segunda escala, también del mismo tipo de la primera, se midió la misma
caracterı́stica sobre estos objetos y se obtuvieron las mediciones siguientes: 10, 90 y
50, respectivamente. ¿Cuál puede ser el nivel de medición empleado?
d) Suponga que esta caracterı́stica sea cuantitativa y que la escala usada sea de razón.
Dé usted una variable que pueda servir como ejemplo y brinde la información principal
que proporcionarı́an dichos valores acerca de ella.
Ejercicio 5.3.
A B C
3 5 5
¿Se puede deducir si una de estas personas es más tolerante que las otras dos?
148
Profesor José Flores Delgado Estadı́stica descriptiva 149
Ejercicio 5.4.
Identifique cada afirmación con la serie de datos que mejor refleje lo sostenido en ella. Para
la elección de cada serie deberá indicar la razón por la que descarta las otras.
Ejercicio 5.5.
En una clı́nica, cada una de dos terapias nuevas (A y B) para la rehabilitación de pacientes
con depresión se aplicó en uno de dos grupos de igual número de pacientes (con caracterı́sticas
similares) que adolecı́an de este problema, obteniéndose las estadı́sticas siguientes sobre las
horas de terapia aplicadas hasta la recuperación de los pacientes:
Horas de aplicación
Estadı́stica Terapia A Terapia B
Media 66,5 77,0
Mediana 66,5 63,0
Moda 66,5 63,0
Desviación estándar 15,5 16,5
Percentil 75 86,0 83,0
Percentil 25 47,0 50,0
b) Si el gasto para la clı́nica, por hora de aplicación, fue el mismo para cada terapia, ¿la
aplicación de cuál de las terapias significó un menor gasto total para la clı́nica?
c) Si como criterio para decidir cuál de las terapias se debı́a adoptar se impuso la condición
de que, a lo más, el 25 % de los pacientes requieran más de 85 horas, ¿cuál de estas dos
terapias, si existe una, decidirı́a adoptar usted?
149
150 Profesor José Flores Delgado Estadı́stica
Ejercicio 5.6.
i) Con el ‘promedio’ de una serie de 10 datos se puede tener cierta idea de la suma total
de los datos, pero no necesariamente la suma exacta.
ii) Para obtener un percentil de una serie de datos, obtenidos de una variable cuantitativa
continua, es necesario construir previamente la distribución de frecuencias y usar la
ojiva de frecuencias acumuladas.
iv) Si una serie de datos tiene una media distinta a la mediana, entonces, necesariamente
existe un patrón de tendencia a la centralización con sesgo.
Ejercicio 5.7.
a) Una hipótesis sostiene que el tiempo necesario para localizar la posición de memoria
está, para la mayorı́a de los archivos, alrededor de medio segundo y conforme el tiempo
se aleje de este valor, se encontrarán menos archivos que requerirán de tal tiempo.
¿Considera que los datos evidencian la validez de esta hipótesis? Comente y justifique
con el apoyo de una gráfica conveniente.
x2 x3
b) La función G(x) = 6( − ), 0 ≤ x ≤ 1, es una de las funciones usadas para modelar
2 3
(aproximar) la frecuencia relativa acumulada hasta x, cuando 0 ≤ x ≤ 1. Según esta
función, ¿cuál serı́a el valor de la frecuencia que corresponde al cuarto intervalo de la
distribución de estos datos?
150
Profesor José Flores Delgado Estadı́stica descriptiva 151
Ejercicio 5.8.
A fin de realizar una descripción estadı́stica de estos datos, primero se obtuvieron las
principales estadı́sticas con el Excel:
Porcentaje de Carencias
Media 75,68
Mediana 75,40
Moda 75,20
Desviación estándar 4,97
Rango 22,00
Mı́nimo 65,40
Máximo 87,40
Suma 4994,90
Cuenta 66,00
Mayor (17) 78,60
Menor(17) 71,70
Nivel de confianza (95 %) 1,22
A continuación, con fines de detectar los posibles patrones de tendencia, se construyó una
distribución de frecuencias. Para esto primero se usó la regla empı́rica “2 a la k,” la cual
establece que el número de intervalos es el menor entero, k, con la propiedad de que 2 elevado
a la k sea mayor o igual que el número de datos, por lo que se consideraron 7 intervalos de
igual longitud.
151
152 Profesor José Flores Delgado Estadı́stica
Frecuencia Frecuencia
Porcentaje
relativa acumulada
68,55 0,09 0,09
71,70 0,17 0,26
74,85 0,15 0,41
78,00 0,30 0,71
81,15 0,14 0,85
84,30 0,11 0,95
87,45 0,05 1,00
En la primera columna de esta tabla se encuentran los lı́mites derechos de los intervalos y
estos son cerrados.
Ejercicio 5.9.
152
Profesor José Flores Delgado Estadı́stica descriptiva 153
Ejercicio 5.10.
Para comparar la dureza del agua en dos ciudades, A y B, se tomaron muestras de agua y
se medió el contenido de calcio. Los resultados, en miligramos por litro de agua, fueron los
siguientes:
A 250 250 258 270 270 270 271 271 272 284 291 291 292 292
B 222 244 250 251 255 261 264 264 265 266 277 277
a) Haga las gráficas de caja, de manera que facilite la comparación del contenido de calcio
entre las muestras de agua de las ciudades. Obtenga las conclusiones.
Ejercicio 5.11.
153
154 Profesor José Flores Delgado Estadı́stica
Ejercicio 5.12.
A fin de fiscalizar el pago de impuestos de los empleados de cierto sector laboral, se tomó una
muestra aleatoria de 25 empleados, entre los 10 000 que integran este sector.
Los ingresos mensuales de esta muestra (en miles de soles) se procesaron con las herramientas
estadı́sticas que proporciona el Excel y se obtuvo los resultados siguientes:
Media 9,69
Mediana 9,40
Desviación estándar 1,15
Cuenta 25
c) Los ingresos mensuales de este sector, superiores a 10 mil soles, serán gravados con un
impuesto extraordinario de 100 soles. Se presenta el problema de estimar la recaudación
total mensual que se obtendrá al aplicar el impuesto sobre este sector.
154
Profesor José Flores Delgado Estadı́stica descriptiva 155
Ejercicio 5.13.
En un centro de trabajo, al que llega una gran cantidad de clientes por dı́a, los
operarios fueron capacitados, siguiendo un entrenamiento patrón, para realizar funciones
del mismo tipo y con gran rapidez. Los tiempos correspondientes hasta que se requiere
un descanso, durante el dı́a de trabajo, se distribuyen siguiendo una patrón de tendencia
a la centralización, cuya media y percentiles 25, 50 y 75 son 4,6; 2,75; 5,1 y 5,1 horas,
respectivamente. Con el fin de mejorar los tiempos, anteriormente descritos, fue elaborado
un nuevo tipo de entrenamiento para realizar las mismas funciones diarias; y al adiestrar
a los operarios los tiempos correspondientes dieron una media y percentiles 25, 50 y 75 de
4,5; 4,1; 5,4 y 5,5 horas, respectivamente. Además la distribución de frecuencias con este
entrenamiento nuevo es como la representada a continuación:
d) ¿Cuál es el tiempo mı́nimo para ser considerado en el “cuarto mejor calificado”, según
cada entrenamiento?
e) ¿Cuál es el tiempo máximo para ser considerado en el “cuarto menos calificado”, según
cada entrenamiento?
155
156 Profesor José Flores Delgado Estadı́stica
Ejercicio 5.14.
Ejercicio 5.15.
En una clı́nica, cada una de dos terapias nuevas (A y B) para la rehabilitación de pacientes
con depresión se aplicó en uno de dos grupos de igual número de pacientes (con caracterı́sticas
similares) que adolecı́an de este problema, obteniéndose las estadı́sticas siguientes sobre las
horas de terapia aplicadas hasta la recuperación de los pacientes:
Horas de aplicación
Estadı́stica Terapia A Terapia B
Media 66,5 77,0
Mediana 66,5 63,0
Moda 66,5 63,0
Desviación estándar 15,5 16,5
Percentil 75 86,0 83,0
Percentil 25 47,0 50,0
a) Si el gasto para la clı́nica, por hora de aplicación, fue el mismo para cada terapia, ¿la
aplicación de cuál de las terapias significó un menor gasto total para la clı́nica?
b) Si como criterio para decidir cuál de las terapias se debı́a adoptar se impuso la condición
de que, a lo más, el 25 % de los pacientes requieran más de 85 horas, ¿cuál de estas dos
terapias, si existe una, decidirı́a adoptar usted?
c) Analice en cuál de las terapias los tiempos de recuperación fueron más homogéneos.
Ejercicio 5.16.
Nota: si x1 , . . . , x12 son las rentabilidades (en porcentaje) de cada uno de estos meses,
x
observe que el capital final al cabo del j-ésimo mes es de 500 + 500 100j = 500 + 5xj .
156
6. Correlación y regresión lineal
6.1. Correlación
Estos diagramas sugieren que el promedio de los valores (xi − X̄)(yi − Ȳ ) es un indicador de
correlación lineal, a este se le llama covarianza y se denota por SX,Y . Ası́:
Pn
(xi − X̄)(yi − Ȳ )
i=1
SX,Y =
n
157
158 Profesor José Flores Delgado Estadı́stica
Como se aprecia en los gráficos anteriores, si los datos tienden a seguir un patrón de tendencia
lineal y directa (si una aumenta la otra también aumenta), entonces, la covarianza es positiva;
si en cambio la tendencia lineal es inversa (si una aumenta la otra disminuye), la covarianza
es negativa. Pero, este indicador no es tan preciso como lo es el siguiente.
2. Solo en el caso de que entre los datos exista una relación lineal exacta es r, en valor
absoluto, igual a 1. Si dicha relación es directa, r es igual a 1, y si es inversa r es igual
a −1. Es decir, se cumple que:
r = 1 ⇔ existen a y b, positivo, tales que: yj = a + bxj , j = 1, . . . , n.
r = −1 ⇔ existen a y b, negativo, tales que: yj = a + bxj , j = 1, . . . , n.
3. Este indicador es invariante ante transformaciones de los datos que sean lineales y del
mismo tipo (ambas directas, o bien ambas inversas). Se tiene que si uj = c + dxj y
vj = e + f yj , j = 1, . . . , n, con d y f con el mismo signo, entonces, el coeficiente de
correlación de los datos, ası́ transformados, no varı́a; es decir, rU,V = rX,Y .
X 2 5 7 9 11 15 9 2 7 10 15 7 11
Y 5, 5 8 9 11 13 20 11 5, 5 9, 2 12 20 8, 4 13
X 5 9 11 2 5 7 10 9 15 10 2 7
Y 8, 4 11 12 5, 9 8, 2 9, 4 12 11 20 12 5, 5 8, 6
158
Profesor José Flores Delgado Correlación y regresión lineal 159
Con estos datos haremos un breve análisis de correlación lineal, gráfica y cuantitativamente.
Se observa una fuerte tendencia lineal entre ambas variables, de modo que a mayor número
de trabajos le corresponde un mayor tiempo.
Ejemplo 6.2. En determinada empresa, se piensa que Y, el precio de venta (en soles) de un
producto, decrece conforme aumenta X, el tiempo (en años) que tiene de uso este, y según
el modelo Y = αβ X , para ciertos parámetros positivos α y β, con este último menor que 1 y
expresados en unidades convenientes. Para corroborarlo, se dispuso de la muestra conjunta
de ambas variables siguiente:
X 1 3 6 8 9 10 12
Y 4500 1200 155 42 22 11 5
En este caso, el diagrama de dispersión es:
Claramente se aprecia que las variables tienden a relacionarse, pero no de forma lineal, sino
más bien parece una forma exponencial decreciente como la del tipo señalado.
159
160 Profesor José Flores Delgado Estadı́stica
Para analizar la validez de este modelo no podemos usar el coeficiente de correlación, pues no
es lineal. Sin embargo, veamos cómo, en este caso, es posible transformar el modelo formulado
en uno equivalente y que sı́ sea lineal, de este modo podremos resolver el problema aplicando
la teorı́a al modelo lineal. Para esto basta usar logaritmos, en efecto:
Si ya sabemos que los datos presentan una correlación lineal, entonces, interesa ahora
determinar cuál es la ecuación de la relación que los aproxima, es decir, cuáles son los valores
de a y b tales que, para la mayorı́a de los datos xj e yj , se tenga que yj sea aproximadamente
igual a a + bxj . El método más conocido es el de los “cuadrados mı́nimos”. Bajo este método
los valores de a y b son aquellos que minimizan la suma de los cuadrados:
n
X
Q(a, b) = (yj − a − bxj )2
j=1
160
Profesor José Flores Delgado Correlación y regresión lineal 161
Ejemplo 6.3. En el problema formulado en el ejemplo 6.1, ya sabemos que entre el tiempo
de procesamiento, Y, y el correspondiente número de trabajos X, existe una fuerte relación
lineal, es decir, esperamos que el modelo entre las dos variables sea:
Y = a + bX
Entonces, el paso siguiente serı́a averiguar los valores a y b que definen dicha relación.
Estos parámetros a y b los podemos estimar usando los datos dados y el método de
4,1706
los cuadrados mı́nimos. Ası́: b = r SSXY = 0, 96453 × 3,90427 = 1, 03033; a = Ȳ − bX̄ =
10, 832 − 1, 03033(8, 08) = 2, 50693. Luego, el modelo estimado es: Ŷ = 2, 50693 + 1, 03033X.
Ejemplo 6.4. En el contexto del ejemplo6.2, ya sabemos que entre el precio del producto,
Y, y la correspondiente edad, predomina una fuerte relación del tipo:
Para efectuar un pronóstico, estimamos los parámetros del modelo transformado a lineal.
Para esto, usamos las fórmulas dadas para el modelo lineal Y = a + bX, con ‘Y ’ = LnY ; y
‘X’ = X; a = Lnα y b = Lnβ. Ası́, usando los datos dados del ejemplo obtenemos:
b = Lnβ = rLnY ; X SLnY / SX = −0, 638197, por lo tanto, β = 0, 52824.
a = Ln α = Ȳ − bX̄ = LnY − (Lnβ)X̄ = 4, 483054 − (−0, 638197)(7) = 8, 95043, por lo
tanto, α = 7711, 20697.
Entonces, la ecuación del modelo esperado, la estimamos como: Ŷ = 7711, 20697(0, 52824)X .
Ası́, por ejemplo, el pronóstico del precio del producto que tiene cinco años de uso es
Ŷ = 7711, 20697(0, 52824)5 = 317, 16 soles.
Observación 6.1. Todo esto ha sido basado exclusivamente en una muestra, por lo tanto,
serı́a válido sólo para los datos dados, es decir, hemos trabajado simplemente a nivel
descriptivo y no de inferencia. Además, incluso para los propios datos, estarı́a faltando una
medida de la bondad de las estimaciones y del pronóstico. Lo último será completado a
continuación; pero la inferencia correspondiente no es materia del curso.
Veamos cómo se puede medir el poder explicativo de la variable dependiente (X) sobre
la independiente (Y ), a través de la regresión planteada. Analizaremos la varianza de Y,
llamada de la regresión, identificando dos fuentes que dan origen a ella.
161
162 Profesor José Flores Delgado Estadı́stica
Tenemos lo siguiente:
n
P
La media de los valores ajustados es igual a la de los propios valores: Ŷ = ŷj /n = Ȳ .
j=1
Esta debe medir la variabilidad de la variable Ŷ , es decir, la de los valores que se obtendrı́an
para Y si se usara la regresión lineal obtenida con X. Es claro que si el ajuste es perfecto
(lo cual sucede solo si efectivamente la relación lineal entre X e Y es exacta), se tendrá que
Ŷ = Y y ası́ SŶ2 = SY2 .
Y debe medir la variabilidad de los errores que se cometen al usar la regresión lineal para
ajustar los valores de Y, ası́, también mide el ajuste de los datos a la recta de regresión.
162
Profesor José Flores Delgado Correlación y regresión lineal 163
SCR estarı́a midiendo la variabilidad de Y explicada por su relación lineal con X; mientras
que SCE estarı́a midiendo la otra parte de la variabilidad.
Ejemplo 6.5. Ası́, en el contexto del ejemplo 6.1, no solo estamos, ahora, en la capacidad
de afirmar que la relación existente entre el tiempo de procesamiento y la cantidad de
trabajos asociada es fuertemente lineal y directa; sino además podemos sostener que el 93 %
2
(rX, Y
= 0, 93) de la variabilidad en el tiempo se debe a la asociación lineal existente con el
número de trabajos para procesar.
163
164 Profesor José Flores Delgado Estadı́stica
164
Referencias bibliográficas
2. Ingenierı́a Sismorresistente.
Alejandro Muñoz P.
PUCP 2002.
4. Measuring Inequality.
Frank A. Cowell.
Prentice Hall/ Harvester Wheatsheaf 1995.
165