Sunteți pe pagina 1din 53

MÓDULO 3.

VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD
3.4 Distribució n binomal
1.- Es un experimento aleatorio que solo tiene dos resultados. Éxito o fracaso.
Donde la probabilidad de éxito se denota por p
Suponga se realizan n experimentos Bernoulli independientes. Suponga que la variable X
de interés es el número de éxitos. X toma valores 0,1,2,...,n

La distribución binomial se utiliza para modelar datos discretos y se aplica para


poblaciones grandes (N>50) y muestras pequeñas (n<0.1N). El muestreo binomial es con
reemplazamiento.
Es apropiada cuando la proporción defectiva es mayor o igual a 0.1.
La binomial es una aproximación de la hipergeométrica
La distribución normal se aproxima a la binomial cuando np > 5
La variable aleatoria x tiene una distribución binomial como sigue:

n
f ( x)  P( X  x)    p x (1  p ) n  x x  0,1,..., n
 x

Con media y varianza:

E ( X )   X  np
V ( X )   X2  np(1  p)
2.- Un equipo requiere a lo más 10% de servicios en garantía. Para comprobarlo se
compran 20 de estos equipos y se someten a pruebas aceleradas de uso para simular el
uso durante el periodo de garantía. Obtener la probabilidad para P(x<=4).
Rechazar la afirmación de que falla menos del 10% si se encuentra que X>=5.

P(X>=5) = 1- P(X<=4) =1 - distr.binom(4,20,0.1,1) = 1 – 0.9568 = 0.0432 lo cual es bajo.

USO DE EXCEL:

x = éxitos en la muestra, p = probabilidad de éxito, n = tamaño de muestra.

 En Fx Estadísticas seleccionar
 =distr.binom(x, n, p, 0 o 1 dependiendo si es puntual o acumulada)
3.5 Distribución de Poisson
La distribución de Poisson se utiliza para modelar datos discretos como aproximación a la
Binomial dada la dificultad que existía de encontrar tablas Binomiales adecuadas cuando n
es grande y p pequeña. La distribución de probabilidad de Poisson proporciona buenas
aproximaciones cuando np <= 5.

Se aproxima a la binomial cuando p es igual o menor a 0.1, y el tamaño de muestra es


grande (n > 16) por tanto np > 1.6.

Una Variable aleatoria X tiene distribución Poisson si toma probabilidades con.

e   x
f ( x)  x  0,1,...
x!
Con media y varianza:

  np
    np
1. Suponga que una compañía de seguros asegura las vidas de 5000 hombres de 42 años
de edad. Si los estudios actuariales muestran que la probabilidad de que un hombre
muera en cierto año es 0.001, entonces la probabilidad de que la empresa pague
exactamente 4 indemnizaciones y= 4 en un cierto año es:

5000!
P( y=4 )= p(4 )= (0 . 001)4 (0 . 999) 4996
4 !*4996 !

El valor de esta expresión no aparece en tablas y su cálculo era difícil, no así con Excel.

Aproximando con la distribución de Poisson, se toma la tasa media de sucesos = np =


(5000)*(0.001)= 5, teniendo:

λ4 e−μ 5 4 e−5
P( y=4 )= = =0. 1745
4! 4!
2. Una planta tiene 20 máquinas, si la probabilidad de que falla una en cierto día es 0.05.
Encuentre la probabilidad de que durante un día determinado fallen dos máquinas.
np = 20 *0.05 = 1.0

12 e−1
P( y=2 )= =0 .184
2!
Si se calcula con la distribución Binomial se tiene:

20!
P( y=2 )= p(2)= (0. 05 )2 (0 . 95 )18 =0 .188
2 !*18 !

La aproximación es mejor conforme se aproxima a np = 5.

3. El tiempo de respuesta de un departamento es de 5 minutos promedio y se distribuye


exponencialmente. La probabilidad de que el tiempo de respuesta a lo sumo de 10
minutos se determina como sigue:

P(X<=10) = F(10; 1/5) = 1- exp(-0.2*10) = 0.865

La probabilidad entre el tiempo de respuesta de 5 y 10 minutos es:

P(5<=X<=10) = F(10;1/5) – F(5; 1/5) = 0.233

3.6 Distribución geométrica


Ejemplo 1: De un grupo de 20 productos, 10 se seleccionan al azar para prueba. ¿Cuál es
la probabilidad de que 10 productos seleccionados contengan 5 productos buenos? Los
productos defectivos son 5 en el lote.

N = 20, n = 10, D = 5, (N-D) = 15, x = 5

P(x=5) = 0.0183 = 1.83%

 5!  15! 
  
 5!0!  5!10! 
P (5)   0.0183
20!
10!10!

USO DE EXCEL:

N = Tamaño de Población, n = Tamaño de muestra, D= éxitos en la población; x = éxitos en


la muestra.

 En Fx Estadísticas seleccionar
 =distr.hipergeom(x, n, D, N)

4.4 Distribució n normal


1. El gerente de personal de una gran compañía requiere que los solicitantes a un puesto
efectúen cierta prueba y alcancen una calificación de 500. Si las calificaciones de la prueba
se distribuyen normalmente con media μ= 485 y desviación estándar σ= 30 ¿Qué
porcentaje de los solicitantes pasará la prueba?

Calculando el valor de Z obtenemos:

X−μ 500−485
Z= =0. 5
σ = 30

Buscamos el valor correspondiente Z en las tablas de distribución normal estándar o por


medio de Excel (=distr.norm.estand(0.05). Z0.5 = 0.69146 = 69.146%. siendo esta la
485

3 0 .8 5 %

Z.0 5
probabilidad de que la calificación sea menor a 500 P (X<500). Dado que el porcentaje
pedido es P( X≥500) la solución es 1-.69146 =0.3085 , 30.85% de los participantes
pasarán la prueba.

2. Encuentre las probabilidades siguientes usando la tabla Z.

a) P(-1.23 < Z > 0)

-1.23 Z

Solución: Buscamos el valor Z1..23 en las tablas siendo este =0.89065. restando
0.89065-0.5 = 0.3905, este valor es la probabilidad de 0 a 1.23 que es exactamente la
misma de –1.23 a 0 por simetría. Por lo tanto la probabilidad es 0.3905
1.2 Medidas de tendencia central y de dispersión datos
simples.
 Media: ( x̄ ) Es el promedio aritmético de todos los valores que componen el
conjunto de datos. Se calcula mediante la siguiente fórmula:
Para una muestra y para una población se tiene respectivamente:
xi xi
x̄=∑ μ=∑
n n

Ejemplo 1: En un equipo de fútbol, una muestra de estaturas de sus integrantes son


las siguientes:

1.70,1.79,1.73,1.67,1.60,1.65,1.79,1.84,1.67,1.82, 1.74. Calcule la media.

xi 19
x̄=∑ = =1 .73
n 11
~
 Mediana: ( x ) Los datos de "n" observaciones son ordenados del más pequeño al
más grande, Si el tamaño de la muestra es "non" la mediana es el valor ordenado en la
posición (n+1)/2,
Cuando el tamaño de la muestra es "par" la mediana es el promedio de los dos valores
que se encuentran al centro del conjunto de valores. Se puede calcular mediante:

( n/2 )+ ( [ n/2 ] + 1 )
2

Ejemplo 2: Para el ejemplo anterior ¿cuál es la mediana?

Ordenando los datos de mayor a menor se obtiene:

1.60,1.65,1.67,1.67,1.70,1.73,1.74,1.79,1.79,1.82,1.84;

Como tenemos 11 datos el número es non por lo que (n+1)/2 = 12/2 = 6, buscando el
número que ocupa la sexta posición en los datos ordenados encontramos el valor de la
~
x =1. 73
mediana
 Media acotada (Truncated Mean): Determinado porcentaje de los valores más altos y
bajos de un conjunto dado de datos son eliminados (tomando números enteros), para
los valores restantes se calcula la media.
Ejemplo 3: Para la siguiente serie de datos calcule la media acotada al 20%:

68.7,34.3,97.9,73.4,8.4,42.5,87.9,31.1,33.2,97.7,72.3,54.2,80.6,71.6,82.2,

Como tenemos 11 datos, el 20% de 11 es 2.2, por lo cual eliminamos 2 datos el más
bajo y el más alto, ordenado los datos obtenemos:

8.4,31.1,33.2,34.3,42.5,54.2,68.7,71.6,72.3,73.4,80.6,82.2,87.9,97.7,97.9, los valores a


eliminar son: 8.4 y 97.9; calculando la media de los datos restantes obtenemos
(~x ,.20 )=63.82

1.4 Medidas de dispersió n

1. La resistencia al rompimiento de dos muestras de botellas es la siguiente:

Muestra 1: 230 250 245 258 265 240


Muestra 2: 190 228 305 240 265 260

Calcule la desviación estándar para ambas muestras.

Muestra 1: Muestra 2

⃗x =248 ⃗x =248

Suma(Xi - x̄ )2 = 790 Suma(Xi - x̄ )2 = 7510

n-1=5 n-1 = 5

790 7510
s= √ 5 = 12.56 s= √ 5 = 38.75

Rango = 265 – 230 = 35 Rango = 305 – 190 = 115

CV = 12.56/248*100= 5.06% CV = 38.75/248*100 = 15.625

Aunque la media en ambas muestras es la misma, la desviación estándar (s), rango y


coeficiente de variación, son menores en la muestra 1, por lo cual deducimos que es
presenta menor variabilidad.
2.2 Otras medidas de dispersión: percentiles, deciles y
quartiles
1. Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro partes
iguales. El primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones y
sobre el cual se encuentra el 75% restante. El segundo cuartil divide a los datos a la mitad
similar a la mediana.

Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los


percentiles en 100 partes, la ubicación de un percentil se encuentra en:

P
L p =(n+1 )
100

Dónde:

Lp es el sitio del percentil deseado en una serie ordenada

n es el número de observaciones

P es el percentil deseado

Por ejemplo para el conjunto de datos siguiente:

3 10 19 27 34 38 48 56 67 74

4 12 20 29 34 39 48 59 67 74

7 14 21 31 36 43 52 62 69 76

9 15 25 31 37 45 53 63 72 79

10 17 27 34 38 47 56 64 73 80

La localización del percentil 35 se halla en:

35
L35=(50+1 ) =17 . 85
100

O sea que el percentil 35 está al 85% del trayecto comprendido entre la observación 17
que es 29 y la observación 18 que es 31 o sea L35 = 29 + (0.85)(31-29) = 30.7. Por tanto el
35% de las observaciones están por debajo de 30.7 y el 65% restante por encima de 30.7.
De la misma forma los percentiles 25, 50 y 75 proporcionan la localización de los cuartiles
Q1, Q2 y Q3 respectivamente.

 Q1: es el número que representa al percentil 25 (hay 25% de los datos por debajo
de este).
 Q2 o Mediana: es el número que representa al percentil 50 (hay 50% de los datos
por debajo de este).
 Q3: es el número que representa al percentil 75 (hay 75% de los datos por debajo
de este).
 Rango o Recorrido intercuartílico: es la diferencia entre Q1 y Q3.

2.3 Distribución de frecuencias e histogramas

1. Construir un histograma con la siguiente serie de datos:

2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
Paso 1: Contar el número de datos n = 130

Paso 2: Calcular el rango R = Valor mayor – Valor menor, R = 96.78-2.41 = 94.37.

Generalmente los datos no están ordenados por lo cual resulta conveniente ordenarlos de
menor a mayor para tener una mejor visualización. En el ejemplo los datos ya han sido
previamente ordenados.

Paso 3: Seleccionar el número de columnas, mediante √n = √ 130=11.4≈11 . Por


lo cual el histograma se compone de 11 columnas

Paso 4: Calcular el tamaño del intervalo de clase ( C ), dividiendo el rango entre el número
94 . 37
=8 .58≈9
de columnas: C = 11 , resultando el tamaño del intervalo 9.
 Otra manera de calcular el tamaño del intervalo es el siguiente:
Dividir el valor del rango entre un cierto número de clases (K). La tabla de abajo es una
guía que nos muestra para diferentes cantidades de datos el número recomendado de
clases a utilizar.

Número de datos (N) Número de clases (K)

Menos de 50 5–7

50 a 100 6 – 10

100 a 250 7 – 12

Más de 250 10 – 20

Paso 5: Calcular los límites de clase de cada intervalo: [0-8], [ 9-17], etc., considerando
que el tamaño del intervalo representa la diferencia entre dos límites de clase adyacentes
ya sean inferiores o superiores.

Paso 6: Contar el número de valores que caen en cada intervalo utilizando una hoja de registro, de
esta manera se obtiene la frecuencia para cada intervalo.
Tabla 1.

Columna Intervalo Registro de frecuencias

1 0 -8 IIIII 5

2 9-17 IIIII IIII 9

3 18-26 IIIII I 6

4 27-35 IIIII IIIII I 11

5 36-44 IIIII IIIII II 17

6 45-53 IIIII IIIII IIIII IIIII IIIII III 28

7 54-62 IIIII IIIII IIIII III 18

8 63-71 IIIII IIIII III 13

9 72-80 IIIII IIIII 10

10 81-89 IIIII III 8

11 90-98 IIIII 5

Paso 7: Basándose en los datos anteriores construya el histograma.

2.5 Mediante el teorema anterior se deduce el teorema de Bayes:


P ( A )×P ( Z / A )
P ( A /Z )=
[ P ( A )×P ( Z / A ) ]+[ P ( B ) ×P ( Z /B ) ]
1. En cierta universidad 20% de los hombres y 1% de las mujeres miden más de 1.80m de
altura. Asimismo 40% de los estudiantes son mujeres. Si se selecciona un estudiante al
azar y se observa que mide más de 1.80m ¿Cual es la probabilidad de que sea mujer?

Z > 1.80 m HOMBRE MUJER

A = Hombre
< 1.80 .80 .99
B = Mujer
> 1.80 .20 .01
P (A) = .60

P (B) = .40
=Z
P (Z/A) = .20

P (Z/B) = .01

Para encontrar la probabilidad de que sea mujer dado que mide más de 1.80,

Utilizando el teorema de Bayes:

P ( B ) ×P ( Z /B )
P ( B/ Z )=
[ P ( A ) ×P ( Z / A ) ]+[ P ( B )×P ( Z / B ) ]
Hombre Mujer
P(B/Z) = (.4 x .01)/ (.6 x .20 +.4 x .01) = .032.

Podemos visualizar P(B/Z) en el siguiente diagrama: Z > .80 P(A/Z) P(B/Z) = .032

Por lo tanto la probabilidad de que sea mujer dado

que mide más de 1.80 es .032 = 3.2 %


4.1 Variable aleatoria continúa

1- La longitud de ciertos tornillos (en centímetros) es una variable aleatoria


con la siguiente función de densidad:

f(x)={ 34(–x2+4x–3)si1≤x≤3
0 en otro punto

a) Para hacer cierto trabajo se prefieren tornillos con longitud entre 1,7 cm y 2,4
cm. ¿Cuál es la probabilidad de que un tornillo tenga dicha longitud?

b) Si la longitud de cada tornillo es independiente de la longitud de otro tornillo.


¿Cuál es la probabilidad de que tres tornillos tengan la longitud que se prefiere?

c) Si para construir lo que se necesita con uno de estos tornillos hay que hacer un
gasto de $10 por cm de longitud que tenga el tornillo más un gasto fijo de $4.
¿Cuál es el gasto medio esperado por un tornillo?

La variable es X: longitud de ciertos tornillos (en cm).


Calculamos la probabilidad pedida P(1,7≤X≤2,4)P(1,7≤X≤2,4) cómo el área bajo
la curva de densidad entre x=1,7x= y x=2,4

3
(−x 2+ 4 x−3 ) dx
2.4
4
P(1.7 ≤ X ≤ 2.4)= ∫ 3
1.7 3 −x
¿
4 3 [
+2 x 2−3 x ¿2.4
1.7

3
3 −( 2.4 ) − (1.7 )3
=
4 [
(
3
+2 ( 2.4 ) 2
)−(
3
+2 ( 1.7 )2−3 ( 1.7 )) ]
=0.50225
Una gráfica de la curva de densidad f mostrando el área
comprendida entre x=1.7 y x=2.4 es la siguiente:
Si llamamos Ti al suceso de que el tornillo i tiene la longitud que se prefiere. La
probabilidad que buscamos puede expresarse así:

P(T1∩T2∩T3)
Como son eventos independientes:

P(T1∩T2∩T3)=P(T1)P(T2)P(T3)
Pero ya conocemos P(Ti) porque la calculamos en el inciso a):
P(T1∩T2∩T3)=(0,50225)3≅0,1267
c)
La variable gasto G depende de la variable X de la siguiente forma:

G=10 X + 4
Entonces debemos calcular E(X).

E ( X ) =∫ f (x )xdx
−∞

3
3
=∫ 4 (−x 2+ 4 x−3)∙ xdx
1

3
3
= 4 ∫ (−x 3 + 4 x 2−3 x) dx
1

3 −x 4 4 x 3 3 x 2 3
= ∙
4 4 [+
3

2 1
❑]
3 34 4.33 3.32 14 4.13 3.12
== 4 ∙[(– 4 + 3 − 2 ) – (– 4 + 3 − 2 )]
3 108 27 1 4 3
=4 ∙⌈ ( −81
4
+
3
− )— + − ¿¿
2 4 3 2
=2
Notemos que la función de densidad es simétrica respecto de x=2. Así que es
razonable que hallamos obtenido que E(X)=2E(X)=2.
Entonces:

E (G)=10.2+4=24

2- Las marcas obtenidas por un lanzador (distancias medidas en


decámetros) es una variable aleatoria continua con la siguiente función
de densidad:
x2
{
f ( x )=f ( x )= 9 ,∧si 0 ≤ x ≤3
k
0 en el resto

a) Encontrar el valor de k.

b) Encontrar la probabilidad de que la distancia conseguida por el lanzador sea


mayor a 2 decámetros.

c) Encontrar la probabilidad de que la marca sea superior a 2,5 decámetros si se


sabe que es superior a 2 decámetros.

d) Encontrar la distancia media esperada.

Si f es función de densidad, entonces el área bajo la curva en todo su recorrido


debe ser 1:

3 2
∫ k . x9 dx=¿ ¿
0

b) Podemos calcular la probabilidad de que X>2 como el área bajo la curva de


densidad:

3
x2 x3 3 8 19
p ( X >2 )=∫ dx=[ ¿] =1− = ≅ 0.703 ¿
2 9 9.3 2 27 27
c) La “probabilidad de que la marca sea superior a 2,5 decámetros si se sabe que
es superior a 2 decámetros” es una probabilidad condicional:

P(X>2,5|X⟩2)

Aplicando la definición de probabilidad condicional:

P ({X >2,5 }∩{X > 2})


P( X > 2.5∨X ⟩ 2)=
P( X >2)

La intersección entre {X>2,5}{X>2,5} y {X>2}{X>2} es {X>2,5}{X>2,5}:

P ( X >2,5)
P(X>2,5|X⟩2)= P( X >2)

El denominador ya fue calculado en el inciso b), así que solo queda calcular
P ( X >2.5 ) :

125
3 2 3
x x 3 8 125 91
P ( X >2.5 ) =∫ dx=
2.5
9 [ ]
9.3 2.5
=1−
27
=¿ 1− =
216 216
≅ 0.421 ¿
P ( X >2.5)
P ( X )=2.5 |X⟩2)= ≅ 0.5993
P( X >2)

D) Recordemos que la esperanza matemática de una variable aleatoria continua


se define:
+∞
E ( X ) =∫ X . f (x)dx
−∞

Entonces:
3
X2 x4 3 9
E ( X ) =∫ X .
0 9
dx= [ ] = =2.25
9.4 0 4

3- La vida, en horas de cierto tipo de lámparas varia aleatoriamente según


la siguiente función de densidad:
k

{
f ( x )=f ( x )= x 2
, si∧x ≥ 100 hrs

0 ,∧si x <100 hrs

a) Encuentre el valor de k para la función de densidad dada.

b) ¿Cuál es la probabilidad de que una lámpara de este tipo tenga una vida útil
mayor a 200 horas?

c) Cierto artefacto tiene tres de estas lámparas, ¿cuál es la probabilidad de que las
tres lámparas duren más de 200 horas?

a)

La variable aleatoria continua es:

X: tiempo de vida de un cierto tipo de lámparas medido en horas.


Las funciones de densidad deben cumplir que el área bajo la curva en todo el
recorrido de la variable es igual a 1:
∞ ∞
k
∫ 2
dx=k ∫ x−2 dx=1
100 x 100

Resolvamos esta integral y despejemos k:

x−1 ∞ k
k. [ ]
−1 100
=k . lim
x →∞
−1
x[ ( ) ( )]

−1
100
=
100
=1

K=100

A continuación, una grafica de la función de densidad:

b)

Calculamos la probabilidad de que X>200:

P ( X <200 ) =1−P ( X ≤200 )

100
200

P ( X ≤200 )=∫ X 2 dx=0.5 ¿


100
¿

P ( X <200 ) =0.5
c)

Un artefacto usa tres de esas lámparas, y queremos calcular la probabilidad de


que las tres lámparas funcionen después de 200 horas:

Podríamos definir una nueva variable: Y: cantidad de lámparas que funcionan de


un total de tres. Esa variable sería una variable binomial
con n=3n=3 y p=0,5p=0,5.

La probabilidad buscada es P(y=3):

P(y=3)=((33 )) 0.5 0.5 =0.125


3 0

4- La cantidad de lluvia caída en un año; en cientos de cc en cierta ciudad


es una variable aleatoria x con función de densidad:

0 , si∧x <0

{ 1.6 x , si0 ≤ x< 0.5


f ( x )= 0.8 si 0.5≤ x <1
0.8
x3
si x ≥ 1
Se realiza un estudio en el cual
se considera el agua caída en los
últimos años. Si se toma una
muestra aleatoria de cinco años,
¿Cuál es la probabilidad de que
por lo menos en tres de ellos
la cantidad de agua caída sea
inferior a la esperada?
Considere que la cantidad de
lluvia
caída, en años diferentes, son
independientes.
Se realiza un estudio en el cual
se considera el agua caída en los
últimos años. Si se toma una
muestra aleatoria de cinco años,
¿Cuál es la probabilidad de que
por lo menos en tres de ellos
la cantidad de agua caída sea
inferior a la esperada?
Considere que la cantidad de
lluvia
caída, en años diferentes, son
independientes.
Se realiza un estudio en el cual se considera el agua caída en los
últimos años. Si se toma una muestra aleatoria de cinco años, ¿Cuál es
la probabilidad de que por lo menos en tres de ellos la cantidad de agua
caída sea inferior a la esperada? .Considere que la cantidad de lluvia
caída, en años diferentes, son independientes.

1) Solución: Para empezar definiremos las variables a utilizar:


X= “Cantidad de lluvia caída en un año; en cientos de cc”

Y= “Número de años en la muestra, en la que cae una cantidad de lluvia sea

inferior a la esperada”
Luego, nos enfocamos a determinar el valor de la cantidad de lluvia esperada, de

la siguiente manera:

∞ 0.5 1 ∞
0.8
E ( x )=∫ x ∙ f ( x ) dx =∫ x ∙ ( 1.6 x ) dx +∫ x ∙ ( 0.8 ) dx+∫ x ∙
−∞ 0 0.5 1
( )
x3
dx

1
=¿ 1.6
| |
x 3 0.5 2
x
3 0+0.8 0.5−
x

1|
0.8 =1.6 ∙
0.53 0.8 0.8 ∙ 0.52
3
+
2

2
+0.8=
7
6

El siguiente paso es calcular la probabilidad de que la cantidad de lluvia


sea inferior a la esperada:

[ |]

7 7 0.8 0.8
( )6 ( )
P x ≤ =1−P x > =1−∫ 3 dx =1−
6 7 x −2 x2
7 =0.706
6
6
Además notemos que la “y” posee una distribución binomial lo que se
expresa de la siguiente manera:
y B ( n=5 ; p=0.706 ) f ( y ) ={ en otro caso
Finalmente, se calcula la probabilidad que el problema nos solicita:
p ( y ≥ 3 )= p ( y=3 ) + p ( y =4 ) + p ( y=5)

p ( y ≥ 3 )= 5 (0.706)3 ∙ ( 0.294 ) + 5 ( 0.706 ) ∙ ( 0.294 ) + 5 (0.706)5 ∙(0.294)0


2 4 1
()
3 4() 5 ()
P ( y ≥ 3 )=0.845
Al tomar una muestra aleatoria de cinco años, la probabilidad de que por
lo menos en tres de ellos la cantidad de agua sea a la esperada, es
0.845
5- Una fábrica de refrigeradores ofrece una garantía de tres años para su
producto, siendo la vida útil (en años) modelada por la siguiente función
de densidad de probabilidad:
x+10
{
f ( x )= 400
,∧si 0≤ x ≤ 20
0 , en otro caso
Se toma al azar a uno de los refrigeradores fabricados, ¿Cuál es la
probabilidad de que se haya realizado uso de la garantía con este
producto?
X=vida útil de los refrigeradores, en años
En seguida para que se haga efectiva la garantía de la vida útil debe ser
como máximo tres, por lo que se calcula probabilidad evaluando en
estos parámetros, en la función de densidad de probabilidad antes dada:
3
P ( x ≤ 3 )=∫
0
( x400
+10
) dx=0.08625
4.3 Distribución de probabilidad uniforme.

1- Un reloj de manecillas se detuvo en un punto que no sabemos.


Determine la probabilidad de que se haya detenido en los primeros
25min luego de señalar la hora en punto.

Intervalo:[ 0−60 ]

1 1
f ( x )= =
60−0 60
25
1 5
P ( x ) =P ( 0 ≤ x ≤ 25 )=∫
dx=
0 60 12
2- Una llamada telefónica llego a un conmutador en un tiempo, al azar
dentro de un periodo de un minuto. El conmutador estuvo ocupado
durante 15 segundos en ese minuto. Calcule la probabilidad de que
la llamada haya llegado mientras el conmutador no estuvo ocupado.

t=x [ 0 ; 1 ] min
[ 0 ; 0,25 ] min
A=el conmutador no está ocupado

B=el conmutador está ocupado

Pr(A)=1-Pr (B)
0.25
1
Pr ( B )= ∫ dx
0 1−0
Pr (B)=0.25

Pr(A)=1-0.25=0.75

3- En una práctica de presión aérea se deja caer una bomba a lo largo


de una línea de un kilómetro de longitud. El blanco se encuentra en
el punto medio de la línea. El blanco se destruirá si la bomba cae a
una distancia menor que 75m del centro. Calcule la probabilidad de
que el blanco se destruya si la bomba cae al azar a lo largo de la
línea recta.

[0; 1]Km
Blanco [0; 0.5] Km
Destrucción [X<0.075] Km
0.075
1
Pr ( 0< x< 0.075 )= ∫ dx
0 0.5

1
¿ ∗( 0.075 )=0.15
0.5

4- El volumen de precipitaciones estimado para el próximo año en la


ciudad de Sevilla va a oscilar entre 400 y 500 litros por metro
cuadrado. Calcular la función de distribución y la precipitación media
esperada:
1
f ( x )= =0.01
500−400
Es decir, que el volumen de precipitaciones este entre 400 y 401
litros tiene un 1% de probabilidades; que este entre 401 y 402 litros,
otro 1% etc. La función de distribución es:
x−400 x−400
F ( x )= =
500−400 100

400+500
E ( x )= =450
2
Es decir, la precipitación media estimada en Sevilla para el próximo
año es de 450 litros por metro cuadrado.
5- Dos amigos Roberto y Fernando, deben encontrarse en una parada
de bus entre las 9:00 y las 10:00. Cada uno esperará un máximo de
10 min. ¿Cuál es la probabilidad de que no encuentren, si Fernando
llegará a las 9:30 en punto?

Tomando a=9:00 y b=10:00, b-a=60minutos


1
{
f ( t )= 60
, si 0 ≤ t ≤∧60
0 , en otro caso

Y a que Fernando llega 30 minutos después de las 9:00 y esperará 10 minutos


más, Roberto no se encontrara con Fernando si llega a las 9:00 y 9:20 o si llega
después de las 9:40. Entonces la probabilidad de que no se encuentre será:
20 60
1 1 1 1 2
Pr ( 0 ≤ t ≤ 20 ) + Pr ( 40≤ t ≤ 60 )=∫ dt +∫ dt= + =
0 60 40 60 3 3 3

1
Y la probabilidad de que se encuentren será:
3

4.4 Distribución de probabilidad normal y normal


estándar.
Distribución normal

1- Si X es una variable aleatoria de una distribución N(µ, σ), hallar: p(µ−3σ ≤ X


≤ µ+3σ).

( µ−3 σ )−µ ( µ+3 σ )−µ


p ( µ−3 σ ≤ X ≤ µ+ 3 σ )=P( ≤Z≤ )
σ σ

¿ P (−3 ≤ Z ≤ 3 )=P ( Z ≤ 3 )−P(Z ≤−3)

¿ P ( Z ≤3 ) −( 1 P ( Z ≤ 3 ) )=0.9987−1+0.9987=0.9974

2- En una distribución normal de media 4 y desviación típica 2, calcular el


valor de a para que: P(4−a ≤ x ≤ 4+a) = 0.5934
( 4−a )−4 ( 4+ a )−4
P ( 2
≤ Z≤
2
=05934 )
¿p ( −a2 ≤ z ≤ a2 )= p( z ≤ a2 )− p( z ≤− a2 )=¿
a a a a
¿ p ( z ≤ ) − p ( z ≥ ) = p ( z ≤ ) −p (1− p( z ≤ ))
2 2 2 2
a a
2 ∙ p ( z ≥ )−1=0.5934 p ( z ≤ )=0.7969
2 2
a
=0.83 ∴ a=1.66
2
3- En una ciudad se estima que la temperatura máxima en el mes de junio
sigue
una distribución normal, con media 23° y desviación típica 5°. Calcular el
número de días del mes en los que se espera alcanzar máximas entre 21° y
27°.
21−23 27−23
P [ 21< X ≤ 27 ] =P ( 5
<Z ≤
5 ) =¿

¿ p (−0.4< Z ≤ 0.8 ) =p ( Z ≤ 0.8 ) −[ 1− p ( Z ≤0.4 ) ]=¿


=0.7881-(1-0.6554)=0.4425*30=13
4- La media de los pesos de 500 estudiantes de un colegio es 70 kg y la
desviación típica 3 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuántos estudiantes pesan:
*Entre 60 kg y 75 kg
*Más de 90 kg
Entre 60 kg y 75 kg
60−70 75−70
(
P [ 60< x ≤ 75 ] = p
3
<Z ≤ ) 3
=¿

¿ p (−3.33<Z ≤1.67 )−[ 1− p ( Z ≤ 3.33 ) ]=¿


¿ 0.9525−( 1−0.9996 ) =0.9521∙ 500=476

Más de 90Kg
90−70
(
P ( X >90 )= p Z>
3 )
=p ( Z >6.67 )=¿
¿ 1− p ( Z <6.67 )=1−1=0∗500=0
5- Tras un test de cultura general se observa que las puntuaciones obtenidas
siguen una distribución una distribución N (65, 18). Se desea clasificar a los
examinados en tres grupos (de baja cultura general, de cultura general aceptable,
de excelente cultura general) de modo que hay en el primero un 20% la población,
un 65% el segundo y un 15% en el tercero.

¿Cuáles han de ser las puntuaciones que marcan el paso de un grupo al otro?

P ( Z ≤ z 1 )=0.2 P ( Z ≤−z 1 ) =0.8

-z1=0.84 z=-0.84
x1−65
=−0.84 X 1 =49.88
18

p ( Z ≤ Z 2 )=0.2 Z2=1.04
X 2−65
=1.04 X2=83.72
18
Baja cultura hasta 49 puntos.
Cultura aceptable entre 50 y 83.
Excelente cultura a partir de 84 puntos.
Distribución normal estándar
1- Una población normal tiene una media de 80 una desviación estándar de
14:
Z−µ
µ=80 Z=
σ
σ=14
a) Calcule la probabilidad de un valor localizado entre 75 y 90 p(75 ≤ x ≤ 90)
.
90−80 10
z= = =0.71 ≈ 0.7611
14 14
75−80 −5
z= = =−0.36 ≈ 0.3594
14 14
p ( 75≤ x ≤ 90 )=0.7611−0.3594=0.4017
b) Calcule la probabilidad de un valor de75 o menor p(x ≤75)
75−80 −5
z= = =−0.36 ≈ 0.3594
14 14
p ( x ≤ 75 )=0.3594
2- Los montos de dinero que se piden en las solicitudes de préstamo en Down
River Federal Savingns tiene una distribución normal, una media de
$70,000 y una desviación estándar de $20,000.Esta mañana se recibió una
solicitud de préstamo. ¿Cuál es la probabilidad de que:
x−µ
µ=$70,000 z=
σ
σ=$20,000
a) El monto solicitado sea de $80,000 o superior p(x ≥80,000)
80,000−70,000 10,000
z= = =0.5 ≈ 0.6915
20,000 20,000
p ( x ≥ 80,000 )=1−0.6915=0.3085
b) El monto solicitado oscilante entre $65,000 y $80,000
p(65,000 ≤ x ≤ 80,000)
80,000−70,000 10,000
z= = =0.50 ≈ 0.6915
20,000 20,000
65,000−70,000 −5000
z= = =−0.25≈ 0.4013
20,000 20,000
p ( 65,000≤ x ≤ 80,000 ) =0.6915−0.4013=0.2902
3- Entre las ciudades de Estados Unidos con una población de más de
250,000 habitantes, la media del tiempo de viaje de ida al trabajo es de 24.3
minutos. El tiempo de viaje más largo pertenece a la ciudad de Nueva York,
donde el tiempo medio es de 38.3 minutos. Suponga que la distribución de
los tiempos de viaje en la ciudad de Nueva York tiene una distribución de
probabilidad normal y la desviación estándar es de 7.5 minutos.
x−µ
µ=38.3 min z=
σ
σ=7.5 min
a) ¿Qué porcentaje de viajes en la ciudad de Nueva York consume menos
de 30 minutos? p(x ≤30)
30−38.3 −8.3
z= = =−1.11 ≈ 0.1335
7.5 7.5
p ( x ≤ 30 )=0.1335=13.35 %
b) ¿Qué porcentaje de viajes consumen entre 30 y 35 minutos?
p(30 ≤ x ≤ 35)
35−38.3 −3.3
z= = =−0.44 ≈ 0.3300
7.5 7.5
30−38.3 −8.3
z= = =−1.11 ≈ 0.1335
7.5 7.5
p ( 30≤ x ≤ 35 ) =0.3300−0.1335=0.1965=19.65%

4- Una distribución normal tiene una media de 80 y una desviación estándar


de 14. Determine el valor por encima del cual se presentara 80% de las
observaciones.
x−µ
µ=80 z=
σ
σ=14
1-0.8000=0.200
a) Buscamos en la tabla de probabilidad de la distribución normal estándar,
el valor de z que tenga la probabilidad .2000 o la probabilidad de que
más se le acerque a esta.
b) El valor de z que corresponde a esta probabilidad es de -0.84
c) Ahora ya se puede sustituir z en la formula y encontrar el valor de x.
x−80
−0.84= =¿
14
-0.84*14=x-80
-11.76=x-80
-11.76+80=x x=68.24
5- Las ventas mensuales de silenciadores en el área de Richmond,
Virginia tiene una distribución normal, con una media de $1,200 y una
desviación estándar de $225. Al fabricante le gustaría establecer niveles
de inventario de manera que dolo haya 5% de probabilidad que se
agoten las existencias. ¿Dónde se deben establecer los niveles de
inventario?
µ=1,200
x−µ
z=z probabilidad acumulada 5 %=0.500
σ

σ=225
1-0.0500=0.9500 valor de z=1.65

x−µ
z=
σ

x−1200
1.65=
225

1.65x225=x-1200

371.25=x-1200 X=1200+371.25 x=1571.25

4.5 Distribución de probabilidad Beta, Gama, Weibull


GAMA:

1- En cierta ciudad el consumo diario de energía eléctrica, en millones de KV


por hora puede considerarse como una variable aleatoria con distribución
Gamma de parámetros α=3 y λ=0.5.

La planta de energía de esta ciudad tiene una capacidad diaria de 10


millones de KW/hora. Cuál es la probabilidad de que este abastecimiento
sea:

a) Insuficiente en un día cualquiera.


10
1 −0.5 x

p ( x>10 )=1− p ( x> 10 )=1− ∫ (0.5)3∗2 e


Γ ( 3) 0
dx=0.124652

b) Se consume entre 3 y 8 millones de KW/hora.


10
0.53
p ( 3≤ X ≤ 8 )= ∙ ∫ x 2 e−0.5 x dx=0.571
Γ ( 3) 0

c) Encuentre E(x) y V(x).


3
E(x)= =6
0.5

3
V(x)= =12→ σ =3.46
0.52

2- Suponga que cierta pieza metálica se romperá después de sufrir dos ciclos
de esfuerzo. Si estos ciclos ocurren de manera independiente a una
frecuencia promedio de dos por cada 100 horas. Obtener la probabilidad de
que el intervalo de tiempo se encuentre hasta que ocurra el segundo ciclo.

X: Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas

Y: Numero de ciclos/100 horas y p ( λ=2 ) E ( y )=2

Y: Numero de ciclos/horas γ p ( λ=0.02 ) E ( γ )=0.02= λ

a) Dentro de una desviación con respecto del tiempo promedio.


170.71
0.022
p ( µ−σ < X< µ+ σ )= p ( 29.29< X <170.71 ) = ∫ ∙ x ∙ e−0.02 x dx =0.73752
29.29 Γ (2)

α 2 2 2
µ= =
λ 0.02
=100 σ 2 =
0.2( )
=5000 σ =7071

b) p ( X > µ+2 σ )= p ( X >241.42 ) =0.0466

3- Un banco recibe un promedio de 6 cheques falsos al día, suponiendo que el


número de cheques falsos sigue una distribución de Poisson. Se pide:

a) Probabilidad de que se reciban 4 cheques falsos en un día.

X=”cheques falsos al día”, donde X p(λ=6)

64 −6
P ( X=4 )= ∙ e =0.1338
4!

b) Sea Y=”cheques falsos en una semana”, Y~P(n.λ=7.6=42)

Al ser λ=42>10, se aproxima a una distribución normal N[42,√ 42]


P[Y>30]=
Y −42 30−42
P
[ √ 42
>
√ 42 ]
=P [ z >−1.85 ]=P [ z< 1.85 ] =1−P [ z ≥ 1.85 ] =0.9678

4- En un vehículo industrial el número de pinchazos sigue una distribución de


Poisson con media 0.3 por cada 50.000 kilómetros. Si un vehículo industrial
recorre 100.000 Kilómetros, se pide:

a) Probabilidad de que no tenga ningún pinchazo

X=”número de pinchazos en un vehículo industrial por cada 100.000Km”

Para calcular el parámetro λ por cada 100.000Km se establece la


proporción:

0.3 λ
= → λ=0.6 , x P( λ=0.6)
50.000 100.000

e−0.6 −0.6
P ( X=0 )= ∙ e =0.5488
0!

0.60 −0.6 0.61 −0.6 0.62 −0.6


b) P ( X <3 ) =P ( X=0 )+ P ( X =2 )= ∙e + ∙e + ∙e =
0! 1! 2!

=0.5488+0.3292+0.09878=0.9767

5- La concentración de un contaminante se distribuye uniformemente en el


intervalo de 0 a 20 millones. Una concentración se considera toxica a partir
de 8 millones. Se pide:

a) Probabilidad de que al tomar una muestra la concentración resulte


toxica

Sea la variable aleatoria continua X=”concentración de contaminante”,


X~U (0,20)

Función de densidad: Función de distribución:

0 ,∧x <0

{
1
f ( x )= 20−0
,∧0≤ x ≤ 20
0 , otro valores {
f ( x )= x−0 ,∧0 ≤ x ≤20
20−0
1, x >20
20
1 1 1 12 3
P ( X ≥8 )=∫ dx= [ x ] 20 = ( 20−8 )= = =0.6
8 20 20 8 20 20 5

8 12
O bien, P ( X ≥8 ) 01−P ( X ≤ 8 ) =1−F ( 8 )=1− = =0.6
20 20

b) La media y varianza de una distribución uniforme en [0,20]


2
20 (20) 400 100
µ= =10 , σ 2= = =
2 12 12 3
10
1
c) P ( X=10 )=∫ dx=0
10 20

BETA:

1- Un distribuidor de gasolina llena los tanques de depósito cada Lunes.


Se ha observado que la cantidad que vende cada semana se puede
modelar con la distribución Beta con α=4 y β=2

a) Encuentra el valor esperado de las venta semanal

b) Encuentre la probabilidad que en alguna semana venda al menos


90%

4 2
µ= =
4 +2 3

Γ (4 +2)
f ( x )= ( x )4−1 (1−x )2−1=20 x3 (1− y)
Γ (4) Γ (2)

1
P ( x> 0.9 )=20∫ x 3 ∙ ( 1−x )=0.081=8.1 %
0

2- En el presupuesto familiar, la posición que se dedica a la salud sigue


una distribución Beta (2,2).

a) ¿Cuál es la probabilidad de que se gaste más del 25% del


presupuesto familiar en salud?

b) ¿Cuál será el porcentaje medio que las familias dedican a la


compra de productos y servicios de salud?

β(α,β)
α=2 a) p(x>0.25)=0.84

β=2 b)50%

Punto x=0.25

PrI =[ x< k ] → 0.1563

PrD= [ x >k ] →0.8438

µ=0.50
5.1 Muestreo estadístico, Teorema de límite central.
1-Se desea tomar una muestra aleatoria estratificada de las personas mayores de
edad de un municipio, cuyos estratos son los siguientes intervalos de edades, en
años: de 18 a 30, de 31 a 45, de 46 a 60 y mayores de 60. En el primer intervalo hay
7500 personas, en el segundo hay 8400, en el tercero 5700 y en el cuarto 3000.
Calcule el tamaño de la muestra total y su composición, sabiendo que el muestreo se
hace con afijación proporcional y se han elegido al azar 375 personas del primer
estrato.

Calculamos el total de la población:

7500+8400+5700+3000=24600

Asignamos incógnitas a los valores desconocidos

Ahora montamos la proporción y calculamos

7500 8400 5700 3000


= = =
375 x y z

7500 8400
Dela proposición = obtenemos el valor de “x”
375 x

375∗8400
x= =420
7500

7500 5700
De la proporción = obtenemos el valor de “y”
375 y
375∗5700
y= =285
7500

7500 3000
De la proporción = obtenemos el valor de “z”
375 z

375∗3000
z= =150
7500

Completamos la tabla

2- En un instituto hay 110 alumnos de 1º ESO, 99 de 2º ESO, 77 de 3º ESO y 66 de


4º ESO. Se toma una muestra para hacer una encuesta, usando muestreo
estratificado con afijación proporcional. Se sabe que en la muestra había 20 alumnos
de 1º ESO. ¿Cuántos alumnos hay en la muestra de los demás cursos y cuál es el
tamaño de la muestra?

352 110 99 77 66
= = = =
X 20 x 2 x 3 x 4

352 110 352∗20


= :X= =64
X 20 110

110 99 99∗20
= : x 2= =18
20 x 2 110

110 77 20∗77
= : x 3= =14
20 x 3 110
110 66 66∗20
= : x 4= =12
20 x 4 110

3- En un pueblo habitan 700 hombres adultos, 800 mujeres adultas y 500 menores.
De él se quiere seleccionar una muestra de 80 personas, utilizando, para ello,
muestreo estratificado con afijación proporcional. ¿Cuál será la composición que debe
tener dicha muestra?

700 800 500 200


= = =
x y z 80

700 2000 700∗80


= : x= =28
x 80 2000

800 2000 800∗80


= : y= =32
y 80 2000

500 2000 500∗80


= z := =20
z 80 2000

Por lo tanto, en la muestra tomaríamos 28 hombres, 32 mujeres y 20 niños

4- Tenemos una población formada por tres datos de valores 1, 2 y 6. a) Obtén todas las
posibles muestras aleatorias simples de n=2 y calcula para cada una de ellas la media
aritmética y la proporción de datos con valores inferiores a 5; b) A partir de la distribución
muestral de medias, calcula el valor esperado y el error tipo; c) haz lo mismo con la
distribución muestral de proporciones; d) Calcula los dos valores esperados y los dos
errores tipo pero esta vez a partir de los datos de la población.

Elementos Media Proporción


1.2 1.5 1.0
1.6 3.5 0.5
2.6 4.0 0.5

b) Para el valor esperado y el error tipo de la media:

1.5+3.5+4
E(x)= =3 ᵟx=√ ¿ ¿ ¿
3

c) Para el valor esperado y el error tipo de la proporción:

1+ 0.5∗2
E(p)= =0.667 ᵟx=√ ¿ ¿ ¿
3

d) Para el caso de las medias:

1+ 2+ 6
µ= =3 ᵟx=√ ¿ ¿ ¿
3

ᵟx= σ N −n =¿ 2.16 3−2 =1.08 ¿


E (X̄ )=µ=3

√ n N −1 √ 2 3−1 √
5- En una población de gran tamaño, el porcentaje de personas que leen un periódico al
menos cinco días a la semana es del 45%. a) ¿Cuál es la desviación tipo poblacional? b)
Si extraemos muestras de 49 personas, ¿Cuál es el error tipo de la proporción?

a)

σ= π ( 1−π )=√ 0.45 (1−0.45 )=0.497



b)

σ 0.497
σp= = =0.071
√ n √ 49
6. Suponiendo que N=10,000, c=2 y que la calidad de entrada p=0.01.
Como en la curva característica de operación (para n=89, c=2) cuando p=0.01, Pa = 0.9397,
entonces el AOQ es:

Pa p( N−n) (0 . 9397 )(0. 01 )(10000−89 )


AOQ= = =0 .0093
N 10000
AOQ  0.93% en lugar del 1% entrante.
Cuando N es grande respecto al tamaño de muestra n, se tiene,
AOQ≈P a p
La curva de AOQ versus p se muestra a continuación:
CURVA AOQ
p P(A<x<X) AOQ

0.001667 1.00 0.002


0.003333 0.99 0.003
0.005000 0.96 0.005
0.006667 0.92 0.006
0.008333 0.87 0.007 Pa Probabilidad de aceptación del lote teniendo una fracción defectiva p
0.010000 0.81 0.008
0.011667 0.74 0.009 AOQ
0.01
0.013333 0.68 0.009 AOQL
0.015000 0.61 0.009 0.009

0.016667 0.54 0.009 0.008

0.018333 0.48 0.009


0.007
0.020000 0.42 0.008
0.006
0.021667 0.37 0.008
0.005
0.023333 0.32 0.007
0.025000 0.27 0.007 0.004

0.026667 0.23 0.006 0.003

0.028333 0.20 0.006


0.002
0.030000 0.17 0.005
0.001
0.031667 0.14 0.005
0.033333 0.12 0.004 0
0 .0 1
0 .0 1
0 .0 1
0 .0 1
0 .0 1
0 .0 1
0 .0 2
0 .0 2
0 .0 2
0 .0 2
0 .0 2
0 .0 2
0 .0 3
0 .0 3
0 .0 3
0 .0 3
0 .0 3
0 .0 3
0 .0 4
0 .0 4
0 .0 4
0 .0 4
0 .0 4
0 .0 4
0 .0 5
0 .0 5
0 .0 5
0 .0 5
0
0

0.035000 0.10 0.004


0.036667 0.08 0.003 Fracción defectiva en el lote p
0.038333 0.07 0.003
0.040000 0.06 0.002
0.041667 0.05 0.002
0.043333 0.04 0.002
0.045000 0.03 0.001
0.046667 0.03 0.001
0.048333 0.02 0.001
0.050000 0.02 0.001

n=89, c=2
Curva de calidad de salida promedio (AOQ)

De la gráfica anterior se observa que la curva AOQ tiene un valor máximo o la peor
fracción defectiva de salida hacia la planta o proceso, que se denomina límite de calidad
de salida promedio AOQL el cual es aproximadamente 0.0155 o 1.55% defectivo.

5.1 Teorema de límite central.

1-Un día visitamos el Casino y decidimos jugar en la ruleta. Nuestra apuesta va a


ser siempre al negro y cada apuesta de 500 ptas. Llevamos 10.000 ptas. y queremos
calcular que probabilidad tenemos de que tras jugar 80 veces consigamos doblar
nuestro dinero.

 
Cada jugada es una variable independiente que sigue el modelo de distribución de
Bernoulli.

"Salir negro", le damos el valor 1 y tiene una probabilidad del 0,485

"No salir negro", le damos el valor 0 y tiene una probabilidad del 0,515

(*) La probabilidad de "no salir negro" es mayor ya que puede salir rojo o el cero.

La media y varianza de cada variable individual es: 

m = 0,485

s 2 = 0,485 * 0,515 = 0,25

A la suma de las 80 apuestas se le aplica el Teorema Central del Límite, por lo que


se distribuye según una normal cuya media y varianza son:

Media: n * m = 80 * 0,485 = 38,8

Varianza: n * s2 = 80 * 0,25 = 20

Para doblar nuestro dinero el negro tiene que salir al menos 20 veces más que el
rojo (20 * 500 = 10.000), por lo que tendrá que salir como mínimo 50 veces (implica
que el rojo o el cero salgan como máximo 30 veces). 

Comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego:

P (X > 50) = P (Y > 2,50) = 1 - P (Y < 2,50) = 1 - 0,9938 = 0,0062 

Es decir, la probabilidad de doblar el dinero es tan sólo del 0,62% (así, que más vale
que nos pongamos a trabajar).
2.- El precio de una acción en bolsa se mueve aleatoriamente entre 10 ptas. y 20
ptas., con la misma probabilidad en todo el tramo. Hemos dado la orden a nuestro
bróker de que nos compre paquetes de 1.000 acciones cada día durante las
próximas 40 sesiones.

Una vez ejecutada la orden, tenemos un total de 40.000 acciones. A final de año
vendemos todas las acciones al precio de 13 ptas./acción, recibiendo 520.000 ptas.
Calcular la probabilidad de que ganemos dinero en esta operación.

El precio de cada paquete comprado es una variable aleatoria independiente que


se distribuye uniformemente entre 10.000 ptas. y 20.000 ptas.
Su media y varianza son:

m = (10.000 + 20.000) / 2 = 15.000

s 2 = (20.000 - 10.000)^2 / 12 = 833,3

El precio total de los 40 paquetes comprados se distribuye según una distribución


normal cuya media y varianza son: 

Media: n * m = 40 * 15.000 = 600.000

Varianza: n * s2 = 40 * 833,3 = 33.333,3 

Para estimar la probabilidad de que ganemos dinero, calculamos el valor


equivalente de la variable normal tipificada:

Luego:

P (X > 520.000) = P (Y > 2,40) = 1 - P (Y < 2,40) = 1 - 0,9918 = 0,0082

Por tanto, la probabilidad de que ganemos dinero con la "dichosa" operación es


tan sólo del 0,82% 
3- La renta media de los habitantes de un país se distribuye uniformemente entre
4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al
seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones
ptas.

Cada renta personal es una variable independiente que se distribuye según una
función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede
aplicar el Teorema Central del Límite.

La media y varianza de cada variable individual es: 

m = (4 + 10 ) / 2 = 7

s 2 = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal
cuya media y varianza son:

Media: n * m = 100 * 7 = 700

Varianza: n * s2 = 100 * 3 = 300

Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable normal
tipificada:

Luego:

P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749 

Es decir, la probabilidad de que la suma de las rentas de 100 personas


seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%

4- En una asignatura del colegio la probabilidad de que te saquen a la pizarra en


cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál
es la probabilidad de tener que salir a la pizarra más de 15 veces?
 

Se vuelve a aplicar el Teorema Central del Límite.

Salir a la pizarra es una variable independiente que sigue el modelo de distribución


de Bernouilli:

"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10

"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

La media y la varianza de cada variable independientes es:

m = 0,10

s 2 = 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye según una normal
cuya media y varianza son:

Media: n * m = 100 * 0,10 = 10

Varianza: n * s2 = 100 * 0,09 = 9

Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el


valor equivalente de la variable normal tipificada:

 
Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo


del curso es tan sólo del 4,75% 

5- En una asignatura del colegio, la probabilidad de que te saquen a la pizarra en


cada clase es del 12%. A lo largo del año tienes 125 clases de esa asignatura.
¿Cuál es la probabilidad de tener que salir a la pizarra más de 18 veces?

Sea S el suceso de que a un alumno le saquen a la pizarra en cada clase

P (S) = 0,12 -- q (¬S) = 0,88

n= 125

µ = n.p = 125 * 0,12 = 15

σ = Ѵ ( n.p.q ) = Ѵ ( 125*0,12* 0,88 ) = 3,63

P [ x > 18 ] ≈ ≈ P [ x >= 19 ] = P [ x >= (19-0,5) ] = P [ x >= 18,50 ] = = P [ z >= (18,50 –


15 ) / 3,63 ] =

P [ Z > = 0,96 ] = 1 - P [ Z < = 0,96 ] = = 1 – 0,8315 = 0,1685 = 16,85 % es la


probabilidad de salir a la pizarra más de 18 veces.

5.2 Estimación puntual y estimación por intervalos.

1- Una empresa de investigación llevó a cabo una encuesta para determinar la


cantidad media que los fumadores gastan en cigarrillos durante una semana. La
semana encontró que la distribución de cantidades gastadas por semana tendía a
seguir una distribución normal, con una desviación estándar de $5. Una muestra de 64
fumadores reveló que = $20. a) ¿Cuál es el estimador de intervalo de confianza de
95% para la μ?

n = 64 Ẋ = 20 σ=5 Nivel de Confianza= 95% = .9500

σ
Ẋ±z
√n
5
20 ± 1.96 20 − 1.225 = 18.77
√64
5
20 ± 1.96 20 + 1.225 = 21.25
8

20 ± 1.96 x .625 intervalo de confianza

20 ± 1.225 18.77 – 21.25

2- La Doctora Patton es profesora de inglés. Hace poco contó el número de palabras


con faltas de ortografía en un grupo de ensayos de sus estudiantes. Observó que la
distribución de palabras con faltas de ortografía por ensayo se regía por una
distribución normal con una desviación estándar de 2.44 palabras por ensayo. En su
clase de 40 alumnos de las 10 de la mañana, el número medio de las palabras con
faltas de ortografía fue de 6.05. Construya un intervalo de confianza de 90% para el
núm. medio de palabras con faltas de ortografía en la población de ensayos.

n = 40 Ẋ = 6.05 σ = 2.44 N.C = 90% = .9000

.9000 = .1000 .1000 ÷ 2 = .0500 𝒛 = ±𝟏. 𝟔4

σ
Ẋ±z
√n

5
√64
20 ± 1.96 20 − 1.225 = 18.77

5
20 ± 1.96 20 + 1.225 = 21.25
8

20 ± 1.96 x .625 Intervalo de confianza

20 ± 1.225 18.77 – 21.25

3- La Asociación Estadounidense de Productores de Azúcar desea calcular el


consumo medio de azúcar por año. Una muestra de 16 personas revela que el
consumo medio anual es de 60 libras, con una desviación estándar de 20 libras.
Construya un intervalo de confianza del 99% para la media de la población.
¿Razonable concluir que la media poblacional es de 69 libras? Si:

n = 16 Ẋ= 60 s = 20 N.C = 99%

N.C = 99% G.L. = n – 1 = 16 – 1 = 15 𝐭 = ± 𝟐. 𝟗𝟒7

s
Ẋ±t
√n
20
60 ± 2.947 60 − 14.735 = 45.265
√16
20
60 ± 2.947 60 + 14.735 = 74.735
4

60 ± 2.947 × 5 intervalo de confianza

60 ± 14.735 45.265 – 74.735

4- Greater Pittsburgh Area Chamber of Commerce desea calcular el tiempo medio


que los trabajadores que laboran en el centro de la ciudad utilizan para llegar al
trabajo. Una muestra de 15 trabajadores revela el tiempo medio es de 35.06 minutos,
con una desviación estándar de 6 minutos. Construya un intervalo de confianza del
98% para la media de la población. ¿Es razonable concluir que la media poblacional
es de 47? No

n = 15 Ẋ= 35.06 s = 6 N.C = 98%

N.C = 98% G.L. = n – 1 = 15 – 1 = 14 𝐭 = ± 𝟐. 𝟔𝟐4

s
Ẋ±t
√n
6
35.06 ± 2.624 35.06 − 4.04 = 31.02
√15

6
3.87
35.06 ± 2.624 35.06 + 4.04 = 39.1

35.06 ± 2.624 x 1.54 Intervalo de confianza

35.06 ± 4.04 31.02 – 39.1

5- María Wilson considera postularse para la alcaldía de la ciudad de Bear Gulch,


Montana. Antes de solicitar la postulación, decide realizar una encuesta entre los
electores de Bear Gulch. Una muestra de 400 electores revela que 300 la apoyarían
en las elecciones de noviembre. Construya un intervalo de confianza del 99% para la
proporción poblacional.

n = 400 x = 300 p = x/n = 300/400 = 0.75 N.C = 99%

.8000=0.1000 .2000/2=.1000 𝒛 = ±1.28

p(1− p)
p± z
√ n

0.5(1−0.5)
0.5±1.28
√ 300
.05 ± 1.28 (.01258) .05 − .0161 = .0339

0.475
0.5±1.28
√ 300
.05 ± .0161 .05 + .0161 = .0661

Intervalo de confianza =. 𝟎𝟑𝟑𝟗− . 𝟎𝟔𝟔1

5.3 Prueba de hipótesis


1- Un investigador de mercados y hábitos de comportamiento afirma que el tiempo que
los niños de tres a cinco años dedican a ver la televisión cada semana se distribuye
normalmente con una media de 22 horas y desviación estándar 6 horas. Frente a este
estudio, una empresa de investigación de mercados cree que la media es mayor y para
probar su hipótesis toma una muestra de 64 observaciones procedentes de la misma
población, obteniendo como resultado una media de 25. Si se utiliza un nivel de
significación del 5%. Verifique si la afirmación del investigador es realmente cierta.

Datos:

n = 64

a = 5% = 0,05

H0: (= 22
H1: (> 22

a = 0,05 
2-  Una empresa está interesada en lanzar un nuevo producto al mercado. Tras realizar
una campaña publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25 no
conocían el producto. A un nivel de significación del 1% ¿apoya el estudio las siguientes
hipótesis?
 a. Más del 3% de la población no conoce el nuevo producto.
 b. Menos del 2% de la población no conoce el nuevo producto
 Datos:
 n = 1000
 x = 25


 Dónde:
 x = ocurrencias
 n = observaciones

 = proporción de la muestra
 = proporción propuesta
 Solución:
 a)

 a = 0,01 


 b)

 a = 0,01 

3- Cuando las ventas medias, por establecimiento autorizado, de una marca de relojes caen


por debajo de las 170,000 unidades mensuales, se considera razón suficiente para lanzar
una campaña publicitaria que active las ventas de esta marca. Para conocer la evolución de
las ventas, el departamento de marketing realiza una encuesta a 51 establecimientos
autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes en
relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media =
169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que las ventas
mensuales por establecimiento se distribuyen normalmente; con un nivel de significación del 5
% y en vista a la situación reflejada en los datos. ¿Se considerará oportuno lanzar una nueva
campaña publicitaria?

Datos:

n = 51

Solución:
H0: (= 170000
H1: (< 170000

a = 0,05 

4-  Un gerente de ventas de libros universitarios afirma que en promedio sus


representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos
representantes piensan que realizan un número de visitas promedio superior a 40. Una
muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y
una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar
esta cuestión.

Datos:
(= 40

n=8

Nivel de confianza del 99%


Nivel de significación = (100%-99%)/2 = 0,5% = 0,005

Solución:
H0: (= 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7

a = 0,005 

5- Se sabe que la desviación típica de las notas de cierto examen de Matemáticas


es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6.
¿Sirven estos datos para confirmar la hipótesis de que la nota media del examen
fue de 6, con un nivel de confianza del 95%?

Enunciamos las hipótesis nula y alternativa:

H0: μ = 6      La nota media no ha variado.


H1: μ ≠ 6       La nota media ha variado.
2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.

Determinamos el intervalo de confianza para la media:

(6-1,96 · 0,4; 6+1,96 · 0,4) = (5,22; 6,78)


3. Verificación.
Valor obtenido de la media de la muestra: 5,6.
4. Decisión
Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.

5.4 Regresión lineal y no lineal


Regresión lineal
1- Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20,
32, 42 y 44 kilos.

1 Hallar la ecuación de la recta de regresión de la edad sobre el peso.

2 ¿Cuál sería el peso aproximado de un niño de seis años?

Xi Yi Xi2 Yi2 Xi ∙ Yi
2 14 4 196 28
3 20 9 400 60
5 32 25 1024 160
7 42 49 1764 294
8 44 64 1936 352
25 152 151 5320 894

2- Un centro comercial sabe en función de la distancia, en kilómetros, a la que


se sitúe de un núcleo de población, acuden los clientes, en cientos, que
figuran en la tabla:

N° de clientes (X) Distancia (Y)


8 15
7 19
6 25
4 23
2 34
1 40
1 Calcular el coeficiente de correlación lineal.
 2 Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar? 
3 Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe
situarse?

Xi Yi Xi ∙ yi Xi2 Yi2
8 15 120 64 225
7 19 133 49 361
6 25 150 36 625
4 23 92 16 529
2 34 68 4 1156
1 40 40 1 1600
28 156 603 170 4496

Correlación negativa muy fuerte.

3- En un estudio llevado a cabo en Italia, 10 pacientes con Hipertrigliceridemia se


sometieron a una dieta baja en grasas y alta en carbohidratos para investigar si
había alguna relación entre estas variables. La tabla muestra los valores antes de
comenzar la dieta.
a) Construya un diagrama de dispersión para estos datos.
b) ¿Existe evidencia de relación lineal entre los niveles de colesterol y triglicéridos
antes de la dieta?
c) Estime el nivel de triglicéridos cuando el nivel de colesterol es de 6,10 mmol/l
d) ¿Cuál es el porcentaje de variación de nivel de triglicéridos explicada por el
nivel de colesterol?

S-ar putea să vă placă și