Sunteți pe pagina 1din 16

Estadística

Responsable:

Lic. Jessica Oliva Gastulo

Chiclayo, Enero 2017


Estadística

TEMA 4: DISTRIBUCIONES DE PROBABILIDAD

INTRODUCCIÓN
Cuando se habla de los tipos de probabilidad, decimos que esta se clasifica en tres:
1. Probabilidad clásica
2. Probabilidad de frecuencia relativa
3. Probabilidad subjetiva

La distribución de probabilidades está muy relacionado con el tipo de variables. Nosotros conocemos dos
tipos de variables:
a. Variable discreta, y
b. Variable continúa.

Estudiaremos las principales distribuciones de variables discretas. Una distribución de probabilidades para
una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultados numéricos
posibles para esa variable aleatoria tal que una probabilidad específica de ocurrencia se asocia con cada
resultado.
El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los posibles
resultados, donde las ponderaciones son las probabilidades asociadas con cada uno de los resultados.

N
  E ( X )   X i P( X i)
i 1

Donde: Xi = i-ésimo resultado de X, la variable discreta de interés.


P(Xi) = probabilidad de ocurrencia del i-ésimo resultado de X

La varianza de una variable aleatoria discreta (s 2) se define como el promedio ponderado de los cuadros
de las diferencias entre cada resultado posible y su media (los pesos son las probabilidades de los resultados
posibles).

N 2

    X i  E ( X ) P ( X i )
2

i 1

Donde: Xi = i-ésimo resultado de X, la variable discreta de interés.


P(Xi) = probabilidad de ocurrencia del i-ésimo resultado de X

Las distribuciones de probabilidades discretas más importantes son:


1. Distribución Binomial,
2. Distribución de Poisson
3. Distribución Hipergeométrica

Lic. Jessica Oliva Gastulo 2


Estadística

DISTRIBUCIÓN BINOMIAL

La distribución Binomial se utiliza para calcular probabilidades de variables discretas. Se aplica en aquellos
experimentos aleatorios que tienen sólo dos resultados mutuamente excluyentes. Ejemplo:

EXPERIMENTO ALEATORIO RESULTADOS POSIBLES


Lanzamiento de una moneda al aire Cara o sello
Nacimiento de un ser humano con respecto al sexo Hombre o Mujer
Estado de salud de una persona Sano o enfermo
Situación ocupacional de una persona Ocupado o desocupado
Situación del alumno al terminar el año escolar Aprobado o desaprobado

Al llevar a cabo un experimento aleatorio, siempre estamos interesados en que suceda uno de los dos
resultados, si el resultado que esperábamos efectivamente sucede, diremos que hubo ÉXITO. Si el resultado
que esperábamos efectivamente no sucede, entonces diremos que hubo FRACASO. Es decir:

Resultados Probabilidad Notación


ÉXITO p Probabilidad de éxito Se debe cumplir: p + q = 1
FRACASO q=1–p Probabilidad de fracaso

Fórmula general para calcular las probabilidades binomiales


La distribución Binomial es una distribución de probabilidades que surge al cumplirse cinco condiciones:

1. Existe una serie de N ensayos,


2. En cada ensayo hay sólo dos posibles resultados,
3. En cada ensayo, los dos resultados posibles son mutuamente excluyentes,
4. Los resultados de cada ensayo son independientes entre sí, y
5. La probabilidad de cada resultado posible en cualquier ensayo es la misma de un ensayo a otro.

Cuando se cumple estas condiciones, la distribución Binomial proporciona cada resultado posible de los N
ensayos y la probabilidad de obtener cada uno de estos resultados.
Para este tipo de distribución de probabilidad, la función matemática es la siguiente:

n!
P( x)  cx . p x .(1  p) n x  p x (1  p) n x
n

x!(n  x)!

Donde:
P(X) = probabilidad de X éxitos dados los parámetros n y p
n = tamaño de la muestra / número de ensayos
p = probabilidad de éxito
1 – p = probabilidad de fracaso
X = número de éxitos en la muestra ( X = 0, 1, 2, …….. n)

Lic. Jessica Oliva Gastulo 3


Estadística

El término p x (1  p) n x indica la probabilidad de obtener X éxitos de n observaciones en una secuencia


n!
específica. En término indica cuantas combinaciones de los X éxitos entre n observaciones son
x!(n  x)!
posibles.

Entonces dado el número de observaciones n y la probabilidad de éxito p, la probabilidad de X éxitos es:


P(X) = (número de secuencia posibles) x (probabilidad de un secuencia especifica)

Por eso que llegamos a la función matemática que representa esta distribución.

Propiedades
El valor esperado o media de la distribución Binomial es : E(x)  = np
La varianza de la distribución Binomial es : V(x) = 2= npq

Desviación estándar de la distribución Binomial es := npq


Ejemplo: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?
“x” es el número de aciertos.
En este ejemplo “x” igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son
6 aciertos, entonces x = 6)
“n” es el número de ensayos. En nuestro ejemplo son 10
“p” es la probabilidad de éxito, es decir, que salga “cara” al lanzar la moneda. Por lo tanto p = 0,5
La fórmula quedaría:

10!
p( x  6)  c6 (0,5) 6 (1  0,5) 10 6  (0,5) 6 (1  0,5) 106
10

6! (10  6)!
Luego,
P (x = 6) = 0,205

Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda.

Uso de tabla Binomial


La tabla contiene probabilidades binomiales acumulativas, es decir, cada valor de la tabla es la probabilidad
desde un valor X = x hasta inclusive (X  x).

Ejemplo: Generalmente el 40% de los alumnos aprueban un examen de Estadística. ¿Cuál es la probabilidad
de que en un grupo de 20, aprueben:

a) 5 o más alumnos?
b) Más de 10 alumnos?
c) Exactamente 10 alumnos?
d) Menos de 10 alumnos?
e) 10 ó menos alumnos?
f) Entre 6 y 10 alumnos?

Lic. Jessica Oliva Gastulo 4


Estadística

a) 5 o más alumnos aprueben: x  5


Aquí nos piden hallar la probabilidad desde 5 hasta 20
P (x  5)  n = 20 p = 0,40 q = 1- 0,40 = 0,60
P (x  5) = 1 – P(x < 5) = 1 – [p(x = 0) + p(x = 1) + p(x = 2) + p(x = 3) + p(x = 4)]
= 1 – (0.0+0.0005+0.0031+0.0123+0.0350)
= p (x  5) = 0.9490 = 94.90%
Respuesta: La probabilidad de que aprueben 5 o más alumnos es de 94.9%

b) más de 10 alumnos aprueban: x > 10


n = 20 p = 0.40 q = 0.60
P(x > 10) = p(x 11) = p(x = 11) + p(x = 12) + p(x = 13) +…+ p(x = 20) =0.1275 = 12.75%

Ejercicios:
1. Un experimento Binomial contiene n = 5, p = 2/5. Hallar
a. La distribución de probabilidad para este experimento
b. La media aritmética y desviación estándar de esta distribución Binomial.

2. En general, el 45% de los postulantes fallan en una prueba de selección de personal. Cuál es la
probabilidad de que en una muestra de 15:
a. Fallen por lo menos 8
b. Fallen más de 4
c. Fallen exactamente 4

3. Aproximadamente 2/5 de las familias de una cierta comunidad, viven en extrema pobreza. ¿cuál es la
probabilidad de que en una muestra aleatoria de 5 personas:
a. 3 de ellos vivan en extrema pobreza?
b. Ninguno viva en extrema pobreza?
c. 3 o más vivan en extrema pobreza?

4. Un vendedor de seguros vende pólizas a 5 personas, todas de la misma edad y con buena salud.
De acuerdo con tablas actuariales, la probabilidad de que una persona de ésta viva 30 años más es 2/3.
Hallar la probabilidad de que al cabo de 30 años vivan:
a. Las 5 personas
b. Al menos 3 personas
c. Solamente 2 personas
d. Al menos una persona

5. El 75% de la mercadería que recibe un comerciante del fabricante A es de calidad excepcional, mientras
que el 80% de la mercadería que recibe del fabricante B es de calidad excepcional. El 60% del total de
la mercadería lo adquiere de A y el resto de B. Si se selecciona 4 unidades de la mercadería, ¿qué
probabilidad hay que se encuentren 2 unidades que sean de calidad excepcional?

6. El American Almanac of Jobs and Salaries, 1994-95 informa que el 25% de los contadores tienen
empleo en contaduría pública. Suponga que este porcentaje se aplica a un grupo de 15 egresados de
universidades que van a ejercer la profesión de contador. ¿Cuál es la probabilidad de que cuando menos
tres egresados tengan empleo en contaduría pública?

Lic. Jessica Oliva Gastulo 5


Estadística

DISTRIBUCIÓN DE POISSON

La Distribución de Poisson mide la probabilidad de un evento aleatorio sobre algún intervalo de


tiempo. Son necesarios dos supuestos para la aplicación de la distribución de Poisson:
 La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o
espacio.
 La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalocualquiera.
Dados estos supuestos, la función de probabilidad de Poisson puede expresarse como:

e  x
p(x; µ) = x = 0, 1, 2, ......
x!

Donde: µ = número promedio de ocurrencia por unidad de tiempo o espacio x = número de veces que
ocurre el evento e = 2.71828, la base del logaritmo natural

Nota: La media y la varianza de esta distribución toman el mismo valor.


E(X) = λ Var(X) = λ

Ejemplo: En una gran empresa el número de accidentes de trabajo sigue un promedio de tres por semana.
Calcular:

1. La probabilidad de que no haya accidentes en una semana


2. La probabilidad de que haya exactamente 3 accidentes en una semana
3. La probabilidad de que no se superen los cuatro accidentes en una semana
4. La probabilidad de que haya más de 5 accidentes

Si usamos la distribución de Poisson, obtenemos:


e 3 30 e 3 33
1. P(x=0) = P(0) =  0.0498 2. P(x = 3) = P(3) =  0.224
0! 3!
e  x
x0 x!  P(0)  P(1)  P(2)  P(3)  P(4)  0.8152
4
3. P(x  4) = F(4) =

e  x
x0 x!  1  P(0)  P(1)  P(2)  P(3)  P(4)  P(5)  0.084
5
4. P(x > 5) = 1 – F(5) = 1 -

Ejercicios:
7. Se tiene una distribución de p probabilidades de Poisson con µ =3
a. Escriba la función correcta de probabilidades de Poisson
b. Calcule:
• P(x = 2) • P(x ≥ 2)
• P(x = 4) • P(3 ≤ x ≤ 6)

8. El tablero conmutador de cierta universidad indica un promedio de 2 llamadas cada 3 minutos.

Lic. Jessica Oliva Gastulo 6


Estadística

Asumiendo un proceso de Poisson.


a. ¿Cuál es la probabilidad que ocurran 5 ó más llamadas en un período de 9 minutos?
b. ¿Cuál es la probabilidad que ocurran a lo más 3 llamadas en un período de 6 minutos?
c. ¿Cuál es la probabilidad que no hayan llamadas en un período de 5 minutos?

9. El profesor Bradley anima a sus estudiantes de estadística a “actuar de forma prudente” consultando al
tutor si tienen alguna pregunta mientras se preparan para el examen final. Parece que la llegada de los
estudiantes a la oficina del tutor se ajusta a una distribución de Poisson, con un promedio de 5.2
estudiantes cada 20 minutos. El profesor Bradley está preocupado porque si muchos estudiantes
necesitan los servicios del tutor, puede resultar un problema de congestión.
a. El tutor debe determinar la probabilidad de que cuatro estudiantes lleguen durante cualquier
intervalo de 20 minutos, lo cual podría causar el problema de congestión que tiene el profesor
Bradley. Si la probabilidad excede del 20%, se contratará un segundo tutor.
b. El tutor debe calcular la probabilidad de que más de cuatro estudiantes lleguen durante algún
período de 20 minutos. Si es mayor que el 50%, las horas de oficina del tutor se aumentarán,
permitiendo a los estudiantes extender el horario en las que vienen a ver el tutor.
c. Si la probabilidad de que más de siete estudiantes lleguen durante un período cualquiera de 30
minutos excede 50%, el mismo profesor Bradley ofrecerá tutoría adicional.

10. A una garita de peaje llegan aleatoriamente 30 autos por hora.


a. Calcular la probabilidad de que un auto llegue durante un período de 1 minuto
b. Calcular la probabilidad de que por lo menos 8 autos llegan durante media hora.
c. Calcular la probabilidad de que lleguen entre 10 y 15 autos durante 20 minutos.

11. Al departamento de Aerolíneas Regionales llegan en promedio 48 llamadas por hora.


a. Calcular la probabilidad de recibir tres llamadas en un intervalo de 5 minutos
b. Calcular la probabilidad de recibir exactamente 10 llamadas en 15 minutos
c. Calcular la probabilidad de que no haya llamadas en un período de 5 minutos

12. Durante la época de reservaciones telefónicas en una universidad local, las llamadas entran con una
frecuencia de una cada dos minutos.
a. ¿Cuál es la cantidad esperada de llamadas en una hora?
b. ¿Cuál es la probabilidad de tres llamadas en cinco minutos?
c. ¿Cuál es la probabilidad de que no hay llamadas en un periodo de cinco minutos?

13. Los pasajeros de las aerolíneas llegan a l azar e independiente a la sección de documentación en una
gran aeropuerto internacional. La frecuencia promedio de llegada es de 10 pasajeros por minuto.
a. ¿Cuál es la probabilidad de no llegadas en un intervalo de un minuto?
b. ¿Cuál es la probabilidad de que lleguen tres pasajeros o menos en un intervalo de un minuto?
c. ¿Cuál es la probabilidad de no llegada en un período de 15 segundos?
d. ¿Cuál es la probabilidad de al menos una llegada en un período de 15 segundos?

14. La compañía Aritmos ha observado que sus calculadoras fallan y necesitan reemplazarlas con una
frecuencia de tres cada 25 días.
a. ¿Cuál es la cantidad esperada de calculadoras que fallan en 30 días?

Lic. Jessica Oliva Gastulo 7


Estadística

b. ¿Cuál es la probabilidad de que fallen al menos dos en 50 días?


c. ¿Cuál es la probabilidad de que fallen exactamente tres en 10 días?

15. Un banco atiende todos los días de 8 a.m. a 4 p.m. y se sabe que el número de clientes por día que van
a solicitar un préstamo por más de $10000 tiene una media de 3.
a. ¿Cuál es la probabilidad de que hasta el mediodía no se haya producido una solicitud de préstamo
por más de $10000?
b. ¿Cuál es la probabilidad de que hasta en dos días se hayan producido más de 3 solicitudes de
préstamo por más de $10000?

16. Los pasajeros de las aerolíneas llegan al azar e independientemente a la sección de documentación en
un gran aeropuerto internacional. La frecuencia promedio de llegadas es de 10 pasajeros por minuto.
¿cuál es la probabilidad de:
a. No llegadas en un intervalo de un minuto?
b. Que lleguen tres pasajeros o menos en un intervalo de un minuto?
c. No llegadas en un intervalo de 15 segundos?
d. Al menos una llegada en un periodo de 15 segundos?

DISTRIBUCIÓN HIPERGEOMÉTRICA

Los experimentos que tienen este tipo de distribución tienen las siguientes características:
a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son constantes.
c) Cada ensayo o repetición del experimento no es independiente de los demás.
d) El número de repeticiones del experimento (n) es constante.

DEFINICIÓN: Un conjunto de N objetos contiene K objetos clasificados como éxitos y N – K objetos


clasificados como fallas

Se toma una muestra de tamaño n, al azar (sin reemplazo) de entre N objetos, donde K ≤K yn ≤N. Sea
la variable aleatoria X el número de éxitos en la muestra. Entonces, X tiene una distribución
Hipergeométrica y
C xK .CnNxk
p ( x; N , K , n) 
CnN

Nota: La media y la varianza de la distribución hipergeométrica son:


N n
E(X) = np, V ar(X) = npq
N 1

Ejemplo: De un grupo de 20 empleados, 15 hombres y 5 mujeres, se desean seleccionar 6 personas


para realizar un trabajo.
a) ¿Cuál es la probabilidad de que haya dos mujeres en el grupo?

Lic. Jessica Oliva Gastulo 8


Estadística

b) ¿Cuál es la probabilidad de que no haya ninguna mujer?


c) Da una expresión de la función de probabilidad y de la función de distribución asociada a este
experimento aleatorio si se toma como variable aleatoria el número de mujeres.
d) Representa gráficamente esta función de probabilidad

Si llamamos X a la variable aleatoria que representa el número de mujeres seleccionadas, esta variable
sigue una distribución hipergeométrica donde N = 20, K = 5, N −K = 15, n = 6.

a) La probabilidad de que haya 2 mujeres en el grupo es:

C 25 .C 415
P(X = 2) =  0.35217
C620

b) La probabilidad de que no haya ninguna mujer en el grupo es:

C05 .C615
P(X = 0) =  0.12913
C620

c) Si x es la variable aleatoria que da el número de mujeres seleccionadas en un grupo de 6 personas,


la función de probabilidad es:
C x5 .C615 x
P(x) = , x  0,1,2,3,4,5
C620

Ejercicios:
17. Entre las 20 celdas solares que se presentan en una expresión comercial, 12 son celdas planas y las otras
son celdas de concentración. Si una persona que visita la exposición selecciona al azar 6 de las salas
solares para revisarlas. ¿Cuál es la probabilidad de que 3 de estas sean planas?

18. Entre 12 hombres que soliciten un trabajo en el servicio postal, las esposas de los 9 trabajan. Si se
seleccionan aleatoria mente a 2 de los solicitantes para una consideración adicional, cuales son las
probabilidades de que
a) La esposa de ninguno trabaje
b) Solo la esposa de uno trabaje
c) Las esposas de ambos trabajen

19. Un inspector de aduanas decide revisar 3 de 16 embarques provenientes de Madrid por la vía aérea. Si
la selección es aleatoria y 5 de los embarques contienen contrabando encuentre las probabilidades de
que el inspector de aduanas
a) No encuentre ningún embarque con contrabando
b) Encuentre uno de los embarques con contrabando
c) Encuentre dos de los embarques con contrabando
d) Encuentre tres de los embarques con contrabando

Lic. Jessica Oliva Gastulo 9


Estadística

20. Para pasar una inspección de control de calidad, se seleccionan al azar 2 piezas de cada lote de 12
acumuladores para automóvil, y se acepta el lote solo si ningún acumulador tienen ningún defecto; de
otra manera se revisan todos los acumuladores del lote. Si la selección de los acumuladores es aleatoria,
obtenga las probabilidades de que un lote
a) Pase la instrucción con uno de los 12 acumuladores defectuoso
b) No pase la inspección con 3 de los acumuladores con defectos) No pase la inspección con 6 de los
acumuladores con defectos

21. Entre las 12 casas que hay para venta en un fraccionamiento, 9 tienen aire acondicionado, si se
seleccionan 4 de las casas para un desplegado en un periódico ¿Cuál es la probabilidad de que 3 de
estas tengan aire acondicionado?

22. El encargado de una oficina de correos debe enviar 6 de 15 paquetes a Europa por correo aéreo, pero
los revuelve y pone por correo al azar de los seis paquetes. ¿Cuál es la probabilidad de que solo tres de
los paquetes que se supone que se deben de enviar por correo aéreo se envíen por esta clase de correo?

23. Entre16 camiones de entrega de una tienda departamental, 5 emiten cantidades excesivas de
contaminantes. Si se seleccionan al azar 8 de los camiones para una inspección ¿Cuál es la probabilidad
de que esta muestra incluya por lo menos 3 de los camiones que emiten cantidades excesivas de
contaminantes?

24. En una prisión federal, 120 de 300 internos están purgando condenas por delitos contra la salud. Si se
selecciona aleatoria mente a 8 de los internos para comparecer ante un comité legislativo ¿Cuál es la
probabilidad de que 3 de los 8 estén purgando condenas por delitos contra la salud?

DISTRIBUCIÓN NORMAL

Abordaremos ahora el estudio de la más importante de las distribuciones de tipo continuo, la


distribución normal, cuya función de probabilidad tiene una representación gráfica (denominada para
variables continuas, curva de densidad) que se caracteriza
por la forma de campana invertida (Fig). Hemos hablado
con anterioridad de lo importantes que son y de la
frecuencia con que aparecen en estadística este tipo de
distribuciones. Corresponde a fenómenos en los que
existen unos pocos datos en los extremos, y estos
aumentan paulatinamente hasta la parte central donde está la mayoría de ellos. Se presenta en
fenómenos tan dispares, como la longitud de una pieza fabricada por una máquina o el efecto que una
misma dosis de un fármaco produce en diferentes individuos. Son de este tipo, la mayoría de los
caracteres morfológicos de las poblaciones (tallas, pesos,...), sociológicos (consumo de productos,
valoración de un mismo fenómeno,...), psicológicos (coeficiente de inteligencia, grado de adaptación
al medio,...) físicos (resistencia a la rotura de una pieza, duración de una pila,.....) y en general todas
aquellas características que se obtengan como suma de muchos factores.
Ante este tipo de fenómenos, existe un modelo matemático que nos permite el tratamiento de todos

Lic. Jessica Oliva Gastulo 10


Estadística

ellos, la curva o campana de Gauss. Veremos ahora las características más importantes de este modelo,
y como usarlo para calcular probabilidades. Diremos que una variable aleatoria tiene una distribución
normal si su curva de densidad es simétrica, con forma de campana invertida (fig. 1).
Cada distribución normal tiene dos parámetros que son los que la determinan: su media y su desviación
típica. Por ello, se suele denotar por N( m,s). En la siguiente figura, vemos diferentes distribuciones
normales

Como se puede observar, la media indica el eje de simetría de la distribución, mientras la desviación
típica es la que determina el recorrido de la misma. Ya dijimos que para distribuciones de tipo discreto,
la suma de todos los valores de la probabilidad debía ser 1. Para el caso de las distribuciones de tipo

continuo esta condición se transforma en que el área total bajo la curva ha de ser 1. La clave de este
tipo de distribuciones está en que existe una correspondencia entre área y probabilidad, de forma que
la probabilidad de que la variable esté entre dos valores a y b es exactamente el área marcada en la
figura.
La distribución normal es en forma de campana, habitualmente llamada distribución de Gauss. Es
simétrica en torno a su media (); la media, mediana y modo son iguales; el área total de la curva por
encima del eje basal x es la unidad del área = 1, por lo tanto cada sector de derecha e izquierda tiene
un valor de 0,5. Si se trazan líneas perpendiculares a un desvío estándar () de distancia de la media,
se obtiene un 68% del área de la curva. Dos desvíos estándar encierran un 95% y tres un 99,7% de la
curva.
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Es propio que ciertos
fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias
continuas presentan una función de densidad cuya gráfica tiene forma de campana.
En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables
asociadas a fenómenos naturales que siguen el modelo de la normal.
 Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas,
pesos, envergaduras, diámetros, perímetros,...
 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma
cantidad de abono.
 Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos,
puntuaciones de examen.

Lic. Jessica Oliva Gastulo 11


Estadística

 Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,...


 Errores cometidos al medir ciertas magnitudes.
 Valores estadísticos muestrales, por ejemplo: la media.
 Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...
Y en general cualquier característica que se obtenga como suma de muchos factores.
En el gráfico se observa la campana de Gauss, representante de la distribución normal y sus desvíos
estándares.

LA DISTRIBUCIÓN NORMAL ESTANDARIZADA O TIPIFICACIÓN

La Distribución Normal Estándar es una Distribución Normal teórica que utiliza un sistema numérico
común. Cuando se estudia la variable de peso de los niños al nacer, o el grueso de tornillos, o el número de
frutos dañados en un árbol, aun cuando las distribuciones de datos muestren la misma forma, las unidades
métricas son variables, por tanto, para poderlas comparar con una distribución patrón es necesario referirlas
en la misma unidad de medida. Esta unidad de medida es la desviación estándar (se verá más adelante), de
esta manera, sean pesos de bebes, grueso de tornillos o frutos de árboles, transformados a una unidad
estándar, estaremos hablando en la misma escala. Cuando se diga por ejemplo, entre el punto A y el punto
B hay k desviaciones estándar, sin importar las unidades en que fueron medidos los datos, kilos, micras o
unidades para el ejemplo. Por tanto, al comparar las magnitudes entre el punto A y el punto B en los tres
análisis con las unidades de la Distribución Normal Estándar, se podrá deducir entre otras cosas, la
magnitud relativa entre el punto A y el punto B. Debe quedar claro que las comparaciones únicamente son
posibles en poblaciones similares, niños con niños, tornillos con tornillos, etc.

Puesto que hay un número infinito de combinaciones para los dos parámetros, hay un número infinito de
curvas normales diferentes. Este problema se ha resuelto prácticamente al transformar los valores de todas
las distribuciones normales a los valores de una distribución normal estandarizada (tipificada) representada
por la curva normal estandarizada.
Las puntuaciones estandarizadas (tipificadas) se logran restando la media a cada observación y dividiendo
entre la desviación estándar. La unidad estándar o tipificada se llama Z y se obtiene mediante la
x
fórmula: Z  . Donde μ es la media de la distribución y σ su desviación estándar.

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a dos distribuciones normales
diferentes. La diferencia entre las dos distribuciones radica en que las medias y las desviaciones estándar

Lic. Jessica Oliva Gastulo 12


Estadística

no son iguales. Sin embargo la comparación se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribución normal estandarizada o tipificada.

x
Z
Si la variable X es N(,σ) entonces la variable tipificada de X es  y
sigue también una distribución normal pero de  = 0 y  = 1, es decir, N(0,1)

Por tanto su:


Función de densidad:
1
1  2  z
2

N (0,1)  e ; -  < z < +


2

Función de distribución:
t2
1 
e
z
F ( z )  P( Z  z )  ( z )  2
dt
2 

Siendo la representación gráfica de esta función la siguiente:

A la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal


tipificada.

Característica de la distribución normal tipificada (reducida o estándar)


 No depende de ningún parámetro
 Su media es 0, su varianza es 1 y su desviación típica es 1.
 La curva f(x) es simétrica respecto del eje 0Y
 Tiene un máximo en el eje Y
 Tiene dos puntos de inflexión en z =1 y z = -1

La curva normal estándar tiene  = 0 y  = 1. Recordamos que la probabilidad equivale al área bajo la
curva, que el área bajo toda la curva es 1 y que el área bajo cada mitad de la curva es 0.5. Para calcular
probabilidades en una curva normal no estándar, usamos la fórmula de conversión z. Cuando la media de
la distribución normal es 0 y la varianza es 1 se denomina "normal tipificada", y su ventaja reside en que
hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Lic. Jessica Oliva Gastulo 13


Estadística

CALCULO DE PROBABILIDADES CON MANEJO DE TABLAS


Tabla de Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la
probabilidad de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera
columna, y el segundo decimal en la cabecera de la tabla.

TABLA DE LA DISTRIBUCIÓN N(0, 1): F(z) = P(Z ≤ z)

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

La tabla contiene valores de la función de distribución de una variable aleatoria N(0,1) desde 0 a 3.99 en intervalos
de una centésima. Por ejemplo si queremos hallar: F(2.34) = P(z ≤ 2.34) usamos la tabla. Como 2.34 = 2.3 + 0.04,
localizamos el valor que aparece en la fila que comienza en 2.3 y en la columna encabezada con 0.04. Este valor
resulta ser 0.9904, por lo que concluimos que: F(2.34) = P(z ≤ 2.34) = P(z < 2.34) = 0.9904.

Lic. Jessica Oliva Gastulo 14


Estadística

Los casos más frecuentes tenemos:

P(Z  a)  Tablas P(Z > a) = 1 - P(Z  a)

P(Z  -a) = 1- P(Z  a) P(-a < Z  b) = P(Z  b) – P(Z > a)

P(a < Z  b) = P(Z  b) – P(Z a)


P(-b < Z -a) = P(a < Z  b)

Ejemplo: La duración media de un televisor de una determinada marca es de 8 años con una desviación
típica de medio año y se distribuye normalmente.
Si quisiéramos calcular la proporción de ellos que durarán más de 9 años, tendríamos:
 98
p(X > 9) = p Z   = p(Z > 2) = 1 - p(Z < 2) = 1 - 0,9772 = 0,0228 ~ 22, 8%
 0,5 

Ejemplo: Una máquina produce ejes de acero con una longitud media de 1.005 m y una desviación típica
de 0.01 m = 1 cm. Sólo son válidos los ejes que midan 1 ± 0.02 m. Suponiendo que la longitud de los ejes
producidos se distribuye de acuerdo con una distribución normal, ¿qué porcentaje de ejes de acero se
espera que haya que desechar?
Hay que calcular: P(0.98 < x < 1.02) con una N(1.005, 0.01)

P(0.98 < x < 1.02) = F(1.02) − F(0.98)

Entonces:
F(1.02) = P(x ≤ 1.02) = P(z ≤ (1.02−1.005)/0.01) = P(z ≤ 1. 5) = 0.9332
F(0.98) = P(x ≤ 0.98) = P(z ≤ (0.98−1.005)/0.01) = P(z ≤ −2.5) =1 − P(z ≤ 2.5) =1 − 0.9938 = 0.0062
Por lo tanto
P(0.98 < x < 1.02) = F(1.02) − F(0.98) = 0.9332 − 0.0062 = 0.9270
Se espera que el 92.7 % serán válidos y el 7.3 % serán desechables.

Lic. Jessica Oliva Gastulo 15


Estadística

BIBLIOGRAFÍA
 ANDERSON, David R. / SWEENEY, Dennis J./ WILLIAMS, Thomas A. (2004): “Estadística
para Administración y Economía”. México. Editorial Internacional THOMSON. Octava
edición.
 CORDOVA M. (2005). Estadística: Descriptiva e Inferencial. Perú. MOSHERA S.R.L.
 DEVORE, J. (1998). Probabilidad y estadística para ingeniería y ciencias. México.
International Thomson Editores.
 MASON R., LIND D., MARCHAL W. (2003). Estadística para administración y economía.
México. Alfaomega Grupo Editor.
 MENDENHALL W., TERRY S. (1997). Probabilidad y estadística para ingeniería y ciencias.
México. Prentice Hall Hispanoamericana.
 WALPOLE R., MYERS R., MYERS. S. (1999). Probabilidad y estadística para ingenieros.
México. Prentice Hall Hispanoamericana

Lic. Jessica Oliva Gastulo 16

S-ar putea să vă placă și