Sunteți pe pagina 1din 17

5-6 La distribución normal: distribución de una variable aleatoria

continua

Definición de una distribución continua:


Hasta este punto del capítulo, nos hemos ocupado del análisis de las distribuciones de
probabilidad discretas. En la presente sección atenderemos a los casos en que la variable puede
tomar cualquier valor que esté en un intervalo de valores dado, y en los cuales la distribución de
probabilidad es continua. Una distribución de probabilidad continua que es muy importante es la
distribución normal.
Importancia de la distribución normal:
Existen dos razones fundamentales por las cuales la distribución normal ocupa un lugar tan
prominente en la estadística. Primero, tiene algunas propiedades que la hacen aplicable a un gran
número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras.
En el capítulo 6 encontraremos que la distribución normal es una útil distribución de muestreo.
Segundo, la distribución normal casi se ajusta a las distribuciones de frecuencias reales
observadas en muchos fenómenos, incluyendo características humanas (peso, altura, coeficiente
intelectual), resultados de procesos físicos (dimensiones y rendimientos), y muchas otras
medidas de interés para los administradores, tanto en el sector público como en el privado.

Características de la distribución normal de probabilidad


Observe durante un momento la figura 5-8. Este diagrama pone de manifiesto varias
características importantes de una distribución normal de probabilidad:
1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la forma de campana que
mencionamos anteriormente.
2. La media de una población distribuida normalmente cae en el centro de su curva normal.
3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la
distribución se encuentran también en el centro; en consecuencia, para una curva normal, la
media, la mediana y la moda tienen el mismo valor.

1
4. Las dos colas de la distribución normal de probabilidad se extienden indefinidamente y nunca
tocan el eje horizontal (desde luego, esto es imposible de mostrar de manera gráfica).

Importancia de dos parámetros que describen una distribución binomial

La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas


direcciones; pero para estas poblaciones, la distribución normal es una aproximación
conveniente. No hay una sola curva normal, sino una familia de curvas normales. Para definir
una distribución normal de probabilidad necesitamos definir sólo dos parámetros: la media (µ) y
la desviación estándar (σ). En

La tabla 5-14, cada una de las poblaciones está descrita solamente por su media y su desviación
estándar, y cada una tiene una curva normal específica.

2
La figura 5-9 muestra tres distribuciones normales de probabilidad, cada una de las cuales tiene
la misma media, pero diferente desviación estándar. Aunque estas curvas difieren en apariencia,
las tres son “curvas normales”.

La figura 5-10 ilustra una “familia” de curvas normales, todas con la misma desviación estándar,
pero con diferente media.

Por último, en la figura 5-11 presentamos tres distribuciones normales de probabilidad, cada una
con una media diferente y una desviación estándar distinta. Las distribuciones normales de
probabilidad presentadas en las figuras 5-9, 5-10 y 5-11 muestran que la curva normal puede
describir un gran número de poblaciones, diferenciadas solamente por la media, por la
desviación estándar o por ambas.

3
Áreas bajo la curva normal
Medición del área bajo una curva normal:

Estas tres afirmaciones se muestran de manera gráfica en la figura 5-12.

4
La figura 5-12 muestra tres formas diferentes de medir el área bajo la curva normal. Sin
embargo, muy pocas de las aplicaciones que haremos de la distribución normal de probabilidad
implican intervalos de exactamente (más, menos) 1, 2 o 3 desviaciones estándar a partir de la
media. ¿Qué haremos con respecto a todos los demás casos? Por fortuna, podemos remitirnos a
tablas estadísticas construidas precisamente para estas situaciones. Las tablas indican porciones
del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones
estándar (más, menos) a partir de la media.

Distribución de probabilidad normal estándar


No es posible ni necesario tener una tabla distinta para cada curva normal posible. En lugar de
ello podemos utilizar una distribución de probabilidad normal estándar para encontrar áreas
bajo cualquier curva normal. Con esta tabla podemos determinar el área o la probabilidad de que
la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la
media. Estas distancias están definidas en términos de desviaciones estándar.
Podremos entender mejor el concepto de la distribución de probabilidad normal estándar
examinando la especial relación existente entre la desviación estándar y la curva normal.

Examine la figura 5-13; en ésta hemos ilustrado dos distribuciones de probabilidad


normales, cada una con una me-

5
6
dia y una desviación estándar diferentes. Tanto el área a como el área b, las áreas sombreadas
bajo la curva, contienen la misma porción del área total bajo la curva normal. ¿Por qué? Porque
ambas están definidas como el área entre la media y una desviación estándar a la derecha de ésta.
Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el mismo
número de desviaciones estándar a partir de la media contendrán la misma fracción del área total
bajo la curva para cualquier distribución de probabilidad normal. Esto posibilita usar solamente
una tabla de la distribución de probabilidad normal estándar.

Búsqueda del porcentaje del área total bajo la curva


Busquemos qué fracción del área total bajo la curva está representada por las áreas sombreadas
de la figura 5-13. En la figura 5-12 vimos que un intervalo de una desviación estándar (más y
menos) a partir de la media contiene el 68% del área total bajo la curva. En la figura 5-13, sin
embargo, estamos interesados solamente en el área que se encuentra entre la media y una
desviación estándar a su derecha (más, no más ni menos). Esta área debe ser la mitad del 68%,
es decir, 34%, para ambas distribuciones.

Un ejemplo más servirá para reforzar nuestro punto de vista. Mire las dos distribuciones
normales de probabilidad de la figura 5-14. Cada una de ellas tiene una media y una desviación
estándar diferentes. El área sombreada bajo ambas curvas, sin embargo, contiene la misma
porción del área total bajo la curva. ¿Por qué? Porque en el problema se establece que ambas
áreas sombreadas entran dentro de dos desviaciones estándar (más y menos) a partir de la media.
Dos desviaciones estándar (más y menos) a partir de la media incluyen la misma porción del área

7
total bajo cualquier distribución normal de probabilidad. En este caso, podemos remitirnos a la
figura 5-12 de nuevo y ver que las áreas sombreadas en ambas distribuciones de la figura 5-14
contienen aproximadamente el 95.5% del área total bajo la curva.

Uso de la tabla de distribución de probabilidad normal estándar


En la tabla 1 del apéndice se muestra el área bajo la curva normal entre la media y cualquier
valor de la variable aleatoria normalmente distribuida. Observe en esta tabla la localización de la
columna identificada con z. El valor de z se deriva de la fórmula:

¿Por qué utilizamos z en lugar del “número de desviaciones estándar”? Las variables aleatorias
normalmente distribuidas tienen muchas unidades diferentes de medición: dólares, pulgadas,
partes por millón, kilogramos, segundos. Como vamos a utilizar la tabla 1 del apéndice,
hablamos en términos de unidades estándar (que en realidad significa desviaciones estándar), e
identificamos a éstas con el símbolo z.

8
Uso de los valores de z Tabla de la distribución de probabilidad normal
estándar

Podemos expresar lo anterior de manera gráfica. En la figura 5-15, podemos ver que el uso de z
es solamente un cambio en la escala de medición del eje horizontal.
La Tabla de distribución de probabilidad normal estándar (tabla 1 del apéndice) está organizada
en términos de unidades estándar, o valores de z. Da los valores de únicamente la mitad del área
bajo la curva normal, empezando con 0.0 en la media. Como la distribución normal de
probabilidad es simétrica (remítase a la figura 5-8 para un repaso de esta cuestión), los valores
correspondientes a una mitad de la curva corresponden también a la otra. Podemos utilizar esta
tabla para resolver problemas que impliquen ambos lados de la curva normal. El tratamiento de
algunos ejemplos nos será de ayuda para trabajar mejor con la tabla.

Uso de la tabla para encontrar probabilidades (ejemplos)


Datos para ejemplos Tenemos un programa de entrenamiento diseñado para mejorar la calidad
de las habilidades de los supervisores de línea de producción. Debido a que el programa es auto
administrado, los supervisores requieren un número diferente de horas para terminarlo.

Un estudio de los participantes anteriores indica que el tiempo medio para completar el programa
es de 500 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación
estándar de 100 horas.

Ejemplo 1 ¿Cuál es la probabilidad de que un participante elegido al azar requiera más de 500
horas para completar el programa?
Solución En la figura 5-16, podemos ver que la mitad del área bajo la curva está localizada a
ambos lados de la media de 500 horas. Por tanto, podemos deducir que la probabilidad de que la
variable aleatoria tome un valor mayor a 500 es el área sombreada, es decir, 0.5.

9
Ejemplo 2 ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650
horas para completar el programa de entrenamiento?
Solución Hemos ilustrado esta situación en la figura 5-17. La probabilidad que responderá a esta
pregunta está representada por el área con pantalla gris entre la media (500 horas) y el valor x, en
el cual estamos interesados (650 horas). Utilizando la ecuación 5-6, obtenemos un valor para z
de:

10
Si buscamos z= 1.5 en la tabla 1 del apéndice, encontraremos una probabilidad de 0.4332. En
con- secuencia, la probabilidad de que un candidato escogido al azar requiera entre 500 y 650
horas para terminar el programa de entrenamiento es ligeramente mayor a 0.4.
Ejemplo 3 ¿Cuál es la probabilidad de que un candidato elegido al azar se tome más de 700
horas en completar el programa?
Solución Esta situación es diferente de los ejemplos anteriores. Observe la figura 5-18. Estarnos
interesados en el área sombreada a la derecha del valor “700 horas”. ¿De qué manera podemos
resolver este problema? Podemos empezar por utilizar la ecuación 5-6:

11
Buscando en la tabla 1 del apéndice un valor de z igual a 2.0, encontramos una probabilidad de
0.4772. Esto representa la probabilidad de que el programa tome entre 500 y 700 horas. Sin
embargo, deseamos tener la probabilidad de que tome más de 700 horas (el sombreado de la
figura 5-18). Puesto que la mitad derecha de la curva (entre la media y la cola derecha)
representa una probabilidad de 0.5, podemos obtener nuestra respuesta (el área que se encuentra
a la derecha del punto correspondiente a 700 horas) si restamos 0.4772 de 0.5; 0.5000 - 0.4772=
0.0228. Por tanto, hay un poco más de dos oportunidades en 100 de que un participante elegido
al azar se lleve más de 700 horas en completar el curso.

12
Ejemplo 4 Suponga que el director del programa de entrenamiento desea saber la probabilidad
de que un participante escogido al azar requiera entre 550 y 650 horas para completar el trabajo
requerido en el programa.
Solución Esta probabilidad está representada por el área sombreada de la figura 5-19. En esta
ocasión, nuestra respuesta requerirá nuevos pasos. Primero calculamos un valor de z para nuestro
punto correspondiente a 650 horas de la siguiente manera:

Cuando buscamos un valor de z igual a 1.5 en la tabla 1 del apéndice, encontramos una
probabilidad de 0.4332 (la probabilidad de que la variable aleatoria esté entre la media y 650
horas). Ahora, para el segundo paso calculamos un valor de z para el punto correspondiente a
550 horas, así:

13
En la tabla 1 del apéndice, nos damos cuenta de que el valor z igual a 0.5 tiene una probabilidad
de 0.1915 (la posibilidad de que la variable aleatoria caiga entre la media y 550 horas). Para
responder nuestra pregunta, debemos realizar la resta siguiente:

Así pues, la probabilidad de que un candidato elegido al azar se tome entre 550 y 650 horas para
completar el programa de entrenamiento es un poco menor de 1 entre 4.

14
Ejemplo 5 ¿Cuál es la probabilidad de que un candidato elegido al azar se tomará menos de 580
horas para completar el programa?
Solución Esta situación se ilustra en la figura 5-20. Utilizando la ecuación 5-6 para obtener el
valor de z apropiado para 580 horas, tenemos:

Al buscar en la tabla 1 del apéndice un valor para z igual a 0.8, encontramos una probabilidad de
0.2881 (la probabilidad de que la variable aleatoria esté entre la media y 580 horas). Debemos
sumar a ésta la probabilidad de que la variable aleatoria esté entre la cola izquierda y la media.
Debido a que la distribución es simétrica con respecto a la mitad de su área a cada lado de la
media, sabemos que este valor debe ser de 0.5. Como paso final, entonces, sumamos las dos
probabilidades:

En consecuencia, las posibilidades de que un candidato escogido al azar se tome menos de 580
horas para completar el programa son ligeramente mayores al 75%.

15
Ejemplo 6 ¿Cuál es la probabilidad de que un candidato escogido al azar se tome entre 420 y
570 horas para completar el programa?

Solución La figura 5-21 ilustra el intervalo en cuestión de 420 a 570 horas. De nuevo, para llegar
a la solución se necesitan dos pasos. Primero, calculamos un valor para z correspondiente al
punto 570 horas:

Buscamos el valor de z correspondiente a 0.7 en la tabla 1 del apéndice y encontramos 0.2580


como valor de probabilidad. Segundo, calculamos el valor de z para el punto correspondiente a
420 horas:

16
Como la distribución es simétrica, podemos desentendernos del signo y buscar un valor de z
correspondiente a 0.8. La probabilidad asociada con este valor de z es 0.2881. Encontramos
nuestra respuesta si sumamos estos dos valores, para obtener:

17

S-ar putea să vă placă și