Sunteți pe pagina 1din 14

ndice

TEOREMA DEL LMITE CENTRAL.........................................................................1


1.
1.1.
2.
2.1.

Aproximacin de la binomial a la normal...................................................1


Estudio de la proporcin.........................................................................6
El teorema del lmite central.....................................................................7
Control de calidad.................................................................................. 9

Conclusiones..................................................................................................... 11
Bibliografa........................................................................................................ 12

TEOREMA DEL LMITE CENTRAL


La distribucin de la media muestral de una poblacin normal es una distribucin
normal con la misma media poblacional y con desviacin tpica el error estndar.
Este hecho nos permite calcular probabilidades cuando tenemos una muestra de
una variable con distribucin normal y desviacin tpica conocida. Cuando no
conocemos la desviacin tpica de la variable, tambin podemos hacer clculos
con la distribucin t de Student.
En esta sesin veremos cmo debemos proceder cuando no sabemos si la
variable de inters sigue una distribucin normal o no, o cuando sabemos seguro
que su distribucin no es normal.
Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno de
los resultados fundamentales de la estadstica: el teorema del lmite central. Lo
introduciremos con un caso particular: el estudio de la binomial.

1. Aproximacin de la binomial a la normal


Supongamos que jugamos diariamente a un nmero de una lotera que, entre
otros premios, devuelve el importe jugado a todos los nmeros que acaban en la
misma cifra que el nmero ganador. Consideremos la variable X(n), que no da el
nmero de veces que nos han devuelto el importe jugado cuando se han realizado
n sorteos. En este caso sabemos que la variable aleatoria X(n) sigue una
distribucin binomial de parmetros n y p = 0,1. En efecto, se han hecho n sorteos
(es decir, se ha repetido un mismo experimento n veces de manera independiente)
y en cada sorteo la probabilidad de que nos devuelvan el dinero es p = 1/10 = 0,1
(probabilidad de xito). Sin embargo, observemos qu sucede al aumentar el valor
de n con la funcin de densidad de probabilidad de la variable X(n). Si dibujamos
esta funcin de densidad de probabilidad para n = 3, obtenemos el grfico
siguiente:

Si ahora consideramos n = 10, los posibles valores van del 0 al 10, y el grfico de
la funcin de densidad de probabilidad es:

Si tomamos n = 100, el grfico es:

Y si por ejemplo tomamos n = 500, el grfico de la funcin de probabilidad es:

Vemos, que el perfil de este grfico cada vez se parece ms al de la funcin de


densidad de probabilidad de una variable aleatoria normal. La conclusin que
extraemos de este experimento es que si n es lo bastante grande, la variable
aleatoria X(n) es aproximadamente normal. Determinaremos ahora la media y la

desviacin de esta variable aleatoria, que sern las correspondientes a la misma


X(n):

La esperanza de esta variable es:

Y la varianza:

stos sern los parmetros de la variable aleatoria normal que aproxima la


distribucin de X(n). As pues, si n es lo bastante grande, X(n) se comporta como
una N(0,1n; 0,09n).
Sea X una variable aleatoria con distribucin binomial de parmetros n y p. Si n es
grande, entonces la distribucin de X es aproximadamente normal con esperanza
2 np (1 p)

u = np y varianza
En la prctica se suele utilizar esta aproximacin
cuando np y n(1 p) son mayores que 5, o bien cuando n > 30.
Este resultado nos permite simplificar bastante los clculos en algunas
situaciones.

Ejemplo de la lotera
Cul es la probabilidad aproximada de que en un ao nos hayan devuelto el
dinero al menos cincuenta veces? De hecho, debemos calcular la probabilidad

P(X(365) 50). Si quisiramos obtener el valor exacto de esta probabilidad, por el


hecho de que X(365) es una binomial de parmetros 365 y p = 0,1, deberamos
hacer el clculo siguiente:

donde cada una de estas probabilidades se encontrara mediante la frmula de la


binomial que ya conocemos, en nuestro caso:

En cambio, si renunciamos a pedir que la probabilidad sea exacta y nos


conformamos con una muy buena aproximacin, podemos utilizar el hecho de que
la distribucin de X(365) se puede aproximar por una normal de parmetros u =
365 0,1 = 36,5 y

= 365 0,09 = 32,85. As:

y si llamamos Z a una variable aleatoria normal (0,1), esta probabilidad ser


aproximadamente:

Por tanto, la probabilidad aproximada de que nos devuelvan el dinero cincuenta


veces o ms a lo largo del ao es nicamente del 0,0091. Observad que hemos

calculado P(X(365) 50), pero que esta cantidad es la misma que P(X(365)

49,5), ya que la variable slo toma valores naturales. Fijaos en que si la


aproximamos por la normal, obtendremos:

que es una cantidad ligeramente diferente de la obtenida antes. Se dice que este
valor se ha obtenido haciendo una correccin de continuidad, ya que aproximamos
una variable discreta por una continua. Podemos considerar buenos los dos
resultados.

1.1. Estudio de la proporcin


Hemos visto que cuando n es grande, podemos aproximar una binomial (n,p) por
2

una normal de parmetros u = np y


= np(1 p). Por otro lado, sabemos que
podemos considerar la variable aleatoria binomial como la suma de n variables
aleatorias con distribucin de Bernoulli de parmetro p. Si dividimos esta suma por
n, obtenemos claramente la proporcin de xitos.
Una proporcin corresponde a hacer la media de n variables aleatorias de
Bernoulli de parmetro p, donde n es el tamao de la muestra y p, la probabilidad
de xito de cada acontecimiento individual.
Ejemplo de clculo de una proporcin: Si queremos calcular la proporcin de
catalanes que se ha conectado hoy a Internet, podemos considerar que a cada
cataln le corresponde una variable Bernoulli que vale 1 si se conecta o 0 si no lo
hace. Para calcular la proporcin, debemos dividir el nmero de catalanes que se
han conectado por el nmero total de catalanes.
Puesto que hemos visto que la suma de n distribuciones de Bernoulli de parmetro p, que es una binomial (n,p), es aproximadamente una distribucin normal
con media np y varianza np(1 - p), est claro que la proporcin (que es la suma de
las n distribuciones de Bernoulli dividida por n), tendr esperanza p y desviacin
tpica
Por tanto, cuando el tamao de la muestra, n, es grande, la distribucin de la
proporcin es aproximadamente una distribucin normal de esperanza p y
desviacin tpica

.En este caso

corresponde al error estndar.


6

Ejemplo de distribucin de la proporcin


Preguntamos a una muestra de habitantes de una poblacin su opinin sobre la
posible construccin de un pantano. La probabilidad de que un individuo concreto
de la poblacin est de acuerdo con la construccin del pantano es p, y n es el
nmero de habitantes entrevistados. El 30% de los encuestados est a favor de la
construccin del pantano, es decir, podemos establecer que p = 0,3. Si hemos
preguntado a cuatrocientos habitantes, entonces encontramos que la distribucin
de la proporcin de habitantes que estn a favor de la construccin del pantano,
que denotaremos por p, es:

Para calcular la probabilidad de que la proporcin de habitantes a favor sea mayor


del 40%, deberamos hacer:

donde Z indica una distribucin normal estndar

2. El teorema del lmite central


Sabemos que la distribucin de la media muestral de una variable normal o bien
tiene distribucin normal o bien se corresponde con una t de Student. Tambin
hemos visto que si las variables originales siguen una distribucin de Bernoulli,
entonces su media es una proporcin y, en este caso, cuando n es lo bastante
grande, su distribucin muestral tambin es una normal. El ltimo resultado es
cierto sea cual sea la distribucin de los datos originales. Es decir, no es preciso
que partamos ni de distribuciones normales ni de distribuciones de Bernoulli, ya
que para muestras de tamaos lo bastante grandes, la distribucin de la media
muestral es normal sea cual sea la distribucin original. Este resultado
fundamental de la estadstica tiene un nombre propio: el teorema del lmite central.
El teorema del lmite central dice que si una muestra es lo bastante grande (n >
30), sea cual sea la distribucin de la variable de inters, la distribucin de la
media muestral ser aproximadamente una normal. Adems, la media ser la
misma que la de la variable de inters, y la desviacin t- pica de la media muestral
ser aproximadamente el error estndar.
Una consecuencia de este teorema es la siguiente:

Dada cualquier variable aleatoria con esperanza u y para n lo bastante grande, la


distribucin de la variable

es una normal estndar.

Ejemplo de aplicacin del teorema del lmite central


Una empresa de mensajera que opera en la ciudad tarda una media de 35
minutos en llevar un paquete, con una desviacin tpica de 8 minutos.
Supongamos que durante el da de hoy han repartido doscientos paquetes.
a) Cul es la probabilidad de que la media de los tiempos de entrega de hoy est
entre 30 y 35 minutos?
b) Cul es la probabilidad de que, en total, para los doscientos paquetes hayan
estado ms de 115 horas?
Consideremos la variable X = Tiempo de entrega del paquete. Sabemos que su
media es 35 minutos y su desviacin tpica, 8. Pero fijaos en que no sabemos si
esta variable sigue una distribucin normal. Durante el da de hoy se han
entregado n = 200 paquetes. Es decir, tenemos una muestra x1 , x2 , ..., xn de
nuestra variable.
Por el teorema del lmite central sabemos que la media muestral se comporta
como una normal de esperanza 35 y desviacin tpica:

Si utilizamos esta aproximacin, ya podemos contestar a la pregunta a. Debemos


calcular:

que es aproximadamente igual a la probabilidad siguiente:

donde Z es una normal (0,1). Es decir, tenemos una probabilidad aproximada del
0,4616 de que la media del tiempo de entrega de hoy haya estado entre 30 y 35
minutos.
9

Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a
minutos, ya que sta es la unidad con la que nos viene dada la variable. Observad
que 115 horas por 60 minutos nos dan 6.900 minutos. Se nos pide que calculemos
la probabilidad siguiente:

y como que sabemos que la media se distribuye aproximadamente como una


normal de media 35 y desviacin tpica 0,566 (supondremos siempre que la
distribucin de la media es normal, ya sea porque la variable de inters es normal
o porque la muestra es lo bastante grande), esta probabilidad se puede aproximar
por la probabilidad de una distribucin normal estndar Z:

2.1. Control de calidad


Uno de los casos ms habituales en los que podemos aplicar el teorema del lmite central es a la hora de hacer un proceso de control de calidad.
Entenderemos por control de calidad el seguimiento de cierta variable aleatoria
en un proceso de produccin a partir de la media de muestras sucesivas.
Estableceremos un intervalo, de manera que las medias que caigan fuera de este
intervalo nos indicarn que existe alguna anomala en el proceso de produccin en
aquel instante. Los lmites de este intervalo se denominan lmites de control.
Si u es la esperanza de la variable de inters, s la desviacin tpica y
consideramos una muestra de esta variable de tamao n, los lmites de control
vendrn dados por
Es decir, calculamos tres veces el error estndar a lado y lado de la media. Por
tanto, la longitud del intervalo es dos veces el triple del error estndar.
Por qu tomamos este intervalo? Si aplicamos el teorema del lmite central sobre
la variable de inters, sabemos que la media de n datos se distribuye como una
normal con media u y varianza
Se demuestra fcilmente que la probabilidad
de que una media est fuera del intervalo
es de 0,001 (esto
significa que un valor fuera de este intervalo, si el proceso funcionase
correctamente, se puede dar slo con una probabilidad de 0,001). Por tanto,
cuando se d un valor fuera del intervalo, pensaremos que no es casualidad y que
el problema es que la variable no se comporta como suponamos.
10

Ejemplo de realizacin de un control de calidad


Consideremos una mquina que llena tarros de yogur. Supongamos que, de
media, cada tarro contiene 125 gramos de yogur con una desviacin tpica de 1,5
gramos. Todas las semanas hacemos un control de la mquina: analizamos una
muestra de treinta tarros y calculamos la media de cada uno. En este ejemplo el
error estndar es:

Por tanto, los lmites de control sern:

As pues, si la media de las muestras semanales de tamao 30 est entre estos


dos valores, consideraremos que todo est correcto, mentras que si es inferior a
124,18 o superior a 125,82 supondremos que hay alguna anomala en el proceso
de produccin, y habr que revisarlo.
Por cierto, fijaos en que para hacer este control de calidad slo se desperdician
treinta yogures a la semana.

11

Conclusiones
En esta sesin hemos presentado un resultado fundamental de la estadstica, el
teorema del lmite central. Desarrollado a partir del estudio de una proporcin.
Hemos acabado viendo una de sus aplicaciones ms habituales, la realizacin de
un control de calidad.

12

Bibliografa
el Teorema del limite central. (s.f.). Recuperado el 18 de mayo de 2016, de
http://www.uib.cat/depart/deaweb/webpersonal/hdeatbc0/archivos/est_p
unt.pdf
Escofet, C. R. (s.f.). Teorema del limite central. Recuperado el 18 de mayo de
2016, de http://www.calidad.com.mx/docs/art_64_1.pdf

13