Sunteți pe pagina 1din 4

Regla 68-95-99.

7
Ir a la navegaci�nIr a la b�squeda

Para una distribuci�n aproximadamente normal, los valores comprendidos en un


intervalo de semiancho una desviaci�n t�pica respecto a la media aritm�tica de la
muestra, abarcan el 68% de los datos; mientras que dos desviaciones de semiancho
abarcan el 95%; y tres deviaciones de semiancho incluyen el 99.7%. Los porcentajes
mostrados son probabilidades te�ricas redondeadas, destinadas solo a aproximar los
datos emp�ricos derivados de una poblaci�n normal. Esta regla generalmente se
ense�a dentro de las matem�ticas b�sicas comunes

Intervalo de predicci�n (eje x) frente a porcentaje de la muestra (eje y, en escala


logar�tmica en base 10)
En estad�stica, la regla 68-95-99.7, tambi�n conocida como regla emp�rica, es una
abreviatura utilizada para recordar el porcentaje de valores que se encuentran
dentro de una banda alrededor de la media en una distribuci�n normal con un ancho
de dos, cuatro y seis veces la desviaci�n t�pica, respectivamente. M�s exactamente,
el 68.27%, el 95.45% y el 99.73% de los valores se encuentran dentro de bandas con
semiancho de una, dos y tres veces la desviaci�n t�pica respecto a la media.

En notaci�n matem�tica, estos hechos se pueden expresar de la siguiente manera,


siendo ? es una observaci�n de una variable aleatoria normalmente distribuida, � es
la media aritm�tica de la distribuci�n y s es su desviaci�n est�ndar:

{\displaystyle {\begin{aligned}\Pr(\mu -1\sigma \leq X\leq \mu +1\sigma )&\approx


0.6827\\\Pr(\mu -2\sigma \leq X\leq \mu +2\sigma )&\approx 0.9545\\\Pr(\mu -3\sigma
\leq X\leq \mu +3\sigma )&\approx 0.9973\end{aligned}}} {\displaystyle
{\begin{aligned}\Pr(\mu -1\sigma \leq X\leq \mu +1\sigma )&\approx 0.6827\\\Pr(\mu
-2\sigma \leq X\leq \mu +2\sigma )&\approx 0.9545\\\Pr(\mu -3\sigma \leq X\leq \mu
+3\sigma )&\approx 0.9973\end{aligned}}}
En las ciencias emp�ricas, la tambi�n llamada "regla del pulgar de las tres sigmas"
denota un criterio heur�stico convencional que considera que casi todos los valores
de una muestra se encuentran dentro de tres desviaciones est�ndar de la media, y
que por lo tanto en la pr�ctica es �til tratar el 99.7% de probabilidad como
certeza.1? La utilidad de esta pr�ctica depende significativamente de la pregunta
que se est� considerando. En las ciencias sociales, un resultado puede considerarse
significativo si su intervalo de confianza del efecto analizado es del orden de de
dos sigma (95%), mientras que en f�sica de part�culas, existe la convenci�n de que
un determinado nuevo efecto debe constatarse en un intervalo de confianza de cinco
sigmas (99.99994%) para ser calificado como un hecho cierto y considerarse un
descubrimiento.

La regla del pulgar de las tres sigmas se relaciona con un resultado tambi�n
conocido como la regla de las tres sigma, que establece que incluso para las
variables de distribuci�n no normal, al menos el 88.8% de los casos deben encajar
correctamente en intervalos de tres sigma. Este principio se deduce de la
Desigualdad de Chebyshov. Para distribuciones unimodales, la probabilidad de estar
dentro del intervalo es de al menos el 95%. Pueden darse ciertas suposiciones para
una distribuci�n que obliguen a que esta probabilidad sea al menos del 98%.2?

�ndice
1 Funci�n de distribuci�n acumulada
2 Pruebas de normalidad
3 Tabla de valores num�ricos
4 V�ase tambi�n
5 Referencias
6 Enlaces externos
Funci�n de distribuci�n acumulada
Diagrama mostrando la funci�n de distribuci�n normal con media (�) 0 y varianza
(s2) 1
Estos valores num�ricos "68%, 95%, 99.7%" provienen de la funci�n de distribuci�n
acumulada de la distribuci�n normal.

El intervalo de predicci�n para cualquier unidad tipificada z corresponde


num�ricamente a (1 - (1 - F�,s2 (z)) � 2).

Por ejemplo, F(2) � 0.9772, o Pr(X = � + 2s) � 0.9772, correspondiente a un


intervalo de predicci�n de (1 - (1 - 0.97725) � 2) = 0.9545 = 95.45%.

Debe tenerse en cuenta que esta f�rmula es una aproximaci�n, puesto que los
intervalos no son necesariamente sim�tricos, y aqu� se ha calculado simplemente dos
veces la probabilidad de que una observaci�n sea menor que � + 2s. Para calcular la
probabilidad de que una observaci�n se encuentre dentro de dos desviaciones
est�ndar de la media, el procedimiento exacto (con peque�as diferencias debidas al
redondeo) es:

{\displaystyle \Pr(\mu -2\sigma \leq X\leq \mu +2\sigma )=\Phi (2)-\Phi (-2)\approx
0.9772-(1-0.9772)\approx 0.9545} {\displaystyle \Pr(\mu -2\sigma \leq X\leq \mu
+2\sigma )=\Phi (2)-\Phi (-2)\approx 0.9772-(1-0.9772)\approx 0.9545}
Esto se relaciona con los intervalos de confianza como se utilizan en las
estad�sticas: {\displaystyle {\bar {X}}\pm 2{\frac {\sigma }{\sqrt {n}}}}
{\displaystyle {\bar {X}}\pm 2{\frac {\sigma }{\sqrt {n}}}} tiene aproximadamente
un intervalo de confianza del 95% cuando {\displaystyle {\bar {X}}} \bar{X} es el
promedio de una muestra de tama�o {\displaystyle n} n.

Pruebas de normalidad
Art�culo principal: Prueba de normalidad
La "regla 68-95-99.7" se usa a menudo para obtener r�pidamente una estimaci�n de
probabilidad aproximada de alguna muestra, conocida su desviaci�n est�ndar, si se
supone que la poblaci�n es normal. Tambi�n se usa como una prueba simple para
determinar si un valor es at�pico suponiendo que la poblaci�n es normal, y como
prueba de normalidad si la poblaci�n es potencialmente no normal.

Para relacionar una muestra con su desviaci�n t�pica, primero se calcula su


desviaci�n a partir de sus errores o residuos, dependiendo de si se conoce la media
de la poblaci�n o solo se estima. El siguiente paso es regularizar porcentualmente
los resultados (dividi�ndolos por la desviaci�n est�ndar de la poblaci�n), si se
conocen los par�metros de la poblaci�n, o someti�ndolos a studentizaci�n
(divididi�ndolos por una estimaci�n de la desviaci�n est�ndar), si los par�metros
son desconocidos y solo se estiman.

Para usarlo como prueba de la normalidad de la muestra o de que se compone de


valores at�picos, se calcula el tama�o de las desviaciones en t�rminos de
desviaciones est�ndar y se compara con la frecuencia esperada. Dado un conjunto de
muestras, se pueden calcular los residuos studentizados y compararlos con las
frecuencias esperadas: los puntos que quedan m�s all� de 3 desviaciones est�ndar de
la norma son probablemente valores at�picos (a menos que el tama�o de la muestra
sea significativamente grande, por lo que podr�a tratarse de una muestra de este
extremo de la poblaci�n), y si hay muchos puntos a m�s de 3 desviaciones est�ndar
de la norma, es probable que haya una raz�n para cuestionar la normalidad asumida
de la distribuci�n. Este criterio es cada vez m�s s�lido a medida que el
procedimiento se extiende a 4 o a m�s desviaciones t�picas.

Se puede calcular de forma m�s precisa, aproximando el n�mero de valores extremos


esperables de una magnitud dada o mayor mediante una distribuci�n de Poisson, pero
simplemente, si aparecen m�ltiples valores por fuera de la banda de 4 sigma en una
muestra de tama�o 1000, entonces se dispone de una raz�n s�lida para considerar que
estos valores son at�picos o para preguntarse acerca de la presunta normalidad de
la distribuci�n considerada.

Por ejemplo, un evento 6s corresponde a una probabilidad de aproximadamente dos


partes en mil millones. Por ejemplo, si se considera que los eventos ocurren
diariamente, esto corresponder�a a un evento esperado cada 1.4 millones de a�os.
Esto da una aproximaci�n muy �til: si se es testigo de un suceso 6s en datos
diarios y ha pasado significativamente menos de 1 mill�n de a�os, entonces una
distribuci�n normal muy probablemente no proporciona un buen modelo para la
magnitud o frecuencia de grandes desviaciones contempladas en este caso.

En El cisne negro, Nassim Taleb da el ejemplo de los modelos de riesgo seg�n los
cuales la ca�da burs�til del Lunes Negro corresponder�a a un evento 36-s: la
ocurrencia de tal evento deber�a sugerir instant�neamente que el modelo es
defectuoso, es decir, que el proceso en consideraci�n no est� modelado
satisfactoriamente por una distribuci�n normal. Los modelos refinados deben
considerarse, por ejemplo, por la introducci�n de la volatilidad estoc�stica. En
tales an�lisis, es importante estar al tanto del problema de la falacia del
apostador, que establece que una sola observaci�n de un evento raro no contradice
que el evento sea de hecho raro. Es la observaci�n de una pluralidad de eventos
supuestamente raros lo que cada vez m�s hace reconsiderar la hip�tesis de que son
raros, es decir, la validez del modelo asumido. Un modelo adecuado de este proceso
de p�rdida gradual de confianza en una hip�tesis implicar�a la estimaci�n de la
probabilidad a priori no solo para la hip�tesis en s�, sino para todas las
hip�tesis alternativas posibles. Por esta raz�n, el contraste de hip�tesis no solo
funciona confirmando una hip�tesis que se considere probable, sino tambi�n
refutando hip�tesis consideradas improbables.

Tabla de valores num�ricos


Debido a las colas exponenciales de la distribuci�n normal, las probabilidades de
desviaciones m�s altas disminuyen muy r�pidamente. A partir de las reglas para
datos normalmente distribuidos para un evento diario:

Rango Fracci�n esperada de la poblaci�n dentro del rango Frecuencia aproximada


esperada fuera del rango Frecuencia aproximada para un evento diario
� � 0.5s 0.382924922548026 2 en 3 Cuatro o cinco veces a la semana
� � s 0.682689492137086 1 en 3 Dos veces a la semana
� � 1.5s 0.866385597462284 1 en 7 Semanalmente
� � 2s 0.954499736103642 1 en 22 Cada tres semanas
� � 2.5s 0.987580669348448 1 en 81 Trimestralmente
� � 3s 0.997300203936740 1 en 370 Anualmente
� � 3.5s 0.999534741841929 1 en 2149 Cada 6 a�os
� � 4s 0.999936657516334 1 en 15 787 Cada 43 a�os (dos veces en la vida)
� � 4.5s 0.999993204653751 1 en 147 160 Cada 403 a�os (una vez en la edad
moderna)
� � 5s 0.999999426696856 1 en 1 744 278 Cada 4776 a�os (una vez en la
historia documentada)
� � 5.5s 0.999999962020875 1 en 26 330 254 Cada 72 090 a�os (tres veces en la
historia del ser humano moderno)
� � 6s 0.999999998026825 1 en 506 797 346 Cada 1.38 millones de a�os (dos
veces en la historia del ser humano)
� � 6.5s 0.999999999919680 1 en 12 450 197 393 Cada 34 millones de a�os (dos
veces desde la extinci�n de los dinosaurios)
� � 7s 0.999999999997440 1 en 390 682 215 445 Cada 1070 millones de a�os
(cuatro veces en la historia de la Tierra)
� � xs {\displaystyle \operatorname {fer} \left({\frac {x}{\sqrt {2}}}\right)}
{\displaystyle \operatorname {fer} \left({\frac {x}{\sqrt {2}}}\right)} 1 en
{\displaystyle {\tfrac {1}{1-\operatorname {fer} \left({\frac {x}{\sqrt
{2}}}\right)}}} {\displaystyle {\tfrac {1}{1-\operatorname {fer} \left({\frac {x}
{\sqrt {2}}}\right)}}} Cada {\displaystyle {\tfrac {1}{1-\operatorname {fer}
\left({\frac {x}{\sqrt {2}}}\right)}}} {\displaystyle {\tfrac {1}{1-\operatorname
{fer} \left({\frac {x}{\sqrt {2}}}\right)}}} d�as
siendo {\displaystyle \operatorname {fer} \left({\frac {x}{\sqrt {2}}}\right)}
{\displaystyle \operatorname {fer} \left({\frac {x}{\sqrt {2}}}\right)} la
"fracci�n esperada de la poblaci�n dentro del rango" en el intervalo dado.

S-ar putea să vă placă și