Sunteți pe pagina 1din 10

Distribución normal

¿Qué es?

Características y ejemplos en estadística

La distribución normal o gaussiana es un concepto muy usado en estadística y

psicometría.

En estadística y probabilidad, la distribución normal, también llamada


distribución de Gauss (en honor a Carl F. Gauss), distribución gaussiana o
distribución de Laplace-Gauss, refleja cómo se distribuyen los datos en una
población.
Se trata de la distribución más frecuente en estadística, y se considera la más
importante por la gran cantidad de variables reales que adoptan su forma. Así,
muchas de las características en la población se distribuyen según una distribución
normal: la inteligencia, datos antropométricos en los seres humanos (por ejemplo la
altura, la talla...), etc.
La distribución normal es un concepto perteneciente a la estadística. La estadística
es la ciencia que se ocupa del recuento, ordenación y clasificación de los datos
obtenidos por las observaciones, para poder hacer comparaciones y sacar
conclusiones.
Una distribución describe cómo se distribuyen ciertas características (o datos)
en una población. La distribución normal es el modelo continuo más importante
en estadística, tanto por su aplicación directa (ya que muchas variables de interés
general pueden describirse por dicho modelo), como por sus propiedades, que han
permitido el desarrollo de numerosas técnicas de inferencia estadística.
La distribución normal se trata, pues, de una distribución de probabilidad de
una variable continua. Las variables continuas son aquellas que pueden adoptar
cualquier valor en el marco de un intervalo que ya está predeterminado. Entre dos
de los valores, siempre puede existir otro valor intermedio, susceptible de ser
tomado como valor por la variable continua. Un ejemplo de variable continua es el
peso.
Históricamente, el nombre de “Normal” proviene del hecho de que durante un tiempo
se creyó, por parte de médicos y biólogos, que todas las variables naturales de
interés seguían este modelo.
Características
Algunas de las características más representativas de la distribución normal son las
siguientes:
1. Media y desviación estándar
A la distribución normal le corresponde un media cero y una desviación
estándar de 1. La desviación típica o estándar indica la separación que existe entre
un valor cualquiera de la muestra y la media.
2. Porcentajes
En una distribución normal, se puede determinar con exactitud qué porcentaje
de los valores estará dentro de cualquier rango específico. Por ejemplo:
Alrededor del 95% de las observaciones está dentro de 2 desviaciones estándar de
la media. El 95% de los valores se ubicará dentro de 1.96 desviaciones estándar
con respecto a la media (entre −1.96 y +1.96).
Aproximadamente el 68% de las observaciones está dentro de una 1 desviación
estándar de la media (-1 a +1), y alrededor del 99.7% de las observaciones estarían
dentro de 3 desviaciones estándar con respecto a la media (-3 a +3).
Distribución normal, normal estándar y
distribución de muestreo de la media

Distribución normal
Muchas de las variables biológicas continuas, se distribuyen de forma normal, de
allí la importancia de conocer en primer término las características de esta curva.
La curva normal, representa una distribución de frecuencia de una variable continua,
en la cual la variable es cada vez menos frecuente a medida que nos distanciamos
de su centro y viceversa más frecuente cuando nos acercamos a su centro. La curva
es totalmente simétrica, con un eje central de simetría (asimetría = 0). En su centro
coinciden las medidas de tendencia central: media, mediana y moda. Posee dos
colas una a la derecha y otra a la izquierda. Tiene forma acampanada y
es asintótica hacia los extremos, del centro hacia los extremos se va aplanando y
acercándose cada vez más hacia el eje de las abscisas, aunque nunca la toca.
Como se dijo, en su centro se encuentra la media (parámetro µ) y en los dos puntos
de inflexión de la curva (lugar donde la curva pasa de cóncava a convexa o
viceversa) coincide una desviación estándar (parámetro σ; distancia desde µ al
punto de inflexión). (Figura 1)

Figura 1: Curva normal y áreas bajo la curva.


Al utilizar la curva normal como una distribución de frecuencia, las áreas bajo la
curva pueden ser entendida como una proporción del área total de la misma y la
frecuencia (eje de las ordenadas) representada en número absolutos o con mayor
frecuencia en porcentajes y en estos casos las áreas bajo la curva representan la
frecuencia con que aparece una variable particular. La curva normal puede
interpretarse también como una distribución de probabilidades, en cuyo caso las
unidades del eje de ordenadas no está representado en frecuencias, sino en
probabilidades, en este caso el área total bajo la curva es igual 1 (suceso seguro) y
las áreas parciales bajo la curva representan la probabilidad de ocurrencia de la
variable.

Distribución normal estándar


Como existe infinitas curvas normales, determinadas cada una de ellas por N(µ,σ),
se creó una distribución normal estándar de referencia y que represente a todas y
cada una de las infinitas curvas normales, donde por convención mu es igual a cero
y sigma igual a uno, N(0,1). Para “transformar” un valor de una variable X
proveniente de una curva normal a su correspondiente valor Z (calificación Z) de
una curva normal estándar, se utiliza la siguiente ecuación:

Donde x, es el valor de la distribución normal a ser transformada en una calificación


Z (normal estándar) y los parámetros mu y sigma son la media y desviación estándar
de la distribución normal de donde procede el valor x. Al transformar cualquier valor
x de una variable a su correspondiente calificación Z, entonces podemos referir esta
calificación con relación a la única curva normal estándar N(0,1). Por ejemplo, si
queremos conocer la calificación Z de un valor de presión arterial sistólica de 130
mmHg proveniente de una distribución de frecuencia de una población, donde la
media de la presión sistólica es igual a 120 mmHg y la desviación estándar igual a
10 mmHg, entonces:

Z = (130 mmHg- 120 mmHd)/10 mmHg = 1.


La importancia de esta transformación a una calificación Z, se hace evidente cuando
ahora podemos observar que este valor está a más una desviación estándar de la
media de la curva normal estándar, lo que no era tan evidente con los valores
provenientes de la distribución de frecuencia original; así mismo con la curva normal
estándar podemos inferir AUC e interpretarlas como distribuciones de
probabilidades y decir por ejemplo, que el 68% de los pacientes provenientes de la
población original tendrían una presión arterial entre 110 – 130 mmHg.
(Figura 2)
Z1= (110 – 120)/10 = -1
Z2=(130 – 120)/10 = 1

Figura 2. Curva normal con valores originales y calificaciones Z. (Nota: se


está utilizando una sola curva, mostrando los valores X originales y sus
calificaciones Z correspondientes, solo con fines didácticos demostrativo).
Siempre teniendo en cuenta las calificaciones Z calculadas como se mostró
previamente, podemos ir a las tablas correspondientes de AUC para conocer el área
bajo la curva: a) menor que un valor Z (P(X<Z)), b) mayor que el valor Z (P(X>Z) y
c) entre dos valores Z (P(Z1< X < Z2), aunque la mayoría de las tablas solo reflejan
los valores de AUC acumulados menor que un valor Z correspondiente.
Distribución de muestreo de la media
Si tomamos TODAS las muestras posibles diferentes de tamaño n de una población,
y calculamos las medias de cada muestra individual de esa población, y graficamos
la distribución de frecuencia de esas medias, podemos verificar que:
1. La media de todas las medias muéstrales individuales es igual a la media de
la población de origen (μ),
2. Las medias muéstrales individuales se distribuyen alrededor de µ, con una
frecuencia tal que dibuja una curva normal (con un eje de simetría en mu, y
dos colas que decrecen hacia ambos extremos); esto se verifica cuando la n
de las muestras individuales son ≥ 30 observaciones independientemente de
la forma de la distribución de la población de origen de las muestras
((Teorema Central del Límite), igualmente ocurre cuando las observaciones
son menores de 30, pero distribución de frecuencia de la variable en la
población de origen se distribuye de forma normal.
3. El punto de inflexión (cambio en la curva de cóncava a convexa, o viceversa)
de la distribución de muestreo de la muestra corresponde con el Error
Estándar (EE), y que puede ser calculado con la siguiente fórmula:

Así como existe infinitas curvas normales, existe infinitas distribuciones de


frecuencias de la media, por lo que estas diferentes distribuciones de frecuencias
de medias pueden ser expresadas como calificaciones Z, a través de una fórmula
similar a aquella utilizada para la curva normal, con la salvedad que aquí no se
utilizarán valores individuales x, sino la media muestral particular y en el
denominador en vez de utilizar la desviación estándar (sigma, σ), utilizaremos el
Error Estándar (EE ) : (comparar fórmulas)

De esta forma conociendo los parámetros (mu y EE) de la población, podemos


calcular la frecuencia (o probabilidad) de observar una media muestral (o intervalo)
de esa misma población. Por ejemplo, conocido que la variable presión arterial
sistólica de una población de personas sanas se distribuye de forma normal, con
μ = 120 mmHg y σ = 10 mmHg, queremos conocer con qué frecuencia
encontraríamos medias muéstrales de tamaño 25, mayor a 124 mmHg. Entonces:
Z = (124-120)/(10/√25) = 2.
Para Z =2 P(X≤2) = 0,977; como se pide conocer P(X>124) = P(X> 2Z) entonces:
P(X > 2Z) = 1 – P(X ≤ 2Z) = 1 – 0,977 = 0,023.
Podemos concluir que en la población con los parámetros previamente conocidos,
podemos encontrar muestras de tamaño 25 con una media mayor o igual a 124
mmHg con una frecuencia del 2,3%. (ver figura 3)

Figura 3. Distribución de muestreo de media con mu = 120 y


media muestral = 124, y su correspondiente distribución de
frecuencia normal estándar (calificaciones Z).
Estos cálculos pueden ser realizados con la calculadora Excel, como con el
programa Epidat 4,2, con la salvedad de colocar el valor del EE en el lugar donde
el programa o calculadora pide el valor de la desviación estándar (σ).
Muchos programas estadísticos (entre ellos SPSS), no consideran entre sus menús,
cálculo de valores de distribución conocido los parámetros poblacionales μ y σ, ya
que está condición (conocer dichos parámetros) es muy infrecuente en la práctica
diaria. Por lo que utilizan otras distribuciones (p.ej. distribución t de Student), donde
no se requiere conocer la σ poblacional sino que es estimada con la desviación
estándar de la propia muestra.
NOTA: En este instante, el estudiante debe proceder a visualizar de manera paciente y reflexiva los
tres videos presentes. En los mismos encontraras ejercicios de práctica, para luego proceder a
enfrentarte a los que se te presentan a continuación.
𝑥−𝜇
Solución: Sabemos que Z = ; como X1 = 21 y X2 = 27 entonces la:
𝜎

P(x1 ≤ X ≤ x2 ); μ=23° y σ=5° se define como:


𝟐𝟏−𝟐𝟑 𝟐𝟕−𝟐𝟑 −𝟐 𝟒
P(21 ≤ X ≤ 27) = P ( 𝟓
≤Z≤ 𝟓
)= P( 21 ≤ X ≤ 27 ) = P ( 𝟓 ≤ Z ≤ 𝟓
)=

P ( -0.4 ≤ Z ≤ 0.8 ) = P (Z ≤ 0.8) – [ 1-P(Z ≤ 0.4) ] =

= P ( Z ≤ 0.8 ) + P ( Z ≤ 0.4 ) – 1 = 0.7881 + 0.6554 – 1 = 0.4435

0.4435 X 30 = 13.305 ( es decir, 13 dias).


EJERCICIOS PROPUESTOS DE PRACTICA

S-ar putea să vă placă și