Sunteți pe pagina 1din 15

FICHA DE IDENTIFICACIÓN DE TRABAJO MONOGRÁFICO

Título: DISTRIBUCION NORMAL


Autor: Jefferson Rolando Baptista Chila
Fecha: 22/11/2019

Código de estudiante: 55190


Carrera: Ing. Gas y Petróleo

Asignatura: Probabilidad y Estadística

Grupo: A

Docente: Carmen Rosa Romero Jove

Periodo Académico: II-2019

Subsede: La Paz
Copyright © (AÑO) por (NOMBRES DE ESTUDIANTES). Todos los derechos reservado
RESUMEN:

Una de las distribuciones teóricas mejor estudiadas en los textos de bioestadística y más
utilizada en la práctica es la distribución normal, también llamada distribución gaussiana. Su
importancia se debe fundamentalmente a la frecuencia con la que distintas variables
asociadas a fenómenos naturales y cotidianos siguen, aproximadamente, esta distribución.
Caracteres morfológicos (como la talla o el peso), o psicológicos (como el cociente
intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una
distribución normal. No obstante, y aunque algunos autores, han señalado que el
comportamiento de muchos parámetros en el campo de la salud puede ser descrito mediante
una distribución normal, puede resultar incluso poco frecuente encontrar variables que se
ajusten a este tipo de comportamiento. El uso extendido de la distribución normal en las
aplicaciones estadísticas puede explicarse, además, por otras razones

Palabras clave:

ABSTRACT:

One of the best-studied theoretical distributions in biostatistical texts and most modified in
practice is the normal distribution, also called the Gaussian distribution, Its importance is
mainly due to the frequency with the different variables associated with natural phenomena.
and following daily, approximately, this distribution. Morphological (such as height or
weight), or psychological (such as intellectual quotient) characters are examples of variables
that are considered to follow a normal distribution. However, and although some authors,
have pointed out that the behavior of many parameters in the field of health can be modified
through a normal distribution, it may even be rare to find variables that fit this type of
behavior. The widespread use of normal distribution in statistical applications can be
explained, in addition, for other reasons. Many of the statistical procedures commonly used
assume the normality of the observed data. Although many of these techniques are not too
sensitive to deviations from normality, in general, this hypothesis can be ignored when a
sufficient number of data is available, it is advisable to always check whether or not a normal
distribution can be assumed

Key Words:
TABLA DE CONTENIDOS

Introducción ………………………………………………………………………………4
Desarrollo………………………………………………………………………………… 5
Titulo 1 …………………………………………………………………………………5
Titulo 2 ………………………………………………………………………………7
Titulo 3 ………………………………………………………………………………9
Bibliografia y Referencias ……………………………………………………………….15

LISTA DE GRÁFICOS E IMÁGENES


Introducción

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas.


Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad
con la que las ciertos fenómenos tienden a parecerse en su comportamiento a esta
distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un


mismo valor de p y de valores de n cada vez mayores, se ve que sus polígonos de frecuencias
se aproximan a una forma en forma de campana.

En resumen, la importancia de la distribución normal se debe principalmente a que hay


muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal.
- Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie.
Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,…
- Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.

- Caracteres sociológicos, por ejemplo: consciente intelectual, grado de adaptación a un


medio.

- Errores cometidos al medir ciertas magnitudes.


- Valores estadísticos maestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la Poisson son aproximaciones normales.
El uso extendido de la distribución normal en las aplicaciones estadísticas puede explicarse,
además, por otras razones. Muchos de los procedimientos estadísticos habitualmente
utilizados asumen la normalidad de los datos observados. Aunque muchas de estas técnicas
no son demasiado sensibles a desviaciones de la normal y, en general, esta hipótesis puede
obviarse cuando se dispone de un número suficiente de datos, resulta recomendable
contrastar siempre si se puede asumir o no una distribución normal. La simple exploración
visual de los datos puede sugerir la forma de su distribución.
DESARROLLO

TITULO 1
DISTRIBUCION NORMAL

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio


nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que
ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor
de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan
a una curva en "forma de campana".

En resumen, la importancia de la distribución normal se debe principalmente a que hay


muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal.

Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie, p.


ejm. Tallas, pesos, envergaduras, diámetros, perímetros…

Caracteres fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.

Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un


medio……

Errores cometidos al medir ciertas magnitudes.

Valores estadísticos maestrales, por ejemplo: la media.

Otras distribuciones como la binomial o la de Poisson son aproximaciones normales…

Y en general cualquier característica que se obtenga como suma de muchos factores


Función De Densidad

Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de


densidad que corresponde a tales distribuciones viene dando por la fórmula

Función De Una Distribución

Puede tomar cualquier valor (- ∞ ,+ ∞ )

Son más probables los valores cercanos a uno central que llamados media

Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a


derecha e izquierda (es simétrica).

Conforma nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o


menos rápida dependiendo de un parámetro s , que es la desviación típica.
TITULO 2

APLICACIÓN E IMPORTANCIA DE LA CAMPANA DE GAUSS

Aunque la campana de Gauss lleva el nombre del genio de las matemáticas Carl Friedrich
Gauss , realmente la distribución normal la descubrió y publico por primera vez Abraham
Moivre (por eso en algunos libros se llama la distribución de Moivre – Gauss) en un artículo
del año 1733, que reprodujo en la segunda edición de su obra “The Doctrine of Chance”
(1738) como aproximación de la distribución normal para valores grandes de n. Este
resultado fue ampliado por Pierre-Simon de Laplace en su libro “Teoría analítica de las
probabilidades” (1812).

El nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando
analizaba datos astronómicos y algunos autores le atribuyen un descubrimiento
independiente del de De Moivre.

El nombre de "campana" se lo dio Esprit Jouffret que uso este término (bell surface)
(superficie campana) por primera vez en 1872.

La campana de Gauss está definida por la función:

PROPIEDADES

El campo de existencia es cualquier valor real, es decir, (-∞, +∞).

Es simétrica respecto a la media µ.

Tiene un máximo en la media µ.

Crece hasta la media µ y decrece a partir de ella.

En los puntos µ − σ y µ + σ presenta puntos de inflexión.

El eje de abscisas es una asíntota de la curva.

El área del recinto determinado por la función y el eje de abscisas es igual a la unidad.
Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y
otra igual a 0.5 a la derecha.

La probabilidad equivale al área encerrada bajo la curva.

p(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %

p(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %

p(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %

APLICACIONES

Una de las mayores aportaciones al cálculo integral que realizó Gauss, fue la introducción de
esta función. Este gráfico se usa en variables asociadas a fenómenos naturales que siguen el
modelo de la normal.

Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie,


p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...

Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.

Caracteres [Psicología|psicológicos]], por ejemplo: cociente intelectual, grado de adaptación


a un medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadísticos muestrales, por ejemplo: la media.


TITULO 3

APLICACIÓN DE REGRESIÓN Y CORRELACIÓN DE DOS VARIABLES


REGRESION

Regresión lineal

Expresándolo en forma simple, la regresión lineal es una técnica que permite cuantificar la
relación que puede ser observada cuando se grafica un diagrama de puntos dispersos
correspondientes a dos variables, cuya tendencia general es rectilínea (Figura la); relación
que cabe compendiar mediante una ecuación “del mejor ajuste” de la forma:

y = a + bx (1)

En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el
gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje
horizontal (absisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es
llamado el intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se
denomina la pendiente o coeficiente de regresión.

Tabla1
Serie de datos para el cálculo de una regresión (“a” y “b”) y del coeficiente de correlación
(“r”)
El procedimiento para obtener valores de “a” y “b” para una serie de pares de datos de “x” y
de “y” (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:

Paso 1 Calcule, para cada par de valores de “x” e “y”, las cantidades “x²”, “y²”, y “x.y”.

Paso 2 Obtenga las sumas (∑) de estos valores para todos los pares de datos de “x” e “y”,
así como las sumas del total de los valores de “x” e “y”. Los resultados de los
Pasos 1 y 2 aparecerán en forma similar a la siguiente:

A partir de esos valores de “a” y de “b” obtenidos mediante las Ecuaciones 2 y 3, es posible
trazar a lo largo de los puntos dispersos de un gráfico la línea recta mejor ajustada a los
mismos, y verificar visualmente si tales puntos están bien “expresados” por la línea (Figura
1b).
CORRELACIÓN

El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión


y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.

La correlación entre dos variables es - otra vez puesto en los términos más simples - el grado
de asociación entre las mismas. Este es expresado por un único valor llamado coeficiente de
correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando “r” es negativo,
ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando la otra aumenta
(se trata entonces de una “correlación negativa”, correspondiente a un valor negativo de “b”
en el análisis de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable
se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo de “b” en el
análisis de regresión).

Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de “x”
e “y”, utilizando la misma table y montos que se indican en el Paso 2 de la sección “regresión”
de este capítulo. De este modo “r” puede ser obtenido - indirectamente - a partir de la relación:
Figura 1 Diagrama de puntos dispersos correspondientes a pares de valores de “x” y de “y”.
Nótese que “y” tiende a decrecer con el aumento de “x”, lo cual sugiere coeficientes de
regresión y de correlación negativos (basado en la Tabla 1)

Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la regresión y = 2,16
- 0,173x, con r = 0,75

la cual proporciona el valor del “coeficiente de determinación” (r²). Entonces, lo único


necesario es calcular

es decir, tomar la raíz indicada del coeficiente de determinación a los fines de obtener el valor
absoluto de “r”, y luego agregar el signo (+ o -) de acuerdo a que la correlación sea positiva
o negativa (lo cual puede ser establecido visualmente a partir del gráfico, o bien en base al
cálculo del valor de “b” de la correspondiente regresión y utilizando para “r” el mismo signo).

Cuando se calculan los valores de “r” se querrá saber, sin embargo, hasta qué punto la
correlación identificada pudiera haber surgido únicamente por casualidad. Esto puede ser
establecido verificando si el valor estimado de “r” es “significativo”, es decir si el valor
absoluto de “r” es mayor o igual que un valor “crítico” de “r” indicado en las tablas
estadísticas (ver Tabla de valores críticos de “r” en el Apéndice 1).
Ejercicio: Calcule “a”, “b” y “r” a partir de los datos presentados en la Tabla 1 y verifique,
por medio de la Tabla del Apéndice 1, hasta qué punto el valor estimado de “r” es
significativo para valores de P = 0,01 y de P = 0,05

Transformación Lineal en el Análisis de Regresión

Como se indicará anteriormente, tanto el análisis de regresión como el de correlación se basan


en la asunción de una relación “lineal” entre las dos variables de referencia (lo cual significa
que la mejor línea de ajuste es una recta). Hay muchos casos en biología pesquera, sin
embargo, en los cuales la relación entre ambas variables no es lineal, y un buen ejemplo de
ello es la relación largo-peso, donde:

W = α · Lb (6)

ecuación que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud
(L) (ver Figura 2a).

Los datos largo-peso, sin embargo, pueden ser ajustados a una regresión lineal si se toma el
logaritmo de ambos miembros, de manera que:

log10W = a + b log10L (7)

Como puede observarse en la Figura 2b, los logaritmos de la longitud y del peso se ajustan
extremadamente bien a una regresión lineal, donde:

y = log10W (8a)

x = log10L (8b)
Así, el ajuste de una relación largo-peso de la forma dada en la Ecuación (6) a una serie de
datos de ambas variables (tal como en la Tabla 2) consiste en lo siguiente:

Tabla2
Datos para la estimación de la relación largo-peso en el “threadifin bream” Nemipterus
marginatus

Del extremo sur del mar del Sur de la China. Original

Paso 1 Obtenga el logaritmo de los valores de largo y peso.


Paso 2 Calcule los montos indicados en la sección referente a regresión, determinando los
valores de “x” e “y” tal como se indica en las Ecuaciones 8a y 8b.
Paso 3 Estime “a” y “b” utilizando las Ecuaciones 2 y 3.
Paso 4 Tome el antilogaritmo de “a”, a fin de obtener “α” en la Ecuación 6.
Paso 5 Anote la Ecuación 6 sustituyendo los parámetros “α” y “b” por sus valores estimados
Paso 6 Utilizando las magnitudes calculadas en el Paso 2, determine los valores de “r²” y “r” y
verifique en la Tabla 2.
BIBLIOGRAFÍA Y REFERENCIAS

https://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/metodos1/Regresion.pdf

http://www.fao.org/3/X6845S/X6845S02.htm

https://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp#distribucion

Pértega Díaz S, Pita Fernández S. Representación gráfica en el análisis de datos. Cad Aten
Primaria 2001; 8: 112-117.

Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman
& Hall; 1997.

Daniel WW. Bioestadística. Base para el análisis de las ciencias de la


salud. Mexico: Limusa; 1995.

Elston RC, Johnson WD. Essentials of Biostatistics. Philadelphia: F.A. Davis Company;
1987.

Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ 1995; 310: 298-298.

S-ar putea să vă placă și