Documente Academic
Documente Profesional
Documente Cultură
Grupo: A
Subsede: La Paz
Copyright © (AÑO) por (NOMBRES DE ESTUDIANTES). Todos los derechos reservado
RESUMEN:
Una de las distribuciones teóricas mejor estudiadas en los textos de bioestadística y más
utilizada en la práctica es la distribución normal, también llamada distribución gaussiana. Su
importancia se debe fundamentalmente a la frecuencia con la que distintas variables
asociadas a fenómenos naturales y cotidianos siguen, aproximadamente, esta distribución.
Caracteres morfológicos (como la talla o el peso), o psicológicos (como el cociente
intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una
distribución normal. No obstante, y aunque algunos autores, han señalado que el
comportamiento de muchos parámetros en el campo de la salud puede ser descrito mediante
una distribución normal, puede resultar incluso poco frecuente encontrar variables que se
ajusten a este tipo de comportamiento. El uso extendido de la distribución normal en las
aplicaciones estadísticas puede explicarse, además, por otras razones
Palabras clave:
ABSTRACT:
One of the best-studied theoretical distributions in biostatistical texts and most modified in
practice is the normal distribution, also called the Gaussian distribution, Its importance is
mainly due to the frequency with the different variables associated with natural phenomena.
and following daily, approximately, this distribution. Morphological (such as height or
weight), or psychological (such as intellectual quotient) characters are examples of variables
that are considered to follow a normal distribution. However, and although some authors,
have pointed out that the behavior of many parameters in the field of health can be modified
through a normal distribution, it may even be rare to find variables that fit this type of
behavior. The widespread use of normal distribution in statistical applications can be
explained, in addition, for other reasons. Many of the statistical procedures commonly used
assume the normality of the observed data. Although many of these techniques are not too
sensitive to deviations from normality, in general, this hypothesis can be ignored when a
sufficient number of data is available, it is advisable to always check whether or not a normal
distribution can be assumed
Key Words:
TABLA DE CONTENIDOS
Introducción ………………………………………………………………………………4
Desarrollo………………………………………………………………………………… 5
Titulo 1 …………………………………………………………………………………5
Titulo 2 ………………………………………………………………………………7
Titulo 3 ………………………………………………………………………………9
Bibliografia y Referencias ……………………………………………………………….15
TITULO 1
DISTRIBUCION NORMAL
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor
de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan
a una curva en "forma de campana".
Caracteres fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.
Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
Son más probables los valores cercanos a uno central que llamados media
Aunque la campana de Gauss lleva el nombre del genio de las matemáticas Carl Friedrich
Gauss , realmente la distribución normal la descubrió y publico por primera vez Abraham
Moivre (por eso en algunos libros se llama la distribución de Moivre – Gauss) en un artículo
del año 1733, que reprodujo en la segunda edición de su obra “The Doctrine of Chance”
(1738) como aproximación de la distribución normal para valores grandes de n. Este
resultado fue ampliado por Pierre-Simon de Laplace en su libro “Teoría analítica de las
probabilidades” (1812).
El nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando
analizaba datos astronómicos y algunos autores le atribuyen un descubrimiento
independiente del de De Moivre.
El nombre de "campana" se lo dio Esprit Jouffret que uso este término (bell surface)
(superficie campana) por primera vez en 1872.
PROPIEDADES
El área del recinto determinado por la función y el eje de abscisas es igual a la unidad.
Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y
otra igual a 0.5 a la derecha.
APLICACIONES
Una de las mayores aportaciones al cálculo integral que realizó Gauss, fue la introducción de
esta función. Este gráfico se usa en variables asociadas a fenómenos naturales que siguen el
modelo de la normal.
Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.
Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
Regresión lineal
Expresándolo en forma simple, la regresión lineal es una técnica que permite cuantificar la
relación que puede ser observada cuando se grafica un diagrama de puntos dispersos
correspondientes a dos variables, cuya tendencia general es rectilínea (Figura la); relación
que cabe compendiar mediante una ecuación “del mejor ajuste” de la forma:
y = a + bx (1)
En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el
gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje
horizontal (absisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es
llamado el intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se
denomina la pendiente o coeficiente de regresión.
Tabla1
Serie de datos para el cálculo de una regresión (“a” y “b”) y del coeficiente de correlación
(“r”)
El procedimiento para obtener valores de “a” y “b” para una serie de pares de datos de “x” y
de “y” (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:
Paso 1 Calcule, para cada par de valores de “x” e “y”, las cantidades “x²”, “y²”, y “x.y”.
Paso 2 Obtenga las sumas (∑) de estos valores para todos los pares de datos de “x” e “y”,
así como las sumas del total de los valores de “x” e “y”. Los resultados de los
Pasos 1 y 2 aparecerán en forma similar a la siguiente:
A partir de esos valores de “a” y de “b” obtenidos mediante las Ecuaciones 2 y 3, es posible
trazar a lo largo de los puntos dispersos de un gráfico la línea recta mejor ajustada a los
mismos, y verificar visualmente si tales puntos están bien “expresados” por la línea (Figura
1b).
CORRELACIÓN
La correlación entre dos variables es - otra vez puesto en los términos más simples - el grado
de asociación entre las mismas. Este es expresado por un único valor llamado coeficiente de
correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando “r” es negativo,
ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando la otra aumenta
(se trata entonces de una “correlación negativa”, correspondiente a un valor negativo de “b”
en el análisis de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable
se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo de “b” en el
análisis de regresión).
Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de “x”
e “y”, utilizando la misma table y montos que se indican en el Paso 2 de la sección “regresión”
de este capítulo. De este modo “r” puede ser obtenido - indirectamente - a partir de la relación:
Figura 1 Diagrama de puntos dispersos correspondientes a pares de valores de “x” y de “y”.
Nótese que “y” tiende a decrecer con el aumento de “x”, lo cual sugiere coeficientes de
regresión y de correlación negativos (basado en la Tabla 1)
Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la regresión y = 2,16
- 0,173x, con r = 0,75
es decir, tomar la raíz indicada del coeficiente de determinación a los fines de obtener el valor
absoluto de “r”, y luego agregar el signo (+ o -) de acuerdo a que la correlación sea positiva
o negativa (lo cual puede ser establecido visualmente a partir del gráfico, o bien en base al
cálculo del valor de “b” de la correspondiente regresión y utilizando para “r” el mismo signo).
Cuando se calculan los valores de “r” se querrá saber, sin embargo, hasta qué punto la
correlación identificada pudiera haber surgido únicamente por casualidad. Esto puede ser
establecido verificando si el valor estimado de “r” es “significativo”, es decir si el valor
absoluto de “r” es mayor o igual que un valor “crítico” de “r” indicado en las tablas
estadísticas (ver Tabla de valores críticos de “r” en el Apéndice 1).
Ejercicio: Calcule “a”, “b” y “r” a partir de los datos presentados en la Tabla 1 y verifique,
por medio de la Tabla del Apéndice 1, hasta qué punto el valor estimado de “r” es
significativo para valores de P = 0,01 y de P = 0,05
W = α · Lb (6)
ecuación que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud
(L) (ver Figura 2a).
Los datos largo-peso, sin embargo, pueden ser ajustados a una regresión lineal si se toma el
logaritmo de ambos miembros, de manera que:
Como puede observarse en la Figura 2b, los logaritmos de la longitud y del peso se ajustan
extremadamente bien a una regresión lineal, donde:
y = log10W (8a)
x = log10L (8b)
Así, el ajuste de una relación largo-peso de la forma dada en la Ecuación (6) a una serie de
datos de ambas variables (tal como en la Tabla 2) consiste en lo siguiente:
Tabla2
Datos para la estimación de la relación largo-peso en el “threadifin bream” Nemipterus
marginatus
https://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/metodos1/Regresion.pdf
http://www.fao.org/3/X6845S/X6845S02.htm
https://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp#distribucion
Pértega Díaz S, Pita Fernández S. Representación gráfica en el análisis de datos. Cad Aten
Primaria 2001; 8: 112-117.
Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman
& Hall; 1997.
Elston RC, Johnson WD. Essentials of Biostatistics. Philadelphia: F.A. Davis Company;
1987.
Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ 1995; 310: 298-298.