Sunteți pe pagina 1din 20

CORRELACIN Y

REGRESIN LINEAL
SIMPLE
Csar Gutirrez Villafuerte
Alvaro Whittembury Vlsica
Departamento Acadmico de Medicina Preventiva y Salud Pblica
Facultad de Medicina UNMSM

Lima, 13 de marzo 2006

Correlacin y Regresin Lineales


Cuando se tiene inters en analizar la relacin entre dos
variables cuantitativas como por ejemplo:
presin sangunea y edad,
estatura y peso,
el ingreso familiar y los gastos mdicos,
los niveles de pobreza y las tasas de mortalidad infantil.
La naturaleza y la intensidad de la relacin entre este tipo
de variables puede ser examinada por medio del anlisis
de CORRELACIN y REGRESIN LINEALES.

Correlacin Lineal Simple


Tiene por objetivo medir y evaluar el grado de asociacin
lineal entre dos variables CUANTITATIVAS (medicin de
la intensidad de la relacin). Una manera de visualizar la
(posible) correlacin entre las observaciones de dos
variables X e Y, es a travs de un diagrama de dispersin,
en el cual los valores que toman estas variables son
representados por puntos.

Medida de Correlacin Lineal Simple

Se realiza a travs del Coeficiente de Correlacin Lineal


de Pearson (r).
Se utiliza cuando las variables de estudio son
cuantitativas medidas en escala de intervalo o razn.

El Coeficiente puede tomar cualquier valor entre -1 y 1


r = 1 Indica correlacin lineal directa perfecta
r = -1 Indica correlacin lineal inversa perfecta
r = 0 Indica que las dos variables no estn asociadas

r = - 0.067

r = - 0.798

r = 0.955

Desventajas

No puede ser usada para hacer predicciones ya que no


nos dice nada acerca de la forma que toma la relacin.
En algunos casos los resultados del coeficiente de
correlacin pueden ser engaosos:
Clustering

Outlier

r = 0.97

r = 0.99

Regresin Lineal Simple

Estima la forma o naturaleza de la relacin entre dos


variables cuantitativas, siendo su objetivo final el
PREDECIR o ESTIMAR el valor de una variable en funcin
al valor dado de otra variable.
Es una regresin lineal ya que la relacin X-Y est
modelada para seguir una lnea recta; y es simple ya que
hay una sola variable X.

Y = 0 + 1X +
y = b0 + b1x

=0

0 = 11.36

Permetro Ceflico = 11.36 + 0.68(Permetro Torcico)


Y=

0 +

1X +

Coeficiente de Determinacin - r2

Mide la proporcin o porcentaje de la variacin total de Y


que es explicada por el modelo de regresin.

0 r2 1
Cuanto ms se aproxime a 1, mejor ser el ajuste del
modelo a los puntos del diagrama de dispersin. Mide
que tan exitoso es el modelo.

Casos de Neumona = 43.1 + -1.35(Temperatura del aire)

r = - 0.3

r2 = 0.09

Suposiciones de la Regresin Lineal


1. Los valores de la variable independiente X son fijos
(no aleatorios), medida sin error.
2. La variable Y es aleatoria.
3. Para cada valor de X, existe una poblacin de valores
de Y con distribucin normal.
4. Las varianzas de las poblaciones Y son todas iguales.
5. Todas las medias de las poblaciones de Y estn sobre
la recta.
6. Los valores de Y estn normalmente distribuidos y
son estadsticamente independientes.

GRACIAS

S-ar putea să vă placă și