Sunteți pe pagina 1din 89

1 2 3

CURSO DE
ESTADSTICA AVANZADA
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3

SESIN 2

REGRESIN LINEAL
SIMPLE
2.1 Introduccin a la regresin
2.2 Modelo de regresin
2.3 Errores comunes de la regresin
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

RECORDATORIO
PARA QU SIRVE EL ANOVA?
variable independiente

Para comprobar si una variable con ms de dos categoras (factores)


tiene relacin con una segunda variable que es cuantitativa
variable dependiente

A esta segunda variable que supone la respuesta al factor se le


llama variable dependiente
Pretendemos demostrar que depende de la otra variable (factor)

El factor es, por lo tanto, la variable independiente


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

RECORDATORIO
Hay dos problemas que no se pueden solucionar con el anlisis de la
varianza:
1

El ANOVA se queda corto

LA REGRESIN Cunto aumenta la


dependiente por
VIENE A RESOLVERvariable
cada unidad de aumento
de la independiente?
ESTOS DOS PROBLEMAS

Indica si hay o no una asociacin


estadstica entre dos variables,
pero no define exactamente cul
es la magnitud de esa relacin

Hay factores que tienen tantas categoras que realmente se


parecen ms a una variable cuantitativa, o puede que nos interese
usar como variable independiente una variable que es cuantitativa
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Como hemos visto, la correlacin sirve para medir la fuerza con


que estn asociadas dos variable cuantitativas

Esa fuerza se expresa con un nmero

COEFICIENTE DE
CORRELACIN

La regresin sirve para detallar ms

Est dirigida a describir de una manera ms completa cmo es la


relacin entre ambas variables
de tal manera que se puede predecir (con un cierto margen de
error) cul va a ser el valor de una variable una vez que se sabe el
valor de la otra
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Si la asociacin entre
ambas variables es dbil

Esta prediccin puede ser


bastante imprecisa

Pero cuando la
asociacin es fuerte

La regresin nos ofrece


un modelo estadstico que
puede alcanzar
finalidades predictivas

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

variable indepediente o predictora

La regresin supone que hay una variable fija, controlada


por el investigador y otra variable que no est controlada

variable de respuesta o depediente

La correlacin supone que ninguna variabe es fija, las dos


estn fuera del control del investigador

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

La regresin en su forma ms sencilla se llama regresin


lineal simple

Tcnica estadstica que analiza la relacin


entre dos variables cuantitativas, tratando de
verificar si dicha relacin es lineal

Sin embargo, a diferencia de lo que ocurra con la correlacin,


ahora no se puede considerar que ambas variables tengan un
papel simtrico

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

En la regresin, cada una de las dos variables desempea


una funcin diferente y en consecuencia tienen una
consideracin distinta:
variable respuesta
A la variable respuesta se le
llama variable dependiente y
ocupa el eje de ordenadas (eje
vertical o de la y)
A la variable predictora o
causa se le denomina variable
independiente y ocupa el eje de
abcisas (eje horizontal)

variable predictora
Suele ser un factor previamente
determinado o una caracterstica
ms fcil de medir que la que se
pretende explicar a partir de ella
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

ALGUNAS ACLARACIONES
La correlacin y la regresin tienen distintas finalidades
Es bastante raro que est indicado aplicar simultneamente
ambas tcnicas para alcanzar los objetivos de un determinado
anlisis estadstico
Con frecuencia se confunden ambas tcnicas y se piensa
que son una sola

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

OBJETIVO DE LA
CORRELACIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Medir el grado o fuerza de la asociacin


entre dos variables cuantitativas
A travs del coeficiente de correlacin

No estima la bondad del ajuste de unos datos a


un modelo

OBJETIVO DE LA
REGRESIN

Buscar la lnea que mejor se ajusta a los


puntos

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
EJERCICIO
REACCIN DE UN ALRGENO EN FUNCIN DE DISTINTAS DOSIS DE UN
PRODUCTO

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
Los datos de nuestra muestra seran los siguientes:

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
1er Paso: Diagrama de Dispersin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
1er Paso: Diagrama de Dispersin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
Obtenemos el siguiente resultado
39

Qu est pasando?

Cul es el problema?

36

CTs-BCRABL

33

30

27

24

21

20000

40000

60000

80000

100000

Concent
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
Obtenemos el siguiente resultado

Qu est pasando?

Cul es el problema?

Dispersin de los datos: los datos estn muy separados


Por eso no se observa ninguna tendencia
QU
HACER?

Aplicamos transformaciones logartmicas

Es una opcin siempre que tengamos datos dispersos


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
Los datos para la regresin seran por tanto:

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
El Diagrama de Dispersin obtenido ahora es:
Ahora s se intuye
una relacin

39

36

CTs-BCRABL

33

30

27

24

21

2,00

4,00

log_Conct
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2 Paso: Estudio de Correlacin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2 Paso: Estudio de Correlacin
Correlaciones
CTs-BCRABL
Rho de Spearman

CTs-BCRABL

Concent

Concent

Coeficiente de
correlacin

1,000

-1,000(**)

Sig. (bilateral)

,000

Coeficiente de
correlacin

-1,000(**)

1,000

Sig. (bilateral)

,000

** La correlacin es significativa al nivel 0,01 (bilateral).

Puedo calcular una recta de regresin lineal?


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3er Paso: Clculo de la Recta de Regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3er Paso: Clculo de la Recta de Regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
RESULTADOS (I)

Res um e n de l m ode lo
Modelo
1

R c uadrado
corregida
,989

R
R c uadrado
,996 a
,993

Error tp. de la
es timacin
,697

a. V ariables predictoras : (Cons tante), log_Conc t


ANOV Ab
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
136,029
,971
137,000

gl
1
2
3

Media
cuadrtica
136,029
,486

F
280,059

Sig.
,004 a

a. V ariables predictoras : (Cons tante), log_Conct


b. V ariable dependiente: CTs-BCRA BL
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
RESULTADOS (II)
Coe ficiente sa

Modelo
1

(Cons tante)
log_Conct

Coef icientes no
es tandariz ados
B
Error tp.
41,343
,736
-3,943
,236

Coef icientes
es tandariz ad
os
Beta
-,996

t
56,197
-16,735

Sig.
,000
,004

a. Variable dependiente: CTs-BCRABL

La recta de regresin sera:

CTs-BCRABL=41,343-3,943*logx

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

EJEMPLO
El ejemplo ms intuitivo es cmo se relacionan la talla y la edad
Por cada incremento de edad (por lo menos hasta los 25 aos) se
produce un incremento de altura. Es decir

y = a + b*x
constante llamada ordenada en el origen
(en nuestro caso: cunto
medira un recin nacido)

pendiente: incremento de y por


cada unidad de incremento de x
(en nuestro caso: cuntos
centmetros crece un nio al ao)
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

EJEMPLO
Sin embargo, a pesar de ser este un modelo de fcil comprensin,
tiene errores
Nunca ser posible hacer predicciones perfectas de la estatura que
tendr un nio una vez que se conoce su edad

Aunque la edad tiene un efecto importante sobre la estatura, este


efecto est afectado por un cierto grado de variabilidad aleatoria

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

EJEMPLO
Las observaciones de dos variables no suelen trazar una lnea recta
perfecta sino que existe un cierto grado de dispersin entorno
a una imaginaria lnea recta que los atravesara por el centro

y = a + b*x + e

error residual: expresa el


desajuste de los datos
respecto al modelo lineal

es una cantidad variable de un sujeto a otro y puede ser


positiva o negativa

equivale a lo que habra que aadir o quitar a la prediccin


que hace el modelo para que coincida exactamente con lo
observado en cada sujeto
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

La ecuacin anterior nos plantea una serie de preguntas

Hasta qu punto es importante ese error?


Qu porcentaje de la variabilidad en la talla puede ser
explicado por efecto de la edad y cul no es explicado?

Para resolver estos interrogantes nos adentramos en los modelos


de regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

COEFICIENTE DE DETERMINACIN R2

R2

INTERPRETACIN

Coeficiente muy importante en regresin, ya


que compara lo explicado por la regresin
lineal con la variabilidad total

Porcentaje de la variabilidad total de la


variable dependiente que es explicada
por la variable independiente

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

COEFICIENTE DE DETERMINACIN R2

VALORES

Los posibles valores para R2 van desde 1, que es


el mximo, a 0 que es el mnimo

+1

La recta dara una explicacin perfecta, es decir, los


valores de y estn totalmente determinados por la x

La recta no explica nada, es decir, no existe asociacin


entre x e y
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

COEFICIENTE DE DETERMINACIN R2

VALORES

+1

Los posibles valores para R2 van desde 1, que es


el mximo, a 0 que es el mnimo
Cuando ms prximo a 1 sea R2 mayor es la fuerza de
la asociacin entre ambas variables

0
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

COEFICIENTE DE DETERMINACIN R2
La raz cuadrada de R2 se llama r

R2 = r

Slo se escribe con mayscula (R) cuando hay varias


variables independientes
Entonces se llama coeficiente de correlacin mltiple o R
mltiple

Esta r es precisamente el coeficiente de correlacin de Pearson

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

COEFICIENTE DE DETERMINACIN R2
Salvo en los casos extremos de que R2 valga 0 o 1, la magnitud
de r es siempre superior a la de R2

para R2 0,1 r >R2

REPERCURSIONES
PRCTICAS

Una correlacin puede parecer muy buena,


por ejemplo r=0,7, y sin embargo el modelo
lineal explicara menos del 50% de lo
observado

R2 = 0,49
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

ECUACIN DE REGRESIN
El objetivo ms importante de un anlisis de regresin lineal
suele ser el clculo del valor de la pendiente de la recta

= pendiente de la recta o coeficiente de regresin


mide el cambio de la variable y por cada unidad de
cambio de x
Su magnitud sirve para predecir en cunto aumentar
y cada vez que x se incremente en una unidad
Su signo puede ser positivo o negativo, y en esto la
interpretacin coincide con la correlacin
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


Para poder realizar una regresin lineal se deben asumir cuatro
supuestos:
1

Normalidad de la distribucin condicional de la variable y

Linealidad

Homogeneidad de las varianzas

Independencia de las observaciones


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


Para poder realizar una regresin lineal se deben asumir cuatro
supuestos:
1

Normalidad de la distribucin condicional de la variable y

Linealidad

3
4

Se refiere no slo a que la variable y siga una


distribucin normal, sino que adems, para
cada valor de x, la distribucin de posibles
Homogeneidad de las varianzas
valores de y tambin siga una normal

Independencia de las observaciones


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


Para poder realizar una regresin lineal se deben asumir cuatro
supuestos:
1

Normalidad de la distribucin condicional de la variable y

Linealidad

Homogeneidad de las varianzas

Independencia de las observaciones

Que exista una relacin lineal subyacente entre


la variable x y la variable y

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


Para poder realizar una regresin lineal se deben asumir cuatro
supuestos:
1

Normalidad de la distribucin condicional de la variable y


Se conoce como homoscedasticidad

Linealidad

Homogeneidad de las varianzas

Independencia de las observaciones


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


Para poder realizar una regresin lineal se deben asumir cuatro
supuestos:
1

Normalidad de la distribucin condicional de la variable y

Linealidad

Cada observacin de la variable y


ser varianzas
independiente de las dems
Homogeneidaddebe
de las

Independencia de las observaciones


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


POR
EJEMPLO

Un estudio en el que y que representa el nmero


de lesiones cutneas en un brazo

Si existiesen pacientes en
los que se han estudiado
ambos brazos

Hay dos observaciones por


paciente que estn
autocorrelacionadas entre s
No son independientes!

POR
TANTO

Habra que considerar como N al nmero de


pacientes y no al nmero de brazos
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


OTRO
EJEMPLO

Nmero de casos de meningitis en la regin


en un ao

Puede influir mucho en el nmero de casos de meningitis


del ao siguiente

Puede decidirse el vacunar a todos los nios porque hubo


muchos casos el ao anterior

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


OTRO
EJEMPLO

Nmero de casos de meningitis en la regin


en un ao

Es decir, el segundo valor y no es independiente sino


que est condicionado por el primero, el tercero por el
segundo y as sucesivamente

A este efecto se le llama autocorrelacin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

SUPUESTOS DEL MODELO DE REGRESIN


OTRO
EJEMPLO

Nmero de casos de meningitis en la regin


en un ao

La autocorrelacin exige aplicar tcnicas especiales que


se agrupan bajo el concepto de series temporales

Estas series se utilizan mucho en economa, y cada vez van


teniendo ms inters para aplicaciones epidemiolgicas

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

REGRESIN LINEAL CON SPSS


PRIMER
PASO

OBJETIVO

Pedir a SPSS un grfico de dispersin

Apreciar visualmente si se puede asumir


un modelo lineal entre ambas variables

Cundo ajustaremos
una regresin?

Cuando la nube de puntos


nos sugiera que existe una
relacin lineal

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

REGRESIN LINEAL CON SPSS


Una nube de puntos puede sugerir que no existe ninguna
relacin
Si no existe relacin

PERO

b=0

Tambin puede resultar una pendiente de 0


por otro motivo: que haya relacin, pero
que la relacin no sea lineal sino que siga
una curva u otro tipo de funcin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

REGRESIN LINEAL CON SPSS


Por ejemplo, las nubes de puntos pueden tomar formas no
lineales como las siguientes:

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

REGRESIN LINEAL CON SPSS


FORMA DE LA
NUBE DE PUNTOS

TIPO DE
RELACIN

ECUACIN

UoJ

CUADRTICA

y = a + b*x2

REPRESENTACIN GRFICA

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

REGRESIN LINEAL CON SPSS


FORMA DE LA
NUBE DE PUNTOS

TIPO DE
RELACIN

ECUACIN

HIPRBOLA

HIPERBLICA

y = a + b*(1/x)

REPRESENTACIN GRFICA

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

USOS E INTERPRETACIN DE UNA REGRESIN LINEAL


Una vez que se ha comprobado que tenemos motivos
razonables para pensar que no existe una transgresin
importante de los supuestos de la regresin lineal

Hemos obtenido una lnea recta que relaciona x e y

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

USOS E INTERPRETACIN DE UNA REGRESIN LINEAL


Cul es la utilidad ms interesante de esta recta de regresin?

Representa lo que idealmente sera la unin de las diferentes


medias que va tomando y para cada grupo de valores de x

ES
DECIR

cul es la media de y a
medida que x va cambiando

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Un error comn en el anlisis de regresin se presenta cuando se


hacen en el mismo individuo mltiples observaciones y se tratan
como si fueran independientes
Considrese 10 pacientes de quienes se ha registrado
el peso y la medida de los pliegues cutneos antes de
empezar una dieta baja en caloras

POR
EJEMPLO

Tamao de la muestra

N = 10

RESULTADO

Variables
PESO

MEDIDA DE
LOS PLIEGUES
CUTNEOS

Puede esperarse una moderada relacin positiva


entre el peso y el grosor de los pliegues de la piel
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Ahora supngase que los mismos 10 sujetos se pesan y miden a


las seis semanas de llevar la dieta

Si las 20 observaciones se tratan como si fueran independientes


se presentaran varios problemas:

El tamao de la muestra parecera ser de 20 en vez de 10

El uso de ambas observaciones tiene el mismo efecto


que usar mediciones duplicadas
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Ahora supngase que los mismos 10 sujetos se pesan y miden a


las seis semanas de llevar la dieta

Si las 20 observaciones se tratan como si fueran independientes


se presentaran varios problemas:

El tamao de la muestra parecera ser de 20 en vez de 10

Podra concluirse (errneamente) con


El uso de ambas
observaciones
tiene
el mismo efecto
mayor
probabilidad una
significancia

que usar mediciones duplicadas


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Ahora supngase que los mismos 10 sujetos se pesan y miden a


las seis semanas de llevar la dieta

Si las 20 observaciones se tratan como si fueran independientes


se presentaran varios problemas:

Esto es debido a que la


Da como resultado una
relacin
entre
el
peso
y
el
El tamao de la muestra parecera ser correlacin
de 20 en vez
de 10de lo
mayor
grosor de los pliegues
que en realidad debe ser
cutneos
es
un
tanto
estable en la misma persona

El uso de ambas observaciones tiene el mismo efecto


que usar mediciones duplicadas
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Se pueden tambin obtener conclusiones inadecuadas si se


mezclan dos poblaciones diferentes
POR
EJEMPLO

Considrese la relacin entre estatura y


peso corporal

Recogemos una muestra de 10 hombres y 10 mujeres y se calcula


la correlacin entre peso y estatura combinando las muestras

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Si representamos las 10 muestras de las mujeres en una grfica


estatura

No parece que haya


relacin entre peso y
estatura

peso

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Si representamos las 10 muestras de los hombres en una grfica


estatura

Tampoco parece que


haya relacin entre
peso y estatura

peso

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2.1 INTRODUCCIN A
LA REGRESIN

2.2 MODELO DE
REGRESIN

2.3 ERRORES COMUNES


DE LA REGRESIN

Sin embargo, si representamos las 20 muestras de hombres y


mujeres en la misma grfica

estatura

Mujeres
Hombres

Nos podra llevar a


interpretar que s hay
relacin entre peso y
estatura

peso

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
EJERCICIO
BLOQUEO DEL NERVIO FEMORAL EN EL PACIENTE PEDITRICO: ES
POSIBLE DETERMINAR EL PUNTO MS ADECUADO PARA LA PUNCIN?

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
Los datos de nuestra muestra seran los siguientes:

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
EJERCICIO
BLOQUEO DEL NERVIO FEMORAL EN EL PACIENTE PEDITRICO: ES
POSIBLE DETERMINAR EL PUNTO MS ADECUADO PARA LA PUNCIN?

OBJETIVO

Queremos relacionar la medida del nervio


inguinal con el del CUN

Si conocemos la
medida del CUN

podemos calcular la medida del


nervio inguinal?

Lo hacemos como ejemplo para el derecho

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
1er Paso: Grfico de Dispersin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
1er Paso: Grfico de Dispersin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
1er Paso: Grfico de Dispersin

1,8

A/N-D

1,5

1,2

0,9

0,6

0,5

0,75

1,0

1,25

1,5

1,75

IFD-D
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2 Paso: Estudio de Correlacin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2 Paso: Estudio de Correlacin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
2 Paso: Estudio de Correlacin
Correlaciones
A/N-D
A/N-D

Correlacin de Pearson

IFD-D
1

Sig. (bilateral)
N
IFD-D

Correlacin de Pearson
Sig. (bilateral)
N

,887(**)
,000

74

74

,887(**)

,000
74

74

** La correlacin es significativa al nivel 0,01 (bilateral).

Vemos que podemos asumir una correlacin lineal


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3er Paso: Clculo de la Recta de Regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3er Paso: Clculo de la Recta de Regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
REGRESIN (I)
b
Variables introducidas/e lim inadas

Modelo
1

Variables
introducidas
A/N-Da

Variables
eliminadas
.

Mtodo
Introducir

a. Todas las v ariables s olicitadas introduc idas


b. Variable dependiente: IFD-D

Res um e n de l m ode lo
Modelo
1

R
R c uadrado
,887 a
,787

R c uadrado
corregida
,784

Error tp. de la
es timacin
,1579

a. V ariables predictoras : (Cons tante), A/N-D


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
REGRESIN (II)
ANOV Ab
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
6,635
1,796
8,431

Media
cuadrtica
6,635
,025

gl
1
72
73

F
266,026

Sig.
,000 a

a. V ariables predictoras : (Cons tante), A/N-D


b. V ariable dependiente: IFD-D
Coe ficiente sa

Modelo
1

(Cons tante)
A/N-D

Coef icientes no
es tandariz ados
B
Error tp.
,118
,064
,901
,055

Coef icientes
es tandariz ad
os
Beta
,887

t
1,830
16,310

Sig.
,071
,000

a. Variable dependiente: IFD-D


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3

SESIN 3

REGRESIN LINEAL
MLTIPLE
3.1 Introduccin
3.2 Mtodos de Regresin Lineal Mltiple

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

El procedimiento de Regresin Lineal permite utilizar ms de una


variable independiente y permite llevar a cabo anlisis de
regresin mltiple

En el anlisis de regresin mltiple la ecuacin ya no define una


recta en el plano, sino un hiperplano en un espacio
multidimensional

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

Con una variable dependiente y dos independientes

necesitamos tres ejes para poder representar el diagrama de


dispersin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

Si en lugar de
utilizramos tres

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

dos

variables

independientes

sera necesario un espacio de cuatro dimensiones para


poder construir el diagrama de dispersin

POR
TANTO

Con ms de una variable independiente, la


representacin grfica de las relaciones
presentes en un modelo de regresin resulta
poco intuitiva, muy complicada y nada til

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

Es ms fcil y prctico partir de la ecuacin del


modelo de regresin lineal:

Y = 0 + 1*X1 + 2*X2 +..+ k*Xk +


La variable dependiente Y se interpreta como una combinacin
lineal de un conjunto de K variables independientes, cada una de
las
las cuales
cuales va
va acompaada
acompaada de
de un
un coeficiente , que
que indica
indica el
el peso
peso
relativo de esa variable en la ecuacin
La ecuacin incluye un componente aleatorio (los residuos )
que recoge todo lo que las variables independientes no son
capaces de explicar
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

SELECCIN DE LAS VARIABLES DE REGRESIN


El control sobre las variables utilizadas para construir el
modelo de regresin recae sobre el propio analista

Es el analista quien decide qu variables independientes


desea incluir en la ecuacin de regresin seleccionndolas l
mismo de la lista de variables independientes que tiene
v. independiente 1
v. independiente 2
v. independiente 3
..

analista

ecuacin de
regresin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

SELECCIN DE LAS VARIABLES DE REGRESIN


Sin
embargo
son
frecuentes situaciones
en las que

No existe una teora o un trabajo


previo que oriente al analista en la
eleccin de las variables relevantes
El nmero de variables
independientes es muy elevado

Para afrontar estas situaciones existen procedimientos diseados


para seleccionar, entre una gran cantidad de variables, slo
aquellas que permiten obtener el mejor ajuste posible

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

CRITERIOS DE SELECCIN DE LAS VARIABLES


Existen diferentes criterios para seleccionar variables en un
modelo de regresin:
1

El valor del coeficiente de correlacin mltiple R2

El coeficiente de correlacin parcial entre cada


variable independiente y la dependiente

El grado de reduccin del error tpico cada vez que se


incorpora una variable

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Existen diferentes mtodos para seleccionar las variables
independientes que debe incluir un modelo de regresin
Los de mayor aceptacin son los mtodos de seleccin por
pasos (stepwise)
En primer lugar se selecciona la mejor variable, de
acuerdo a algn criterio estadstico

A continuacin, la mejor de las restantes


y as sucesivamente hasta que ya no quedan variables
que cumplan los criterios de seleccin

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

Pasos sucesivos

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Las variables se incorporan al modelo de regresin


Mtodo hacia
una atrs
a una

PRIMER
PASO:
se
selecciona
la
variable
independiente que, adems de superar los criterios
Pasos sucesivos
de entrada, ms alto correlaciona (positiva o
negativamente) con la dependiente

Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

SIGUIENTES PASOS: se utiliza como criterio de


Mtodo hacia
atrs el coeficiente de correlacin parcial.
seleccin

Van siendo seleccionadas una a una las variables


que poseen el coeficiente de correlacin parcial ms
Pasos sucesivos
alto en valor absoluto
La seleccin de variables se detiene cuando no
quedan variables que superen el criterio de entrada
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

Comienza incluyendo en el modelo todas las


variables independientes, para luego proceder a
Pasos sucesivos
eliminarlas una a una
PRIMER PASO: se elimina aquella variable que,
adems de cumplir los criterios de salida, posee el
coeficiente de regresin ms bajo en valor absoluto
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

SIGUIENTES PASOS: Se van eliminando las variables


con coeficientes de regresin no significativos

Pasos sucesivos

La eliminacin de variables se detiene cuando no


quedan variables en el modelo que cumplan los
criterios de salida
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

Pasos sucesivos

Mezcla de los dos mtodos anteriores


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

Pasos sucesivos
Comienza al igual que el mtodo hacia delante,
seleccionando en el primer paso la variable independiente
que adems de superar los criterios de entrada ms altos
correlaciona con la variable dependiente
Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

1 2 3
3.1 INTRODUCCIN

3.2 MTODOS DE REGRESIN


LINEAL MLTIPLE

MTODOS DE SELECCIN DE VARIABLES


Los mtodos de seleccin ms utilizados son:
1

Mtodo hacia delante

Mtodo hacia atrs

Pasos sucesivos

A continuacin se selecciona la variable independiente


Guadalupe Ruiz Merino - Curso de Estadstica Avanzada

S-ar putea să vă placă și