Sunteți pe pagina 1din 19

UNIVERSIDAD NACIONAL

AUTNOMA DE MXICO
FACULTAD DE CONTADURIA Y ADMINISTRACIN
LICENCIATURA EN ADMINISTRACIN
ESTADISTICA INFERENCIAL
TRABAJO: . REGRESIN LINEAL SIMPLE
AYALA OLIVA GUSTAVO
ALUMNA: SPINDOLA VILLEDA ANA KAREN
GRUPO: 9271
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
REGRESIN LINEAL SIMPLE
Introduccin
El mtodo de anlisis llamado anlisis de regresin, investiga y modela la relacin entre una variable
Y dependiente o de respuesta en funcin de otras variables de prediccin Xs, a travs del mtodo
de mnimos cuadrados.
Como ejemplo supngase que un ingeniero industrial de una embotelladora est analizando la
entrega de producto y el servicio requerido por un operador de ruta para surtir y dar mantenimiento a
maquinas dispensadoras. El ingeniero visita ! locales al azar con mquinas dispensadoras,
observando el tiempo de entrega en minutos y el volumen de producto surtido en cada uno. "as
observaciones se grafican en un diagrama de dispersin #$ig. %.%&, donde claramente se observa
que 'ay una relacin entre el tiempo de entrega y el volumen surtido( los puntos casi se encuentran
sobre una lnea recta, con un peque)o error de ajuste.
En general los modelos de regresin tienen varios propsitos como son*
Descripcin de datos a travs de ecuaciones
Estimacin de parmetros para obtener una ecuacin modelo
Prediccin y estimacin.
Control.
El modelo de rere!in line"l !im#le
+l tomar observaciones de ambas variables Y respuesta y X prediccin o regresor, se puede
representar cada punto en un diagrama de dispersin.
,
-
- -
--- -
--- --
---
.
Fig. 1.1 Diagrama de dispersin y recta de ajuste
El modelo de ajuste o modelo de regresin lineal es*

ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014


+ + X Y
1 0
/onde los coeficientes
0
y
1
son parmetros del modelo denominados coeicientes de regresin,
son constantes, a pesar de que no podemos determinarlos e0actamente sin e0aminar todas las
posibles ocurrencias de . y ,, podemos usar la informacin proporcionada por una muestra para
'allar sus estimados 1 0
, b b
. El error es difcil de determinar puesto que cambia con cada
observacin Y. 1e asume que los errores tienen media cero, varianza desconocida

y no estn
correlacionados #el valor de uno no depende del valor de otro&. 2or esto mismo las respuestas
tampoco estn correlacionadas.
Conviene ver al regresor o predictor X como la variable controlada por el analista y evaluada con el
mnimo error, mientras que la variable de respuesta Y es una variable aleatoria, es decir que e0iste
una distribucin de Y con cada valor de X.
"a media de esta distribucin es*
x x y E
1 0
) | ( +
y su varianza es*
2
1 0
) ( ) | ( + + x V x y V
/e esta forma la media de Y es una funcin lineal de X a pesar de que la varianza de $ no dependa
de los valores de X.
Estimacin de los parmetros por mnimos cuadrados
El mtodo de mnimos cuadrados se usa para estimar
0
y
1
se estimar
0
y
1
de manera que
la suma de cuadrados de las diferencias entre la observaciones yi y la lnea recta sea mnima. "os
parmetros
0
y
1
son desconocidos y deben ser estimados usando datos de una muestra.
1upongamos que se tienen n pares de datos #y%, 0%&, #y%, 0%&, #y, 0&,....., #yn, 0n& de un e0perimento o
por 'istoria.
/e la ecuacin modelo de regresin de la poblacin
+ + X Y
1 0
3sando los pares de datos se puede establecer el criterio de mnimos cuadrados como*
2
1 0
1
1 0
) ( ) , (
i
n
i
i
x y S

4
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
"os estimadores de mnimos cuadrados de
0
y
1
por decir
1 0

,


debe satisfacer es*
0 ) ( 2
1 0
1
, 0
1 0

i
n
i
i
x y
S


y
0 ) ( 2
1 0
1
, 1
1 0

i i
n
i
i
x x y
S


1implificando estas dos ecuaciones se obtienen las ecuaciones de m!nimos cuadrados*


+
n
i
i
n
i
i
y x n
1 1
1 0




+
n
i
i i
n
i
i
n
i
i
x y x x
1 1
2
1
1
0


"a solucin a las ecuaciones normales anteriores*
x y
1 0

,
_

,
_

,
_

n
i
n
i
i
i
n
i
i
n
i
i
n
i
i i
n
x
x
n
y x
x y
1
2
1 2
1 1
1
1

/onde los promedios para . y para , son los siguientes**

n
i
i
y
n
y
1
1

n
i
i
x
n
x
1
1
+plicando el mtodo de mnimos cuadrados del error, se obtiene el modelo que nos da un valor
estimado , en funcin de ., denominado ecuacin de prediccin o de regresin lineal, como sigue*
1 1
0 0

b
b
X b b Y
1 0
^
+
/onde*
5
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014


n
i
i
n
i
i i
xx
xy
X n X
Y X n Y X
S
S
b
1
2
__
2
__ __
1
1
__
1
__
0
X b Y b
por tanto*
) (
__
1
__ ^
X X b Y Y +
Cuando
__
X X
se tiene el punto
) , (
__ __
Y X
que se encuentra en la lnea ajustada y representa el
centro de gravedad de los datos.
Ejemplo 1.1 Se realizaron 25 observaciones de la variable Y y como sigue!
Y
10."# $5.$
11.1$ 2".%
12.51 $0.#
#.& 5#.#
".2% '1.&
#.%$ %1.$
'.$' %&.&
#.5 %'.%
%.#2 %0.%
".1& 5%.5
#.2& &'.&
12.1" 2#."
11.## 2#.1
".5% $".1
10."& &'.#
".5# &#.5
10.0" 5".$
#.11 %0
'.#$ %0
#.## %&.5
%.'# %2.1
#.&% 5#.1
#.#' &&.'
10.$' $$.&
11.0# 2#.'
!
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
6aciendo clculos con el paquete 7initab con . en la columna C y , en la columna C% se tiene*
Rere!!ion An"l%!i!: &' (er!u! &)
()e regression e*uation is
+1 , 1$.' - 0.0%"# +2
.redictor +oe/ S0 +oe/ ( .
+onstant 1$.'2$0 0.5#15 2$.&$ 0.000
+2 -0.0%"#$ 0.01052 -%.5" 0.000
S , 0.#"01 1-S* , %1.&2 1-S*3adj4 , %0.22
2or lo anterior la ecuacin de regresin obtenida es*
X Y 0798 . 0 6 . 13
^

#%.8&
/espus de obtener esta ecuacin, surgen algunas preguntas*
9qu tan bien ajusta los datos esta ecuacin:
9el ;til el modelo para 'acer predicciones:
9se viola alguna condicin como varianza constante y no correlacin en los errores, de ser as
que tan seria es:
8
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
<odo esto debe ser aclarado antes de usar el modelo.
+nlisis de =arianza
El anlisis de varianza es una 'erramienta que sirve para probar la adecuacin del modelo de
regresin, para lo cual es necesario calcular las sumas de cuadrados correspondientes.
"a desviacin estndar 1 corresponde a la raz cuadrada del valor de 71E o cuadrado medio
residual.
2 2
1 2

n
S b S
n
SS
S
XY YY E
/onde*
n
Y
Y S
n
i
i
n
i
i YY
2
1
1
2

,
_

n
Y X
Y X S
n
i
i
n
i
i
n
i
i i XY


1 1
1
"a e0presin
i
i i
Y Y e
^

es el residuo que e0presa la diferencia entre el valor observado y el valor
estimado por la ecuacin de prediccin.
/onde*
) (
__
^
__
^
Y Y Y Y Y Y
i
i
i
i


Y
Yi
^
i
e
Yi
__
Y Y
i

_
Y
l5nea ajustada
>
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
x b b Y
1 0
^
+
X
i
Fig. 1.2 0rrores involucrados en la recta de ajuste
"a cantidad
) (
__
Y Y
i

es la desviacin de la observacin i?sima respecto a la media. 2or otra parte*

+
2
^
2
__
^
2
__
) ( ) ( ) (
i
i
i
i
Y Y Y Y Y Y
1uma de cuadrados @ 1uma de cuadrados A 1uma de cuadrados
respecto a la media de la regresin del error o residuos
/e tal forma que la tabla de anlisis de varianza queda como*
T"*l" de An+li!i! de ,"ri"n-" .
$uente df 11 71 @ 11Bdf $c
Cegresin %
XY
S b SSR
1
REG
MS
71regBs

@71regB71E
Cesidual n?
XY YY
S b SS SSE
1

1

@71E@11EBn?
DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD.
<otal corregido n?%
YY
S
donde*


2
__
2
) ) ( (
i i XY
Y X X S


2
__
2 2
__
) ( X n X X X S
i i XX
6bteni7ndose con el 8initab
Source DF SS 8S F .
1egression 1 &5.5"2 &5.5"2 5%.5& 0.000
1esidual 0rror 2$ 1#.22$ 0.%"2
(otal corrected 2& '$.#1'
El estadstico $ se calcula como $ @ 71ECEE B 1

y se compara con la $ de tablas con #%, n?& grados


de libertad y rea en %FF#%?&G, para determinar si el parmetro % es significativo que es el caso de
$calc. H $tablas.
En este caso $c @ 5!.!I5 B F.>I4 @ !>.5 y $ de tablas $#%, 4, F.I!& es igual a 5.J, por tanto se
rec'aza 6F aceptando que e0iste una ecuacin de regresin.
J
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
El rea de la cola de $c est descrita por el valor de p que debe ser menor o igual al valor de , en
este caso es casi cero.
Inter("lo! de con.i"n-" #"r" 1 0
,
En base al error estndar para los parmetros se tiene*
S
X X n
X
S
X
n
MSE b se
i
i
XX
2 / 1
2
__
2
2
__
0
) (
1
) (
1
1
1
]
1

,
_

XX XX
S
S
S
MSE
b se ) (
1
Del ejemplo9 como s , 0.%"'$ y S

, %15&.&2
0105 . 0
42 . 7154
792 . 0
) (
1
b se
El intervalo de confianza %FF #% ? &G para 0

,
1

, considerando que las observaciones y los


errores siguen un comportamiento normal, es*
, 2ara el coeficiente o se tiene*

,
_

+ t

XX
n a
S
X
n
MSE t
2
__
2 , 2 /
^
0
1

S
X X n
X
n t b
i
i
2 / 1
2
__
2
0
) (
)
2
1
1 , 2 (
1
1
1
]
1

2ara el caso del coeficiente Keta %*


El error estndar es*
I
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
XX
S
MSE
se )

(
1

XX
n a
S
MSE
t
2 , 2 /
^
1
t



t
2
__
1
) (
).
2
1
1 , 2 (
X X
S n t
b
i


Suponiendo , 0.059 t32$90."%54 , 2.0'"9 los l5mites de con/ianza para el
par:metro
1
son!
-0.%"# t 32.0'"430.01054 o sea -0.%"# t 0.021%
y
1
se encuentra en el intervalo 3-0.10159 -0.05#14.
2ara el caso de sigma, si los errores estn distribuidos normalmente y son independientes, la
distribucin del estadstico,
2
/ ) 2 ( MSE n
es C'i?cuadrada con n L grados de libertad y de esta forma*

'


1
) 2 (
2
2 , 2 / 2
2
2 , 2 / 1 n n
MSE n
P
2or consecuencia un intervalo de confianza %FF #% ? & G en

es*
2
2 , 2 / 1
2
2
2 , 2 /
) 2 ( ) 2 (

n n
MSE n MSE n

E!tim"cin del inter("lo #"r" l" medi" de l" re!#ue!t"


3na aplicacin mayor del anlisis de regresin es la estimacin de la media de la respuesta E#,&
para un valor particular de la variable regresora .. El valor esperado de la respuesta , media para
un cierto valor de . @ .F es*
0 1 0
^
0 0
) | ( X b b Y X Y E +
2ara obtener un intervalo de confianza con %FF#% ? &G para el coeficiente % se aplica la frmula
siguiente*
%F
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014

,
_


+ t

xx XX
n a
S
x x
n S
MSE
t Y
2
0
2 , 2 /
^
0
) ( 1

;er gr:/ica anterior del ejemplo.
Prediccin de nue("! o*!er("cione!
Esta es otra de las aplicaciones del modelo de regresin, predecir nuevas observaciones ,
correspondientes a un nivel especfico de la variable regresora .. "a banda de prediccin es ms
anc'a dado que depende tanto del error del modelo de ajuste y el error asociado con observaciones
futuras
)

(
0 0
Y Y
. El intervalo es mnimo en
__
0
X X
y se amplia conforme se incrementa la
diferencia entre
.
__
0
X X
"a variable aleatoria,
0 0

Y Y
Est normalmente distribuida con media cero y varianza*
1
1
]
1

+ +
XX
S
X X
n
V
2
__
0 2
) ( 1
1 ) (
1i se usa 0

Y
para predecir a 0
Y
entonces el error estndar de @ 0
Y
? 0

Y
, es el estadstico
apropiado para establecer un intervalo de prediccin probabilstico, en el caso de un intervalo %FF #%
? & G sobre una observacin futura en 0
X
se tiene*
1
1
]
1

+ + +
1
1
]
1

+ +

XX
n
XX
n
S
X X
n
MSE t Y Y
S
X X
n
MSE t Y
2
__
0
2 , 2 / 0 0
2
__
0
2 , 2 / 0
) ( 1
1

) ( 1
1


#%.%
1e puede generalizar para encontrar un intervalo de prediccin del %FF#%?& porciento para la media
de m observaciones futuras en . @ .o. 1ea ,media la media de las observaciones futuras en . @
.o. El intervalo de prediccin estimado es*
%%
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
1
1
]
1

+ + +
1
1
]
1

+ +

XX
n
XX
n
S
X X
n m
MSE t Y Y
S
X X
n m
MSE t Y
2
__
0
2 , 2 / 0 0
2
__
0
2 , 2 / 0
) ( 1 1

) ( 1 1


Prue*"! de /i#te!i! #"r" l" #endiente e inter!eccin
Prue*" de 0i#te!i! #"r" 0o:1 2 '1 contr" 0':1 '1
Calculando el estadstico t3 considerando que 10

@ F, se tiene*
) (
0
0
b se
b
t
#%.&
2robar la 'iptesis para bF no tiene inters prctico.
+'ora para probar la significancia de b% se tiene*
XX
S
MSE
b
t
1
0

para
) 2 , 2 / ( n
grados de libertad #%.4&
1i 2 , 2 / 0
>
n
t t
se rec'aza la 'iptesis nula, indicando que % es significativo y se tiene regresin
lineal.
Del ejemplo!
60 . 7
0105 . 0
798 . 0
) (
1
1


b se
b
t
+omo
60 . 7 t
e<cede el valor cr5tico de t , 2.0'"9 se rec)aza =o 3o sea el
valor de p >> 0.054 ..or tanto este coe/iciente es signi/icativo.
Es importante notar que el valor de $ @ t.
?a salida del 8initab es como sigue!

Predictor Coef SE Coef T P
+onstant , b0 1$.'2$0 0.5#15 2$.&$ 0.000
+2 , b1 -0.0%"#$ 0.01052 -%.5" 0.000
%
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
In.erenci" !imult"ne" #"r" lo! #"r+metro! del modelo
2ara una estimacin conjunta de KetaF y Keta% en una regin donde estemos seguros con %FF#%?
alfa& porciento de que ambos estimados son correctos es*
2 , 2 ,
1 1
1 1
2
1 1 0 0
2
0 0
2
)

( )

)(

( 2 )

+ +

n
n
i
n
i
i
i
F
MSE
x x n


E!tim"cin !imult"ne" de l" re!#ue!t" medi"
"a estimacin simultanea de la respuesta media es*
Es posible construir m?intervalos de confianza de la respuesta media de un conjunto de m?valores
especficos ., vgr. .%, ., M., .m, que tengan un coeficiente de confianza conjunta de la menos
%FF#%?alfa& porciento.
1e puede utilizar el mdulo t de 1c'eff*
2 , 2 ,

n
u

/onde 2 , 2 , n
u
es el punto de la cola superior alfa de la distribucin del valor m0imo absoluto de
dos variables aleatorias t?student cada una basada en n? grados de libertad. Estos dan intervalos
ms cortos. 2ara el caso de alfa @ F.%F, m@,n@%J se tiene de tablas #+.J&*
101 . 2
18 , 025 . 0 2 ), 2 /(

t t
n m
082 . 2
18 , 2 , 10 . 0 , ,
u u
n m
"a /elta de Koferroni como sigue*
454 . 2 ) 02 . 6 ( ) 2 ( ) 2 (
2 / 1 2 / 1
18 , 2 , 10 . 0
2 / 1
2 , 2 ,


F F
n

,
_


+ t
xx
i
Xi i
S
x x
n
MSE Y X Y E
2
^
) ( 1
) (
Note que los intervalos del m0imo mdulo t son ms angostos que los de Konferroni. 1in embargo
cuando m H los intervalos de m0imo mdulo t se siguen ampliando mientras que los de
Konferroni no dependen de m.
%4
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
Prediccin de nue("! o*!er("cione!
El conjunto de intervalos de prediccin para m nuevas observaciones en los niveles .%, .,M, .m
que tienen un nivel de confianza de al menos #%?alfa& es*

,
_


+ + t
xx
i
Xi x
S
x x
n
MSE Y y
i
2
^
) ( 1
1
&orrel"cin
"as discusiones anteriores de anlisis de regresin 'an asumido que . es una variable controlable
medida con un error despreciable y que , es una variable aleatoria. 7uc'as aplicaciones de anlisis
de regresin involucran situaciones donde tanto X como Y son variables aleatorias y los niveles de .
no pueden ser controlados. En este caso se asume que las observaciones #.i, ,i&, i@%, ,M,n son
variables aleatorias distribuidas conjuntamente. 2or ejemplo suponiendo que se desea establecer la
relacin entre los refrescos vendidos y la temperatura del da. 1e asume que la distribucin conjunta
de , y . es la distribucin normal divariada, que es*

'

1
1
]
1

,
_

,
_

,
_

,
_


2
2
2
2
1
1
2
2
2
2
1
1
2
2 1
2
) 1 ( 2
1
exp
2
1
) , (


x y
p
x y
p
y x f
/onde % y %

corresponden a la media y la varianza de ,, y y

corresponden a la media y la
varianza de . y
2 1
12
2 1
2 1
) )( (

x y E
Es el coeficiente de correlacin entre , y .. % es la covarianzade , y ..
"a distribucin condicional de , para un valor de . es*
1
1
]
1

,
_



2
12
1 0
12
2
1
exp
2
1
) (

x y
x y f
/onde*
2
1
2 1 0

2
1
1

%5
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
) 1 (
2 2
1
12
2

"a correlacin es el grado de asociacin que e0iste las variables . y ,, se indica por el estadstico
cuyo estimador es el coeiciente de correlacin de la muestra r r4%. /onde*
YY XX
XY
S S
S
r
r
S
S
b
XX
YY
2 / 1
1

,
_


3n estadstico ;til es el valor del ajuste de la regresin R
)
, coeficiente de determinacin que se
define como*
r @ r0y @ #signo de b'&C
YY
i
S
SSE
Syy
SSR
Y Y
Y Y
media la para corregido SSTotal
b por regresin la de SS
R

1
) (
) (
) . . . . (
) . . . . . (
2
__
2
__ ^
0 2

Como 1yy es una medida de la variabilidad en , sin considerar el efecto de la variable regresora . y
11E es una medida de la variabilidad en , que queda despus de que se 'a considerado ., C

mide la proporcin de la variacin total respecto a la media que es e0plicada por la regresin. Es
frecuente e0presarla en porcentaje. 2uede tomar valores entre F y %, los valores cercanos a %
implican que la mayora de la variabilidad es e0plicada por el modelo de regresin.
En el ejemplo*
C?1q @ >%.5G C?1q#adj& @ >F.G
1e debe tener cuidado con la interpretacin de C, ya que su magnitud tambin depende del rango
de variabilidad en la variable regresora. Eeneralmente se incrementa conforme se incrementa la
dispersin de . y decrece en caso contrario, de esta forma un valor grande de C puede ser
resultado de un rango de variacin no realista de . o puede ser muy peque)a debido a que el rango
de . fue muy peque)o y para permitir la deteccin de su relacin con ,.
2ara probar la 'iptesis 0F: 2 1 contra 0%: 13 el estadstico apropiado de prueba es*
2
0
1
2
r
n r
t

%!
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
que sigue una distribucin t con n? grados de libertad. 1i 2 , 2 / 0
>
n
t t
se rec'aza la 'iptesis 6o,
indicando que e0iste una correlacin significativa.
.or ejemplo si en un grupo de 25 observaciones se obtiene una r , 0."'&' y
se desea probar las =iptesis!
=o! = 0
=
1
! 0
@sando el estad5stico de prueba to!
55 . 17
9305 . 0 1
2 25 9646 . 0
0

t
como t
0.02592$
,2.0'"9 se rec)aza =o indicando *ue s5 )ay correlacin
signi/icativa entre los datos.
2ara probar la 'iptesis 0F: 2 F contra 0%: F 3 donde F no es cero y 1i n ! se utiliza el
estadstico transformacin?z de $is'er*
r
r
r arctan !

+

1
1
ln
2
1
) (
Con media ) ( arctan
!
y desviacin estndar
3
1
2

n
!

En base a la frmula de la distribucin normal, se calcula el estadstico Oo siguiente para probar la


'iptesis 6o* 2 F,
3 )( ( ) ( (
0 0
n arctan r arctan !

y rec'azar si 2 / 0
! ! >
Pbtenindose

'

+
)
1
1
ln(
2
1
)
1
1
ln(
2
1
) 3 (
0
0 2 / 1

r
r
n "
y el intervalo de confianza #%FF ? &G para est dado por*

,
_

+
,
_

3 3
2 / 2 /
n
!
arctanr tan
n
!
arctanr tan

Del ejemplo anterior9 se puede construir un intervalo de con/ianza del "52


para .
%8
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
Siendo *ue arctan) r , arctan)0."'&' , 2.00#29 se tiene!

,
_

,
_

22
96 . 1
0082 . 2
22
92 . 1
0082 . 2 tan tan
Se simpli/ica a 0."202 0."#&5.
Se re*uiere un an:lisis adicional para determinar si la ecuacin de la
recta es un ajuste adecuado a los datos y si es un buen predictor.

,
_

1
]
1

,
_

,
_


1
1
ln
2
1
3
1
2
1
1
1
ln
2
1
2 / 1
n
"
r
r
#%.44&
6tro ejemplo9 si n,10$9 r,0.59 , 0.05. Se tiene *ue el intervalo de
con/ianza es! 31A24 ln $ t 0.1"' , 31A24lnB31C4A31-4D
.or tanto se encuentra entre 30.$$"9 0.'$24
Rie!o! en el u!o de l" rere!in
6ay varios abusos comunes en el uso de la regresin que deben ser mencionados*
%. "os modelos de regresin son vlidos como ecuaciones de interpolacin sobre el rango de las
variables utilizadas en el modelo. No pueden ser vlidas para e0trapolacin fuera de este rango.
. "a disposicin de los valores . juega un papel importante en el ajuste de mnimos cuadrados.
7ientras que todos los puntos tienen igual peso en la determinacin de la recta, su pendiente
est ms influenciada por los valores e0tremos de .. En este caso debe 'acerse un anlisis
minucioso de estos puntos y en todo caso eliminarlos y re L estimar el modelo. En la figura se
observan dos puntos que influyen en el modelo de ajuste, ya que si se quitaran, el modelo de
lnea recta se modificara.
,
-+
- -
- - - 1in + y K
- - - -
-K
%>
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
.
Fig. 1.$ Dos observaciones con muc)a in/luencia 3E9F4
"os outliers u observaciones malas pueden distorsionar seriamente el ajuste de mnimos cuadrados.
En la figura, la observacin + parece ser un QoutlierR o valor malo ya que cae muy lejos de la lnea de
ajuste de los otros datos. /ebe investigarse esta observacin.
,
-+ -
- - -
- -
- - -
-- -
--
- - -
--
- -
.
Fig. 1.& ?ocalizacin de un GoutlierH 3E4
4. 1i se encuentra que dos variables estn relacionadas fuertemente, no implica que la relacin sea
causal, se debe investigar la relacin causa L efecto entre ellas. 2or ejemplo el n;mero de
enfermos mentales vs. n;mero de licencias recibidas.
(abla 1.1 @na relacin de datos sin sentido
+)o Enfermos mentales "icencias emitidas
%I5 J %,4!F
%I8 I ,>F
%IJ %% ,>4F
%I4F % 4,85>
%I4 %J !,5I>
%I45 F >,F%
%I48 J,%4%
%J
ANALISIS DE REGRESIN LINEAL SIMPLE 24 de mayo de 2014
4. En algunas aplicaciones el valor de la variable regresora . requerida para predecir a , es
desconocida, por ejemplo al tratar de predecir la carga elctrica el da de ma)ana en relacin con
la m0ima temperatura de ma)ana, primero debe estimarse cul es esa temperatura.
%I

S-ar putea să vă placă și