Documente Academic
Documente Profesional
Documente Cultură
CAPTULO
CAPTULO 55
LA HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE
5.1 CONCEPTUACIN
El modelo Clsico de Regresin tuvo su origen en los trabajos de astronoma elaborados por Gauss en el perodo de 1809 a 1821. Actualmente el anlisis de regresin es una
de las ramas de la teora estadstica ms utilizados en investigaciones cientficas. Es una
tcnica adecuada cuando se desea estudiar el comportamiento de una variable (variable
dependiente) en relacin a otras que son responsables de su formacin (variables
independientes).
En Ingeniera de Tasaciones generalmente se considera como variable dependiente,
los precios de contado de los datos de mercado en oferta o efectivamente negociados, y
como variables independientes, las respectivas caractersticas relacionadas con los aspectos fsicos y de localizacin, as como los aspectos econmicos (dato de oferta o
transaccin, poca de ocurrencia del evento, etc.). Se observa que las variables
independientes pueden ser tanto de naturaleza cuantitativa (rea, frente, etc.), como
cualitativa (naturaleza de la informacin, orientacin solar, etc.)
Cuando la variabilidad de los precios puede ser explicada por apenas una variable
independiente, a travs de una funcin lineal, se utiliza el modelo de regresin lineal
simple, que ser tratado en este captulo; pero cuando ms de una variable independiente
es necesaria para esta explicacin, se adopta el modelo de regresin lineal mltiple, que
ser asunto de los prximos tres captulos. Aunque en la prctica, lo ms usual es el
modelo de regresin lineal mltiple, se inicia con el modelo de regresin lineal simple,
debido a las facilidades de entendimiento de las deducciones e interpretaciones. No
obstante, todos los conceptos de regresin lineal simple pueden ser generalizados para el
modelo de regresin lineal mltiple.
El modelo de regresin lineal simple, para explicar la variabilidad de todos los m precios
del mercado (Yi), a travs de las variaciones provocadas por una variable nica (Xi), se
representa por una funcin lineal del tipo 5.1 y por las cinco hiptesis bsicas definidas
ms adelante:
a) Funcin Lineal
Yi = 0 + 1 Xi + i ,
i=1,..,m
(5.1)
INGENIERA D E TASACIONES
101
Donde:
Y1 ,.....,Ym - es llamada la variable dependiente, variable explicada o variable respuesta;
Xi
- es llamada la variable independiente, variable explicativa o covariable;
0, 1
- se denominan parmetros de la poblacin;
i,......., n - son los errores aleatorios del modelo.
b) Hiptesis Bsicas
a
2 ) El nmero de observaciones, m, debe ser superior al nmero de parmetros estimados, o sea, que para el caso de la regresin lineal simple debe ser superior a dos;
a
3 ) Los errores de las variables aleatorias tienen valor esperado nulo y varianza cons2
tante, o sea, E ( i) = 0 y Var ( i) = , respectivamente;
a
i=1,...,m
(5.2)
Como no es viable el levantamiento de todos los datos del mercado de una poblacin,
en la prctica se trabaja con un subconjunto de n elementos de esta poblacin, denominada
muestra, a travs de la cual, utilizando inferencia estadstica se estiman los parmetros de
la poblacin. La ecuacin del modelo inferido esta dada por:
Yi =b0 +b1 Xi + ei
i=1,...,n
(5.3)
Donde:
Y1 ,.....,Yn - son los precios observados en el mercado, correspondientes a la muestra
recolectada;
b0 , b1
- son los parametros estimados correspondientes a 0 , 1;
ei ,..., en - son los respectivos estimadores de i, ... ,n, denominados tambin resduos
del modelo.
102
Una estimacin del valor medio del mercado est dada por
= b0 +b1 Xi
i = 1,...,n
(5.4)
Poblacin Yi = 0 + 1 Xi + i
Muestra Yi = b0 + bi Xi + ei
recta 2
recta 1
X i (independiente)
Figura 5.1 Recta 1 ( media de la poblacin ) y Recta 2 ( media de la muestra )
$
Y
i
Cabe destacar que con la recta 1 se obtiene una estimacin del verdadero
comportamiento del mercado, que sera lo obtenido si se levantara toda la poblacin. En
la prctica este comportamiento se infiere con la recta 2.
Un caso particular del modelo de regresin lineal simple es el modelo nulo. Este modelo posee apenas un parmetro. Su representacin grfica esta dada por una recta
horizontal. En la prctica, esto significa que no existe ninguna variable explicativa sobre
la formacin de los precios, pudiendo estimarse el valor de mercado apenas por la media
general, y el modelo esta dado por:
Y i = 0 + i ,
i=1,..,m
(5.5)
103
Yi
Yi
Xi
Yi
Xi
Yi
Xi
Xi
Este analisis inicial es fundamental para formular un modelo aceptable para explicar
el mercado inmobiliario. La curva que pasa ms prxima a los puntos es llamada la curva
de regresin. As que al plotear los puntos en un papel milimetrado, como en la fig. 5.6 se
encuentra esta curva con bastante aproximacin, como por ejemplo la recta de la fig. 5.7.
Vu (R$/m2)
Vu (R$/m2)
50
40
50
30
40
1
Figura 5.6
30
5 d(km)
1
Figura 5.7
5 d(km)
Obsrvese que sin necesidad de usar equipos o sistema para el tratamiento de los
datos, el tasador al trazar esta recta, esta estimando un modelo de regresin con una
buena aproximacin y podra, a partir de ah, usar el modelo para estimar el valor medio
para terrenos que estuviesen una distancia entre 1 y 5 Km. del polo valorizante. Fuera de
este intervalo no hay seguridad en cuanto al comportamiento de los precios, no siendo
permitida la extrapolacin. El modelo de regresin es intrnsecamente interpolativo. As,
si se desease estimar el valor para un terreno que estuviese a 3 Km. de distancia del polo,
bastara con buscar el precio medio correspondiente en la figura 5.7 y encontrar como
resultado R$40/m2.
Es muy importante que el tasador comprenda lo que est haciendo cuando ajusta un
modelo de regresin, siendo el anlisis grfico una de las herramientas mas simple y ms
potentes del modelaje.
Muchas otras situaciones interesantes pueden ocurrir. Algunas sern presentadas en
esta seccin y otras a lo largo del libro.
Considerando el mismo ejemplo, puede ocurrir una distribucin de los datos como se
muestra en la figura 5.8. En este caso se puede considerar una sola recta para explicar el
fenmeno, como en la figura 5.9, mas no habra seguridad en cuanto al comportamiento
del mercado para distancias en el intervalo entre b y c. Utilizar el modelo en este intervalo
es equivalente a hacer una extrapolacin interna, o mejor una intrapolacin.
Yi
Yi
a
Figura 5.8
Xki
a
Figura 5.9
INGENIERA D E TASACIONES
Xki
105
Otro caso bastante interesante, que puede llevar al tasador a cometer errores graves
se presenta en la figura 5.10. La recta de regresin (recta 1) pasa por la media del
conjunto y por un punto aislado como se muestra en la figura 5.11.
Yi
Yi
Recta 1
Recta 2
Xi
Figura 5.10
Xi
Figura 5.11
Obsrvese que el comportamiento del mercado mostrado en la figura 5.10 sera explicado por la recta 2 de la figura 5.11, pero debido a un punto discrepante, la recta est
distorsionada, invirtiendo la tendencia del mercado. Los puntos de este tipo o el mismo
conjunto de puntos son denominados puntos influyentes y son bastante peligrosos. Los
mismos pueden ser detectados fcilmente con un anlisis grfico.
En el caso de los puntos de la figura 5.12 se verifica que no hay informacin suficiente
para utilizar el modelo fuera del intervalo [a;b], pues estos tres puntos que no pertenecen
a [a;b] son determinantes en la inclinacin de la recta mucho mas que los que pertenecen
al conjunto formado por el grueso de los datos. Obsrvese que si los tres puntos estuvieran
como los de la figura 5.13, el comportamiento del mercado estara completamente
desvirtuado. Este es un caso tpico de desequilibrio de la muestra. El pequeo conjunto de
puntos no es suficiente para explicar por s solo su tendencia. Tambin son puntos
influyentes.
Yi
Yi
Figura 5.12
Xi
Xi
Figura 5.13
figura 5.15. Este caso sera resuelto con la inclusin de una variable dummy en el modelo, asunto que ser tratado en el captulo 7.
Yi
Yi
Recta 1
Recta 3
Recta 2
Xi
Figura 5.14
Xi
Figura 5.15
Una disposicin de los puntos como se muestra en la figura 5.16 es un caso tpico de
interaccin entre una varible dummy y la distancia a un polo valorizante, como por ejemplo,
los datos de oferta y las transacciones decrecen de forma diferenciada a medida que se
alejan del polo. En este caso, el mercado sera explicado a travs de dos rectas no paralelas como las mostradas en la figura 5.17. Este asunto tambin ser tratado en el captulo 7.
Yi
Yi
Xi
Figura 5.16
Xi
Figura 5.17
5.3 LINEALIZACIN
El proceso de regresin lineal simple se aplica para ajustar rectas a los puntos observados en el mercado. De esta forma, la recta solamente tendr significado para explicar
el fenmeno si la tendencia de los puntos fuese lineal. En general, en la prctica, no
siempre se observa este tipo de tendencia. Sin embargo, algunos modelos no lineales
pueden ser linealizados por la simple transformacin de escalas de medicin de las variables. Considrese, por ejemplo, que los datos resumidos en la figura 5.18 son el resultado
de una recoleccin de datos de terrenos, donde los puntos ploteados corresponden a
precios unitarios de mercado (P) versus las respectivas reas (A). Observe que hay una
tendencia de decrecimiento de los precios unitarios con las reas, de forma hiperblica.
En este caso, el ajuste de una recta a los puntos, como se muestra en la figura 5.18, sera
inadecuado, pues slo se pueden ajustar rectas a datos dispuestos con tendencia a la
INGENIERA D E TASACIONES
107
linealidad.
1
_
z= p
z=1/P
Figura 5.18
Figura 5.19
Por ello, se hace necesario alguna transformacin para hacer posible la utilizacin de la
regresin lineal, esto es, una transformacin que linealice los datos. La solucin para el problema enunciado es utilizar una transformacin inversa, Z= 1/P, en los datos de la figura 5.18
resulta en puntos con tendencia lineal como los de la figura 5.19. As los datos con tendencia lineal seran modificados para una tendencia hiperblica, cuando se realiza una
inversin de la escala de las ordenadas, la reciproca tambin es verdadera. De esa forma
se hace la regresin de Z sobre A y se obtiene la ecuacin:
Z = bo + b1 . A
(5.6)
1
= bo + b1 . A
P
P=
(5.7)
y=
x
ax b
(5.8)
1
b
=a
y
x
(5.9)
b<0
b>0
1/a
1/a
b/a
Figura 5.20
Figura 5.21
y = a e bx
(5.10)
Ln y = Ln a + bx
y El
b<0
aeb
a
Figura 5.22
Figura 5.23
109
y = a xb
(5.12)
Ln y = Ln a + b Ln x
El comportamiento
b > 1 grfico de 5.12 se puede visualizar en las figuras 5.24 y 5.25.
y
y
b=1
0<b<1
a
-1 < b < 0
b = -1
b < -1
Figura 5.24
Figura 5.25
dy/y
dx/x
(5.14)
(5.15)
c) se define una funcin U formada por la sumatoria de los cuadrados de los errores,
para una muestra de tamao n, dada por:
U=
E 2i
U=
i= 1
(Yi Yi ) 2
(5.16)
i =1
Observe que la sumatoria de los errores Ei es nula para la curva que pasa ms prxima a los puntos, puesto que los errores positivos se anulan con los negativos. As se
tienen dos caminos para cuantificar estas distancias: la sumatoria de los mdulos o por la
sumatoria de los cuadrados. La segunda solucin es ms fcil de ser tratada
matemticamente. Cuando se utiliza la minimizacin de los cuadrados de los errores, el
mtodo de estimacin se denomina mtodo de los mnimos cuadrados.
^
d) se deriva una funcin U en relacin a cada parmetro desconocido de la funcin Y
i
y cada resultado se iguala a cero, obtenindose un sistema de ecuaciones cuyo numero
es igual al de los parmetros a ser estimados. La solucin del sistema suministra los
estimados que se buscan.
A continuacin se presenta la metodologa citada para estimar los parmetros de los
modelos nulo y de regresin lineal simple.
5.4.1 MODELO NULO
La estimacin se inicia por el modelo ms simple, no obstante el razonamiento se
puede generalizar para los modelos ms complejos. El modelo nulo esta dado por:
^ + e , con Y
^ =b
Yi = Y
i
i
i
o
(5.17)
INGENIERA D E TASACIONES
111
Yi = bo
X ki
Figura 5.26
^ =
El estimador bo se obtiene considerando una recta horizontal cualquiera dada por Y
i
Bo, donde la sumatoria de los cuadrados de los errores esta dada por:
n
U = (Yi Yi ) 2
i =1
U=
(Yi
i= 1
Bo ) 2
(5.18)
i=l
i=l
dU / dBo = 2 (Yi Bo ) = 2 ( Yi Bo . n)
(5.19)
Igualando dU/dBo a cero, se impone la condicin de mnimo a la funcin (5.19), que coincide con el modelo 5.17. As, Bo que antes era una variable, se transforma en una constante
bo, una vez que el sistema nos da la solucin buscada, como se demuestra a continuacin:
n
n
=
Y
=
si dU/dBo = 0, entonces n . bo i , bo Yi /n, o an bo = Y
i= 1
i= 1
O sea, que en una poblacin de datos homogneos, el valor del mercado se estima por
la media aritmtica de los datos muestrales.
Se observa que en el momento en que se impone la condicin de mnimo a la funcin
5.18, se encuentra el estimador del parmetro desconocido representado por bo.
La comprobacin de la condicin de mnimo de la funcin se verifica observando el
resultado de la segundo derivada:
dU/dBo = -2. (- Bo) = 2n > 0
(5.20)
El valor medio ajustado para una funcin lineal corresponde a una ecuacin del tipo
^ =b +b .X
Y
i
o
1
i
112
(5.21)
Yi
^ =b +b .X
Y
i
o
1
i
Figura 5.27
Xi
En este caso la funcin que mide la sumatoria de todas las distancias entre cada
precio observado (Yi) y el correspondiente precio ajustado, calculado por una recta
^ = B + B .X est dada por:
cualquiera Y
i
o
1
i
(5.22)
Para que en esta funcin alcance su punto mnimo, se hace necesario inicialmente que
las derivadas parciales en relacin a cada parmetro sean iguales a cero, o U/Bo = 0 y
U/B1 = 0, o sea,
U=
i= 1
= 2 ( Bo + B1 Xi - Yi)
(5.23)
bo . n + b1 . Xi = Yi;
bo . Xi + b1 . Xi = Xi . Yi;
(5.24)
n
i=1
La solucin del sistema 5.24 nos da los estimadores de los parmetros poblacionales
correspondientes; de esta forma el modelo deseado tendr la siguiente ecuacin:
Yi = bo + b1. Xi + ei
(5.25)
(5.26)
INGENIERA D E TASACIONES
113
(5.27)
TERCERA HIPTESIS:
Los errores son variables aleatorias con valor esperado cero y varianza constante.
El primer aspecto de esta hiptesis es de difcil verificacin, sin embargo, as sea el
valor esperado del error aleatorio igual a una constante, esto puede ser absorbida por el
coeficiente bo del modelo, sin provocar tendenciosidad en los dems coeficientes que son
los ms importantes en el anlisis de regresin.
Para la verificacin del aspecto de varianza constante del error, existen varios mtodos
analticos que pueden ser encontrados en Kmenta (1978). A travs de un anlisis grfico
de los residuos se puede verificar con facilidad esta hiptesis.
Un grfico de resduos (ei) versus los valores ajustados por el modelo de regresin
^ ), presenta puntos distribuidos
(Y
aleatoriamente en torno a una recta horizontal que pasa
i
por el origen, sin ningn patrn definido, como la forma de la figura 5.28, es un indicador
favorable a la aceptacin de la hiptesis de varianza constante por los errores; en caso
contrario, si los puntos presentan una tendencia, como los datos de la figura 5.29, se
puede concluir que la varianza del error no es constante. En el primer caso, se dice que el
modelo es homocedstico y en el segundo, heterocedstico.
ei
ei
Figura 5.28
^
Yi
^
Yi
Figura 5.29
115
d=
(e i e i 1 )
i=2
2
ei
(5.28)
i =1
donde e i es el i-esimo residuo del modelo, ordenado de manera creciente con relacin a
los valores ajustados, considerando una muestra de tamao n.
Para n grande se demuestra que d= 2 ( 1 - r ), donde r es el coeficiente de correlacin
entre e i y e i - 1 .
As cuando r = -1 los residuos ei y ei - 1 estn perfectamente correlacionados negati116
Regin no concluyente
Regin de no auto-regresin
d
Regin auto-regresin
Positiva
dL
dU
Figura 5.30
(4-dL) (4-dU)
Regin auto-regresin
N egativa
Se puede demostrar con facilidad (Kmenta-1978) que cuando las perturbaciones son
autoregresivas, los estimadores de mnimos cuadrados tambin son no tendenciosos y
consistentes, pero no son ms eficientes, ni menos asintoticamente.
117
Solucin:
o
1 ) Se encuentra en la tabla I.5, apndice I, los puntos crticos tabulados por DurbinWatson, que estn en la primera columna y la linea 25, o sea,
dL = 1,29
dU = 1,45
dU
1,29
auto-reg.
positiva
4- dU
1,45
no
concluyente
4 - dL
2,55
no auto-regreson
2,71
no
concluyente
auto-reg.
negativa
3 ) Verificar en cual regin se encuentra el valor d = 2,2. Como d est entre 1,45 y 2,55, se
puede concluir que no existe auto-regresin en los residuos al nivel de significancia del 5%.
5.6 PUNTOS ATPICOS
Adems de las cinco hiptesis bsicas es importante verificar si hay presencia de
outliers o puntos influyentes, toda vez que los estimadores de mnimos cuadrados no son
robustos cuando puntos de esta naturaleza contribuyen a su ajuste. En este caso, el
modelo no se ajusta bien ni al grueso de los datos, ni a los datos con un punto atpico.
Un punto atpico debe ser analizado aparte con bastante cuidado, pues puede haber
sido ocasionado por errores de medida, o por algn cambio en el comportamiento de la
muestra. Es aconsejable que se haga otro ajuste excluyndolos y comparando el nuevo
modelo con el anterior, obtenindose de esta forma informaciones respecto a sus influencias
sobre los parmetros estimados y tambin sobre el poder de explicacin de la ecuacin
de regresin.
5.6.1 OUTLIER
Se entiende por outlier un dato que tiene un residuo grande en relacin a los dems
que componen la muestra.
Estos puntos pueden ser detectados con facilidad a travs de un anlisis grfico de los
*
residuos estandarizados e i versus los valores ajustados correspondientes Y$ i . Por
ejemplo, para puntos dispuestos como los de la figura 5.31, aquellos destacados pueden
ser caracterizados como outliers.
Obsrvese el hecho de que el punto se presenta con un residuo estandarizado superior
a 2, no implica necesariamente que se trata de un outlier. Esta indicacin en la figura es
importante para detectar una informacin respecto a la normalidad de los residuos, pues
( )
118
( )
ei
Outlier
+2
^
Yi
0
-2
Outlier
FIGURA 5.31
cuando los datos presentan estas caractersticas, 95% de sus residuos estandarizados
estn entre -1,96 y +1,96, esto es, aproximadamente entre -2 y +2. As, si la mayora de
los puntos estn entre estos limites existen indicios favorables de normalidad. Pero puede
ocurrir que una muestra con dispersin grande, con varios residuos estandarizados fuera
del intervalo [-2;+2], sin que existan puntos aparentes discrepantes, como por ejemplo los
indicados en la figura 5.32. En este caso que se puede inferir que los datos provienen muy
probablemente de una distribucin Gama. En caso inverso puede ser aquel de una muestra
que presenta subdispersin , como los puntos dispuestos en la figura 5.33. Observe que
todos los puntos estn en el intervalo [-2;+2], pero existe un punto discrepante en relacin
a la masa de datos. En un caso como este es probable que los datos provengan de una
poblacin con distribucin binomial. De esta forma, se verifica que es un procedimiento
peligroso considerar puntos outliers que apenas se presentan con residuos estandarizados
fuera de los limites -2 y +2 como hacen algunos sistemas disponibles en el mercado. De
aqu se ve una vez mas la importancia del anlisis grfico de los residuos. El ajuste de los
datos con distribuciones diferentes a la normal, como Gama, Binomial, Poisson y otras,
solo es posible a travs de modelos lineales generalizados, asunto que ser tratado en el
captulo 8.
ei
+2
+1
0
-2
+2
+1
^
Yi
-1
ei
-1
^
Yi
Figura 5.32
-2
Figura 5.33
Se entienden por puntos influyentes aquellos con pequeos residuos, en algunas veces
hasta nulos, que se distancian de la masa de datos, pudiendo alterar completamente las
tendencias naturales indicadas por el mercado.
INGENIERA D E TASACIONES
119
Existen varios criterios estadsticos para detectar estos puntos, como el de Cook,
presentado en la seccin 8.9, pero con un simple anlisis del comportamiento grfico de
la variable dependiente o de los residuos en relacin a cada variable independiente se
puede verificar el problema. En la figura 5.34, por ejemplo, un punto con caractersticas
como el sealado indica la presencia de un punto influyente. En este caso un punto tiene
residuo cero, como se puede observar en la figura 5.35 y parece ser bien ajustado, pero
degenera completamente el modelo. Mientras que la tendencia del mercado es la indicada por la recta 1 de la figura 5.34, el punto influyente modifica la tendencia para la
situacin de la recta 2 de la misma figura.
Recta 2
Yi
ei
Recta 1
^
Yi
Xi
Figura 5.34
Figura 5.35
(X i - X)(Yi - Y)
(X i - X) 2 . (Yi Y) 2
(5.29)
Correlacin
nula
dbil
media
fuerte
fortsima
perfecta
(5.30)
se =
(Y
Yi
(5.31)
n p
(Y
Yi
n2
(5.32)
121
porque las estimaciones son mas precisas. Otra informacin importante es que cada
variable includa en el modelo genera una reduccin en la varianza residual. Si la reduccin
fue significativa, hay indicios de que la variable es importante para explicar mejor la
variabilidad de los precios, en caso contrario, la variable no debe ser includa.
5.10 PRUEBA DE SIGNIFICANCIA DE LOS PARMETROS
La significancia individual de un parmetro j se mide a travs de una prueba t aislada.
La hiptesis a ser probada es:
(5.33)
Probar la hiptesis 5.33 para un parmetro 1, corresponde a una variable X1, es
semejante a probar:
t *j =
b j j
s( bj)
(5.34)
(5.35)
*
t
I
Rechaza Ho
Acepta Ho
;( n 2 )
2
Rechaza Ho
Figura 5.36
La norma para tasacin de inmuebles urbanos NB-502/89, de la ABNT, exige para esta
prueba una significancia mxima de 5% en las tasaciones de precisin rigurosa y 10% en la
rigurosa especial.
Para el caso de la Regresin Lineal Simple, el s(bj) es calculado por la expresin:
s( bj) = se
t
2
(Xi
X)
, donde se =
(Yi Y$ i ) 2
n 2
(5.36)
;( n 2 )
2
Aplicacin 5.2
123
(0,975; 19)
H 0 : 1 = 0, contra
H 1: 1 0
(5.38)
^
Yi- Yi
^
Y i = bo + b1 .xi
^Y
^ _
Y i-Y
_
Y
xi
xi
Figura 5.37
a la recta horizontal Y, puede ser expresada por una parte correspondiente a la variacin
^ ), ms la
de este punto (Yi) con relacin a su valor ajustado sobre la recta inclinada (Y
i
^
variacin existente entre el punto ajustado sobre la recta inclinada (Yi) y la recta horizon
tal (Y). As, la variacin total (Yi - Y) es igual a una variacin explicada por la recta de
^ ), es
^ - Y) ms una variacin no explicada por la recta de regresin (Y - Y
regresin (Y
i
i
i
decir, para un punto i se tiene:
^ - Y)
^)
+ (Yi - Y
(Yi - Y) = ( Y
i
i
124
(5.39)
2
^ -Y)
^ ) 2.
Se demuestra (Kmenta - 1978) que (Y i - Y) 2 = (Y
+ (Y i - Y
i
i
Considerndose un modelo de regresin lineal simple ajustado a una muestra de n datos,
se encuentran los siguientes grados de libertad para cada una de las sumatorias:
2
$ i))22Y )2 (n 2)
Y
(Y$
i (Y
i
F =
Con esto se puede hacer una tabla de anlisis de varianza, tambin conocida como
n 1 12tabla
2
1como se demuestra en la tabla 5.1. Un caso ms general se presentar en
Y YANOVA,
i
la seccin 6.5.1.
No explicada (error)
2
^ -Y)
SQR = (Y
i
^ )2
SQE = (Y - Y
Total
Explicada (modelo)
Grados de
libertad
n 2
2
^ -Y)
V exp = (Y
/1
i
^ )2/(n-2)
Vn exp = (Y - Y
n-1
Varianza
Observe en la figura 5.37, que la situacin ideal sera aquella donde la varianza explicada
fuese grande y la no explicada pequea. As, para probar la significancia global del modelo, se analiza la razn entre las dos varianzas por el estadstico:
(5.40)
INGENIERA D E TASACIONES
125
que presentar un resultado un tanto mayor cuanto mayor sea la probabilidad del modelo
de ser aceptado para explicar el fenmeno en estudio.
Se demuestra que Fc, bajo la hiptesis H0, tiene distribucin de Snedecor con 1 grado de
libertad en el numerador y (n-2) en el denominador. Esta distribucin fue tabulada por Fisher.
Los puntos crticos para un nivel de significancia es simbolizado por F(; 1 ; n - 2 ). Estos puntos
estn en las tablas 13 y 14 del apndice I para los nveles de 5% y 1%, donde el nmero
de grados de libertad del numerador se indica en la columna y el nmero de grados de
libertad del denominador se indica en la lnea, donde se localiza el punto crtico
correspondiente.
As para rechazar la hiptesis nula de no haber regresin al nivel , es necesario que
Fc sea superior a F(; 1 ; n - 2 ); en caso contrario, hay indicios de que la recta inclinada no
explica mejor el fenmeno que la recta horizontal, debiendo ser sta ltima la escogida.
La prueba es unicaudal y puede ser observada a travs de la figura 5.38.
aceptacin de Ho
F; 1 ; ( n - 2 ) rechazo de Ho
Figura 5.38
La norma para tasacin de inmuebles urbanos NB-502/89, de la ABNT, exige que sea
probada la hiptesis de anlisis de varianza a un nivel de significancia mxima de 5% en
las tasaciones de precisin rigurosa y 1% en la rigurosa especial.
Aplicacin 5.3
Considerndose los datos de la aplicacin 5.2, y sabindose que la varianza explicada
por el modelo es 16 y la no explicada es igual a 40, se pide probar la significancia del
modelo al nivel del 1%.
Solucin:
1o) Calcular el Fc por la ecuacin (5.40),
Fc =
$ Y ) 2 ( n 2)
(Y
i
$ )2
1
(Yi Y
i
Fc =
126
16 ( 21 2)
= 7,6
40
1
$
5.12 INTERVALO DE CONFIANZA PARA Y
i
El intervalo de confianza a un nivel de (1- ), en torno de un punto (Xo ;Yo), sobre la
recta de regresin, es calculado por
^ t
. s( Y0 )
I =Y
o
1-/2 ; (n - 2)
(5.41)
$ )2
( Yi Y
i
n 2
1 ( Xo X ) 2 donde s =
+
e
n ( X i X) 2
^ t
I =Y
. se .
o
1-/2 ; (n - 2 )
(5.42)
^ ^
Y = b0 + b1 .Xi
^
Ym a
^
Y
^
Y mi
x
Figura 5.39
INGENIERA D E TASACIONES
127
$ o t 90 ; 19 . s( Y0 )
I= Y
Entrando en la tabla 12, del apndice I, se encuentra t 90 ; 19 = 1,33. Sustituyendo los
resultados, se tiene
I = 800 1,33 . 100 I = 800 133
As se encuentra para el intervalo, un lmite inferior de R$ 667,00/m2 y un lmite
superior de R$ 933,00/m2. Esto es, hay una probabilidad del 80% que el valor de mercado
est entre esos lmites del intrvalo de confianza.
5.13 EJERCICIOS PROPUESTOS
5.13.1 Se propone un ejercicio bastante sencillo, que debe ser resuelto sin necesidad de
utilizar ningn sistema de tratamiento de datos. Su resolucin es fundamental para entender el desarrollo de los dems asuntos abordados en los captulos siguientes.
128
distancia
(km)
1
2
3
4
5
0
1
1
2
1
precio
unitario
2
(R$/m )
3
2
1
1
3
tomndose como variable dependiente el precio unitario en R$/m2 de rea privada (V) y
como variable independiente la edad (I). El modelo escogido fue el exponencial que
present los siguientes resultados:
a) b0 = 7 y b1 = 0,02 (0,005), que representan: los trminos independiente y el estimador
del parmetro correspondiente a la covariable edad, estando la desviacin estndar
correspondiente dentro de los parntesis;
b) Coeficiente de correlacin entre V e I igual a - 0,95
c) Fc =25
d) Desviacin estndar del modelo igual a 0,30;
INGENIERA D E TASACIONES
129
^
Yi
130