Cap5 Dantas

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE
CAPTULO
CAPTULO 55
LA HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE
5.1 CONCEPTUACIN
El modelo Clsico de Regresin tuvo su origen en los trabajos de astronoma elaborados por Gauss en el perodo de 1809 a 1821. Actualmente el anlisis de regresin es una
de las ramas de la teora estadstica ms utilizados en investigaciones cientficas. Es una
tcnica adecuada cuando se desea estudiar el comportamiento de una variable (variable
dependiente) en relacin a otras que son responsables de su formacin (variables
independientes).
En Ingeniera de Tasaciones generalmente se considera como variable dependiente,
los precios de contado de los datos de mercado en oferta o efectivamente negociados, y
como variables independientes, las respectivas caractersticas relacionadas con los aspectos fsicos y de localizacin, as como los aspectos econmicos (dato de oferta o
transaccin, poca de ocurrencia del evento, etc.). Se observa que las variables
independientes pueden ser tanto de naturaleza cuantitativa (rea, frente, etc.), como
cualitativa (naturaleza de la informacin, orientacin solar, etc.)
Cuando la variabilidad de los precios puede ser explicada por apenas una variable
independiente, a travs de una funcin lineal, se utiliza el modelo de regresin lineal
simple, que ser tratado en este captulo; pero cuando ms de una variable independiente
es necesaria para esta explicacin, se adopta el modelo de regresin lineal mltiple, que
ser asunto de los prximos tres captulos. Aunque en la prctica, lo ms usual es el
modelo de regresin lineal mltiple, se inicia con el modelo de regresin lineal simple,
debido a las facilidades de entendimiento de las deducciones e interpretaciones. No
obstante, todos los conceptos de regresin lineal simple pueden ser generalizados para el
modelo de regresin lineal mltiple.
El modelo de regresin lineal simple, para explicar la variabilidad de todos los m precios
del mercado (Yi), a travs de las variaciones provocadas por una variable nica (Xi), se
representa por una funcin lineal del tipo 5.1 y por las cinco hiptesis bsicas definidas
ms adelante:
a) Funcin Lineal
Yi = 0 + 1 Xi + i ,
i=1,..,m
(5.1)
INGENIERA D E TASACIONES
101
Donde:
Y1 ,.....,Ym - es llamada la variable dependiente, variable explicada o variable respuesta;
Xi
- es llamada la variable independiente, variable explicativa o covariable;
0, 1
- se denominan parmetros de la poblacin;
i,......., n - son los errores aleatorios del modelo.
b) Hiptesis Bsicas
a
1 ) La variable independiente debe ser representada por nmeros reales que no

contengan ninguna perturbacin aleatoria;
a
2 ) El nmero de observaciones, m, debe ser superior al nmero de parmetros estimados, o sea, que para el caso de la regresin lineal simple debe ser superior a dos;
a
3 ) Los errores de las variables aleatorias tienen valor esperado nulo y varianza cons2
tante, o sea, E ( i) = 0 y Var ( i) = , respectivamente;
a
4 ) Los errores son variables aleatorias con distribucin normal.

a
5 ) Los errores no estn correlacionados, son independientes bajo la condicin de

normalidad.
Los valores medios de mercado para cada nivel de Xi son calculados por el componente sistemtico del modelo 5.1, que se representa por:
^ = + X
Y
i
0
1 i
i=1,...,m
(5.2)
Como no es viable el levantamiento de todos los datos del mercado de una poblacin,
en la prctica se trabaja con un subconjunto de n elementos de esta poblacin, denominada
muestra, a travs de la cual, utilizando inferencia estadstica se estiman los parmetros de
la poblacin. La ecuacin del modelo inferido esta dada por:
Yi =b0 +b1 Xi + ei
i=1,...,n
(5.3)
Donde:
Y1 ,.....,Yn - son los precios observados en el mercado, correspondientes a la muestra
recolectada;
b0 , b1
- son los parametros estimados correspondientes a 0 , 1;
ei ,..., en - son los respectivos estimadores de i, ... ,n, denominados tambin resduos
del modelo.
102
R UBENS ALVES DANTAS
Una estimacin del valor medio del mercado est dada por
= b0 +b1 Xi
i = 1,...,n
(5.4)
En un grfico formado por pares de puntos observados en el mercado (Xi;Yi), dispuestos

en ejes cartesianos, donde Yi corresponde a los precios praticados y Xi a una caracterstica que vara en cada uno de estos datos, la parte explicada del modelo de regresin
lineal se representa por la recta que pasa ms prxima a todos los puntos, conocida
tambin como la recta de regresin, como se muestra en la figura 5.1.
Y i (dependiente)
Poblacin Yi = 0 + 1 Xi + i
Muestra Yi = b0 + bi Xi + ei
recta 2
recta 1
X i (independiente)
Figura 5.1 Recta 1 ( media de la poblacin ) y Recta 2 ( media de la muestra )
$
Y
i
Cabe destacar que con la recta 1 se obtiene una estimacin del verdadero
comportamiento del mercado, que sera lo obtenido si se levantara toda la poblacin. En
la prctica este comportamiento se infiere con la recta 2.
Un caso particular del modelo de regresin lineal simple es el modelo nulo. Este modelo posee apenas un parmetro. Su representacin grfica esta dada por una recta
horizontal. En la prctica, esto significa que no existe ninguna variable explicativa sobre
la formacin de los precios, pudiendo estimarse el valor de mercado apenas por la media
general, y el modelo esta dado por:
Y i = 0 + i ,
i=1,..,m
(5.5)
5.2 DIAGRAMA DE DISPERSIN

El primer paso para analizar el comportamiento de los precios en relacin a una determinada variable influyente determinada, es analizar el grfico de dispersin. Por ejemplo,
suponga que en una tasacin se desea analizar el comportamiento de los precios unitarios
de lotes en relacin a la distancia a un determinado polo valorizante, pudiendo ocurrir
cuatro casos distintos, presentados en las figuras 5.2, 5.3, 5.4 y 5.5.
103
Yi
Yi
Figura 5.2 Caso 1
Xi
Yi
Figura 5.3 Caso 2
Xi
Yi
Figura 5.4 Caso 3
Xi
Figura 5.5 Caso 4
Xi
De acuerdo al comentario en la seccin 2.2.4.2, por la simple observacin grfica se

pueden detectar cuatro informaciones muy importantes de los datos: la tendencia, la
intensidad, la forma funcional de la curva, y la dispersin de los datos.
En los casos presentados en las figuras 5.2, 5.3 y 5.4 se verifica una tendencia de
decrecimiento del valor unitario a medida que el lote se aleja del polo valorizante. Esto
que parece bastante trivial, es muy importante para comprobar la creencia a priori que el
tasador tiene sobre el comportamiento del mercado. En los puntos de la figura 5.5 no se
puede extraer la misma conclusin. En este caso el mercado esta indicando, aparentemente, que el polo no ejerce ninguna influencia sobre la formacin de los precios. La
inclinacin de la recta indica la intensidad con que la variable independiente influye sobre
la variable dependiente.
En cuanto a la forma de la curva se verifica que los puntos dispuestos en las figuras
5.2, 5.4 y 5.5 presentan caractersticas de linealidad, mientras que los de la figura 5.3
indican un comportamiento exponencial. Esto es fundamental para el tasador, pues en los
casos 1, 3 y 4 se pueden ajustar los datos a una recta, utilizando regresin lineal, pero en
el caso 2 eso no es posible, sino se procede a la debida transformacin para linealizar los
datos.
Por ltimo, una cuarta informacin de bastante inters en cuanto a la dispersin de los
datos a lo largo de la curva que mejor se ajusta a los datos. Se verifica en los casos 1, 2,
y 4 que la dispersin es aparentemente constante, o sea, aparenta homocedasticidad o
varianza constante de los errores; en cuanto al caso 3, la varianza de los datos es creciente
a medida que se aleja del polo valorizante, presentndose condiciones de heterocedasticidad.
En captulos posteriores ser mostrado que los modelos ideales son aquellos que presentan condiciones favorables de linealidad, homocedasticidad y con intensidad alta, esto
es, rectas distantes de la recta horizontal, adems de otras cualidades.
104
Este analisis inicial es fundamental para formular un modelo aceptable para explicar
el mercado inmobiliario. La curva que pasa ms prxima a los puntos es llamada la curva
de regresin. As que al plotear los puntos en un papel milimetrado, como en la fig. 5.6 se
encuentra esta curva con bastante aproximacin, como por ejemplo la recta de la fig. 5.7.
Vu (R$/m2)
Vu (R$/m2)
50
40
50
30
40
1
Figura 5.6
30
5 d(km)
1
Figura 5.7
5 d(km)
Obsrvese que sin necesidad de usar equipos o sistema para el tratamiento de los
datos, el tasador al trazar esta recta, esta estimando un modelo de regresin con una
buena aproximacin y podra, a partir de ah, usar el modelo para estimar el valor medio
para terrenos que estuviesen una distancia entre 1 y 5 Km. del polo valorizante. Fuera de
este intervalo no hay seguridad en cuanto al comportamiento de los precios, no siendo
permitida la extrapolacin. El modelo de regresin es intrnsecamente interpolativo. As,
si se desease estimar el valor para un terreno que estuviese a 3 Km. de distancia del polo,
bastara con buscar el precio medio correspondiente en la figura 5.7 y encontrar como
resultado R$40/m2.
Es muy importante que el tasador comprenda lo que est haciendo cuando ajusta un
modelo de regresin, siendo el anlisis grfico una de las herramientas mas simple y ms
potentes del modelaje.
Muchas otras situaciones interesantes pueden ocurrir. Algunas sern presentadas en
esta seccin y otras a lo largo del libro.
Considerando el mismo ejemplo, puede ocurrir una distribucin de los datos como se
muestra en la figura 5.8. En este caso se puede considerar una sola recta para explicar el
fenmeno, como en la figura 5.9, mas no habra seguridad en cuanto al comportamiento
del mercado para distancias en el intervalo entre b y c. Utilizar el modelo en este intervalo
es equivalente a hacer una extrapolacin interna, o mejor una intrapolacin.
Yi
Yi

a
Figura 5.8

Xki
a
Figura 5.9
Xki
105
Otro caso bastante interesante, que puede llevar al tasador a cometer errores graves
se presenta en la figura 5.10. La recta de regresin (recta 1) pasa por la media del
conjunto y por un punto aislado como se muestra en la figura 5.11.
Yi
Yi
Recta 1
Recta 2
Xi
Figura 5.10
Xi
Figura 5.11
Obsrvese que el comportamiento del mercado mostrado en la figura 5.10 sera explicado por la recta 2 de la figura 5.11, pero debido a un punto discrepante, la recta est
distorsionada, invirtiendo la tendencia del mercado. Los puntos de este tipo o el mismo
conjunto de puntos son denominados puntos influyentes y son bastante peligrosos. Los
mismos pueden ser detectados fcilmente con un anlisis grfico.
En el caso de los puntos de la figura 5.12 se verifica que no hay informacin suficiente
para utilizar el modelo fuera del intervalo [a;b], pues estos tres puntos que no pertenecen
a [a;b] son determinantes en la inclinacin de la recta mucho mas que los que pertenecen
al conjunto formado por el grueso de los datos. Obsrvese que si los tres puntos estuvieran
como los de la figura 5.13, el comportamiento del mercado estara completamente
desvirtuado. Este es un caso tpico de desequilibrio de la muestra. El pequeo conjunto de
puntos no es suficiente para explicar por s solo su tendencia. Tambin son puntos
influyentes.
Yi
Yi
Figura 5.12
Xi
Xi
Figura 5.13
En el caso de los puntos representados en la figura 5.14 se verifica que se trata de un

caso tpico de un comportamiento de datos provenientes de dos poblaciones distintas,
como por ejemplo, datos de oferta y datos de transacciones. Si no se observa el fenmeno,
el modelo ajustado seria el de la recta 1 de la figura 5.14, pero en la realidad el
comportamiento del mercado debe ser explicado por las rectas paralelas mostradas en la
106
figura 5.15. Este caso sera resuelto con la inclusin de una variable dummy en el modelo, asunto que ser tratado en el captulo 7.
Yi
Yi
Recta 1

Recta 3
Recta 2
Xi
Figura 5.14
Xi
Figura 5.15
Una disposicin de los puntos como se muestra en la figura 5.16 es un caso tpico de
interaccin entre una varible dummy y la distancia a un polo valorizante, como por ejemplo,
los datos de oferta y las transacciones decrecen de forma diferenciada a medida que se
alejan del polo. En este caso, el mercado sera explicado a travs de dos rectas no paralelas como las mostradas en la figura 5.17. Este asunto tambin ser tratado en el captulo 7.
Yi
Yi

Xi
Figura 5.16
Xi
Figura 5.17
5.3 LINEALIZACIN
El proceso de regresin lineal simple se aplica para ajustar rectas a los puntos observados en el mercado. De esta forma, la recta solamente tendr significado para explicar
el fenmeno si la tendencia de los puntos fuese lineal. En general, en la prctica, no
siempre se observa este tipo de tendencia. Sin embargo, algunos modelos no lineales
pueden ser linealizados por la simple transformacin de escalas de medicin de las variables. Considrese, por ejemplo, que los datos resumidos en la figura 5.18 son el resultado
de una recoleccin de datos de terrenos, donde los puntos ploteados corresponden a
precios unitarios de mercado (P) versus las respectivas reas (A). Observe que hay una
tendencia de decrecimiento de los precios unitarios con las reas, de forma hiperblica.
En este caso, el ajuste de una recta a los puntos, como se muestra en la figura 5.18, sera
inadecuado, pues slo se pueden ajustar rectas a datos dispuestos con tendencia a la
107
linealidad.
1
_
z= p
z=1/P
Figura 5.18
Figura 5.19
Por ello, se hace necesario alguna transformacin para hacer posible la utilizacin de la
regresin lineal, esto es, una transformacin que linealice los datos. La solucin para el problema enunciado es utilizar una transformacin inversa, Z= 1/P, en los datos de la figura 5.18
resulta en puntos con tendencia lineal como los de la figura 5.19. As los datos con tendencia lineal seran modificados para una tendencia hiperblica, cuando se realiza una
inversin de la escala de las ordenadas, la reciproca tambin es verdadera. De esa forma
se hace la regresin de Z sobre A y se obtiene la ecuacin:
Z = bo + b1 . A
(5.6)
En seguida se retorna a la escala original, sustituyendo Z por 1/P en la ecuacin 5.6 y

se obtiene:
1
= bo + b1 . A
P
P=
(5.7)
que es la ecuacin de una hiprbole, llamada hiperblica I. As que en la escala de P se

tienen puntos con tendencia hiperblica, en tanto, que en la escala de Z la tendencia es
lineal.
Como se puede observar, el conocimiento del comportamiento de los grficos de algunas
funciones muchas veces orienta al analista en relacin a la transformacin a adoptar . A
continuacin se presentan tres funciones no lineales, bastante utilizadas, que pueden ser
linealizadas a travs de transformaciones adecuadas, con sus respectivos grficos (Daniel
y Wood-1971), apenas en el primer cuadrante, toda vez que tanto la variable explicada
como las explicativas son nmeros reales positivos.
(a) Funcin Hiperblica II
Esta funcin tiene una ecuacin del tipo
y=
x
ax b
(5.8)
La linealizacin de la ecuacin 5.8 se hace con la inversin de las escalas de x y de y,

108
como se indica en la ecuacin 5.9.
1
b
=a
y
x
(5.9)
El comportamiento grfico de la ecuacin (5.8)

se muestra en las figuras 5.20 y 5.21.
y
b<0
b>0
1/a
1/a
b/a
Figura 5.20
Figura 5.21
(b) Funcin Exponencial

La ecuacin de una funcin exponencial es del tipo:
y = a e bx
(5.10)
La linealizacin de una curva exponencial se hace utilizando la correspondiente

transformacin inversa, o sea, una transformacin logartmica de la escala de y, obtenindose
la ecuacin:
(5.11)
Ln y = Ln a + bx
y El
comportamiento grfico de (5.11) se puede observar

en las figuras 5.22 y 5.23.
y
b>0
b<0
aeb
a
Figura 5.22
Figura 5.23
Una informacin importante suministrada por la ecuacin 5.10 es respecto a la tasa

b
de variacin de y en relacin a x, que se indica por (1-e ). As, cuando se pretende
estimar una tasa media de valorizacin territorial en determinado periodo, por ejemplo, se
109
utiliza una funcin exponencial.

Otro aspecto a considerar es que si los datos en la escala logartmica poseen distribucin
normal, hay indicios de que los datos originales poseen distribucin lognormal.
(c) Funcin Potencia
Esta funcin tiene una ecuacin del tipo
y = a xb
(5.12)
La linealizacin de 5.12 se hace utilizando una transformada logartmica en las variables

x e y, resultando en
(5.13)
Ln y = Ln a + b Ln x
El comportamiento
b > 1 grfico de 5.12 se puede visualizar en las figuras 5.24 y 5.25.
y
y
b=1
0<b<1
a
-1 < b < 0
b = -1
b < -1
Figura 5.24
Figura 5.25
Una informacin importante cuando se utiliza la funcin potencia es que b indica la

elasticidad de y en relacin a x. El concepto de elasticidad esta ligado a un aspecto del
comportamiento de las variaciones de y en relacin a las variaciones de x, por la ecuacin:
e=
dy/y
dx/x
(5.14)
Cuando se usa una transformacin, se debe entender que no se trata de un mero

ejercicio de matemtica, es importante saber lo que representa el cambio de escala propuesta y si es coherente para explicar el mercado. No se debe confundir con un simple
proceso de intentos, en el sentido de buscar mejores resultados estadsticos. Esto no
basta. Es importante que el modelo resultante pueda expresar con fidelidad el fenmeno
que se desea explicar. Si este es coherente con las creencias a priori que el tasador tiene
sobre el mercado, as como sus teoras sobre el mismo. Por ejemplo, si una cuestin es
inferir la tasa de valorizacin territorial en una regin y es del conocimiento del tasador
que el crecimiento sigue una tasa aproximadamente constante, tiene sentido utilizar un
modelo exponencial; pero si el tasador espera que la tasa sea decreciente en el periodo
observado, el modelo ms aproximado sera uno potencial.
110
5.4 ESTIMACIN DE LOS PARMETROS

La manera ms fcil de estimar los parmetros del modelo es a travs del Mtodo de
los Mnimos Cuadrados. Este mtodo consiste en minimizar la suma de los cuadrados de los
errores calculados para una funcin cualquiera de la ecuacin determinada. Los pasos son
los siguientes:
a) se determina una funcin cualquiera de los parmetros de las variables, con valores
^ ;
medios calculados por Y
i
b) se calculan los errores existentes entre los puntos observados (Y i) y los
^ , esto es, las distancias, medidas en la
correspondientes ajustados por el modelo definido Y
i
^
vertical, entre cada punto observado (Yi) y el estimado por el modelo (Yi ) , o sea:
^
Ei = Yi Y
i
(5.15)
c) se define una funcin U formada por la sumatoria de los cuadrados de los errores,
para una muestra de tamao n, dada por:
U=
E 2i
U=
i= 1
(Yi Yi ) 2
(5.16)
i =1
Observe que la sumatoria de los errores Ei es nula para la curva que pasa ms prxima a los puntos, puesto que los errores positivos se anulan con los negativos. As se
tienen dos caminos para cuantificar estas distancias: la sumatoria de los mdulos o por la
sumatoria de los cuadrados. La segunda solucin es ms fcil de ser tratada
matemticamente. Cuando se utiliza la minimizacin de los cuadrados de los errores, el
mtodo de estimacin se denomina mtodo de los mnimos cuadrados.
^
d) se deriva una funcin U en relacin a cada parmetro desconocido de la funcin Y
i
y cada resultado se iguala a cero, obtenindose un sistema de ecuaciones cuyo numero
es igual al de los parmetros a ser estimados. La solucin del sistema suministra los
estimados que se buscan.
A continuacin se presenta la metodologa citada para estimar los parmetros de los
modelos nulo y de regresin lineal simple.
5.4.1 MODELO NULO
La estimacin se inicia por el modelo ms simple, no obstante el razonamiento se
puede generalizar para los modelos ms complejos. El modelo nulo esta dado por:
^ + e , con Y
^ =b
Yi = Y
i
i
i
o
(5.17)
111
Su representacin grfica se muestra en la figura 5.26.

Yi
Yi = bo
X ki
Figura 5.26
^ =
El estimador bo se obtiene considerando una recta horizontal cualquiera dada por Y
i
Bo, donde la sumatoria de los cuadrados de los errores esta dada por:
n
U = (Yi Yi ) 2
i =1
U=
(Yi
i= 1
Bo ) 2
(5.18)
Para imponerle a la funcin la condicin de mnimo, se calcula inicialmente la primera

derivada de la funcin en relacin a la variable Bo , o sea:
n
i=l
i=l
dU / dBo = 2 (Yi Bo ) = 2 ( Yi Bo . n)
(5.19)
Igualando dU/dBo a cero, se impone la condicin de mnimo a la funcin (5.19), que coincide con el modelo 5.17. As, Bo que antes era una variable, se transforma en una constante
bo, una vez que el sistema nos da la solucin buscada, como se demuestra a continuacin:
n
n
=
Y
=
si dU/dBo = 0, entonces n . bo i , bo Yi /n, o an bo = Y
i= 1
i= 1
O sea, que en una poblacin de datos homogneos, el valor del mercado se estima por
la media aritmtica de los datos muestrales.
Se observa que en el momento en que se impone la condicin de mnimo a la funcin
5.18, se encuentra el estimador del parmetro desconocido representado por bo.
La comprobacin de la condicin de mnimo de la funcin se verifica observando el
resultado de la segundo derivada:
dU/dBo = -2. (- Bo) = 2n > 0
(5.20)
Como la segunda derivada es positiva, la condicin de mnimo para la funcin est

garantizada.
5.4.2 MODELO LINEAL SIMPLE
El valor medio ajustado para una funcin lineal corresponde a una ecuacin del tipo
^ =b +b .X
Y
i
o
1
i
112
(5.21)
Su representacin grfica es el de una recta inclinada, como se muestra en la figura 5.27.
Yi
^ =b +b .X
Y
i
o
1
i
Figura 5.27
Xi
En este caso la funcin que mide la sumatoria de todas las distancias entre cada
precio observado (Yi) y el correspondiente precio ajustado, calculado por una recta
^ = B + B .X est dada por:
cualquiera Y
i
o
1
i
(5.22)
Para que en esta funcin alcance su punto mnimo, se hace necesario inicialmente que
las derivadas parciales en relacin a cada parmetro sean iguales a cero, o U/Bo = 0 y
U/B1 = 0, o sea,
U=
E 2i =U/B(Y=i 2 Bo(Y BB1 . X iB) 2 . X ) . (-1)

i= 1
i= 1
= 2 ( Bo + B1 Xi - Yi)
(5.23)
U/B1 = 2 (Yi - Bo - B1 . Xi) . (- Xi) = 2(Bo Xi + B1 X - Yi . Xi )

2
i
Igualando las derivadas a cero se obtiene el sistema siguiente:
bo . n + b1 . Xi = Yi;
bo . Xi + b1 . Xi = Xi . Yi;
(5.24)
n
Nota: se considera en los sistemas 5.23 y 5.24 que =
i=1
La solucin del sistema 5.24 nos da los estimadores de los parmetros poblacionales
correspondientes; de esta forma el modelo deseado tendr la siguiente ecuacin:
Yi = bo + b1. Xi + ei
(5.25)
Los precios ajustados por la recta de regresin estn dados por:

^ = b +b.X
Y
i
o
1
i
(5.26)
113
Tal como se vio en la seccin 5.4.1 se puede confirmar la condicin de mnimo de la

funcin si al calcular las derivadas de segundo orden, estas son positivas. Una forma ms
general de verificacin se presenta en la seccin 6.3.1.
Los residuos estimados se calculan por:
^
ei = Y i - Y
i
(5.27)
5.5 COMPROBACIN DE LAS HIPTESIS BSICAS

Adems de la estimacin de los parmetros, es de fundamental importancia la
verificacin de la hiptesis bsicas citadas en la seccin 5.1. Cada hiptesis se analiza, en
particular, para un modelo lineal simple ajustado a datos inmobiliarios.
PRIMERA HIPTESIS:
La variable independiente corresponde a los nmeros reales que no contienen
ninguna perturbacin aleatoria.
De hecho, en el caso de los datos inmobiliarios, las variables independientes estn
relacionadas con las caractersticas fijas de cada elemento tomado como referencia, por
lo que se cumple la hiptesis.
SEGUNDA HIPTESIS:
El nmero de observaciones, n, debe ser superior al nmero de parmetros
estimados por el modelo.
Para el modelo de regresin lineal simple, que envuelve los parmetros ( o e 1), el
ajuste de la recta de regresin exige al menos tres datos. Aunque este nmero de datos
mnimos cumple con las exigencias matemticas de la estimacin, en la prctica, no es
suficiente para explicar el comportamiento del mercado. La norma brasilea NB-502/89
exige un mnimo de cinco datos cuando se estima un parmetro en las tasaciones normales,
para modelos de regresin con k parmetros k+5 datos en las tasaciones rigurosas y en
las tasaciones rigurosas especiales 2k+5 o 3k , el que fuere mayor. Se entiende que para
medir el efecto de una variable sobre la variabilidad de los precios, se debe trabajar con
un mnimo de cinco informaciones sobre esta variable, adems de las cinco necesarias
para estimar la media general. O sea un mnimo de cinco datos para cada parmetro
estimado, lo que resulta en una muestra mnima de 5k datos. Adems de esto se debe
observar el equilibrio de la muestra, visto en la seccin 3.5.2.
114
TERCERA HIPTESIS:
Los errores son variables aleatorias con valor esperado cero y varianza constante.
El primer aspecto de esta hiptesis es de difcil verificacin, sin embargo, as sea el
valor esperado del error aleatorio igual a una constante, esto puede ser absorbida por el
coeficiente bo del modelo, sin provocar tendenciosidad en los dems coeficientes que son
los ms importantes en el anlisis de regresin.
Para la verificacin del aspecto de varianza constante del error, existen varios mtodos
analticos que pueden ser encontrados en Kmenta (1978). A travs de un anlisis grfico
de los residuos se puede verificar con facilidad esta hiptesis.
Un grfico de resduos (ei) versus los valores ajustados por el modelo de regresin
^ ), presenta puntos distribuidos
(Y
aleatoriamente en torno a una recta horizontal que pasa
i
por el origen, sin ningn patrn definido, como la forma de la figura 5.28, es un indicador
favorable a la aceptacin de la hiptesis de varianza constante por los errores; en caso
contrario, si los puntos presentan una tendencia, como los datos de la figura 5.29, se
puede concluir que la varianza del error no es constante. En el primer caso, se dice que el
modelo es homocedstico y en el segundo, heterocedstico.
ei
ei
Figura 5.28
^
Yi
^
Yi
Figura 5.29
Cuando el modelo es heterocedstico, los estimadores de mnimos cuadrados son tambin

no tendenciosos y consistentes, pero no son los de menor varianza, o sea, que no son eficientes, ni menos asintticamente. Las estimaciones de las varianzas de los estimadores de
los parmetros son tendenciosas, y las inferencias sobre ellas y sobre los parmetros son
incorrectas. En este caso se debe tener precaucin en el sentido de estabilizar la varianza
del trmino error, tal como una estimacin de los parmetros a travs del mtodo de los
mnimos cuadrados ponderados, que se presenta en la seccin 6.3.11, o haciendo transformaciones adecuadas en la variable de respuesta, como logartmica o raz cuadrada.
CUARTA HIPTESIS
Los errores son variables aleatorias con distribucin normal.
Como se puede observar ninguna suposicin en este sentido fue necesaria para la
estimacin de los parmetros del modelo a travs del mtodo de los mnimos cuadrados.
Pero la misma es necesaria para hacer inferencias y construir intervalos de confianza.
115
En un primer anlisis, se puede verificar esta hiptesis observando el intervalo

comprendido por los residuos estandarizados
, estos se encuentran dividiendo cada
residuo (ei) por la desviacin estndar del modelo (s), calculado por (5.32), toda vez que en
una distribucin normal, 68% de estos residuos estn en el intervalo [-1; + 1], 90% entre
[-1,64; + 1,64] y 95% entre [-1,96 ; + 1,96].
Un histograma de los residuos presentando simetra y forma parecida a la curva normal es un indicador a favor de la hiptesis de normalidad del error. El grfico de los
residuos es el que arroja los mejores resultados en este sentido.
Para la construccin del grfico normal de los residuos se deben plotear los puntos
correspondientes a cuartiles muestrales de los residuos ordenados versus los cuartiles
tericos de la distribucin normal, que si resulta en una recta se puede verificar la hiptesis de normalidad. El coeficiente angular de esta recta es una estimacin de la varianza y
es un coeficiente lineal de la media. En el caso de la distribucin N (0,1), los puntos se
deben situar sobre la bisectriz del primer cuadrante.
Se observa que el campo de variacin de la distribucin normal es todo el intervalo de
los nmeros reales, en cuanto que los precios de los inmuebles son estrictamente positivos. Esto tiene que ver con que la distribucin normal no sea la mas apropiada para los
datos inmobiliarios. Una solucin tambin ha sido bastante satisfactoria es el cambio para
una escala logartmica, puesto que el logaritmo del precio abarca toda la recta real. Cuando el logaritmo de los precios tiene una distribucin normal, se dice que los precios tiene una
distribucin log-normal. Esta distribucin se ha mostrado adecuada a los datos inmobiliarios.
QUINTA HIPTESIS:
Los errores no estn correlacionados, es decir, que son independientes bajo la
condicin de normalidad.
El concepto de independencia de los residuos esta ligado a la independencia de los datos
de mercado Una situacin ideal es aquella donde cada transaccin se realiza independientemente de otra Esto es, el conocimiento del precio y las condiciones de una transaccin no
interfieren en otra.
La existencia de autocorrelacin en los trminos de la perturbacin aleatoria se puede
verificar con el auxilio de la razn de Von Neumann, dada por:
.
d=
(e i e i 1 )
i=2
2
ei
(5.28)
i =1
donde e i es el i-esimo residuo del modelo, ordenado de manera creciente con relacin a
los valores ajustados, considerando una muestra de tamao n.
Para n grande se demuestra que d= 2 ( 1 - r ), donde r es el coeficiente de correlacin
entre e i y e i - 1 .
As cuando r = -1 los residuos ei y ei - 1 estn perfectamente correlacionados negati116
vamente y d = 4 ; si r = + 1 se tiene autocorrelacin positiva perfecta y d= 0. Cuando no

hay autocorrelacin r = 0 y d= 2.
El estadstico d fue tabulado por Durbin-Watson para niveles de significancia de 5%,
2,5% y 1%, considerando ajustes del modelo de 15 a 100 observaciones, con hasta seis
variables independientes, estableciendo los lmites crticos d L y d u.. Estas tablas se encuentran en el apndice I, con las identificaciones I5, I6 y I7 respectivamente.
Para probar la hiptesis nula de que los residuos estn correlacionados (H0) contra
una hiptesis de que los residuos no estn correlacionados (H1), se calcula d con la
ecuacin (5.28) y despus se compara con los puntos crticos dL e dU, de la forma siguiente:
-Si d u < d < 4 - d u, rechaza H 0, o sea, rechaza la hiptesis de que los residuos estn
correlacionados a favor de la hiptesis de no autocorrelacin al nivel de significancia establecido;
-Si d < d L se acepta la hiptesis de auto-regresin positiva;
-Si d > 4 - d L se acepta la hiptesis de auto-regresin negativa;
-En los dems casos la prueba no es concluyente.
La representacin grfica de la prueba puede ser visualizada en la figura 5.30.
f (d)
Regin no concluyente
Regin no concluyente
Regin de no auto-regresin
d
Regin auto-regresin
Positiva
dL
dU
Figura 5.30
(4-dL) (4-dU)
Regin auto-regresin
N egativa
Se puede demostrar con facilidad (Kmenta-1978) que cuando las perturbaciones son
autoregresivas, los estimadores de mnimos cuadrados tambin son no tendenciosos y
consistentes, pero no son ms eficientes, ni menos asintoticamente.
$ que presenta puntos como los de la figura 5.28 es un

Un grfico de ei versus Y
i
fuerte indicador de la distribucin aleatoria de los errores independientes; sin embargo, en
la situacin cuando los puntos se presentan dispuestos con alguna tendencia, puede haber
indicios de autocorrelacin de los residuos.
Aplicacin 5.1
En la tasacin de un inmueble, donde fueron considerados 25 datos de mercado, se utiliz
un modelo de regresin lineal simple y se obtuvo como resultado el estadstico de Von Neuman
d= 2,2. Se pide probar la hiptesis de no auto-regresin en el modelo para un nivel de 5%.
117
Solucin:
o
1 ) Se encuentra en la tabla I.5, apndice I, los puntos crticos tabulados por DurbinWatson, que estn en la primera columna y la linea 25, o sea,
dL = 1,29
dU = 1,45
2 ) Definir las regiones

dL
dU
1,29
auto-reg.
positiva
4- dU
1,45
no
concluyente
4 - dL
2,55
no auto-regreson
2,71
no
concluyente
auto-reg.
negativa
3 ) Verificar en cual regin se encuentra el valor d = 2,2. Como d est entre 1,45 y 2,55, se
puede concluir que no existe auto-regresin en los residuos al nivel de significancia del 5%.
5.6 PUNTOS ATPICOS
Adems de las cinco hiptesis bsicas es importante verificar si hay presencia de
outliers o puntos influyentes, toda vez que los estimadores de mnimos cuadrados no son
robustos cuando puntos de esta naturaleza contribuyen a su ajuste. En este caso, el
modelo no se ajusta bien ni al grueso de los datos, ni a los datos con un punto atpico.
Un punto atpico debe ser analizado aparte con bastante cuidado, pues puede haber
sido ocasionado por errores de medida, o por algn cambio en el comportamiento de la
muestra. Es aconsejable que se haga otro ajuste excluyndolos y comparando el nuevo
modelo con el anterior, obtenindose de esta forma informaciones respecto a sus influencias
sobre los parmetros estimados y tambin sobre el poder de explicacin de la ecuacin
de regresin.
5.6.1 OUTLIER
Se entiende por outlier un dato que tiene un residuo grande en relacin a los dems
que componen la muestra.
Estos puntos pueden ser detectados con facilidad a travs de un anlisis grfico de los
*
residuos estandarizados e i versus los valores ajustados correspondientes Y$ i . Por
ejemplo, para puntos dispuestos como los de la figura 5.31, aquellos destacados pueden
ser caracterizados como outliers.
Obsrvese el hecho de que el punto se presenta con un residuo estandarizado superior
a 2, no implica necesariamente que se trata de un outlier. Esta indicacin en la figura es
importante para detectar una informacin respecto a la normalidad de los residuos, pues
( )
118
( )
ei
Outlier
+2
^
Yi
0
-2
Outlier
FIGURA 5.31
cuando los datos presentan estas caractersticas, 95% de sus residuos estandarizados
estn entre -1,96 y +1,96, esto es, aproximadamente entre -2 y +2. As, si la mayora de
los puntos estn entre estos limites existen indicios favorables de normalidad. Pero puede
ocurrir que una muestra con dispersin grande, con varios residuos estandarizados fuera
del intervalo [-2;+2], sin que existan puntos aparentes discrepantes, como por ejemplo los
indicados en la figura 5.32. En este caso que se puede inferir que los datos provienen muy
probablemente de una distribucin Gama. En caso inverso puede ser aquel de una muestra
que presenta subdispersin , como los puntos dispuestos en la figura 5.33. Observe que
todos los puntos estn en el intervalo [-2;+2], pero existe un punto discrepante en relacin
a la masa de datos. En un caso como este es probable que los datos provengan de una
poblacin con distribucin binomial. De esta forma, se verifica que es un procedimiento
peligroso considerar puntos outliers que apenas se presentan con residuos estandarizados
fuera de los limites -2 y +2 como hacen algunos sistemas disponibles en el mercado. De
aqu se ve una vez mas la importancia del anlisis grfico de los residuos. El ajuste de los
datos con distribuciones diferentes a la normal, como Gama, Binomial, Poisson y otras,
solo es posible a travs de modelos lineales generalizados, asunto que ser tratado en el
captulo 8.
ei
+2
+1
0
-2
+2
+1
^
Yi
-1
ei
-1
^
Yi
Figura 5.32
-2
Figura 5.33
5.6.2 PUNTOS INFLUYENTES
Se entienden por puntos influyentes aquellos con pequeos residuos, en algunas veces
hasta nulos, que se distancian de la masa de datos, pudiendo alterar completamente las
tendencias naturales indicadas por el mercado.
119
Existen varios criterios estadsticos para detectar estos puntos, como el de Cook,
presentado en la seccin 8.9, pero con un simple anlisis del comportamiento grfico de
la variable dependiente o de los residuos en relacin a cada variable independiente se
puede verificar el problema. En la figura 5.34, por ejemplo, un punto con caractersticas
como el sealado indica la presencia de un punto influyente. En este caso un punto tiene
residuo cero, como se puede observar en la figura 5.35 y parece ser bien ajustado, pero
degenera completamente el modelo. Mientras que la tendencia del mercado es la indicada por la recta 1 de la figura 5.34, el punto influyente modifica la tendencia para la
situacin de la recta 2 de la misma figura.
Recta 2
Yi
ei
Recta 1
^
Yi
Xi
Figura 5.34
Figura 5.35
5.7 COEFICIENTE DE CORRELACIN

El coeficiente de correlacin es una medida estadstica importante en el anlisis de un
modelo de regresin, pues informa la dependencia lineal entre las variables explicada
(Yi) y explicativa (Xi), se calcula por:
r=
(X i - X)(Yi - Y)
(X i - X) 2 . (Yi Y) 2
(5.29)
Este resultado vara de-1 a +1. Cuanto ms prximo se encuentre el modelo de la

unidad, mayor ser la dependencia lineal entre las variables involucradas y cuanto mas
prximo a cero, menor ser esta dependencia.
Cuando r > 0 la correlacin es directa, correspondiendo a una recta creciente;
Cuando r = 0 la correlacin es nula, correspondiendo a una recta horizontal;
Cuando r < 0 la correlacin es inversa, correspondiendo a una recta decreciente.
En un modelo de regresin lineal simple es deseable que el mdulo del coeficiente de
correlacin entre la variable dependiente y una variable independiente sea prximo a la
unidad.
120
En Pereira (1970), existe la siguiente clasificacin:

Coeficiente
r =0
0 < r 0,30
0,30 < r 0,70
0,70 < r 0,90
0,90 < r 0,99
r =1
Correlacin
nula
dbil
media
fuerte
fortsima
perfecta
5.8 COEFICIENTE DE DETERMINACIN

El cuadrado del coeficiente de correlacin resulta en el coeficiente de determinacin, que
indica el poder de explicacin del modelo en funcin de las variables independientes consideradas.
R = r
(5.30)
As por ejemplo, si en un modelo para la tasacin de un lote de terreno, se consider el rea

como la nica variable para explicar la formacin de los precios y se encontr R=0,90, esto
indica que el 90% de la variabilidad de precios observados se debe a variaciones en el
rea.
5.9 DESVIACIN ESTNDAR DEL MODELO
La desviacin estndar de un modelo general con p parmetros estimados, ajustados
^ , est dado por la expresin:
a n datos Y por una ecuacin de media Y
i
se =
(Y
Yi
(5.31)
n p
Para el caso de una recta p = 2, se tiene:

se =
(Y
Yi
n2
(5.32)
En el modelo 5.32, se puede observar lo siguiente:

a) El denominador (n-p) representa el nmero de grados de libertad del modelo, pues
cada parmetro estimado provoca la prdida de un grado de libertad.
b) El cuadrado de la desviacin estndar indica la varianza del sistema. Esto es, la
media de los cuadrados de los residuos. Esta es una medida importante de diagnstico del
modelo. Entre dos modelos satisfactorios, se debe escoger aquel de menor varianza,
121
porque las estimaciones son mas precisas. Otra informacin importante es que cada
variable includa en el modelo genera una reduccin en la varianza residual. Si la reduccin
fue significativa, hay indicios de que la variable es importante para explicar mejor la
variabilidad de los precios, en caso contrario, la variable no debe ser includa.
5.10 PRUEBA DE SIGNIFICANCIA DE LOS PARMETROS
La significancia individual de un parmetro j se mide a travs de una prueba t aislada.
La hiptesis a ser probada es:
(5.33)
Probar la hiptesis 5.33 para un parmetro 1, corresponde a una variable X1, es
semejante a probar:
Ho : la varible X1 no es importante en el modelo, contra
H1 : la varible X1 es importante para explicar los fenmenos en estudio y debe

participar en el modelo.
As, lo que se pretende es rechazar la hiptesis nula (Ho), ya que el tasador presume
que la variable en prueba influye en la formacin de los precios.
Una vez aceptada la tendencia de normalidad de los residuos, el estadstico de la
prueba es:
t *j =
b j j
s( bj)
(5.34)
Donde s(bj) es la desviacin estndar correspondiente al parmetro estimado bj.

Se demuestra que t* tiene distribucin t de Student con n - p grados de libertad donde n es
el nmero de datos de la muestra y p es el nmero de parmetros estimados. Esto es, para un
modelo de regresin simple: n 2 grados de libertad.
As para probar la hiptesis 5.33, a un nivel de significancia para un modelo de
regresin lineal simple, se compara
(5.35)
*
con t (1-/2 ; n - 2 ). Si t j es superior a t (1-/2 ; n - 2 ) , se rechaza la H0, indicando que la variable

correspondiente al parmetro probado es importante para explicar el fenmeno. La prueba
es bicaudal y puede ser observada en la figura 5.36.
122
t
I
Rechaza Ho
Acepta Ho
;( n 2 )
2
Rechaza Ho
Figura 5.36
La norma para tasacin de inmuebles urbanos NB-502/89, de la ABNT, exige para esta
prueba una significancia mxima de 5% en las tasaciones de precisin rigurosa y 10% en la
rigurosa especial.
Para el caso de la Regresin Lineal Simple, el s(bj) es calculado por la expresin:
s( bj) = se
t
2
(Xi
X)
, donde se =
(Yi Y$ i ) 2
n 2
(5.36)
;( n 2 )
2
Aplicacin 5.2
En la tasacin de un local comercial, se eligi la edad (X) como nica variable

responsable por las variaciones de precio unitarios (Y), en R$/m2, con base en una muestra
de 21 datos de mercado, obtenindose la siguiente recta de regresin:
Y = 900 - 10 (8) . X
(5.37)
donde el trmino entre parntesis corresponde a la desviacin estndar del respectivo
parmetro estimado.
Se pide probar la significancia del parmetro correspondiente a la edad al nivel del 5%.
Solucin:
o
1 ) Encontrar el t calculado por la ecuacin 5.35, esto es, dividindose el parmetro

estimado por su desviacin estndar, obtenindose:
t1 = |10/8| = 1,25
o
2 ) Encontrar en la tabla I 2 del apndice I, el punto crtico de la distribucin t de

student para el nivel de 5% y 19 grados de libertad, que corresponde a:
t (0,975; 19 ) = 2,09
123

o
3 ) Comparar t1 calculado con t
(0,975; 19)
- como |t1| es inferior a t (0,975; 19), se concluye que el parmetro poblacional

correspondiente a la edad no es significativo al nivel del 5%.
5.11 PRUEBA DE SIGNIFICANCIA DEL MODELO
La hiptesis a ser probada en este caso es la misma para un parmetro individual, toda
vez que el modelo slo tiene un parmetro a ser probado.
H 0 : 1 = 0, contra
H 1: 1 0
(5.38)
Esto es semejante a probar:
H0 : el mercado debe ser explicado por una recta horizontal

H1 : el mercado debe ser explicado por una recta inclinada.
La visualizacin grfica de la prueba es mostrada en la figura 5.37.

Yi
^
Yi- Yi
^
Y i = bo + b1 .xi
^Y
^ _
Y i-Y
_
Y
xi
xi
Figura 5.37
Observe en la figura 5.37 la variacin total de un punto observado (Y i) con relacin
a la recta horizontal Y, puede ser expresada por una parte correspondiente a la variacin
^ ), ms la
de este punto (Yi) con relacin a su valor ajustado sobre la recta inclinada (Y
i
^
variacin existente entre el punto ajustado sobre la recta inclinada (Yi) y la recta horizon
tal (Y). As, la variacin total (Yi - Y) es igual a una variacin explicada por la recta de
^ ), es
^ - Y) ms una variacin no explicada por la recta de regresin (Y - Y
regresin (Y
i
i
i
decir, para un punto i se tiene:
^ - Y)
^)
+ (Yi - Y
(Yi - Y) = ( Y
i
i
124
(5.39)
2
^ -Y)
^ ) 2.
Se demuestra (Kmenta - 1978) que (Y i - Y) 2 = (Y
+ (Y i - Y
i
i
Considerndose un modelo de regresin lineal simple ajustado a una muestra de n datos,
se encuentran los siguientes grados de libertad para cada una de las sumatorias:
2
(n 1) para ( Yi - Y) , pues slo se conoce un parmetro estimado, que es Y;

^ )2, pues involucra las medias estimadas de b y b , que son los
(n 2) para (Yi - Y
0
1
i
^;
coeficientes de la recta de regresin definida por Y
i
2
^ - Y)
Uno (1) para ( Y
, correspondiente al resultado de la diferencia entre (n-1) - (n-2).
i
Dividindose cada una de las sumatorias por sus respectivos grados de libertad, se
encuentran las correspondientes varianzas, esto es:
Varianza total
Varianza no explicada
Varianza explicada
$ i))22Y )2 (n 2)
Y
(Y$
i (Y
i
F =
Con esto se puede hacer una tabla de anlisis de varianza, tambin conocida como
n 1 12tabla
2
1como se demuestra en la tabla 5.1. Un caso ms general se presentar en
Y YANOVA,
i
la seccin 6.5.1.
Tabla 5.1 Tabla de Anlisis de Varianza

Variacin
Sumatoria de los cuadrados
No explicada (error)
2
^ -Y)
SQR = (Y
i
^ )2
SQE = (Y - Y
Total
SQTO = (Yi- Y)2
Explicada (modelo)
Grados de
libertad
n 2
2
^ -Y)
V exp = (Y
/1
i
^ )2/(n-2)
Vn exp = (Y - Y
n-1
Vtot = (Yi- Y)2/(n-1)
Varianza
Observe en la figura 5.37, que la situacin ideal sera aquella donde la varianza explicada
fuese grande y la no explicada pequea. As, para probar la significancia global del modelo, se analiza la razn entre las dos varianzas por el estadstico:
(5.40)
125
que presentar un resultado un tanto mayor cuanto mayor sea la probabilidad del modelo
de ser aceptado para explicar el fenmeno en estudio.
Se demuestra que Fc, bajo la hiptesis H0, tiene distribucin de Snedecor con 1 grado de
libertad en el numerador y (n-2) en el denominador. Esta distribucin fue tabulada por Fisher.
Los puntos crticos para un nivel de significancia es simbolizado por F(; 1 ; n - 2 ). Estos puntos
estn en las tablas 13 y 14 del apndice I para los nveles de 5% y 1%, donde el nmero
de grados de libertad del numerador se indica en la columna y el nmero de grados de
libertad del denominador se indica en la lnea, donde se localiza el punto crtico
correspondiente.
As para rechazar la hiptesis nula de no haber regresin al nivel , es necesario que
Fc sea superior a F(; 1 ; n - 2 ); en caso contrario, hay indicios de que la recta inclinada no
explica mejor el fenmeno que la recta horizontal, debiendo ser sta ltima la escogida.
La prueba es unicaudal y puede ser observada a travs de la figura 5.38.
aceptacin de Ho
F; 1 ; ( n - 2 ) rechazo de Ho
Figura 5.38
La norma para tasacin de inmuebles urbanos NB-502/89, de la ABNT, exige que sea
probada la hiptesis de anlisis de varianza a un nivel de significancia mxima de 5% en
las tasaciones de precisin rigurosa y 1% en la rigurosa especial.
Aplicacin 5.3
Considerndose los datos de la aplicacin 5.2, y sabindose que la varianza explicada
por el modelo es 16 y la no explicada es igual a 40, se pide probar la significancia del
modelo al nivel del 1%.
Solucin:
1o) Calcular el Fc por la ecuacin (5.40),
Fc =
$ Y ) 2 ( n 2)
(Y
i
$ )2
1
(Yi Y
i
Sustituyendo los resultados, se tiene:
Fc =
126
16 ( 21 2)
= 7,6
40
1

o
2 ) Encontrar el punto crtico de la distribucin de Snedecor, en la tabla I4, apndice I,

con un grado de libertad en el numerador y 19 grados en el denominador, esto es, se
a
encuentra en la primera columna y en la 19 lnea de la tabla, es decir, F(0,01; 1 ; 19 ) = 8,19.
o
3 ) Comparar Fc con F(0,01; 1 ; 19 ) : como Fc= 7,29 es inferior a F(0,01; 1 ; 19 ) = 8,19 se

concluye que el modelo no es significante al nivel del 1%.
$
5.12 INTERVALO DE CONFIANZA PARA Y
i
El intervalo de confianza a un nivel de (1- ), en torno de un punto (Xo ;Yo), sobre la
recta de regresin, es calculado por
^ t
. s( Y0 )
I =Y
o
1-/2 ; (n - 2)
(5.41)
donde s( Y0 ) es la desviacin estndar calculada en torno al punto (Xo; Yo). Para un

modelo de regresin lineal simple, se tiene la siguiente expresin:
$ )2
( Yi Y
i
n 2
1 ( Xo X ) 2 donde s =
+
e
n ( X i X) 2
^ t
I =Y
. se .
o
1-/2 ; (n - 2 )
(5.42)
La norma para la tasacin de inmuebles urbanos NB-502/89, de la ABNT, admite un

intervalo de confianza mxima del 80%, o una significancia mnima del 20%. Para este
intervalo se considera = 20%.
Como se puede observar en la expresin 5.42, la menor amplitud del intervalo ocurre
cuando el bien que se est tasando posee caractersticas iguales a la media de las carac
tersticas de los datos muestrales, esto es, Xo = X. Las mayores amplitudes ocurren en la
frontera del campo muestral. En este caso, las estimaciones ms precisas ocurren para
las tasaciones ms cercanas a las caractersticas medias de los datos de referencia y las
ms imprecisas, en las extremas.
$ puede ser vista en la figura
La variacin del intervalo de confianza en torno de Y
i
5.39.
y
^ ^
Y = b0 + b1 .Xi
^
Ym a
^
Y
^
Y mi
x
Figura 5.39
127
La estimacin de un intervalo de confianza en torno de un punto cercano a la frontera

de la muestra o cuando se trata de una muestra extrada de una poblacin con caracterstica platicrtica, la amplitud del intrvalo puede ser bastante amplio, es decir, una estimacin
bastante imprecisa para la media. En estos casos, es preferible reducir la confianza y
obtener un intervalo de variacin ms estrecho. En una situacin opuesta, en que la muestra
es extrada de una poblacin con caractersticas leptocrticas, la confianza podra ser
ampliada. Esto sera bien informativo para el que toma decisiones, pues es preferible una
estimacin con 99% de certeza que otra con apenas 80%, por ejemplo. Pero el tasador
est impedido de presentar una confianza mayor en su trabajo, por cuestiones normativas.
Sera ms coherente establecer intervalos aceptables de variacin en torno de la media, a
partir de all, calcular la probabilidad del verdadero valor de mercado contenido en ellos.
Aplicacin 5.4
Considerando los datos de la aplicacin 5.2, estimar el valor medio de mercado y el
intervalo de confianza al 80% para un local comercial con diez aos de edad, sabiendo
que la desviacin estndar en torno a ese punto es igual a 100.
Solucin:
o
1 ) estimar el valor medio de mercado sustituyendo Xo = 10 en el modelo

Y = 900 10 . X
que corresponde a un Yo = R$ 800,00/m
2o) estimar el intervalo de confianza por la ecuacin 5.41, es decir,
$ o t 90 ; 19 . s( Y0 )
I= Y
Entrando en la tabla 12, del apndice I, se encuentra t 90 ; 19 = 1,33. Sustituyendo los
resultados, se tiene
I = 800 1,33 . 100 I = 800 133
As se encuentra para el intervalo, un lmite inferior de R$ 667,00/m2 y un lmite
superior de R$ 933,00/m2. Esto es, hay una probabilidad del 80% que el valor de mercado
est entre esos lmites del intrvalo de confianza.
5.13 EJERCICIOS PROPUESTOS
5.13.1 Se propone un ejercicio bastante sencillo, que debe ser resuelto sin necesidad de
utilizar ningn sistema de tratamiento de datos. Su resolucin es fundamental para entender el desarrollo de los dems asuntos abordados en los captulos siguientes.
128
Para la tasacin de un lote de terreno, se recolectaron cinco datos relativos a las

distancias al centro urbano y los respectivos precios unitarios, segn el cuadro siguiente:
dato
distancia
(km)
1
2
3
4
5
0
1
1
2
1
precio
unitario
2
(R$/m )
3
2
1
1
3
Con base en los datos recolectados, se pide:

01 - Verificar grficamente el comportamiento del precio unitario con la distancia al centro urbano. Interpretar la figura, trazar una recta de regresin y encontrar su
ecuacin.
02 - Estimar los parmetros del modelo de regresin por el mtodo de los mnimos
cuadrados.
03 - La ecuacin del modelo con su respectiva interpretacin.
04 - Los coeficientes de correlacin y determinacin, con las debidas interpretaciones.
05 - Calcular la desviacin estndar del modelo.
06 - Construir la tabla de ANOVA.
07 - Probar la significancia del modelo al nivel del 5% e interpretar el resultado.
08 - Probar la significancia del parmetro correspondiente a la variable distancia, al nivel
del 5% e interpretar el resultado.
09 - Encontrar un intervalo de confianza del 80% en torno de b1.
10 - Analizar el grfico de los residuos estandarizados versus valores ajustados.
11 - Probar la hiptesis de no auto-regresin al nivel de 5%.
12 - Probar la normalidad de los residuos.
13 - Estimar el valor unitario medio para un lote de terreno que est a 1,5 km del centro
urbano.
14 - Estimar el intervalo de confianza al nivel del 80% en torno del valor unitario medio
estimado e interpretar el resultado.
5.13.2 Para la tasacin de un apartamento se recolectaron 19 datos de referencia,
tomndose como variable dependiente el precio unitario en R$/m2 de rea privada (V) y
como variable independiente la edad (I). El modelo escogido fue el exponencial que
present los siguientes resultados:
a) b0 = 7 y b1 = 0,02 (0,005), que representan: los trminos independiente y el estimador
del parmetro correspondiente a la covariable edad, estando la desviacin estndar
correspondiente dentro de los parntesis;
b) Coeficiente de correlacin entre V e I igual a - 0,95
c) Fc =25
d) Desviacin estndar del modelo igual a 0,30;
129
e) Estadstico de Durbin-Watson d=1,90

f) Residuos estandarizados en los siguientes intervalos: 70% entre [ -1;+1]; 90%
entre [1,65;+1,65] y 98% entre [ -1,96; +1,96].
g) Grfico de los Resduos Versus Valores Ajustados;
ei
^
Yi
Con base en los datos indicados se pide:

a) La ecuacin del modelo exponencial con la debida interpretacin;
b) Interpretar el coeficiente de correlacin;
c) El poder de explicacin del modelo con la debida interpretacin;
d) Probar la significancia del parmetro correspondiente a la edad al nivel del 5%;
e) Probar la significancia del modelo al nivel del 1%;
f) Probar la no auto-regresin al nivel del 2,5%;
g) Analizar los residuos y su normalidad;
h) Analizar el grfico de los residuos y observar la homocedasticidad.
i) Estimar el valor medio de mercado, la moda y la mediana para un apartamento con
10 aos de edad;
j) Estimar la tasa mnima y mxima de depreciacin anual de los apartamentos en la
regin abarcada en la investigacin, considerndose un intervalo de confianza de 90% en
torno de la tasa media inferida;
k) Atender el tratamiento dispensado a los datos segn los niveles de rigor de la NB-502/
89.
130

Cap5 Dantas

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Cap5 Dantas

Încărcat de

Drepturi de autor:

Formate disponibile

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

1 ) La variable independiente debe ser representada por nmeros reales que no

4 ) Los errores son variables aleatorias con distribucin normal.

5 ) Los errores no estn correlacionados, son independientes bajo la condicin de

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

En un grfico formado por pares de puntos observados en el mercado (Xi;Yi), dispuestos

5.2 DIAGRAMA DE DISPERSIN

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Figura 5.2 Caso 1

Figura 5.3 Caso 2

Figura 5.4 Caso 3

Figura 5.5 Caso 4

De acuerdo al comentario en la seccin 2.2.4.2, por la simple observacin grfica se

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

En el caso de los puntos representados en la figura 5.14 se verifica que se trata de un

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

En seguida se retorna a la escala original, sustituyendo Z por 1/P en la ecuacin 5.6 y

que es la ecuacin de una hiprbole, llamada hiperblica I. As que en la escala de P se

La linealizacin de la ecuacin 5.8 se hace con la inversin de las escalas de x y de y,

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

como se indica en la ecuacin 5.9.

El comportamiento grfico de la ecuacin (5.8)

(b) Funcin Exponencial

La linealizacin de una curva exponencial se hace utilizando la correspondiente

comportamiento grfico de (5.11) se puede observar

Una informacin importante suministrada por la ecuacin 5.10 es respecto a la tasa

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

utiliza una funcin exponencial.

La linealizacin de 5.12 se hace utilizando una transformada logartmica en las variables

Una informacin importante cuando se utiliza la funcin potencia es que b indica la

Cuando se usa una transformacin, se debe entender que no se trata de un mero

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

5.4 ESTIMACIN DE LOS PARMETROS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Su representacin grfica se muestra en la figura 5.26.

Para imponerle a la funcin la condicin de mnimo, se calcula inicialmente la primera

Como la segunda derivada es positiva, la condicin de mnimo para la funcin est

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Su representacin grfica es el de una recta inclinada, como se muestra en la figura 5.27.

E 2i =U/B(Y=i 2 Bo(Y BB1 . X iB) 2 . X ) . (-1)

U/B1 = 2 (Yi - Bo - B1 . Xi) . (- Xi) = 2(Bo Xi + B1 X - Yi . Xi )

Igualando las derivadas a cero se obtiene el sistema siguiente:

Nota: se considera en los sistemas 5.23 y 5.24 que =

Los precios ajustados por la recta de regresin estn dados por:

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Tal como se vio en la seccin 5.4.1 se puede confirmar la condicin de mnimo de la

5.5 COMPROBACIN DE LAS HIPTESIS BSICAS

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Cuando el modelo es heterocedstico, los estimadores de mnimos cuadrados son tambin

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

En un primer anlisis, se puede verificar esta hiptesis observando el intervalo

R UBENS ALVES DANTAS

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

vamente y d = 4 ; si r = + 1 se tiene autocorrelacin positiva perfecta y d= 0. Cuando no