Documente Academic
Documente Profesional
Documente Cultură
y emplear mtodos que permitan predecir los valores de la respuesta ante valores
dados del regresor x.
Un anlisis de la relacin entre Y y x requiere el planteamiento de un modelo
estadstico. Con frecuencia, un modelo es usado por un estadstico como
representacin
de un ideal que, en esencia, defi ne cmo percibimos que el sistema en cuestin
gener los datos. El modelo debe incluir al conjunto [(xi, yi); i = 1, 2, . . . , n]
de datos que implica n parejas de valores (x, y). Debe tenerse en cuenta que el
valor de yi depende de xi por medio de una estructura lineal que tambin incluye
el componente aleatorio. La base para el uso de un modelo estadstico relaciona la
forma en que la variable aleatoria Y cambia con x y el componente aleatorio. El
modelo tambin incluye las suposiciones acerca de las propiedades estadsticas del
componente aleatorio. A continuacin se da el modelo estadstico para la regresin
lineal simple.
, que con
frecuencia
recibe el nombre de error aleatorio o alteracin aleatoria, tiene varianza
constante. Es frecuente que a esta parte de las suposiciones se le llame la suposicin
de varianza homognea. La presencia de este error aleatorio,
, impide que
el modelo sea tan slo una ecuacin determinista. Ahora, el hecho de que E( ) = 0
implica que para una x especfi ca los valores de y se distribuyen alrededor de la recta
verdadera o recta de regresin de la poblacin y = + x. Si se elige bien el
modelo, (esto es, no hay regresores adicionales de importancia y la aproximacin
lineal es buena dentro de los rangos de los datos), entonces son razonables los errores
positivos y negativos alrededor de la regresin verdadera. Debe recordarse que en la
prctica se desconocen y , y que deben estimarse a partir de los datos. Adems,
el modelo que se acaba de describir es de naturaleza conceptual. Como resultado, en
la prctica nunca se observan los valores reales
la
verdadera recta de regresin (aunque se acepta que ah est). nicamente es posible
dibujar una recta estimada. La fi gura 5.2 ilustra la naturaleza de los datos (x, y)
hipotticos dispersos alrededor de la verdadera recta de regresin para un caso en
que slo se dispone de n = 5 observaciones. Debe destacarse que lo que observamos
en la fi gura 5.2 no es la recta que utilizan el cientfi co o ingeniero. En vez de ello,
la ilustracin nicamente describe el signifi cado de las suposiciones! A continuacin
se describir la regresin que el usuario tiene a su disposicin.