Documente Academic
Documente Profesional
Documente Cultură
lineal simple
Herramientas
Matemáticas V -
Estadística II
1
Regresión lineal simple
Bibliografía Básica Análisis de Regresión y Correlación
Para cumplir con los
objetivos de la Unidad 6 Introducción a la Inferencia Estadística
del programa, es necesario
profundizar en los temas La idea de poder predecir cierto valor de una variable a partir del
desarrollados en el conocimiento del valor de otra que la determina o influye ha llevado a
Capítulo 17 y 18 del texto desarrollar las técnicas que presentamos en este módulo.
de Berenson & Levine
(1996), relacionándolo con En particular, la idea es detectar si existe una relación lineal entre dos
los comentarios, ejemplos variables, una que llamaremos dependiente que es condicionada por los
y recomendaciones de las
valores de otra que denominamos independiente o explicatoria.
lecturas del módulo.
Capítulos: 17 (Apartados
17.1, 17.2, 17.3, 17.4, 17.5, Diagrama de dispersión
17.6, 17.7, 17.8, 17.9), 18
(Apartados 18.1 y 18.2) Como siempre en Estadística, un primer análisis exploratorio gráfico
posibilita un avance en el conocimiento sobre un fenómeno, aunque no de
manera concluyente.
2
variable X (independiente) señala el número de horas seguidas de repetición
de la actividad. Para describir la relación aparente entre estas variables,
podríamos indicar que si bien en nuestra muestra hay pocos casos con muy
pocas horas de realización la tarea repetitiva, a medida que más horas se
lleva a cabo continuamente la misma, el número de errores resulta más
elevado. Con la intención de ser más específicos y sintéticos al mismo
tiempo, el modelo de regresión lineal intenta asociar la relación entre estas
variables a través de una línea recta que generalice esta vinculación,
despreciando las oscilaciones específicas de cada caso particular respecto de
la línea recta que indicaría la estructura de la relación entre experiencia y
salario inicial.
Actividad:
3
Tabla 1
modelo lineal puede sintetizarse de manera que represente una línea recta
con la siguiente expresión:
Donde:
4
β0 = la intersección u ordenada al origen poblacional
β1 = la pendiente poblacional
εi = error aleatorio en Y para la i-ésima observación
5
Figura 4: Ordenada al origen 2,7
La relación lineal es uno de los modelos que puede seguir la relación entre
dos variables. En este caso, a su vez, la relación puede ser positiva (tal como
la ejemplificada) o negativa. No obstante, la relación podr ía tener otra
forma (curvilínea, constante, etc.) que pudiera tener enorme interés teórico
y práctico, que se trabaja con técnicas más sofisticadas que las que
presentaremos en este módulo. La siguiente figura ilustra algunas de las
situaciones posibles.
6
Formas de la relación entre dos variables
7
Figura 9: variables que aparentemente no poseen relación
8
Figura 10: Recta de mínimos cuadrados
Método de Mínimos
Cuadrados La ecuación de la recta
Es el método
matemático que
permite encontrar los Esta manera de obtener los valores de b0 y b1, permite seleccionar una de
valores de b0 y b1 que todas las posibles rectas (algunos ejemplos pueden observarse en la figura
hacen mínimas la siguiente) que podrían ser utilizadas para describir la relación. El método de
sumatoria del
mínimos cuadrados aporta un criterio para determinar esa recta. Este
cuadrado de las
criterio corresponde a determinar la recta en la cual los valores reales y los
diferencias entre los
valores predichos tienen la mínima distancia. Como puede observarse en la
valores observados y el
figura previa, la recta de mínimos cuadrados, es la que tiene las menores
obtenido mediante la
distancias totales (ej: la distancia vertical indicada en la figura). En cuanto a
recta de regresión.
si las diferencias (ej) entre la recta de regresión y los valores observados, no
interesa si las diferencias son por exceso o por defecto, por lo tanto, se
trabaja con la suma de desvíos elevados al cuadrado.
9
Figura 11: Otras rextas de regresión “posibles”
Ecuación I:
Ecuación II:
10
Pendiente:
Ordenada:
Ejercicio:
Los siguientes datos corresponden a información sobre pautas de consumo
de individuos adultos de una ciudad metropolitana. La variable X indica la
edad del individuo (medida en años), mientras que la variable Y señala la
cantidad de veces que salieron a comer fuera de su casa, en ocasiones de
esparcimiento, en el último año. Los datos consideran una muestra reducida
de individuos de la ciudad, por tratarse de un estudio piloto.
11
Descripción gráfica de los datos bivariados
Diagrama de dispersión
Tabla auxiliar
12
Cálculo del estimador de la pendiente
13
Por lo tanto, la ecuación estimada de la recta es:
14
En una recta de regresión, para como la indicada, obtenemos la predicción
reemplazando en la ecuación a X por el valor que se desee considerar, y
luego realizamos los cálculos indicados en la ecuación.
15
Error estándar de estimación
Tabla 2
16
El error estándar de la estimación es la medida análoga a la desviación
estándar, y está expresada en la misma unidad de medida que la variable Y.
17
Figura 15: Descomposición de los desvíos respecto de la media
Para obtener cada una de estas medidas, aplicamos las siguientes fórmulas
de cálculo basadas en la parte del desvío respecto de la media que les
corresponde.
18
Figura 16: Relación entre SSR y SSE
Para ello, completemos la tabla que teníamos, con los desvíos que
necesitamos y las respectivas sumas de desvíos al cuadrado:
Tabla 3
Tabla 3
19
Tabla 4
20
El coeficiente de determinación:
21
Referencias
Berenson & Levine (1996). Estadística para administración y economía. Sexta
Edición. Ed. Prentice Hall Hispanoamericana. México.
22