Sunteți pe pagina 1din 17

ESTADÍSTICA

SEMANA 6
ÍNDICE

REGRESIÓN LINEAL ........................................................................................................................ 3


APRENDIZAJES ESPERADOS ........................................................................................................... 3
DEFINICIÓN DE REGRESIÓN LINEAL .......................................................................................... 3
EJEMPLO 1 ............................................................................................................................. 4
EJEMPLO 1.1 .......................................................................................................................... 5
EJEMPLO 1.2 .......................................................................................................................... 7
COEFICIENTE DE DETERMINACIÓN ........................................................................................... 8
COEFICIENTE DE CORRELACIÓN LINEAL .................................................................................... 8
EJEMPLO 1.3 .......................................................................................................................... 9
EJEMPLO 2 ............................................................................................................................. 9
EJEMPLO 2.1 ........................................................................................................................ 11
REGRESIÓN LINEAL MÚLTIPLE ..................................................................................................... 12
EJEMPLO 3 ........................................................................................................................... 13
COMENTARIO FINAL.................................................................................................................... 16
REFERENCIAS ............................................................................................................................... 17

2
ESTE DOCUMENTO CONTIENE LA SEMANA 6
REGRESIÓN LINEAL

APRENDIZAJES ESPERADOS
El objetivo de esta semana es comprender el tipo de problemática donde se puede aplicar un
modelo de regresión lineal y, además, calcular e interpretar los resultados de los diferentes
ejemplos.

INTRODUCCIÓN

El termino regresión tiene sus orígenes a principio del siglo XVIII, donde se utilizaba para buscar
relaciones entre una o más variables que pueden aportar información para explicar otra variable
(variables independientes) y una variable que se quiere explicar (variable dependiente), la
evolución del estudio y la aplicación de esta técnica en el mundo empresarial es en base a la
capacidad que tiene de analizar tendencias de datos históricos para poder predecir
comportamientos futuros de variables tan decisivas como las ventas, la producción o los costos.

DEFINICIÓN DE REGRESIÓN LINEAL


Considérese n puntos en un plano cartesiano (X,Y), digamos (x1,y1), (x2,y2), (x3,y3), …,(xn,yn), la idea
geométrica de regresión lineal, es encontrar una recta de la forma , que pase “lo más cerca” de los
n puntos anteriores, es decir, la distancia entre estos puntos a la recta sea lo más pequeña posible.
Si se define como e1, e2, e3, …,en a estas distancias, se les puede escribir la función como:

Los parámetros de regresión son conocidos como intercepto y pendiente,

respectivamente. Las estimaciones que se obtienen al minimizar la suma


de los cuadrados de las distancias, son llamadas estimaciones del método de los mínimos
cuadrados ordinarios, es decir:

3
ESTE DOCUMENTO CONTIENE LA SEMANA 6
Así la recta de regresión es: son las soluciones a La
variable Y recibe el nombre de variable dependiente y la variable X de independiente.

Solución al problema de regresión


Con un poco de conocimientos en el cálculo de mínimos y máximos, la solución a:

EJEMPLO 1:
Considérese el número de empleados y los gastos fijos que se generan en cuatro empresas muy
similares, se cree que existe una relación lineal entre ambas variables.

Al graficar los valores, queda clara la relación lineal entre ambas variables, esta conclusión se basa
en el análisis de las variables número de empleados y gastos fijos, ya que a medida que aumenta el
numero de empleados (eje x) también aumenta el monto de los gastos fijos, esto se puede
comprobar en el gráfico que se muestra a continuación:

4
ESTE DOCUMENTO CONTIENE LA SEMANA 6
EJEMPLO 1.1: Encontrar e interpretar estimadores de según los datos presentados
en la siguiente tabla:

De la tabla se obtiene:

5
ESTE DOCUMENTO CONTIENE LA SEMANA 6
Si se determinan los errores y se dibuja la recta de regresión, quedaría como sigue:

6
ESTE DOCUMENTO CONTIENE LA SEMANA 6
EJEMPLO 1.2:
Al considerar la siguiente recta: y construir una tabla equivalente a la anterior,
se determinarán los errores de la recta, tal como sigue:

Y se obtiene que la suma de los errores al cuadrado es 2.300, claramente muy superior a la recta
obtenida (en el ejemplo anterior) con el método de los mínimos cuadrados.

7
ESTE DOCUMENTO CONTIENE LA SEMANA 6
COEFICIENTE DE DETERMINACIÓN
Es una medida estadística que permite evaluar el ajuste de la ecuación de regresión a los datos.
De acuerdo al resultado del se pueden interpretar los valores cercanos a 0 como la inexistencia
del ajuste de la recta a los datos, el valor cercano a 1 se puede interpretar como la existencia de
un ajuste importante entre la variable dependiente y la(s) independiente(s).

Por lo tanto,

El coeficiente de determinación corresponde al cuadrado del coeficiente de correlación lineal.

COEFICIENTE DE CORRELACIÓN LINEAL


El coeficiente de correlación (que es una medida de ajuste), cuantifica si el modelo lineal es
apropiado para determinar la relación que existe entre las dos variables y se define como:

Interpretación de resultados:
a) Para valores cercanos a 1 se puede decir que existe una alta asociación lineal positiva, tal como
se presenta en el gráfico A).

b) Para valores cercanos a -1 se puede decir que existe una alta asociación lineal negativa, tal
como se presenta en el gráfico B).

c) Para valores cercanos a 0 se puede decir que no existe asociación lineal, sin descartar algún
otro tipo de asociación, tal como se presenta en el gráfico C).

Para la interpretación, es mejor ocupar el valor que se obtiene de R2•100 que indica el porcentaje
de la variabilidad de Y explicada por la variable X.

Gráficamente, esto se interpreta a través de los siguientes ejemplos:

8
ESTE DOCUMENTO CONTIENE LA SEMANA 6
EJEMPLO 1.3:
Para continuar con el ejemplo anterior, revisemos el resultado del cálculo de R y R2

La interpretación de los resultados es la siguiente: un 99% de variabilidad de los gastos fijos de


estas empresas se explican por el número de empleados que la componen (revisar ejemplo 1)

EJEMPLO 2:
Una compañía local de energía seleccionó una residencia típica para desarrollar un modelo
empírico para el consumo de energía (en kilowatts por día) como una función de la temperatura
promedio diaria durante los meses de invierno. Se obtuvo la siguiente información durante un
periodo de 15 días.

a) Al graficar estos datos, ¿sugiere la gráfica una asociación lineal?

9
ESTE DOCUMENTO CONTIENE LA SEMANA 6
De acuerdo al diagrama de dispersión (puntos), la gráfica si sugiere una asociación lineal negativa,
lo cual se ilustra a través del gráfico: el consumo de energía disminuye a medida que aumenta la
temperatura.

b) Para un modelo lineal simple, obténgase la ecuación estimada de regresión y grafique esta
ecuación sobre la gráfica de la parte a) Al tabular los datos de la siguiente forma:

Se obtienen los siguientes resultados:

10
ESTE DOCUMENTO CONTIENE LA SEMANA 6
Determinando las sumas de cuadrado se calcula el intercepto y la pendiente :

Finalmente, los estimadores:

Por lo que la ecuación estimada de regresión quedaría: La gráfica


representa la recta (color rojo) en el gráfico de la parte a).

c) Interpretar los coeficientes de regresión estimados:

: Por cada grado de aumento de la temperatura, el consumo de energía disminuirá en


aproximadamente 1,78 kW por día: o en forma equivalente por cada grado que disminuya la
temperatura, el consumo de energía aumentará en cerca de 1,78 kW por día.

: Cuando la temperatura alcanza los 0º Celsius, el consumo de energía es de aproximadamente


78,26 kW por día.

EJEMPLO 2.1:

a) Estimar los consumos individuales de energía para las siguientes temperaturas:

-10 -8 -5 -2 1 4 7 10 13

Reemplazando cada uno de los valores de x en la recta de regresión estimada, se obtiene

11
ESTE DOCUMENTO CONTIENE LA SEMANA 6
El resultado del reemplazo de cada una de las temperaturas planteadas, entrega un consumo
estimado, por lo tanto, una vez calculada la ecuación de la recta, es posible interpolar valores de
consumo para distintas temperaturas, se obtiene a modo de ejemplo, para x = -10 se obtiene y =
78,26 – 1,78 • (1)=96,06

b) Determinar el coeficiente de correlación:

Se interpreta 100 • R2 = 100 • (-0,88)2 = 77,44 es decir 77,4% de la variabilidad en los consumos, se
pueden explicar por las temperaturas.

REGRESIÓN LINEAL MÚLTIPLE


Muchos de los problemas de regresión lineal no pueden ser resueltos solo con una variable
independiente, por lo tanto, es necesario ampliar la definición anterior, incorporando 2 o más
variables independientes, en el ejemplo número 3 se revisará un caso aplicado. En términos
generales y simplificados la ecuación quedaría de la siguiente forma:

Para i = 1,2,… n. Escribiendo el modelo para cada una de las observaciones, este puede ser
considerado como un sistema de ecuaciones lineales de la forma.

12
ESTE DOCUMENTO CONTIENE LA SEMANA 6
A continuación se revisaran los resultados de un ejemplo aplicado de regresión lineal múltiple.

EJEMPLO 3:

Una determinada universidad realizó un estudio sobre la relación que existe entre el coeficiente
intelectual (CI) con dos variables explicativas cantidad de horas de estudio semanal y el promedio
de sus calificaciones, para dicho estudio se obtuvo una muestra aleatoria de estudiantes de 8º
básico.

Alumno CI Tiempo estudio (hrs.) Promedio notas


1 110 4 55
2 115 5 63
3 128 9 68
4 112 8 47
5 121 14 68
6 111 5 49
7 126 8 67
8 130 11 50
9 125 20 66
10 117 9 65
Desarrollo:
Ci Tiempo estudio (hrs.) Promedio notas
Media 119,5 9,3 59,8
D.T 7,47 4,81 8,57
Varianza 55,83 23,12 73,51

Los resultados obtenidos en Microsoft Excel son los siguientes:


Estadísticas de la regresión
Coeficiente de correlación múltiple 0,63552795
Coeficiente de determinación R^2 0,40389577
Observaciones 10

Coeficientes calculados:
Parámetros ecuación Coeficientes
Intercepto 98,5907347
TIEMPO estudio (hrs) 0,7422419
PROMEDIO notas 0,234221

Por lo tanto, la ecuación queda de la siguiente forma:

Análisis de residuales
Observación Pronóstico CI Residuos

13
ESTE DOCUMENTO CONTIENE LA SEMANA 6
1 114,4 -4,4
2 117,1 -2,1
3 121,2 6,8
4 115,5 -3,5
5 124,9 -3,9
6 113,8 -2,8
7 120,2 5,8
8 118,5 11,5
9 128,9 -3,9
10 120,5 -3,5

NOTA: Para realizar un análisis de regresión en Microsoft Excel, primero se debe ir a Archivo->
Opciones -> Complementos y habilitar el complemento análisis de datos y luego ir a la opción
Datos->Análisis de datos-> Regresión

Las opciones análisis de datos se encuentran en la siguiente ventana:

Luego seleccionar Regresión y se mostrará la siguiente ventana:

14
ESTE DOCUMENTO CONTIENE LA SEMANA 6
En esta ventana se deben seleccionar dos rangos de entrada, el rango correspondiente a la
variable dependiente (Y) y uno o más columnas con la información de las variables independientes
(X).

Para complementar la información mencionada en esta semana revisar el siguiente link:


http://goo.gl/pqXY4

15
ESTE DOCUMENTO CONTIENE LA SEMANA 6
COMENTARIO FINAL
Durante esta semana aprendimos los conceptos básicos del método de regresión lineal simple, por
lo tanto, podemos complementar nuestro conocimiento sobre la construcción de gráficos de
dispersión vistos en la semana 2 y agregar la recta de la ecuación lineal, adicionalmente también
estamos en condiciones de interpretar los coeficientes de correlación que se obtienen.

16
ESTE DOCUMENTO CONTIENE LA SEMANA 6
REFERENCIAS

Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadística para
administración y economía (10ª edición). Cencage Learning
Canavos, George. (1988). Introducción y estadística descriptiva. Probabilidad y estadística.
México: McGraw-Hill/Interamericana S. A.
Pagano, Robert R. (2011). Estadística para las ciencias del comportamiento (9ª edición).
Cencage Learning.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2012). Estadística. Semana 6.

17
ESTE DOCUMENTO CONTIENE LA SEMANA 6

S-ar putea să vă placă și