Sunteți pe pagina 1din 15

23/02/2019

Profesor: Juan Díaz Valencia.


Instituto Tecnológico Metropolitano ITM

1
Fue un biólogo y estadístico inglés, SIR FRANCIS GALTON*,
quien introdujo en 1889 el término regresión en Estadística.
Empleó este concepto para indicar la relación que existía entre la
estatura de los niños de una muestra y la estatura de su padre.
Observó, que si los padres son altos, los hijos generalmente
también lo son, y si los padres son bajos los hijos son también de
menor estatura. Pero ocurría un hecho curioso: cuando el padre es
muy alto o muy bajo, aparece una perceptible "regresión" hacia la
estatura media de la población, de modo que sus hijos retroceden
hacia la media de la estura de sus padres, por cierto, están muy
alejados. Hoy día, el término no se utiliza en ese sentido.

2
Para hacer un análisis de regresión se puede emplear un diagrama de
dispersión, donde se grafica la variable independiente sobre el eje X y la
variable dependiente sobre el eje Y.
La naturaleza de la relación puede tomar muchas formas de tipo lineal o
curvilínea; la mas elemental es la línea recta.

3
MODELO DE REGRESIÓN LINEAL

En este modelo, la pendiente de la recta es b, que representa el


cambio esperado en Y por unidad de cambio en X, el valor de a es el
punto de corte con la ordenada, y constituye el error aleatorio en Y
para cada observación. 4
Para estimar los coeficientes de regresión por medio del método de mínimos
cuadrados, utilizamos las siguientes fórmulas:

σ 𝑋𝑖 𝑌𝑖 − 𝑛𝑋ത 𝑌ത
𝑏=
σ 𝑋𝑖 2 − 𝑛𝑋ത 2
∀ 𝑖 = 1, 2, 3, . . . , 𝑛
𝑎 = 𝑌ത − 𝑏𝑋ത

La regresión se centra en el uso de la relación para determinar la


predicción, la predicción es sencilla de establecer cuando la relación
es perfecta, cuando ocurre esto todos los puntos están sobre una
línea recta y lo único que se hace es obtener la ecuación de la recta
y utilizarla para señalar la predicción, la situación se torna compleja
si la relación es imperfecta.

5
Correlación. Nos indica la dirección y el grado de relación entre la
variable Independiente y Dependiente, la dirección se refiere a si es
positiva o negativa y el grado de relación a su magnitud o fuerza. En
síntesis el coeficiente de correlación expresa de manera cuantitativa
la magnitud y la dirección de una relación.
Un coeficiente de correlación de Pearson puede variar de –1 a +1,
mientras mayor sea el numero mayor será la correlación.

6
Interpretación aproximada del coeficiente de correlación de
Pearson r
-1 ≤ r ≤ 1

r Interpretación
r = -1 Correlación negativa Perfecta
-1 < r ≤ -0,9 Correlación negativa muy fuerte
-0,9 < r ≤ -0,75 Correlación negativa considerable
-0,75 < r ≤ -0,5 Correlación negativa media
-0,5 < r ≤ -0,1 Correlación negativa débil
r=0 No existe correlación
0,1 ≤ r < 0,5 Correlación positiva débil
0,5 ≤ r < 0,75 Correlación positiva media
0,75 ≤ r < 0,9 Correlación positiva considerable
0,9 ≤ r < 1 Correlación positiva muy fuerte
r=1 Correlación positiva perfecta

7
8
El coeficiente de correlación de Pearson (r) es el índice que mide la
magnitud de la relación lineal entre dos variables cuantitativas; nos
muestra el sentido positivo o negativo. Para calcular el valor de r utilizamos
la siguiente formula.
ഥ𝐘
σ 𝐗 𝐢 𝐘𝐢 − 𝐧𝐗 ത
𝐫=
σ 𝐗 𝐢 𝟐 − 𝐧𝐗
ഥ 𝟐 ∗ σ 𝐘𝐢 𝟐 − 𝐧𝐘
ത𝟐
Hay que tener en cuenta que el coeficiente de correlación de Pearson mide
únicamente correlación lineal por lo que no es útil para evaluar otro tipo de
correlación.
Coeficiente de Determinación.
Indica el porcentaje de ajuste que se ha conseguido con el modelo lineal,
es decir el porcentaje de variación de la variable Y, a través de
comportamiento de la variable X.
También se puede entender el coeficiente de determinación como el
porcentaje de varianza explicada por la recta de regresión, el valor está
entre 0 y 1, para calcularlo se eleva el coeficiente el coeficiente de
correlación al cuadrado.
R2 = r2
9
Ejemplo 1.
Halla el coeficiente de correlación de Pearson, halle y explique el coeficiente de
determinación, para los datos de la siguiente tabla.
Elabore la gráfica, construya el modelo de regresión lineal.

N° X Y XY X2 Y2
1 2 7 14 4 49
2 3 10 30 9 100
3 7 8 56 49 64
4 5 6 30 25 36
17 31 130 87 249

𝑋ത = 4,25 b= -0,118644068
a= 8,254237288
𝑌ത = 7,75
r= -0,154041597
r^2= 0,023728814

10
Ejercicio 1.
Se hace un estudio para observar el comportamiento
del precio del EURO del mes de enero del año 2018
con el mes de enero del año 2019. con los datos que se
proporcionan a continuación halle:
1° Estimar el modelo lineal o recta de regresión
2° Interprete el coeficiente de correlación de Pearson.
3° Interprete el coeficiente de determinación.
4° Elabore el grafico de dispersión.

11
AÑO 2018 AÑO 2019
01.01.2018 3.584,50 1.01.2019 3.722,50
02.01.2018 3.534,50 02.01.2019 3.674,00
03.01.2018 3.488,00 03.01.2019 3.696,50
04.01.2018 3.484,50 04.01.2019 3.638,50
08.01.2018 3.484,00 08.01.2019 3.605,50
09.01.2018 3.472,50 09.01.2019 3.619,50
10.01.2018 3.451,00 10.01.2019 3.608,50
11.01.2018 3.437,50 11.01.2019 3.600,00
15.01.2018 3.508,00 15.01.2019 3.585,00
16.01.2018 3.511,50 16.01.2019 3.554,00
17.01.2018 3.465,00 17.01.2019 3.569,00
18.01.2018 3.482,00 18.01.2019 3.550,00
22.01.2018 3.496,50 22.01.2019 3.573,50
23.01.2018 3.511,50 23.01.2019 3.587,00
24.01.2018 3.489,50 24.01.2019 3.585,00
25.01.2018 3.459,00 25.01.2019 3.595,50
26.01.2018 3.495,00 27.01.2019 3.597,00
29.01.2018 3.512,50 29.01.2019 3.605,50
30.01.2018 3.537,50 12
30.01.2019 3.631,00
31.01.2018 3.515,50 31.01.2019 3.554,50
ENERO 2019 vs ENERO 2018 y = 0,6068x + 1486,1
3.740,00
R² = 0,1925

3.720,00

3.700,00

3.680,00
PRECIO EURO2019

3.660,00

3.640,00

3.620,00

3.600,00

3.580,00

3.560,00

3.540,00
3.420,00 3.440,00 3.460,00 3.480,00 3.500,00 3.520,00 3.540,00 3.560,00 3.580,00 3.600,00
PRECIO EURO 2018

13
Análisis del modelo.
La variable independiente, precio del Euro del mes de
enero del 2018 explica el comportamiento de la variable
dependiente, precio del euro del mes de enero del 2019
en un 19,25%.
Si obtenemos el coeficiente de correlación r ≈ 0,4387 este
nos indica que hay una correlación positiva débil entre las
dos variables. En otras palabras el modelo lineal obtenido
no es adecuado para hacer estimaciones con estas dos
variables.

14
carro Kilómetros Costo
1 3147 213,9 Ejercicio.
2 3160 212,6
3 3197 215,3
Una empresa de transporte de pasajeros desea
4 3173 215,3 estimar la relación que existe entre los costos
5 3561 228,2 totales de operación en miles de pesos
6 3292 215,4
7 4013 245,6 mensualmente y los kilómetros recorridos por
8 4244 259,9 cada vehículo que pertenece a la compañía.
9 4159 250,9
10 3776 234,5 La información aparece en la tabla de la
11 3232 205,9 izquierda.
12 3141 202,7
13 2928 198,5 X: Kilómetros recorridos por el vehículo
14 3063 195,6 (variable Independiente)
15 3096 200,4
16 3096 200,1
Y: Costos (gastos de operación mensual) en
17 3158 201,5 miles de pesos (variable dependiente)
18 3338 213,2
19 3492 219,5 1° Estimar el modelo lineal o recta de regresión
20 4019 243,7
21 4394 262,3 2° Interprete el coeficiente de correlación de
22 4251 252,3 Pearson.
23 3844 224,4
24 3276 215,3
3° Interprete el coeficiente de determinación.
25 3184 202,5 4° Elabore la grafica y presente el informe, con
26 3037 200,7
27 3142 201,8
sus respectiva tabla de cálculos.
28 3159 202,1
29 3139 200,4
30 3203 209,3
31 3307 213,9
32 3585 227 15
33 4073 246,4

S-ar putea să vă placă și