Sunteți pe pagina 1din 30

TRABAJO DE REGRESIÓN Y CORRELACIÓN LINEAL

YUDI PAOLA VILLORIA


CODIGO:

PROFESOR (A):

UNIVERSIDAD “mmmmmmmmmmmm”
FACULTAD “,DFJSDFJJFKDJFJDSFJ”
PROGRAMA “MMMMMMMMMMMM”
CIUDAD-DEPARTAMENTO
2019
INTRODUCCIÓN

En el presente trabajo vamos a laborar con dos variables cuantitativas estudiando


la relación que existe entre ellas mediante la correlación y la regresión. En la
correlación tan solo medimos la dirección y la fuerza de la asociación de una
variable frente a la otra, pero nunca una relación de causalidad. Solo cuando
tenemos una variable que es causa o depende de otra, podremos realizar
entonces una regresión.

JUSTIFICACIÓN

Aprenderemos a identificar la relación que puede existir entre dodos variables


cuantitativas mediante el uso del programa de Excel, teniendo en cuenta el
método que más se utiliza para hacer una regresión y correlación lineal que es la
de Pearson.
OBJETIVOS GENERALES

 Determinar la correlación entre dos variables cuantitativas a través de un


laboratorio de regresión y correlación lineal.

OBJETIVOS ESPECIFICOS

 Determinar la relación existente entre dos variables cuantitativas a través


de las herramientas de Infostat y Excel.

 Analizar datos agrupados para encontrar su relación

 Entender qué tipo de regresión utilizar cuando se tienen datos con


variables dependientes e independientes (Regresión lineal simple o
regresión lineal múltiple).
MAPA MENTAL
CONCEPTOS

1. ¿Qué es un diagrama de dispersión?

Los diagramas de dispersión son una forma fenomenal de expresar datos de dos
variables, y hacer predicciones basadas en los datos. Al contrario de los
histogramas y los diagramas de caja, los de dispersión muestran valores de datos
individuales.

2. ¿Qué es la correlación lineal simple?

La correlación, también conocida como coeficiente de correlación lineal (de


Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre
dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo
bien o lo mal que el conjunto de puntos representados se aproxima a una recta.

Tipos:

 Sin correlación: no hay una relación aparente entre las variables. Los
puntos en tus videojuegos y tu talla de zapato no parece tener ninguna
correlación; mientras una aumenta, la otra no tiene ningún efecto.

 Correlación positiva

 Correlación negativa
3. ¿Qué es coeficiente de determinación 𝒓𝟐 ?

El coeficiente de determinación que se conoce también como r2, es un término


utilizado en estadística, que tiene como función principal predecir el resultado de
hipótesis. Esto es fundamental en cualquier estudio con fundamentos científicos
y sus aplicaciones pueden tener un amplio, rango como en la economía, el estudio
de los mercados o para determinar el éxito de algún producto.

Existen varias definiciones acerca de esta conocida herramienta, las cuales no


todas coinciden, por lo que es importante conocer cada una de ellas, como por
ejemplo aquellas que están relacionadas con la regresión lineal.

4. ¿Qué es la correlación positiva y correlación negativa?

 Correlación positiva: ocurre cuando una variable aumenta y la otra


también. Por ejemplo, la altura de una persona y el tamaño de su pie;
mientras aumenta la altura, el pie también.

 Correlación negativa: es cuando una variable aumenta y la otra disminuye.


El tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen
una correlación negativa, ya que cuando tu tiempo de estudio aumenta,
no te queda tanto tiempo para jugar videojuegos.

5. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de


Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables. Por tanto, es una medida estadística que
cuantifica la dependencia lineal entre dos variables, es decir, si se representan en
un diagrama de dispersión los valores que toman dos variables, el coeficiente de
correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variable.
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

PROBLEMA:

En este laboratorio se deseara establecer una relación entre las variable total de
población y el % de la población ocupada con ingreso de hasta 2 salarios mínimos.
Así, podemos plantear unas series de preguntas para nuestro laboratorio que
sería para nuestra relación de tipo 1 ¿Entre más población tenga un municipio
del territorio de Colombia, el % de la población tiene mayor índice a ocupar más
de dos salarios? Y para nuestra relación de tipo 2 ¿Entre más población tenga un
municipio del territorio de Colombia, la población de 15 años o más, se queda
sin educación básica primaria completa?

SOLUCIÓN.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

TABLA DE PRESENTACIÓN CON RESPECTO AL TRABAJO

Nombre de la Nombre de la
Nombre del TIPO variable variable
estudiante cuantitativa cuantitativa

1. TENDENCIA % Población
INVERSA O ocupada con ingreso Población
NEGATIVA total(habitantes)
YUDI PAOLA de hasta 2 salarios (X)
VILLORIA mínimos
(Y)

2. TENDENCIA Población de 15
YUDI PAOLA DIRECTA O años o más sin Población
VILLORIA POSITIVA Educación básica total(habitantes)
primaria completa (X)
(Y)

NOTA
En este laboratorio escogimos dos tipos de relaciones; una de tipo directa o
positiva y otra de tipo inversa o negativa.

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

TIPO 1.

El porcentaje (%) de ingresos de la Población ocupada con ingreso de hasta 2


salarios mínimos de 125 municipios del territorio Colombiano está relacionada
con el número total de población de cada uno de los 125 municipios. Se desea
establecer la relación que existe entre el número total de población que en este
caso será nuestra variable (X) y el porcentaje (%) de ingresos de la Población
ocupada con ingreso de hasta 2 salarios mínimos (Y).

DATOS:
% Población
Población ocupada con
Municipio total(habitantes) ingreso de hasta 2
(X) salarios mínimos
(Y)
1 21 206 38,27
2 23 241 33,26
3 21 714 36,12
4 5 545 50,34
5 14 648 33,35
6 57 340 41,64
7 8 896 46,82
8 72 812 36,66
9 17 545 25,13
10 6 655 52,51
11 5 400 63,73
12 4 115 45,34
13 57 717 34,35
14 8 276 58,82
15 57 559 30,12
16 38 291 53,52
17 12 664 54,18
18 64 269 30,25
19 6 820 54,71
20 10 029 48,11
21 21 475 42,14
22 39 020 31,48
23 100 534 29,52
24 26 174 41,68
25 18 091 50,67
26 5 933 49,75
27 17 322 56,18
28 2 171 45,65
29 17 795 50,00
30 48 839 29,70
31 3 771 66,18
32 5 814 65,02
33 21 132 55,19
34 2 082 51,25
35 51 396 44,81
36 18 632 34,65
37 23 845 31,33
38 4 323 66,99
39 672 641 20,93
40 10 284 62,55
41 6 084 59,94
42 8 781 52,34
43 23 428 44,82
44 41 060 30,10
45 19 005 38,52
46 31 948 40,80
47 22 881 43,32
48 18 634 45,27
49 9 545 42,78
50 42 164 29,98
51 13 218 35,09
52 5 515 47,06
53 153 817 39,46
54 5 499 46,05
55 21 321 33,14
56 2 517 67,38
57 3 755 51,97
58 14 245 36,32
59 13 225 40,37
60 6 034 49,21
61 18 084 62,06
62 3 574 62,04
63 92 967 29,89
64 30 097 45,91
65 12 119 49,91
66 48 408 46,20
67 255 681 23,46
68 11 623 60,28
69 8 691 63,79
70 138 226 28,74
71 3 176 55,07
72 6 647 36,99
73 65 219 32,15
74 15 454 40,35
75 3 762 44,97
76 3 405 40,46
77 26 306 36,37
78 31 166 39,41
79 14 011 46,59
80 5 755 55,71
81 3 726 64,79
82 34 829 37,60
83 69 031 28,43
84 14 410 55,39
85 37 986 33,36
86 18 096 33,83
87 16 847 44,94
88 16 573 45,96
89 3 511 48,52
90 7 051 46,74
91 40 105 49,81
92 10 837 62,08
93 136 123 27,96
94 40 697 40,16
95 9 088 41,94
96 20 857 41,69
97 416 626 19,02
98 608 114 24,17
99 9 591 62,32
100 35 050 47,02
101 478 689 26,79
102 5 930 44,78
103 7 256 36,55
104 4 435 52,94
105 21 871 32,25
106 4 234 58,01
107 6 316 33,21
108 34 182 45,01
109 17 325 37,41
110 13 737 40,25
111 6 705 33,63
112 5 798 46,26
113 15 310 49,50
114 16 969 30,16
115 5 638 48,02
116 18 711 41,38
117 4 152 47,43
118 22 284 39,51
119 27 901 48,20
120 451 300 18,45
121 29 192 35,14
122 6 685 63,49
123 17 585 50,89
124 63 636 41,73
125 17 626 29,03

NOTA:
A continuación presentaremos diferentes tipos de gráficas, para estudiarlas y así
poder analizar y determinar cuál es la más acorde que me permite estudiar dicha
relación entre nuestras variables cuantitativas escogidas.
 DIAGRAMA DE DISPERSIÓN LINEAL SIMPLE 𝒚 = 𝒂𝒙 + 𝒃

% Población ocupada con ingreso de hasta 2 % Población ocupada con ingreso de hasta 2 salarios mínimos
80.00
70.00
60.00 y = -5E-05x + 46,133 % Población ocupada con
ingreso de hasta 2 salarios
salarios mínimos

50.00 R² = 0,2565 mínimos (Y)


40.00
30.00
20.00
Linear (% Población
10.00 ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)

ANALISIS: Se puede decir que el 25% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,50 tendiendo a la mitad indicándonos una
correlación lineal muy baja.

TIPO DE ASOCIACIÓN: El tipo de asociación entre las variables es de tendencia


inversa o negativa, ya que su pendiente como se puede observar en la gráfica es
negativa.

VARIABLE TENDENCIA TIPO DE ASOCIACIO


X CRECE RELACIÓN INVERSA
Y DECRECE O NEGATIVA

c. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
Análisis de correlación múltiple de las variables cuantitativas

 MODELO EXPONENCIAL

% Población ocupada con ingreso de hasta 2 salarios mínimos


% Población ocupada con ingreso de hasta 2

80.00
70.00 y = 45,218e-2E-06x
% Población ocupada con
60.00 R² = 0,3605 ingreso de hasta 2 salarios
salarios mínimos

50.00 mínimos (Y)


40.00
30.00
20.00
Expon. (% Población
10.00 ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)

ANALISIS: Se puede decir que el 36% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,60 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
 MODELO LOGARÍTMICA

% Población ocupada con ingreso de hasta 2 salarios mínimos


% Población ocupada con ingreso de

80.00
hasta 2 salarios mínimos

70.00
60.00
y = -6,552ln(x) + 107,69 % Población ocupada con
50.00 R² = 0,4745 ingreso de hasta 2 salarios
mínimos (Y)
40.00
30.00
20.00
Log. (% Población ocupada
10.00
con ingreso de hasta 2
0.00 salarios mínimos (Y))
0 200 000 400 000 600 000 800 000
Población total(habitantes)

ANALISIS: Se puede decir que el 47% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,69 tendiendo un poco más de la mitad
indicándonos una correlación lineal un poco más alta que las anteriores.

 MODELO POLINÓMICA

% Población ocupada con ingreso de hasta 2 salarios mínimos


% Población ocupada con ingreso de

80.00
hasta 2 salarios mínimos

60.00 y = 2E-10x2 - 0,0002x + 48,876 % Población ocupada con


ingreso de hasta 2 salarios
R² = 0,3717 mínimos (Y)
40.00

20.00 Poly. (% Población


ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)

ANALISIS: Se puede decir que el 37% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,60 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
 MODELO POTENCIAL

% Población ocupada con ingreso de hasta 2 salarios mínimos


% Población ocupada con ingreso de

80.00
hasta 2 salarios mínimos

% Población ocupada con


60.00 y = 218,39x-0,168 ingreso de hasta 2 salarios

40.00
R² = 0,5314 mínimos (Y)

20.00 Power (% Población


ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)

ANALISIS: Se puede decir que el 53% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,72 tendiendo un poco más de la mitad
indicándonos una correlación lineal buena.

EL MODELO MAS CONFIABLE ES EL POTENCIAL

% Población ocupada con ingreso de hasta 2 salarios mínimos


% Población ocupada con ingreso de

80.00
hasta 2 salarios mínimos

70.00
% Población ocupada con
60.00 y = 218,39x-0,168 ingreso de hasta 2
50.00
40.00
R² = 0,5314 salarios mínimos (Y)

30.00
20.00 Power (% Población
10.00 ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)

ANALISIS: Se puede decir que el 53% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,72 tendiendo a uno indicándonos una
correlación lineal casi perfecta. Además ese 53% me está representando más
de la mitad de confiablidad para nuestra relación.

d. Determine el grado de relación de las dos variables.

El grado de relación se encarga de valorar la asociación entre dos variables


cuantitativas estudiando el método conocido como correlación. Dicho cálculo es
el primer paso para determinar la relación entre las variables.

También, la predicción de una variable dado un valor determinado de la otra


precisa de la regresión lineal es la cuantificación de la fuerza de la relación lineal
entre dos variables cuantitativas, se estudia por medio del cálculo del coeficiente
de correlación de Pearson.
Dicho coeficiente oscila entre –1 y +1. Un valor de –1 indica una relación lineal o
línea recta positiva perfecta. Una correlación próxima a cero indica que no hay
relación lineal entre las dos variables.
El realizar la representación gráfica de los datos para demostrar la relación entre
el valor del coeficiente de correlación y la forma de la gráfica es fundamental ya
que existen relaciones no lineales.

Coeficiente de correlación
Columna 1 1
Columna 2 -0,50649 1

En esta tabla podemos darnos cuenta de que el coeficiente de correlación es de


-0,50649 lo que nos indica una relación estable, ni muy baja y ni muy alta.
También que los puntos de nuestra relación pueden ajustarse de manera estable.

e. Relacionar la información obtenida con el problema.

Así, podemos responder a la pregunta planteada para nuestro laboratorio que


sería para nuestra relación de tipo 1 ¿Entre más población tenga un
municipio del territorio de Colombia, el % de la población tiene mayor índice
a ocupar más de dos salarios?

Respuesta: Cuando la población tiende a crecer potencialmente encontramos


que los valores del porcentaje de población que ocupan hasta dos salarios
mínimos son muy lejanos, por lo que a mayor población menos porcentajes
habrán que ocupen hasta dos ingresos, en efecto podríamos predecir que a
mayor población, más (%) de población podrían ocupar más de dos ingresos,
esto lo podríamos garantizar con un 53% de confiabilidad que me genera el
modelo potencial.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a


través del modelo matemático calculado.

ESTIMACION: para un x conocido y así poder encontrar a Y

 Sea x= 23000 entonces probamos en la ecuación.

𝑦 = 218,39(23000)−0,168
𝑦 = 40,407
Lo que significa que para un total de población de 23.000 obtenemos un
porcentaje (%) Población ocupada con ingreso de hasta 2 salarios mínimos del
40,407%, lo cual es confiable.

 Sea x= 9870 entonces probamos en la ecuación.

𝑦 = 218,39(9870)−0,168
𝑦 = 46,57
Lo que significa que para un total de población de 9.780 obtenemos un porcentaje
(%) Población ocupada con ingreso de hasta 2 salarios mínimos del 46,57%, lo
cual es confiable.

 Sea x= 98320 entonces probamos en la ecuación.

𝑦 = 218,39(98320)−0,168
𝑦 = 31,656
Lo que significa que para un total de población de 98.320 obtenemos un
porcentaje (%) Población ocupada con ingreso de hasta 2 salarios mínimos del
31,656%, lo cual es confiable.

TIPO 2.

La población de 15 años o más sin educación básica primaria completa de 125


municipios del territorio Colombiano está relacionada con el número total de
población de cada uno de los 125 municipios. Se desea establecer la relación que
existe entre el número total de población que en este caso será nuestra variable
(X) y la población de 15 años o más sin Educación básica primaria (Y).

g. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

DATOS:

Población de 15
Población años o más sin
total(habitantes) Educación básica
primaria completa
21 206 7852
23 241 4135
21 714 4663
5 545 1503
14 648 3248
57 340 13875
8 896 2279
72 812 23680
17 545 3906
6 655 2311
5 400 2042
4 115 1278
57 717 17366
8 276 2960
57 559 12178
38 291 14404
12 664 3940
64 269 17995
6 820 3030
10 029 3235
21 475 6058
39 020 10054
100 534 16352
26 174 6784
18 091 4854
5 933 1942
17 322 7094
2 171 816
17 795 6549
48 839 9479
3 771 1653
5 814 1809
21 132 7578
2 082 678
51 396 17058
18 632 3697
23 845 5585
4 323 1569
672 641 73296
10 284 3240
6 084 2232
8 781 3192
23 428 7178
41 060 7033
19 005 6581
31 948 9159
22 881 6211
18 634 8352
9 545 4202
42 164 12072
13 218 2253
5 515 1667
153 817 39270
5 499 1659
21 321 5048
2 517 1314
3 755 1170
14 245 3848
13 225 3426
6 034 2177
18 084 9669
3 574 1138
92 967 18348
30 097 10041
12 119 4917
48 408 13559
255 681 33158
11 623 4496
8 691 4065
138 226 23855
3 176 1182
6 647 2301
65 219 17766
15 454 4577
3 762 879
3 405 1262
26 306 6899
31 166 9840
14 011 4172
5 755 1973
3 726 1615
34 829 7027
69 031 15656
14 410 4339
37 986 11702
18 096 5890
16 847 5640
16 573 4460
3 511 948
7 051 2121
40 105 14010
10 837 3821
136 123 35495
40 697 8779
9 088 2517
20 857 7013
416 626 52149
608 114 88713
9 591 3371
35 050 11635
478 689 73111
5 930 1944
7 256 2003
4 435 1673
21 871 6875
4 234 1647
6 316 1706
34 182 7466
17 325 6491
13 737 3704
6 705 1946
5 798 1971
15 310 4887
16 969 4792
5 638 2395
18 711 5696
4 152 1714
22 284 7698
27 901 7167
451 300 49163
29 192 6925
6 685 2070
17 585 5900
63 636 20033
17 626 6813

NOTA:
A continuación presentaremos diferentes tipos de gráficas, para estudiarlas y así
poder analizar y determinar cuál es la más acorde que me permite estudiar dicha
relación entre nuestras variables cuantitativas escogidas.

 DIAGRAMA DE DISPERSIÓN LINEAL SIMPLE 𝒚 = 𝒂𝒙 + 𝒃

Población de 15 años o más sin Educación básica primaria completa


Población de 15 años o más sin Educación básica primaria completa
Educación básica primaria completa

100000
Población de 15 años o más sin

Linear ( Población de 15 años o más sin Educación básica primaria completa )


80000

60000 y = 0,1272x + 3419,1


40000
R² = 0,9224
20000

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)

ANALISIS: Se puede decir que el 92% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,96 Indicándonos una correlación lineal casi
perfecta.

TIPO DE ASOCIACIÓN: El tipo de asociación entre las variables es de tendencia


directa o positiva, ya que su pendiente como se puede observar en la gráfica es
positiva o creciente.

VARIABLE TENDENCIA TIPO DE ASOCIACIÓN


X CRECE RELACIÓN DIRECTA O
Y CRECE POSITIVA
h. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

Análisis de correlación múltiple de las variables cuantitativas

 MODELO EXPONENCIAL

Población de 15 años o más sin Educación básica primaria completa


Población de 15 años o más sin Educación básica primaria

Población de 15 años o más sin Educación básica primaria completa


350000 Expon. ( Población de 15 años o más sin Educación básica primaria completa )

300000

250000
completa

200000
y = 3778e7E-06x
150000 R² = 0,4758
100000

50000

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000

Población total(habitantes)

ANALISIS: Se puede decir que el 47% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,68 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
 MODELO LOGARÍTMICA

Población de 15 años o más sin Educación básica primaria


Población de 15 años o más sin Educación

100000 completa
Población de 15 años o más sin Educación básica primaria completa
básica primaria completa

80000 Log. ( Población de 15 años o más sin Educación básica primaria completa )

60000 y = 9741.9ln(x) - 85999


R² = 0.6974
40000

20000

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
-20000
Población total(habitantes)

ANALISIS: Se puede decir que el 69% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,83 tendiendo más de la mitad indicándonos
una correlación lineal alta.

 MODELO POLINÓMICA

Población de 15 años o más sin Educación básica primaria completa


Población de 15 años o más sin Educación

100000
90000 y = -1E-07x2 + 0,1962x + 1917,7
básica primaria completa

80000
70000
R² = 0,9454
60000
50000
40000
30000
20000
10000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 94% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,97 tendiendo mucho más de la mitad
indicándonos una correlación lineal casi perfecta.

 MODELO POTENCIAL

Población de 15 años o más sin Educación básica primaria


Población de 15 años o más sin

120000
completa
Educación básica primaria

100000 y = 1,559x0,8281
80000 R² = 0,9546
completa

60000
40000
20000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)

ANALISIS: Se puede decir que el 95% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,977 tendiendo un poco más de la mitad
indicándonos una correlación lineal casi perfecta.

EL MODELO MAS CONFIABLE ES EL POTENCIAL

Población de 15 años o más sin Educación básica primaria completa


Educación básica primaria completa

120000
Población de 15 años o más sin

100000
y = 1,559x0,8281
R² = 0,9546
80000

60000

40000

20000

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 95% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,9770 tendiendo a uno indicándonos una
correlación lineal casi perfecta. Además ese 95% me está representando casi la
unidad de confiablidad para nuestra relación.

NOTA:

Para elegir cual de nuestros modelos se ajustaba mejor para la relación en


nuestras variables tuvimos que escoger entre la Lineal Simple, la Polinómica y la
Potencial. El modelo potencial nuevamente me garantizaba el 95% de
confiabilidad para mi relación por lo cual opte por tomar la decisión de escoger
el modelo potencial.

i. Determine el grado de relación de las dos variables.

El grado de relación se encarga de valorar la asociación entre dos variables


cuantitativas estudiando el método conocido como correlación. Dicho cálculo es
el primer paso para determinar la relación entre las variables.

También, la predicción de una variable dado un valor determinado de la otra


precisa de la regresión lineal es la cuantificación de la fuerza de la relación lineal
entre dos variables cuantitativas, se estudia por medio del cálculo del coeficiente
de correlación de Pearson.
Dicho coeficiente oscila entre –1 y +1. Un valor de –1 indica una relación lineal o
línea recta positiva perfecta. Una correlación próxima a cero indica que no hay
relación lineal entre las dos variables.
El realizar la representación gráfica de los datos para demostrar la relación entre
el valor del coeficiente de correlación y la forma de la gráfica es fundamental ya
que existen relaciones no lineales.

Coeficiente de correlación
Columna 1 1
Columna 2 0,96044051 1
En esta tabla podemos darnos cuenta de que el coeficiente de correlación es de
0,96044051 lo que nos indica una relación muy fuerte. También que los puntos
de nuestra relación pueden ajustarse de manera casi perfecta.

j. Relacionar la información obtenida con el problema.

Así, podemos responder a la pregunta planteada para nuestro laboratorio que


sería para nuestra relación de tipo 2 ¿Entre más población tenga un municipio
del territorio de Colombia, la población de 15 años o más, se queda sin
educación básica primaria completa?

Respuesta: Cuando la población tiende a crecer potencialmente encontramos


que los valores de la población que tengan hasta 15 o más años de educación
básica primaria completa son casi perfecta, en efecto podríamos predecir que a
mayor población, más población del territorio Colombiano de entre 15 o más
años estará sin educación básica primaria completa, esto lo podríamos garantizar
con un 95% de confiabilidad que me genera el modelo potencial.

k. Establezca al menos 3 nuevos valores independientes para ser hallados a


través del modelo matemático calculado.

ESTIMACION: para un x conocido y así poder encontrar a Y

 Sea x= 200.000 entonces probamos en la ecuación.

𝑦 = 1,559(200000)0,8281
𝑦 = 38249,79
Lo que significa que para un total de población de 200.000 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
del 38249, lo cual es confiable.

 Sea x= 83254 entonces probamos en la ecuación.

𝑦 = 1,559(83254)0,8281
𝑦 = 18511,15
Lo que significa que para un total de población de 9.780 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
18511, lo cual es confiable.

 Sea x= 45320 entonces probamos en la ecuación.

𝑦 = 1,559(45320)0,8281
𝑦 = 11187
Lo que significa que para un total de población de 98.320 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
del 11187, lo cual es confiable.
CONCLUSIONES

 Para nuestra regresión y correlación lineal simple de tipo 1, encontramos


una relación estable con un 53% de confiabilidad en el modelo potencial
siendo este el más acto para nuestro estudio.

 Para nuestra regresión y correlación lineal simple de tipo 2, encontramos


una relación estable con un 95% de confiabilidad en el modelo potencial
siendo este el más acto para nuestro estudio.

 Se proyecta que para un futuro los índices de ingresos por salarios mínimos
sean más bajos debido a su crecimiento exponencial de población, esto es
para relación de tipo 1.

 Para un estudio a futuro de la educación del país se deben tener en cuenta


otro aspectos que puedan alterar la variable de educación para la relación
de tipo 2.

REFERENCIAS:

 https://www.monografias.com/trabajos96/analisis-regresion-y-correlacion/analisis-
regresion-y-correlacion.shtml

 https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm

 Churchill, G.A. (2009). "Análisis de Regresión Múltiple."


Investigación de mercados. Mexico City: Cengage Learning

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo.

 https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

S-ar putea să vă placă și