Documente Academic
Documente Profesional
Documente Cultură
PROFESOR (A):
UNIVERSIDAD “mmmmmmmmmmmm”
FACULTAD “,DFJSDFJJFKDJFJDSFJ”
PROGRAMA “MMMMMMMMMMMM”
CIUDAD-DEPARTAMENTO
2019
INTRODUCCIÓN
JUSTIFICACIÓN
OBJETIVOS ESPECIFICOS
Los diagramas de dispersión son una forma fenomenal de expresar datos de dos
variables, y hacer predicciones basadas en los datos. Al contrario de los
histogramas y los diagramas de caja, los de dispersión muestran valores de datos
individuales.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre
dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo
bien o lo mal que el conjunto de puntos representados se aproxima a una recta.
Tipos:
Sin correlación: no hay una relación aparente entre las variables. Los
puntos en tus videojuegos y tu talla de zapato no parece tener ninguna
correlación; mientras una aumenta, la otra no tiene ningún efecto.
Correlación positiva
Correlación negativa
3. ¿Qué es coeficiente de determinación 𝒓𝟐 ?
De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variable.
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL
PROBLEMA:
En este laboratorio se deseara establecer una relación entre las variable total de
población y el % de la población ocupada con ingreso de hasta 2 salarios mínimos.
Así, podemos plantear unas series de preguntas para nuestro laboratorio que
sería para nuestra relación de tipo 1 ¿Entre más población tenga un municipio
del territorio de Colombia, el % de la población tiene mayor índice a ocupar más
de dos salarios? Y para nuestra relación de tipo 2 ¿Entre más población tenga un
municipio del territorio de Colombia, la población de 15 años o más, se queda
sin educación básica primaria completa?
SOLUCIÓN.
Nombre de la Nombre de la
Nombre del TIPO variable variable
estudiante cuantitativa cuantitativa
1. TENDENCIA % Población
INVERSA O ocupada con ingreso Población
NEGATIVA total(habitantes)
YUDI PAOLA de hasta 2 salarios (X)
VILLORIA mínimos
(Y)
2. TENDENCIA Población de 15
YUDI PAOLA DIRECTA O años o más sin Población
VILLORIA POSITIVA Educación básica total(habitantes)
primaria completa (X)
(Y)
NOTA
En este laboratorio escogimos dos tipos de relaciones; una de tipo directa o
positiva y otra de tipo inversa o negativa.
TIPO 1.
DATOS:
% Población
Población ocupada con
Municipio total(habitantes) ingreso de hasta 2
(X) salarios mínimos
(Y)
1 21 206 38,27
2 23 241 33,26
3 21 714 36,12
4 5 545 50,34
5 14 648 33,35
6 57 340 41,64
7 8 896 46,82
8 72 812 36,66
9 17 545 25,13
10 6 655 52,51
11 5 400 63,73
12 4 115 45,34
13 57 717 34,35
14 8 276 58,82
15 57 559 30,12
16 38 291 53,52
17 12 664 54,18
18 64 269 30,25
19 6 820 54,71
20 10 029 48,11
21 21 475 42,14
22 39 020 31,48
23 100 534 29,52
24 26 174 41,68
25 18 091 50,67
26 5 933 49,75
27 17 322 56,18
28 2 171 45,65
29 17 795 50,00
30 48 839 29,70
31 3 771 66,18
32 5 814 65,02
33 21 132 55,19
34 2 082 51,25
35 51 396 44,81
36 18 632 34,65
37 23 845 31,33
38 4 323 66,99
39 672 641 20,93
40 10 284 62,55
41 6 084 59,94
42 8 781 52,34
43 23 428 44,82
44 41 060 30,10
45 19 005 38,52
46 31 948 40,80
47 22 881 43,32
48 18 634 45,27
49 9 545 42,78
50 42 164 29,98
51 13 218 35,09
52 5 515 47,06
53 153 817 39,46
54 5 499 46,05
55 21 321 33,14
56 2 517 67,38
57 3 755 51,97
58 14 245 36,32
59 13 225 40,37
60 6 034 49,21
61 18 084 62,06
62 3 574 62,04
63 92 967 29,89
64 30 097 45,91
65 12 119 49,91
66 48 408 46,20
67 255 681 23,46
68 11 623 60,28
69 8 691 63,79
70 138 226 28,74
71 3 176 55,07
72 6 647 36,99
73 65 219 32,15
74 15 454 40,35
75 3 762 44,97
76 3 405 40,46
77 26 306 36,37
78 31 166 39,41
79 14 011 46,59
80 5 755 55,71
81 3 726 64,79
82 34 829 37,60
83 69 031 28,43
84 14 410 55,39
85 37 986 33,36
86 18 096 33,83
87 16 847 44,94
88 16 573 45,96
89 3 511 48,52
90 7 051 46,74
91 40 105 49,81
92 10 837 62,08
93 136 123 27,96
94 40 697 40,16
95 9 088 41,94
96 20 857 41,69
97 416 626 19,02
98 608 114 24,17
99 9 591 62,32
100 35 050 47,02
101 478 689 26,79
102 5 930 44,78
103 7 256 36,55
104 4 435 52,94
105 21 871 32,25
106 4 234 58,01
107 6 316 33,21
108 34 182 45,01
109 17 325 37,41
110 13 737 40,25
111 6 705 33,63
112 5 798 46,26
113 15 310 49,50
114 16 969 30,16
115 5 638 48,02
116 18 711 41,38
117 4 152 47,43
118 22 284 39,51
119 27 901 48,20
120 451 300 18,45
121 29 192 35,14
122 6 685 63,49
123 17 585 50,89
124 63 636 41,73
125 17 626 29,03
NOTA:
A continuación presentaremos diferentes tipos de gráficas, para estudiarlas y así
poder analizar y determinar cuál es la más acorde que me permite estudiar dicha
relación entre nuestras variables cuantitativas escogidas.
DIAGRAMA DE DISPERSIÓN LINEAL SIMPLE 𝒚 = 𝒂𝒙 + 𝒃
% Población ocupada con ingreso de hasta 2 % Población ocupada con ingreso de hasta 2 salarios mínimos
80.00
70.00
60.00 y = -5E-05x + 46,133 % Población ocupada con
ingreso de hasta 2 salarios
salarios mínimos
ANALISIS: Se puede decir que el 25% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,50 tendiendo a la mitad indicándonos una
correlación lineal muy baja.
MODELO EXPONENCIAL
80.00
70.00 y = 45,218e-2E-06x
% Población ocupada con
60.00 R² = 0,3605 ingreso de hasta 2 salarios
salarios mínimos
ANALISIS: Se puede decir que el 36% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,60 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
MODELO LOGARÍTMICA
80.00
hasta 2 salarios mínimos
70.00
60.00
y = -6,552ln(x) + 107,69 % Población ocupada con
50.00 R² = 0,4745 ingreso de hasta 2 salarios
mínimos (Y)
40.00
30.00
20.00
Log. (% Población ocupada
10.00
con ingreso de hasta 2
0.00 salarios mínimos (Y))
0 200 000 400 000 600 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 47% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,69 tendiendo un poco más de la mitad
indicándonos una correlación lineal un poco más alta que las anteriores.
MODELO POLINÓMICA
80.00
hasta 2 salarios mínimos
ANALISIS: Se puede decir que el 37% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,60 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
MODELO POTENCIAL
80.00
hasta 2 salarios mínimos
40.00
R² = 0,5314 mínimos (Y)
ANALISIS: Se puede decir que el 53% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,72 tendiendo un poco más de la mitad
indicándonos una correlación lineal buena.
80.00
hasta 2 salarios mínimos
70.00
% Población ocupada con
60.00 y = 218,39x-0,168 ingreso de hasta 2
50.00
40.00
R² = 0,5314 salarios mínimos (Y)
30.00
20.00 Power (% Población
10.00 ocupada con ingreso de
0.00 hasta 2 salarios mínimos
0 200 000 400 000 600 000 800 000 (Y))
Población total(habitantes)
ANALISIS: Se puede decir que el 53% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,72 tendiendo a uno indicándonos una
correlación lineal casi perfecta. Además ese 53% me está representando más
de la mitad de confiablidad para nuestra relación.
Coeficiente de correlación
Columna 1 1
Columna 2 -0,50649 1
𝑦 = 218,39(23000)−0,168
𝑦 = 40,407
Lo que significa que para un total de población de 23.000 obtenemos un
porcentaje (%) Población ocupada con ingreso de hasta 2 salarios mínimos del
40,407%, lo cual es confiable.
𝑦 = 218,39(9870)−0,168
𝑦 = 46,57
Lo que significa que para un total de población de 9.780 obtenemos un porcentaje
(%) Población ocupada con ingreso de hasta 2 salarios mínimos del 46,57%, lo
cual es confiable.
𝑦 = 218,39(98320)−0,168
𝑦 = 31,656
Lo que significa que para un total de población de 98.320 obtenemos un
porcentaje (%) Población ocupada con ingreso de hasta 2 salarios mínimos del
31,656%, lo cual es confiable.
TIPO 2.
DATOS:
Población de 15
Población años o más sin
total(habitantes) Educación básica
primaria completa
21 206 7852
23 241 4135
21 714 4663
5 545 1503
14 648 3248
57 340 13875
8 896 2279
72 812 23680
17 545 3906
6 655 2311
5 400 2042
4 115 1278
57 717 17366
8 276 2960
57 559 12178
38 291 14404
12 664 3940
64 269 17995
6 820 3030
10 029 3235
21 475 6058
39 020 10054
100 534 16352
26 174 6784
18 091 4854
5 933 1942
17 322 7094
2 171 816
17 795 6549
48 839 9479
3 771 1653
5 814 1809
21 132 7578
2 082 678
51 396 17058
18 632 3697
23 845 5585
4 323 1569
672 641 73296
10 284 3240
6 084 2232
8 781 3192
23 428 7178
41 060 7033
19 005 6581
31 948 9159
22 881 6211
18 634 8352
9 545 4202
42 164 12072
13 218 2253
5 515 1667
153 817 39270
5 499 1659
21 321 5048
2 517 1314
3 755 1170
14 245 3848
13 225 3426
6 034 2177
18 084 9669
3 574 1138
92 967 18348
30 097 10041
12 119 4917
48 408 13559
255 681 33158
11 623 4496
8 691 4065
138 226 23855
3 176 1182
6 647 2301
65 219 17766
15 454 4577
3 762 879
3 405 1262
26 306 6899
31 166 9840
14 011 4172
5 755 1973
3 726 1615
34 829 7027
69 031 15656
14 410 4339
37 986 11702
18 096 5890
16 847 5640
16 573 4460
3 511 948
7 051 2121
40 105 14010
10 837 3821
136 123 35495
40 697 8779
9 088 2517
20 857 7013
416 626 52149
608 114 88713
9 591 3371
35 050 11635
478 689 73111
5 930 1944
7 256 2003
4 435 1673
21 871 6875
4 234 1647
6 316 1706
34 182 7466
17 325 6491
13 737 3704
6 705 1946
5 798 1971
15 310 4887
16 969 4792
5 638 2395
18 711 5696
4 152 1714
22 284 7698
27 901 7167
451 300 49163
29 192 6925
6 685 2070
17 585 5900
63 636 20033
17 626 6813
NOTA:
A continuación presentaremos diferentes tipos de gráficas, para estudiarlas y así
poder analizar y determinar cuál es la más acorde que me permite estudiar dicha
relación entre nuestras variables cuantitativas escogidas.
100000
Población de 15 años o más sin
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 92% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,96 Indicándonos una correlación lineal casi
perfecta.
MODELO EXPONENCIAL
300000
250000
completa
200000
y = 3778e7E-06x
150000 R² = 0,4758
100000
50000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 47% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,68 tendiendo un poco más de la mitad
indicándonos una correlación lineal estable.
MODELO LOGARÍTMICA
100000 completa
Población de 15 años o más sin Educación básica primaria completa
básica primaria completa
80000 Log. ( Población de 15 años o más sin Educación básica primaria completa )
20000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
-20000
Población total(habitantes)
ANALISIS: Se puede decir que el 69% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,83 tendiendo más de la mitad indicándonos
una correlación lineal alta.
MODELO POLINÓMICA
100000
90000 y = -1E-07x2 + 0,1962x + 1917,7
básica primaria completa
80000
70000
R² = 0,9454
60000
50000
40000
30000
20000
10000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 94% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,97 tendiendo mucho más de la mitad
indicándonos una correlación lineal casi perfecta.
MODELO POTENCIAL
120000
completa
Educación básica primaria
100000 y = 1,559x0,8281
80000 R² = 0,9546
completa
60000
40000
20000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 95% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,977 tendiendo un poco más de la mitad
indicándonos una correlación lineal casi perfecta.
120000
Población de 15 años o más sin
100000
y = 1,559x0,8281
R² = 0,9546
80000
60000
40000
20000
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Población total(habitantes)
ANALISIS: Se puede decir que el 95% del modelo lineal es confiable para hacer
regresión y su correlación es de 0,9770 tendiendo a uno indicándonos una
correlación lineal casi perfecta. Además ese 95% me está representando casi la
unidad de confiablidad para nuestra relación.
NOTA:
Coeficiente de correlación
Columna 1 1
Columna 2 0,96044051 1
En esta tabla podemos darnos cuenta de que el coeficiente de correlación es de
0,96044051 lo que nos indica una relación muy fuerte. También que los puntos
de nuestra relación pueden ajustarse de manera casi perfecta.
𝑦 = 1,559(200000)0,8281
𝑦 = 38249,79
Lo que significa que para un total de población de 200.000 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
del 38249, lo cual es confiable.
𝑦 = 1,559(83254)0,8281
𝑦 = 18511,15
Lo que significa que para un total de población de 9.780 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
18511, lo cual es confiable.
𝑦 = 1,559(45320)0,8281
𝑦 = 11187
Lo que significa que para un total de población de 98.320 obtenemos de la
población que tengan hasta 15 o más años de educación básica primaria completa
del 11187, lo cual es confiable.
CONCLUSIONES
Se proyecta que para un futuro los índices de ingresos por salarios mínimos
sean más bajos debido a su crecimiento exponencial de población, esto es
para relación de tipo 1.
REFERENCIAS:
https://www.monografias.com/trabajos96/analisis-regresion-y-correlacion/analisis-
regresion-y-correlacion.shtml
https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html