Sunteți pe pagina 1din 20

Unidad 3: Paso 4 - Descripción de la información.

Estadística Descriptiva

Presentado por:
Lina Marcela Ropero Vidal
Código: 1.120.579.731

Tutor: Luis Robinson Camelo

Grupo:
204040_63

Universidad Nacional Abierta y a Distancia

Psicología – Tercer Semestre

San José del Guaviare


Introducción

Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella los


capítulos de correlación y regresión son muy usados en la investigación científica, una
herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre
sí, como por ejem. Nivel de hemoglobina y embarazo en el ámbito de las ciencias de
la salud, la Correlación implica el grado de dependencia de una variable respecto a otra
y la Regresión es otra técnica que ayuda en la investigación de la salud psicología
costos de una empresa etc. Con este trabajo se consolido la información en un informe
descriptivo, que permite detallar la problemática estudiada, utilizando las tablas,
gráficos, diagramas de dispersión, coeficiente de determinación y demás elementos
procesados anteriormente
Justificación

Al realizar este trabajo ponemos en prácticas los conocimientos teóricos que nos
permite analizar la información arrojada a través de medidas bivariantes y regresión y
correlación lineal las cuales nos permite estudiar el problema y detallar sus resultados,
en función de la descripción de la problemática, a partir del trabajo realizado con
variables cuantitativas, de la base de datos denominada.
Objetivos

 Entender los conceptos básicos asociados a Regresión y Correlación.

 Identificar, calcular e interpretar las medidas bivariantes, en función de la


descripción de la problemática.

 Detectar posibles relaciones entre las variables( análisis de correlación)


Mapa Mental
Definición de Conceptos

Diagrama de dispersión
El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un conjunto de
datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué
tanto se afectan entre sí o qué tan independientes son una de la otra. en este
sentido, ambas variables se representan como un punto en el plano cartesiano y de
acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.
Correlación lineal simple
el análisis de correlación lineal simple se usa para determinar la dirección y la
magnitud de dicha relación. La dirección de la relación se refiere a si ésta es positiva o
negativa. La magnitud de la relación o grado de relación entre las variables se refiere a
la fuerza de la relación que existe entre las variables. Se trata de expresar
cuantitativamente el grado de relación que existe entre las variables en estudio.
Coeficiente de determinación R2
El coeficiente de determinación, se define como la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
Correlación positiva y correlación negativa definición
Correlación positiva:
es la relación entre dos variables que muestra que ambas aumentan o disminuyen
simultáneamente.
Correlación negativa:
las dos variables se correlacionan en sentido inversa a valores altos de una de ellas le
suelen corresponder valor bajo de la otra y viceversa.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
La correlación, también conocida como coeficiente de correlación lineal, es una medida
de regresión que pretende cuantificar el grado de variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman
dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el
conjunto de puntos representados se aproxima a una recta.
Análisis de correlación lineal simple de las dos variables cuantitativas
seleccionadas. (Laboratorio)

% Viviendas cantidad de
con algún sercicios
nivel de publicos
hacinamiento disponibles

19,74 0
20,32 0
20,40 0
21,75 0
22,34 1
22,48 1
22,60 1
22,87 1
23,45 1
24,42 1
25,30 1
26,02 1
26,46 1
26,77 1
26,82 1
27,18 1
27,21 2
27,27 2
27,51 2
28,17 2
28,92 2
28,92 2
29,11 2
29,17 2
29,46 2
29,51 2
29,80 2
29,83 2
29,95 2
30,01 2
30,22 2
30,34 2
30,48 2
30,73 2
30,79 2
30,89 2
30,91 2
31,12 2
31,13 2
31,35 2
31,46 2
31,67 2
31,68 2
32,30 2
32,32 2
32,35 2
32,51 2
32,84 2
32,94 3
33,30 3
33,34 3
33,44 3
33,57 3
33,97 3
33,98 3
34,17 3
34,18 3
34,24 3
34,33 3
34,39 3
34,60 3
34,96 3
35,14 3
35,21 3
35,27 3
35,30 3
35,31 3
35,49 3
35,65 3
36,09 3
36,19 3
36,33 3
36,38 3
36,45 3
36,49 4
36,63 4
36,70 4
36,79 4
36,86 4
37,03 4
37,11 4
37,16 4
37,33 4
37,37 4
37,68 4
37,91 4
38,13 4
38,35 4
38,81 5
39,24 5
39,87 5
39,90 5
39,94 5
40,16 5
40,43 5
41,05 5
41,64 5
41,65 5
41,79 5
41,80 5
42,05 5
42,13 5
42,79 5
42,84 5
43,24 5
43,32 5
43,41 5
43,52 5
43,58 6
43,76 6
44,08 6
44,48 6
44,86 6
48,07 6
48,67 7
49,39 7
49,52 7
51,93 7
54,56 7
54,56 7
cantidad de servicios
publicos (X)

% Viviendas con algún


nivel de hacinamiento (Y)

120 municipios de zonas vulnerables por pobreza,


violencia y ausencia del estado en Colombia entre
Mayo 28 y Junio 10 de 2015.
9
cantidad de sercicios publicos disponibles

8
y = 0.2335x - 4.9048
7 R² = 0.9487

0
0.00 10.00 20.00 30.00 40.00 50.00 60.00
-1
% Viviendas con algún nivel de hacinamiento

MODELO MATEMATICO = y = 0,2335x - 4,9048

R CUADRADO = COEFICIENTE DE DETERINACION =0,9487*100%= 94,87 %

R CUADRADO mide la confiabilidad por lo tanto se dice que e coeficiente


determinante si es confiable

GRADO DE CORRELACION ENTRE LAS VARIABLES: COEFICIENTE DE


CORRELACION =R

R CUADRADO NOS DIO 0,9487 A ESTE VALOR SE LE APLICA LA RAIZ CUADRADA Y EL


VALOR QUE QUEDA ES 0,973

HAY UNA CORRELACION EXCELENTES ENTRE LAS VARIABLES DE cantidad de


sercicios publicos disponibles Y % Viviendas con algún nivel de hacinamiento
Análisis de correlación múltiple de las variables cuantitativas seleccionadas.

Población de 15
% de Población años o más sin
Población
de 15 años o Educación básica
total(habitantes)
más analfabeta primaria completa
(Y)
10,82 21 206 7852
3,79 23 241 4135
4,89 21 714 4663
6,38 5 545 1503
5,52 14 648 3248
5,24 57 340 13875
5,14 8 896 2279
9,55 72 812 23680
5,66 17 545 3906
11,27 6 655 2311
9,43 5 400 2042
8,31 4 115 1278
8,52 57 717 17366
10,13 8 276 2960
4,80 57 559 12178
11,36 38 291 14404
7,45 12 664 3940
8,14 64 269 17995
19,47 6 820 3030
5,83 10 029 3235
7,98 21 475 6058
7,13 39 020 10054
4,23 100 534 16352
7,17 26 174 6784
5,45 18 091 4854
10,13 5 933 1942
17,09 17 322 7094
8,27 2 171 816
11,02 17 795 6549
4,18 48 839 9479
14,57 3 771 1653
10,18 5 814 1809
9,80 21 132 7578
7,91 2 082 678
8,31 51 396 17058
4,01 18 632 3697
5,16 23 845 5585
10,56 4 323 1569
2,11 672 641 73296
8,20 10 284 3240
7,16 6 084 2232
10,95 8 781 3192
9,20 23 428 7178
3,46 41 060 7033
9,57 19 005 6581
6,81 31 948 9159
7,57 22 881 6211
13,77 18 634 8352
16,18 9 545 4202
6,50 42 164 12072
4,60 13 218 2253
6,31 5 515 1667
7,16 153 817 39270
6,26 5 499 1659
5,63 21 321 5048
19,31 2 517 1314
7,02 3 755 1170
4,86 14 245 3848
8,28 13 225 3426
9,61 6 034 2177
27,47 18 084 9669
7,61 3 574 1138
5,05 92 967 18348
8,85 30 097 10041
14,82 12 119 4917
8,16 48 408 13559
2,66 255 681 33158
10,59 11 623 4496
18,63 8 691 4065
4,30 138 226 23855
10,26 3 176 1182
9,72 6 647 2301
6,54 65 219 17766
6,72 15 454 4577
5,45 3 762 879
9,56 3 405 1262
5,31 26 306 6899
9,14 31 166 9840
10,83 14 011 4172
10,32 5 755 1973
8,59 3 726 1615
4,21 34 829 7027
5,57 69 031 15656
7,39 14 410 4339
9,69 37 986 11702
8,89 18 096 5890
10,62 16 847 5640
6,53 16 573 4460
6,20 3 511 948
6,66 7 051 2121
8,12 40 105 14010
8,42 10 837 3821
6,55 136 123 35495
4,92 40 697 8779
6,28 9 088 2517
10,39 20 857 7013
2,56 416 626 52149
3,44 608 114 88713
13,11 9 591 3371
8,66 35 050 11635
3,38 478 689 73111
8,83 5 930 1944
8,30 7 256 2003
9,45 4 435 1673
8,88 21 871 6875
12,84 4 234 1647
5,62 6 316 1706
6,09 34 182 7466
11,86 17 325 6491
4,96 13 737 3704
6,61 6 705 1946
9,95 5 798 1971
9,32 15 310 4887
7,20 16 969 4792
12,57 5 638 2395
5,04 18 711 5696
11,04 4 152 1714
8,18 22 284 7698
6,18 27 901 7167
2,30 451 300 49163
DIAGRAMA DE DISPERSION DE DICHAS VARIABLE:

RELACION NIVEL EDUCATIVO VS POBLACION SIN


EDUCACION BASICA
100000
90000
80000
70000
60000
50000
40000
30000
20000
10000
0
0.00 5.00 10.00 15.00 20.00 25.00 30.00
RELACION: TOTAL DE POBLACION TOTAL VS
POBLACION SIN EDUCACION BASICA COMPLETA

100000

90000

80000

70000

60000

50000

40000

30000

20000

10000

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,96223291
Coeficiente de determinación
R^2 0,92589217
R^2 ajustado 0,92462537
Error típico 3908,70196
Observaciones 120

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 2,2333E+10 1,1167E+10 730,890288 7,7099E-67
Residuos 117 1787520271 15277951
Total 119 2,4121E+10

Superior Inferior Superior


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95,0% 95,0%
Intercepción 2368,71994 982,951874 2,40980255 0,0175196 422,035258 4315,40461 422,035258 4315,40461
Variable X 1 0,12852669 0,0035878 35,8232713 6,6123E-65 0,12142124 0,13563214 0,12142124 0,13563214
Variable X 2 111,803862 101,490676 1,10161708 0,27288925 -89,193104 312,800828 -89,193104 312,800828
Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o situación estudiada.

MODELO DE REGRESION
Y=2368,7+0,12885X1+111,803X2

COEFICIENTE DE COORELACION

R^2= 0,9258. POR EL RESULTADO DADO EN LOS ANALISIS PODEMOS DECIR QUE EL VALOR QUE
OBTUBIMOS POR SER UN NUMERO CERCANO A 1,
ES 0,9258 DE DA COMO RESPUESTA QUE ES UNA LINEA DE REGRESION MATEMATICA MUY CONFIABLE.

R^2= 0,9258*100% = 92,58% POR MOTIVO DA COMO RESPUESTA QUE ES UNA LINEA DE REGRESION MATEMATICA CON UN
PORCENTAJE DE MUY CONFIABLE.

COCIENTE CORELACION MULTIPLE

r= raiz cuadrada de 0,9258= 0,9622

r= 0,9622*100% = 96,22%

EN LA ESTADISTICA REALIZADA SOBRE LOS 120 MUNICIPIOS DE ZONAS VULNERABLES POR POBREZA, VIOLENCIA Y AUSENCIA DEL ESTADO
EN COLOMBIA ENTRE MAYO 28 Y JUNIO 10 DE 2015. COMO REFERENCIA ESTAMOS TRABAJANDO EN LA BASE DE DATOS DE LA AUSENCIA
DEL ESTADO EN COLOMBIA, NOS INDICAN QUE LA CORRELACION ENTRE LAS VARIABLES ES EXELENTE, YA QUE SU VALOR DE COEFICIENTE
ES DE 96,22

EN LA ESTADISTICA REALIZADA SOBRE LOS 120 MUNICIPIOS DE ZONAS VULNERABLES POR POBREZA, VIOLENCIA Y AUSENCIA DEL ESTADO
EN COLOMBIA ENTRE MAYO 28 Y JUNIO 10 DE 2015. COMO REFERENCIA ESTAMOS TRABAJANDO EN LA BASE DE DATOS DE LA AUSENCIA
DEL ESTADO EN COLOMBIA, OFRECEN EL 96,22%, Y QUIERE DECIR QUE LA CORRELACION EN LAS VRIABLES ES EXELENTES DEBIDO A SU
RESULTADO EN EL ANALISIS.

EN ESTE ANALISIS SE COMPRUEBA ESTADISTICAMENTE LA RELACION QUE HAY ENTRES LAS TRES VARIABLES DE LA ENCUESTA
:
Población de 15 años o más sin Educación básica primaria completa, Población total(habitantes), % de Población de 15 años o
más analfabeta

CONCLUSION

EN EL PROCESO REALIZADO OBTENEMOS COMO RESULTADOS QUE LAS VARIABLES DE POBLACIÓN DE 15 AÑOS O MÁS SIN EDUCACIÓN
BÁSICA PRIMARIA COMPLETA, POBLACIÓN TOTAL(HABITANTES), % DE POBLACIÓN DE 15 AÑOS O MÁS ANALFABETA NOS IDICAN QUE SE
ENCUENTRAN RELACIONADAS POR MEDIO DE UN MODELO MATEMATICO DE REGRESION MULTIPLE Y=2368,7+0,12885X1+111,803X2, Y
NOS DICE QUE EL PORCENTAJE DE CONFIABILIDAD ES 92,58%, ESTO ES DEBIDO A QUE ALGUNAS VARIABLES SE ENCUENTRAN BAJO UNA
CORRRELACION EXELENTE DEL 0,9622 QUE ES LO MISMO QUE DECIR 96,22%.
Conclusión
a partir de las regresiones lineales se puede generar un modelo matemático,
que permite asociar dos magnitudes y determinar pronósticos entre ellas.

El coeficiente de determinación y correlación muestra el grado de relación


que tienen las magnitudes asociadas.

Para las magnitudes con un coeficiente de correlación bajo, se puede aplicar


otro tipo de regresión (cuadrática, exponencial) que se ajuste de mejor
manera a los datos proporcionados.
Bibliografías

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas.130 172. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=u
nad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico


City:Cengage Learning. Páginas 675 686. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=u
nad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de


mercados.Mexico City: Cengage Learning. Páginas 686 695. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=u
nad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo.


Páginas191 225. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=u
nad&it=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

 Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia. Recuperado


de:http://hdl.handle.net/10596/11579