Sunteți pe pagina 1din 16

PASO 4.

DESCRIPCION DE LA INFORMACION

Presentado por:

Presentado a:
ALBA DORIS TORRES HERRERA
Tutora

GRUPO N°

204040_263

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
PROGRAMA - PSICOLOGIA
ESTADISTICA DESCRIPTIVA
CEAD - SOGAMOSO
2019
INTRODUCCION

La estadística descriptiva nos permite organizar, describir y presentar un conjunto


de datos con el propósito de facilitar su análisis y aplicación, con el presente
trabajo desarrollaremos temáticas de conocimiento de la Guía de actividades y
rúbrica de evaluación – Paso 4 – presentación de la información, donde se
profundizara en el aprendizaje de manera teórica y práctica los conocimiento
adquiridos en la temática del curso estadística descriptiva y lo planteado en la
presente actividad, en el cual se aplicaran las temáticas como: Análisis de
correlación, Regresión simple, Diagramas de dispersión, Análisis de correlación
múltiple, coeficiente de determinación y coeficiente de correlación, entre otros. Lo
anterior con la aplicación de ejercicios prácticos y teóricos planteados, aplicación
de Variables dependientes e independientes; Representaciones graficas de los
datos suministrados y evaluados de forma estadística teniendo como referencia el
caso de estudio planteado “Indicadores socioeconómicos 115 municipios (2019)
16-4”.
Mediante el siguiente trabajo colaborativo, se dará acercamiento de una forma
general a toda la temática planteada en la guía de actividades del paso número
tres del curso estadística descriptica y de manera gráfica atraves de diagramas de
dispersión.
JUSTIFICACION
Mediante el desarrollo del presente trabajo se da cumplimiento a la guía de
actividades planteada para el trabajo colaborativo, paso 4 “presentación de la
información”; se investigara y representara las por medio de mapa conceptual las
medidas estadísticas Bivariantes de regresión, de igual manera se realizara el
análisis estadístico de las variables independientes y dependientes cuantitativas
de manera práctica teniendo como referencia el caso de estudio planteado
“Indicadores socioeconómicos 115 municipios (2019) 16-4”. Reforzaran los
conocimientos básicos de estadística descriptiva, temática como población,
muestra, muestreo, unidad estadística, unidad estadística, entre otras vistas en la
unidad 1 y diagramas de dispersión.
OBJETIVOS

 Representar de manera gráfica la investigación realizada respecto a las


medidas estadísticas Bivariantes de regresión.

 Aplicar de una manera práctica las medidas estadísticas cuantitativas


independientes y dependientes, con los datos del caso de estudio
propuesto “Indicadores socioeconómicos 115 municipios (2019) 16-4”.

 Seleccionar, organizar y analizar la aplicación de variables cuantitativas


dependientes e independientes, atraves de modelos matemáticos y su
respectivo análisis estadístico, respecto al caso de estudio propuesto
“Indicadores socioeconómicos 115 municipios (2019) 16-4”.

 Conocimiento teórico - práctico y su aplicación de las herramientas


graficas estadísticas diagrama de dispersión de la información analizada
respecto al caso de estudio “Indicadores socioeconómicos 115 municipios
(2019) 16-4”.

ACTIVIDADES
Actividad 1. Mapa Mental.
Descripción de la Actividad:
Resumir mediante un mapa mental las medidas estadísticas Bivariantes de
regresión, describiendo ampliamente al menos una de ellas, regresión lineal
simple o regresión múltiple.

URL: https://mm.tt/1186413980?t=LdAfNj2PGZ
Actividad 2. Definición de Conceptos
Descripción de la Actividad:
Definir brevemente los conceptos básicos asociados a Regresión y Correlación
como:
-Diagrama de dispersión: También se le conoce como gráfico de
puntos o diagrama de XY. Son diagramas que utilizan un grupo de puntos,
ubicados usando las coordenadas cartesianas (X, Y) para expresar valores de 2
variables, ya que, al seguir una variable en cada eje, se detecta la relación o
correlación entre las dos variables.

El diagrama de dispersión, es la representación gráfica de una serie de datos


para dos variables, se analiza la relación entre las 2 variables, conociendo en
qué forma se afectan la una a la otra o en caso contrario qué tan independientes
pueden ser una de la otra.
-Correlación lineal simple: Si deseamos estudiar la relación entre dos variables
cuantitativas y además una de ellas puede considerarse como variable
dependiente o “respuesta” podemos considerar el uso de la regresión lineal
simple. Con la regresión, aparte de medir el grado de asociación entre las dos
variables, podremos realizar predicciones de la variable dependiente.
El objetivo de la regresión lineal simple es encontrar la mejor recta de ajuste de
entre todas las posibles dentro de la nube de puntos. La mejor recta de ajuste será
aquella que minimice las distancias verticales entre cada punto y la recta,
calculándose normalmente por el método de “mínimos cuadrados” (Figura 2B) 1,
5. De este modo conseguiremos una ecuación para la recta de regresión de Y
(variable dependiente) en función de X (variable independiente) de la forma
Y=a+bX.
-Coeficiente de determinación R2: denominado R² y pronunciado R cuadrado,
es un estadístico usado en el contexto de un modelo estadístico cuyo principal
propósito es predecir futuros resultados o probar una hipótesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporción de
variación de los resultados que puede explicarse por el modelo.
Hay varias definiciones diferentes para R² que son algunas veces equivalentes.
Las más comunes se refieren a la regresión lineal. En este caso, el R² es
simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo
cierto para la regresión lineal simple. Si existen varios resultados para una única
variable, es decir, para una X existe una Y, Z... el coeficiente de determinación
resulta del cuadrado del coeficiente de determinación múltiple. En ambos casos
el R² adquiere valores entre 0 y 1.
-Correlación positiva y correlación negativa: Si la gráfica de una recta sube
de la izquierda a la derecha, la pendiente es positiva. Si la gráfica de la recta cae
de la izquierda a la derecha la pendiente es negativa.
-¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
El coeficiente de correlación lineal tiene como propósito determinar cuál es el
grado de intensidad que existe entre dos datos o variables. Por ello, el coeficiente
de correlación lineal sirve para comprobar cuándo la relación entre dos variables
es lineal.
El concepto de coeficiente de correlación lineal también es conocido como
el coeficiente de Pearson y forma parte de una estadística cuyo objetivo es el de
comprobar la intensidad que se da entre las dos variables que pretende definir.
A la hora de definir el coeficiente de Pearson se tendrá en cuenta que el dato no
puede variar a lo largo de su escala de medición. De forma particular, el
coeficiente de correlación lineal nunca podrá dar como resultado números entre el
-1 y el 1. De hecho, podemos hablar de varios tipos o resultados del coeficiente de
Pearson, que son los siguientes:
La covarianza positiva, que se dará siempre y cuando los resultados indiquen una
correlación directa. Esta covarianza será considerada como fuerte en la medida
que se vaya acercando al 1.
La covarianza negativa, hablaremos de ella cuando el resultado arroje una
correlación inversa. Por su parte, esta covarianza será considerada más fuerte en
la medida que se vaya acercando al -1.
Cuando la covarianza es nula, se da en todos aquellos casos cuyo resultado de
cálculo no permite la correlación.
Formula

Actividad 3. Realizar el laboratorio de regresión y correlación lineal


Descripción de la Actividad:
A partir de la base de datos “Indicadores socioeconómicos 115 municipios
(2019) 16-4”, desarrollar el Laboratorio denominado Regresión y correlación, el
cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta Guía para
el uso de recursos educativos. El laboratorio lo puede desarrollar con el programa
Infostat o Excel. Donde el estudiante deberá realizar lo siguiente:

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

Variables cuantitativas:
 Población total(habitantes)
 % de Población de 15 años o más analfabeta

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de relación entre las variables.

Diagrama de dispersión
30.00

25.00
% de analfabetzacion

20.00

15.00 % de Población de 15
años o más analfabeta
10.00 Linear (% de Población de
15 años o más
analfabeta)
5.00

0.00
0 500 000 1 000 000
habitantes

La relación de las variables des de dependencia ya que si aumenta o


disminuye la cantidad de habitantes de un municipio puede afectar el
porcentaje de analfabetismo del mismo según su ponderación y análisis.
c. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

Modelo matemático: y=a+bx


El efecto de predecir una variable sobre la otra teniendo en cuenta que R
de la matriz de datos de las variables seleccionadas es R= – 0.3546 y R2=
0.1245, lo que hace predecir una relación débil o posiblemente nula pero
que hace el modelo matemático sea confiable.

d. Determine el grado de correlación de las dos variables.

La correlación de la matriz de datos de las variables seleccionadas es R= –


0.3546 y R2= 0.1245, lo que hace predecir una relación débil o
posiblemente nula entre las dos variables.

e. Relacionar la información obtenida con el problema.

Variables: Población total (habitantes) y % de Población de 15 años o más


analfabeta.
Observando la tendencia del grafico de dispersión y el grado de correlación
de las dos variables seleccionadas del estudio, se puede relacionar que las
dos variables no son del todo proporcionales, la variación de la cantidad de
habitantes de determinado municipio de forma ascendentes o
descendentes no relaciona de la misma forma el nivel de analfabetismo en
habitantes de 15 años o más.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a


través del modelo matemático calculado.
Para predecir al menos 3 valores independientes nuevos, con un valor
estimado de la población total y así calcular el valor del % de Población
de 15 años o más analfabeta, con el modelo matemático planteado.

y=a+bx

1. sea para x = 5000


y= 10.32+ 0.1245 (5000)
y = 21834.5
Para predecir un % de analfabetismo de cercano al 10.32 la población
total seria de 21834.5 habitantes.

2. sea para x = 10000


y= 10.32+ 0.1245 (10000)
y = 23720
Para predecir un % de analfabetismo de cercano al 10.32 la población
total seria de 23720 habitantes.
3. sea para x = 50000
y= 10.32+ 0.1245 (50000)
y = 27491
Para predecir un % de analfabetismo de cercano al 10.32 la población
total seria de 27491 habitantes.
Nota: Los anteriores valores nos reflejan que las dos variables no son del
todo proporcionales, la variación de la cantidad de habitantes de determinado
municipio de forma ascendentes o descendentes no relaciona de la misma forma
el nivel de analfabetismo en habitantes de 15 años o más.

Actividad 4. Regresión y correlación múltiple.


Descripción de la Actividad:
A partir de la base de datos suministrada “Indicadores socioeconómicos 115
municipios (2019) 16-4”, cada estudiante, deberá:
a. Identificar una variable cuantitativa dependiente y varias variables
cuantitativas independientes del estudio de investigación.
Variable independiente: Población total (habitantes)
Variable dependiente: % Ocupantes en viviendas sin agua de acueducto
% Ocupantes en viviendas sin energía eléctrica
% de Población de 15 años o más analfabeta

b. Realizar el diagrama de dispersión de dichas variables.


 Diagrama de dispersión 1, variables
Variable independiente: Población total (habitantes)
Variable dependiente: % Ocupantes en viviendas sin agua de acueducto
% OCUPANTES EN VIVIENDAS SIN AGUA DE ACUEDUCTO
50.00
% OCUPANTES EN VIVIENDAS SIN AGUA
45.00
40.00
35.00
30.00
% Ocupantes en viviendas sin
25.00 agua de acueducto
20.00
15.00
10.00
5.00
0.00
0 200 000 400 000 600 000 800 000
HABITANTES

 Diagrama de dispersión 2, variables


Variable independiente: Población total (habitantes)
Variable dependiente: % Ocupantes en viviendas sin energía eléctrica

% OCUPANTES EN VIVIENDAS SIN ENERGIAELECTRICA


% OCUPANTES ENVIVIENDAS SINN ENERGIA ELECTRICA

60.00

50.00

40.00

30.00
% Ocupantes en
20.00 viviendas sin energía
eléctrica
10.00

0.00
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
HABIATANTES

 Diagrama de dispersión variables


Variable independiente: Población total (habitantes)
Variable dependiente: % de Población de 15 años o más analfabeta
% DE POBLACION DE 15 AÑOS O MAS ANALFABETA
% POBLACION DE 15 AÑOS O MAS ANALFABETA
30

25

20

15

10

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
HABIATANTES

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.
 Diagrama de dispersión 1, variables
Variable independiente: Población total (habitantes)
Variable dependiente: % Ocupantes en viviendas sin agua de acueducto

50.00
45.00
% OCUPANTES EN VIVIENDAS SIN AGUA

40.00
35.00
30.00
25.00 % Ocupantes en viviendas
sin agua de acueducto
20.00 Linear (% Ocupantes en
15.00 viviendas sin agua de
acueducto)
10.00
5.00
0.00
0 200 000 400 000 600 000 800 000
HABITANTES

Coeficiente de correlación: -0,114053232


 Diagrama de dispersión 2, variables
Variable independiente: Población total (habitantes)
Variable dependiente: % Ocupantes en viviendas sin energía eléctrica
% OCUPANTES ENVIVIENDAS SINN ENERGIA ELECTRICA
60.00

50.00

40.00

30.00 % Ocupantes en viviendas sin


energía eléctrica
Linear (% Ocupantes en
20.00
viviendas sin energía
eléctrica)
10.00

0.00
0 200 000 400 000 600 000 800 000
HABIATANTES

Coeficiente de correlación: - 0,131195577


 Diagrama de dispersión variables
Variable independiente: Población total (habitantes)
Variable dependiente: % de Población de 15 años o más analfabeta

30
% DE POBLACION DE 15 AÑOS O MAS ANALFABETA

25

20

15 % de Población de 15 años o
más analfabeta
10 Linear (% de Población de 15
años o más analfabeta)

0
0 200 000 400 000 600 000 800 000
HABIATANTES

Coeficiente de correlación: - 0,354603087

d. Relacionar la información obtenida con el problema.


Se evidencia que el mayor parte de la población objeto del estudio se encuentra
en un porcentaje inferior al 10 %, de las tres variables de estudio.
Teniendo en cuenta los resultados de los gráficos de dispersión y resultados del
coeficiente de relación de las tres variables, % Ocupantes en viviendas sin agua
de acueducto, % Ocupantes en viviendas sin energía eléctrica y % de Población
de 15 años o más analfabeta, no son directamente proporcionales con el total de
la población de cada de municipio encuestado.

CONCLUSIONES
Se realizó el estudio estadístico de los resultados arrojados de las variables
cuantitativas independientes: Población total (habitantes) y la Variable
cuantitativas dependientes: % Ocupantes en viviendas sin agua de acueducto, %
Ocupantes en viviendas sin energía eléctrica y % de Población de 15 años o más
analfabeta del estudio “Indicadores socioeconómicos 115 municipios (2019)
16-4”.
La estadística descriptiva tiene como objetivo resumir la evidencia encontrada en
una investigación de manera sencilla y clara para su interpretación a través de
herramientas estadísticas como tablas o cuadros, figuras o gráficas e imágenes o
fotografías.
Se realizó el análisis estadístico de la variable cuantitativa dependiente % de
Población de 15 años o más analfabeta, con el modelo matemático planteado. en
base al estudio “Indicadores socioeconómicos 115 municipios (2019) 16-4”.

REFERENCIAS BIBLIOGRAFICAS
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:
Paraninfo. Paginas. 151 – 158
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning. Páginas 686 – 695

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:


Paraninfo. Página 26 -42
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Paginas 41-50

Sitios Web:

www.unad.edu.co, plataforma, curso virtual, estadística descriptiva.

http://www.aulafacil.org/CursoEstadistica/CursoEstadistica.htm Buen curso de


estadística on-line. Sencillo y completo.

S-ar putea să vă placă și