Sunteți pe pagina 1din 20

ESTADISTICA DESCRIPTIVA

Paso 4 - Descripción de la Información

Estudiante:
Andrés Eduardo Fernández Delgado
C.C 16.461.747

Tutor(a):
José Rodrigo González

Curso:
100105_126

Universidad Nacional Abierta y a Distancia


Administración de Empresas
Santiago de Cali, 13 de marzo 2020
Introducción

En muchas situaciones de la vida real, se presentan problemas en los cuales existe una

relación entre dos o más variables y se hace necesario encontrar la naturaleza de esta

relación.

La técnica de Regresión y Correlación, resulta una herramienta muy útil a la hora de

analizar el comportamiento de dos o más variables relacionadas.

Por lo tanto, se puede emplear para construir un modelo que permita predecir el

comportamiento de una variable dada.

La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se

hace de mala forma, por lo cual es necesario realizar una selección adecuada de las

variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no

tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.
Objetivos

Aplicar las medidas bivariantes, en función de la problemática de estudio.

Objetivos específicos

1. Resumir mediante un mapa mental las medidas estadísticas Bivariantes de

regresión y correlación.

2. Definir brevemente los conceptos básicos asociados a regresión y

correlación como: diagrama de dispersión, correlación lineal simple, coeficiente de

determinación r2, correlación positiva y correlación negativa y qué es el coeficiente

de correlación lineal y qué nos ayuda a medir.

3. Desarrollar el Laboratorio denominado Regresión y Correlación lineal.


Justificación

Este ejercicio práctico, pretende hacer la transferencia del conocimiento adquirido a

partir de la elaboración del laboratorio de Regresión y Correlación Lineal, el cual se

realizará utilizando el software gratuito INFOSTAT.

Para ello, en primer lugar aplicaremos el proceso de regresión lineal simple para

determinar tanto la naturaleza como la fuerza de una relación entre dos variables y segundo

lugar la regresión lineal múltiple con la cual describiremos la relación entre dos o más

variables independientes y una variable dependiente utilizando la ecuación de regresión

múltiple; estas ecuaciones de estimaciones nos permitirá realizar una interpretación de

correlación de la investigación realizada en estas instituciones educativas.

El trabajo de laboratorio constituye una de las mejores metodologías para la aplicación

de modelos estadísticos a las variables de los hechos, es por eso que se trabaja en este

sentido y no otro para la práctica de la unidad 3 de regresión y determinación


Actividad 1. Mapa Mental

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y

correlación.

Link: https://www.mindmeister.com/1483585795?t=Ngu3zznQd9
Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

- Diagrama de dispersión.

Dispersión se define como el grado de distanciamiento de un conjunto de valores

respecto a su valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la

clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de

correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o

gráfico de correlación consiste en la representación gráfica de dos variables para un

conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo

qué tanto se afectan entre sí o qué tan independientes son una de la otra.

En este sentido, ambas variables se representan como un punto en el plano cartesiano y

de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

- Correlación lineal simple.

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es

una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos

variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos

variables, es decir, si se representan en un diagrama de dispersión los valores que toman


dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto

de puntos representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado

de intensidad y el sentido de la relación entre dos variables.

Siendo:

Cov (x;y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».

σ(y): desviación típica de «y».

Valores que puede tomar la correlación


ρ = -1          Correlación perfecta negativa

ρ = 0           No existe correlación

ρ = +1         Correlación perfecta positiva

Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y

además con la misma intensidad (+1).

En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además con

la misma intensidad, entonces estamos hablando de correlación negativa (-1).


- Coeficiente de determinación R2

El coeficiente de determinación, se define como la proporción de la varianza total de la

variable explicada por la regresión. El coeficiente de determinación, también llamado R

cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.

Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que

estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado

estará el modelo y, por tanto, menos fiable será.

En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer

lugar, analizaremos el numerador, es decir, la parte de arriba.

A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte

de abajo).
- Correlación positiva y correlación negativa

Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre

sí. Esto es lo que se conoce como correlación.

Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).

Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por

ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie

también.

Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo

de estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya

que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.

Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus

videojuegos y tu talla de zapato no parecen tener ninguna correlación; mientras una

aumenta, la otra no tiene ningún efecto.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El Coeficiente de correlación es una medida que permite conocer el grado de asociación

lineal entre dos variables cuantitativas (X, Y).

En los siguientes Diagramas de dispersión se puede observar que existe una relación

lineal entre la variable X y la variable Y.

El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación

entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las
variables es lineal (es decir, si representáramos en un gráfico los pares de valores de las dos

variables la nube de puntos se aproximaría a una recta).

 
Actividad 3. Realizar el laboratorio de regresión y correlación lineal

1.1. Temperatura – Consumo de gas.

En una ciudad del norte de la costa colombiana fue registrada la temperatura media del

día y la cantidad de gas consumida en algunas de las residencias. Los datos están

representados en la siguiente tabla. Para estudiar la relación entre la temperatura y el

consumo de gas.

X Temperatura Media Y Volumen de Gas


- oC consumido – cm3
3 7
6 5
3 8
1 8
5 7
7 5
9 4
13 3
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las

variables

Es lineal

Temperatura - Volumen de Gas consumido


9 8 8
8 7 x + 8.627
f(x) = − 0.47
7 R² = 0.91
Volumen de Gas

6 5 5
5 4
4 3
3
2
1
0
0 2 4 6 8 10 12 14
Temperatura Media

b. Encuentre el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?


/

Y= mx+b

y = -0,4678x + 8,6233

R² = 0,905

De acuerdo con R2 si es confiable en un 90,5%.


c. Determine el grado de relación de las dos variables.

R ²=❑√ 0,905

Grado de relación= 0,951

El grado de relación es excelente.

d. Determine el Volumen de gas consumido si la temperatura media llega a ser -1

grado oC?

y= -0,4678 (-1) + 8,6233

y= 9,0911

El Volumen de gas consumido seria de 9,0911.

1.5. Temperatura-consumo de gaseosa.

El número de gaseosas (y) consumidas mensualmente en un sector de la ciudad de

barranquilla, se relaciona con la temperatura promedio (en o F). Para el año 2018, se

registraron los siguientes valores de temperatura y consumo de gaseosas.

2018 registros de temperatura y consumos gaseosas.

Consumo
Mes Temperatura (F)
gaseosas (lts)

Ene. 23 188,14
Feb. 26 216,82
Mar. 34 290,38
Abr. 49 427,19
May. 52 457,35
Jun. 61 541,35
Jul. 70 623,9
Ago. 76 677,41
Sep. 64 564,38
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las

variables.

Es lineal

Temperatura - Consumo gaseosas


800
700
600
Consumo deGaseosa

500
f(x) = 17.32 x + 294.37
400 R² = 0.15

300
200
100
0
0 2 4 6 8 10 12 14
Temperatura

b. Ajuste un modelo matemático que permita predecir el efecto de una variable

sobre la otra. ¿Es confiable?

y = 9,2087x - 22,386

R² = 0,9999

De acuerdo con R2 si es confiable en un 99,99%


c. Determine el porcentaje de explicación del modelo y el grado de relación de las

dos variables.

R ²=❑√ 0,9999

Grado de relación= 0,9999 4

El grado de relación es excelente.

d. ¿Cuál es el de consumo de gaseosas cuando la temperatura es de 70 oF?

y = 9,2087 (70) - 22,386

y= 644,609 – 22,386

y= 622,223

El consumo de gaseosas cuando la temperatura es de 70 es de 622,223

1.1. PIB-Energía.
En un estudio realizado por la UNAD se desea analizar si el crecimiento económico
medido por el PIB es influenciado por el consumo de energía a partir de los
siguientes datos:
Consumo de
PIB de la Nación electricidad en
Año MWh
2008 2,057 428,2
2009 2,054 426,0
2010 2,209 464,7
2011 2,297 481,0
2012 2,341 498,4
2013 2,412 516,2
2014 2,424 532,6
2015 2,338 524,6
2016 2,257 520,0

Pib de la Nación- Consumo de electricidad


600

500 f(x) = 273.62 x − 131.92


Consumo de electricidad

R² = 0.85
400

300

200

100

0
2 2.05 2.1 2.15 2.2 2.25 2.3 2.35 2.4 2.45
Pib de la Nación

a. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. ¿Es confiable?
y = 273,62x - 131,92
R² = 0,8465
De acuerdo con R2 si es confiable en un 84,65%
b. Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables.
R ²=❑√ 0,8465

Grado de relación= 0,9 200

El grado de relación es excelente.

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se espera que el PIB
nacional sea del 3,2?
y = 273,62 (3,2) - 131,92
y = 875,584 - 131,92
y = 743,664

La proyección del consumo de electricidad para el año 2021 es de 743,664 MWh


según el aumento del PIB en 3,2 para ese año.
Conclusiones

La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre dos

variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el

valor de una variable, aumenta o disminuye el valor de la otra variable. Para valorar la asociación

entre dos variables, la primera aproximación suele hacerse mediante un diagrama de dispersión.

El coeficiente de correlación de Pearson evalúa específicamente la adecuación a la recta lineal

que defina la relación entre dos variables cuantitativas. El coeficiente no paramétrico de Spearman

mide cualquier tipo de asociación, no necesariamente lineal.

La regresión está dirigida a describir cómo es la relación entre dos variables X e Y, de tal

manera que incluso se pueden hacer predicciones sobre los valores de la variable Y, a partir de los

de X. Cuando la asociación entre ambas variables es fuerte, la regresión nos ofrece un modelo

estadístico que puede alcanzar finalidades predictivas.


Referencias

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 –
158.
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. Páginas 675 – 686
Recuperado de https://economipedia.com/definiciones/coeficiente-de-correlacion-
lineal.html
Recuperado de https://www.shmoop.com/estadistica-basica-probabilidades/diagrama-
dispersion-correlacion.html
Recuperado de https://www.aulafacil.com/cursos/estadisticas/gratis/coeficiente-de-
correlacion-lineal-l11224
Recuperado de https://www.monografias.com/trabajos14/estadistica/estadistica.shtml
Recuperado de http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T04.pdf

S-ar putea să vă placă și