Sunteți pe pagina 1din 21

UNIDAD 3 - PASO 4 – ANALIZAR INFORMACIÓN A TRAVÉS DE LAS

MEDIDAS BIVARIANTES

PRESENTADO POR:

FERNANDO AUGUSTO GOMEZ


COD: 88.199.375

TUTOR: STEFFI LUZ PEÑA

GRUPO: 204040_252

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESTADISTICA DESCRIPTIVA
CUCUTA
2017
INTRODUCCION
La industria siempre va a necesitar que se resuelvan problemas que impliquen conjunto de
variables, cuando hay existe una relación entre ambas. Se necesita poder determinar
modelos que den explicación a esta relacion. Cuando, simultáneamente, contemplamos dos
variables continuas, aunque por extensión se pueden emplear para variables discretas
cuantitativas, surgen preguntas y problemas específicos. Se utilizaran estadísticos
descriptivos y técnicas de estimación para responder estas preguntas, y técnicas de
contraste de hipótesis especiales para resolver dichos problemas. Estos métodos
mayormente se encuentran encuadrados entre si con las técnicas de regresión y correlacion.
Estas técnicas se encargan del análisis de los datos para tener conocimientos sobre que es y
que las relacionan entre si a dos o mas variables de una población.
JUSTIFICACION

Gracias a este análisis podemos certificar que en nuestra vida son necesarios los métodos
estadísticos. En muchas áreas de nuestra historia como país hemos utilizados ciertos
métodos, como es el caso del ejemplo utilizado para la realización de este trabajo, ¨
víctimas del conflicto armado en Colombia¨ nos han proporcionado los medios para la
información basados en los datos obtenidos y lograr ver la eficacia con la que se puede
hacer este proceso.
OBJETIVOS

 estimar la recta de regresión por el método de mínimos cuadrados e interpretar su


ajuste.

 dibujar un diagrama de dispersión.


 Representar la recta que define la relación lineal entre dos variables.
 Determinar la relación entre dos o más variables a partir de la regresión lineal
simple y la regresión múltiple.
 Saber calcular la correlación entre dos variables.
Regresión y Correlación lineal Simple
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.

Hay que seleccionar las variables “población cantidad de personas” y “producción en


millones”

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación


entre las variables.
Para realizar el diagrama de dispersión hay que utilizar funciones de Excel:
Primero debemos ordenar las variables:
Después seleccionar el grafico de dispersión:

Produccion Millones
80,000,000

70,000,000 f(x) = 6.85x - 263845774.07


R² = 1
60,000,000

50,000,000

40,000,000

30,000,000

20,000,000

10,000,000

-
40,000,000 42,000,000 44,000,000 46,000,000 48,000,000 50,000,000

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
y=6,8457x-3E+08
R² = 1 =100%
R2 = coeficiente de determinación, nos indica un confiabilidad de 100% en el
modelo matemático

4. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
Coeficiente de correlación √ 1 =1 es una correlación Perfecta.

5. Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o


situación Estudiada.
Variables (X población cantidad), (Y Producción en Millones). Las variables se
correlacionan de manera perfecta, por lo tanto estas variables son validad para realizar
un análisis relacional.
CONCLUSIONES
Los métodos de correlación y regresión son de uso frecuente en diferentes casos de la vida.
Dado que no analizan la industria aportando datos que no son requeridos habitualmente,
pero aportan racionalidad a lo que veremos con detalle en las metodologías multivariadas,
comenzando por la más sencilla: la regresión múltiple. Se debe tener en cuenta que
habitualmente puede ser correcto predecir el valor de Y dentro del rango observado de X,
procedimiento llamado interpolación, sin embargo, es incorrecto extrapolar, es decir
predecir el valor de Y fuera del rango observado de X aplicando la ecuación de regresión,
dado que fuera de los valores observados la función puede cambiar.
REFERENCIAS BIBLIOGRAFICAS

 William Mendenhall y Dennos D. Wackerly. Estadística Matemática con:


http://www.vitutor.com/estadistica/bi/correlacion.html
 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db
86a0eb46dae86bbaf74cb9
 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo.
Páginas 191 – 225.Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=47eaa8f46c1
9ad13af26a0a74e510de2
 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.
130 – 172. Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fc
c1361e1929abe203c8219

 Churchill, G.A. (2009).Análisis de Correlación y de Regresión Simple. México


City: Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89
e57d11ede116134cfce41
ANEXOS LABORATORIOS

EJERCICIOS DE LABORATORIO

1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie
de voluntarios se les administra distintas dosis de sal en su dieta y se mide su
tensión arterial un tiempo después.

X (sal) Y (Tensión)

1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables

Consecuencias consumo de sal.


140

120
f(x) = 6.11x + 88.13
100 R² = 0.99
Tension arterial

80

60

40

20

0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
consumo de sal

Las variables tienen una asociación lineal debido a su coeficiente R2


Coeficiente de correlación es muy confiable en un 98%.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
De acuerdo al análisis del laboratorio en Excel:
Y =6.1062 x+ 88.128
Con un valor
2
R =0.987
Coeficiente de correlación es muy confiable en un 98%.
c. Determine el grado de relación de las dos variables.

El grado de relación de las variables es:


R= √ 0.987=0.99
Igual al 0.99

d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial


esperada?

y=6,1062 x+ 88,128
Y =6,1062 ( 4,8 )+ 88,128
Y =117.43

2. En un nuevo proceso artesanal de fabricación de cierto artículo que está


implantado, se ha considerado que era importante ir anotando periódicamente el
tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el
número de días desde que empezó dicho proceso de fabricación. Con ello, se
pretende analizar como los operarios van adaptándose al nuevo proceso mejorando
paulatinamente su proceso de producción.
Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
proceso artesanal
50
45
40
35
30
Y 25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
X

Se tiene una asociación aproximadamente potencial.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?

proceso artesanal
50
45
40 f(x) = 126.1 x^-0.43
R² = 0.98
35

Y 30
25
20
15
10
0 10 20 30 40 50 60 70 80
X

−0,433
Y =126,1 X
2
El modelo es muy confiable ya que R =0,9807

c. Determine el grado de correlación de las dos variables.


2
R =0,9807
R= √ 0,9807=0,9903
R ( ) =99,03

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 80 días?


−0,433
Y =126,1 X
Y =126,1 ( 80−0,433 )
Y =18,9093

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que


permita determinar la relación entre el peso y la estatura de sus estudiantes. Para
ello selecciona 10 niños y realiza las mediciones respectivas.
A continuación se presentan los resultados:

Estatura 12 12 10 10
118 112 110 115 110 116
(cm) 0 4 7 4
Peso ( kg) 24 23 19 24 21 19 22 16 20 23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
Como variable independiente el peso y dependiente la estatura:

Nutricionista
130

125

120

115

110

105

100

95

90
15 17 19 21 23 25

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?
Nutricionista
130

125

120
f(x) = 2.16x + 68.07
R² = 0.83
115

110

105

100
15 17 19 21 23 25

Si es confiable el modelo:
Y =2,1576 X + 68,074

c. Determine el grado de correlación de las dos variables.


2
R =0,8329
R2 ( ) =83,29
R= √ 0,8329=0,9126
R=91,26

d. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
Y =2,1576 X + 68,074
120=2,1576 X+ 68,074
X =24,0665

LABORATORIO

EJERCICIOS

4. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie
de voluntarios se les administra distintas dosis de sal en su dieta y se mide su
tensión arterial un tiempo después.

X (sal) Y
(Tensión
)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

e. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables

Y (Tensión)
125
120
f(x) = 4.37x + 94.2
115 R² = 0.98

110
105
100
95
90
85
80
0 1 2 3 4 5 6 7

2
Las variables tienen una asociación lineal debido a su coeficiente R

f. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?
De acuerdo al análisis del laboratorio en Excel:

Y =4.37 X +94.2
Con un valor
2
R =0.9793
Es decir un 97.93% de confiabilidad del modelo.
g. Determine el grado de relación de las dos variables.

El porcentaje de explicación es 97,93%


El grado de relación de las variables es:
R= √ 0.9793=0.9895
Igual al 98,95%.

h. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial


esperada?

Y =4.37 X +94.2
Y =4.37 ( 4,8 ) + 94.2
Y =115,176

5. En un nuevo proceso artesanal de fabricación de cierto artículo que está


implantado, se ha considerado que era importante ir anotando periódicamente el
tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el
número de días desde que empezó dicho proceso de fabricación. Con ello, se
pretende analizar como los operarios van adaptándose al nuevo proceso mejorando
paulatinamente su proceso de producción.
Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

e. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
proceso artesanal
50
45
40
35
30
Y 25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
X

Se tiene una asociación aproximadamente potencial.

f. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?

proceso artesanal
50
45
40 f(x) = 126.1 x^-0.43
R² = 0.98
35

Y 30
25
20
15
10
0 10 20 30 40 50 60 70 80
X

−0,433
Y =126,1 X
2
El modelo es muy confiable ya que R =0,9807

g. Determine el grado de correlación de las dos variables.


2
R =0,9807
R= √ 0,9807=0,9903
R ( ) =99,03

h. Que tiempo deberá tardarse un empleado cuando lleven 80 días?


Y =126,1 X −0,433
Y =126,1 ( 80−0,433 )
Y =18,9093

6. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que


permita determinar la relación entre el peso y la estatura de sus estudiantes. Para
ello selecciona 10 niños y realiza las mediciones respectivas.
A continuación se presentan los resultados:

Estatura 12 12 10 10
118 112 110 115 110 116
(cm) 0 4 7 4
Peso ( kg) 24 23 19 24 21 19 22 16 20 23

e. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
Como variable independiente el peso y dependiente la estatura:

Nutricionista
130

125

120

115

110

105

100

95

90
15 17 19 21 23 25
f. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. Es confiable?

Nutricionista
130

125

120
f(x) = 2.16x + 68.07
R² = 0.83
115

110

105

100
15 17 19 21 23 25

Si es confiable el modelo:
Y =2,1576 X + 68,074

g. Determine el grado de correlación de las dos variables.


2
R =0,8329
R2 ( ) =83,29
R= √ 0,8329=0,9126
R=91,26

h. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
Y =2,1576 X + 68,074
120=2,1576 X+ 68,074
X =24,0665

DESARROLLO.

Regresión y Correlación lineal Simple


A partir de la base de datos suministrada, cada estudiante debe:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.
Se seleccionan las variables tasa de desempleo y tasa de empleo:

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación


entre las variables.
Al ordenar las variables y realizar el diagrama de dispersión se obtiene lo siguiente:
Se observa que existe un comportamiento lineal entre las variables.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Al realizar el modelo matemático que describe el comportamiento de las variables,
siguiendo el procedimiento determinado en el laboratorio se encuentra lo siguiente:

De acuerdo al valor de R2 se puede afirmar que el modelo no es confiable, por tanto las
variables no tienen un comportamiento lineal, ni se relacionan entre ellas.

- Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
Como se tiene que 2
R =0,5483 , su valor porcentual sería de R2 ( ) =54,83 . Por tanto
el valor de R=0,7404 y su valor en porcentaje corresponde a R ( ) =74,04

- Relacionar la información obtenida con el problema.


De acuerdo a los valores obtenidos en la regresión de las dos variables, se observa que
estas no tienen ninguna correlación, por tanto se puede afirmar que la tasa de desempleo no
tiene un comportamiento lineal con la tasa de empleo y por tanto no son dos variables que
dependan una de la otra.

S-ar putea să vă placă și