Documente Academic
Documente Profesional
Documente Cultură
GRUPO: 204040_187
Justificacin.
Con el fin de mejorar nuestro aprendizaje atreves de las unidades expuestas, se tomarn
las temticas regresin y correlacin lineal simple y regresin correlacin lineal
mltiple donde se realizar una serie de ejercicios para su mejor compresin y saber.
Objetivos.
Para realizar los ejercicios primero se debe obtener los estimadores de los parmetros,
estimar la varianza del error, obtener los errores estndares de los parmetros estimados,
probar la hiptesis sobre los parmetros, clculo de valores estimados basados en la
ecuacin estimada, estimar el ajuste o la falta de ajuste del modelo.
El modelo a utilizar es Y= a+ bx, a es el intercepto, b es la pendiente de la funcin, la
que nos indica el cambio marginal de Y respecto a X.
En los ejercicios del laboratorio y el grupal se buscar primero en el simple
identificar dos variables cuantitativas de la situacin estudiada que puedan estar
relacionadas.
Dos realizar el diagrama de dispersin de dichas variables y determinar el tipo
de asociacin entre las variables.
Encontrar el modelo matemtico que permite predecir el efecto de una variable
sobre la otra y si es confiable?
Determinar el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
Relacionar la informacin obtenida con el problema.
En el mltiple se identificar una variable cuantitativa
dependiente y varias variables independientes del estudio de investigacin.
Realizar el diagrama de dispersin de dichas variables y calcular la recta de
regresin y el coeficiente de correlacin para probar estadsticamente su
relacin.
Relacionar la informacin obtenida con el
problema.
Anlisis de correlacin lineal simple de las dos variables cuantitativas
seleccionadas.
Maibeth lucia pardo:
1. Regresin y Correlacin lineal Simple
c. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?
Solucin.
a. Las variables cuantitativas son: nmero de muertos y velocidad.
VELOCIDAD
160
140
120
100 f(x) = 5.23x + 47.97
80 R = 0.79
Velocidad
60
40
20
0
0 2 4 6 8 10 12 14
Nmero de Muertos
Asociacin positiva.
- Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
Modelo matemtico y= 0,058x - 0,6267 R2=0,4693. Es un poco confiable
porque su valor es un poco bajo.
- Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
El modelo es R2=0,4693
Porcentaje: 0,4693*100=46,93%
viene siendo de 46,93%. Su grado de relacin es poco aceptable entre las dos
variables.
r= 2 R 2
r= 2 0,4693
r=0,7021395873
porcentaje: 0,7021395873*100=70,21395873% y su correlacin (r) es regular.
10
8
No. De Muertos
6
0
20 40 60 80 100 120 140 160
velocidad
La asociacin es positiva.
- Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
Y=0,1518x-6,2858, R2=0,7971
Es confiable porque su valor es alto, el modelo es R2=0,7971
- Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
El porcentaje 0,7971x100=79,71%
Su grado de relacin es bastante aceptable.
- Relacionar la informacin obtenida con el problema.
Los resultados obtenidos en la recta nos da una relacin bastante aceptable entre las dos
variables velocidad y numero de muerto teniendo una correlacin del 89.28% entre las
dos variables indicando que a mayor velocidad mayor cantidad de muertes en accidentes
de trnsito en la ciudad de Medelln.
Angie Nohelis Cadena
1-Regresin y Correlacin lineal Simple
Las variables cuantitativas que quizs podran estar relacionadas son grados de alcohol
del conductor y nmero de heridos
Estadsticas de la regresin
Coeficiente de correlacin 0,946163514
mltiple
Coeficiente de determinacin 0,895225395
R^2
R^2 ajustado 0,893266991
Error tpico 1,008035533
Observaciones 110
ANLISIS DE VARIANZA
Grados de
libertad
Regresin 2
Residuos 107
Total 109
Coeficientes
Intercepcin -3,069758962
Variable X 1 0,059221055
Variable X 2 2,058677504
a= -3,0697
b1=0.0592
b2=2.0586
Reemplazamos los datos en la ecuacin Y= a+b1X1+b2X2
Modelo matemtico Y= -3.0697+0.0592X1+2.0586X2
Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
R^2 = 0,8952, Por ser cercano a 1, el modelo matemtico es confiable, dicho de otra
manera
R^2 = 0,8952*100% = 85.92%, el modelo matemtico explica el 85.92% de
confiabilidad
R= ( 0,8952)
R= 0,9461*100%= 94.61%
la correlacin entre las variables es excelente, dado que su valor de coeficiente es de
0.9461, dicho de manera porcentual, la correlacin entre las variables es excelente, ya
que ofrece el 94.61%.
Lo anterior comprueba estadsticamente la relacin de las tres variables analizadas;
nmero de muertos, grados de alcohol del conductor y la velocidad
- Relacionar la informacin obtenida con el problema.
Los resultados anteriores indican que las variables nmero de muertos, grados de
alcohol del conductor y la velocidad se encuentras relacionadas a travs de un modelo
matemtico de regresin mltiple Y= -3.0697+0.0592X1+2.0586X2, este modelo
explica el 85.82% de confiabilidad, esto debido a que dicha variables se encuentran en
una correlacin excelente del 94.61%
Leisy Lorena Santa
Grados de alcohol del 0,0 0,3 0,0 0,2 0,6 0,4 0,2 0,6 0,7 0,5
conductor (X)
Edades (Y) 29 38 52 46 21 18 54 33 52 38
Diagrama de Dispersin
50
20
10
0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Grados de alcohol
- Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
Grados de
alcohol del Edad (y) x*y x2 y2
conductor (x)
0,0 29 0 0 841
0,3 38 11,4 0,09 1444
0,0 52 0 0 2704
0,2 46 9,2 0,04 2116
0,6 21 12,6 0,36 441
0,4 18 7,2 0,16 324
0,2 54 10,8 0,04 2916
0,6 33 19,8 0,36 1089
0,7 52 36,4 0,49 2704
0,5 38 19 0,25 1444
3,5 381 126,4 1,8 16023
Y = Variable independiente
A = Intercepto con el eje y
b = a + bX X = Variable dependiente
b = Pendiente
a=
y b x
n
n xy x y
b=
n x2 ( x ) 2
Hallamos el valor b
n xy x y
b=
n x2 ( x ) 2
10(126,4)(3,5)(381)
b=
10 (1,8)-(3,5) 2
12641333,5
b=
18-12,25
69,5
b=
5,75
b = 12,0869565
Hallamos el valor a
a=
y b x
n
( 381)(12,086)(3,5)
a=
10
( 381)42,301
a=
10
338,699
a=
10
a = 33,8699
a = 33,8699
b = a + bX
b = 12,0869565
b = 12,08695 x + 33,8699
Se =
y 2a y b xy
n2
Se =
16023,033,8699( 381 )12,0869(126,4)
102
Se =
16023,012904,43191527,78416
102
Se =
1590,78394
8
Se = 198,847992
Se = 14,10134
S 2
=
y2
2
y
n y
16023
S 2y = (38,1)2
10
2
S y = 1602,31451,61
S 2y = 150,69
Frmula para hallar la correlacin.
2
2 Se
R =1- 2
Sy
2
2 (14,10134)
R =1-
150,69
2 198,8477
R =1-
150,69
R2 = 1 - 1,3195
2
R = 0,3195
Con los resultados obtenidos se puede asegurar que la ecuacin de la recta es una muy
proporcional a la relacin entre las variables de edades y grados de alcohol. El R2
afirma adems que el modelo explica el 31,95 % de la informacin y el valor de r
coeficiente de correlacin lineal hace una correlacin afirmativa entre las variables:
edades y grados de alcohol del estudio de investigacin.
10
EDAD 6
0
0 1 2 3 4 5 6 7
NUMERO DE HERIDOS
10
VELOCIDAD 6
0
0 1 2 3 4 5 6 7
NUMERO DE HERIDOS
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,69758531
Coeficiente de determinacin R^2 0,486625264
R^2 ajustado 0,477029475
Error tpico 1,122367618
Observaciones 110
Ecuacin
Y=b0 + b1x1+ b2x2
Y=-0,040794881+ -0,016113508x1+ 0,058738492x2
r= 2 0,804803534
r= 0,8971084293
la correlacin entre las variables es aceptable dado que su coeficiente es
0,8971084283.
Porcentaje.
0,8971084283*100= 89,71084283
140
120
Velocidad 80
60
40
20
0
0 2 4 6 8 10 12 14
Numero de muertos
Numero de heridos vs velocidad
160
140
120
60
40
20
0
0 1 2 3 4 5 6 7 8
Numero de heridos
140
120
100
f(x) = 17.19x + 43.48
R = 0.8
Velocidad 80
60
40
20
0
0 0.5 1 1.5 2 2.5 3 3.5 4
grados de alcoholemia
r= 2 0,8005
r =0,89470 x 100
r =89,47%
- Relacionar la informacin obtenida con el problema.
Al relacionar la informacin obtenida del anlisis de relacin se puede distinguir la
relacin entre las variables: velocidad, nmero de heridos, grados de alcohol y nmero
de muertos, esta relacin aceptable se observa a travs del modelo matemtico:
Y= 33,265 x 33,654X1 + 47,87X2 + 43,418X3
Que aplica el 80,05% de confiabilidad, con una aceptable correlacin del 89,47% lo
cual nos hace afirmar que en la accidentalidad en Medelln tiene mucha influencia la
velocidad y los grados de alcohol que llevan los conductores.
Nmero de heridos 4
3
2
1
0
20 40 60 80 100 120 140 160
Velocidad
Y= a + b1 X1 + b2X2
1.5
Linear (NUMERO DE MUERTOS)
Horarios Linear (NUMERO DE MUERTOS)
1
0.5
Conclusiones
Referencias Bibliogrficas
Montero, J.M. (2007).Regresin y Correlacin Simple. Madrid: Paraninfo.
Paginas. 130 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc
1361e1929abe203c8219
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db86a0
eb46dae86bbaf74cb9
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=47eaa8f46c19ad1
3af26a0a74e510de2
X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.
Diagrama de Dispersin
105
100
85
80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
% de Hidrocarburos
Respuesta: Con los resultados obtenidos se puede asegurar que la ecuacin de la recta se
puede utilizar como una representacin entre las variables ya que tiene un coeficiente
de correlacin de 87,74%; entonces existe una relacin lineal entre el porcentaje de
hidrocarburo y la pureza.
b Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la
otra. Es confiable?
Respuesta: el modelo matemtico que permite predecir el efecto de una variable sobre la
otra es; el modelo de regresin lineal simple y = 14,947x + 74,283. Es confiable este
modelo porque tiene un coeficiente de correlacin de 87,74%.
y = 14,947x + 74,283
51,4=14,947x + 74,283
51,4-74,283=14,947x
-22,883/14,947=x
-1,531=x
Tenemos que para una pureza del oxgeno igual a 51,4 obtenemos un porcentaje de
-1,531 de hidrocarburo, lo cual es incorrecto ya que los porcentajes de de Hidrocarburos
son positivos; el modelo matemtico lineal hallado plantea que para un porcentaje x=0
(mnimo) tenemos una pureza del 74,283 lo cual sobrepasa el nivel de pureza pedido
(51,4), entonces el modelo realizado no es el ms representativo para responder esta
pregunta.
2 El nmero de libras de vapor (y) consumidas mensualmente por una planta qumica,
se relaciona con la temperatura ambiental promedio (en o F). Para el ao 2015, se
registraron los siguientes valores de temperatura y consumo anual.
Consumo de
Mes Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
Diagrama de Dispersin
800
700
600 f(x) = 9.21x - 6.32
R = 1
500
Temperatura
x
y (umbral de
(porcentaje
reflejo de
de
flexin
sobrepeso)
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
14
12
10
f(x) = - 0.06x + 11.64
8 R = 0.11
Umbral de Reflejo
6
0
10 20 30 40 50 60 70 80 90 100
% de Sobrepeso
y = -0,0629x + 11,642
y = -0,0629(50) + 11,642
y = 14,787
X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Solucin
a)
b) el modelo matemtico es
y=14,947x + 74,283 R2=0,8774 es confiable porque se aproxima al 1.
d) y= a+bx
y= 14,947x+74,283
Y=14,947x+74,283
51,4=14,947X +74,283
74,283-51,4=14,947X
14,947X= 22,883
22,883
X= 14,947
X= 1,530942664
-Asociacin positiva.
r= 2 0,9999
r=0,9999499987
x
y (umbral de
(porcentaje
reflejo de
de
flexin
sobrepeso)
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
Solucin
a)
-Asociacin negativa
B) Modelo matemtico y=-0,0629x +11,642 R2= 0,1115 es poco confiable porque su
porcentaje es bajo.
c) porcentaje de aplicacin del modelo R2=0,1115 viene siendo 11,15%
r= 2 R 2
r= 2 0,1115
d) y= a+bx
y=-0,0629x +11,642
y=-0,0629(50)+11,642
y= -3.145+11,642
y=8,497
el umbral de reflejo de flexin nociceptiva, cuando hay un porcentaje de sobrepeso, de
50 es de 8,497.
MARIA ANDREA BULA
EJERCICIOS:
X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
1. El nmero de libras de vapor (y) consumidas mensualmente por una planta qumica, se
relaciona con la temperatura ambiental promedio (en o F). Para el ao 2015, se
registraron los siguientes valores de temperatura y consumo anual.
Consumo de
Mes Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
x
(porcentaje y (umbral de
de reflejo de
sobrepeso) flexin
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Hidrocarburos y pureza
105
100
85
80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
% de Hidrocarburos
A partir de los resultados obtenidos se podra decir que tiene una tendencia positiva y
una relacin directa, el porcentaje de hidrocarburos es directamente proporcional a la
pureza. El R2 = 0,8774 afirma que la asociacin entre las variables es fuerte-
Ecuacin.
y=14,947x+74,283
R = 0,8774
Podemos observar que en la relacin de las variables podemos determinar que por el
lado de coeficiente de correlacin se puede destacar que su valor debe de ser 0.90 y
1 para poder ser una variable confiable, en el problema presentando se puede ver
que por dicho resultado es una variable confiable
Ecuacin
Y=14,947x+74,283
Y= 51.4
Por lo tanto tenemos que Reemplazar de esta forma:
51.4= 14.94(x) + 74.283
51.4 74.283 = 14.94 x
(- 22.883) / 14.94 = x
Resultado X= - 1.53
Respuesta: donde mediante el desarrollo de la ecuacin se puede observar que la pureza
del oxgeno es igual a 51.4 y el porcentaje de hidrocarburo es -1.53%.
3. El nmero de libras de vapor (y) consumidas mensualmente por una planta qumica,
se relaciona con la temperatura ambiental promedio (en o F). Para el ao 2015, se
registraron los siguientes valores de temperatura y consumo anual.
Consumo de
Mes Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
a) Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.
Temperatura
A partir de los resultados obtenidos se podra decir que tiene una tendencia positiva y
una relacin directa, porque en la ecuacin la recta es una buena estimacin de la
relacin creciente entre dos variables, El R2 0, 9999 afirma que la asociacin entre las
variables es fuerte
Modelo matemtico
Y= a + b
Y= 9.2087x 6.3184
b) Encuentre el modelo matemtico que permite predecir el efecto de una
variable sobre la otra. Es confiable?
El modelo matemtico:
Ecuacin.
Y= 9.2087x 6.3184
R = coeficiente de determinacin
R= 0.9999
En esta ecuacin debemos de multiplicar 0,99 x 100= 99 seria un 99 %
de
Confiabilidad.
Para pode sacar el coeficiente de correlacin tenemos que sacar la raz
cuadrada del coeficiente de determinacin donde esta raz nos arroja un
resultado de 0.99
Podemos observar que en la relacin de las variables podemos determinar que por el
lado de coeficiente de correlacin se puede destacar que su valor debe de ser 0.99 y
1 para poder ser una variable confiable, en el problema presentando se puede ver
que por dicho resultado es una variable confiable.
4. Los investigadores estn estudiando la correlacin entre la obesidad y la
respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexin nociceptiva (y) que es una medida de sensacin de punzada.
Obsrvese que ambas, X e Y, son variables aleatorias
x
y (umbral de
(porcentaje
reflejo de
de
flexin
sobrepeso)
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
a) Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.
En este tipo de diagrama se puede observar que las variables es inversa debido a
que algunas aumentan y las otras a disminuir.