Sunteți pe pagina 1din 24

ESTADISTICA DESCRIPTIVA

UNIDAD 2: PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN.

PRESENTADO POR:

DANNA LIZETH POVEDA FERNANDEZ

GRUPO: 100105_72

TUTOR:

RAMIRO HERNAN POLANCO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

INGENIERIA ELECTRONICA

MAYO 2018
INTRODUCCIÓN.

La estadística descriptiva es la rama de la estadística que recolecta, analiza y


caracteriza un conjunto de datos (peso de la población, beneficios diarios de una
empresa, temperatura mensual,…) con el objetivo de describir las características y
comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.
A través del siguiente trabajo se lleva a cabo la aplicación de conocimientos
referentes a la regresión y determinación mediante la realización de ejercicios
empleando las medidas de regresión y correlación lineal simple y múltiple con
variables cuantitativas.
JUSTIFICACIÓN.

En el presente trabajo se compararon datos cuantitativos para determinar su


correlación y de ésta manera analizarla, partiendo de una realidad que conocemos
y entendemos se podrán formular propuestas encaminadas a la transformación de
una realidad.

Mediante un proceso gradual de clasificación, organización y tabulación de datos


hemos analizado variables cualitativas y cuantitativas, lo que nos permite en éste
momento elaborar un laboratorio apoyados en el análisis y fórmulas del programa
Microsoft Excel.
OBJETIVOS.

GENERAL

Determinar la correlación entre dos variables cuantitativas a través de un

laboratorio de regresión y correlación lineal

ESPECÍFICOS

 Analizar datos agrupados para encontrar su relación

 Participar en la consolidación de un trabajo grupal que evidencie los

aprendizajes adquiridos

 Determinar la relación existente entre dos variables cuantitativas a través

de las herramientas Infostat y Excel


LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL.

1-El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe
entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que
está presente en el condensador principal en un proceso de destilación, de acuerdo
con los siguientes datos:

X
(% de Y
Hidrocarburos) (Pureza)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.
RENDIMIENTO DEL PRODUCTO DE UN PROCESO QUIMICO
102
y = 14,947x + 74,283
100 R² = 0,8774
98

96
PUREZA

94

92

90

88

86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% DE HIDROCARBURO

Posee tendencia positiva y relación directa entre el % de hidrocarburo y la


pureza puesto que a medida que él % aumenta la pureza también aumenta es
decir que la pureza si depende del % de hidrocarburo. La ecuación matemática
es confiable en un 87,74%.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

y = 14,947x + 74,283 R² = 0,8774

R²= coeficiente de determinación = 87,74% por lo tanto es confiable


c. Determine el porcentaje de explicación del modelo y el grado de relación
de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,8774 R= 0,93% La correlación es excelente

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 91,3?

y= pureza.

x= hidrocarburo?.

y= 91,3

91,3= 14,947x+74,283

91,3-74,283=14,947x

17,02/14,947=x

x= 1,13

Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.

2- El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en o F). Para el año
2014, se registraron los siguientes valores de temperatura y consumo anual.

x Temperatura y Consumo de
Mes
(°F) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct.CONSUMO MENSUAL
50 452,93
DE VAPOR POR UNA PLANTA
Nov. 41 369,95
QUIMICA
Dic. 30 273,98
800
y = 9.2087x - 6.3184
CONSUMO DE VAPOR (LB)

700
R² = 0.9999
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA °F

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.

Tendencia positiva, existe una relación directa entre la temperatura y el consumo


de vapor, por lo tanto el número de libras de vapor consumidas mensualmente
por una planta química si se relaciona con la temperatura la cual está
representada en °F, su correlación es excelente con un 0,99%, la R² = 99,99 lo
que significa que posee un alto grado de confiabilidad.
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. Es confiable?

y = 9,2087x - 6,3184 R² = 0,9999

R²= coeficiente de determinación= 99,99 % lo cual es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,9999%

R= 0,99% La correlación es excelente

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

y= consumo de vapor?
x= temperatura en °F

x= 70 °F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.

Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%

3-Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso
ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión
nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que
ambas, X e Y, son variables aleatorias.

x (porcentaje
de
sobrepeso)
O BE S I DAD Y RE S P UE S TA I NDI V I DUAL AL
DO LO R
UMBRAL DE REFLEJO DE

16
14
REFELXIÓN

12 y = -0,0629x + 11,642
R² = 0,1115
10
8
6
4
2
0
0 20 40 60 80 100
% DE SOBREPESO

y (umbral de reflejo
de flexión
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a- Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.
b- Ajuste un modelo matemático que permita predecir el efecto de una
variable sobre la otra. Es confiable?

y = -0,0629x + 11,642

R² = 0,1115

R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable

c-Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

R=coeficiente de correlación

R= raíz cuadrada de 0,1115

R= 0,33% La correlación es mínima

d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?

y= umbral de reflejo de flexión nociceptiva?


x= porcentaje de sobrepeso

X= 40 % Sobrepeso
y= (-0,0629) (40)+ 11,642
y= -2,516 + 11,642
y= 9.126

Cuando el porcentaje de sobrepeso es de 40%, el umbral de


reflejo de flexión nociceptiva es de 9,126.

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE


Identificar dos variables cuantitativas de la situación estudiada que puedan
estar relacionadas.

NUMERO DE HERIDOS DEPENDIENTE Y


VELOCIDAD INDEPENDIENTE X

VELOCIDAD NUMERO
(X) DE
HERIDOS
(Y)
66 3
111 2
66 1
80 2
75 8
66 0
45 0
88 4
55 2
70 6
105 4
88 1
69 2
48 0
70 2
83 2
138 3
68 4
77 2
81 5
50 2
88 4
71 2
55 0
78 2
80 1
68 1
74 3
75 4
83 9
65 0
60 3
83 15
95 2
86 2
68 0
55 1
88 0
63 2
70 0
78 4
83 2
138 3
55 0
66 2
108 4
69 1
72 5
74 3
69 6
79 11
65 2
74 3
77 2
51 1
75 4
72 2
77 6
67 4
55 4
40 2
73 3
69 2
70 0
75 1
55 4
69 1
50 3
73 2
38 0
60 3
50 0
100 4
75 2
80 6
95 4
70 1
66 1
69 1
67 4
83 1
70 2
150 2
55 0
66 1
68 6
79 3
79 2
60 0
33 0
85 2
80 4
81 18
62 9
79 2
76 2
80 2
70 1
80 3
83 2
68 2
79 1
79 2
80 8
75 0
66 0
45 2
77 3
81 4
50 2
88 5
71 2
55 4
78 2
67 2
55 3
40 2
73 0
69 1
70 4
Realizar el diagrama de dispersión de dichas variables y determinar el tipo
de asociación entre las variables.

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

y= 0,033x + 0,3492 R² = 0,0453

R² = coeficiente de determinación= 4,53 % por lo tanto no es confiable.

Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

R= Coeficiente de correlación
R= Raíz cuadrada de 0,0453

R= 0,21 % No hay correlación

Relacionar la información obtenida con el problema.

INDICES ACCIDENTALIDAD EN MEDELLIN


20
18 y = 0,033x + 0,3492
NUMERO DE HERIDOS

16 R² = 0,0453
14
12
10
8
6
4
2
0
0 20 40 60 80 100 120 140 160
VELOCIDAD
En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el
grado de confiabilidad entre las variables Velocidad y Número de heridos es de
4,53%, lo cual significa que no es confiable, no existe correlación entre ellas ya que
su coeficiente corresponde a 0,21%, por lo tanto el número de heridos no depende
de la velocidad de los conductores.

REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

Identificar una variable cuantitativa dependiente y varias variables independientes


del estudio de investigación.

y x1 x2
NUMERO VELOCIDAD GRADOS DE
DE ALCOHOL
MUERTOS DEL
CONDUCTOR
0 66 1,2
1 111 3,0
1 66 0,0
0 80 0,6
0 75 0,0
2 66 0,0
1 45 3,0
2 88 1,4
0 55 2,1
1 70 0,0
0 105 1,6
3 88 2,2
1 69 3,0
2 48 1,1
1 70 2,4
0 83 0,6
0 138 1,6
1 68 0,0
1 77 0,0
1 81 2,1
0 50 1,4
2 88 2,6
1 71 3,0
3 55 2,7
1 78 0,6
0 80 0,0
1 68 2,9
0 74 0,6
1 75 1,8
2 83 0,0
2 65 1,1
2 60 2,4
1 83 0,6
0 95 0,0
0 86 2,9
2 68 1,3
1 55 1,4
4 88 2,1
0 63 0,8
2 70 0,0
0 78 1,2
2 83 3,0
2 138 0,0
1 55 0,6
0 66 1,9
1 108 2,7
0 69 1,1
1 72 2,4
0 74 0,6
0 69 1,6
1 79 0,0
1 65 1,4
0 74 2,1
1 77 0,8
1 51 1,1
0 75 2,4
0 72 0,0
1 77 1,6
0 67 1,2
1 55 3,0
0 40 2,7
1 73 0,6
0 69 0,0
2 70 3,0
1 75 1,1
1 55 2,4
1 69 0,0
0 50 1,6
0 73 0,0
1 38 0,8
0 60 0,3
2 50 1,1
1 100 2,4
1 75 0,6
0 80 0,0
0 95 1,2
2 70 3,0
0 66 2,7
1 69 0,6
0 67 1,9
1 83 1,1
0 70 0,0
0 150 0,6
2 55 1,6
3 66 2,1
1 68 0,8
0 79 0,5
0 79 2,7
1 60 1,1
2 33 2,4
0 85 0,6
1 80 1,6
2 81 1,4
0 62 2,1
1 79 0,0
2 76 3,0
0 80 0,0
1 70 0,6
0 80 1,9
0 83 1,4
1 68 0,0
1 79 2,7
0 79 0,6
0 80 1,9
2 75 2,5
1 66 3,0
0 45 0,6
0 77 0,0
1 81 2,7
1 50 1,3
1 88 2,1
0 71 0,0
2 55 2,6
1 78 3,0
0 67 2,7
1 55 0,6
0 40 1,9
2 73 3,0
1 69 1,1
1 70 2,4

Realizar el diagrama de dispersión de dichas variables.

RELACIÓN: NUMERO DE MUERTOS Vs


VELOCIDAD
4.5
4
NUEMRO DE MUERTOS

3.5
3
2.5
2
1.5
1
0.5
0
0 20 40 60 80 100 120 140 160
VELOCIDAD
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,264226981
Coeficiente de determinación R^2 0,069815897
R^2 ajustado 0,053915314
Error típico RELACION: NUEMERO DE 0,82971621
MUERTOS VS GRADOS DE
Observaciones ALCOHOL 120
4.5
NUMERO DE MUERTOS

4
3.5
3
2.5
2
1.5
1
0.5
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
GRADOS DE ALCOHOL

ANÁLISIS DE
VARIANZA
Grados Promedio de
de Suma de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 6,045474917 3,022737458 4,39077596 0,014497109
Residuos 117 80,54619175 0,688428989
Total 119 86,59166667

Coefici Error Estadís Probab Inferior Superio Inferior Superio


entes típico tico t ilidad 95% r 95% 95,0% r 95,0%
Interce 0,6933 0,3477 1,9939 0,0484 0,0046 1,3821 0,0046 1,3821
pción 96471 56788 12107 8759 82397 10544 82397 10544
- - - -
Variabl 0,0018 0,0043 0,4327 0,6659 0,0104 0,0066 0,0104 0,0066
eX1 70908 23386 41376 993 33148 91332 33148 91332
Variabl 0,2138 0,0740 2,8877 0,0046 0,0671 0,3604 0,0671 0,3604
eX2 37562 49969 46795 2341 85483 89641 85483 89641

y= 0,69339+ (-0,00187x1)+0,21383x2

y= 0,69339-0,00187x1+0,21383x2

Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

R^2=0,0698*100
R^2=6,98% El modelo matemático es confiable en un 6,98%
R=0,26 No hay correlación entre las variables

Relacionar la información obtenida con el problema.

Los resultados estadísticos obtenidos indican que no hay relación entre las
variables: número de muertos, grados de alcohol y velocidad, esto lo podemos
identificar mediante el modelo matemático de regresión múltiple, y= 0,69339-
0,00187x1+0,21383x2, a lo cual solo podemos obtener un 6,98% de confiabilidad,
teniendo en cuenta que el intervalo de correlación es invalida o no hay correlación
alguna. Por consiguiente e claro decir que los muertos dentro de la accidentalidad
en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.

CONCLUSION

En conclusión con este trabajo se desarrolló con claridad todos los ejercicios y
se cumplieron cada uno de los lineamientos expuestos por la universidad
nacional abierta y a distancia UNAD, entendiendo cada uno de los procesos
para llevar a cabo un desarrollo de una determina da investigación; también
aprendimos el manejo de Excel para la aplicación de una investigación.
REFERENCIAS BIBLIOGRÁFICAS

 Estadística descriptiva. Campus virtual UNAD

http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900

 Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes


https://www.youtube.com/watch?v=Ktk263q-W-4

 Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística.

Universidad Santo Tomás, 2013

S-ar putea să vă placă și