Sunteți pe pagina 1din 11

ANALISIS ESTADISTICO PARA LA INGENIERIA

Ejercicios Resueltos - “Regresio n Lineal”

PROBLEMA 1
Un ingeniero está investigando el efecto de la temperatura de operación de proceso en el
rendimiento del producto. El estudio da como resultado los siguientes datos:

Temperatura, ℃ 100 110 120 130 140 150 160 170 180 190
Rendimiento, % 45 51 54 61 66 70 74 78 85 89
Tabla 1. Datos asociados a la temperatura de operación de cierto proceso y rendimiento del producto procesado. 1

a) Ajuste una recta de regresión e interprete los valores de los coeficientes.


b) Pruebe con 5% nivel de significación, si existe relación lineal entre las variables.
c) Indique qué porcentaje de variabilidad del rendimiento está explicado por la
temperatura. Comente el resultado.
d) Pruebe con 5% de significación que al aumentar la temperatura en 1℃ el
rendimiento del producto aumenta en menos de un 0,5%.
e) Construya un intervalo de 95% de confianza para el rendimiento del producto
cuando la temperatura de operación del proceso es de 150℃.
f) Estime con 98% la variación del rendimiento cuando la temperatura de operación
del proceso aumenta en 10 ℃.
g) Construya un intervalo de 95% para el intercepto. Comente los resultados.

SOLUCIÓN 1-A

Sean:
X: Temperatura de operación de proceso de cierto producto, en ℃.

Y: Rendimiento del producto, en %.

Se tiene el modelo de regresión lineal, mostrado en la ecuación (1)

𝑌𝑖 = 𝛽0 + 𝛽1 ∙ 𝑥𝑖 + 𝑢𝑖 , ∀𝑖 = 1,2, … , 𝑛 (1)

Luego, es posible obtener los parámetros 𝛽0 y 𝛽1 directamente de la calculadora,


ingresando los valores muestrales de ambas variables, los cuales se han expuesto en la tabla
1. Así, se obtiene la siguiente recta ajustada presentada a continuación.

𝑦̂𝑖 = −2,7394 + 0,4830 𝑥𝑖 , 𝑐𝑜𝑛 𝑖 = 1,2, … ,10

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Conclusión
El valor -2,7394 no tiene sentido práctico y el valor 0,4830 indica que si la temperatura de
operación del proceso aumenta en 1℃, el rendimiento promedio del producto aumenta en
0,483%. Además, para que logremos visualizar de mejor forma el ajuste realizado, se
expone el siguiente gráfico en el cual se han dispuesto los puntos asociados a las variables
de interés, para luego obtener la línea de tendencia con sus respectivos parámetros.

Ajuste Lineal
2
100

90
y = 0,483x - 2,7394
80 R² = 0,9963

70
Rendimiento , en %

60

50

40

30

20

10

0
0 50 100 150 200
Temperatura de Operación, en ºC

SOLUCIÓN 1-B

En este caso, se planteará un test de hipótesis que pruebe si existe relación lineal entre las
variables estudiadas.

Dócima

𝐻0 : ⍴ = 0
𝐻1 : ⍴ ≠ 0

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Estadística

El estadístico de prueba a utilizar en este caso, se presenta en la ecuación (2), donde "𝑟" es
el coeficiente de correlación, "𝑟 2 " el coeficiente de determinación y "𝑛" el número de
muestra. El valor asociado al coeficiente de correlación, es posible determinarlo
directamente de la calculadora, ingresando los parámetros estipulados en el enunciado.

𝑟 ∙ √𝑛 − 2
𝑇= (2)
√1 − 𝑟 2
3
0,9981√8
𝑇= → 𝑇 = 46,169
√1 − 0,99812

Región Crítica

En este tipo de dócima, la región de rechazo está dada según la ecuación (3).

𝑇 < −𝑡(𝑛−2;1−𝛼) ˅ 𝑇 > 𝑡(𝑛−2;1−𝛼) (3)


2 2

Reemplazando en la ecuación (3), con ayuda de la tabla de la distribución “t-Student”, es


posible determinar la región de rechazo.

𝑅𝐶: 𝑇 < −𝑡(8 ; 0,975) ˅ 𝑇 > 𝑡(8 ;0,975) → 𝑇 < −2,3060 ˅ 𝑇 > 2,3060

Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
(T) pertenece a la región de rechazo, por lo que se rechaza la hipótesis nula. Con esto, es
posible inferir que el modelo lineal es significativo, por lo que sí existe asociación lineal
entre las variables en estudio.

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

SOLUCIÓN 1-C

Directamente de la calculadora, es posible obtener el valor del coeficiente de correlación


"𝑟", valor que nos permite obtener el coeficiente de determinación, el cual está dado por
𝑟 2 = 0,9963. Esto indica que el 99,63% de la variabilidad en el rendimiento está explicada
por el modelo, es decir por la temperatura. A partir de lo anteriormente expuesto, es
posible inferir que el ajuste es bastante bueno, ya que sólo queda un 0,37% de variación
asociado a otras variables que se encuentran fuera del alcance de este estudio.

SOLUCIÓN 1-D

En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.

Dócima

𝐻0 : 𝛽1 ≥ 0,5
𝐻1 : 𝛽1 < 0,5

Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:

𝐻0 : Al aumentar la temperatura en 1ºC, el rendimiento del producto no aumenta en menos


de un 0,5%.

𝐻1 : Al aumentar la temperatura en 1ºC, el rendimiento del producto aumenta en menos de


un 0,5%.

Estadística

En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (4).

𝛽1
𝑇= (4)
𝑠𝛽1

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (5)
√∑(𝑥𝑖 − 𝑥̅ )2

𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠 − 𝑏12 𝑠𝑥2 ) (6)
𝑛−2 𝑦

Reemplazando, se obtiene:
5
9
𝑠𝑦𝑥 = √ (14,65192 − 0,48302 ∙ 30,27652 ) = 0,9503
8

0,9503
𝑠𝛽1 = = 0,0105
√218500 − 10 ∙ 1452
0,483 − 0,5
𝑇= → 𝑇 = −1,6191
0,0105

Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,5 que corresponde al valor porcentual del
rendimiento del producto, el cual se pide probar en el enunciado.

Región Crítica

En este caso, la región de rechazo se encuentra dada de la siguiente forma:

𝑇 < −𝑡(𝑛−2,1−𝛼) → 𝑇 < −𝑡(8,0,95) → 𝑇 < −1,86

Conclusión

Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto, es posible inferir que al aumentar la temperatura
en 1ºC, el rendimiento del producto no aumenta en menos de un 0,5%, por lo que no se
acepta la información planteada.

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

SOLUCIÓN 1-E

El intervalo de confianza solicitado, es posible obtenerlo a partir de la ecuación (7).

1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (𝑌) = 𝑏0 + 𝑏1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √1 + + (7)
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Reemplazando en la ecuación expuesta anteriormente, contextualizándola así con el


ejercicio, se obtiene el siguiente intervalo confidencial.
6

1 (150 − 145)2
𝐼𝐶 (𝑌/𝑥 = 150) = −2,7394 + 0,483 ∙ 150 ∓ 𝑡(8;0,975) ∙ 0,9503√1 + +
10 8250

𝐼𝐶(𝑌/𝑥 = 150) = 69,7106 ∓ 2,306 ∙ 0,9503 ∙ 1,050

𝐼𝐶(𝑌/𝑥 = 150) = (67,41 ; 72,01)%

Conclusión
Con un 95% de confianza, es posible afirmar que cuando la temperatura de operación es de
150ºC, el rendimiento del producto fluctúa entre un 67,41% y un 72,01%.

SOLUCIÓN 1-F

El intervalo de confianza solicitado, es posible obtenerlo a partir de la ecuación (8).

𝐼𝐶 (𝛽1 ) = 𝑏1 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑏1 (8)


2

Reemplazando en la ecuación expuesta anteriormente, es posible estimar los valores del


rendimiento, para cuando la temperatura de operación aumenta 1ºC, obteniendo lo
siguiente:

𝐼𝐶 (𝛽1 ) = 0,483 ∓ 𝑡(8;0,99) ∙ 0,0105 = 0,483 ± 2,8965 ∙ 0,0105

𝐼𝐶 (𝛽1 ) = (0,4526 ; 0,5134)%

Finalmente, es necesario obtener el intervalo confidencial que represente la variación del


rendimiento, cuando la temperatura de operación aumenta en 10ºC, lo que se determina
de la siguiente forma:

10 ∙ 𝐼𝐶 (𝛽1 ) = (45,26; 51,34)%

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Conclusión
Con un 98% de confianza, cuando la temperatura de operación del proceso aumenta en 10
ºC, el rendimiento del producto fluctúa entre un 45,26% y un 51,34%.

SOLUCIÓN 1-G

El intervalo de confianza solicitado, es posible obtenerlo a partir de las ecuaciones (9) y (10).

𝐼𝐶 (𝛽0 ) = 𝑏0 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑏0 (9) 7


2

1 𝑥̅ 2
𝑠𝑏0 = 𝑠𝑦𝑥 ∙ √ + (10)
𝑛 ∑(𝑥𝑖 − 𝑥)2

Reemplazando en las ecuaciones expuestas anteriormente, se obtiene:

1 1452
𝑠𝑏0 = 0,9503 ∙ √ + → 𝑠𝑏0 = 1,5465
10 10 ∙ 28,72282

𝐼𝐶 (β0 ) = −2,7394 ∓ 𝑡(8;0,975) ∙ 1,5465 = −2,7394 ∓ 2,306 ∙ 1,5465

→ 𝐼𝐶 (β0 ) = (−6,3056; 0,8268)

Conclusión
Con un 95% de confianza, es posible inferir que el valor del intercepto fluctúa entre -6,3056
y 0,8268. Como el cero pertenece al intervalo confidencial, podríamos afirmar con 95% de
confianza que en el modelo no debiera incluirse el intercepto. El modelo más adecuado
sería 𝑦𝑖 = 𝛽 𝑥𝑖 + 𝑢𝑖 .

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

PROBLEMA 2
Para determinar si existe una relación lineal entre el consumo de electricidad (Kw-hora) y
el número de habitaciones en una vivienda se recogieron datos para un mismo mes de una
muestra de viviendas, obteniendo los siguientes datos:

∑12 12 12 2 12 2 12
𝑖=1 𝑥𝑖 = 105; ∑𝑖=1 𝑦𝑖 = 80; ∑𝑖=1 𝑥𝑖 = 1067; ∑𝑖=1 𝑦𝑖 = 570; ∑𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 = 758

a) Estime la ecuación de regresión muestral por medio del método de los mínimos
cuadrados e interprete los valores obtenidos de los coeficientes en el contexto del
problema. 8
b) Estime con 95% de confianza el consumo de electricidad esperado en una vivienda
con 8 habitaciones.
c) ¿Podría afirmar que por cada habitación adicional en una vivienda, el consumo de
electricidad aumenta en más de 350 w-hora? Use α = 0,05

SOLUCIÓN
Sean:
X=Número de habitaciones en la vivienda

Y=Consumo de electricidad, en [Kw-hora]

SOLUCIÓN 2-A

Se tiene el modelo condicionado a la siguiente forma:

𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝑢𝑖

𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ⋅ ∑𝑛𝑖=1 𝑦𝑖


̂1 =
𝑏1 = 𝛽 (11)
𝑛 ⋅ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2

∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖
̂0 =
𝑏0 = 𝛽 − 𝑏1 ∙ (12)
𝑛 𝑛
Reemplazando en las ecuaciones (11) y (12), se obtienen los parámetros de la regresión,
como se muestra a continuación.

12 ∙ 758 − 105 ∙ 80
𝑏1 = = 0,3912
12 ⋅ 1067 − (105)2

80 105
𝑏0 = − 0,3912 ∙ = 3,2434
12 12

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Por lo tanto, la ecuación de regresión estimada es:

𝑦𝑖 = 3,2434 + 0,3912𝑥𝑖

Conclusión
El valor del intercepto en este caso no tendría sentido práctico y la pendiente indica que
por cada habitación adicional en la vivienda el consumo de electricidad aumenta en 0,391
Kw-hora. 9

SOLUCIÓN 2-B

El intervalo de confianza solicitado, es posible obtenerlo a partir de las ecuaciones (13) y


(14).

1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (µ) = 𝛽0 + 𝛽1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √ + (13)
2 𝑛 ∑(𝑥𝑖 − 𝑥)2

𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠𝑦 − 𝑏12 𝑠𝑥2 ) (14)
𝑛−2

Reemplazando en las ecuaciones expuestas anteriormente, se obtiene:

11
𝑠𝑦𝑥 = √ (3,333 − 0,39122 ∙ 13,4773) = 1,1822
10

1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 𝑡(10;0,975) ∙ 1,1822 ∙ √ +
12 148,25

1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 2,2281 ∙ 1,1822 ∙ √ +
12 148,25

𝐼𝐶 (µ/(𝑥 = 8)) = (6,1437; 6,6027)

Conclusión
Con un 95% de confianza, es posible inferir que el consumo de electricidad esperado en una
vivienda que contiene 8 habitaciones, fluctúa entre 6,1437 [kw/h] y 6,6027 [kw/h]

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

SOLUCIÓN 2-C

En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.

Dócima

𝐻0 : 𝛽1 ≤ 0,35
10
𝐻1 : 𝛽1 > 0,35

Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:

𝐻0 : El consumo no aumenta en más de 350 [W/h]

𝐻1 : El consumo aumenta en más de 350 [W/h]

Estadística

En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (15).

𝛽1
𝑇= (15)
𝑠𝛽1

Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (16)
√∑(𝑥𝑖 − 𝑥̅ )2

Reemplazando, se obtiene:

1,1822
𝑠𝛽1 = = 0,0971
√1067 − 12 ∙ 8,752

0,3912 − 0,35
𝑇= → 𝑇 = 0,4243
0,0971

Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,35 que corresponde al consumo en [kw/hr], el
cual se pide probar en el enunciado.

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander


ANALISIS ESTADISTICO PARA LA INGENIERIA

Región Crítica

En este caso, la región de rechazo se encuentra dada de la siguiente forma:

𝑇 > 𝑡(𝑛−2,1−𝛼) → 𝑇 > 𝑡(10,0,95) → 𝑇 > 1,8125

Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba 11
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto, no podríamos afirmar que por cada habitación
adicional en una vivienda, el consumo de electricidad aumenta en más de 350 [w/h]

ANALISIS ESTADISTICO PARA LA INGENIERIA | Ayudante – Camilo Bustamante Santander

S-ar putea să vă placă și