Documente Academic
Documente Profesional
Documente Cultură
Coatzacoalcos.
División de Ingeniería Industrial.
Introducción. 3
Referencias bibliográficas. 20
2
INTRODUCCIÓN.
La palabra Estadística procede del vocablo “Estado”, pues era función principal de
los Gobiernos de los Estados establecer registros de población, nacimientos,
defunciones, impuestos, cosechas... fue una de las causas principales del
nacimiento de la misma.
3
UNIDAD 1. ‘’ REGRESIÓN LINEAL MÚLTIPLE’’.
Donde los son los parámetros del modelo que se conocen como coeficientes de
regresión y es el error aleatorio, con media cero, . Si en la
ecuación (1.22) , estamos en el caso de regresión lineal simple y el modelo
es una línea recta; si , tal ecuación representa un plano. En general, la
ecuación (1.22) representa un hiperplano en el espacio de dimensiones generado
por las variables
}.
El término lineal del modelo de regresión se emplea debido a que la ecuación (1.22)
es función lineal de los parámetros desconocidos La interpretación de
éstos es muy similar a lo ya explicado para el caso de regresión lineal simple: es
4
la ordenada al origen, y mide el cambio esperado en por cambio unitario en
cuando el resto de las variables regresoras se mantienen fijas o constantes.
Por ejemplo La siguiente tabla muestra los pesos Y a la libra más cercana, las estaturas X1 a la
pulgada más cercana y las edades X2 al año más cercano de 12 muchachos.
64 57 8
71 59 10
53 49 6
67 62 11
55 51 8 Regresión lineal múltiple 31
58 50 7
10 Tabla 1.5 Peso, estatura y edad
77 55
57 48 9
56 52 10
6
51 42
12
76 61
9
68 57
5
Para encontrar los coeficientes de regresión ( , y ) múltiple mediante el
método de mínimos cuadrados seria de la siguiente manera
Tabla 1.6 Procedimiento para realizar los cálculos para la regresión múltiple
Y X1 X2 Y2 X12 X22 X1Y X2Y X1X2
64 57 8 4096 3249 64 3648 512 456
71 59 10 5041 3481 100 4189 710 590
53 49 6 2809 2401 36 2597 318 294
67 62 11 4489 3844 121 4154 737 682
55 51 8 3025 2601 64 2805 440 408
58 50 7 3364 2500 49 2900 406 350
77 55 10 5929 3025 100 4235 770 550
57 48 9 3249 2304 81 2736 513 432
56 52 10 3136 2704 100 2912 560 520
6 36
51 42 2601 1764 2142 306 252
12 144
76 61 5776 3721 4636 912 732
9 81
68 57 4624 3249 3876 612 513
34,843
6
el método de Cramer. Para este tipo de planteamiento se recomienda el método
de Cramer el cual consiste en la siguiente secuencia:
7
En caso contrario no se rechaza Ho No rechazar que 𝛽1 = 0, en el caso del modelo
de regresión lineal simple, implica que no existe una relación lineal significativa entre
y ; por tanto, no existe relación entre estas variables o ésta es de otro tipo.
La suma de cuadrados de los residuos o suma de cuadrados del error ( y se utiliza
para estimar la varianza del error de ajuste de un modelo, y está dada por:
ejemplo, a partir de la tabla 1.6 es claro que un estimador por intervalos de cada
coeficiente en lo individual está dado por:
8
13.- ¿Por qué se requiere la regresión lineal múltiple?
14.- Se realizo un estudio para investigar la relación de la resistencia al corte del terreno (
) con la profundidad en pies ( ) y el contenido de humedad . Se hicieron 10
observaciones, obteniéndose las siguientes cantidades resumidas
,
,
, , , , ,
pH Temperatura Espesor
9
1,2 -8 9
1,8 -8 14
1,2 8 10
1,8 8 19 8
1,2 -8 12
1,8 -8 11
1,2 8 20
1,8 8 14
1,5 0 13
1,5 0
16.- Se realizó un experimento para estudiar el sabor del queso panela en función
de la cantidad del cuajo y la sal. La variable de respuesta observada es el sabor
promedio reportado por un grupo de cinco panelistas que probaron todos los
quesos y los calificaron en una escala hedónica. Los datos obtenidos se muestran
a continuación:
10
Sal Cuajo Sabor
6 0,3 5,67
5,5 0,387 7,44
4,5 0,387 7,33
4 0,3 6,33
4,5 0,213 7,11
5,5 0,213 7,22
5 0,3 6,33
5 0,3 6,66
a) Ajuste el modelo
b) ¿El modelo explica la variación observada en el sabor? Argumente con base
en la significancia del modelo, los residuales y el coeficiente de
determinación.
c) Ajuste un modelo que incluya términos cuadráticos y analice con detalle la
calidad del ajuste aplique las pruebas de hipótesis
17.- Se piensa que la energía eléctrica consumida mensualmente por una planta
química se relaciona con la temperatura ambiente promedio ( , el número de
días laborales del mes ( , la pureza promedio del producto y las toneladas
del producto producidas
. Se cuenta con los datos del último año, los cuales se presentan en la tabla
siguiente:
11
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98
12
1.1.3 USO DE UN SOFTWARE ESTADÍSTICO.
13
Activamos la casilla de rótulos, por default está indicado en una hoja nueva,
seleccionamos además cualquiera de las opciones de residuos, grafica de
residuales, y curva de regresión ajustada y aceptar y tendremos el resultado.
Utilizando Minitab
En Minitab la secuencia de captura para la regresión lineal simple o múltiple en la
hoja de cálculo una vez capturada las columnas de datos seleccionamos
Estadísticas luego Regresión seguida de Regresión nuevamente
14
Nota: De la ventana de captura aparecen automáticamente en el cuadro de la
izquierda la información de la tabla, en respuesta, se indica con un clic del ratón en
peso y este automáticamente se manifiesta, en predictores de igual manera se da
un clic a cada uno y estos se manifiestan en el recuadro.
15
Supongamos que al hacer la representación gráfica correspondiente la distribución
bidimensional, hemos obtenido la figura 6.1c. Se observa una clara relación entre
las dos variables, pero desde luego, esa relación no es lineal.
Por tanto, debemos buscar la función que ha de describir la dependencia entre las
dos variables.
Nos limitaremos al estudio de las más utilizadas: la función parabólica, la
logarítmica, la exponencial y la potencial.
Parábola de Regresión
En muchos casos, es una función de segundo grado la que se ajusta lo suficiente a
la situación real dada.
16
Para encontrar los valores de a, b y c que hacen mínima la expresión anterior,
deberemos igualar las derivadas parciales de D con respecto a dichos parámetros
a cero y resolver el sistema resultante. Las ecuaciones que forman dicho sistema
se conocen como ecuaciones normales de Gauss (igual que en el caso de la
regresión lineal simple).
Modelo potencial:
Si tomamos logaritmos en la expresión de la función potencial, obtendremos:
17
potencial coincide con el coeficiente de regresión de la recta ajustada a los datos
transformados, y A lo obtenemos mediante el antilog(a).
Modelo exponencial:
Tomando logaritmos en la expresión de la función exponencial, obtendremos:
Modelo logarítmico:
La curva logarítmica Y = a + b es también una recta, pero en lugar de estar
referida a las variables originales X e Y, está referida a y a Y.
Hemos visto, cómo, a pesar de ser inicialmente modelos mucho más complejos que
el de una recta, estos tres últimos se reducen al modelo lineal sin más que
transformar adecuadamente los datos de partida.
18
CONCLUSIÓN.
19
REFERENCIAS BIBLIOGRÁFICAS.
Estadística inferencial II
Raúl Jiménez González.
Agosto 2012.
20