Sunteți pe pagina 1din 45

ING.

SISTEMAS

Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados

ING. SISTEMAS

CLASIFICACIN DE LAS VARIABLES


Las variables se clasifican segn:

Lic. Est. Aracelli Pomape Grados

1. Su Naturaleza 2. Su Escala de Medida 3. Su Nmero 4. Su Relacin entre ellas Y = Variable Dependiente o Respuesta X 1, X k = Variables Independientes

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

La importancia de la estadstica en la ingeniera, ha sido subrayada por la participacin de la industria en el aumento de la calidad en sus operaciones y en el producto final

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

El objetivo de muchas investigaciones cientficas es comprender y explicar las relaciones entre variables.

Frecuentemente, se requiere conocer como y en que medida una variable de respuesta ( Y) se relaciona con un grupo de variables independientes ( X1, X2, , X k).

El anlisis de regresin es una tcnica estadstica para el modelamiento y la investigacin de la relacin entre dos o ms variables.

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

La palabra Regresin fue usada por primera vez por Francis Galton ( 1822 1911) en sus estudios biolgico de la Herencia, refirindose a la ley de la regresin universal

Lic. Est. Aracelli Pomape Grados

Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.
Francis Galton Primo de Darwin Estadstico y aventurero Fundador (con otros) de la estadstica moderna para explicar las teoras de Darwin.

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

Regresin

: El anlisis de regresin es til

Lic. Est. Aracelli Pomape Grados

para averiguar la forma probable de las relaciones entre las variables, y el objetivo final, cuando se emplea este mtodo de anlisis, es predecir o estimar el valor de una variable que corresponde al valor dado de otra variable.

Correlacin:

El anlisis de correlacin se refiere a la intensidad de la relacin entre variables. Cuando se calculan las mediciones de correlacin a partir de un conjunto de datos, el inters recae en el grado de correlacin entre las variable, calculado con el coeficiente de correlacin.

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Analizaremos como ms de una sola variable explicativa podra utilizarse para predecir el valor de la variable dependiente. Se considera cuanto ms poderoso podra volverse el modelo si se utilizaran ms variables explicativas

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ANALISIS DE REGRESION

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Simple * Lineal
Cuando la relacin entre las variables es de tipo lineal

Mltiple **

Regresin Simple * No Lineal


Cuando la relacin entre las variables es de tipo nolineal

Mltiple **

recta o cbica?

* ES SIMPLE: Una variable independiente ** ES MULTIPLE: Varias variables independientes

recta o parbola?

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

140

150

160

170

180

190

200

140

150

160

170

180

190

200

CORRELACION LINEAL SIMPLE

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

ECUACION DE REGRESION LINEAL SIMPLE


ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Relacin lineal positiva


E(Y)

Recta de Regresin

pendiente es positiva Intercepto 0

ECUACION DE REGRESION LINEAL SIMPLE


ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Relacin lineal negativa


E(Y)

Intercepto 0

Recta de regresin

Pendiente 1
es negativa

ING. SISTEMAS

ECUACION DE REGRESION LINEAL SIMPLE


Ninguna Relacin

Lic. Est. Aracelli Pomape Grados

E(Y)

Lnea de regresin Intercepto 0 Pendiente 1 Es CERO

ING. SISTEMAS

El modelo de regresin mltiple con k variable independientes se expresa como: El Modelo de Regresin Mltiple
i = Yi ^ Yi recibe el nombre de residuo.

Lic. Est. Aracelli Pomape Grados

Se estima el modelo utilizando los datos muestrales as:

El Modelo de Regresin Mltiple Estimado

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

COEFICIENTE DE CORRELACIN Y COEFICIENTE DE DETERMINACIN

Lic. Est. Aracelli Pomape Grados

Ahora que tenemos una comprensin general de la naturaleza de la relacin entre las variables, es conveniente medir la fuerza de sta relacin.

La medida de la fuerza viene dada por el Coeficiente de Correlacin.(R )

La medida del poder explicativo o ajuste del Modelo viene dada por el Coeficiente de Determinacin. (R 2)

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

COEFICIENTE DE CORRELACIN Y COEFICIENTE DE DETERMINACIN

Lic. Est. Aracelli Pomape Grados

R = +/- 1, Existe perfecta correlacin positiva o negativa R + / - 1, existe elevada correlacin positiva o negativa R + / - 0.8, existe meritoria correlacin positiva o negativa R + / - 0.6, existe moderada correlacin positiva o negativa R + / - 0.5, existe baja correlacin positiva o negativa R 0, existe pobre correlacin positiva o negativa R = 0, No existe correlacin entre las variables

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

17

EJERCICIO N 1

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

18

Salidas Minitab 15

19
I. FASE OPERATIVA EN SPSS V. 18
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Luego de ingresados los datos se accede a la opcin Analizar Regresin Lineales Designamos la Variable Dependiente luego las variables Independientes.

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

20

II. FASE RESULTADOS EN SPSS V. 18


Coeficientesa Modelo Coeficientes no estandarizados B 88.786 .289 -57.154 Error tp. 230.470 .155 30.488 Coeficientes tipificados Beta .474 -.479 t Sig.

(Constante)
PC DIST

.385
1.857 -1.875

.709
.096 .094

ANOVAb Modelo Suma de cuadrados 102481.766 19009.901 121491.667 Resumen del modelo R cuadrado Error tp. de la corregida estimacin .809 45.959 gl 2 9 11 Media cuadrtica 51240.883 2112.211 F 24.259 Sig. .000

Regresin Residual Total

R .918

R cuadrado .844

Salidas SPSS V. 18

21
ING. SISTEMAS

REGRESION Y CORRELACION LINEAL MULTIPLE


Tabla N 1: Sueldos para una muestra de Analista de Sistemas.
Analista 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Sueldo Anual ( Y) 54900 60500 58900 59000 57500 55500 56000 52700 65000 60000 56000 53600 55000 52500 Aos de Experiencia ( X1) 5.5 9.0 4.0 8.0 9.5 3.0 7.0 1.5 8.5 7.5 9.5 6.0 2.5 1.5 Aos de Educacin Superior ( X2) 4.0 4.0 5.0 4.0 5.0 4.0 3.0 4.5 5.0 6.0 2.0 2.0 4.0 4.5

Lic. Est. Aracelli Pomape Grados

Interprete los coeficientes de la ecuacin de regresin y pruebe la significacin individual y conjunta de parmetros. Calcule e interprete el coeficiente de correlacin mltiple

REGRESION Y CORRELACION LINEAL MULTIPLE


I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

22

REGRESION Y CORRELACION LINEAL MULTIPLE


I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

23

I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

24

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS

25

II. FASE RESULTADOS

Lic. Est. Aracelli Pomape Grados

Salidas Minitab 15

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

26

II. FASE RESULTADOS

Salidas Minitab 15

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS

27

III. FASE ANALITICA

Lic. Est. Aracelli Pomape Grados

a) La ecuacin de regresin lineal mltiple del Salario Anual de los Analistas de sistemas es:

45511 +826 X1 + 1604 X2

28

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

b) Interpretando coeficientes de Regresin bo = 45511, es el sueldo anual de los analistas de sistemas independientemente de los Aos de Experiencia ( X1) y los Aos de educacin( X2).

b1 = 826, representa el incremento promedio del sueldo anual de los analistas de sistemas por cada variacin unitaria en los Aos de Experiencia ( X1). Individualmente tiene influencia altamente significativa sobre el sueldo anual.( p = 0.002) b2 = 1604, representa el incremento promedio del sueldo anual de los analistas de sistemas independientemente de los Aos de educacin( X2). Individualmente tiene influencia significativa sobre el sueldo anual. .( p = 0.012)

29

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

c) Interpretando Cuadro de ANVA

El anlisis de varianza nos indica que conjuntamente ambas variables Aos de Experiencia ( X1) y Aos de educacin( X2), tienen influencia altamente significativa en el sueldo anual de los analistas de sistemas

d) Interpretando Coeficiente de Correlacin y Determinacin. R = 0.81975, nos indica que existe elevada correlacin entre las variables R2 % = 0.672 nos indica que el 67.2 % de la variabilidad del sueldo anual de los analistas de sistemas se explica por la influencia de Aos de Experiencia ( X1) y Aos de educacin( X2).

30

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

EJERCICIO N 1

Como preparacin para su grado, Ud ha asumido el cargo de practicante de una importante aerolinea y se require saber si la publicidad y el ingreso neto nacional tienen algn tipo de relacin con el nmero de pasajeros de la aerolinea . Este proyecto requerir que Ud. Configure y analice algn modelo que pueda proporcionar la informacin necesaria para establecer los procedimientos necesarios para la empresa.

31

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

EJERCICIO N 1

Interprete los coeficientes de la ecuacin de regresin y pruebe la significacin individual y conjunta de parmetros. Calcule e interprete el coeficiente de correlacin mltiple

32

REGRESION Y CORRELACION LINEAL MULTIPLE


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

EJERCICIO N 1
Anlisis de regresin: Pasajeros Y vs. Publicidad( , Ingreso Naci

Coef. Predictor Coef de EE T P Constante 3.5284 0.9994 3.53 0.004 Publicidad( en miles de dlares 0.8397 0.1419 5.92 0.000 Ingreso Nacional ( billones de 1.4410 0.7360 1.96 0.074

S = 0.821666 R-cuad. = 95.3% R-cuad.(ajustado) = 94.5%

Anlisis de varianza

Fuente
Error residual Total Regresin 12 8.102 171.733

GL 2 0.675

SC MC 163.632 81.816

F 121.18

P 0.000

14

Salidas del MINITAB 15

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

1. El rendimiento de una reaccin qumica (Y) depende de la Concentracin del reactivo ( X1) y de la temperatura de operacin.( X2) . Los datos obtenidos son los siguientes:
Y X1 X2 81 1 150 89 1 180 83 2 150 91 2 180 79 1 150 87 1 180 84 2 150 90 2 180

a) Ajuste un modelo de regresin lineal mltiple a los datos. b) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de Regresin. Si se emplea = 0.05 , Qu conclusiones se puede obtener? c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor P de esta prueba? d) Calcule e interprete R y R 2 e) Prediga el Rendimiento de la reaccin qumica cuando la la Concentracin del reactivo X1 = 1 y la temperatura de operacin X2 = 170
Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

II. FASE RESULTADOS


ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

III. FASE ANALITICA

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

a) La ecuacin de regresin lineal mltiple del Rendimiento de una Reaccin Qumica es:

39.750 + 3.000 X1 + 0.250 X2

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

III. FASE ANALITICA

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

b) Interpretando coeficientes de Regresin y su significancia.

bo = 39.750, es el rendimiento de una reaccin qumica independientemente de la Concentracin del reactivo ( X1) y de la temperatura de operacin.( X2)
b1 = 3.000, representa el incremento promedio del rendimiento de una reaccin qumica por cada variacin unitaria de la Concentracin del reactivo (X1). Cuando la temperatura de operacin (X2) permanece constante. Individualmente tiene influencia significativa sobre el rendimiento ( p = 0.01) b2 = 0.250 , representa el incremento promedio del rendimiento de una reaccin qumica por cada variacin unitaria de Temperatura de operacin ( X2). Cuando la Concentracin del reactivo (X1) permanece constante. Individualmente tiene influencia altamente significativa sobre el rendimiento ( p = 0.000)
Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

III. FASE ANALITICA

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor P de esta prueba? Interpretando el cuadro ANVA El anlisis de varianza nos indica que conjuntamente ambas, variables Concentracin del reactivo ( X1) y la temperatura de operacin.( X2) tienen influencia altamente significativa en la reaccin qumica ( p = 0.000) d) Calcule e interprete R y R 2 R = 0.980, nos indica que existe elevada correlacin entre las variables R2 % = 0.960 nos indica que el 96.0 % de la variabilidad de la reaccin qumica es como consecuencia de la variabilidad de la Concentracin del reactivo ( X1) y la temperatura de operacin.( X2)

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

ING. SISTEMAS

III. FASE ANALITICA

Lic. Est. Aracelli Pomape Grados

e) Prediga el Rendimiento de la reaccin qumica cuando la Concentracin del reactivo X1 = 1 y la temperatura de operacin X2 = 170 39.75 + 3 * X1 + 0.25 * X2

39.75 + 3 * 1 + 0.25 * 170

85.25

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

2. Se piensa que la potencia consumida por una planta qumica est relacionada con la temperatura ambiente promedio ( X1), el nmero de das al mes ( X2), la pureza producto del producto ( X3), y las toneladas del producto producidas (X4). Los datos correspondientes al ao pasado son:
Y X1 X2 X3 X4 240 236 290 274 301 316 300 296 267 276 288 261 25 24 91 100 31 21 90 95 45 24 88 110 60 25 87 88 65 25 91 34 72 26 94 99 80 25 87 97 84 25 86 96 75 24 88 60 25 91 50 25 90 38 23 89 98

110 105 100

a) Ajuste un modelo de regresin lineal mltiple a los datos. b) Prediga el consumo de de potencia para un mes en el que X1 = 75 F, X2 = 24 dias, X3 = 90% y X4 = 98 toneladas. c) Pruebe la significancia de la Regresin utilizando = 0.01; Cul es el valor P de esta prueba? d) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de Regresin. Si se emplea = 0.01 , Qu conclusiones se puede obtener? e) Calcule e interprete R y R 2
Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

I. FASE OPERATIVA
ING. SISTEMAS Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com

II. FASE RESULTADOS

ING. SISTEMAS

Lic. Est. Aracelli Pomape Grados

Lic. Aracelli Pomape Grados aracelli_p@hotmail.com