Sunteți pe pagina 1din 54

ESTADISTICA

BIDIMENSIONAL:

REGRESION Y
CORRELACION SIMPLE
Y MULTIPLE
Por: Aracelli Pomape

1
Regresin y correlacin lineal
Simple
Regresin y correlacin
lineal Mltiple.

2
3
El objetivo de muchas investigaciones cientficas es comprender
y explicar las relaciones entre variables.

La importancia de la estadstica en la ingeniera, ha sido subrayada


por la participacin en la industria, incrementando la calidad en sus
operaciones y en el producto final

4
CLASIFICACIN DE LAS VARIABLES

Las variables se clasifican segn:

1. Su Naturaleza

2. Su Escala de Medida

3. Su Nmero Y = Variable
Dependiente o
Respuesta
4. Su Relacin entre ellas
X 1, X k = Variables
Independientes

5
La importancia de la estadstica en la ingeniera, ha sido
subrayada por la participacin de la industria en el aumento
de la calidad en sus operaciones y en el producto final

6
El objetivo de muchas investigaciones cientficas es comprender y explicar las
relaciones entre variables.

Frecuentemente, se requiere conocer como y en que medida una variable de


respuesta ( Y) se relaciona con un grupo de variables independientes ( X1, X2,
, X k).

El anlisis de regresin es una tcnica estadstica para el modelamiento y la


investigacin de la relacin entre dos o ms variables.

7
La palabra Regresin fue usada por primera vez por
Francis Galton ( 1822 1911) en sus estudios biolgico de
la Herencia, refirindose a la ley de la regresin universal

Cada peculiaridad en un hombre es


compartida por sus descendientes,
pero en media, en un grado menor.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.

8
Regresin : El anlisis de regresin es til para
averiguar la forma probable de las relaciones
entre las variables, y el objetivo final, cuando se
emplea este mtodo de anlisis, es predecir o
estimar el valor de una variable que corresponde
al valor dado de otra variable.

Correlacin: El anlisis de correlacin se refiere a


la intensidad de la relacin entre variables. Cuando
se calculan las mediciones de correlacin a partir
de un conjunto de datos, el inters recae en el grado
de correlacin entre las variable, calculado con el
coeficiente de correlacin.

9
ANALISIS DE REGRESION

Simple *
Lineal
Cuando la relacin entre las
variables es de tipo lineal Mltiple **

Regresin

Simple *

No Lineal
Cuando la relacin entre las
variables es de tipo nolineal Mltiple **

recta o cbica?

* ES SIMPLE: Una variable independiente recta o parbola?


** ES MULTIPLE: Varias variables independientes

140 150 160 170 180 190 200


10
140 150 160 170 180 190 200
Analizaremos como ms de una sola variable explicativa podra
utilizarse para predecir el valor de la variable dependiente. Se
considera cuanto ms poderoso podra volverse el modelo si se
utilizaran ms variables explicativas

11
12
El modelo de regresin mltiple con k variable independientes se expresa
como:

El Modelo de
Regresin Mltiple

^
i = Yi Yi recibe el nombre de residuo.

Se estima el modelo utilizando los datos muestrales as:

El Modelo de Regresin
Mltiple Estimado

13
COEFICIENTE DE CORRELACIN Y
COEFICIENTE DE DETERMINACIN

Ahora que tenemos una comprensin general de la naturaleza de la


relacin entre las variables, es conveniente medir la fuerza de sta relacin.

La medida de la fuerza viene dada por el Coeficiente de Correlacin.(R )

La medida del poder explicativo o ajuste del Modelo viene dada por el
Coeficiente de Determinacin. (R 2)

14
COEFICIENTE DE CORRELACIN Y
COEFICIENTE DE DETERMINACIN

R = +/- 1, Existe perfecta correlacin positiva o negativa


R + / - 1, existe elevada correlacin positiva o negativa
R + / - 0.8, existe meritoria correlacin positiva o negativa
R + / - 0.6, existe moderada correlacin positiva o negativa
R + / - 0.5, existe baja correlacin positiva o negativa
R 0, existe pobre correlacin positiva o negativa
R = 0, No existe correlacin entre las variables

15
16
CASO N 1: REGRESION LINEAL SIMPLE

El procesamiento de carbon sin tratar implica el "lavado", en donde se elimina la


ceniza de carbn( no organico, material incombustible). Una revista proporciona los
datos relacionados con los porcentajes de ceniza y el volmen de una partcula de
carbn. Se midieron los porcentajes promedio de ceniza para seis volmenes de
partculas de carbn. Los datos son los siguientes:

3 Porcentaje de a) La ecuacin de regresin lineal simple del Porcentaje


Volumen ( cm ) de Ceniza
ceniza
0.01 3.32
b) Utilizando el modelo pronostique el porcentaje de ceniza
0.06 4.05 para partculas con un volmen de 5,0 cm 3
0.58 5.69
2.24 7.06 c) Interpretar coeficientes de Regresin y su significancia.
15.55 8.17
d) Pruebe la significancia de la Regresin utilizando = 0.05;
276.02 9.36 Cul es el valor P de esta prueba? Interpretando el
cuadro ANVA
e) Calcule e interprete R y R 2

17
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE OPERATIVA UTILIZANDO MINITAB

18
CASO N 1: REGRESION LINEAL SIMPLE

UTILIZANDO MINITAB
I. FASE OPERATIVA

19
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE OPERATIVA UTILIZANDO MINITAB

20
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA

UTILIZANDO MINITAB

21
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE DE INTERPRETACION

a) La ecuacin de regresin lineal simple del Porcentaje de


Ceniza

4.2871 + 0.8861 X1

22
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE DE INTERPRETACION

b) Utilizando el modelo pronostique el porcentaje de ceniza para partculas


con un volmen de 5,0 cm 3

4.2871 + 0.8861 (5)

8.7176

23
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE DE INTERPRETACION

c) Interpretando coeficientes de Regresin y su significancia.

bo = 4.2871, es el Porcentaje de Ceniza, independientemente del


Volmen de partcula ( X1)

b1 = 0.8861, representa el incremento promedio del Porcentaje de Ceniza


por cada variacin unitaria del Vomen de Partcula.(X1).

Individualmente tiene influencia altamente significativa sobre el Porcentaje


de Ceniza ( p = 0.003)

24
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE DE INTERPRETACION

d) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor


P de esta prueba? Interpretando el cuadro ANVA

El anlisis de varianza nos indica que la variable Volmen de Partcula (


X1) tiene influencia altamente significativa en el Porcentaje de Ceniza. (p
= 0.003)

e) Calcule e interprete R y R 2

R = 0.9539, nos indica que existe elevada correlacin entre las variables
R2 % = 0.909 nos indica que el 90.9 % de la variabilidad del Porcentaje de
ceniza es a consecuencia del volmen de partcula.

25
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA
UTILIZANDO SPSS

26
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA
UTILIZANDO SPSS

27
CASO N 2: REGRESION LINEAL MULTIPLE

1. El rendimiento de una reaccin qumica (Y) depende de la


Concentracin del reactivo ( X1) y de la temperatura de
operacin.( X2) . Los datos obtenidos son los siguientes:

Y 81 89 83 91 79 87 84 90
X1 1 1 2 2 1 1 2 2
X2 150 180 150 180 150 180 150 180

a) Ajuste un modelo de regresin lineal mltiple a los datos.


b) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de
Regresin. Si se emplea = 0.05 , Qu conclusiones se puede obtener?
c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor P de
esta prueba?
d) Calcule e interprete R y R 2
e) Prediga el Rendimiento de la reaccin qumica cuando la la Concentracin del
reactivo X1 = 1 y la temperatura de operacin X2 = 170

28
I. FASE OPERATIVA

UTILIZANDO SPSS

29
I. FASE OPERATIVA

UTILIZANDO SPSS

30
II. FASE RESULTADOS

UTILIZANDO SPSS

31
III. FASE ANALITICA

a) La ecuacin de regresin lineal mltiple del Rendimiento de una


Reaccin Qumica es:

39.750 + 3.000 X1 + 0.250 X2

32
III. FASE ANALITICA

b) Interpretando coeficientes de Regresin y su significancia.

bo = 39.750, es el rendimiento de una reaccin qumica


independientemente de la Concentracin del reactivo ( X1) y de la
temperatura de operacin.( X2)

b1 = 3.000, representa el incremento promedio del rendimiento de una


reaccin qumica por cada variacin unitaria de la Concentracin del
reactivo (X1). Cuando la temperatura de operacin (X2) permanece
constante. Individualmente tiene influencia significativa sobre el
rendimiento ( p = 0.01)

b2 = 0.250 , representa el incremento promedio del rendimiento de una


reaccin qumica por cada variacin unitaria de Temperatura de operacin (
X2). Cuando la Concentracin del reactivo (X1) permanece constante.
Individualmente tiene influencia altamente significativa sobre el
rendimiento ( p = 0.000)

33
III. FASE ANALITICA

c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor


P de esta prueba? Interpretando el cuadro ANVA

El anlisis de varianza nos indica que conjuntamente ambas, variables


Concentracin del reactivo ( X1) y la temperatura de operacin.( X2) tienen
influencia altamente significativa en la reaccin qumica ( p = 0.000)

d) Calcule e interprete R y R 2

R = 0.980, nos indica que existe elevada correlacin entre las variables
R2 % = 0.960 nos indica que el 96.0 % de la variabilidad de la reaccin qumica
es como consecuencia de la variabilidad de la Concentracin del reactivo ( X1)
y la temperatura de operacin.( X2)

34
III. FASE ANALITICA

e) Prediga el Rendimiento de la reaccin qumica cuando la Concentracin del


reactivo X1 = 1 y la temperatura de operacin X2 = 170

39.75 + 3 * X1 + 0.25 * X2

39.75 + 3 * 1 + 0.25 * 170

85.25

35
CASO N 3: REGRESION LINEAL MULTIPLE
Se piensa que la potencia consumida por una planta qumica est relacionada
con la temperatura ambiente promedio ( X1), el nmero de das al mes ( X2), la
pureza producto del producto ( X3), y las toneladas del producto producidas
(X4). Los datos correspondientes al ao pasado son:

Y 240 236 290 274 301 316 300 296 267 276 288 261
X1 25 31 45 60 65 72 80 84 75 60 50 38
X2 24 21 24 25 25 26 25 25 24 25 25 23
X3 91 90 88 87 91 94 87 86 88 91 90 89
X4 100 95 110 88 34 99 97 96 110 105 100 98

a) Ajuste un modelo de regresin lineal mltiple a los datos.


b) Prediga el consumo de de potencia para un mes en el que X1 = 75 F, X2 = 24
dias, X3 = 90% y X4 = 98 toneladas.
c) Pruebe la significancia de la Regresin utilizando = 0.01; Cul es el valor P de
esta prueba?
d) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de
Regresin. Si se emplea = 0.01 , Qu conclusiones se puede obtener?
e) Calcule e interprete R y R 2

36
I. FASE OPERATIVA

UTILIZANDO SPSS

37
I. FASE OPERATIVA

UTILIZANDO SPSS

38
II. FASE RESULTADOS

UTILIZANDO SPSS

39
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE

Uno de los problemas ms desafiantes en el campo del control de la


contaminacin del agua, lo presenta la industria del curtido de pieles. Los
desechos de las curtiembres son qumicamente complejos. Se caracterizan por
los altos valores de demanda bioqumica de oxgeno, slidos voltiles y otros.
Considrense los siguientes datos que se obtuvieron de 33 muestras de
desechos qumicamente tratados en un estudio. Donde las variables son el
porcentaje de slidos totales y el porcentaje de la demanda qumica de oxgeno
para las 33 muestras.

40
II. FASE RESULTADOS

CASO N 4: REGRESION LINEAL SIMPLE


% Demanda % Demanda
N % de Slidos qumica de N % de Slidos qumica de
oxgeno oxgeno
1 3 5 18 36 34
2 7 11 19 37 36
3 11 21 20 38 38
4 15 16 21 39 37
5 18 16 22 39 36
6 27 28 23 39 45
7 29 27 24 40 39
8 30 25 25 41 41
9 30 35 26 41 41
10 31 30 27 42 40
11 31 40 28 42 44
12 32 32 29 43 37
13 33 34 30 44 44
14 33 32 31 45 46
15 34 34 32 46 46
16 36 37 33 47 49
17 36 38 34 50 51

41
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE

PREGUNTAS DEL CASO

a) Construya el modelo de regresin lineal simple para estimar el valor del %


de Demanda qumica de oxgeno a partir del % de Slidos.

b) Utilizando el modelo pronostique el porcentaje de Demanda qumica de


oxgeno cuando el % de Slidos es 35.

c) Interprete el grado de influencia o Contribucin de cada variable al modelo.

d) Calcule e interprete R y R 2

42
II. FASE RESULTADOS

CASO N4: REGRESION LINEAL SIMPLE


UTILIZANDO EXCEL
I. FASE OPERATIVA DEL CASO N 4

43
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
I. FASE OPERATIVA DEL CASO N 4 UTILIZANDO EXCEL

44
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
UTILIZANDO EXCEL
II. FASE RESULTADOS DEL CASO N 4

45
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
UTILIZANDO EXCEL
II. FASE RESULTADOS DEL CASO N 4

46
II. FASE RESULTADOS
CASO N 4: REGRESION LINEAL SIMPLE

II. FASE INTERPRETACIN DEL CASO N 4

47
II. FASE RESULTADOS

CASO N 5: REGRESION LINEAL SIMPLE

En la fabricacin de productos comerciales de madera es importante


estimar la relacin entre la densidad de un producto de madera y su
dureza.

En una fbrica se produjeron treinta tableros de aglomerados con


densidades de aproximadamente 8 a 26 libras por pie cbico, y se midi
la dureza en libras por pulgada cuadrada. La siguiente tabla muestra los
datos

48
II. FASE RESULTADOS
CASO N 5: REGRESION LINEAL SIMPLE
a) Construya el modelo de regresin lineal simple para estimar el valor de la Dureza de la madera a
partir de la densidad .

b) Utilizando el modelo pronostique la Dureza de la Madera con una densidad de 8 lb/pies3.

c) Interprete el grado de influencia del modelo. Contribucin de cada variable al modelo.


Densidad ( X) Dureza (Y) Densidad ( X) Dureza (Y)
d ) Calcule e interprete R y R 2 6,4 5,076 15,2 14,028
7 5,304 15,4 14,312
8,2 7,328 16,4 16,792
8,3 7,573 16,7 16,899
8,4 7,592 17,4 18,243
8,6 8,714 19,5 20,207
9,5 8,814 19,8 20,438
9,8 9,007 21,2 23,218
9,9 9,191 21,3 23,45
11 9,643 21,7 23,661
13,6 11,036 22,8 24,453
14,5 12,148 23,3 25,512
14,8 12,751 23,4 25,74
15 13,319 24,4 27,594
15 13,522 25,6 29,305

49
II. FASE RESULTADOS
CASO N 5: REGRESION LINEAL SIMPLE

UTILIZANDO MINITAB

50
II. FASE RESULTADOS
CASO N 5: REGRESION LINEAL SIMPLE

UTILIZANDO MINITAB

51
II. FASE RESULTADOS
CASO N 5: REGRESION LINEAL SIMPLE

UTILIZANDO MEGA STAT

52
II. FASE RESULTADOS
CASO N 5: REGRESION LINEAL SIMPLE

UTILIZANDO MEGA STAT


Densidad y Dureza
16
14 y = 0.8518x + 0.3151
12 R = 0.9566
Dureza (Y)

10
8
6
4
2
0
0 5 10 15 20
Densidad ( X)

53
54