Sunteți pe pagina 1din 56

ESTADISTICA

BIDIMENSIONAL:

REGRESION Y
CORRELACION SIMPLE
Y MULTIPLE
Por: Aracelli Pomape

1
Regresin y correlacin lineal
Simple
Regresin y correlacin
lineal Mltiple.

2
3
El objetivo de muchas investigaciones cientficas es
comprender y explicar las relaciones entre variables.

La importancia de la estadstica en la ingeniera, ha sido


subrayada por la participacin en la industria, incrementando
la calidad en sus operaciones y en el producto final

4
CLASIFICACIN DE LAS VARIABLES

Las variables se clasifican segn:

1. Su Naturaleza

2. Su Escala de Medida
Y = Variable
Dependiente o
3. Su Nmero Respuesta

4. Su Relacin entre ellas X 1, X k =


Variables
Independientes

5
El objetivo de muchas investigaciones cientficas es comprender y
explicar las relaciones entre variables.

Frecuentemente, se requiere conocer como y en que medida una


variable de respuesta ( Y) se relaciona con un grupo de variables
independientes ( X1, X2, , X k).

El anlisis de regresin es una tcnica estadstica para el


modelamiento y la investigacin de la relacin entre dos o ms
variables.

6
La palabra Regresin fue usada por primera vez por
Francis Galton ( 1822 1911) en sus estudios biolgico de
la Herencia, refirindose a la ley de la regresin universal

Cada peculiaridad en un hombre es


compartida por sus descendientes,
pero en media, en un grado menor.

Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.

7
Regresin : El anlisis de regresin es til para
averiguar la forma probable de las relaciones
entre las variables, y el objetivo final, cuando se
emplea este mtodo de anlisis, es predecir o
estimar el valor de una variable que corresponde
al valor dado de otra variable.

Correlacin: El anlisis de correlacin se refiere a


la intensidad de la relacin entre variables. Cuando
se calculan las mediciones de correlacin a partir
de un conjunto de datos, el inters recae en el grado
de correlacin entre las variable, calculado con el
coeficiente de correlacin.

8
ANALISIS DE REGRESION

Simple *
Lineal
Cuando la relacin entre las
variables es de tipo lineal Mltiple **

Regresin

Simple *

No Lineal
Cuando la relacin entre las
variables es de tipo nolineal Mltiple **

recta o cbica?

* ES SIMPLE: Una variable independiente recta o parbola?


** ES MULTIPLE: Varias variables independientes

140 150 160 170 180 190 200


9
140 150 160 170 180 190 200
Analizaremos como ms de una sola variable explicativa podra utilizarse
para predecir el valor de la variable dependiente. Se considera cuanto ms
poderoso podra volverse el modelo si se utilizaran ms variables
explicativas

10
El modelo de regresin mltiple con k variable independientes se expresa
como:

El Modelo de
Regresin Mltiple

^
i = Yi Yi recibe el nombre de residuo.

Se estima el modelo utilizando los datos muestrales as:

El Modelo de Regresin
Mltiple Estimado

11
COEFICIENTE DE CORRELACIN Y
COEFICIENTE DE DETERMINACIN

Ahora que tenemos una comprensin general de la naturaleza de la


relacin entre las variables, es conveniente medir la fuerza de sta
relacin.

La medida de la fuerza viene dada por el Coeficiente de Correlacin.(R )

La medida del poder explicativo o ajuste del Modelo viene dada por el
Coeficiente de Determinacin. (R 2)

12
COEFICIENTE DE CORRELACIN Y
COEFICIENTE DE DETERMINACIN

R = +/- 1, Existe perfecta correlacin positiva o negativa


R + / - 1, existe elevada correlacin positiva o negativa
R + / - 0.8, existe meritoria correlacin positiva o negativa
R + / - 0.6, existe moderada correlacin positiva o negativa
R + / - 0.5, existe baja correlacin positiva o negativa
R 0, existe pobre correlacin positiva o negativa
R = 0, No existe correlacin entre las variables

13
COEFICIENTE DE
CORRELACIN
15
CASO N 1: REGRESION LINEAL SIMPLE

El procesamiento de carbon sin tratar implica el "lavado", en donde se elimina la ceniza


de carbn( no organico, material incombustible). Una revista proporciona los datos
relacionados con los porcentajes de ceniza y el volmen de una partcula de carbn.
Se midieron los porcentajes promedio de ceniza para seis volmenes de partculas de
carbn. Los datos son los siguientes:

Volumen Porcentaje a) La ecuacin de regresin lineal simple del Porcentaje


( cm 3 ) de ceniza de Ceniza
0.01 3.32
b) Utilizando el modelo pronostique el porcentaje de
0.06 4.05 ceniza para partculas con un volmen de 5,0 cm 3
0.58 5.69
2.24 7.06 c) Interpretar coeficientes de Regresin y su significancia.
4.55 8.17
d) Pruebe la significancia de la Regresin utilizando =
6.02 9.36 0.05; Cul es el valor P de esta prueba?
Interpretando el cuadro ANVA
e) Calcule e interprete R y R 2

16
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE OPERATIVA UTILIZANDO MINITAB

17
CASO N 1: REGRESION LINEAL SIMPLE

UTILIZANDO MINITAB
I. FASE OPERATIVA

18
CASO N 1: REGRESION LINEAL SIMPLE

I. FASE OPERATIVA UTILIZANDO MINITAB

19
CASO N 1: REGRESION LINEAL SIMPLE
II RESULTADOS
UTILIZANDO MINITAB

4.2871 + 0.8861 X1

20
CASO N 1: REGRESION LINEAL SIMPLE

III. FASE DE INTERPRETACION

a) La ecuacin de regresin lineal simple del Porcentaje de


Ceniza

4.2871 + 0.8861 X1

21
CASO N 1: REGRESION LINEAL SIMPLE

III. FASE DE INTERPRETACION

b) Utilizando el modelo pronostique el porcentaje de ceniza para


partculas con un volmen de 5,0 cm 3

4.2871 + 0.8861 (5)

8.7176

22
CASO N 1: REGRESION LINEAL SIMPLE

III. FASE DE INTERPRETACION

c) Interpretando coeficientes de Regresin y su significancia.

bo = 4.2871, es el Porcentaje de Ceniza, independientemente del


Volmen de partcula ( X1)

b1 = 0.8861, representa el incremento promedio del Porcentaje de


Ceniza por cada variacin unitaria del Vomen de Partcula.(X1).

Individualmente tiene influencia altamente significativa sobre el


Porcentaje de Ceniza ( p = 0.003)

23
CASO N 1: REGRESION LINEAL SIMPLE

III. FASE DE INTERPRETACION

d) Pruebe la significancia de la Regresin utilizando = 0.05;


Cul es el valor P de esta prueba? Interpretando el cuadro
ANVA
El anlisis de varianza nos indica que la variable Volmen de
Partcula ( X1) tiene influencia altamente significativa en el
Porcentaje de Ceniza. ( p = 0.003)

e) Calcule e interprete R y R 2

R = 0.9539, nos indica que existe elevada correlacin entre las variables
R2 % = 0.909 nos indica que el 90.9 % de la variabilidad del Porcentaje
de ceniza es a consecuencia del volmen de partcula.

24
UTILIZANDO SPSS
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA
1
Se ingresan las variables
Dependientes e Independientes
4

2 3

25
UTILIZANDO SPSS
CASO N 1: REGRESION LINEAL SIMPLE

II. FASE RESULTADOS

4.2871 + 0.8861 X1

26
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA UTILIZANDO EXCEL
1
2

5
4

27
CASO N 1: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA UTILIZANDO EXCEL

Si la
herramienta
ANLISIS DE
DATOS, no se 3
encontrara
habilitada ir a
ARCHIVO
. OPCIONES 4

28
CASO N 1: REGRESION LINEAL SIMPLE
II. RESULTADOS
UTILIZANDO EXCEL

4.2871 + 0.8861 X1

29
CASO N 2: REGRESION LINEAL SIMPLE

Uno de los problemas ms desafiantes en


el campo del control de la contaminacin
del agua, lo presenta la industria del
curtido de pieles. Los desechos de las
curtiembres son qumicamente complejos.
Se caracterizan por los altos valores de
demanda bioqumica de oxgeno, slidos
voltiles y otros. Considrense los
siguientes datos que se obtuvieron de 33
muestras de desechos qumicamente
tratados en un estudio. Donde las variables
son el porcentaje de slidos totales y el
porcentaje de la demanda qumica de
oxgeno para las 33 muestras.

30
CASO N 2: REGRESION LINEAL SIMPLE

% Demanda % Demanda
% de % de
N qumica de N qumica de
Slidos Slidos
oxgeno oxgeno
1 3 5 18 36 34
2 7 11 19 37 36
3 11 21 20 38 38
4 15 16 21 39 37
5 18 16 22 39 36
6 27 28 23 39 45
7 29 27 24 40 39
8 30 25 25 41 41
9 30 35 26 41 41
10 31 30 27 42 40
11 31 40 28 42 44
12 32 32 29 43 37
13 33 34 30 44 44
14 33 32 31 45 46
15 34 34 32 46 46
16 36 37 33 47 49
17 36 38 34 50 51

31
CASO N 2: REGRESION LINEAL SIMPLE

PREGUNTAS DEL CASO

a) Construya el modelo de regresin lineal simple para estimar el valor


del % de Demanda qumica de oxgeno a partir del % de Slidos.

b) Utilizando el modelo pronostique el porcentaje de Demanda qumica


de oxgeno cuando el % de Slidos es 35.

c) Interprete el grado de influencia o Contribucin de cada variable al


modelo.

d) Calcule e interprete R y R 2

32
CASO N2: REGRESION LINEAL SIMPLE
UTILIZANDO EXCEL
I. FASE OPERATIVA DEL CASO N 2

33
CASO N 2: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
I. FASE OPERATIVA DEL CASO N 2 UTILIZANDO EXCEL

34
CASO N 2: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
UTILIZANDO EXCEL
II. FASE RESULTADOS DEL CASO N 2

35
CASO N 2: REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
UTILIZANDO EXCEL
II. FASE RESULTADOS DEL CASO N 2

36
CASO N 2: REGRESION LINEAL SIMPLE

III. FASE INTERPRETACIN DEL CASO N 2

37
CASO N 3: REGRESION LINEAL SIMPLE

En la fabricacin de productos comerciales de madera es importante


estimar la relacin entre la densidad de un producto de madera y su
dureza.

En una fbrica se produjeron treinta tableros de aglomerados con


densidades de aproximadamente 8 a 26 libras por pie cbico, y se midi
la dureza en libras por pulgada cuadrada. La siguiente tabla muestra los
datos

38
CASO N 3: REGRESION LINEAL SIMPLE

a) Construya el modelo de regresin lineal simple para estimar el valor de la


Dureza de la madera a partir de la densidad .

b) Utilizando el modelo pronostique la Dureza de la Madera con una densidad de


8 lb/pies3.

c) Interprete el grado de influencia del modelo. Contribucin de cada variable al


modelo.
Densidad ( X) Dureza (Y) Densidad ( X) Dureza (Y)
d ) Calcule e interprete R y R2 6,4 5,076 15,2 14,028
7 5,304 15,4 14,312
8,2 7,328 16,4 16,792
8,3 7,573 16,7 16,899
8,4 7,592 17,4 18,243
8,6 8,714 19,5 20,207
9,5 8,814 19,8 20,438
9,8 9,007 21,2 23,218
9,9 9,191 21,3 23,45
11 9,643 21,7 23,661
13,6 11,036 22,8 24,453
14,5 12,148 23,3 25,512
14,8 12,751 23,4 25,74
15 13,319 24,4 27,594
15 13,522 25,6 29,305
39
CASO N 3: REGRESION LINEAL SIMPLE
I. FASE OPERATIVA DEL CASO N 3
UTILIZANDO
MINITAB

40
CASO N 3: REGRESION LINEAL SIMPLE
II. FASE RESULTADOS DEL CASO N 3
UTILIZANDO MINITAB

41
CASO N 3: REGRESION LINEAL SIMPLE

UTILIZANDO MEGA STAT

42
CASO N 4: REGRESION LINEAL MULTIPLE

1. El rendimiento de una reaccin qumica (Y) depende de la


Concentracin del reactivo ( X1) y de la temperatura de
operacin.( X2) . Los datos obtenidos son los siguientes:

Y 81 89 83 91 79 87 84 90
X1 1 1 2 2 1 1 2 2
X2 150 180 150 180 150 180 150 180

a) Ajuste un modelo de regresin lineal mltiple a los datos.


b) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de
Regresin. Si se emplea = 0.05 , Qu conclusiones se puede obtener?
c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul es el valor P de
esta prueba?
d) Calcule e interprete R y R 2
e) Prediga el Rendimiento de la reaccin qumica cuando la la Concentracin del
reactivo X1 = 1 y la temperatura de operacin X2 = 170

43
CASO N 4: REGRESION LINEAL MULTIPLE
UTILIZANDO SPSS
I. FASE OPERATIVA

44
CASO N 4: REGRESION LINEAL MULTIPLE
I. FASE OPERATIVA

UTILIZANDO SPSS

45
CASO N 4: REGRESION LINEAL MULTIPLE
II. FASE RESULTADOS

UTILIZANDO SPSS

46
CASO N 4: REGRESION LINEAL MULTIPLE

III. FASE ANALITICA

a) La ecuacin de regresin lineal mltiple del Rendimiento de una


Reaccin Qumica es:

39.750 + 3.000 X1 + 0.250 X2

47
CASO N 4: REGRESION LINEAL MULTIPLE
III. FASE ANALITICA
b) Interpretando coeficientes de Regresin y su significancia.

bo = 39.750, es el rendimiento de una reaccin qumica


independientemente de la Concentracin del reactivo ( X1) y de la
temperatura de operacin.( X2)

b1 = 3.000, representa el incremento promedio del rendimiento de


una reaccin qumica por cada variacin unitaria de la Concentracin
del reactivo (X1). Cuando la temperatura de operacin (X2)
permanece constante. Individualmente tiene influencia significativa
sobre el rendimiento ( p = 0.01)

b2 = 0.250 , representa el incremento promedio del rendimiento de


una reaccin qumica por cada variacin unitaria de Temperatura de
operacin ( X2). Cuando la Concentracin del reactivo (X1)
permanece constante. Individualmente tiene influencia altamente
significativa sobre el rendimiento ( p = 0.000)

48
CASO N 4: REGRESION LINEAL MULTIPLE

III. FASE ANALITICA

c) Pruebe la significancia de la Regresin utilizando = 0.05; Cul


es el valor P de esta prueba? Interpretando el cuadro ANVA

El anlisis de varianza nos indica que conjuntamente ambas, variables


Concentracin del reactivo ( X1) y la temperatura de operacin.( X2) tienen
influencia altamente significativa en la reaccin qumica ( p = 0.000)

d) Calcule e interprete R y R 2

R = 0.980, nos indica que existe elevada correlacin entre las variables
R2 % = 0.960 nos indica que el 96.0 % de la variabilidad de la reaccin
qumica es como consecuencia de la variabilidad de la Concentracin
del reactivo ( X1) y la temperatura de operacin.( X2)

49
CASO N 4: REGRESION LINEAL MULTIPLE

III. FASE ANALITICA


e) Prediga el Rendimiento de la reaccin qumica cuando la
Concentracin del reactivo X1 = 1 y la temperatura de operacin
X2 = 170

39.75 + 3 * X1 + 0.25 * X2

39.75 + 3 * 1 + 0.25 * 170

85.25

50
CASO N 5: REGRESION LINEAL MULTIPLE
Se piensa que la potencia consumida por una planta qumica est relacionada
con la temperatura ambiente promedio ( X1), el nmero de das al mes ( X2), la
pureza producto del producto ( X3), y las toneladas del producto producidas
(X4). Los datos correspondientes al ao pasado son:

Y 240 236 290 274 301 316 300 296 267 276 288 261
X1 25 31 45 60 65 72 80 84 75 60 50 38
X2 24 21 24 25 25 26 25 25 24 25 25 23
X3 91 90 88 87 91 94 87 86 88 91 90 89
X4 100 95 110 88 34 99 97 96 110 105 100 98

a) Ajuste un modelo de regresin lineal mltiple a los datos.


b) Prediga el consumo de de potencia para un mes en el que X1 = 75 F, X2 = 24
dias, X3 = 90% y X4 = 98 toneladas.
c) Pruebe la significancia de la Regresin utilizando = 0.01; Cul es el valor P de
esta prueba?
d) Utilice la prueba t para evaluar la contribucin al modelo de cada variable de
Regresin. Si se emplea = 0.01 , Qu conclusiones se puede obtener?
e) Calcule e interprete R y R 2

51
CASO N 5: REGRESION LINEAL MULTIPLE
I. FASE OPERATIVA
UTILIZANDO SPSS

52
CASO N 5: REGRESION LINEAL MULTIPLE

I. FASE OPERATIVA
UTILIZANDO
SPSS

53
CASO N 5: REGRESION LINEAL MULTIPLE
II. FASE RESULTADOS

UTILIZANDO
SPSS

54
BIBLIOGRAFIA

55
56

S-ar putea să vă placă și