Documente Academic
Documente Profesional
Documente Cultură
DISEO DE EXPERIMENTOS
Teora
Dr. Primitivo Reyes Aguilar
Mail: primitivo_reyes@yahoo.com
Cel. 04455 5217 4912
P.
OBJETIVO
Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS...............................4
1.1 Aplicaciones del diseo de experimentos...................................5
Definicin de experimento, diseo de experimentos y eficiencia
de un experimento.........................................................................7
1. 2 Principios bsicos del diseo de experimentos..........................7
1.3. Metodologa general para realizar un experimento..................9
1.4. Aplicaciones del diseo de experimentos................................13
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)..................15
2.1 Introduccin..............................................................................15
2.2 Tipos de variacin y sumas de cuadrados.................................16
2.3 Uso de Excel:.............................................................................18
2.4 Uso de Minitab...........................................................................19
2.5 Grafica de residuos contra el valor ajustado de y ij ....................20
2.6 Ejercicios...................................................................................21
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2
VIAS)...................................................................................................23
3.1 Introduccin..............................................................................23
3.2 Ejemplos con clculo manual....................................................23
3.3 Procedimiento en Excel.............................................................24
3.4 ANOVA en Minitab.....................................................................25
4. DISEOS FACTORIALES...................................................................29
4.1 Principios y definiciones bsicas...............................................29
Ventajas de los diseos factoriales..............................................31
4.2 Diseo factorial de dos niveles (2^K).......................................32
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES.....40
5.1 Concepto de replicacin fraccionada........................................40
Pgina 2 de 82
P.
Pgina 3 de 82
P.
Entradas
Proceso
Salida
z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema
Pgina 4 de 82
P.
de
experimentos
se
plantean
varias
preguntas
Pgina 5 de 82
P.
Pgina 6 de 82
P.
F1
F2
F11
F21
F12
F22
CARACTERISTICA
DE C ALIDAD
F41
F31
F32
F42
F4
F3
Pgina 7 de 82
P.
Diseo de experimentos
P.
2.2
3.4
2.8
3.9
3.2
4.3
3.6
4.7
2.95
4.07
Pgina 9 de 82
P.
Pgina 10 de 82
P.
Cuantitativa
Precisa.
Que tenga algn significado fsico.
P.
desarrollada
Pgina 12 de 82
por
Douglas
C.
P.
Pgina 13 de 82
P.
Pgina 14 de 82
P.
Qu
Qu
Qu
Qu
Qu
Qu
Pgina 16 de 82
P.
P.
H 0 1 2 3 .... k
H 1 : Al menos dos medias poblaciona les son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que
utiliza muestras independientes son:
1. Ambas poblaciones son normales.
2
2
2. Las varianzas poblacionales son iguales, esto es, 1 2 .
El estadstico tiene una distribucin muestral resultando:
sb2
Fc 2
sw
El valor crtico para la prueba F es:
F , ( k 1), k ( n 1))
Donde el nmero de grados de libertad para el numerador (Sb^2 >
Sw^2) es k-1 y para el denominador es k(n-1), siendo el nivel de
significancia.
k = nmero de muestras.
Por ejemplo:
Pgina 17 de 82
P.
c=1
SCT
i 1
( Xij X )
j 1
Pgina 18 de 82
P.
SCTR rj ( X j X ) 2
j 1
SCE
i 1
(X
j 1
ij
X j )2
19.4
32.9
16.9
P.
1.946745562
=DISTR.F.INV(0.05, 2, 11) =
Pgina 20 de 82
P.
ZONA
DE
RECHAZO
NO
RECHAZAR
Distr. F
Pgina 21 de 82
RESUMEN
P.
Anlisis de varianza de un
factor
Varianz
Cuenta
Suma Promedio
a
32.666
4
320
80
667
Grupos
Programa
1
Programa
2
Programa
3
405
81
425
85
17
Grado Promedio
ANLISIS DE VARIANZA s de
de
Variacione
Suma
liberta Cuadrado
s
cuadrados
d
s
Entre
65.714285
32.85714
grupos
71
2
286
Dentro de
16.90909
grupos
186
11
091
251.71428
Total
57
13
Probabili
Fc
dad
F crtica
1.9431 0.189377 3.98229
644
31
796
DF
2
11
13
SS
65.7
186.0
251.7
S = 4.112
MS
32.9
16.9
R-Sq = 26.11%
F
1.94
P
0.189
R-Sq(adj) = 12.67%
N
4
5
Mean
80.000
81.000
StDev
5.715
2.236
----+---------+---------+---------+----(------------*------------)
(----------*-----------)
Pgina 22 de 82
85.000
4.123
P.
(-----------*----------)
----+---------+---------+---------+----77.0
80.5
84.0
87.5
Programa 2
Programa 3
Lower
-6.451
-2.451
Center
1.000
5.000
Upper
8.451
12.451
--------+---------+---------+---------+(------------*-----------)
(-----------*------------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Upper
11.025
--------+---------+---------+---------+(-----------*----------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Programa 3
Lower
-3.025
Center
4.000
Pgina 23 de 82
P.
2.6 Ejercicios
1. Cuatro catalizadores que pueden afectar la concentracin de un
componente en una mezcla lquida de tres componentes estn siendo
investigado.
Se obtienen las siguientes concentraciones:
A
58.2
57.2
58.4
55.8
54.9
Cataliza
dor
B
56.3
54.5
57
55.3
C
50.1
54.2
55.4
D
52.9
49.9
50
51.7
Pgina 24 de 82
P.
B
78
91
97
82
85
77
C
55
66
49
64
70
68
D
64
72
68
77
56
95
B
71
75
73
74
69
82
C
59
64
62
69
75
67
Pgina 25 de 82
P.
Mquinas
Maq
1
Maq 2 Maq 3 Promedios
27
21
25
24.33333
31
33
35
33
42
39
39
40
Pgina 26 de 82
4
5
Promedios
TABLA ANOVA
SS
SCTR
0.93333
=
3
SCBL
764.933
=
3
41.0666
SCE =
7
806.933
SCT =
3
38
45
36.6
41
46
36
GL
P.
37
45
36.2
CMTR
=
CMBL
=
CME=
CM
0.46666
7
191.233
3
5.13333
3
14
CMT=
57.6381
38.66667
45.33333
36.26667
Fc
Ftr =
0.09
Fbl =
37.25
Falfa
4.46
3.84
Pgina 27 de 82
P.
294
73.5
274
68.5
302
75.5
291
72.75
2.92
274
68.5
1.67
ANLISIS DE VARIANZA
Fuente
Suma Grados Cuadrad
de
de
de
os
variaci Cuadrad liberta
n
os
d
medios
Filas
12.95
3
4.32
Column
as
157
4
39.25
Error
21.8
12
1.82
Total
191.75
19
Total
231
24
Fc
F
Probabilid tabla
ad
s
2.38
Valor P
0.12
3.49
21.61
2.06E-05
3.26
Pgina 28 de 82
P.
Resp
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69
Colum
na
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
Fila
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Instrucciones:
Stat > ANOVA > One two Way
Response Respuesta,
indicar Row factor y Column Factor,
Seleccionar ! Display Means
Seleccionar ! Store Residuals
! Store Fits
Confidence
level 95%
Graphs
Seleccionar Normal plot of residuals
OK
Resultados:
Pgina 29 de 82
P.
95
90
Percent
80
70
60
50
40
30
20
10
5
-3
-2
-1
0
Residual
DF
3
4
12
19
SS
12.95
157.00
21.80
191.75
R-Sq = 88.63%
MS
4.3167
39.2500
1.8167
F
2.38
21.61
P
0.121
0.000
R-Sq(adj) = 82.00%
Mean
70.6
71.4
72.4
72.6
Pgina 30 de 82
Rollo
1
2
3
4
5
Mean
73.50
68.50
75.50
72.75
68.50
P.
Pgina 31 de 82
P.
4. DISEOS FACTORIALES
4.1 Principios y definiciones bsicas
B2
A1
20
30
A2
40
52
Factor A
40 52
2
20 30
2
21
Pgina 32 de 82
30 52
2
20 40
P.
11
B2
A1
20
40
A2
50
12
Factor A
B2
50
B1
40
30
20
10
B2
B1
A1
Factor A
A2
Pgina 33 de 82
P.
60
B1
50
B2
40
30
20
B1
10
B2
A1
Factor A
A2
50 12
2
20 40
2
P.
Pgina 35 de 82
P.
Factor B
B1
B2
A1
A1B1
A1B2
A2
A2B1
12
Factor A
A
A
A
A
Combinacin de
tratamientos
baja, B baja
alta, B baja
baja, B alta
alta, B alta
I
28
36
18
31
Pgina 36 de 82
II
25
32
19
30
Replica
III
27
32
23
29
Total
80
100
60
90
P.
Alto (2 sacos) +
bajo (1 saco) -
b = 60(18+19+23)
ab = 90(31+30+19)
(1) = 80(28+25+27)
a = 100(36+32+32)
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
Fig.
3
Pgina 37 de 82
P.
1
2n
ab b a (1) 1 ab a b (1)
2n
1
2n
ab a b (1)
1
2n
ab b - a (1)
AB
1
2n
ab b a (1)
1
2n
ab (1) a (b)
Y A).
Esto es,
Pgina 38 de 82
P.
A YA YA
ab a
2n
1
2n
b (1)
2n
ab a b (1)
B YB YB
ab b
2n
1
2n
a (1)
2n
ab b a (1)
AB
1
2n
ab (1)
2n
ab
2n
ab (1) a b
Pgina 39 de 82
P.
1
2(3)
1
2(3)
AB
90 100 60 80 8.33
90 60 100 80 5.00
1
2(3)
90 80 100 60 1.67
ContrasteA ab a b (1)
Este contraste suele llamarse efecto total de A. A partir de la
segunda y tercera ecuacin, puede apreciarse que tambin se utilizan
contraste para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:
aciyi.
SSc 1
2
n a
a ci
Pgina 40 de 82
P.
ab a b (1)
SSA
n*4
ab b a (1)
SSB
n*4
ab (1) a b
SSAB
n*4
SSA
SSB
50
2
208.33
4(3)
30
SSAB
4(3)
10
75.00
4(3)
8.33
2
Y ...
4n
Pgina 41 de 82
P.
2
2 2 3
Y
2
SS E Yijk
9398.00 9075.00 323.00
i1j1k 1
4(3)
SS E SS T SS A SS B SS AB
(1)
-1
-1
+1
a
+1
-1
-1
b
-1
+1
-1
Ab
+1
+1
+1
SS
G.L.
208.33
1
75.00
1
8.33
1
31.34
8
323.00
11
a
significativo al 1%
MS
208.33
75.00
8.33
3.92
Efecto Factorial
(1)
a
b
ab
+
+
+
+
I A B AB
+
+
- +
- + + +
Pgina 42 de 82
Fo
53.15a
19.13a
2.13
P.
1
2n
ab b a (1)
1
2n
ab a b (1)
Pgina 43 de 82
P.
K!
r! (k r)!
Pgina 44 de 82
P.
P.
Pgina 46 de 82
Notacin 1
a
b
c
abc
P.
Notacin 2
+ - - + - - +
+ + +
Efecto factorial
Combinacin de
Tratamientos
I
+
+
+
+
+
+
+
+
a
b
c
abc
ab
ac
bc
(1)
A
+
+
+
+
-
B
+
+
+
+
-
C
+
+
+
+
-
AB
+
+
+
+
AC
+
+
+
+
BC
+
+
+
+
ABC
+
+
+
+
-
bc
ac
ab
B
A
(1 )
P.
LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es
imposible distinguir entre A y BC, entre B y AC y entre C y AB. De
hecho, es posible mostrar que cuando se estima A, B y C, en realidad,
lo que s esta haciendo es estimar A + BC, CB + AC y C + AB,
respectivamente. Dos o ms efectos que tienen esta propiedad se
conoce como alias. En este ejemplo, A y BC, B y AC y C y AB son
alias. Esto se indica empleando la notacin:
LA A BC,
LB B AC
LC C AB
La estructura de los alias de este diseo pueden determinarse
fcilmente con la relacin I = ABC, multiplicando cualquier efecto por
la relacin que define al diseo, modulo 2, da como resultado los alias
de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A2BC
O dado que el cuadrado de cualquier columna es simplemente la
identidad I.
A = BC
De modo similar, se encuentra que los alias de B y C son:
B*I = B*ABC = AB2C = AC
C*I = C*ABC = ABC2 = AB
Pgina 48 de 82
P.
Notacin 2
(1)
ab
ac
abc
--+++-+
-++
L' A A BC
L' B B AC
L' C C AB
Por lo tanto, en realidad se est estimando A BC, B AC y C AB al
estimar A, B y C con esta fraccin. En la prctica, no importa cual de
las dos fracciones se utilice. Generalmente la fraccin asociada con I
= +ABC se denomina fraccin principal. Ambas fracciones pertenecen
a la misma familia; en otras palabras, estas dos fracciones forman el
diseo 23 completo.
Pgina 49 de 82
P.
2III
Pgina 50 de 82
P.
Tipo de material
1
3
3
130
74
150
159
138
168
15
155
180
188
126
110
160
Temperatura F
70
34
40
80
75
126
122
106
115
174
120
150
139
20
82
25
58
96
82
125
70
58
70
45
104
60
Pgina 51 de 82
P.
i 1,2,..., a
k 1,2,..., n
manera que: i1
se realizan n rplicas.
Pgina 52 de 82
observaciones porque
P.
2 ...b 0
H1 : al menos una j 0
Tambin es interesante determinar s los tratamientos de rengln y
columna
interaccionan. En otras palabras, resulta conveniente
probar:
Ho : ()i 0 para toda i, j
H1 : al menos una ()i 0
Pgina 53 de 82
b n
Yijk
Yi..
j1k 1
Yi..
a n
Y.j. Yijk
i1k 1
Y.j.
n
Yij. Yijk
k 1
Yij.
Yi..
bn
Y.j.
a b n
Y... Yijk
i1j1k 1
; i 1,2,..., a
; j 1,2,..., b
an
Y...
P.
i 1,2,..., a
j 1,2,...,b
Y...
Y...
abn
i1
2
n
b Yijk Y...
k 1
j1
2
a b n
Yijk Y...
i1j1 k 1
2
2
2
a
b
a b
bn Yi.. Y... an Y.j. Y... n Yij. Yi.. Y.j. Y...
i1
j1
i1j1
2
a b n
Yijk - Yij.
i1j1 k 1
P.
Grados de libertad
a-1
b-1
(a-1)(b-1)
ab(n-1)
abn-1
Pgina 55 de 82
P.
Fuente de
Variacin
SS
Tratamientos A SSA
G.L.
a-1
MS
MSA
SSA
Fo
MSA
MSE
a 1
Tratamientos B SSB
Interaccin
SSAB
b-1
MSB
MSB
SSB
MSE
b 1
(a - 1)(b - MSAB
1)
SSAB
MSAB
MSE
(a 1)(b 1)
Error
SSE
ab(n-1)
MSB
SSE
ab(n 1)
Total
SST
abn - 1
Pgina 56 de 82
P.
2
2
a Y i.. Y ...
SSA
i1 bn
abn
2
2
b Y .j. Y ...
SSB
j1 an
abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la
suma de cuadrados entre los totales de las ab celdas, conocida como
la suma de cuadrados debido a los "subtotales":
2
2
a b Y ij. Y ...
SSsubtotales
i1j1 n
abn
Esta suma de cuadrados contiene a la SS A y SSB. Por lo tanto, la
segunda etapa consiste en calcular SSAB mediante:
SSE
o bien :
SSE
SST SSSubtotales
Pgina 57 de 82
Ti
p 15
o
d
e
70
P.
125
Yi.
.
M
at
.
1
1 1
3 5
0 5
7 1
4 8
0
1 1
5 8
0 8
1 1
5 2
9 6
1 1
3 1
8 0
1 1
6 6
8 0
Y.j 1738
.=
3 4
4 0
2
539 4
2
134.75 8 7 9
0 5
2 7
0 0
2 7
5 0
623
1 1
3 2
6 2 4
7
1 1 9
0 1
6 5
576
1 1
7 2
4 0 5
8
1 1 3
5 3
0 9
9 1
6 0
4 3 15
4
8 6 2 01
2 0
1291
770
2
99
3
8 5 0 8
2 8
1
13
9
5 4 8 00
8 5
Y..
.=
37
99
Pgina 58 de 82
P.
2
a b n 2
Y ...
SST Y ijk
i1j1 k 1
abn
130
2
2
2
2 3799
155 74 ... 60
77,646.97
36
2
2
a Y i.. Y ...
SSmaterial
i1 bn
abn
2
2
2
2
998 1300 1501
3799
10,683.72
(3)(4)
36
2
2
b Y .j. Y ...
SStemperat ura
j1 an
abn
2
2
2
2
1738 1291 770
3799
39,118.72
(3)(49
36
2
2
a b Y ij. Y ...
SSinteraccion
i1j1 n
abn
2
2
2
2
539 229 ... 342
3799
10,683.72
4
36
39,118.72 9,613.78
Pgina 59 de 82
Fuente de variacin
Tipo de material
Temperatura
Interaccin
Error
Total
SS
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97
P.
G.L.
2
2
4
27
35
MS
5,341.86
19,558.36
2,403.44
675.21
Fo
7.91
28.97
3.56
175
150
125
Yij. 100
Material tipo 3
75
Material tipo 1
Material tipo 2
50
25
15
70
Tempera tura
125
P.
Pgina 61 de 82
P.
Pgina 62 de 82
P.
La (b)C
Donde:
a = Representa el nmero de pruebas o condiciones experimentales
que se tomarn. Esto es el nmero de renglones o lneas en el
arreglo.
b = Representa los diferentes niveles a los que se tomar cada
factor.
c = Es el nmero de efectos independientes que se pueden analizar,
esto es el nmero de columnas.
A
1
1
2
2
2
F A C T O R E S (c)
B
C
1
1
2
2
1
1
2
1
Resultado
Y1
Y2
Y3
Y4
Pgina 63 de 82
P.
a No. de
probar
4
8
12
16
32
64
condiciones
Col.
1
Col.
2
Col.
3
Col.
4
Col.
5
Col.
6
Col.
7
1
1
1
1
2
2
2
2
1
1
2
2
1
1
2
2
1
1
2
2
2
2
1
1
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
1
2
2
1
1
2
2
1
1
2
2
1
2
1
1
2
3
2
1
(3)
4
5
6
7
(4)
5
4
7
6
1
(5)
6
7
4
5
2
1
(1)
Matriz o
tabla de
interacci
ones
Column
as
1
1
(1)
2
3
4
5
6
7
2
3
(2)
Pgina 64 de 82
7
6
5
4
3
2
6
(7)
P.
1
3
5
1
.7
6
2
6
(a)
4
(b)
Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el
caso de menor es mejor son:
P.
Factores de control
Contaminacin de FeII
Temperatura C
Tiempo
de
aejamiento h
pH
Nivel 1
2
25
Nivel 2
7
50
Nivel 3
15
75
1
8
2
10
3
12
Pgina 66 de 82
P.
Factores de ruido
Conc. De KMnO4
Nivel 1 Nivel 2
0.00375 0.0375
Nivel 3
0.075
L9
Col.1 Col.
Exp.
No.
1
Col.
4
Col.
3
C
2
3
4
5
6
1
1
2
2
2
2
3
1
2
3
2
3
2
3
1
2
3
3
1
2
7
8
3
3
1
2
3
1
2
3
N1
Rep.
1
N1
Rep.
2
N2
Rep.
1
N2
Rep.
2
2.24
1.75
5.32
0.37
7.2
39.1
7
0.57
0.59
5.07
0.65
0.32
0.49
27.0
5
1.26
3.88
15.4
2
7.85
25.5
2
5.29
1.05
0.4
0.34
0.48
46.5
4
0.61
22.7
4
35.2
7
1.75
0.41
1.07
0.68
0.44
25.7
7
0.7
36.3
3
48.6
1
N3
Rep.
1
155.
04
0.38
0.51
4.31
0.8
138.
08
0.91
92.8
67.5
6
1 n 2
yi
n i 1
S / N 10 log
A1 = Y1 + Y2 + Y3
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9
Pgina 67 de 82
N3
Rep.
2
166.
27
0.48
0.36
0.65
0.88
165.
61
1.42
120.
33
72.7
3
Y
promedio
S/N
55.20
1.52
1.39
1.11
1.72
-39.36
-7.05
-7.05
-5.19
-9.54
73.70
0.91
-39.34
0.28
47.32
-36.20
44.19
-33.79
P.
B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
SSB
Term
Constant
A
A
B
B
C
C
D
D
1
2
1
2
1
2
1
2
Coef
-19.6915
1.8735
1.6687
4.9386
2.0970
-18.6078
4.3499
-7.8678
4.3221
Pgina 68 de 82
P.
S = *
Analysis of Variance for SN ratios
Source
contribucin
A
B
C
D
Residual Error
Total
DF
2
2
2
2
0
8
Seq SS
56.52
234.86
1705.37
279.46
*
2276.21
Adj SS
56.52
234.86
1705.37
279.46
*
28.261
117.428
852.685
139.732
*
Adj MS
*
*
*
*
*
*
*
*
P
2.49%
10.32%
74.91%
12.28%
Term
Constant
A
A
B
B
C
C
D
D
1
2
1
2
1
2
1
2
Coef
25.2281
-5.8598
0.2819
-6.1548
-8.3748
33.5124
-9.6215
8.4707
0.1513
S = *
Analysis of Variance for Means
Source
A
B
C
D
Residual Error
Total
DF
2
2
2
2
0
8
Seq SS
196.59
957.39
5359.29
438.35
*
6951.62
Adj SS
196.59
957.39
5359.29
438.35
*
Adj MS
98.30
478.69
2679.65
219.17
*
F
*
*
*
*
P
*
*
*
*
A
-17.818
-18.023
-23.234
5.416
4
B
-14.753
-17.595
-26.727
11.974
3
C
-38.299
-15.342
-5.434
32.866
1
D
-27.559
-15.369
-16.146
12.190
2
Porcentaje de
A
19.368
25.510
30.806
Delta
Rank
B
19.073
16.853
39.758
11.438
4
C
58.741
15.607
1.337
P.
D
33.699
25.379
16.606
22.904
2
57.403
1
17.093
3
-10
Mean of SN ratios
-20
-30
-40
1
2
C
2
D
-10
-20
-30
-40
60
45
Mean of Means
30
15
0
1
2
C
2
D
60
45
30
15
0
Mean
Pgina 70 de 82
5.70044
-10.5261
Pgina 71 de 82
P.
P.
*
**
*
*
*
*
*
*
*
b1
* *
* *
*
*
*
*
*
b0
Correlacin positiva
Correlacin negativa
Sin
correlacin
Pgina 72 de 82
Pgina 73 de 82
P.
P.
X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error
se aplicarn en el siguiente ejemplo por claridad. Se tienen los
siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la
recta de regresin poblacional
2. Las varianzas de los errores son las mismas en todos los valores de
X (Homoscedasticidad)
en caso contrario se tiene
(Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn
patrn definido.
El coeficiente de Correlacin r desarrollado por Carl Pearson es un
indicador de la fuerza de la relacin entre las variables X y Y, puede
asumir valores entre -1 y 1 para correlacin negativa y positiva
perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una
caldera, se deben buscar soluciones al problema mediante acciones
asociadas con la variable presin; de lo contrario, sera necesario
buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:
Pgina 74 de 82
P.
Y
Yest = 4.4 + 1.08 X
Yi =
23
Desviacin no
explicada
Error = (Yi - Yest) =
1.32
Variacin
total
(Yimedia)=5.13
Desviacin
explicada
(Yest-Ymedia) =
3.81
Ymedia =17.87
X = 16
Y Tiempo
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
27.50
17.08
37.00
41.95
11.66
21.65
17.89
69.00
10.30
(Xi-X)*(Yi-Y)
119.076672
1.099872
7.499472
10.502272
0.963072
51.612672
91.433472
121.260672
-3.558928
0.367872
50.679872
21.989472
48.568672
108.406272
31.303072
47.245472
470.014272
135.625472
(Xi-X)^2
(Yi-Y)^2
38.9376 364.1533
0.0576
21.0021
7.6176
7.3832
3.0976
35.6075
0.0576
16.1026
17.9776 148.1771
38.9376 214.7045
38.9376 377.6337
0.5776
21.9286
0.0576
2.3495
17.9776 142.8694
7.6176
63.4763
14.1376 166.8541
38.9376 301.8142
17.9776
54.5057
17.9776 124.1620
138.2976 1,597.3771
52.4176 350.9178
Pgina 75 de 82
Yest
10.9199
28.3362
37.0443
34.1416
28.3362
16.7253
10.9199
10.9199
31.2389
28.3362
16.7253
37.0443
39.9470
10.9199
16.7253
16.7253
63.1686
8.0172
Error
0.9408
15.1022
28.0292
0.7369
10.9969
0.0181
11.9721
1.7422
47.4563
0.6991
0.1258
0.0020
4.0121
0.5477
24.2523
1.3564
34.0052
5.2111
P.
10
15
15
16
17
6
5
34.93
46.59
44.88
54.12
56.63
22.13
21.15
10.379072
118.686672
107.127072
194.676672
241.751472
15.462272
25.540272
206
725.82
2,027.7132
698.5600
Sxy
Sxx
Syy = SST
Sxy
Sxx
Syy
X
promedio
Y Promedio
3.0976
45.6976
45.6976
60.2176
76.7376
5.0176
10.4976
34.7770
308.2553
251.1337
629.3676
761.6054
47.6486
62.1385
34.1416 0.6216
48.6551 4.2646
48.6551 14.2512
51.5578 6.5649
54.4605 4.7068
22.5307 0.1606
19.6280 2.3164
220.092
6,105.9447
6
b0 0
( Xi X )(Yi Y ) S
S
( Xi X )
XY
1 X i
n
XX
= 2.902704421
Y X
= 5.114515575
SST (Yi Y ) 2
6,105.9447
220.0926
SSE
r2 1
P.
SST
SST
SST = 0.9639
627
25
Observaciones
ANLISIS DE VARIANZA
Grados
de
libertad
Residuos
Total
XServicios
Promedio
Suma de de
Cuadrad
os
5885.852
1
069
220.0926
23
348
6105.944
24
704
Regresin
Intercepcin
P.
Valor
cuadra
crtico de
dos
F
F
5885.852 615.0800 4.24118E
069
898
-18
9.569244
992
Coeficien
Error
Estadsti Probabili Inferior
tes
tpico
co t
dad
95%
5.114515 1.145804 4.463691 0.000177 2.744239
575
127
004
215
161
2.902704 0.117040 24.80080 4.24118E 2.660587
421
719
825
-18
249
Pgina 78 de 82
P.
70
60
S
R-Sq
R-Sq(adj)
Y Tiempo
50
3.09342
96.4%
96.2%
40
30
20
10
0
0
10
X Servicios
15
20
Pgina 79 de 82
P.
Pgina 80 de 82
P.
8.5 Ejercicios:
1. La energa consumida en un proceso depende del ajuste de
mquinas, realizar una regresin cuadrtica con los datos siguientes y
responder las preguntas.
Cons_energ Ajuste
a
Mq.
Y
X
21.6
11.15
4
15.7
1.8
18.9
1
19.4
1
21.4
0.8
21.7
3.8
25.3
7.4
26.4
4.3
26.7
36.2
29.1
a) Trazar un diagrama de dispersin
b) Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c) Estimar el consumo de energa para un ajuste de mquina de 20
con regresin cuadrtica
d) Obtener los intervalos de prediccin y de confianza para un ajuste
de mquina de 20
e) Obtener el coeficiente de correlacin y de determinacin
2. En base al porcentaje de puntualidad se trata de ver si hay
correlacin con las quejas en una lnea area. Las quejas son por cada
100000 pasajeros.
%punto Queja
s
s
Aeroline
a
X
Y
A
81.8
0.21
B
76.6
0.58
C
76.6
0.85
D
75.7
0.68
E
73.8
0.74
F
72.2
0.93
G
70.8
0.72
H
68.5
1.22
a) Trazar un diagrama de dispersin
b) Obtener la ecuacin de regresin lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
Pgina 81 de 82
P.
Pgina 82 de 82