Documente Academic
Documente Profesional
Documente Cultură
xi
46.8 20
30.0 16
63.0 43
42.4 20
51.5 15
54.3 32
56.5 19
40.6 13
51.0 32
55.0 19
51.3 12
39.0 30
53.0 19
50.3 12
52.0 26
55.0 18
62.4 10
55.0 25
54.0 18
39.3 10
41.2 23
50.7 17
43.2 9
47.7 22
37.5 17
40.4 7
44.5 22
61.0 16
37.7 6
43.0 21
48.1 16
27.7 3
39.643
0.436
SS
MS
412.20 412.20
1927.18 64.24
2339.38
Std.Err.
t Stat
3.467
0.172
11.433
2.533
F
Signific.F
6.42
0.01677
Pvalue
0.000
0.017
Lower
95%
32.561
0.085
Upper
95%
46.724
0.788
xi
ei
18.4
14.4
8.6
7.5
7.1
6.5
6.4
5.4
5.3
5.1
4.6
4.5
3.6
1.5
1.0
0.7
10
16
19
18
19
18
12
12
15
19
43
25
17
16
26
32
yi
43.2
47.7
46.8
40.4
51.0
37.7
39.3
40.6
44.5
43.0
42.4
41.2
37.5
27.7
39.0
30.0
xi
9
22
20
7
32
6
10
13
22
21
20
23
17
3
30
16
ei
-0.4
-1.5
-1.6
-2.3
-2.6
-4.6
-4.7
-4.7
-4.7
-5.8
-6.0
-8.5
-9.6
-13.3
-13.7
-16.6
38.952
0.494
SS
414.966
731.674
1146.64
Std.Err.
MS
414.966
29.267
2.700
0.131
14.425
3.765
t Stat
F
Signif.F
14.179 0.000903
P-value
0.000
0.001
Lower
95%
33.390
0.224
Upper
95%
44.513
0.764
40.829
0.360
3.904
0.206
10.459
1.749
F
3.0576
P-value
0.000
0.091
Signif.F
0.0909
Lower
95%
32.845
-0.061
Upper
95%
48.812
0.782
F
6.819
P-value
0.0000
0.0153
Signif.F
0.0153
Lower
95%
33.459
0.0902
Upper
95%
46.526
0.7702
Modelul obinut y i 39.99 0.43 xi este mai bun dect cel din varianta
anterioar, dar nu mai bun dect cel din varianta a 2-a. Acest model este global
semnificativ, dup cum arat testul Fisher, ncepnd de la un prag de 1.53%.
Coeficientul de determinaie de numai 0.22 poate determina renunarea la
aceast variant i pstrarea variantei, n care se elimin numai cele 5 valori
extreme, ncercuite n Figura 1.16.
Modelul reinut ca fiind cel mai bun este: y i 38.952 0.494 xi . Nu se
poate renuna la punctual izolat, pentru c acesta se afl pe direcia norului de
puncte, iar abaterea sa fa de linia de regresie din modelul iniial este mic.
1.15. Metode rezistente de regresie
Calitatea ajustrii folosind metoda regresiei, se apreciaz n funcie de
coeficientul de determinaie, R2. Informaia coninut n date, nu este toat
condensat n estimatorii: a 0 i a1 , R2 i SSE, ci se poate gsi i n reziduuri,
care conin partea de variaie neexplicat a variabilei dependente. Dac
analiznd reziduurile, se constat prezena unei structuri, nseamn c acestea
sunt nc purttoare de informaie, care s-ar putea modela. Modelul ales trebuie
modificat corespunztor.
Statisticianul Anscombe, n 1973, a gsit patru seturi de date care au
particularitatea de a furniza aceleai rezultate statistice. Pentru cele patru
grupuri de date, se gsete aceeai dreapt de regresie y i 3 0.5 xi , aceeai
abatere rezidual 1.236 i acelai coeficient de determinaie 0.667, ceea ce
nseamn c variabila x explic dou treimi din variana variabilei y.
x
10
14
5
8
9
12
4
7
11
13
6
Grupul A
y
8.04
9.96
5.68
6.95
8.81
10.84
4.26
4.82
8.33
7.58
7.24
8
10
5.5
7
7.5
9
5
6.5
8.5
9.5
6
x
10
14
5
8
9
12
4
7
11
13
6
Grupul B
y
y
9.14
8
8.1
10
4.74 5.5
8.14
7
8.77 7.5
9.13
9
3.1
5
7.26 6.5
9.26 8.5
8.74 9.5
6.13
6
x
10
14
5
8
9
12
4
7
11
13
6
Grupul C
y
7.46
8.84
5.73
6.77
7.11
8.15
5.39
6.42
7.81
12.74
6.08
8
10
5.5
7
7.5
9
5
6.5
8.5
9.5
6
x
8
8
8
8
8
8
8
19
8
8
8
Grupul D
y
y
6.58
7
5.76
7
7.71
7
8.84
7
8.47
7
7.04
7
5.25
7
12.5 12.5
5.56
7
7.91
7
6.89
7
8
6
4
2
0
0
Datele observate
10
15
dreapta de regresie
14
12
12
10
y
10
8
6
8
4
6
2
4
0
2 0
0
0
5
Datele observate
5
Datele observate
10
dreapta de regresie
10
dreapta de regresie
15
15
8
6
4
2
0
0
5
10
Datele observate
15
dreapta de regresie
20
x
min ( y i y i ) 2 .
i 1
0.09
0.181818
0.272727
0.363636
0.454545
0.545455
0.636364
0.727273
0.818182
0.909091
1
Ordin
cuantile
Cuantilele
x1/3 i x2/3
6.66
0.33333
10.33
0.66667
yi
5.73)
0.3686
3.8206
8.495)
yi a1xi
3.9153
3.8866
3.868
3.8393
3.8206
3.792
3.7733
3.7546
3.726
7.9473
3.6786
3.9153
3.8866
3.868
3.8393
3.8206
3.792
3.7733
3.7546
3.726
3.6786
7.9473
8
6
4
2
0
3
datele observate
11
13
15
dreapta de regresie corecta x
n( n 1)
cupluri de puncte;
2
xi x j 14
10
14
5
8
9
12
4
7
11
13
6
9 12
7 11 13
4 -5 -2 -1 2 -6 -3 1 3 -4
0 -9 -6 -5 -2 -10 -7 -3 -1 -8
0 3 4 7 -1 2 6 8 1
0 1 4 -4 -1 3 5 -2
0 3 -5 -2 2 4 -3
0 -8 -5 -1 1 -6
0 3 7 9 2
0 4 6 -1
0 2 -5
0 -7
0
5.73
6.77
7.11
8.15
5.39
6.42
7.81 12.74
5.28
3.9
7.01
5.97
5.63
4.59
7.35
6.32
4.93
0
6.08
-1.38
-2.76
0.35
-0.69
-1.03
-2.07
0.69
-0.34
-1.73
-6.66
0
prin metoda celor trei puncte. Graficul din Figura 1.23 prezint cele dou
drepte de regresie obinute prin metoda celor 3 puncte i prin metoda lui Theil.
xi x j y i y j
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
4
-5
-2
-1
2
-6
-3
1
3
-4
-9
-6
-5
-2
-10
-7
-3
-1
-8
3
4
7
-1
2
6
8
1
1
4
-4
-1
3
5
-2
3
-5
-2
2
4
-3
-8
-5
-1
1
-6
3
7
9
2
1.38
-1.73
-0.69
-0.35
0.69
-2.07
-1.04
0.35
5.28
-1.38
-3.11
-2.07
-1.73
-0.69
-3.45
-2.42
-1.03
3.9
-2.76
1.04
1.38
2.42
-0.34
0.69
2.08
7.01
0.35
0.34
1.38
-1.38
-0.35
1.04
5.97
-0.69
1.04
-1.72
-0.69
0.7
5.63
-1.03
-2.76
-1.73
-0.34
4.59
-2.07
1.03
2.42
7.35
0.69
b
1
b
0
0.3450
0.3460
0.3450
0.3500
0.3450
0.3450
0.3467
0.3500
1.7600
0.3450
0.3456
0.3450
0.3460
0.3450
0.3450
0.3457
0.3433
-3.900
0.3450
0.3467
0.3450
0.3457
0.3400
0.3450
0.3467
0.8763
0.3500
0.3400
0.3450
0.3450
0.3500
0.3467
1.1940
0.3450
0.3467
0.3440
0.3450
0.3500
1.4075
0.3433
0.3450
0.3460
0.3400
4.5900
0.3450
0.3433
0.3457
0.8167
0.3450
4.0044
4.0022
4.0022
4.0056
4
4.0033
4.0078
4.0011
4.0089
8.2478
4.0067
Me=b0
4.0044
50
51
52
53
54
55
4
6
-1
2
-5
-7
1.39
6.32
-0.34
4.93
-1.73
-6.66
Me=b1
0.3475
1.0533
0.3400
2.4650
0.3460
0.9514
0.3456
7.46
8.84
5.73
6.77
7.11
8.15
5.39
6.42
7.81
12.74
6.08
(y
i 1