Documente Academic
Documente Profesional
Documente Cultură
LUCRAREA
1
1. Obiectivele lucrrii
nsuirea unor noiuni referitoare la: principalele tipuri de prelucrri statistice efectuate
asupra eantioanelor de valori provenite din msurri experimentale sau din operaii de
achiziie de date, domeniil de aplicabilitate ale respectivelor prelucrri, algoritmii i modurile
de lucru corespunztoare.
Aplicarea testelor statistice prezentate n lucrare asupra unui eantion de date
experimentale i enunarea concluziilor corespunztoare.
2. Noiuni teoretice
n situaiile n care se urmrete determinarea valorii unei variabile dintr-un anumit proces,
atunci cnd se dorete eliminarea sau reducerea efectelor datorate diverselor tipuri de erori,
valorile experimentale obinute sunt supuse unor teste ce evalueaz influenele induse de ctre
factorii generatori de erori de msurare.
Principalele categorii de teste statistice aplicabile unui eantion de valori experimentale
sunt dedicate identificrii i eventual eliminrii unor influene datorate celor trei tipuri de erori
ce pot conduce la diferene ntre valorile msurate i cele reale ale variabilei ce se dorete a fi
determinat:
erori aberante (grosolane), cauzate de funcionarea defectuoas a sistemului de
msurare sau provenite din nerespectarea de ctre operatorul uman a metodologiei
adecvate de msurare;
erori sistematice, cauzate n general de configurarea (reglarea) incorect a sistemului
de msurare sau de influena unor factori exteriori de valoare constant;
erori aleatoare, prezente n majoritatea activitilor de msurare, datorate caracterului
stochastic al oricrui proces natural, inclusiv al procesului studiat i al celui n urma
cruia se obin valorile experimentale.
n continuare vor fi prezentate o serie de teste pentru identificarea celor trei tipuri de erori
enumerate mai sus. Dac identificarea valorilor experimentale afectate de erori aberante poate
fi urmat de eliminarea valorilor respective din eantionul de date experimentale, prezena
erorilor sistematice nu poate fi perceput dect prin influena sa asupra ntregului eantion de
valori experimentale. Reducerea efectelor induse de ctre erorile sistematice nu poate fi
realizat dect prin compararea rezultatelor prelucrrii mai multor eantioane de valori
experimentale. Deoarece erorile aleatoare apar n majoritatea eantioanelor de valori
experimentale (excepie fcnd unele determinri precise ale unor variabile de natur
discret), testele statistice nu urmresc n acest caz dect evidenierea gradului n care aceste
erori au afectat eantionul respectiv, indicnd dac densitatea de probabilitate a acestuia mai
coincide ca form general cu aceea a variabilei reale ce a fost msurat.
2.1. Eliminarea datelor afectate de erori aberante
Fiind dat un ir de valori experimentale x 1 , x 2 ,..., x n , se consider c valoarea xi este
afectat de erori aberante dac este verificat condiia (criteriul Chauvenet)
xi x z
(1.1)
n
2
1
xi x
n 1 i1
(1.2)
0,435 0,862 a
1 3,604 a 3,213 a 2
(1.3)
2 n 1
4n
(1.4)
unde
a
Dac, n urma aplicrii testului, rezult c una dintre valorile testate este afectat de erori
aberante, valoarea respectiv este eliminat din cadrul eantionului, se recalculeaz valorile
mediei i abaterii standard pentru valorile rmase i se reia verificarea condiiei (1.1),
algoritmul aplicndu-se pn cnd condiia respectiv nu mai este verificat pentru nici una
dintre cele dou valori extreme ale eantionului.
2.2. Verificarea caracterului aleator
Unul dintre testele cele mai utilizate pentru verificarea caracterului aleator al unui eantion
de valori experimentale este testul Young, descris prin algoritmul de mai jos.
Pasul 1: Fiind dat un ir de valori experimentale x 1 , x 2 ,..., x n , se calculeaz mrimea
2
i mrimea
1 n 1
x i 1 x i 2
n 1 i 1
(1.5)
(1.6)
(1.7)
Tabelul 1.2
VCI
n
4
5
6
7
8
9
10
11
12
15
20
25
= 0,95
0,78
0,82
0,89
0,94
0,98
1,02
1,06
1,10
1,13
1,21
1,30
1,37
VCS
= 0,99
0,53
0,54
0,56
0,61
0,66
0,71
0,75
0,79
0,83
0,92
1,04
1,13
= 0,95
3,22
3,18
3,11
3,06
3,02
2,98
2,94
2,90
2,87
2,79
2,70
2,63
= 0,99
3,47
3,46
3,44
3,39
3,34
3,29
3,25
3,21
3,17
3,08
2,96
2,87
Se poate observa c testul nu poate fi aplicat dect pentru eantioane coninnd cel mult 25
de valori experimentale.
Parametrul din tabelul 1.2 are semnificaia unui coeficient de ncredere i poate fi ales
orientativ, n funcie de volumul eantionului, din tabelul 1.3.
Tabelul 1.3
n
5
6
7
8
9
10
12
14
0,960
0,970
0,976
0,980
0,983
0,985
0,988
0,990
n
16
18
20
25
30
50
100
150
0,991
0,992
0,993
0,994
0,995
0,996
0,997
0,9973
Dac volumul eantionului se afl ntre dou valori din tabelul 1.3, este indicat s se aleag
valoarea corespunztoare unui volum mai mic al eantionului.
Alegerea coeficientului de ncredere din tabelul 1.3 poate fi nlocuit de determinarea
acestuia cu ajutorul relaiei
(1.8)
Dac valoarea aleas sau calculat a coeficientului de ncredere se afl ntre valorile
disponibile n tabelul 1.2, este indicat s se aleag valoarea disponibil inferioar.
Alegerea valorilor VCI i VCS din tabelul 1.2 poate fi nlocuit cu determinarea acestora
cu ajutorul relaiilor
0,491 0,081 n 0,003 n 2 pentru 0,95
(1.9)
2,336
411
,
427
n
x 2
n
1
x 2
pentru n par
Me
(1.11)
n 1
x 2
pentru n impar
unde indicii superiori, ntre paranteze rotunde, semnific poziia n cadrul irului
ordonat cresctor;
diferena dintre media teoretic a eantionului i modulul acestuia s fie nul (condiie
echivalent cu cea anterioar), unde modulul poate fi determinat cu relaia
Mo x 3 Me x
2 4 3
4
unde
(1.13)
4
1 n
xi x
n i 1
(1.12)
(1.14)
2
1 n
xi x
n i 1
(1.15)
E 2 3 0
(1.16)
Dac verificarea criteriilor prezentate mai sus nu conduce la rezultate elocvente, pentru
verificarea ipotezei referitoare la distribuia normal a valorilor din eantionul experimental se
2
poate apela la unul din testele Massey sau , alegerea unuia sau altuia dintre cele dou teste
fcndu-se n funcie de valoarea volumului eantionului de date experimentale.
Testul poate fi aplicat pentru valori ale volumului eantionului n intervalul 8, 32 i const
din urmtorii pai:
Pasul 1: Se calculeaz valorile
x x
yi i
; i 1, ..., n
(1.17)
y i2
1 e 2
(1.18)
1
; i 1, ..., n
1 0,3326 y i
(1.19)
unde
ti
n
Fi i ; i 1, ..., n
n
(1.20)
d i Fi i 0,5 ; i 1, ..., n
(1.21)
(1.22)
Tabelul 1.4
d critic
d critic
0,95
0,90
0,95
0,90
0,95
0,90
8
9
10
11
12
13
14
15
0,140
0,134
0,130
0,129
0,128
0,128
0,128
0,127
0,163
0,158
0,156
0,155
0,154
0,153
0,151
0,148
16
17
18
19
20
21
22
23
0,125
0,124
0,122
0,120
0,117
0,115
0,113
0,112
0,144
0,142
0,138
0,136
0,133
0,131
0,129
0,128
24
25
26
27
28
29
30
31
0,110
0,109
0,108
0,107
0,105
0,104
0,102
0,099
0,126
0,124
0,121
0,120
0,118
0,116
0,114
0,111
d
Valorile critic din tabelul 1.4 pot fi aproximate prin calcul utiliznd expresiile
0,1851 0,01064 n 0,000785 n 2
0,1408 0,00714 n 0,000769 n 2
d critic
pentru 0,95
pentru 0,90
(1.23)
2
2.3.2. Testul
Testul poate fi aplicat pentru eantioane de cel puin 50 de valori experimentale i const
din urmtorii pai:
(1.26)
(1.27)
unde x i reprezint limita superioar a clasei i (la ultima clas se consider x(+1) = ).
Pasul 4: Se calculeaz valorile
p i t i t i 1 , i 1, ..., 1
unde
t
t2
2
(1.28)
1 e
(1.29)
unde
a
1
1 0,3326 t
(1.30)
0,5; t t
Pasul 5: Se calculeaz valoarea
2
(1.31)
n i n pi
i 1
(1.32)
n pi
(1.33)
2
2 cr
Tabelul 1.5
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,80
5,99
7,29
8,56
9,80
11,0
12,2
13,4
14,6
15,8
17,0
18,2
19,3
20,5
21,6
22,8
23,9
25,0
0,90
7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4
0,95
9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
0,98
11,67
13,39
15,03
16,6
18,2
19,7
21,2
22,6
24,1
25,5
26,9
28,3
29,6
31,0
32,3
33,7
35,0
0,99
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
0,995
14,9
16,7
18,5
20,3
22,0
23,6
25,2
26,8
28,3
29,8
31,3
32,8
34,3
35,7
37,2
38,6
40,0
0,998
16,9
18,9
20,7
22,6
24,3
26,1
27,7
29,4
31,0
32,5
34,0
35,6
37,1
38,6
40,1
41,6
43,1
0,999
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
2
Valorile cr din tabelul 1.5 pot fi determinate prin calcul utiliznd relaia
10
(1.34)
2
cr
a b c 2 d 3
0,80
0,46418
1,48892
-0,032088
0,0015968
0,90
1,4172
1,72353
-0,039225
0,0014982
0,95
2,49661
1,93494
-0,054008
0,0022594
0,98
4,25874
2,00109
-0,040796
0,0011185
0,99
5,2267
2,24028
-0,064354
0,0023769
0,995
6,43404
2,33645
-0,065893
0,0023355
0,998
8,32969
2,31312
-0,045275
0,0007687
0,999
9,30127
2,57235
-0,079616
0,003011
Parametrii a, b, c i d pot fi de asemenea exprimai n funcie de coeficientul de ncredere
utiliznd relaiile de mai jos, funciile de regresie respective oferind ns coeficieni de
corelaie relativ deprtai de unitate.
0,2046 0,2032
(1.35)
1 1,9562 0,9563 2
0,685 0,6819
(1.36)
1 1,6662 0,6673 2
0,1507 0,1508
(1.37)
10 17,1239 7,122 2
0,07773 0,07928
(1.38)
Spt
I
11
L
32
Ma
39
Mi
33
J
38
V
40
Spt
IV
L
39
Ma
41
Mi
33
Tabelul 1.7
J
V
33
37
II
III
32
33
41
33
41
33
39
34
41
37
V
VI
38
40
40
40
41
32
33
38
35
32
2
1 30
x i x 3,47 9
29 i 1
(1.40)
x 1 x 4,6 z 8,387
(1.41)
x 30 x 4,4 z 8,387
(1.42)
concluzia fiind aceea c nici una dintre valorile extreme nu este afectat de erori aberante.
Dac n urma aplicrii testului ar fi rezultat c o valoare este afectat de erori aberante,
aceasta ar fi trebuit exclus din eantionul experimental, iar testul ar fi trebuit aplicat din nou
valorilor rmase, recalculnd parametrii x , i z.
3.2. Verificarea caracterului aleator
Pasul 1: Folosind relaia (1.5), se calculeaz valoarea
2
1 29
x i 1 x i 2 22,897
29 i 1
(1.43)
2
2
1,891
(1.44)
12
Pasul 2: Din tabelul 1.2 se aleg valorile VCI = 1,13 i VCS = 2,87, corespunztoare unui
coeficient de ncredere = 0,99 i unui volum al eantinului experimental n = 25.
Valoarea coeficientului de ncredere a fost aleas astfel nct s fie ct mai apropiat de
valoarea recomandat n tabelul 1.3. Limitele VCI i VCS au fost alese corespunztor valorii
n = 25 deoarece n tabelul 1.2 nu exist valori disponibile pentru un volum al eantionului n =
30. O extrapolare a valorilor din tabelul 1.2 ar putea fi permis n acest caz, observnd
tendinele asimptotice ale funciilor (1.9) i (1.10) care descriu variaia limitelor VCI i VCS,
cantitile cu care acestea se modific la o variaie unitar a volumului eantionului i poziia
n care valoarea M se ncadreaz ntre cele dou limite.
Deoarece este ndeplinit condiia (1.7), se trage concluzia c eantionul de date
experimentale are un caracter aleator.
3.3. Verificarea normalitii
Dup cum se poate observa n continuare, criteriile prezentate la nceputul subcapitolului
2.3 nu ofer rezultate pozitive privind caracterul normal al distribuiei valorilor din eantionul
experimental. Astfel:
histograma eantionului (figura 1.1) are o form diferit de curba Gauss;
valoarea median, determinat cu relaia (1.11) este Me = 37,5, diferit de media
aritmetic a eantionului x = 36,6;
8
7
6
5
4
3
2
1
0
41
33
41
40
1,264
-1,034
1,264
0,977
0,704
1,525
0,704
0,755
0,397
-0,366
0,397
0,336
30
11
30
25
xi
40
33
41
33
33
41
32
38
39
34
33
33
38
40
41
37
37
35
32
yi
0,977
-1,034
1,264
-1,034
-1,034
1,264
-1,322
0,402
0,690
-0,747
-1,034
-1,034
0,402
0,977
1,264
0,115
0,115
-0,460
-1,322
ti
0,755
1,525
0,704
1,525
1,525
0,704
1,785
0,882
0,813
1,331
1,525
1,525
0,882
0,755
0,704
0,963
0,963
1,181
1,785
i
0,336
-0,366
0,397
-0,366
-0,366
0,397
-0,453
0,156
0,255
-0,277
-0,366
-0,366
0,156
0,336
0,397
0,046
0,046
-0,178
-0,453
ni
25
11
30
11
11
30
4
18
21
12
11
11
18
25
30
15
15
13
4
1,000
0,103
0,367
0,233
1,000
0,103
0,833
0,002
Tabelul 1.8 (continuare)
Fi
di
0,833
0,002
0,367
0,233
1,000
0,103
0,367
0,233
0,367
0,233
1,000
0,103
0,133
0,086
0,600
0,056
0,700
0,055
0,400
0,177
0,367
0,233
0,367
0,233
0,600
0,056
0,833
0,002
1,000
0,103
0,500
0,046
0,500
0,046
0,433
0,111
0,133
0,086
82
53
38
60
39
37
65
60
49
41
32
26
82
98
14
15
32
99
4
26
85
67
63
51
20
13
57
24
28
59
49
18
72
38
1
11
18
27
90
53
91
26
40
99
46
42
15
95
72
5
59
22
15
48
Tabelul 1.9
11
29
41
78
70
89
x
x min 99 1
max
9,8
k
10
(1.45)
14
Clasa
Limita
inferioar
Limita
superioar
Numrul
de valori
1
-
2
10,8
3
20,6
4
30,4
5
40,2
6
50
7
59,8
8
69,6
Tabelul 1.10
9
10
79,4
89,2
10,8
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
10
Pasul 2: Deoarece prima clas nu conine cel puin cinci valori, se comaseaz primele dou
clase, obinndu-se situaia din tabelul 1.11.
Tabelul 1.11
Clasa
1
2
3
4
5
6
7
8
9
Limita
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
-
inferioar
Limita
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
superioar
Numrul
13
8
7
7
6
5
4
4
6
de valori
Conform relaiei (1.26), se consider numrul de grade de libertate = 8.
Paii 3 i 4: Determinnd valorile mediei aritmetice i abaterii standard ale irului de date
experimentale ( x 46,48333 i 27,56102 ), se calculeaz, conform relaiilor (1.27), ...,
(1.31), valorile prezentate n tabelul 1.12.
Clasa
xi
ti
ai
(ti)
pi
1
20,6
-0,939
1,454
-0,337
0,163
2
30,4
-0,584
1,241
-0,222
0,115
3
40,2
-0,228
1,082
-0,09
0,132
4
50
0,128
0,959
0,051
0,141
5
59,8
0,483
0,862
0,185
0,135
6
69,6
0,839
0,782
0,299
0,114
7
79,4
1,194
0,716
0,384
0,085
Tabelul 1.12
8
9
89,2
1,55
0,66
0
0,439
0,5
0,056
0,061
15
5. Enunul problemei
Pentru unul dintre eantioanele de valori experimentale din Anexa 1, s se studieze:
existena unor valori afectate de erori aberante;
caracterul aleator al eantionului de date;
ncadrarea valorilor din eantion ntr-o distribuie normal (Gauss).
16