Documente Academic
Documente Profesional
Documente Cultură
LUCRAREA
1
1. Obiectivele lucrrii
nsuirea unor noiuni referitoare la: principalele tipuri de prelucrri statistice efectuate
asupra eantioanelor de valori provenite din msurri experimentale sau din operaii de
achiziie de date, domeniil de aplicabilitate ale respectivelor prelucrri, algoritmii i
modurile de lucru corespunztoare.
Aplicarea testelor statistice prezentate n lucrare asupra unui eantion de date experimentale i
enunarea concluziilor corespunztoare.
2. Noiuni teoretice
n situaiile n care se urmrete determinarea valorii unei variabile dintr-un anumit proces,
atunci cnd se dorete eliminarea sau reducerea efectelor datorate diverselor tipuri de erori,
valorile experimentale obinute sunt supuse unor teste ce evalueaz influenele induse de ctre
factorii generatori de erori de msurare.
Principalele categorii de teste statistice aplicabile unui eantion de valori experimentale sunt
dedicate identificrii i eventual eliminrii unor influene datorate celor trei tipuri de erori ce
pot conduce la diferene ntre valorile msurate i cele reale ale variabilei ce se dorete a fi
determinat:
erori aberante (grosolane), cauzate de funcionarea defectuoas a sistemului de
msurare sau provenite din nerespectarea de ctre operatorul uman a metodologiei
adecvate de msurare;
erori sistematice, cauzate n general de configurarea (reglarea) incorect a sistemului
de msurare sau de influena unor factori exteriori de valoare constant;
erori aleatoare, prezente n majoritatea activitilor de msurare, datorate caracterului
stochastic al oricrui proces natural, inclusiv al procesului studiat i al celui n urma
cruia se obin valorile experimentale.
n continuare vor fi prezentate o serie de teste pentru identificarea celor trei tipuri de erori
enumerate mai sus. Dac identificarea valorilor experimentale afectate de erori aberante poate
fi urmat de eliminarea valorilor respective din eantionul de date experimentale, prezena
erorilor sistematice nu poate fi perceput dect prin influena sa asupra ntregului eantion de
valori experimentale. Reducerea efectelor induse de ctre erorile sistematice nu poate fi
realizat dect prin compararea rezultatelor prelucrrii mai multor eantioane de valori
experimentale. Deoarece erorile aleatoare apar n majoritatea eantioanelor de valori
experimentale (excepie fcnd unele determinri precise ale unor variabile de natur
discret), testele statistice nu urmresc n acest caz dect evidenierea gradului n care aceste
erori au afectat eantionul respectiv, indicnd dac densitatea de probabilitate a acestuia mai
coincide ca form general cu aceea a variabilei reale ce a fost msurat.
2.1. Eliminarea datelor afectate de erori aberante
Fiind dat un ir de valori experimentale x 1 , x 2 ,..., x n , se consider c valoarea xi este
afectat de erori aberante dac este verificat condiia (criteriul Chauvenet)
xi x z
(1.1)
Lucrarea 1 Modelare
n
2
1
xi x
n 1 i1
(1.2)
0,435 0,862 a
1 3,604 a 3,213 a 2
(1.3)
2 n 1
4n
(1.4)
unde
a
Dac, n urma aplicrii testului, rezult c una dintre valorile testate este afectat de erori
aberante, valoarea respectiv este eliminat din cadrul eantionului, se recalculeaz valorile
mediei i abaterii standard pentru valorile rmase i se reia verificarea condiiei (1.1),
algoritmul aplicndu-se pn cnd condiia respectiv nu mai este verificat pentru nici una
dintre cele dou valori extreme ale eantionului.
2.2. Verificarea caracterului aleator
Unul dintre testele cele mai utilizate pentru verificarea caracterului aleator al unui
eantion de valori experimentale este testul Young, descris prin algoritmul de mai jos.
Pasul 1: Fiind dat un ir de valori experimentale x 1 , x 2 ,..., x n , se calculeaz mrimea
2
1 n 1
x i 1 x i 2
n 1 i 1
(1.5)
i mrimea
M
2
2
(1.6)
Lucrarea 1 Modelare
Pasul 2: Se compar mrimea M cu valorile VCI (valoare critic inferioar) i VCS (valoare
critic superioar), alese din tabelul 1.2, i se consider c irul de valori experimentale are un
caracter aleator, cu probabilitatea , dac este ndeplinit condiia
VCI < M < VCS
(1.7)
Tabelul 1.2
VCI
n
4
5
6
7
8
9
10
11
12
15
20
25
= 0,95
0,78
0,82
0,89
0,94
0,98
1,02
1,06
1,10
1,13
1,21
1,30
1,37
VCS
= 0,99
0,53
0,54
0,56
0,61
0,66
0,71
0,75
0,79
0,83
0,92
1,04
1,13
= 0,95
3,22
3,18
3,11
3,06
3,02
2,98
2,94
2,90
2,87
2,79
2,70
2,63
= 0,99
3,47
3,46
3,44
3,39
3,34
3,29
3,25
3,21
3,17
3,08
2,96
2,87
Se poate observa c testul nu poate fi aplicat dect pentru eantioane coninnd cel mult 25 de
valori experimentale.
Parametrul din tabelul 1.2 are semnificaia unui coeficient de ncredere i poate fi ales
orientativ, n funcie de volumul eantionului, din tabelul 1.3.
Tabelul 1.3
n
5
6
7
8
9
10
12
14
0,960
0,970
0,976
0,980
0,983
0,985
0,988
0,990
n
16
18
20
25
30
50
100
150
0,991
0,992
0,993
0,994
0,995
0,996
0,997
0,9973
Dac volumul eantionului se afl ntre dou valori din tabelul 1.3, este indicat s se aleag
valoarea corespunztoare unui volum mai mic al eantionului.
Alegerea coeficientului de ncredere din tabelul 1.3 poate fi nlocuit de determinarea acestuia
cu ajutorul relaiei
(1.8)
Dac valoarea aleas sau calculat a coeficientului de ncredere se afl ntre valorile
disponibile n tabelul 1.2, este indicat s se aleag valoarea disponibil inferioar.
Alegerea valorilor VCI i VCS din tabelul 1.2 poate fi nlocuit cu determinarea acestora cu
ajutorul relaiilor
0,491 0,081 n 0,003 n 2
411,427 n 2,336
pentru 0,95
pentru 0,99
(1.9)
Lucrarea 1 Modelare
3,317 1,057 e 8,919 n 0,941
pentru 0,95
3,484 - 0,882 e
pentru 0,99
VCS
- 33,574 n -1,399
(1.10)
n
n
1
2
x
x 2
pentru n par
Me
(1.11)
n 1
x 2
pentru n impar
unde indicii superiori, ntre paranteze rotunde, semnific poziia n cadrul irului
ordonat cresctor;
diferena dintre media teoretic a eantionului i modulul acestuia s fie nul (condiie
echivalent cu cea anterioar), unde modulul poate fi determinat cu relaia
Mo x 3 Me x
(1.12)
unde
4
4
(1.13)
4
1 n
xi x
n i 1
(1.14)
2
1 n
xi x
n i 1
(1.15)
(1.16)
Dac verificarea criteriilor prezentate mai sus nu conduce la rezultate elocvente, pentru
verificarea ipotezei referitoare la distribuia normal a valorilor din eantionul experimental se
4
Lucrarea 1 Modelare
poate apela la unul din testele Massey sau 2 , alegerea unuia sau altuia dintre cele dou teste
fcndu-se n funcie de valoarea volumului eantionului de date experimentale.
2.3.1. Testul Massey
Testul poate fi aplicat pentru valori ale volumului eantionului n intervalul 8, 32 i const
din urmtorii pai:
Pasul 1: Se calculeaz valorile
yi
xi x
; i 1, ..., n
(1.17)
y i2
1 e 2
(1.18)
1
; i 1, ..., n
1 0,3326 y i
(1.19)
unde
ti
ni
; i 1, ..., n
n
(1.20)
d i Fi i 0,5 ; i 1, ..., n
n
8
9
10
11
12
13
0,95 0,90
0,140
0,134
0,130
0,129
0,128
0,128
0,163
0,158
0,156
0,155
0,154
0,153
(1.22)
Tabelul 1.4
d critic
n
16
17
18
19
20
21
0,95 0,90
0,125
0,124
0,122
0,120
0,117
0,115
0,144
0,142
0,138
0,136
0,133
0,131
d critic
n
24
25
26
27
28
29
0,95 0,90
0,110
0,109
0,108
0,107
0,105
0,104
0,126
0,124
0,121
0,120
0,118
0,116
5
Lucrarea 1 Modelare
14
15
0,128
0,127
0,151
0,148
22
23
0,113
0,112
0,129
0,128
30
31
0,102
0,099
0,114
0,111
Valorile d critic din tabelul 1.4 pot fi aproximate prin calcul utiliznd expresiile
0,1851 0,01064 n 0,000785 n 2
0,1408 0,00714 n 0,000769 n 2
d critic
pentru 0,95
pentru 0,90
(1.23)
2.3.2. Testul 2
Testul poate fi aplicat pentru eantioane de cel puin 50 de valori experimentale i const din
urmtorii pai:
Pasul 1: Fiind dat un ir de valori experimentale x 1 , x 2 ,..., x n , se ordoneaz irul cresctor i
se mparte n k clase, unde
k 1 3,322 lg n
(1.24)
i
10 k 25
(1.25)
Pasul 2: Se comaseaz clasele extreme, dac este cazul, astfel nct fiecare clas s aib cel
puin cte 5 valori, i se consider numrul de grade de libertate al irului de date
= numrul de noi clase (comasate) - 1
(1.26)
(1.27)
unde x i reprezint limita superioar a clasei i (la ultima clas se consider x(+1) = ).
Pasul 4: Se calculeaz valorile
p i t i t i 1 , i 1, ..., 1
unde
t
t2
e 2
(1.28)
(1.29)
unde
a
1
1 0,3326 t
0,5; t t
n i n pi
n pi
i 1
(1.30)
(1.31)
(1.32)
Lucrarea 1 Modelare
2
Pasul 6: Se compar 2 cu cr
din tabelul 1.5, n funcie de coeficientul de ncredere i se
consider c repartiia este normal dac
(1.33)
2
2 cr
Tabelul 1.5
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,80
5,99
7,29
8,56
9,80
11,0
12,2
13,4
14,6
15,8
17,0
18,2
19,3
20,5
21,6
22,8
23,9
25,0
0,90
7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4
0,95
9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
0,98
11,67
13,39
15,03
16,6
18,2
19,7
21,2
22,6
24,1
25,5
26,9
28,3
29,6
31,0
32,3
33,7
35,0
0,99
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
0,995
14,9
16,7
18,5
20,3
22,0
23,6
25,2
26,8
28,3
29,8
31,3
32,8
34,3
35,7
37,2
38,6
40,0
0,998
16,9
18,9
20,7
22,6
24,3
26,1
27,7
29,4
31,0
32,5
34,0
35,6
37,1
38,6
40,1
41,6
43,1
0,999
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
2
Valorile cr
din tabelul 1.5 pot fi determinate prin calcul utiliznd relaia
2
cr
a b c 2 d 3
(1.34)
0,80
0,46418
1,48892
-0,032088
0,0015968
0,90
1,4172
1,72353
-0,039225
0,0014982
0,95
2,49661
1,93494
-0,054008
0,0022594
0,98
4,25874
2,00109
-0,040796
0,0011185
0,99
5,2267
2,24028
-0,064354
0,0023769
0,995
6,43404
2,33645
-0,065893
0,0023355
0,998
8,32969
2,31312
-0,045275
0,0007687
0,999
9,30127
2,57235
-0,079616
0,003011
Parametrii a, b, c i d pot fi de asemenea exprimai n funcie de coeficientul de ncredere
utiliznd relaiile de mai jos, funciile de regresie respective oferind ns coeficieni de
corelaie relativ deprtai de unitate.
7
Lucrarea 1 Modelare
a
0,2046 0,2032
(1.35)
1 1,9562 0,9563 2
0,685 0,6819
(1.36)
1 1,6662 0,6673 2
0,1507 0,1508
(1.37)
10 17,1239 7,122 2
0,07773 0,07928
(1.38)
Spt
I
II
III
L
32
32
33
Ma
39
41
33
Mi
33
41
33
J
38
39
34
V
40
41
37
Spt
IV
V
VI
L
39
38
40
Ma
41
40
40
Mi
33
41
32
Tabelul 1.7
J
V
33
37
33
35
38
32
1 30
x i 36,6
30 i 1
(1.39)
2
1 30
x i x 3,47 9
29 i 1
(1.40)
Lucrarea 1 Modelare
maxim x(30) = 41, unde indicii dintre paranteze reprezint poziia n cadrul irului ordonat.
Rezult, aplicnd relaia (1.1):
x 1 x 4,6 z 8,387
(1.41)
x 30 x 4,4 z 8,387
(1.42)
concluzia fiind aceea c nici una dintre valorile extreme nu este afectat de erori aberante.
Dac n urma aplicrii testului ar fi rezultat c o valoare este afectat de erori aberante,
aceasta ar fi trebuit exclus din eantionul experimental, iar testul ar fi trebuit aplicat din nou
valorilor rmase, recalculnd parametrii x , i z.
3.2. Verificarea caracterului aleator
Pasul 1: Folosind relaia (1.5), se calculeaz valoarea
2
1 29
x i 1 x i 2 22,897
29 i 1
(1.43)
2
2
1,891
(1.44)
Pasul 2: Din tabelul 1.2 se aleg valorile VCI = 1,13 i VCS = 2,87, corespunztoare unui
coeficient de ncredere = 0,99 i unui volum al eantinului experimental n = 25.
Valoarea coeficientului de ncredere a fost aleas astfel nct s fie ct mai apropiat de
valoarea recomandat n tabelul 1.3. Limitele VCI i VCS au fost alese corespunztor valorii
n = 25 deoarece n tabelul 1.2 nu exist valori disponibile pentru un volum al eantionului n =
30. O extrapolare a valorilor din tabelul 1.2 ar putea fi permis n acest caz, observnd
tendinele asimptotice ale funciilor (1.9) i (1.10) care descriu variaia limitelor VCI i VCS,
cantitile cu care acestea se modific la o variaie unitar a volumului eantionului i poziia
n care valoarea M se ncadreaz ntre cele dou limite.
Deoarece este ndeplinit condiia (1.7), se trage concluzia c eantionul de date
experimentale are un caracter aleator.
3.3. Verificarea normalitii
Dup cum se poate observa n continuare, criteriile prezentate la nceputul subcapitolului
2.3 nu ofer rezultate pozitive privind caracterul normal al distribuiei valorilor din eantionul
experimental. Astfel:
histograma eantionului (figura 1.1) are o form diferit de curba Gauss;
valoarea median, determinat cu relaia (1.11) este Me = 37,5, diferit de media
aritmetic a eantionului x = 36,6;
calculnd, cu ajutorul relaiei (1.14), momentul centrat de ordinul 4 ( 4 = 184,622), se
determin din relaia (1.13) valoarea coeficientului de boltire 2 = 1,347, acesta fiind
mult deprtat de valoarea 3.
Lucrarea 1 Modelare
8
7
6
5
4
3
2
1
0
Lucrarea 1 Modelare
37
35
32
0,115
-0,460
-1,322
0,963
1,181
1,785
0,046
-0,178
-0,453
15
13
4
0,500
0,433
0,133
0,046
0,111
0,086
82
53
38
60
39
37
65
60
49
41
32
26
82
98
14
15
32
99
4
26
85
67
63
51
20
13
57
24
28
59
49
18
72
38
1
11
18
27
90
53
91
26
40
99
46
42
15
95
72
5
59
22
15
48
Tabelul 1.9
11
29
41
78
70
89
9,8
k
10
(1.45)
Limitele inferioar i superioar ale fiecrei clase, precum i numrul de valori experimentale
din eantion din fiecare clas, sunt prezentate n tabelul 1.10.
Clasa
Limita
inferioar
Limita
superioar
Numrul
de valori
1
-
2
10,8
3
20,6
4
30,4
5
40,2
6
50
7
59,8
8
69,6
Tabelul 1.10
9
10
79,4
89,2
10,8
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
10
Pasul 2: Deoarece prima clas nu conine cel puin cinci valori, se comaseaz primele dou
clase, obinndu-se situaia din tabelul 1.11.
Tabelul 1.11
Clasa
1
2
3
4
5
6
7
8
9
Limita
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
-
inferioar
Limita
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
superioar
Numrul
13
8
7
7
6
5
4
4
6
de valori
Conform relaiei (1.26), se consider numrul de grade de libertate = 8.
11
Lucrarea 1 Modelare
Paii 3 i 4: Determinnd valorile mediei aritmetice i abaterii standard ale irului de date
experimentale ( x 46,48333 i 27,56102 ), se calculeaz, conform relaiilor (1.27), ...,
(1.31), valorile prezentate n tabelul 1.12.
Tabelul 1.12
Clasa
1
2
3
4
5
6
7
8
9
xi
20,6
30,4
40,2
50
59,8
69,6
79,4
89,2
ti
-0,939 -0,584 -0,228 0,128
0,483 0,839
1,194
1,55
ai
1,454 1,241
1,082 0,959
0,862 0,782
0,716
0,66
0
-0,337 -0,222 -0,09
0,051
0,185 0,299
0,384 0,439
0,5
(ti)
pi
0,163
0,115
0,132 0,141
0,135
0,114
0,085 0,056
0,061
Pentru calculul valorii p0 s-a considerat (t0) = (- ) = -0,5.
Pasul 5: Utiliznd relaia (1.32), se determin valoarea 2 = 0,315.
Pasul 6: Alegnd din tabelul 1.3 un coeficient de ncredere recomandat = 0,996, se alege
2
din tabelul 1.5 (pentru = 0,995 i = 8) valoarea cr
= 22.
Deoarece condiia (1.33) nu este satisfcut, se trage concluzia c eantionul de valori
experimentale din tabelul 1.9 nu are o funcie de repartiie normal (Gauss).
5. Enunul problemei
Pentru unul dintre eantioanele de valori experimentale din Anexa 1, s se studieze:
existena unor valori afectate de erori aberante;
caracterul aleator al eantionului de date;
ncadrarea valorilor din eantion ntr-o distribuie normal (Gauss).
12