Documente Academic
Documente Profesional
Documente Cultură
Lucrarea
64
Lucrarea 3
Curpins
Curpins ..................................................................................................................... 64
A.
B.
2.
3.
C.
1.
Tema ........................................................................................................... 68
2.
2.2.
Sortarea pe coloane.............................................................................. 69
2.3.
Sortarea global.................................................................................... 70
2.4.
2.5.
2.6.
2.7.
Decizia .................................................................................................. 72
2.8.
D.
E.
Bibliografie......................................................................................................... 74
Prelucrarea
65
statistica
irurilor
de
date
Eliminarea
valorilor
aberante
A. Scopul lucrrii:
Se urmrete realizarea urmtoarelor obiective:
- prezentarea metodelor de analiz n vederea depistrii i eliminrii valorilor
aberante;
- prezentarea indicatorilor statistici necesari aplicrii metodelor de analiz critic a
irurilor de date;
- prezentarea noiunilor generale legate de generarea irurilor de date utiliznd
software-ul Excel;
- prezentarea unei aplicaii;
B. Noiuni de baza:
Dac n cursul unei msurtori repetate se obin rezultate care sunt mult diferite fa
de celelalte marea majoritate a rezultatelor este de presupus c s-au nregistrat erori.
ntruct rezultatele disparate (aberante) pot avea o influen disproporionat de mare
asupra valorii medii, se impune ca de ndat ce au fost constatate, s se verifice
dac condiiile de efectuare a msurtorilor sunt corespunztoare.
Atunci cnd nu au fost sesizate situaii deosebite (defecte tehnologice), n cursul
msurtorilor este necesar s se analizeze oportunitatea eliminrii datelor aberante
n faza de prelucrare statistica a rezultatelor. Aceasta operaie este posibil pe baza
unor teste care impun alegerea unei probabiliti funcie de care se ia decizia de
pstrare sau eliminare a lor.
Aceast verificare a irurilor de date / a eantionului obinut poart denumirea de
analiz critic a datelor, iar metodele care se aplica sunt: testul IRWIN, testul
GRUBBS i testul ROMANOWSKI.
(3.1)
Unde: x0 este valoarea susceptibila a fi aberanta, , x0-1 este valoarea imediat
urmtoare, iar s este abaterea medie ptratic a irului celor x1, x2, , xn date,
determinata cu relaia:
(3.2)
(3.3)
Valorile critice ale metodelor de analiz critic a irurilor ale aplicaiilor cel mai frecvent
utilizate, stabilite pentru un nivel de ncredere/ risc propus, se gsesc tabelate n Tabelul
3.1.
66
Lucrarea 3
Astfel, comparnd valoarea lui cu valoarea critica critic (stabilita n Tabelul 3.1),
valoarea x0 se elimina din irul de date dac:
(3.4)
n caz contrar nu sunt motive suficiente pentru aceasta.
Dac valoarea x0 a fost eliminata se recalculeaz abaterea medie ptratica pentru
cele n-1 valori ramase i testul se aplica din nou, procesul continund pana cnd nu
se mai elimina date ale irului.
Observaie: testului IRWIN nu este suficient n cazul care, n cadrul irului de date exista mai
multe valori suspecte, iar valoarea dispersiei este mare, n acest caz fiind necesara
aplicarea celorlalte metode.
(3.5)
Se va determina raportul:
|
(3.6)
Comparnd valoarea u cu valoarea critica ucritic (din tabelul 3.1) pentru un nivel de ncredere
propus, valoarea xn se elimina din irul de date dac:
(3.7)
n caz contrar, se impune concluzia ca nu exista motive suficiente de eliminare a valorii x0.
, se
(3.8)
De asemenea este necesar sa se calculeze abaterea medie ptratica, neglijndu-se
valoarea disparata x0, (pentru n-1 valori).
n continuare se determina raportul:
(3.9)
Rezultatul acestui raport se compara cu valorile critice (tabelul 3.1) stabilite pentru un risc
propus, iar dac valoarea t depete valoarea tcritic:
(3.10)
atunci rezultatul x0 poate fi eliminat cu o siguran a concluziei de cel puin cea propusa. n
caz contrar, se impune concluzia ca nu exista motive suficiente de eliminare a valorii x0.
Prelucrarea
67
statistica
irurilor
de
date
Eliminarea
valorilor
aberante
Denumirea
testului
IRWIN
ROMANOVSKI
|
Expresia analitic
a testului
Numrul de valori
al irului
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 (i >20)
GRUBBS
0.95
1.79
1.64
1.51
1.39
1.31
1.24
1.20
1.18
1.14
1.11
1.09
1.07
1.06
1.05
1.04
1.03
1.03
1.03
0.98
2.17
2.05
1.93
1.81
1.69
1.57
1.51
1.46
1.43
1.41
1.39
1.37
1.35
1.33
1.31
1.29
1.28
1.27
0.98
1.41
1.72
1.96
2.13
2.27
2.37
2.46
2.54
2.61
2.66
2.71
2.76
2.80
2.84
2.87
2.90
2.93
2.96
0.99
1.41
1.73
1.97
2.16
2.31
2.43
2.53
2.62
2.69
2.75
2.81
2.86
2.91
2.95
2.98
3.02
3.05
3.08
68
Lucrarea 3
C. Desfurarea lucrrii
1. Tema
S se genereze un ir de 100 de valori aezate ntr-un tabel cu 10 coloane.
Generarea numerelor va fi aleatoare, datele vor fi normal repartizate, cu media egal
cu ziua de natere i dispersia cuprins n intervalul 0,0 0,31 va fi de forma 0,XX,
unde XX reprezint ziua naterii.
S se completeze un raport care s cuprind:
1 Tabelul datelor primare;
2 Tabelul datelor sortate n ordine cresctoare pe coloane;
3 Tabelul datelor sortate n ordine cresctoare (global);
4 Numerele considerate aberante;
5 Calculul mediei i dispersiei pe fiecare coloan;
6 Coeficienii Grubbs, Irwin i Romanowski;
7 Decizia de pstrare sau eliminare a datelor aberante pentru un nivel de
ncredere de 95% (risc 5%);
8 Trasarea unei diagrame circulare pentru 7 clase.
2. Prelucrarea rezultatelor
2.1. Introducerea datelor
Pe baza celor enunate anterior se va introduce un ir de date, n=100, utiliznd
software-ul Excel, i anume:
1. Selectai panoul Data i din seciunea Analysis selectai Data Analysis
(Instrumente, Analiza datelor);
2. Selectai din caseta de dialog care s-a deschis opiunea Random Number
Generation (Generare de Numere Aleatorii);
3. Executai clic asupra butonului ok;
4. n caseta de dialog care se deschide selectai:
Number of Variables (Numrul coloanelor generate): 10;
Number of Random Number (Numrul rndurilor generate): 10;
Distribution: Normal (Distribuia, Normala):
Mean (Media):22 (dac suntei nascut() n ziua de 22);
Standard Deviation (Abaterea standard): 0.22;
Output Range (Afiarea generrii), selectnd/introducnd domeniul
(rndul/coloan) unde dorim sa fie afiat irul de date generat;
5. Executai clic asupra butonului OK.
Prelucrarea
69
statistica
irurilor
de
date
Eliminarea
valorilor
aberante
Pentru a sorta pe coloane se folosete procedura descris mai sus pentru fiecare
coloan n parte.
70
Lucrarea 3
Prelucrarea
71
statistica
irurilor
de
date
Eliminarea
valorilor
aberante
astfel:
=ABS(M3-C44)/E52 obinndu-se valoarea, umin unde M3 este valoarea minim din
ir, C44 este media aritmetic, iar E52 este celula ce conine valoarea lui s pentru
testul Grubbs.
=(M102-C44)/E52 obinndu-se valoarea , umax unde M102 este valoarea maxim din
ir, C44 este media aritmetic, iar E52 este celula ce conine valoarea lui s pentru
testul Grubbs.
3. Cazul testului ROMANOWSKI. Se determina raportul:
|
72
Lucrarea 3
2.7. Decizia
Se impune astfel concluzia c nu exist motive suficiente de eliminare a valorilor
aberante, concluzie de asemenea prezentat n Tabelul 3.3.
Prelucrarea
73
statistica
irurilor
de
date
Eliminarea
valorilor
aberante
74
Lucrarea 3
D. Prezentarea rezultatelor
Rezultatele vor fi prezentate sub forma unui raport (vezi Exemplu Raport) ce
cuprinde:
- reprezentarea datelor primare, irul de date;
- reprezentarea tabelar a valorilor indicilor statistici: media aritmetic,
dispersia, abaterea medie ptratic;
- reprezentarea tabelar a valorilor calculate n cazul celor trei metode de
analiza critic a datelor: , u i t;
- prezentarea deciziei pentru riscul propus.
E. Bibliografie
[1]
[2]
[3]
[4]
[5]
[6]