Sunteți pe pagina 1din 14

PRELUCRAREA

STATISTICĂ A DATELOR
EXPERIMENTALE
Procesul de cercetare
ştiinţifică/măsurare

Se desfăşoară, în general, respectînd următoarele etape:


- stabilirea problemei de cercetat;

- efectuarea unui studiu bibliografic de specialitate;

- formularea unor ipoteze;

- stabilirea metodologiei de experimentare şi culegerea


datelor;
- analiza (testarea) datelor experimentale;

- interpretarea rezultatelor;

- formularea concluziilor.
Prelucrarea statistică a datelor
experimentale
 Eliminarea arbitrariului din cercetările experimentale se poate
face prin utilizarea cercetării statistice, care utilizează ca
instrument testul statistc.

 După culegerea datelor experimentale acestea sunt supuse unor


teste statistice pentru a:
- identifica valorile afecate de erori aberante şi a le elimina;
- verificarea caracterului aleator al şirului de date (au fost sau
nu afectate de erori sistematice);
- verificarea normalităţii distribuţiei/repartiţiei (distribuţia
Gauss)
- calcularea limitelor sau intervalului de încredere (calcularea
valorii adevărate).
Teste de valabilitate
 Teste de identificare şi eliminare a valorilor aberante sau teste care
permit aflarea valorii unei experiment/măsurări în funcţie de
probabilităţile apariţiei variaţiei în natură (для исключения грубых
погрешностей или промахов).

 Într-o serie de rezultate experimentale apar valori foarte îndepărtate faţă de


celelalte, care par întîmplătoare.
Problema care se pune este dacă aceste rezultate pot sau nu pot fi luate în
considerare.
Există tendinţa de a elimina din start aceste rezultate. Acest mod simplist de a
raţiona este total greşit.

 Statistica pune la dispoziţie o serie de criterii de apreciere a acestei situaţii de


eliminare a valorilor care se abat foarte mult de la medie, aşa numitele rezultante
aberante (outliers).
Teste de valabilitate
 În testarea caracterului aberant al valori dintr-o serie se
utilizează testul Dixon/criteriul Q (dacă n ≤ 25), testul
Grubbs sau testul Chauvenet (dacă n > 20). x1  x2
Pentru aplicarea testelor se parcurg următoarele Testul Dixon: D 
x1  xn1
etape:
- se aranjează ordonat crescător (sau descrescător) Testul Grubbs:
seria de date;  
x  x  1 x n   x
- se calculează media ( ) şi abaterea (deviaţia) G G
standard (s); s sau s

- se calculează valoarea statistică a testului după Testul Chauvenet:


formula (veze tab.) 
 xi  x  s  z
unde: xşi s - media şi abaterea standard; x1 – valoarea
minimă; xn – valoarea maximă în seria aranjată în mod
crescător; xi – valoarea suspectată (valoarea minimă 0,435  0,862  a 2  n 1
sau maximă); n – numărul de valori ale şirului de date z a
1  3,604  a  3,213  a 2 4n
experimentale.
Teste de valabilitate

- se ia decizia funcţie de nivelul de semnificaţie, α, selectat,


pentru testele Dixon şi Grubbs:
 dacă (D, G)calc > (D, G)n, 1-α (tabelar), valoarea este aberantă,
trebuie eliminată
 dacă (D, G)calc < (D, G)n, 1-α(tabelar), valoarea nu este
aberantă.
pentru testul Chauvenet:

 dacă x  x  s  z , valoarea este aberantă
i

 dacă x  x s  z , valoarea nu este aberantă
i
Aplicarea testului Chauvenet
Componentele xi xi (ordonat Valori │xi - xmed│ z·
esantionului crescător) extreme
1 58 30 35 38,993 56,5306
2 60 50 160 86,067
3 80 55
4 77 58
5 83 60
6 75 65
7 82 70
8 79 75
9 50 77
10 35 79
11 70 80
12 160 80
13 80 82
14 65 83
15 55 160
Test de verificare a caracterului
aleator al datelor experimentale.
Testul Young (Критерий Янга )

-este un test de identificare a influenţei erorilor sistematice, fără a


oferi posibilitatea de eliminare a acestora (Критерий
предназначен для проверки равномерности выборок).

- dacă testul confirmă că datele nu au caracter aleator, atunci se


reface experimentul/măsurarea.
Testul Young (Критерий Янга )
Pentru aplicarea testelor se parcurg următoarele etape:
- se calculează mărimea 2 , datele fiind luate din şirul neordonat:
1 n 1
 
2

 i 1 ix  x  2

 2 n 1
n  1 i 1 M  2 
- se determină valoarea testului M: s n
- se compară M cu valoarea critică inferioară (VCI) şi valoarea critică
superioară (VCS), dacă VCI < M < VCS, atunci şirul are un caracter
aleator.

VCI şi VCS sunt mărimi tabelare sau pot fi calculate din relaţiile:
VCI = 0,491 + 0,081n – 0,003·n2
VCS = 3,317 – 1,057e-8,919·n( -0,941)
Distribuţia normala-Gauss-Laplace
În cadrul unei asemenea repartitii, între valoarea mediei şi cea a abaterii
standard se distribuie 68,26% din totalul valorilor unei colectivitati statistice; între
medie si de doua ori valoarea abaterii standard se distribuie 95,45% din valori, iar
între medie şi de trei ori valoarea abaterii standard sunt cuprinse 99,73% din
valori. Practic, întreaga arie de sub grafic (99,73%) se afla între medie si de trei ori
valoarea abaterii standard. Aceasta este asa-numita „regula celor sase sigma”:
pornind de la presupunerea ca populatia este distribuita normal, abaterea standard
este estimata la 1/6 din diferenta dintre valoarea maxima si cea minima, valori ce
sunt obtinute dintr-un esantion suficient de mare.
Verificarea normalităţii
distribuţiei /repartiţiei datelor
Ipoteza că valorile experimenatle din cadrul unui şir de date sunt repartizate
după o lege de distribuţie normală (Gauss) poate fi testată, într-o primă
aproximare, prin verfiicarea următoarelor criterii:
- reprezentarea datelor experimentale sub formă de histogramă.

O repartiţie este considerată normală dacă histograma are un singur vârf (punct
maxim);
- verificarea diferenţei dintre media şi mediana.

O repartiţie este considerată normală dacă: xmed – Me(x) = 0


-verificarea mărimii coeficientului de boltire, .
O repartiţie este considerată normală dacă  = 3, iar excesul (E) are valoarea
zero:
4 1 n
 

4
E=-3=0  4  4    xi  x 
s n i 1  
Verificarea normalităţii
distribuţiei /repartiţiei datelor

Dacă verificarea criteriilor prezentate mai sus


nu conduc la rezultate elocvente, pentru
verificarea distribuţiei se aplică teste statistice:
Massey (n= 8-50; 2 (n > 50); Kolmogorov-
Smirno etc.
Graficul histogramă
Exemplu: In tabelul urmator este sintetizată evolutia parametrului Greutate
corporală la 1014 pacienţi:
Greutatea corporală a 1014 pacienţi
pe clase din 5kg în 5kg

Histograma greutăţilor corporale a


1014 pacienţi
Limitele/intervalul de
încredere/confidenţă (доверительный
интервал)
După aplicarea acestor teste sunt stabilite limitele/intervalul de
încredere/confidenţă pentru medie, adică se stabileşte intervalul în care cu o
anumită probabilitate (90%, 95%, 99%) se găseşte valoarea adevărată a mărimii
măsurate. Aceaste limite mai poartă numele de eroare aleatoare absolută.
Доверительный интервал - интервал, в котором при заданной
доверительной вероятности следует ожидать нахождение истинного
значения результата. t s
P, f
x  
n

unde: tP, f – valoare tabelară a coeficientului Student ce corespunde intervalului


de încredere selectat şi gradelor de libertate (f = n - 1); s – abaterea standard; n –
numărul de date ale seriei.  
x   x   
 x 

S-ar putea să vă placă și