Documente Academic
Documente Profesional
Documente Cultură
|
( )
=
i
i i
n
n x x
2
2
( )
=
i
i i
n
n x x
4
4
2
3
1
=
( )
=
i
i i
n
n x x
3
3
Asimetria repartitiei
|
1
= 0 distribuia este simetric
|
1
> 0 distribuia este asimetric la dreapta
|
1
< 0 distribuia este asimetric la stnga
2
3
1
=
( )
=
i
i i
n
n x x
2
2
( )
=
i
i i
n
n x x
3
3
Repartitia frecventelor
Parametrii unui proces sunt variabile aleatoare ce urmeaz o
anumit lege de repartiie.
Att histograma ct i poligonul frecvenelor se pot nlocui
printr-o curb continu numit funcie de repartiie a
frecvenelor (se mai numete i densitatea probabilitilor).
Principalele repartitii teoretice sunt:
repartiia normal,
repartiia binomial,
repartiia Poisson,
repartiia (hi-ptrat),
repartiia t (Student),
repartiia F (Fischer-Snedecor).
Repartiia normal N (, 2)
Este una dintre cele mai importante repartiii i este cunoscut
sub numele de repartitia Gauss-Laplace.
Aceast lege se bazeaz pe observaia c rezultatele obinute
prin msurtori repetate n aceleai condiii, nu sunt identice ci
variaz n jurul unei valori.
Pentru =0 i =1
Particularitati ai repartitiei normale
Are un maxim pentru x = (media aritmetica a colectivitatii)
Scade la dreapta i la stnga mediei aritmetice.
Este simetrica n raport cu dreapta x = .
Are form de clopot (clopotul lui Gauss) cu convexitatea n sus.
n punctele x + i x - curba i modific convexitatea.
Curba densitii de probabilitate este cu att mai ascuit cu ct
este mai mic.
La repartitia normala
circa 68,3% din valorile variabilei aleatoare se ncadreaz n domeniul
;
circa 95,5%, n domeniul 2;
peste 99,70%, n domeniul 3 i
numai o proporie de sub 0,3% n afara acestui interval.
Exemple de repartitii normale
Curba de repartitie pentru diferite
abateri medii patratice
Repartiia binominal
Se aplic n studiul probelor repetabile.
Fiecare prob ofer o alternativ a crei probabilitate este
constant. Dac p este probabilitatea unuia dintre termenii
alternativei, probabilitatea celuilalt este complementar, adic
este q = 1 p.
Intr-o serie de n probe repetate, probabilitatea ca termenul de
probabilitate p s se produc de k ori este dat de expresia:
Parametrii pentru repartiia binomial sunt :
media = n*p
dispersia 2 = n*p*q
( )! !
!
k n k
n
C
k
n
=
unde: - este numrul de combinri a n obiecte luate cate k adic
k
n
C
Repartiia Poisson
n cazul cnd probabilitatea p de apariie a caracteristicii
observate este mic, iar numrul de observaii este mare, se
poate deduce din forma funciei de frecven pentru repartiia
binomial legea de repartiie a lui Poisson :
Repartiia Poisson este, ca i repartiia binomial, o lege
discontinu.
Caracteristicile repartiiei snt :
media = n*p
dispersia
2
= n*p*q
u
k
k
e
k
P
!
=
Repartiia
2
(hi-ptrat).
Dac se consider n variabile aleatoare independente x
1
, x
2
, ...,
x
n
cu repartiii normale N(0,1), suma ptratelor variabilelor x
i
,
constituie o variabil aleatoare notata cu
2
Densitatea de probabilitate a repartiiei este:
unde = n 1 reprezint numrul de grade de
libertate
v = v o 2 =
Repartiia t (Student)
Dou variabile u cu repartiie normal N (0, 1) si
2
cu -
grade de libertate - pot defini o alt variabil aleatoare:
v
_
2
u
t =
Densitatea de probabilitate a variabilei t
este:
cu o repartiie denumit repartiia t sau
Student (pseudonimul matematicianului
englez Gosset).
Repartiia F (Fisher-Snedecor).
Considernd dou variabile aleatoare Y1 i Y2 independente
n probabilitate, cu repartiia avnd respectiv numrul gradelor
de libertate v1 (v - niu) i v2 se definete o alt variabil
aleatoare:
Teste statistice
Clasificarea testelor statistice dup scopul lor:
teste de comparare a unor parametri ai unor populaii (compararea
mediilor a doua populaii, compararea mediilor mai multor populaii,
compararea dispersiilor, etc. Se impart in:
teste neparametrice - nu se face nici o presupunere despre distribuiile
populaiilor din care provin eantioanele.
teste parametrice pentru compararea parametrilor se presupune ca
populaiile din care provin eantioanele au anumite distribuii cunoscute,
de exemplu sunt distribuite normal. Testele parametrice sunt preferate
celor neparametrice deoarece, dei sunt mai restrictive, sunt superioare
celor neparametrice din cauza c iau in considerare n plus informaia
despre distribuii.
teste de omogenitate sau de independen - sunt teste care verifica
ipoteze de tipul dependentei sau independentei unor factori de
clasificare;
teste de concordanta - sunt teste care verifica daca distribuia
valorilor unei serii de date este conforma cu o anumita distribuie
teoretic aa cum ar fi distribuia normal.
Principalele teste statistice
Eliminarea datelor aberante
Analiznd un ir de date experimentale se poate ntmpla ca
unele valori s fie afectate de erori.
Punerea n eviden i eliminarea rezultatelor anormale,
respectiv a rezultatelor cu probabilitate foarte mic de a se
produce se face cu ajutorul:
testului Romanovski
testului Testul Grubbs-Smirnov
testului Chauvenet
Verificarea caracterului aleator al
datelor experimentale
Se face cu scopul de a se stabili dac variaia variabilei
aleatoare are loc numai sub influena cauzelor ntmpltoare,
tiind c asupra acesteia pot aciona i cauze sistematice.
n practic se utilizeaz dou teste:
testul iteraiilor (Runtest).
testul Young
Verificarea normalitatii repartitiei
Testele utilizate pentru verificarea normalitatii repartitiei pot fi
impartite in:
teste analitice
bazate pe functia de repartitie
testul Kolmogorov-Smirnov/Lilliefors
testul Cramer-von-Mises
testul Kuiper-Test
testul Watson
testul Anderson-Darling.
bazate pe coeficientul de corelatie si regresie
testul Shapiro-Wilk-Test
testul DAgostino-Test
testul coeficientului de corelatie
teste grafice. Testele grafice se realizeaza ca o completare a testelor
analitice
retea de probabilitate
Quantil-Quantil-Plot
Probability-Probability-Plot.
teste care se bazeaza pe asimetria si boltirea curbei de repartitie (testul
Jarque
testul universal Chi-patrat
Care este cel mai bun test de
verificare a normalitatii ?
Testele care se bazeaza pe functia de repartitie sunt mai slabe
testul cel mai cunoscut Kolmogorov-Smirnov/Lilliefors este destul de
criticat
testele Cramer von Mises si Anderson-Darling sunt considerate mai
bune
Testele care se bazeaza pe coeficientul de corelatie si regresie
sunt mai bune
testul Shapiro-Wilk este considerat unul din cele mai bune teste
Testul Hi-patrat este o alegere proasta deoarece prin gruparea
valorilor in clase se pierd o serie de date necesare testului de
verificare a normalitatii
Quantil-Quantil Plot
Datele experimentale x
i
se ordoneaza crescator
Se calculeaza cuantilele repartitiei normale:
Se reprezinta grafic perechile de puncte P
i
(x
i
, z
i
)
Se verifica imprastierea cuantilelor in jurul liniei de referinta
Probability-Probability Plot
Se calculeaza valorile functiei de repartitie
pentru fiecare valoare experimentale:
Se calculeaza valorile functiei G(x)
Se reprezinta grafic
perechile de valori
P
i
(F(X
i
),G
n
(x))
Se verifica pozitia punctelor
fata de linia de referinta. Cu
cat sunt mai aproape de
linia de referinta cu atat
datele experimentale sunt
repartizate mai normal
Datele experimentale x
i
se ordoneaza crescator
Testul
2
(hi-ptrat)
poate fi aplicat la orice distribuie (repartiie) teoretic.
Abaterile dintre frecvenele absolute experimentale i
frecvenele repartiiei teoretice normale sunt: fa
i
np
i
Suprafeele haurate din figura alaturata
reprezint diferena ntre frecvenele
absolute (fa
i
) i frecvenele repartiiei
normale (np
i
) unde p
i
este probabilitatea
de apariie a intervalului i.
TESTUL
2
(hi-patrat)
cu = n
0
2 - 1 grade de libertate
(n
0
= numrul de grupe).
Numrul de grade de libertate () se calculeaz astfel: din
numrul de grupe se scade numrul parametrilor estimai pe
baza seleciei (egal cu doi), adic media () i abaterea medie
ptratic (s), i o unitate.
Daca
Se respinge ipoteza c repartiia
de selecie este o repartiie
normal;
Nu se respinge ipoteza c
repartiia de selecie este o
repartiie
Daca
unde: - este nivelul (pragul de semnificaie) i de obicei are valoarea 0.05
sau 0.01.
Testul Kolmogorov
are la baz aceleai consideraii ca testul
2
aplicate ns la
funcia de repartiie;
- In figura alaturata este reprezentat
o funcie de repartiie de selecie
(frecvena absolut cumulat) i
funcia de repartiie teoretica normal
- Suprafetele haurate reprezint,
diferena absolut cumulat (fca) i
valoarea funciei de repartiie
teoretic nmulit cu volumul de
selecie, adic:
( )
i i n
u nF fca d =
Suprafee haurate sunt valori ale unei variabile aleatoare (dn),
a crei repartiie a fost studiat de Kolmogorov i reprezint
probabilitatea ca dn s nu depeasc o valoare dat.
Valorile testului Kolmogorov
Funcia de repartiie a lui Kolmogorov se noteaz cu K(), iar
valorile ei sunt date n anexa V pentru valori ale lui X cuprinse
ntre 0,34 i 1,81.
Testul iteraiilor
Se definete o iteraie ca o succesiune de valori dintr-o prob
(eantion) cu o mprtiere aleatoare, mai mare sau mai mic
dect media.
n statistic se demonstreaz c repartiia numrului total de
iteraii tinde ctre repartiia normal.
Numrul critic de iteraii (I) la un nivel de semnificaie :
( ) 1 1
2
1
+ = n u n I
o o
n care : n - este volumul probei
(eantionului); u
variabila normal
normat corespunztoare unui nivel de
semnificaie
Dac Ic > I
=
unde: x
*
- este valoarea aberanta; x2 - valoarea cea mai apropiat de x1; x
min
valoarea minima; x
max
valiarea maxima.
Criteriul rmin - rmax
Dac r
max
> r
,
valoarea x
max
se consider greit i va fi
eliminat
Dac r
min
> r
,
valoarea x
min
se consider greit i va fi
eliminat
Valoarea lui r
,
se citete din anexa VII la nivelul de
semnificaie i = n - 2 grade de libertate.
Dup eliminarea valorilor anormale se alctuieste o nou
repartiie statistic i se calculeaza parametrii necesari analizei.
n
n
s
x x
r
1
min
min
=
n
n
s
x x
r
1
max
max
=
unde: n numarul de valori; x
min
- valoarea minim din irul de date; x
max
- valoarea maxim din irul de date; s - abaterea medie ptratic.