Documente Academic
Documente Profesional
Documente Cultură
unde
8
x
e(1)
>
>
>
>
x
e
>
>
< (2)
:::
x
e(i)
>
>
>
>
:::
>
>
:
x
e(N )
=
=
:::
=
:::
=
x
e(1)
x
e(2)
:::
x
e(N ) ;
min [e
x1 ; x
e2 ; :::; x
eN ];
min([e
x1 ; x
e2 ; :::; x
eN ]n[e
x(1) ]);
..............................
min([e
x1 ; x
e2 ; :::; x
eN ]n[e
x(1) ; :::;e
x(i
.................................
max [e
x1 ; x
e2 ; :::; x
eN ]:
1) ]
Pasul 2.
Se elimina datele aberante. De multe ori, datorita unor accidente aparute
in timpul experimentului/elor ori datorita unor erori inerente procesului de inregistrare a unui numar mare de date sau din alte cauze unele dintre datele din
e nu reprezinta valori reale ale unor masuratori efectuate cu caracteristica
setul D
X asupra populatiei aate in studiu, ci valori aberante ce nu-si au locul in setul
de date. Pentru ca rezultatele prelucrarii statistice sa e relevante si conforme
cu realitatea asemenea date trebuie eliminate din setul de date ce urmeaza a
prelucrate. Este evident ca primele date vizate de caracter aberant sunt x
e(1)
si x
e(N ) : Exista teste speciale, destul de sosticate, care permit stabilirea caracterului aberant al unor asemenea date. Noi vom verica din "ochi" caracterul
aberant al unora dintre date si le vom elimina.
x(2)
:::
x(n) :
Pasul 3.
Se determina volumul selectiei, adica numarul total de date ce urmeaza a
analizate. Atragem atentia ca ecare data din setul D trebuie numarata (de
atatea ori) de cate ori apare in setul de date. In cazul nostru jDj = n:
Pasul 4.
Se determina intervalul de variatie al datelor (intervalul cel mai mic care
contine toate datele din setul de date analizat).
In cazul nostru acest interval va :
[x(1) ; x(n) ]:
In continuare se determina cei mai importanti indicatori de pozitie (numiti si indicatori pe orizontala). Acestia ne pot indica (intr-un mod relevant)
situarea unui numar mare de date fata de o anumita "pozitie centrala" asociata
setului de date.
Cel mai important indicator de pozitie se obtine la:
Pasul 5.
Se determina Media de selectie.
x=
Aceasta este
M e :=
8
< x(k+1) ;
:
xk + x(k+1)
;
2
daca
n = 2k + 1;
daca
n = 2k:
Aceasta marime are o valoare mai mare din punct de vedere practic. Ea nu
este inuentata de valorile aberante.
In cazul seturilor de date cu volum mare un rol important il pot juca si
cvartilele.
Pasul 7.
Se determina cvartilele (setului de date). Pentru aceasta se imparte intervalul de variatie [x(1) ; x(n) ] in patru parti egale astfel:
Q1
Q2
Q3
=
=
=
Mediana[x(1) ; M e]
Me
:
Mediana[M e; x(n) ]
In continuare se determina cei mai importanti indicatori de variatie (numiti si indicatori pe verticala).
Acestia ne pot indica abaterea datelor fata de indicatorii de pozitie.
Printre cei mai importanti indicatori de variatie se numara amplitudinea si
dispersia de selectie.
Pasul 8.
Se determina amplitudinea selectiei.
a = x(n)
x(1) :
S2 =
1X
(xk
n
x)2 :
k=1
Marimea
S=
v
u n
u1 X
2
S =t
(xk
n
x)2
k=1
1X
(xk
n
y)2
S2:
k=1
Pasul 11.
Se determina functia empirica de repartitie.
Fn : R ! [0; 1]
este data prin:
Fn (x) =
unde
x
= jf1
n j xi < xgj :
F (x)j
x2R
! 0;
n!1
Pentru a usura calculele noi vom alege de ecare data volumul populatiei
din esantion de forma n = 2k ; k 2 N ; k 3; cand vom obtine log2 n = k 2 N :
Vom obtine intervalele:
8
I1
=
[x(1) ; x(1) + h)
>
>
>
>
=
[x(1) + h; x(1) + 2h)
< I2
:
>
>
I
=
[x
+
(r
2)h;
x
+
(r
1)h)
>
r
1
(1)
(1)
>
:
Ir
=
[x(1) + (r 1)h; x(1) + (1 + log2 n)h]
Daca am luat
Ir = [x(1) + (r
am facut o eroare
x(1) + (1 + log2 n)h
a
1 + log2 n
! 0; daca a := x(n)
n!1
[log2 n]) h
x(1)
Pasul 13.
Se traseaza histograma.
Conform dictionarelor o histograma ar un grac care reprezint
a, prin dreptunghiuri, o distributie statistica.
Fie n1 numarul de date din setul D care se aa in intervalul I1 ; n2 numarul de
date care se aa in intervalul I2 ; :::; nr numarul de date care se aa in intervalul
Ir :
Asadar frecventa absoluta a intervalului Ij va .
nj := f1
i n x(i) 2 Ij g ; 1 j r:
Pr
Este evident ca 0 nj n si j=1 nj = n:
Pentru a obtine histograma asociata datelor x1 ; :::; xn vom trasa, intr-un
sistem ortogonal de axe, dreptunghiurile, cu bazele de lungimi egale,
Dj = Ij
[0; nj ]; 1
115 109
6
= = 1; 5:
1 + log2 23
4
5
Obtinem intervalele:
I1 = [109 ; 110; 5) ; I2 = [110; 5 ; 112) ; I3 = [112 ; 113; 5) ; I4 = [113; 5 ; 115]:
De aici se obtin usor frecventele absolute n1 = 2 ; n2 = 1; n3 = 3 si n4 = 2:
Se obtine histograma: