Sunteți pe pagina 1din 4

Fiabilitate i terotehnic

LUCRAREA - 03

3. GRUPAREA DATELOR N CLASE I DETERMINAREA


FRECVENELOR CARACTERISTICE

3.1. Noiuni teoretice privind gruparea irurilor de valori n clase

Indicatorii statistici nu ofer n totalitate informaii privind evaluarea de fiabilitate. Determinrile


bazate pe observaii discrete, permit efectuarea unor asocieri, care nu altereaz setul de valori sau
interpretarea rezultatelor. Determinarea unei normaliti a distribuiei valorilor, este necesar pentru
a putea fi interpretate seturi mai mari de date. n acest scop, datele sunt condensate ordonat, n aa
numite clase de valori. caracteristic acestor clase este tendina tuturor valorilor din interiorul unei
clase, de a converge spre o valoare central din interiorul intervalului de clas.
Exist situaii specifice n determinrile statistice de fiabilitate, cnd redistribuirea valorilor
nu este n msur s ofere rezultate concludente. De aceea tehnica de grupare n clase este de cele
mai multe ori utilizat pentru evaluarea normalitii distribuiei valorilor.
Ordonarea i gruparea datelor, se face prin distribuirea acestora n clase de valori, care
cuprind toate rezultatele observaiei sau msurtorilor efectuate, ce se ncadreaz ntr-un interval de
mrime impus.
Numrul k de clase n care se grupeaz valorile supuse unei prelucrri statistice, se
determin funcie de mrimea N a eantionului. Relaia recomandat pentru determinarea numrului
de clase este:
(3.1)
k 1 3,332 lg( N)
Pentru un numr redus de date (sub 25 de valori), gruparea n clase este puin semnificativ,
suplimentul de informaie obinut fiind neconcludent.
Numrul de clase efectiv ke reprezint partea ntreag a valorii k calculate.
n MathCAD exist relaia: floor(k) prin care se extrage partea ntreag dintr-un numr real.
n cazul n care setul de valori este relativ ridicat (>100), este recomandat pentru
determinarea numrului de clase relaia:

k 1 4(0,75( N 1) )
2

1
5

(3.2)

Shapiro-Wald, recomand n cazul eantioanelor statistice de volum mare, relaia:


k2

N
4

(3.3)

Valori orientative ale numrului de clase, determinat funcie de dimensiunea N a eantionului


prelucrat, pentru date de volum distinct, se prezint n tabelul 1.
Alegerea uneia din cele trei valori recomandate pentru numrul claselor de grupare, se face
funcie de dimensiunea N a eantionului.
Uzual sunt agreate valorile k i k1, valorile k2 fiind mai rar utilizate n determinrile de
fiabilitate.
1

Fiabilitate i terotehnic
LUCRAREA - 03

Gruparea valorilor n clase de repartiie necesit stabilirea unor intervale restrictive n care
datele din eantion vor fi ncadrate. Intervalele astfel determinate exprim o tendin a valorilor de a
converge local, spre valoarea central a fiecrei clase.
Amplitudinea a (lungimea intervalului de clas), ce caracterizeaz intervalul unei clase, se
determin cu relaia:
a

x max x min
k

(3.4)

unde: xmax este valoarea cea mai mare din irul de date;
xmin - valoarea cea mai mic din irul de date.
Intervalul unei clase va fi deci mrginit de dou valori: limita inferioar i superioar, de forma:
j
j1
l inf
l sup
;
j
j
l sup
l inf
a

(3.5)

unde: j = 1 k reprezint ordinal clasei.


Valoarea central lcj a clasei de repartiie de ordin j se determin cu relaia:
j
l cj l inf
a/2

(3.6)

Se face specificarea c limita inferioar a primului interval este valoarea minim din ir, iar limita
superioar a ultimului interval este valoarea maxim din irul ordonat de valori.
Tendina privind modul de variaie a unui fenomen analizat prin evaluri statistice este dat de
indicatorul frecven de repartiie. Sunt dou tipuri de frecvene care ofer informaii distincte
privind comportarea irului de date:
- frecvena de repartiie a valorilor aleatorii;
- frecvena cumulat de repartiie a datelor.
Numrul nj de date coninute ntr-o clas, reprezint frecvena de apariie n clase a valorilor.
fj nj

(3.7)

Pentru determinarea frecvenei de repartiie se va crea urmtorul algoritm:


- se introduc noi variabile tip ir de forma:
u: = 1 .. k;
j: = 1 .. k+1;
Valorile limit ale claselor vor fi date de relaia:
int j : x min j 1a
f : hist (int, x )

Cu aceast relaie s-a determinat frecvena de apariie n clase a datelor. Prin apelarea la
reprezentarea grafic, se poate vizualiza modul de grupare a datelor n intervalele caracteristice.
2

Fiabilitate i terotehnic
LUCRAREA - 03

Raportul dintre numrul de date coninut n clas i numrul total al datelor din eantion
reprezint frecvena relativ. Se determin cu relaia:

f rj

fj
N

(3.8)

Frecvena cumulat reprezint suma frecvenelor absolute sau relative, a setului de date.
k

f cj f rj

(3.9)

i 1

Frecvena relativ, precum i frecvena cumulat sunt ntlnite sub form procentual, exprimare
mai aproape de domeniul statistic dect de cel al probabilitilor.
Pentru determinarea frecvenelor cumulate este necesar utilizarea declaraiilor de ir
anterioare, de iniializare a irului. Etapele de algoritm parcurse pentru obinerea frecvenelor
cumulate sunt:

Fcum1 : f 1 ;
Fcum u : Fcum u 1 f u
Tabelul 3.1. Valori pentru numrul de clase,
determinate funcie de mrimea eantionului
Mrimea eantionului
N<150
N>150
N>150
k
k1
(Shapiro-Wald)
k2
Nr. valori Nr. clase Nr. valori Nr. clase Nr. valori Nr. clase
<23
5
<200
30
24-27
6
150
28
200
40
48-76
7
200
31
250
50
77-150
8
250
34
300
60
400
41
350
70
500
45
450
90

3.2. Cerinele lucrrii

1. Algoritmarea relaiilor matematice propuse pentru efectuarea calculelor;


2. Efectuarea gruprii n clase pentru irul de date, prelucrat de fiecare student n lucrarea anterioar;
3. Determinarea frecvenei relative procentual;
4. Evaluarea diferenelor nregistrate la calculul valorii k cu diferite relaii date n lucrare i
compararea cu datele din tabelul 3.1;
5. Trasarea graficelor de repartiie pentru frecvenele calculate;
6. Completarea concluziilor rezultate din evaluarea statistic (din lucrarea precedent), cu cele ce
decurg n urma gruprii n clase i a tendinei de variaie, dat de frecvenele calculate.
3

Fiabilitate i terotehnic
LUCRAREA - 03

Comentarii ajuttoare
Pentru a crea un algoritm, este necesar ca relaiile 3.5 i 3.6 din lucrare s fie transpuse
astfel nct utiliznd eficiena indicelui de control a irului de date, calculul valorilor
solicitate s se fac global.
La trasarea grafic nu uitai s marcai ce reprezentai pe fiecare din axele de coordonate,
cu unitile de msur aferente. Specific evalurilor de statistic a frecvenelor relative i
cumulate sunt reprezentrile de tip: bar, respectiv step.
n Anexa B.2, se prezint o modalitate de rezolvare propus a aplicaiei n mediul MathCAD.
Anexa B. 2.
Algoritmul MathCAD de rezolvare a aplicaiei A. 2.2.
n cazul acestei aplicaii, se pot utiliza funcii predefinite ale mediului MathCAD, care vor scurta
mult timpul de rezolvare a aplicaiei.
Pasul
Identificarea valorii
minime a irului
Identificarea valorii
maxime a irului
Calculul numrului de
clase i extragerea prii
ntregi
Calculul amplitudinei
intervalelor de clas
iniiere variabil tip ir
pentru numrul de clase

Relaia mathCAD

Obs.

v min : min x

Cu x s-a notat irul iniial de date

v max : maxx
Instruciunea floor returneaz valoarea ntreag a unui
numr natural;
n MathCAD, logaritmul zecimal este recunoscut cu
instruciunea log

k : floor1 3.322 logn


v max v min
k
j : 1 k

d :

Constituie baza iteraiei pentu gruparea celor n valori n


k clase

q : 1 k 1

l inf j : v min j 1 d
Calculul limitelor i
valorii centrale pentru
cele k clase

l sup j : v min j d

Calculul gruprii celor n


valori n clase
Identificarea gruprii
celor n valori n cele k
clase de repartiie
Calculul frecvenei
relative

int q : l inf q q 1 d

Iteraia q permite identificarea i a valorii primei clase,


dar i a clasei de ordin k

f : hist int, x

Instruciunea hist are valoare de grupare n intervale a


unui ir de valori

Calculul frecvenei
cumulate

Calculul frecvenei
cumulate relative
Reprezentri grafice i
afiare liste de valori
calculate

d
2

lc j : l inf j

fj

fr j :

n
Algoritmul este n 3 pai:
I. declararea unei noi variabile;
II. declararea explicit a primei valori care n cazul
frecvenei cumulate este identic cu frecvena absolut
III. scrierea relaiei care s cumuleze la valoarea
precedenta indicele curent de cretere

I. t : 2 k
II. fcum1 : f1
III. fcum t : fcum t 1 f t
fcrel j :

fcum j
n

insert graph X Y plot

Se face referire la succesiunea alegerii opiunilor din


bara de meniu

S-ar putea să vă placă și