Sunteți pe pagina 1din 4

Fiabilitate şi terotehnică

LUCRAREA - 02
1. GRUPAREA DATELOR ÎN CLASE ŞI DETERMINAREA
FRECVENŢELOR CARACTERISTICE

1.1. Noţiuni teoretice privind gruparea şirurilor de valori în clase

Indicatorii statistici nu oferă în totalitate informaţii privind evaluarea de fiabilitate. Determinările


bazate pe observaţii discrete, permit efectuarea unor asocieri, care nu alterează setul de valori sau
interpretarea rezultatelor. Determinarea unei normalităţi a distribuţiei valorilor, este necesară pentru
a putea fi interpretate seturi mai mari de date. În acest scop, datele sunt condensate ordonat, în aşa
numite clase de valori. caracteristic acestor clase este tendinţa tuturor valorilor din interiorul unei
clase, de a converge spre o valoare centrală din interiorul intervalului de clasă.
Există situaţii specifice în determinările statistice de fiabilitate, când redistribuirea valorilor
nu este în măsură să ofere rezultate concludente. De aceea tehnica de grupare în clase este de cele
mai multe ori utilizată pentru evaluarea normalităţii distribuţiei valorilor.
Ordonarea şi gruparea datelor, se face prin distribuirea acestora în clase de valori, care
cuprind toate rezultatele observaţiei sau măsurătorilor efectuate, ce se încadrează într-un interval de
mărime impus.
Numărul k de clase în care se grupează valorile supuse unei prelucrări statistice, se
determină funcţie de mărimea N a eşantionului. Relaţia recomandată pentru determinarea numărului
de clase este:
k = 1 + 3 ,322 lg( N ) (1.1)

Pentru un număr redus de date (sub 25 de valori), gruparea în clase este puţin semnificativă,
suplimentul de informaţie obţinut fiind neconcludent.
Numărul de clase efectiv ke reprezintă partea întreagă a valorii k calculate.

În MathCAD există relaţia: floor(k) prin care se extrage partea întreagă dintr-un număr real.

În cazul în care setul de valori este relativ ridicat (>100), este recomandată pentru
determinarea numărului de clase relaţia:

1
2
k 1 = 4(0,75( N − 1) ) 5
(1.2)

Shapiro-Wald, recomandă în cazul eşantioanelor statistice de volum mare, relaţia:

N
k2 = (1.3)
4

Valori orientative ale numărului de clase, determinat funcţie de dimensiunea N a eşantionului


prelucrat, pentru date de volum distinct, se prezintă în tabelul 1.
Alegerea uneia din cele trei valori recomandate pentru numărul claselor de grupare, se face
funcţie de dimensiunea N a eşantionului.
Uzual sunt agreate valorile k şi k1, valorile k2 fiind mai rar utilizate în determinările de
fiabilitate.

1
Fiabilitate şi terotehnică
LUCRAREA - 02
Gruparea valorilor în clase de repartiţie necesită stabilirea unor intervale restrictive în care
datele din eşantion vor fi încadrate. Intervalele astfel determinate exprimă o tendinţă a valorilor de a
converge „local”, spre valoarea centrală a fiecărei clase.
Amplitudinea a (lungimea intervalului de clasă), ce caracterizează intervalul unei clase, se
determină cu relaţia:

x max − x min
a= (1.4)
k

unde: xmax este valoarea cea mai mare din şirul de date;
xmin - valoarea cea mai mică din şirul de date.
Intervalul unei clase va fi deci mărginit de două valori: limita inferioară şi superioară, de forma:

j j−1
l inf = l sup ;
j j
(1.5)
l sup = l inf +a

unde: j = 1 … k reprezintă ordinal clasei.


Valoarea centrală lcj a clasei de repartiţie de ordin j se determină cu relaţia:

l cj = l inf
j
+a/2 (1.6)

Se face specificarea că limita inferioară a primului interval este valoarea minimă din şir, iar limita
superioară a ultimului interval este valoarea maximă din şirul ordonat de valori.
Tendinţa privind modul de variaţie a unui fenomen analizat prin evaluări statistice este dată de
indicatorul frecvenţă de repartiţie. Sunt două tipuri de frecvenţe care oferă informaţii distincte
privind comportarea şirului de date:
- frecvenţa de repartiţie a valorilor aleatorii;
- frecvenţa cumulată de repartiţie a datelor.
Numărul nj de date conţinute într-o clasă, reprezintă frecvenţa de apariţie în clase a valorilor.

fj = nj (1.7)

Pentru determinarea frecvenţei de repartiţie se va crea următorul algoritm:


- se introduc noi variabile tip şir de forma:

u: = 1 .. k;
j: = 1 .. k+1;

Valorile limită ale claselor vor fi date de relaţia:

int j := x min + ( j − 1)a

f := hist (int, x )

Cu această relaţie s-a determinat frecvenţa de apariţie în clase a datelor. Prin apelarea la
reprezentarea grafică, se poate vizualiza modul de grupare a datelor în intervalele caracteristice.
2
Fiabilitate şi terotehnică
LUCRAREA - 02
Raportul dintre numărul de date conţinut în clasă şi numărul total al datelor din eşantion
reprezintă frecvenţa relativă. Se determină cu relaţia:

fj
f rj = (1.8)
N

Frecvenţa cumulată reprezintă suma frecvenţelor absolute sau relative, a setului de date.

k
f cj = ∑ f rj (1.9)
i =1

Frecvenţa relativă, precum şi frecvenţa cumulată sunt întâlnite sub formă procentuală, exprimare
mai aproape de domeniul statistic decât de cel al probabilităţilor.
Pentru determinarea frecvenţelor cumulate este necesară utilizarea declaraţiilor de şir
anterioare, de iniţializare a şirului. Etapele de algoritm parcurse pentru obţinerea frecvenţelor
cumulate sunt:

Fcum1 := f1 ;
Fcum u := Fcum u −1 + f u

Tabelul 1.1. Valori pentru numărul de clase,


determinate funcţie de mărimea eşantionului
Mărimea eşantionului
N<150 N>150 N>150
k k1 (Shapiro-Wald)
k2
Nr. valori Nr. clase Nr. valori Nr. clase Nr. valori Nr. clase
<23 5 - - <200 30
24-27 6 150 28 200 40
48-76 7 200 31 250 50
77-150 8 250 34 300 60
- 400 41 350 70
- 500 45 450 90

1.2. Cerinţele lucrării

1. Algoritmarea relaţiilor matematice propuse pentru efectuarea calculelor;


2. Efectuarea grupării în clase pentru şirul de date, prelucrat de fiecare student în lucrarea anterioară;
3. Determinarea frecvenţei relative procentual;
4. Evaluarea diferenţelor înregistrate la calculul valorii k cu diferite relaţii date în lucrare şi
compararea cu datele din tabelul 1.1;
5. Trasarea graficelor de repartiţie pentru frecvenţele calculate;
6. Completarea concluziilor rezultate din evaluarea statistică (din lucrarea precedentă), cu cele ce
decurg în urma grupării în clase şi a tendinţei de variaţie, dată de frecvenţele calculate.

3
Fiabilitate şi terotehnică
LUCRAREA - 02
Comentarii ajutătoare
© Pentru a crea un algoritm, este necesar ca relaţiile 3.5 şi 3.6 din lucrare să fie transpuse
astfel încât utilizând eficienţa indicelui de control a şirului de date, calculul valorilor
solicitate să se facă global.
© La trasarea grafică nu uitaţi să marcaţi ce reprezentaţi pe fiecare din axele de coordonate,
cu unităţile de măsură aferente. Specific evaluărilor de statistică a frecvenţelor relative şi
cumulate sunt reprezentările de tip: „bar”, respectiv „step”.

În Anexa B.1, se prezintă o modalitate de rezolvare propusă a aplicaţiei în mediul MathCAD.

Anexa B. 1.
Algoritmul MathCAD de rezolvare a aplicaţiei 1.2.

În cazul acestei aplicaţii, se pot utiliza funcţii predefinite ale mediului MathCAD, care vor scurta
mult timpul de rezolvare a aplicaţiei.

Pasul Relaţia mathCAD Obs.


Identificarea valorii v min := min (x ) Cu x s-a notat şirul iniţial de date
minime a şirului
Identificarea valorii
v max := max(x )
maxime a şirului
Instrucţiunea „floor” returnează valoarea întreagă a unui
Calculul numărului de
k := floor(1 + 3.322 ⋅ log(n )) număr natural;
clase şi extragerea părţii
În MathCAD, logaritmul zecimal este recunoscut cu
întregi
instrucţiunea „log”
Calculul amplitudinei v max − v min
d :=
intervalelor de clasă k
iniţiere variabilă tip şir j := 1 K k Constituie baza iteraţiei pentu gruparea celor n valori în
pentru numărul de clase q := 1 K k + 1 k clase
l inf j := v min + ( j − 1) ⋅ d
Calculul limitelor şi
l sup j := v min + j ⋅ d
valorii centrale pentru
cele k clase d
lc j := l inf j +
2
Calculul grupării celor n int q := l inf q + (q − 1) ⋅ d Iteraţia q permite identificarea şi a valorii primei clase,
valori în clase dar şi a clasei de ordin k
Identificarea grupării
Instrucţiunea hist are valoare de grupare în intervale a
celor n valori în cele k f := hist (int, x )
unui şir de valori
clase de repartiţie
Calculul frecvenţei fj
relative fr j :=
n
Algoritmul este în 3 paşi:
I. t := 2 K k I. declararea unei noi variabile;
Calculul frecvenţei II. declararea explicită a primei valori care în cazul
II. fcum1 := f 1
cumulate frecvenţei cumulate este identică cu frecvenţa absolută
III. fcum t := fcum t −1 + f t III. scrierea relaţiei care să cumuleze la valoarea
precedenta indicele curent de creştere
Calculul frecvenţei fcum j
cumulate relative fcrel j :=
n
Reprezentări grafice şi Toolbar Se face referire la succesiunea alegerii opţiunilor din
afişare liste de valori
insert → graph → X − Y plot bara de meniu
calculate

S-ar putea să vă placă și