Documente Academic
Documente Profesional
Documente Cultură
2. Aspecte teoretice
2.1. Prelucrarea datelor observate
x1 , x2 , x3 ,..., x n , (1.1)
Rx x x x w. (1.3)
max min (n) (1)
Pentru calculul mărimilor statistice este utilă, de multe ori, gruparea datelor pe clase
(intervale). Numărul claselor k se recomandă să fie între 13 şi 20. În cazul în care numărul
datelor este inferior lui 250, este suficientă împărţirea în 10 clase. STAS 7122-86 propune
pentru stabilirea numărului de clase formula lui H.A. Sturges,
k n. (1.5)
Se stabilesc amplitudinea, limitele şi valoarea centrală ale claselor. Cele n valori
observate se grupează în k clase de lungime aj, centrate în punctele xj ( j 1, 2,..., k ).
2
a a
x x x ; (1.8)
j i j
2 2
a
mici sau egale cu limita superioară a intervalului, x , determinate cu relaţiile de
j
2
recurenţă:
F0, a 0;
; (1.9)
F j ,a F j 1,a n j
F0 0;
; j = 1, 2, …,k. (1.10)
F j F j 1 f j
Aceste mărimi sunt prezentate sub forma tabelului frecvenţelor.
Reprezentarea mărimilor tabelate se poate face intuitiv sub mai multe forme grafice.
Poligonul frecvenţelor este o linie poligonală care uneşte puncte având în abscisă
valoarea centrală a clasei, iar în ordonată frecvenţa clasei, absolută sau relativă. Punctele de la
extreme se află pe axa absciselor, deoarece ele reprezintă frecvenţele claselor zero şi k+1, care
au valoarea zero, pentru că în aceste clase nu apar date observate (fig. 1.1).
Histograma frecvenţelor este o reprezentare echivalentă poligonului frecvenţelor, cu
deosebirea că sunt reprezentate dreptunghiuri, cu baza egală cu amplitudinea claselor (a) şi
înălţimea proporţională cu frecvenţa claselor, absolută sau relativă (fig. 1.2).
3
intervalului, j, atunci
0,x x1
F ( x) F j ,x j x x j 1, j 1,2,...,k 1 . (1.11)
1,x xk
Graficul funcţiei de repartiţie empirică este prezentat în figura 1.3.
1 k
x x j n j . (1.13)
n
j 1
4
Mediana Me este valoarea observată pentru care frecvenţele valorilor mai mari şi mai
mici decât aceasta sunt egale. Determinarea ei presupune ordonarea valorilor, în şir crescător
(sau descrescător), x(1) ≤ x(2) ≤ x(3) ≤ ... ≤ x (n), indicele (n) arătând rangul. În acest caz,
mediana are valoarea
x n 1 ,nimpar
2
Me . (1.14)
x
1
2 n x n 1 ,n par
2 2
Modul (moda) Mo este valoarea observată cu frecvenţa cea mai mare. Pentru
repartiţii de frecvenţă aproape normale, modul se calculează cu relaţia aproximativă
Mo x 3 ( x Me) . (1.15)
s s2 . (1.20)
Amplitudinea R (sau w) a şirului de date este dată de diferenţa dintre valorile maximă
şi minimă observate,
R w xmax xmin . (1.21)
Coeficientul de variaţie Cv se calculează cu relaţia:
s
Cν . (1.22)
x
5
Evaluarea valorilor tipice necunoscute ale unei populaţii reprezintă o estimare. Dacă
pentru fiecare valoare tipică (parametru) se calculează o singură valoare, estimarea se numeşte
punctuală. Dacă pentru fiecare valoare tipică se calculează un interval, estimarea se numeşte prin
intervale.
Intervalul de încredere este un interval care acoperă cu o probabilitate dată, numită nivel
de încredere, valoarea unui parametru oarecare ce trebuie estimat.
Rezolvare:
Suma = 326817.00 ore
Media = 1634.09 ore
Mediana = 1641.00 ore
Dispersia = 56987.09 ore2
Abaterea medie pătratică = 238.72 ore
Amplitudinea = 1149.00 ore
Modul = 1654.83 ore
Coeficientul de variaţie = 0.15
Pentru metoda de calcul „pe clase (intervale)”, se va realiza tabelul 1.2.
6