Asist. cerc.
Cezara Vinturis, FEAA, UVT
DEFINITII SI FORMULE
Asist. cerc. Cezara Vinturis, FEAA, UVT
GRUPAREA DATELOR PE INTERVALE ȘI DISTRIBUȚIA DE FRECVENȚĂ
1. Gruparea datelor
Pentru a grupa datele pe interval este necesara determinarea lungimii de interval.
Lungimea unui interval se notează cu ℎ și se calculează utilizând formula lui Sturges:
𝑋𝑚𝑎𝑥 −𝑋𝑚𝑖𝑛
ℎ= ;
1+3,322∗𝑙𝑔(𝑛)
n-volumul eșantionului.
Valoarea lui ℎ se rotunjește, de obicei, în sus.
Formule Excel utilizate: MIN, MAX, LOG10, ROUNDUP
Asist. cerc. Cezara Vinturis, FEAA, UVT
2. Determinarea frecventelor: frecvențele absolute, relative, cumulate și cumulate relative
a) Frecventa absoluta (𝒏𝒊 ) a unui interval arată numărul de valori din seria inițială de date care se găsesc în
intervalul respectiv. Suma frecvențelor absolute este egală cu volumul eșantionului.
b) Frecvențele relative (𝒇𝒊 ) se determină prin raportul dintre frecvențele absolute și volumul eșantionului. Suma
frecvențelor relative este egală cu 1.
c) Frecvența cumulată a unui interval (𝑪𝒏𝒊 ) se determină prin suma dintre frecvența absolută (𝒏𝒊 ) a intervalului
respectiv și frecvențele absolute (𝒏𝒊 ) ale tuturor intervalelor anterioare. Ultima frecvență cumulată este egală
cu volumul eșantionului (n).
d) Frecvența cumulată relativă a unui interval (𝑪𝒇𝒊 ) se determină prin suma frecvenței relative (𝒇𝒊 ) a
intervalului respectiv și frecvenței relative (𝒇𝒊 ) ale tuturor intervalelor anterioare. Ultima frecvență cumulată
relativă este egală cu 1.
Asist. cerc. Cezara Vinturis, FEAA, UVT
PARAMETRII TENDINTEI CENTRALE
DATE NEGRUPATE DATE GRUPATE
∑𝑛
𝑖=1 𝑥𝑖 ∑ 𝑥 ∗𝑛 𝑘 ′
Media aritmetică: 𝑋̅ = Media aritmetică: 𝑋̅ = 𝑖=1𝑘 𝑖 𝑖
𝑛 ∑𝑖=1 𝑛𝑖
𝑥𝑖′ = mijloacele intervalelor de grupare calculate ca și medii aritmetice între capetele intervalelor
Mediana Mediana
Trebuie mai întâi ordonate datele crescător. Apoi: Pas 1: identificarea intervalului median. Intervalul median este cel corespunzător primei
𝒏
Dacă 𝒏 este număr impar, atunci mediana este valoarea centrală a frecvențe cumulate (𝑪𝒏𝒊 ) mai mari decât 𝟐.
𝑛+1 𝑛
seriei ordonate de date: 𝑀𝑒 = 𝑥𝑛+1 (valoarea cu numărul de ordine ). − 𝑁𝑒−1
2 2 𝑀𝑒 = 𝑙𝑒 + ℎ𝑒 ∗ 2
𝑛𝑒
Dacă 𝒏 este număr par, atunci mediana este media aritmetică a celor
𝑙𝑒 = limita inferioară a intervalului median
1
două valori centrale ale seriei ordonate de date: 𝑀𝑒 = (𝑥𝑛 + 𝑥𝑛+1 ) ℎ𝑒 = lungimea intervalului median
2 2 2
𝑁𝑒−1 = frecvența cumulată a intervalului anterior celui median
𝑛 𝑛
(valorile cu numerele de ordine și + 1). 𝑛𝑒 = frecvența absolută a intervalului median
2 2
Modul (Mo) valoarea care apare de cele mai multe ori Modul (Mo)
Observație: Pas 1: identificarea intervalului modal = cel care are frecvența absolută (ni) maximă.
Dacă există două sau mai multe valori care se repetă de cele mai multe ∆1
𝑀0 = 𝑙𝑜 + ℎ0 ∗
∆1 + ∆2
ori, modul nu se poate determina.
𝑙𝑜 = limita inferioară a intervalului modal
Daca toate apar o singură dată, modul nu există.
ℎ0 = lungimea intervalului modal
Excel: AVERAGE, MEDIAN, [Link], SUM ∆1 = diferența dintre frecvența absolută a intervalului modal (cea maximă) și cea anterioara
∆2 = diferența dintre frecvența absolută a intervalului modal (cea maximă) și următoarea
Asist. cerc. Cezara Vinturis, FEAA, UVT
PARAMETRII VARIATIEI
DATE NEGRUPATE DATE GRUPATE
Varianța (Dispersia) = medie aritmetică a pătratelor abaterilor valorilor
studiate de la media lor Varianța
La nivelul unei populații, ea se notează cu 𝜎 2 , iar la nivelul unui eșantion, 𝑘
se notează cu 𝑠 2 . 1
𝑛
2
𝑠 = ∑(𝑥𝑖′ − 𝑋̅)2 ∗ 𝑛𝑖
1 𝑛−1
𝑖=1
2
𝑠 = ∑(𝑥𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
Excel: VAR.S
Abaterea medie pătratică (Abaterea standard sau Ecartul tip) Abaterea medie pătratică
= media pătratică a abaterilor valorilor de la medie (rădăcină pătrată din
𝑘
varianţă) La nivelul unei populații, ea se notează cu 𝜎, iar la nivelul unui 1
eșantion, se notează cu 𝑠. 𝑠 = √𝑠 2 = √ ∑(𝑥𝑖′ − 𝑋̅)2 ∗ 𝑛𝑖
𝑛−1
𝑖=1
𝑛
1
𝑠= √𝑠 2 =√ ∑(𝑥𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
Excel: SQRT
Abaterea medie liniară (𝑑) Abaterea medie liniară
= medie aritmetică simplă a abaterilor individuale, luate în valoare 1
𝑘
absolută: 𝑑 = ∑|𝑥𝑖′ − 𝑋̅| ∗ 𝑛𝑖
𝑛 𝑛
1 𝑖=1
𝑑 = ∑|𝑥𝑖 − 𝑋̅|
𝑛
𝑖=1
Excel: AVEDEV
Asist. cerc. Cezara Vinturis, FEAA, UVT
Coeficientul de variație
Coeficientul de variație 𝑠
𝐶𝑉 = ∗ 100
= raportul procentual dintre abaterea medie pătratică și medie. 𝑋̅
𝑠
𝐶𝑉 = ∗ 100
𝑋̅ s = abaterea medie patratica
Amplitudinea În general, amplitudinea se referă la diferența dintre cel mai mare și cel mai mic
Amplitudinea se notează cu 𝐴. element dintr-o serie de date.
= diferența dintre valoarea maximă și valoarea minimă a seriei de
date: Pentru datele grupate pe intervale, nu se poate determina amplitudinea exactă
𝐴 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 deoarece informațiile individuale sunt agregate în intervale. Astfel,
amplitudinea poate fi aproximată, dar nu poate fi determinată cu exactitate, deoarece
detalii precise despre fiecare valoare individuală sunt pierdute când datele sunt
grupate.