Sunteți pe pagina 1din 3

2.

1 REPREZENTAREA DATELOR STATISTICE

Datele culese experimental urmează a fi analizate conform metodelor statisticii. Datele se culeg în
general dintr-o populaţie statistică sau colectivitate statistică. Elementele populaţiei sunt numite unităţi
statistice sau indivizi. La un anumit moment ne interesează o trăsătură comună a indivizilor, numită variabilă
sau caracteristică.

În general, informaţiile ce se culeg sunt numai de la o parte din indivizi, nu din întreaga populaţie.
Aceasta este o cercetare selectivă. Astfel de indivizi formează eşantionul sau selecţia de lucru.

O formă simplă de a obţine informaţii referitoare la populaţie din datele de pe eşantioane este oferită
de metodele statisticii descriptive. Aceasta implică culegerea datelor, prezentarea lor sub formă de tabele,
întocmirea unor reprezentări grafice şi calculul indicatorilor statistici (astfel se extrag primele informaţii).
Crearea tabelelor şi a graficelor ajută la o interpretare mai uşoară a datelor.

2.2 Gruparea termenilor

Pentru a reprezenta datele sub o formă mai restrânsă se foloseşte gruparea acestora. Aceasta
înseamnă crearea unui tabel cu două coloane pentru fiecare variabilă de interes. În prima coloană se trece
intervalul variabilei de studiu, iar în a doua se trece numărul de apariţii în acel interval.

Intervalele trebuie să fie disjuncte şi consecutive, astfel încât de la valoarea minimă până la valoarea
maximă să fie acoperită toată plaja de valori.

Numărul indivizilor ce aparţin unui anumit interval (sau clasă) formează frecvenţa absolută a
intervalului, notată a1, a2, …, am (unde m este numărul de clase care nu poate fi decât mai mic sau egal cu n,
numărul de indivizi). Avem relaţia:

∑ 𝑎𝑗 = 𝑛
𝑗=1

unde :
aj – frecvenţa absolută a clasei j.
m – numărul de clase.
n – numărul de indivizi.

Frecvența absolută ne oferă informații despre numărul de repetări ale unui eveniment sau a unei variabile
calitative sau cantitative.
Frecvenţa relativă fi se obţine raportând frecvenţa absolută ai la numărul de indivizi, notat cu n.

Frecvenţa cumulată este numărul de indivizi cumulaţi până la o anumită valoare a variabilei de studiu.
La rândul ei frecvenţa cumulată poate fi absolută şi relativă. Pentru frecvenţele cumulate se folosesc de obicei
la notaţie litere mari.

2.3 Reprezentarea datelor prin diagrame

Reprezentarea datelor prin diagrame Graficele se creează prin reprezentarea proporţională cu valorile
numerice, a formelor de bare, linii, sectoare de cerc sau chiar puncte aflate în anumite sisteme de coordonate.
Forma graficelor scoate în evidenţă proprietăţi care se observă greu din prezentarea tabelară. Diagramele nu
dovedesc o legitate sau o relaţie, dar scot în evidenţă posibile trăsături sau sugerează caracteristici ce trebuie
apoi verificate.

Histograma este reprezentarea sub formă grafică, a unor dreptunghiuri cu înălţimea proporţională cu
frecvenţa, iar cu baza egală cu dimensiunea intervalului de grupare. Există histograme ale frecvenţelor
absolute, relative şi cumulate.

Figura 2.3 1 Histograma frecvenţelor absolute (Heart Disease Data Set)


Exemplul 2.1

Următoarele valori reprezintă chest pain type


-- Value 1: typical angina
-- Value 2: atypical angina
-- Value 3: non-anginal pain
-- Value 4: asymptomatic

un esantion din setul de date Heart Disease Data Set (https://archive.ics.uci.edu/ml/datasets/heart+disease)

[2, 2, 2, 1, 2, 2, 2, 2, 3, 2, 2, 2, 1, 4]

Cărei din valorile de mai jos îi corespunde frecvenţa relativă de 0.142857:


A. 1
B. 2
C. 3
D. 4

Solutie:

Definiṭii:
Dacă într-o serie de probe, evenimentul A s-a realizat de nA ori, atunci numărul nA se numeşte frecvenṭa
absolută a evenimentului A.
Frecvenţa relativă fi se obţine raportând frecvenţa absolută fa la numărul de elemente, notat cu n.
Valoare Frecvenṭa absoluta Frecvenţa relativă

fa fi = fa/n unde n este numarul total de valori n=14

1 2 2/14 = 0.142857
2 10 10/14 = 0.714286
3 1 1/14 = 0.071429
4 1 1/14 = 0.071429

S-ar putea să vă placă și