Sunteți pe pagina 1din 6

Scopul statisticii

Statistica poate fi clasificată în două mari categorii:

- statistica descriptivă

- statistica analitică.

Statistica descriptivă se ocupă de prezentarea, clasificarea şi sintetizarea


datelor de observaţie. Aceasta concentrează informaţia existentă în datele
respective cu ajutorul anumitor indicatori statistici care, în fond, sunt nişte numere
ce exprimă caracteristici sau tendinţe ale fenomenului studiat.

Statistica analitică foloseşte metode matematice (teoria probabilităţilor)


pentru extragerea şi prelucrea informaţiei statistice; în multe cazuri aceste metode
pun în evidenţă legităţi statistice.

Obiectivele esenţiale ale statisticii

-Identificarea unor noi legi de dependenţă, specific statistice şi adaptate la


formele complexe şi variate pe care le oferă natura în diferitele sale manifestări.
Aplicarea calculelor statistice la datele empirice, oferite de observarea
fenomenului, permite desprinderea de legităţi statistice.

-Măsurarea incertitudinii concluziilor inductive. De la un timp însă, gîndirea


statistică tinde să se preocupe mai puţin de măsurarea incertitudinii şi mai mult de
determinarea riscului de eroare şi a pierderilor implicate de orice decizie întemeiată
pe o informaţie care, prin natura sa, nu poate fi exhaustivă

Fenomenele sunt în interconexiune unele cu altele, în sensul că se generează


şi se influenţează reciproc. Acest fapt conduce la noţiunea de cauzalitate care
exprimă interacţiunea dintre cauză şi efect astfel încât întotdeauna cauza să
preceadă efectul. Desfăşurarea fenomenelor constă astfel într-un şir neîntrerupt de
momente, într-o succesiune cauză-efect, efectul fiind la rîndul lui cauză pentru un
alt efect ş.a.m.d. Astfel se formează un lanţ cauzal. Nici un fenomen nu se abate de
la acest principiu care poartă numele de principiul cauzalităţii.

Cunoaşterea desfăşurării evenimentelor este asigurată de cunoaşterea legilor


care guvernează fenomenul şi a ansamblului de condiţii în care se desfăşoară
acesta. Deci legea este un element primordial în cunoaşterea fenomenelor
deoarece exprimă raporturile esenţiale, necesare, generale, relativ stabile şi
repetabile ale fenomenelor şi ale desfăşurării lor.

Putem deosebi două mari categorii de legi:

- legi fizice, care se aplică fenomenelor şi proceselor individuale luate în


parte (ex. legea atracţiei universale, legile I, II, III ale dinamicii etc.) şi

- legi statistice, care se aplică numai fenomenelor de masă, ansamblurilor de


obiecte (ex. legea gazelor perfecte, legea dezintegrării radioactive, etc.) şi
care exprimă anumite caracteristici ale ansamblului considerat.

Legile fizice permit cunoaşterea perfectă a desfăşurării viitoare a


fenomenelor pe baza cunoaşterii la momentul iniţial a unor mărimi.

Legile statistice permit cunoaşterea desfăşurării viitoare a fenomenelor doar


în termeni probabilistici (probabilităţi, valori medii, erori statistice etc.).

Particularitatea esenţială a legilor statistice izvorâtă din faptul că ele


acţionează în fenomenele de masă, unde întregul este determinat de unitatea
părţilor componente, o constituie exprimarea comportării ansamblului de unităţi
omogene şi nu a fiecărei unităţi în parte.

De aici şi principiul verificat deseori în practică: legea statistică poate fi


evidenţiată dacă şi numai dacă este considerat şi supus observării un număr mare
sau suficient de mare de unităţi elementare ale ansamblului considerat.

Noţiuni elementare

Investigarea statistică presupune, prin definiţie, considerarea fenomenelor în


multiplicitatea şi variabilitatea lor. Un ansamblu de fenomene formează un
fenomen de masă, sau, ceea ce numim populaţie statistică, în măsura în care
elementele componente (indivizi) sunt de aceaşi natură, adică au toate o proprietate
comună şi se deosebesc unele de altele în raport cu aspectele sau valorile
caracteristice luate în studiu. Populaţia cu care lucrează statistica trebuie să fie
global omogenă - să includă doar elementele similare, aparţinînd de aceeaşi
"categorie" şi intern structurată - elementele ei să poată fi ordonate potrivit unui
sistem de clasificare.
Denumirea de "populaţie" s-a păstrat din timpurile în care statistica se
ocupa cu precădere de populaţii în sensul propriu al cuvîntului. O populaţie poate
fi împăţită în subpopulaţii sau populaţii parţiale, care sunt : clase, grupe şi
eşantioane.

O clasă este un subansamblu de elemente ale unei populaţii care conţin o


variabliă determinată de aceeaşi măsură.

Un grup este un subansamblu de elemente ale unei populaţii care se distinge


printr-o manieră de tratare comună.

Un eşantion este un subansamblu de elemente ale unei populaţii ales la


întâmplare. Se apelează la acest gen de populaţie parţială atunci când populaţia în
studiu este prea mare pentru a fi tratată în ansamblul ei. Studiul asupra eşantionului
va fi atribuit întregii populaţii.

Indivizii unei populaţii statistice sunt cercetaţi pentru una sau mai multe
caracteristici. Caracteristicile întâlnite se clasifică în caracteristici cantitative şi
calitative. Caracteristicile cantitative sunt cele care se a căror măsură au o
exprimare numerică (înălţime, greutate, lungimea unui râu etc.) şi se mai numesc
variabile statistice.

Caracteristicile calitative nu se măsoară numeric (culoare, sexul unei


persoane etc.). Ele nu reprezintă o măsură a unei entităţi. Dacă se convine să se
reprezinte unele din ele prin numere ataşate la categoriile ce le determină, nu este
vorba decât de o "codificare", procedeul nejustificând operaţiile aritmetice. Aceste
caracteristici se mai numesc atribute.

Caracteristicile cantitative pot fi discrete sau continue.

Variabilele discrete sunt cele care pot lua un număr finit de valori distincte
(întregi, fracţionare).

Variabilele continue sunt cele care pot lua orice valoare dintr-un anumit
interval (nivelul unui râu etc.). Totuşi, în practică nu se întâlneşte o informaţie
privind adâncimea unui râu de forma: 1m, 3 cm, 17 microni. Acest lucru nu se va
întîmpla fie că precizia aparatelor cu care efectuăm măsurătorile este limitată, fie
că o precizie exagerată nu este întotdeauna folositoare pentru ceea ce urmărim în
investigaţie. Astfel, măsurătorile sau datele de observaţie se grupează în cadrul
unei anumite unităţi şi deci din punct de vedere practic se lucrează cu forma
discretă chiar dacă variabilele sunt de tip continuu.

Cercetarea statistică a unei colectivităţi poate fi:

- exhaustivă (totală), când fiecare individ este analizat, de exemplu în cazul


recensămintelor;

- parţială (selectivă), când sunt examinaţi numai anumiţi indivizi, aleşi


aleator. Ea este cea mai frecvent folosită, în majoritatea cazurilor fiind şi
singura posibilă.

Partea examinată din colectivitate se numeşte selecţie sau. eşantion.


Numărul indivizilor examinaţi se numeşte volumul selecţiei.

Analiza seriilor statistice

Evaluarea anumitor indicatori (parametri) statistici implică stabilirea


caracteristicilor (proprietăţilor) principale ale seriilor statistice.

Variabilitatea termenilor unei serii statistice este determinată de faptul că


fenomenul pe care îl reprezintă nu este univoc determinat, ci apare ca un rezultat al
acţiunii combinate a mai multor cauze (permanente sau întâmplătoare). Cu cât
acţiunea cauzelor întâmplătoare este mai mare, cu atât variabilitatea este mai mare
şi gradul de omogenitate mai mic.

Omogenitatea presupune o variaţie minimă între termeni. Dacă în urma


analizei se constată că o serie nu prezintă omogenitate, înseamnă că în acest caz
colectivitatea este formată din mai multe tipuri calitative şi seria trebuie
descompusă în subserii componente.

Independenţa termenilor unei serii provine din faptul că fiecare valoare


individuală reprezintă un element distinct şi obiectiv al unei populaţii statistice.
Termenii ce aparţin aceleiaşi colectivităţi se supun aceloraşi legi care se manifestă
sub formă de tendinţă.

Concentrarea/împrăştierea (dispersia) către/faţă de un una sau mai multe


valori ale seriei apare ca rezultat al intensităţii unui efect produs de cauze esenţiale
şi întâmplătoare. Acest lucru determină fercvenţele diferite de apariţie a diferitelor
valori din serie. Dacă intensitatea factorilor este uniformă, frecvenţele de apariţie
sunt apropiate. În caz contrar, frecvenţele de apariţie se concentrează fie la un
singur capăt al seriei, fie către o valoare centrală.

Repartiţii de frecvenţe

Datele statistice în stare brută reprezintă o masă dezordonată de materiale.


Prima problemă este aceea de a face o asemenea grupare a datelor cu ajutorul
căreia să se poată aprecia valoarea lor în legătură cu problema propusă, să se poată
înlesni comparaţia cu alte date de acelaşi gen şi să se poată obţine posibilitatea unei
analize ulterioare. Înainte ca materialul statistic să fie supus analizei ulterioare şi
generalizărilor care vor permite să se facă anumite deducţii, el trebuie să capete o
anumită formă şi o structură clară. Cu alte cuvinte în cadrul analizei datelor
statistice trebuie să se ia în considerare atât valorile individuale cât şi frecvenţele
de apariţie ale acestora.

În urma observării caracteristicii cantitative X în n probe se obţin


următoarele date primare:

x1, x2,..., xn (1)

Gruparea datelor se face în funcţie de tipul caracteristicii X. Astfel, dacă X


este o variabilă discretă ce poate lua valorile distincte v1, v2 ,..., vn , atunci în locul
datelor iniţiale se va reţine repartiţia empirică:

 v1.v2 ...vm 
 
 n1.n2 ...nm  (2)

Unde ni, (i=1, m) reprezintă frecvenţa apariţiei (numărul de apariţii) valorii


vi, iar n reprezintă numărul valorilor din şirul iniţial (1) şi se numeşte frecvenţă
absolută a valorii v. Valoare m reprezintă numărul de clase.

Raportul fj =nj/n dintre frecvenţa absolută şi numărul total de probe se


numeşte frecvenţă relativă. Se observă că
f1 + f2 +…+ fm =1 întrucât n1 +n2 + ... +nm = n.

Frecvenţele relative, numite impropriu şi probabilităţi de apariţie, stau la


baza calculării densităţii de repartiţie a fercvenţelor şi a indicatorilor care exprimă
gradul de concentrare. De asemenea permit compararea a două repartiţii construite
pe aceeaşi variabilă, care diferă numai prin numărul unităţilor pe grupe.

Dacă X este o variabilă continuă care poate lua valori într-un interval [a,b]
atunci acest interval este împărţit în m subintervale [aj, aj+1], j=1, m , cu a1 = a şi
am+1 = b. Pentru fiecare din aceste subintervale se determină numărul n al valorilor
din şirul (1) care se află în acest interval numit frecvenţă absolută a subintervalului.

Mărimea intervalului va fi dată de formula:

xmax  xmin
i
m
Reprezentarea grafică a repartiţiilor statistice

Există mai multe tipuri de reprezentări grafice a datelor statistice. Dintre


acestea prezentăm histograma, poligonul frecvenţelor şi graficul frecvenţelor
cumulate.

Histograma este o figură într-un sistem de coordonate rectangualre care


reprezintă distribuţia empirică prin dreptunghiuri. Bazele acestor dreptunghiuri,
construite pe axa absciselor, reprezintă subintervalele folosite în centralizarea
datelor. Înălţimea hj a dreptunghiului cu baza (aj, aj+1) este proporţională cu
raportul dintre frecvenţa relativă a intervalului şi lungimea sa:

fj
hj  C
a j 1  a j
constanta C fiind un factor de scară. În cazul când subintervalele grupării au
lungimi egale, înălţimea hj va fi proporţională cu frecvenţa relativă, deci hj =C*fj .

S-ar putea să vă placă și