Sunteți pe pagina 1din 36

Capitolul I

STATISTICA – INSTRUMENT DE CUNOAŞTERE ŞI DIRIJARE A PROCESELOR


BIOLOGICE
1.1. Momente principale din evoluția statisticii
Ca domeniu de activitate, statistica a apărut din nevoia socială reală de a cunoaște în expresie
numerică diferite fenomene şi procese ale activității umane, începuturile activității statistice se identifică
în cele mai vechi forme de organizare ale societăţii, în evoluția sa, statistica s-a îmbogățit continuu odată
cu progresul științific şi tehnic general, cu realizările celorlalte științe, transformându-se din ce în ce mai
mult într-o disciplină de graniță.
Ca domeniu de activitate, ca metodă sau ca știință statistica a ajuns la stadiul actual de dezvoltare,
parcurgând diverse etape.
Prima etapă coincide cu apariția primelor forme de evidentă. La primele formațiuni statale se
consemnează forme incipiente de evidentă a terenurilor, a numărului şi mișcării naturale a populației, a
averilor etc., precum în China, Egipt, Grecia. In Imperiul roman se efectuau înregistrări periodice (census)
ale populației, se întocmeau registre fiscale, vamale, cadastrale etc.
O altă etapă în evoluția statisticii reprezintă delimitarea evidenței statistice de evidenta contabilă.
Evidențele statistice, chiar dacă se rezumau la simple consemnări de fapte, ofereau datele necesare pentru
informarea organismelor statului, referitoare la aspectele fiscale, militare şi administrative.
Etapa descriptivă apare odată cu dezvoltarea rapidă a vechilor activități, cu apariția altora noi, cu
extinderea relațiilor comerciale şi culturale şi corespunde trecerii de la ”simple consemnări de fapte” la
analiza comparativă a datelor, la ”descrierea faptelor” în interacțiune. Curentul "descrierea statului" (sec.
XII-XVIU) a atins apogeul în perioada când în Germania s-a format o adevărată școală. Reprezentanții de
seamă ai acestei școli, Herman Conrig, Martin Smeitzel, Gotffried Achewald etc., au introdus pentru
prima dată denumirea de statistică (”status” – situația sau starea socială), au dezvoltat atât mijloacele de
investigare a fenomenelor sociale şi economice, cât şi mijloacele de informare a organismelor statale
punând accentul pe determinările numerice.
Etapa aritmeticii politice ține de perioada când în Anglia apare o statistică deosebită, cunoscută
sub numele de ”aritmetică politică”. Aceasta se ocupa cu analiza, prin procedee matematice de prelucrare
a datelor culese, cu stabilirea regularităților şi chiar cu formularea previziunilor. Astfel, John Grăunţ a
scos în evidentă legități ale populației şi fenomenelor demografice; Wiliam Petty (părintele economiei
politice moderne) a utilizat metode cantitative de studiere a fenomenelor economice şi sociale; Edmund
Halley s-a preocupat de estimarea numărului populației, a elaborat prima tabelă de mortalitate şi a
introdus conceptul de durată probabilă de viață.
Etapa probabilistică apare în disputa dintre curentul descriptiv şi cel al aritmeticii politice şi în
care a triumfat ultimul. Odată cu dezvoltarea opticii numerice, denumirea de aritmetică politică se
substituie cu denumirea de statistică şi capătă o nouă dimensiune prin introducerea calculelor probabiliste,
în acest context menționăm formularea legii numerelor mari, desprinderea altor regularități şi legități
statistice. Dintre reprezentanții de seamă ai acestei faze amintim: J. Bernoulli, P.S. Laplace, K.F. Gauss,
S.D. Poisson, A. Quetelet, A. Ciuprov, D.P. Joravski etc.
Etapa statisticii moderne apare către sfârşitul secolului trecut. Un rol deosebit în această etapă 1-a
avut înființarea oficiilor naționale şi internaţionale de statistică, organizarea congreselor internaţionale de
statistică, apariția primelor reviste de specialitate, introducerea statisticii în învățământul universitar şi cel
mediu, în această etapă F. Galton, K. Pearson, M.G. Kendall, F .Y. Edgeworth, A.L. Bowley, G.U. Yule,
C.E. Spearmen, R.A. Fisher etc. au fundamentat teoria şi practica corelației statistice, a analizei factoriale,
a experimentelor statistice. S-au abordat în mod deosebit problemele de repartiție, specificație şi
estimație.
În evoluția sa istorică, statistica a avut diferite accepțiuni: unele califică statistica drept știință, iar
altele o admit numai ca metodă. Realizările obţinute în etapele (fazele) anterioare conduc la accepțiunea
de astăzi potrivit căreia statistica este o disciplină științifică care are însușirea de a fi în acelaşi timp şi
știință, şi metodă utilizată în multe științe.
În prezenta lucrare accentul este pus pe conceperea sistemică a activității statistice, pe utilizarea
statisticii pentru cunoaștere şi conducere.
Optica informațională a gândirii statisticii are la bază teoria entropiei Iui Shannon, teoria energiei
informaționale a lui Onicescu, teoria corelației informaționale etc. Ea oferă cercetării statistice un caracter
de sistem. Viziunea sistemică a cercetării statistice este astăzi, mai mult ca oricând, solicitată de
complexitatea extrem de mare a manifestării fenomenelor biologice, economice şi sociale. Această
complexitate în ultimă instanță este rezultatul acțiunii directe şi/sau indirecte a unor diverși factori de
influență, de natură obiectivă şi/sau subiectivă, care imprimă o variabilitate (în timp, spațiu şi din punct
de vedere organizatoric etc.) ce trebuie explicată. Sensul relațiilor de cauzalitate este reversibil,
contradictoriu şi provoacă „reacții în lanț".
In concepția actuală a științei, statistica poate fi considerată ca o disciplină de graniță care prin
metodele sale asigură cercetărilor științifice un caracter interdisciplinar în cadrul căreia analiza de natură
statistică ocupă (după cum se observă şi în fig.1.1) un loc centrul.

Figura 1.1. Locul statisticii în abordarea interdisciplinară a fenomenelor complexe

Statistica privită ca sistem ilustrează, în cel mai pregnant mod caracterul trivalent al cunoașterii
științifice, în sensul că ea integrează deopotrivă:
– componentă factuală, prin care obiectul investigației este delimitat ca fiind un domeniu
concret al realității;
– o componentă conceptuală, definită prin grefarea sa pe construcția științei factuale căreia
îi servește ca instrument (de exemplu, statistica biologică avansează ipoteze şi modelează
dependențele stocastice dintre: fenomenele şi procesele biologice, în concordanță cu
paradigmele teoretice ale domeniului; statistica socială operează cu sistemul de noțiuni şi
concepte specifice sociologiei etc.);
– logico-formală, datorată instrumentalizării şi utilizării tehnicilor statisticii descriptive,
statisticii inferențiale etc. pentru verificarea ipotezelor formulate în termenii teoriei ce i-a
servit drept componentă conceptuală.
1.2. Obiect şi metodă în ecostatistică
Cuvântul statistică are o semnificație multiplă pentru cercetători, specialiști, studenți şi populație
în general. Astfel, acest cuvânt poate să ducă cu gândul la indicele prețurilor de consum, la cifra medie de
afaceri a unor firme, la rata șomajului, la datele publicate într-o revistă sau într-un buletin oficial, ori,
evident, la o disciplină de studiu din cadrul învățământului superior de specialitate.
Statistica este, așadar, o activitate practică, dar şi mulțimea datelor obţinute prin această
activitate, publicațiile de date ale diferitelor organisme de specialitate, metodologia statistică, o ramură a
științei şi cunoașterii ori o disciplină științifică şi de învățământ.
Obiectul de studiu al ecostatisticii îl constituie fenomenele şi procesele ecologice care întrunesc
următoarele particularități: se produc într-un număr mare de cazuri (sunt fenomene de masă); variază de
la un element la altul, de la un caz la altul; sunt forme individuale de manifestare în timp, în spațiu şi ca
formă organizatorică, precum şi interdependența dintre acestea şi condițiile în care se produc.
Urmărind etapele oricărui proces de cunoaștere, pentru rezolvarea problemelor care fac obiectul
său de studiu, ecostatistica, ca orice știință, şi-a elaborat procedee şi metode speciale de cercetare, cum
sunt cele ale observării de masă, ale centralizării şi grupării, procedee şi modele de analiză şi interpretare
statistică. Putem spune că metoda statisticii este constituită din „totalitatea operațiilor, tehnicilor,
procedeelor şi metodelor de investigare statistică a fenomenelor ce aparțin unor procese de tip stochastic”.
Prin abordarea statistică a fenomenelor de masă se realizează trecerea de la datele individuale
numeroase, amorfe, la un sistem de indicatori specifici unui ansamblu. Prin urmare, obiectul statisticii îl
reprezintă studiul cantitativ al fenomenelor de masă în scopul cunoașterii legităților lor de manifestare la
nivelul întregului ansamblu. Pentru atingerea acestui obiectiv, statistica apelează atât la metodele generale
de abordare, cât şi la numeroase metode specifice pe care ea însăși le-a elaborat.
Complexitatea şi amploarea cercetării ecostatistice fac imperios necesară perfecționarea continuă
a metodelor de observare, prelucrare, analiză, în acelaşi timp, dezvoltarea metodelor statisticii este strâns
legată de progresele înregistrate de teoria probabilităților şi statistică matematică, precum şi de cele din
domeniul informaticii biologice.
Ecostatistica este știința care studiază aspectele cantitative ale determinărilor calitative ale
fenomenelor ecologice, fenomene care sunt supuse acțiunii legilor statistice ce se manifestă în condiții
concrete, variabile în timp şi spațiu.
Rolul statisticii în ecologie se caracterizează prin:
- cunoașterea situației problematice, statistica contribuind la colectarea de date; clasificarea lor;
prelucrarea sub forma de serii, tabele, grafice, estimarea parametrilor; analiza rezultatelor;
- evaluarea variantelor de decizie: modelare statistică; testarea modulelor; formularea de
ipoteze; verificarea ipotezelor şi previziunea statistică;
- formularea deciziei sau alegerea variantei optime: analiza comparativă asupra variantelor;
precizarea variantei de decizie prin măsuri cantitative;
- controlul aplicării deciziei şi verificarea rezultatelor.

1.3. Noțiuni fundamentale ale statisticii


În studiu cantitativ al fenomenelor de masă, statistica folosește un număr mare de noțiuni şi
concepte. Dintre acestea, unele au caracter general şi formează vocabularul de bază al statisticii, altele au
caracter specific.
Colectivitatea statistică, denumită şi populație statistică, este o noțiune fundamentală a statisticii
şi reprezintă totalitatea elementelor de aceeași natură, care au trăsături esențiale comune, ale cărei unități
sunt delimitate în timp şi spațiu formând o colectivitate statistică şi care sunt supuse unui studiu statistic.
Colectivitatea statistică se mai întâlnește şi sub denumirea de populație statistică sau, pur şi
simplu, populație, şi desemnează totalitatea elementelor de aceeași natură care sunt supuse studiului
statistic. Aceasta înseamnă că o mulțime de elemente formează o colectivitate statistică numai dacă au
aceeași natură, sunt asemănătoare sau sunt omogene din punctul de vedere al anumitor criterii.
Colectivitatea statistică se prezintă într-o varietate de forme, motiv pentru care una dintre
problemele esențiale ale unei cercetări statistice o reprezintă delimitarea colectivității statistice în spațiu şi
timp, din punctul de vedere al conținutului şi al formei de organizare. În funcție de natura unităților,
colectivitățile statistice sunt alcătuite dintr-un ansamblu de indivizi, obiecte, evenimente, factori
bioecologici, trăsături morfofiziologice, componenți biochimici etc. Ele pot fi privite static (când exprimă
o stare, un nivel, la un moment dat) sau dinamic (care caracterizează un proces sau o devenire în timp).
Cu cât o colectivitate este mai numeroasă, cu atât devine mai dificilă cercetarea tuturor
elementelor sale. O astfel de cercetare poate fi consumatoare de timp şi costisitoare. Soluţia poate fi, în
acest caz, extragerea unei subcolectivități din colectivitatea generală (numită şi colectivitate parțială,
eșantion sau colectivitate de selecție).
Eșantionul reprezintă un subset de elemente selectate dintr-o colectivitate statistică.
În felul acesta, se vor estima parametrii colectivității totale pe baza rezultatelor obţinute în
colectivitatea de selecție, iar ceea ce a font determinat ca fiind tipic, esențial şi caracteristic în eșantion, se
presupune că ar fi fost găsit, dacă s-ar fi cercetat colectivitatea generală. Soliditatea acestei presupuneri
depinde de modul cum a fost extras eșantionul, iar de acuratețea acestui proces depinde succesul
demersului statistic. Reprezentativitatea eșantionului este, așadar, aspectul crucial al oricărui proces de
cercetare pe bază de sondaj stațiile.
Un alt concept de bază al statisticii îl reprezintă unitatea statistică.
Unitatea statistică reprezintă fiecare element, manifestare sau concretizarea colectivității
statistice şi care este purtătorul unui nivel al locării trasaturii supuse observării şi cercetării statistice, în
funcție de conținutul unității, acestea pot fi:
• simple, fiecare element constituent;
• complexe, una sau mai multe unități simple (exemplu: familia).
Unitățile colectivității statistice existente la un moment dat sunt unități ale colectivități statice.
Unitățile colectivităților dinamice desemnează evenimente, procese sau fluxuri şi se produc în decursul
timpului, se referă la perioada sau intervalul de timp în care se produc evenimente statistice.
Caracteristica statistică reprezintă trăsătura, proprietatea, însușirea comună tuturor unităților unei
colectivități, care variază ca nivel, variantă sau valoare, de la o unitate a colectivității la alta. Este
denumită si variabilă statistică ori variabilă aliatoare, deoarece are proprietatea de a-şi modifica valoarea
în timp şi spațiu, de la o unitatea la alta. Exemple de caracteristici statistice pot fi: vârsta, greutatea, sexul,
culoarea ochilor, temperatura, rata de reproducere, conținutul chimic etc.
Caracteristicile (variabilele) statistice pot fi clasificate în funcție de diferite criterii.
Astfel, deosebim caracteristici de timp (acelea care desemnează apartenența la un moment sau
interval de timp), caracteristici de spațiu (care exprimă teritoriul căreia îi aparține) şi caracteristici
atributive. Caracteristicile atributive pot fi numerice (cantitative) şi nenumerice (calitative).
O caracteristică ale cărei modalități de manifestare sunt consemnate pentru fiecare unitate,
nenumeric, prin ”cuvinte” este o caracteristică (variabilă) nenumerică sau calitativă.
Caracteristica măsurabilă se numește caracteristică (variabilă) numerică, în acest caz fiecărei
unități îi corespunde un număr care exprimă măsura (valoarea) caracteristicii urmărite. Exemple de astfel
de caracteristici: vârsta – în ani, zile, ore; rata de reproducere -în unități valorice; conținut biochimic –
unități convenționale; temperatura – °C; efectivul numeric – numărul de indivizi etc.
În funcție de variația manifestată de caracteristici, acestea pot fi: cu variație continuă sau cu
variație discretă (discontinuă).
Variabila discretă ia numai valori întregi (numărul indivizilor dintr-o populaţie). Variabila
continuă poate lua orice valoare într-un interval finit sau infinit. Exemple: temperatura aerului într-o zonă
cercetată, înălțimea, greutatea etc. Valorile unei caracteristici numerice (cantitative) se stabilesc prin
numărare, măsurare şi prin calcul.
După un alt criteriu de clasificare a caracteristicilor (în funcție de numărul variantelor înregistrate
la unitățile colectivității) deosebim caracteristici alternative şi caracteristici nealternative. Caracteristicile
alternative prezintă numai două valori individuale complementare. Exemple: sexul (mascul sau femelă),
indivizii (fertili sau nefertili) etc. Prin formularea dihotomică a întrebării pentru orice caracteristică
alternativă, valoarea individuală se exprimă prin ”DA” sau ”NU” codificate prin ”l” sau ”O”.
Caracteristicile nealternative conțin valori individuale diferite la nivelul unităților colectivității.
În funcție de modul în care se obțin variabilele (caracteristicile) în cercetarea statistică, acestea
pot fi primare şi derivate. Variabilele primare se înregistrează direct la unitățile colectivității prin
măsurare sau numărare. Variabilele derivate sunt acele variabile, ale căror valori individuale se obțin
printr-un anumit algoritm de calcul.
În cercetarea statistică, în special în teoria probabilităților şi a statistici matematice, se întâlnește
frecvent noțiunea de variabilă aleatorie. Aceasta desemnează variabila ale cărei valori aprioric
necunoscute apar în împrejurări întâmplătoare cu probabilități determinate.
Variabila aleatorie este un tip de variabilă statistică deosebită, deoarece comportă nu numai un
ansamblu de valori posibile, ci şi o funcție bine definită care indică probabilitatea de apariție a fiecăreia
dintre valorile posibile. O variabilă aleatorie poate fi discretă sau continuă.
O sinteza tipurilor de variabile studiate într-o populație statistică (eșantion), potrivit scopului
cercetării, este prezentată în figura l .2.

Figura 1.2. Tipuri de variabile statistice.


Frecvenţa. Dacă o anumită variantă se înregistrează de mai multe ori într-o colectivitate de n
elemente, atunci numărul de apariții ale variantei ”i” se notează cu n i sau fi şi se numește frecvență.
Frecvența poate fi absolută sau relativă.
Analiza oricărei repartiții statistice (empirice sau teoretice) implică utilizarea conceptului de
parametru statistic. Parametrul statistic (valoare tipică a repartiției) desemnează o valoare reprezentativă
obținută dintr-o operație numerică (de calcul, agregare etc.) aplicată unei repartiții statistice. Exemple de
parametri statistici: mediile, dispersiile etc. în funcție de conținutul lor, parametrii statistici sunt:
parametri de nivel (media, mediana, modul etc.), parametri de variație (dispersia, abaterea medie
pătratică, coeficientul de variație etc.); parametri de asimetrie şi boltire (coeficienții lui Pearson şi ai lui
Fisher etc.).
În analiza statistică au caracter de parametri şi alte valori sintetice: indicii de concentrare,
coeficienții de corelație etc.
Un alt concept al vocabularului de bază al statisticii este conceptul de date statistice.
Dacă matematica operează cu numere abstracte, datele statistice sunt mărimi concrete obţinute
din experimente, observații, numărare, măsurare sau din calcule, în mod general, prin date statistice se
înțelege o caracterizare numerică, cantitativă, obținută de statistică, despre unitățile colectivității analizate
prin numărare, măsurare sau calcul statistic. Datele statistice cuprind următoarele elemente: noțiunea,
care precizează fenomenul sau procesul la care se referă, identificarea (de timp, de spațiu, organizatorică
etc.) şi valoarea numerică.
Datele statistice pot fi absolute sau relative, primare sau derivate, publicate sau stocate în baze
sau bănci de date. Indiferent de forma în care se obțin, datele statistice sunt purtătoarele unor informații
statistice.
Informația statistică reprezintă conținutul specific (semnificația), mesajul datelor. Pentru
înțelegerea legităților de manifestare ale fenomenelor şi proceselor, informația statistică trebuie
structurată în funcție de conținutul şi organizarea lor.
Datele statistice, cu ajutorul cărora se cercetează un fenomen sau proces biologic sau ecologic sub
raportul structurii, interdependențelor, al modificării lor în timp sau în spațiu, se numesc indicatori
statistici.
Indicatorul statistic reprezintă expresia numerică a unor fenomene, procese, activități sau
categorii biologice, ecologice, definite în timp, spațiu şi structură organizatorică.
Conceptul de indicator statistic este strâns legat de conceptul de model statistic. Modelul statistic
exprimă, sub forma unei construcții logice sau matematice (funcție, ecuație sau sistem de ecuații și/sau
inecuații etc.), trăsăturile, momentele, corelațiile esențiale din manifestările reale ale fenomenelor şi
proceselor.
1.4. Ecostatistică descriptivă şi ecostatistica inferențială
În funcție de obiectivul urmărit, gradul de generalitate al condițiilor şi de mijloacele utilizate,
cercetarea ecostatistica presupune două faze: o fază descriptivă (exploratorie) şi o fază inferențială
(decizională), ambele faze având scop subordonat cunoașterii.
Scopul principal şi specific ecostatisticii descriptive este acela do a sintetiza şi structura, într-o
manieră cât mai directă şi mai intuitivă, datele de observație şi informația conținută în acestea. Deci,
utilizează de regulă, tabele, grafice, indicatori numerici etc.
Atunci când observarea s-a făcut prin cercetare selectivă (eșantionare), statisticii descriptive îi
revine rolul de a pune în evidență proprietățile eșantionului şi, pe această bază, de a sugera diverse ipoteze
cu privire la o posibilă extindere a concluziilor la nivelul întregii populaţii. Statistica descriptivă nu-şi
asumă, însă, şi rolul de n verifica „valoarea de adevăr” a acestei ipoteze. Un asemenea studiu reclamă
explicit apelul la modelele probabilistice şi, în consecință, constituie obiectul fazei inferențiale a cercetării
statistice.
Ecostatistica inferențială. Dacă ecostatistica descriptivă, din punctul de vedere menționat
anterior, mai este denumită de unii autori „statistica fără modele aleatorii”, ecostatisticii inferențiale îi
revine rolul de a extinde rezultatele obţinute în baza datelor din eșantion asupra nivelului populației
generale şi de a confirma sau invalida ipotezele emise apriori sau formulate după faza exploratorie.
Metodologia ecostatisticii inferențiale se bazează pe teoria probabilităților și posedă caracteristici
specifice, cum ar fi: caracterul aleatoriu al eșantionării; generalizarea concluziilor de la eșantion la
populația statistica totală prin marje specifice de incertitudine; recunoașterea explicita a nesiguranței
predicțiilor, deoarece incertitudinea implicată este măsurată în mod obiectiv şi este supusă unui control
statistic în limite cât mai strânse cu putință.
Ecostatistica inferențială reprezintă un important instrument de analiză utilizat în procesul de
luare a deciziilor. Premisa de baza a statisticii inferențiale este foarte simplă. Ea face trecerea de la
statistica descriptivă a unui eșantion (subpopulatei) la descrierea întregii mase care caracterizează
fenomenul respectiv (populație). Cu alte cuvinte, statistica inferențială presupune metode pentru inferența
asupra populației generale având la bază informații ale eșantionului desprins din colectivitatea generală
(Figura 1.3).

Figura 1.3. Procesul inferenței ecostatistice


Una dintre utilizările imediate ale statisticii inferenţiale este previziunea biologică.
Considerentele privind raportul statistică descriptivă-statistică inferențiala prezentat anterior sunt
reflectate şi evidențiate şi în Figura 1.4.
Figurii 1.4. Raportul descriptiv-inferențial în cercetarea statistică
1.5. Variabilitatea biologică şi ecostatistica
Variabilitatea biologică este proprietatea fiinţelor vii de a-şi schimba (sub influența mediului şi a
eredității, a factorilor externi şi interni) însușirile lor morfologice, fiziologice, biochimice, ecologice, de a
se deosebi unele de altele
Datorită variabilității, în natură nu există două ființe sau două organe perfect identice.
Aşa cum am menționat, procedeele statistice dau cercetătorului posibilitatea de a preciza
variabilitatea existentă în cadrul unei colectivități. Măsura acestei variabilități dă indicații cu consecințe
practice, în special în domeniul biologiei, unde se spune că „variabilitatea este singura realitate, media
fiind o ficțiune”, în fata proceselor biologice, atât de complexe, cum s-ar putea cunoaște valorile
normalului şi limitele lui de variație? Fiind dat un anumit experiment, cu o dispersie mare a rezultatelor,
cum se poate trage o concluzie justă în aprecierea fenomenului cercetat? Cum putem şti, dacă am efectuat
un număr suficient de experienţe pentru a trage o concluzie valabilă? Când putem spune, suficient de
exact, că o diferenţa între două măsurători este semnificativă?
Variabilitatea este un concept-cheie în statistică. Indivizii în aparență asemănători posedă, de fapt,
numeroase trăsături distinctive. Astfel de diferențe, mai mult sau mai puțin semnificative, pot fi înre-
gistrate prin observații sau măsurători. Această particularitate se observă din faptul că fenomenele de
masă sunt rezultatul acțiunii unui număr mare de factori de influenta cu esențialitate şi natură diferită,
asociați cu sensuri, direcții şi intensități multiple. Acţiunile unor factori de influență se pot compensa
reciproc, deoarece ei se manifestă în sensuri diferite.
Fără sprijinul statisticii matematice aceste întrebări nu şi-ar găsi niciodată răspunsul. Mai mult,
interpretarea simplistă a rezultatelor este neconcludentă, empirică, putând duce la erori grave de
interpretare. Indiferent de semnificația care se dă termenului de statistică, obiectul de studiu al acesteia îl
constituie fenomenele de masă, care sunt, totodată, şi fenomene complexe, atipice, rezultate din acțiunea
combinată şi repetată a unui număr mare de factori. Definindu-se ca ştiinţa fenomenelor de masă,
statistica privilegiază raționamente de tip inductiv. Ea utilizează detaliul individual doar pentru a propune
caracterizări de ansamblu. O plastică prezentare a acestui tip de demers a efectuat-o Gupta (1963):
„Metodele statistice sunt inductive prin natura lor, deoarece generalizările rezultă din observații
individuale, în plus, generalizările deduse dintr-o investigație statistică sunt adevărate doar în medie. Ele
pun în evidentă numai comportamentul tipic al tuturor obiectelor luate în studiu, dar nu descriu
comportamentul elementelor luate separat, deoarece există o stabilitate mai mare în colectivitate decât
în individ”.
Fenomenele de masă, prin definiție, se caracterizează prin mai multe elemente specifice astfel:
- pentru ca, din punct de vedere statistic, esența lor să fie pusă în evidentă, este nevoie de un
număr mare de cazuri individuale;
- fenomenele de masă, prin definiție, se caracterizează prin variabilitate;
- fenomenele de masă sunt fenomene nedeterministe de tip stohastic, produse în condiții de
incertitudine;
- forma individuală de manifestare a fenomenelor de masă este diferită. Legitatea de manifestare a
acestor fenomene nu poate fi cunoscută şi verificată în fiecare caz în parte, ci numai la nivelul întregului
ansamblu de cazuri individuale. Conform lui W.E. Deming, statisticii îi este propriu faptul că, deși
acceptă variabilitatea ca pe un dat natural, nu încetează nici o clipă să studieze sistemul de cauze (legile
de probabilitate) care o generează, în scopul de a institui asupra lor un control cât mai strict. „În viața
reală nu există constantă veșnică. Rezultatele produse de un sistem constant de cauze variază şi, de fapt,
ele pot varia între limite largi sau înguste. Ele variază, dar pun în evidentă o caracteristică importantă
numită stabilitate. De ce aplicăm termenii de constanță şi stabilitate unui sistem de cauze ce generează
rezultate care variază? Deoarece o proporție identică a acestor rezultate ce variază continuă să cadă între
două limite bine stabilite, oră de oră, zi de zi, atâta timp sistemul constant de cauze continuă să opereze.
Deci, se comportă ca un sistem controlat de cauze, iar rezultatele lui pun în evidență stabilitatea, se spune
că acest proces este într-o stare de control statistic”;
- conceptul de fenomen de masă presupune luarea în considerare a raportului dintre necesitate şi
întâmplare, dintre legea statistică (stohastică) şi legea dinamică, dintre modelul stohastic şi modelul
determinist.
Legea stohastică nu poate fi cunoscută decât dacă se iau în studiu un număr mare de cazuri
individuale care sunt legate între ele datorită acțiunii diferite a acelorași factori de influență.
Spre deosebire de legile dinamice, legile statistice se manifestă sub formă de tendință şi sunt
valabile pentru un ansamblu de unități individuale, în esență, rolul statisticii este de a determina, pe baza
datelor empirice, informații cât mai precise asupra legii statistice de repartiție a formelor individuale ale
fenomenelor de masă care ne interesează.
Legile statistice, tendințe obiective de dezvoltare a fenomenelor de masă, necesită depistarea
tuturor cazurilor individuale, abstractizarea succesivă şi eliminarea a tot ceea ce este neesențial. Aceasta
înseamnă că statistica studiază fenomenele de masă din punct de vedere cantitativ şi le interpretează ca
fenomene probabile. Ele au un grad mare de variație de la o unitate la alta chiar dacă aparțin aceleiași
esențe. Prin urmare, în cercetarea statistică este necesar să se țină seama în mod obiectiv de principiile
teoriei probabilităților, de cerințele legii numerelor mari (formulată de J. Bernoulli în 1713). Această lege
a statisticii arată că într-un număr suficient de mare de cazuri individuale influențele factorilor se pot
compensa în așa fel încât să ajungă la o anumită valoare tipică pentru întreg ansamblul. O altă
particularitate a obiectului de studiu al statisticii este aceea că aceasta studiază fenomenele de masa din
punct de vedere cantitativ în condiţii specifice de timp, spaţiu şi organizare.
Capitolul II. CERCETAREA ECOSTATISTICĂ
Pentru satisfacerea necesității de informații, este necesar să se organizeze cercetări (investigații)
statistice. Prin cercetare statistică, în funcție de scopul urmărit, se culeg date care apoi se prelucrează în
mod corespunzător, pentru ca în final să se obțină, într-o formă statistică, informațiile necesare
desfășurării procesului de estimare si dirijare a proceselor biologice.
In sens larg, cercetarea statistica cuprinde totalitatea operaţiilor de culegere şi observare,
sistematizare şi prelucrare, stocare şi regăsire, analiză şi interpretare a informațiilor necesare pentru
cunoașterea şi conducerea proceselor ecologice.
Cercetarea statistică se desfășoară în câteva etape succesive. Organizarea şi desfășurarea
cercetării statistice este redată în Figura 2. l.

Figura 2.1. Organizarea şi desfășurarea cercetării statistice


Deși cercetarea statistică se desfășoară în aceste etape succesive, ea reprezintă un proces unitar
prin conținutul, scopul şi prin metodele utilizate, în cadrul cercetării statistice rolul cel mai important îi
revine analizei statistice care trebuie să asigure nu numai o interpretare științifică a rezultatelor cercetării,
dar, mai ales, obținerea unui material documentar real, prelucrat după metodele cele mai adecvate naturii
specifice fenomenelor de cercetare.

2.1. Observarea statistica (Culegerea datelor statistice)


Observarea este prima etapa a cercetării statistice. Ea constă în culegerea de date (informații)
după o anumită metodologie pentru toate unitățile colectivității cercetate.
Scopul observării este comun cu cel al cercetării statistice, în sensul cunoașterii situației existente,
modificărilor structurale şi în dinamică sau al interdependenței cu alte fenomene.
În procesul observării statistice trebuie să se ţină seama de anumite principii:
• datele culese să fie autentice, să reflecte realitatea;
• datele să se refere numai la caracteristicile esențiale, care corespund cel mai bine scopului
cercetării;
• culegerea de date trebuie să se realizeze în condiții obiective, fără preferințe din partea
cercetătorilor.
În general, cercetările ecologice sunt operațiuni de mare amploare şi ele trebuie pregătite cu multă
atenție şi competentă. De aceea, cercetarea statistică trebuie să se bazeze pe un plan stabilit în prealabil –
plan de observare statistică – în care să se precizeze atât măsurile organizatorice, cât şi problemele cu
caracter metodologic ce trebuie rezolvate în efectuarea concretă a cercetării.
Planul de observare statistică cuprinde:
• scopul observării – subordonat scopului general pentru care s-a organizat cercetarea;
• obiectul observării îl formează colectivitatea cercetată sau mulțimea unităților care se vor
înregistra împreună;
• unitatea de observare – definită ca element component al colectivităţii. Pot exista unităţi simple
(indivizi etc.) sau unităţi complexe (familie, echipă etc.);
• programul observării – constă în stabilirea caracteristicilor care trebuie s ă fie înregistrate,
modalitățile concrete de culegere a datelor şi încadrarea în timp şi spaţiu a activităţii de obținere a
informațiilor;
• formulare şi instrucțiuni de completare – se prezintă sub forma de fișe şi liste.
Formularele de înregistrare cuprind şi instrucțiuni de înregistrare. Astfel, timpul observării
vizează două aspecte: stabilirea timpului la care se referă datele înregistrate şi a duratei înregistrării:
• locul observării şi unitatea care raportează – în general, el coincide cu locul unde este amplasat
fenomenul înregistrat;
• probleme organizatorice – care asigură condiții cât mai bune pentru desfășurarea observării.

2.1.1. Surse de date statistice


În practică culegerea datelor se realizează prin:
- Observări totale (exhaustive), de exemplu rapoartele statistice şi recensămintele. Acestea
presupun înregistrarea caracteristicilor cuprinse în programul de cercetare la toate unitățile
(fără excepție) colectivității statistice.
- Observări parțiale. Acestea presupun înregistrarea după criterii bine stabilite a unui număr
mai redus de unități din colectivitatea generală.
- Observări curente. Acestea constau în înregistrarea sistematică, permanentă, pe măsură ce se
produc caracteristicile fenomenelor analizate la nivelul unităților colectivității (de exemplu,
înregistrarea evenimentelor ce țin de natalitate, mortalitate etc.).
- Observări periodice. În acest caz, înregistrarea datelor asupra unităților se efectuează la
intervale de timp bine stabilite.
- Observări directe. Acest tip de observare se realizează prin înregistrarea nemijlocită a datelor
de către cercetător în unitățile colectivității.
- Observări indirecte. Astfel de observări se întâlnesc atunci când înregistrarea datelor se
realizează pe baza unor surse care au consemnat anterior fenomenul studiat (de exemplu,
înregistrarea pe bază de documente).
Principalele metode de culegere a datelor sunt:
- Recensământul. Aceasta este cea mai veche metodă de observare statistică. Prin recensământ
(al populației, animalelor, mijloacelor fixe, pomilor fructiferi etc.) se culeg date de la toate
unitățile colectivității. Organizarea recensământului presupune rezolvarea unor probleme
(delicate prin complexitatea lor), cum ar fi: scopul observării; scopul colectării datelor; timpul
la care se referă datele; sfera de cuprindere; elaborarea de definiții, clasificări şi
nomenclatoare etc. Date fiind cheltuielile mari de materiale şi de timp pe care le implică
organizarea lor, recensămintele au un caracter periodic, în funcție de scopul cercetării.
- Rapoarte statistice. Acestea sunt observări totale, permanente, prin intermediul cărora se
culeg datele statistice referitoare la fenomene şi procese ecologice diferite din domeniile de
activitate ale instituțiilor de cercetări științifice. În acest caz este vorba de un nomenclator al
rapoartelor statistice pe care trebuie să le completeze fiecare cercetător științific. Există
rapoarte statistice referitoare la componența numerică şi specifică pe grupe de organisme în
diferite ecosisteme etc.
- Sondaje statistice, în cazul în care observările statistice nu pot fi organizate (din diferite
motive), se apelează la observări parțiale de tipul sondajelor statistice.
- Observarea părții principale (masivul principal sau panelul). Este o metodă operativă,
parțială, de culegere a datelor numai de la cele mai semnificative (masivul principal) unități
ale colectivității.
- Monografia. Aceasta este o metodă de observare aprofundată a fenomenelor şi proceselor ce
au loc în activitatea unui cercetător științific sau laborator științific.
În ultimul timp există tendința de utilizare pe scară largă a observărilor parțiale. Această orientare
este legată de necesitatea de cunoaștere rapidă (de culegere a datelor), de posibilitățile ample de aplicare
(cu costuri dintre cele mai reduse) etc.

2.2. Erori statistice şi controlul datelor statistice


Este cunoscut şi faptul că, de exemplu, aceeași substanță activă, experimental, prin aceeași
metodă, poate da rezultate diverse, nu numai în laboratoare diferite, ci chiar în acelaşi laborator. De aceea,
cunoașterea de către cercetător a factorilor care determină această variabilitate, precum şi a tipurilor de
erori ce pot să apară este o necesitate.
În general, variabilitatea rezultatelor unui experiment ecologic este determinată de următorii
factori:
1. Factori care ţin de organismul de experiență:
- Factori interni: greutate, sex, vârstă, rasă, soiul, hibrid, origine, sănătate.
- Factori externi: condiții de întreținere (alimentație, măsuri de protecție, temperatură ambiantă,
umiditatea), condiții sezoniere.
- Factori care ţin de individualitatea organismului, proprie fiecărui individ şi care caracterizează
reactivitatea individuală a acestuia la acțiunea unor factori anumiți.
2. Factori care ţin de mediul geografic şi climateric
Se pot obține rezultate diferite în diverse părți ale globului investigând aceeași probă şi urmând
chiar aceeași tehnică de lucru, organismul fiind o entitate biologică a cărui reactivitate individuală
depinde de mediul înconjurător, de factorii micro- şi microclimatici înconjurători.
3. Factori care ţin de tehnicile întrebuințate
Fiecare tehnică de lucru poate da un rezultat care poate fi chiar discordant cu cel obținut printr-o
altă tehnică, de aceea cele două rezultate nu pot fi obiectul unei comparații realizate științific. Dată fiind
multitudinea factorilor de eroare, cercetarea ecologică ar fi insuficientă sau neconcludentă, dacă în
experimentare nu s-ar ţine seama de anumite norme științifice. Aceste norme se referă, în primul rând, la
înlăturarea factorilor care determină variabilitatea răspunsurilor.
Menţionăm câteva măsuri importante:
- selecţia riguroasă a obiectului de studii;
- întocmirea loturilor dintr-un număr suficient de indivizi/plante/fenomene, siguri din punct de
vedere statistic (sănătoși, de vârstă apropiată, de aceeași gen etc.);
- asigurarea omogenității unui lot, precum şi a loturilor folosite într-o anumită experiența, prin
măsurile mai sus menționate înlăturându-se factorii de eroare ce depind de
organismul/fenomenul de experiență;
- determinarea comparativă prin folosirea standardelor sau a unor substanţe de referință, factori
decisivi care contribuie la înlăturarea unor erori eventuale ce ţin de tehnicile utilizate.
Existenta variabilități, cât şi volumul foarte mare de date cu care operează ecostatistica, ne
determină să admitem că între valoarea răspunsului ecologic, obţinut de cercetător în urma unui
experiment, şi valoarea reală poate exista o anumită diferență. Când datele obţinute de către cercetător se
abat de la valoarea reală, putem spune că au fost comise erori ce se datorează factorilor mai sus
menționați.
Erorile întâlnite frecvent în etapa de culegere a datelor se mai produc si la înregistrare, la
transmitere, la trecerea de pe un purtător pe altul, la codificare etc. Aceste erori apar datorită lipsei de
atenție a operatorului de interviu, neînțelegerii scopului observării şi al cercetării, interpretării greșite a
unor noțiuni etc.
Erorile de observare (înregistrare) pot apărea în procesul de culegere a datelor statistice şi se pot
datora, după cum s-a menționat anterior, obiectului observării, cercetătorului, mijloacelor de înregistrare,
metodei de culegere a datelor sau condițiilor externe. Aceste erori pot fi de două feluri: întâmplătoare şi
sistematice. Erorile de observare pot fi înlăturate prin controlul statistic.
Principalele tipuri de erori statistice în etapa de observare sunt:
- erori întâmplătoare care provoacă abateri în sensul măririi sau micșorării nivelului real al
fenomenului. Acestea pot surveni din neatenție şi nu au caracter premeditat, în cazul
colectivităților mari, acest tip de erori are un caracter redus;
- erori sistematice care produc abateri semnificative, de regulă întru-n singur sens, de la
realitatea observată. Sunt generate din neînțelegere sau din rea credință (voință).
Exemplele de mai sus sugerează faptul că există factori obiectivi şi subiectivi care conduc la erori
de înregistrare întâmplătoare, sistematice şi la greșeli de înregistrare. O vizualizare a tipologiei generale
de erori de înregistrare este prezentată în Figura 2.2.

Figura 2.2. Tipuri de erori de înregistrare


Prin eroare de observare se înțelege diferența dintre valoarea reală a nivelului caracteristicii
urmărite şi valoarea sa individuală înregistrată. În practică, nu se cunoaște valoarea reală, adevărată, iar
eroarea efectivă nu poate fi calculată. Din această cauză, pe baza experienței dobândite, se fixează în
valoare absolută sau relativă o eroare maximă admisibilă pe care eroarea efectivă nu o poate depăși.
Datele statistice culese prin diferite metode se supun unui control riguros în vederea depistării şi
eliminării erorilor. Controlul datelor statistice este o operație intermediară, prin care se trece de la
observarea de masă la prelucrarea datelor statistice.
Controlul datelor statistice presupune verificarea completitudinii şi autenticității acestora.
Controlul cantitativ sau completitudinea datelor vizează controlul datelor sub următoarele
aspecte:
- verificarea tuturor formularelor primite la centrul de prelucrare;
- verificarea completării rubricilor etc.
Prin operația de verificare a completitudinii se evită atât lipsa unor date, cât şi fenomenul de
redundanță (datele de prisos).
Controlul calității datelor culese este o operație de volum mai mare decât controlul
completitudinii din cauza numărului mare de date ce se înregistrează la fiecare unitate statistică şi are în
vedere identificarea erorilor.
Controlul calitativ presupune verificarea naturii calitative a datelor culese. Acesta poate fi:
- control aritmetic;
- control logic.
Controlul aritmetic presupune efectuarea unor operații simple de calcul pentru analiza şi
verificarea datelor derivate neînregistrate. Controlul logic, spre deosebire de cel aritmetic şi de volum,
constă în testarea concordanței logice care există între valorile diferitelor caracteristici înregistrate la
aceeași unitate de observare (de exemplu: vârsta, sexul etc.).
Erorile apar nu numai în etapa de culegere a datelor, ci şi în etapele prelucrării statistice, în
funcție de metodele utilizate.
Factorii de eroare care pot fi înlăturați alcătuiesc aşa numitele erori sistematice, însă ele afectează
exactitatea rezultatului. Factorii care ţin de reactivitatea individuală, de exemplu, nu pot fi înlăturați, ei
determinând ceea ce numim erori aleatorii (întâmplătoare), care afectează atât exactitatea, cât şi precizia
rezultatelor experimentale. Cu toate că acești factori de eroare nu pot fi înlăturați în totalitate, variațiile pe
care ei le provoacă în cadrul unui experiment dat pot fi apreciate şi acestor variații le sunt adresate
calculele de eroare. Deoarece aceste variații aleatorii se supun legilor de distribuție normală a frecvenței,
valoarea lor poate fi calculată. Odată fiind realizat acest lucru, precizia cercetărilor ecologice poate fi
confirmată științifica.

2.3. Prelucrarea statistică a datelor

2.3.1. Conținutul conceptului de prelucrare statistica


În sensul cel mai larg, prin prelucrare statistică se înțelege etapa cercetării statistice în care se
trece de la datele (informațiile) individuale obţinute în etapa observării pentru fiecare unitate a
colectivității la indicatori care caracterizează colectivitatea în ansamblul său, sub formă de indicatori
totalizatori absoluți sau indicatori derivați. De regulă, acești indicatori sunt calculați ca valori sintetice
obţinute prin aplicarea unor abstractizări şi comparări succesive, prin care se elimină ceea ce este
întâmplător şi neesențial în apariția şi dezvoltarea fenomenelor studiate.
În funcție de natura datelor incluse în operațiile de prelucrare statistică, deosebim prelucrare
primară şi prelucrare secundară.
Prelucrarea statistică primară cuprinde operațiile care au drept elemente de intrare datele
primare înregistrate, în aceste operații se realizează, de regulă, sintetizarea datelor primare la nivelul
colectivității şi al grupelor sau claselor acesteia, calculul indicatorilor absoluți şi relativi etc. Principalele
operații de prelucrare primară a datelor statistice sunt: gruparea sau clasificarea; centralizarea sau
agregarea şi compararea prin diferență sau/şi raportare.
Prelucrarea statistică secundară cuprinde un ansamblu de operații care utilizează datele obţinute
în cadrul prelucrării primare, în urma efectuării operațiilor de prelucrare secundară se obțin indicatori
sintetici cu ajutorul cărora se apreciază tendința centrală, omogenitatea şi asimetria distribuțiilor,
intensitatea legăturilor dintre caracteristicile statistice, semnificația factorilor de grupare etc.

2.3.2. Metode de prelucrare primară a datelor statistice


2.3.2.1. Gruparea f i clasificarea statistică
Gruparea şi clasificarea statistică sunt principalele metode prin care se realizează trecerea de la
datele primare culese printr-o metodă oarecare şi eventual sistematizate, la valorile tipice, sintetice, care
reflectă esenţa fenomenelor studiate în cadrul unei colectivități. Aceste două metode evidențiază legătura
dintre latura cantitativă şi cea calitativă a fenomenelor studiate, deoarece cu ajutorul lor se efectuează o
anumită sistematizare a datelor primare care să conducă la formarea de grupe sau clase de unități
omogene din punct de vedere statistic.
Prin grupă omogenă din punct de vedere statistic se înțelege clasa de unități în interiorul căreia
variația caracteristicii este minimă. Această variație din interiorul grupei este interpretată statistic ca fiind
rezultatul influenței factorilor întâmplători şi care, la nivelul întregului ansamblu, se completează
reciproc.
Gruparea şi clasificarea statistică presupune o operație de structurare a colectivității generale pe
grupe sau clase omogene în funcție de variația unei caracteristici. Gruparea şi clasificarea datelor
statistice sunt subordonate scopului cercetării, apoi sunt declanșate după o analiză aprofundată, calitativă
a colectivității statistice în vederea identificării grupelor sau claselor calitativ distincte şi omogene. Este
necesar să se acorde o atenție deosebită acestor operații, deoarece, în cazul în care grupările/clasificările
obţinute nu sunt corecte, atunci nu se mai pot observa deosebirile calitative existente în structura
colectivității studiate, iar cunoașterea obiectivă a aspectelor este imposibilă.
Criteriile în funcție de care se efectuează structurarea colectivității se numesc caracteristici de
grupare/clasificare. Alegerea caracteristicilor de grupare/clasificare se efectuează în funcție de scopul
cercetării astfel încât să conducă la separarea unităților colectivității în grupe/clase cât mai omogene. Cu
cât gradul de complexitate al fenomenelor analizate este mai mare, cu atât mai dificil se realizează
grupe/clase omogene, în asemenea situații nu este suficient să se utilizeze o singură caracteristică de
grupare, ci este necesar să se combine mai multe caracteristici aflate în relații de interdependență
obiectivă. Astfel, în funcție de numărul caracteristicilor de grupare utilizate există grupări simple şi
grupări combinate.
Grupările simple sunt acelea în care gruparea unităților se face în funcție de variația unei singure
caracteristici cu care variabila de grupare se găsește în interdependență. Grupările simple se pot efectua
pentru toate caracteristicile din programul observării sau numai pentru acelea care interesează mai departe
procesul de prelucrare.
Grupările combinate. Realizarea scopului cercetărilor statistice necesită pe lângă clasificări
statistice şi elaborarea de grupări simple şi/sau combinate după una sau mai multe caracteristici numerice
cuprinse în programul de observare. Caracteristicile numerice de grupare pot fi cu variație discretă sau cu
variație continuă, în funcție de variația caracteristicii, grupările statistice se clasifică în grupări pe
intervale de variație.
Grupările combinate sunt acelea în care se folosesc împreună mai multe caracteristici pentru
formarea grupelor. Se alege o primă caracteristică de grupare şi, în funcție de variația ei, se repartizează
unitățile colectivității; în continuare, fiecare grupă se separă pe subgrupe după variațiile celei de-a treia
caracteristici de grupare ş.a.m.d. În funcție de creșterea numărului caracteristicilor de grupare, se obțin
grupe din ce în ce mai omogene. Pentru a nu fărâmița colectivitatea în grupe prea numeroase, se
recomandă să nu se depășească 3-4 caracteristici de grupare.
Gruparea combinată poate fi completată la nevoie cu centralizarea/agregarea valorilor
caracteristicilor observate în fiecare grupă/subgrupă.
După conținut, caracteristica de grupare se poate clasifica în grupări cronologice, teritoriale şi
grupări după o caracteristică atributivă. Realizarea grupărilor teritoriale şi cronologice se efectuează în
funcție de condițiile obiective în care se produc fenomenele. Astfel, în cazul grupărilor teritoriale unitățile
colectivității statistice studiate se repartizează în funcție de unitățile administrativ-teritoriale cărora le
aparțin.
Gruparea cronologică presupune utilizarea timpului drept caracteristică de grupare a unităților
statistice sau a valorilor individuale ale celorlalte caracteristici cuprinse în programul de observare.
Grupările după o caracteristică atributivă se întâlnesc frecvent în cercetarea statistică, fie ca
grupări simple, fie ca grupări combinate, deoarece permit caracterizarea independentă sau interde-
pendentă a fenomenelor din colectivitatea analizată. Caracteristicile atributive în funcție de care se
descompune colectivitatea în grupe/clase omogene pot fi exprimate prin cuvinte şi/sau numere.
Gruparea statistică este folosită în cercetarea statistică ca metodă de bază, deoarece rezultatele ei
se utilizează în continuare în prelucrarea datelor şi aceasta poate fi utilizată ca o metodă principală de
analiză a fenomenelor care prezintă diferențieri.
Prin urmare, gruparea statistică ca metodă de prelucrare primară are o serie de funcții cognitive
care se referă la:
- evidențierea structurii colectivității cercetate pe tipuri calitative;
- evidențierea mutațiilor structurale produse în colectivitatea studiată, pe plan teritorial, în
dinamică şi ca urmare a modalităților de organizare a acestora;
- reflectarea tendințelor de manifestare a variației caracteristicilor observate;
- stabilirea şi interpretarea direcției şi formei sub care se manifestă tendința legăturii dintre
fenomenele şi factorii de influență.
Grupările pe variante se folosesc în cazul în care caracteristica numerică are un număr redus de
variante. Aceasta constă în identificarea prin numărare a unităților (a frecvențelor) din colectivitatea la
care se înregistrează aceeași variantă a caracteristicii de grupare şi eventual este însoțită de centralizarea
datelor pe fiecare variantă (Tabelul 2.1).
Tabelul 2. l Gruparea unităților după caracteristica numerică discretă

Elementele din tabelul 2. l au următoarele semnificații:


xi – varianta ”i” a caracteristicii ”x”;
ni – numărul de unități la care s-a înregistrat varianta xi;
ni valoarea centralizată a caracteristicii x
∑ x iv =x i 1+ x i 2 +… … ..+ x¿ i
care posedă varianta xi
v=1

ni valoarea centralizată a caracteristicii y


∑ yiv = y i 1 + y i 2+ … … ..+ y ¿ i
care posedă, după x, varianta yi
v=1

k ni -valoarea totală a caracteristicii xn în


∑ ❑ ∑ x iv colectivitatea n, unde
i=1 v=1
k
n=∑ ni
i=1

k ni -valoarea totală a caracteristicii yn în


∑ ❑ ∑ y iv colectivitatea n, unde
i=1 v=1
k
n=∑ ni
i=1

În urma operației de grupare pe variante, rezultă serii statistice de frecvenţe pe variante. Exemple
de astfel de grupări (serii) pot fi: gruparea familiilor după numărul de pui sau după numărul membrilor de
familie etc.
Gruparea datelor pe intervale de variație se folosește atunci când caracteristica numerică de
grupare prezintă un număr mare de valori individuale. În funcție de mărimea intervalului de variație,
gruparea datelor poate fi pe intervale egale sau pe intervale neegale.
Grupările pe intervale egale de variație se folosesc în cazul în care mărimea variației
caracteristicilor de grupare permite alegerea unei mărimi egale a intervalelor astfel încât să nu conducă la
un număr prea mare de grupe.
Grupările pe intervale neegale de variație se folosesc fie în cazul în care caracteristica de grupare
prezintă un grad foarte mare de variație, fie în cazul grupărilor tipologice, unde diferențierea pe tipuri
calitative nu este uniformă.
Prin urmare, gruparea datelor pe intervale de variație comportă decizia de stabilire a numărului de
grupe şi a mărimii intervalelor de grupare.
În cazul în care gruparea se utilizează ca mijloc de analiză, în vederea stabilirii tipurilor calitative
din structura colectivității, a unităților structurale produse, se recomandă formarea unui număr redus de
grupe cu intervale neegale de variație. Această grupare se numește tipologică şi poate fi făcută combinând
mai multe caracteristici. Dacă gruparea se face cu scopul ca rezultatele să fie supuse în continuare
prelucrării statistice, atunci se recomandă stabilirea unui număr mai mare de grupe şi, pe cât posibil, cu
intervale egale de variație. Indiferent de scopul grupării, se recomandă ca intervalele să nu fie prea largi
(numărul de grupe prea mic), întrucât se constată o pierdere mare de informație şi, implicit, se micșorează
precizia rezultatelor, dar nici prea înguste (un număr foarte mare de grupe), pentru că, deși se păstrează o
informație mai amplă, nu se estompează iregularitățile accidentale, în schimb complică fără folos
calculele. Este necesar să se găsească un echilibru între «o precizie amăgitoare» şi o «informație
suficientă».
Pentru efectuarea grupării pe intervale de variație, este necesar ca numărul de grupe (r) să se
stabilească în funcție de mărimea amplitudinii variației (A). Amplitudinea variației valorilor individuale
ale caracteristicii de grupare se calculează cu relația (2.1.)
A=X max −X min (2.1)
unde:

Xmin = min {xl, x2, ..., xn} şi Xmax = max{xl, x2, ...,xn} semnifică cea mai mică şi respectiv cea
mai mare valoare individuală din ansamblul datelor culese. Numărul de grupe (r) care se formează trebuie
să fie direct proporțional cu mărimea amplitudinii. Raționamentul stabilirii numărului de grupe (r) în
funcție de mărimea amplitudinii poate fi, în mod orientativ, influențat şi de rezultatul care s-ar fi obținut
cu ajutorul relației lui Sturges (2.2):
r =1+ 3 ,322∗log n (2.2)
unde:
n – numărul de unități din colectivitatea la care s-a înregistrat caracteristica x.
Relația (2.2.) poate servi drept punct de reper la determinarea numărului de grupe în cazul în care
distribuirea unităților colectivității după caracteristica dată se apropie de cea normală şi se folosesc
intervale egale de grupe.
Pe baza mărimii amplitudinii variației şi a numărului de grupe stabilit se determină mărimea
intervalului de grupare (h) cu relația (2.3.):
A
h= (2.3)
r
unde: h – mărimea intervalului de grupare.
Dacă din calcul rezultă un număr zecimal, mărimea intervalului se rotunjește întotdeauna la
numărul natural următor.
Rezultatul sistematizării pe intervale de grupare pentru o variabilă numerică continuă reprezintă o
serie de distribuție (repartiție) de frecvente pe intervale (Tabelul 2.2).
Tabelul2.2
Distribuție de frecvente pe intervale de variație

Intervale de variație a variabilei (X) Numărul de unități statistice (frecvente


absolute, n,)

x1 inf – x1 sup n1

x2 inf – x2 sup n2

- -

x inf – xi sup ni

- -

- -

xk inf – xk sup nk
k
Total n=∑ ni
i=1

Seriile de distribuție a frecvențelor pot fi:


• simple, când avem un şir de variante privind aceeași variabilă (x1, x2,...,xi,...,xn), unde i = 1,n
x 1 x 2 … .. x i … … x k
• de frecvențe, când fiecărei variante i se atașează câte o frecvență ( n 1 n2 … … x i … … n k ),

unde k<n
Ele pot fi pentru variabile numerice şi nenumerice.
Proprietăţi:
• omogenitatea termenilor din punct de vedere al conţinutului variabilei;
• variabilitatea termenilor în funcţie de modul de asociere ; a factorilor;
• independenta termenilor datorată faptului că unitățile la care se înregistrează datele sunt entități
relativ autonome;
• tendința de concentrare în anumite zone ale variației potrivit legii statistice care guvernează
fenomenele respective, sau o tendință de diversificare identificată prin existenta unor frecvențe relativ
uniforme pentru toată seria.
Observații:
• dacă intervalele sunt cu variație discontinuă, atunci:
x (i+1 )inf =xi + ∆ ¿
¿ (2.4)
unde Δ este o unitate de discretizare;
• dacă intervalele sunt cu variație continuă, adică:
x (i+1 )inf =xi ¿ ¿ (2.5)
atunci trebuie stabilit în ce interval este cuprinsă valoarea de graniță;
• mărimea intervalului de grupare se calculează:
hi =xi − x
¿
iinf
¿ (2.6)
dacă intervalele sunt cu variație continuă, sau:
hi =x( i+1) inf −x i inf (2.7)
sau ,
hi =xi − x
¿
¿
( i−1) ¿
¿ (2.8)
indiferent dacă intervalele sunt cu variație continuă sau discontinuă;
• pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni unități dintr-o grupă au
valoarea variabilei egală cu centrul de interval (xi):
hi
x i=x i inf + (2.9)
2
sau, dacă intervalele sunt cu variație continuă:
xi ¿

x i=x i inf + ¿ (2.10)


2
Astfel, dacă limita superioară a fiecărui interval se repetă ca limita inferioară a intervalului
următor, se obţin două variante de grupare în funcţie de modul de includere a limitelor de interval,
modalitate ce se menţionează într-o notă din subsolul tabelului.
Intervalele de grupare pot fi construite şi în aşa fel încât să nu se repete limita superioară a unui
interval ca limita inferioară a intervalului următor, în acest caz cele două limite care definesc fiecare
grupă sunt incluse în interval. Prima grupă poate fi obţinută pornind de la Xmin, sau de la o valoare mai
mică, convenabilă din punct de vedere al calculelor, care urmează sa fie efectuate pe baza grupării, la care
se adaugă mărimea intervalului.
La alegerea limitelor care se includ în interval, trebuie să se aibă în vedere să nu rămână nici o
unitate în afara grupării, să se evite, pe cât posibil, asimetria pronunțată în repartizarea frecvențelor şi
apariția unor grupe la care frecvența este zero.
Exemplu. Presupunem că s-a determinat masa (mg) a 30 indivizi de moluşte bivalve (Tabelul
2.3):
Tabelul 2.3
Masa (mg) moluștelor bivalve

380 384 408 408 387 394

385 387 389 386 391 397

390 392 394 393 399 398

395 398 397 396 392 395

400 404 403 402 397 405

Se cere să se distribuie indivizii de moluște bivalve pe intervale de variație după masă.


Se determină amplitudine variației conform relației 2.1.:
Xmin = 380 și Xmax=408
A=408-380=28
Apoi se calculează numărul de grupe după relația lui Sturges (2.2):
r = l + 3,322*logn.
Deoarece numărul indivizilor de moluște bivalve din colectivitatea la care s-a înregistrat masa
este 30 (n=30), rezultă:
r = l + 3,322*log30 = l + 3,322*1,477 = 5,907 ≈ 6.
Mărimea intervalului de variație se determină conform relației 2.3:
h = A/r,
h = 28/6 = 4,67 ≈ 5.
Se alcătuiește tabelul. Mărimea intervalului de grupare se obține fie ca diferența dintre două
limite inferioare sau superioare alăturate, fie ca diferența dintre limita superioară şi limita inferioară a
aceluiași interval (Tabelul 2.4 şi Tabelul 2.5).
Tabelul 2.4
Distribuţia indivizilor din eşantionul înregistrat după masă (mg)

Numărul indivizilor (frecvenţa


Grupe de moluşte după masă (mg)
absolută, n$

380-385 2

385-390 5

390-395 7

395-400 9

400-405 4

405-410 3

Total 30

Notă: Limita inferioară inclusă în interval.


Tabelul 2.5
Distribuţia indivizilor din eşantionul înregistrat după masă (mg)
Numărul indivizilor (frecvenţa
Grupe de moluşte după masă (mg)
absolută, itj)

379-384 1

384-389 5

389-394 6

394-399 10

399-404 4

404-409 4

Total 30

Notă: Limita inferioară inclwă în interval.


Se pot întâlni situații când la intervalele extreme lipsește una din limite, ceea ce înseamnă că
acestea sunt deschise. Astfel, în cazul exemplului prezentat, primul interval putea fi «sub 385», iar
ultimul – «405 şi peste», în acest caz se recurge la închiderea convențională a acestor intervale cu
mărimea intervalelor alăturate.
Gruparea propriu-zisă pe intervale de variație a caracteristicii Xi presupune identificarea limitelor
fiecărui interval de variație.
Gruparea pe clase şi implicit obținerea distribuției empirice scoate în evidentă tendința de grupare
şi de împrăștiere a datelor. Totodată, distribuția empirică servește în continuare pentru calcularea
parametrilor statistici de selecție.
Pe lângă frecvența absolută (ni) care indică numărul total de unități statistice care au valoarea
variabilei situată într-un interval (Xi inf – Xi sup), se poate calcula şi frecvența relativă a grupei, care indică
proporția din numărul total de unități, care se încadrează în grupă:
ni ni
n¿i = k
=
n (2.11)
∑ ni
i=1

unde n reprezintă volumul total al colectivității.


Exprimată în procente, frecvența relativă a grupei i este:
ni ni
n¿i %= k
∙ 100= ∙100
n (2.12)
∑ ni
i=1

Dacă utilizăm frecvențele relative, obținem o serie de distribuție (repartiție) de frecvente relative
(Tabelul 2.6)
Tabelul 2.6
Serie de distribuție de frecvente relative

Intervale de variație a variabilei (X) Numărul de unități statistice (frecvente


relative, n1*)

x1 inf – x1 sup n1*

x2 inf – x2 sup n2*


… …

x inf – xi sup ni*

… …

… …

xk inf – xk sup nk*

k
Total ∑ n¿i =1,00
i=1

Frecvențele absolute cumulate (Fci) reprezintă numărul unităților statistice care au valoarea
variabilei mai mică (sau, eventual, egală) cu limita superioară a grupei (deci, au valoarea variabilei mai
mure decât X1 inf şi mai mică decât Xl sup).
i
F ci=∑ nk (2.13)
k=1

Similar cu frecvențele cumulate crescător, se pot calcula şi frecvențe cumulate descrescător.


r
F di =∑ nk (2.14)
k=1
i
F ¿di =∑ n¿k (2.15)
k=1

Pentru reprezentarea grafică, se efectuează calcule pentru frecvențe cumulate sau greutăți
specifice (parte faţă de întreg). (Tabelul 2.7.)
Tabelul 2.7
Distribuția indivizilor din eșantionul înregistrat după masă (mg)

Frecvențe absolute
Frecvențe
cumulate (Fci)
Grupe
Num
de moluşte după relative descresc
ărul grupei absolute
masă (mg) crescăto ător
(% faţă r (Fci)
(ni)
de total, ni*) (Fdi)

1 380-385 2 6,67 2 30

2 385-390 5 16,67 7 27

3 390-395 7 23,33 14 23

4 395-400 9 30,00 23 14

5 400-405 4 13,33 27 7

6 405-410 3 10,00 30 2

Total 30 100 - -
Notă: Limita inferioară inclusă în interval.
Din exemplul de mai sus.se observă o puternică tendință de grupare a datelor pe clasele de mijloc
şi de împrăștiere pe cele din extremități.
2.3.2.2. Agregarea (centralizarea) datelor statistice
Gruparea/clasificarea datelor statistice culese este însoțită sau precedată de operații de
centralizare/agregare în scopul obținerii unor indicatori sintetici absoluți. După nivelul la care se execută
operațiile de centralizare/agregare se distinge:
- centralizare/grupare simplă: se efectuează la nivelul colectivității negrupate, nestructurate;
- centralizare/agregare pe grupe/clase: se efectuează la nivelul grupelor/claselor în care a fost
structurată colectivitatea, într-o clasificare/agregare ierarhică, agregarea datelor individuale se face
succesiv în concordanță cu nivelurile (treptele) acesteia până se ajunge la nivelul întregului ansamblu.
Centralizarea/agregarea datelor statistice se face prin aditivitate sau prin aplicarea unor tehnici
speciale. Prin operațiile de aditivitate se obțin la nivelul grupelor/claselor indicatori sub formă de
sume/totaluri. Aditivitatea nu trebuie efectuată mecanic, ci respectându-se anumite restricții (cerințe)
dintre care amintim:
- datele individuale agregate trebuie să aibă acelaşi conținut, să se refere la aceeași trăsătură
calitativă, să exprime aceeași categorie de fapte individuale;
- fenomenele reflectate prin datele individuale înregistrate trebuie să aibă caracter primar şi nu
caracter derivat sau secundar. Cu alte cuvinte, sunt însumabile direct numai caracteristicile de volum;
- datele individuale trebuie să fie exprimate în aceleași unități de măsură etc.
Rezultatele operațiilor de grupare/clasificare a datelor statistice sunt prezentate prin tabele,
grafice şi serii.
2.4. Prezentarea datelor statistice
În vederea aplicării metodelor de calcul şi de interpretare statistică, rezultatele sistematizării
datelor se prezintă sub formă de serii, tabele sau grafice statistice,

2.4.1. Serii statistice


Seria statistică este prezentarea paralelă a două șiruri de date în care primul șir constituie
caracteristica de grupare, iar cel de-al doilea – rezultatul centralizării frecvențelor sau valorile unei alte
caracteristici cu care se află în raport de interdependență.
Dintre caracteristicile înregistrate cu prilejul observării se alege aceea care servește cel mai bine
scopului cercetării. Uneori este necesară combinarea şi utilizarea concomitentă a mai multor caracteristici
de grupare (Figura 2.3).

Figura 2.3. Clasificarea seriilor statistice


în acest context distingem:
• serii unicriteriale (unidimensionale);
• serii multicriteriale (multidimensionale).
Seriile unicriteriale (unidimensionale) pot fi prezentate în funcţie de natura caracteristicii de
grupare în trei tipuri distincte:
• serii cronologice (dinamice, de timp);
• serii teritoriale (de spațiu);
• serii de repartiție (de distribuție).
Seriile cronologice reprezintă seriile statistice ce se obțin prin sistematizarea datelor după o
variabilă de timp. O serie cronologică este alcătuită din două șiruri de date: unul cu privire la unitățile de
timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvența de apariție sau
nivelul unui fenomen, înregistrat în aceste unități de timp. Dacă unitățile de timp sunt momente, atunci
seria cronologică se numește de stoc (de momente), iar dacă unitățile de timp sunt intervale (perioade),
seria cronologică se numește de flux (de intervale). O serie cronologică se notează:
( y 1y2………...ty…………n y ) sau( yt )
1 2 t n t

Exemplu, Evoluția efectivului numeric al populației de mamifere rozătoare pentru perioada


ianuarie 2014 – februarie 2015 (Tabelul 2.8).
Tabelul 2.8
Evoluția efectivului numeric al populației de mamifere rozătoare

Anul Efectivul numeric (indivizi)

ianuarie 2014 104

februarie 2014 103

martie 2014 104

aprilie 2014 99

mai 2014 124

iunie 2014 127

iulie 2014 108

august 2014 110

septembrie 2014 116

octombrie 2014 123

noiembrie 2014 148

decembrie 2014 133

ianuarie 2015 139

februarie 2015 143

Serii teritoriale. Dacă variabila pentru care se sistematizează datele este o variabilă de spațiu
(teritorială), adică elementul ce diferențiază manifestările fenomenului analizat este locul unde acestea s-
au produs, atunci rezultatul este o serie teritorială (de spațiu).
Exemplu. Răspândirea moluştei Dreissena polymorpha în anul 1997 în ecosistemele acvatice din
11 tari din Europa este prezentată în Tabelul 2.9.
Seriile de repartiție (de distribuție) reprezintă seriile statistice când caracteristica de grupare este
un atribut cantitativ sau calitativ al colectivității cercetate.
Tabelul 2.9
Răspândirea moluştei Dreissena polymorpha în anul 1997

Ţara Rata răspândirii (%)

Austria 7,1

Belgia 13,2

Bulgaria 13,7

Elveţia 5,2

Franţa 12,4

Germania 12,5

Italia 12,3

Olanda 5,5

România 10,4

Spania 20,8

Ungaria 10,4

2.4.1.1. Tabele statistice


Tabelul statistic este o formă de prezentare ordonată şi completă a datelor, în cuvinte şi expresii
numerice, despre o colectivitate cercetată, facilitând formarea unei imagini globale despre obiectul de
studiu. El se folosește atât pentru prezentarea rezultatelor cercetării, cât şi în cadrul analizei indicatorilor
derivați. Indiferent care este destinația tabelelor statistice, acestea trebuie sa fie întocmite respectând
elementele de conținut şi de formă.
Elementele constructive ale unui tabel statistic sunt:
• titlul tabelului trebuie să precizeze în câteva cuvinte ce se prezintă în tabel, unde şi când s-au
produs evenimentele prezentate în tabel; titlurile interioare se referă la elemente ale subiectului (se trec la
începutul rândurilor) şi ale predicatului (în capul coloanelor);
• macheta tabelului care cuprinde totalitatea liniilor orizontale şi verticale a căror intersecție
conduce la formarea de rubrici pentru subiectul şi predicatul tabelului;
• subiectul tabelului se înscrie în capetele rândurilor şi este reprezentat de colectivitate şi părțile
sale componente;
• predicatul tabelului se înscrie în capătul coloanelor şi este format din totalitatea aspectelor
cantitative referitoare la colectivitatea cercetată. Macheta devine tabel statistic când se umple cu date;
• conținutul tabelului reprezintă totalitatea informațiilor trecute în rubrici;
• sursa datelor se trece imediat sub tabel;
• nota explicativă se plasează fie imediat după sursa datelor, fie în subsolul paginii pe care se află
tabelul, dacă în etapa de culegere sau prelucrare a datelor din tabel s-au folosit proceduri sau tehnici noi
sau rar utilizate de către posibilii cititori.
În funcție de scopul analizei şi al prelucrării, în teoria şi practica statistică se elaborează şi se
utilizează o multitudine de tabele statistice. După felul cum este prelucrat subiectul sau predicatul, se
disting tabele: simple, pe grupe, combinate, combinate cu dublă intrare, de asociere.
Tabele simple, descriptive. Sunt elaborate pentru a prezenta indicatorii statistici ai unităților
complexe investigate, ordonați din punct de vedere cronologic, teritorial sau organizatoric (Tabelul 2.2).
Tabelele simple întocmite după criteriile cronologic şi teritorial servesc pentru caracterizarea statistică a
fenomenelor în evoluția lor în timp si, respectiv, în plan teritorial.
Tabele pe grupe, utilizate în prelucrare. Sunt instrumente intermediare utilizate pentru gruparea
simplă cu valori centralizate pentru frecvențele corespunzătoare grupelor şi pentru valorile
caracteristicilor dependente de variația caracteristicii principale de grupare sau pentru aplicarea unor
algoritmi de calcul ai indicatorilor derivați (Tabelul 2.10).
Tabelul 2.10
Model de tabel pe grupe

Numărul
Valorile centralizate ale caracteristicii
Grupe şi unități după variația unităților
caracteristicii X
fi Y Z V

A 1 2 3 4

x1 f1 Y1 Z1 V1

x2 f2 Y2 Z2 V2

... ... ... ... ...

xi fi Yi Zi Vi

... ... ... ... ...

xn fn Yn Zn Vn

n n n n
Total ∑ fi ∑Yi ∑ Zi ∑Vi
i=1 i=1 i=1 i=1

Tabele de prezentare a datelor statistice structurate pe grupe/clase de variație (Tabelul 2.3,


Tabelul 2.4 şi Tabelul 2.5).
Tabelul pe grupe se folosește când se aplică gruparea simplă cu valori centralizate pentru
frecvențele corespunzătoare grupelor şi pentru valorile caracteristicilor dependente de variația
caracteristicii principale de grupare.
Forma generală a unui tabel cu dublă intrare este prezentată în Tabelul 2.11.
Tabelul 2.11
Distribuția unităților unei colectivități după două caracteristici interdependente, x şi y

Valorile / Valorile / variantele caracteristicii y Totalul


variantele frecvențelor după
caracteristicii x y2 … yj … yp variabilă x
x1 n12 … n1j … n1p n1.
… … … … … … …
xi ni2 … nij … nip ni.
… … … … … … …
xr nr2 … nrj … nrp nr.
Totalul
frecvențelor după n.2 … n.j … n.p n..
variabilă y
Din Tabelul 2.11 se observă următoarele:
- nij reprezintă numărul de unități care posedă varianta/ grupa x i şi yj
- ni. reprezintă numărul total de unități care posedă varianta / grupa x; indiferent ce variantă/grupă
posedă după caracteristica y;
- n.j reprezintă numărul total de unități care posedă varianta/grupa yj indiferent ce variantă/grupă
posedă după caracteristica x;
- n.. reprezintă numărul total de unități investigate în colectivitatea statistică.
O formă particulară de tabel de contingență este tabelul de asociere (tabelul 2.12). Acesta prezintă
repartiția unităților după două caracteristici alternative, corelate între ele.
Sunt utilizate următoarele tabele statistice de prezentare a valorilor funcţiilor biometrice sau a
repartiției binomiale: distribuțiilor Fischer, Student, Kruskal–Wallis, Gauss–Lapîace.
Tabelul 2.12
Asocierea frecvenţelor după două caracteristici alternative
Variantele alternative ale caracteristicii y
Variantele alternative ale (de exemplu – P/B)
caracteristicii x (de exemplu Y2 (de exemplu – TOTAL
Y1 (de exemplu –
-mediul) biomasa)
producția) (DA sau y1=1)
(Nu sau y2 = 0)
X1
(DA sau X1 = 1) (de exemplu n11(=50 000) n12(=30 000) n1.(80 000)
– terestru)
X2
(NU sau x2 = 0) n21(=25 000) n22(=15 000) n.2(40 000)
(de exemplu – acvatic)
Total n.1(=75 000) n.2(=45 000) n.. (120 000)

Tabelele statistice, indiferent de tipul lor, de modalitatea lor de elaborare (manuală sau automată),
conțin una sau mai multe serii.

2.4.1.2. Grafica datelor statistice


2.4.1.2.1. Principii și reguli de reprezentare grafică
Oricât de bine ar fi gândite tabelele statistice, utilizarea lor repetată în lucrarea științifică este
obositoare şi determină o receptare dificilă a mesajului informativ, uneori suprapunerea, amestecarea
nedorită sau asocierea defectuoasă a datelor din diferite tabele, într-un asemenea context, Wiliam
Plyfaircel, care a pus la punct construcția primelor grafice moderne în secolul al XVIII-lea, afirma că prin
utilizarea graficelor se pot imprima în memorie, în cinci minute, informații al căror studiu prin tabele ar fi
necesitat zile întregi. Ele facilitează înțelegerea şi memorizarea, invitând la elaborarea intuitivă a
ipotezelor cu privire la legitățile specifice obiectului cercetării, cu privire la conexiunile posibile cu alte
fenomene şi procese etc.
Graficele sunt folosite în statistică în următoarele scopuri:
a) Ca modalitate de reprezentare, respectiv grafica de popularizare şi de informare vizuală.
b) Ca metode empirice de analiză şi interpretare a:
- raportului dintre doi sau mai mulți indicatori statistici;
- structurii şi nuanțelor de structură– în timp sau teritorial;
- formării de variație şi de asimetrie;
- legăturilor statistice dintre două sau mai multe variabile statistice;
- trendului de scurtă şi de lungă durată;
- variației unui fenomen complex în funcție de factorii săi determinanți etc.
c) Ca metodă de calcul grafic al unor indicatori statistici (mărimi medii, indicatori medii de
poziție, indicatori de concentrare, indicatori de corelație etc).
Graficul este o imagine spațială, cu caracter convențional, care prin diferite mijloace de
reprezentare reliefează ceea ce este caracteristic, esențial, pentru obiectul cercetării. Anume grație acestui
avantaj se afirmă că un grafic simplu valorează mai mult decât o expunere lungă. El constituie, totodată, o
manieră simplificată de descriere a realității, transpunând aspectele sale măsurabile în mărimi şi figuri
geometrice variate, acestea imprimându-se în memorie mult mai ușor decât mulțimea datelor înscrise în
tabele. De aceea graficele sunt utilizate în analizele biologice ca un important auxiliar în prezentarea
rezultatelor cercetării.
Trasarea corectă a graficelor statistice se efectuează pe baza unor reguli care se referă atât la
conținut, cât şi la formă. O parte din regulile de elaborare a graficelor statistice sunt comune cu cele ale
tabelelor, iar altele sunt specifice. Astfel, pentru interpretarea completă şi corectă a mesajului transmis de
grafic este necesar ca acesta să aibă:
• titlul graficului;
• axa sau axele de coordonate ale graficului explicite;
• scara de reprezentare sau scările graficului pentru gradare;
• legenda care să explice culori, hașuri;
• graficul propriu-zis reprezentat de puncte, linii, figuri geometrice în plan sau spațiu sau figuri
natural convenționale construite la scară;
• sursa datelor se plasează imediat după grafic;
• notă explicativă.
Pe axa Ox a graficului se vor fixa variantele sau intervalele de variație ale caracteristicii
independente, momentele sau intervalele de timp, iar pe axa Oy – frecvențele, valorile caracteristicii a
cărei evoluție este urmărită, valorile sau intervalele de variație ale caracteristicii dependente. Pentru a
respecta proporțiile din date, este necesar ca pe cele două axe punctele să fie fixate la scară.
Principalele tipuri de grafice care se trasează în acest sistem de axe sunt următoarele: histograma,
poligonul frecvențelor, curba cumulativă de frecvențe, diagramele prin benzi şi coloane, cronograma
(pentru seriile cronologice), corelograma (pentru seriile interdependente) etc.
2.4.1.2.2. Principalele tipuri de grafice statistice
În funcție de obiectul reprezentării grafice, de datele disponibile şi de intenția autorului, se va
alege unul sau altul dintre tipurile fundamentale de grafice. Deşi nu există reguli riguros stabilite cu
privire la utilizarea diferitelor tipuri de grafice, cercetarea unui număr de lucrări de referința în acest
domeniu conduce la enumerarea anumitor tipuri de grafice (Figurile 2.3, 2.4 şi 2.5).
Figura 2.3. Reprezentarea grafică a seriilor cronologice

SERII DE SPAȚIU
(teritoriale)

Cartograma - destribuția în spațiu a Cartograma - destribuția în


intensității de manifestare a unui
spațiu a structurii unui fenomen
fenomen
Figura 2.4. Reprezentarea grafică a seriilor teritoriale
Figura 2.5. Reprezentarea grafică a seriilor calitative
1. Diagramele prin benzi şi coloane. Se folosesc în scopul popularizării unor aspecte biologice
pentru a reda imaginea unui fenomen în evoluția lui în timp, când distanțele dintre perioade sunt mari sau
neegale. Graficul prin benzi mai este indicat în cazul în care se reprezintă indicatori care exprimă lungimi.
Diagrama prin benzi se construiește sub forma unor dreptunghiuri cu latura mare orizontală
sprijinită pe o dreaptă ridicată în punctul de origine al axei (orizontale) de reprezentare. Benzile au
aceeași lățime, iar lungimea lor este proporțională cu nivelul măsurat al caracteristicii, între benzi se
păstrează o distanta constantă. Acest grafic se folosește, mai ales, pentru a arăta mărimea diferită a ele-
mentelor sau grupelor de elemente dintr-o colectivitate studiată.
Nu se recomandă să se folosească o diagramă prin benzi pentru ilustrarea dinamicii unei
caracteristici, deoarece între benzi ar trebui stabilite distanțe diferite, proporționale cu intervalul de timp
dintre două observări consecutive. Această distanțare diferențiată a benzilor este inestetică, iar alipirea
benzilor sau așezarea lor la distante egale deformează informațiile cu privire la evoluția reală a ca-
racteristicii.
Diagrama prin coloane (Figura 2.6) se construiește sub forma unor dreptunghiuri cu latura mare
verticală, cu ajutorul unui sistem de axe rectangulare. Axa X (a absciselor) este axa timpului, pe care se
așază fiecare coloana cu latura mică. Toate coloanele au aceeași lățime, iar între ele se recomandă să se
păstreze distanțele proporţionale cu timpul care se scurge între două observări succesive. Axa ordonatelor
servește la măsurarea nivelului caracteristicii. Când este necesară reprezentarea întregii serii cronologice,
este preferabilă înlocuirea diagramei prin coloane cu o simplă cronogramă (Figura 2.9), adică linia frântă
rezultată din unirea succesivă a punctelor are drept coordonate timpul şi nivelul caracteristicii. Graficul
câștigă în simplitate şi forță de sugestie. Graficul prin coloane se folosește pentru a ilustra dinamica unei
caracteristici atunci când se au în vedere doar câteva din datele observate de-a lungul unei perioade.
Figura 2.6. Variația temperaturii în perioada anului agricol 2013-2014 în condițiile Moldovei
Centrale

2. Diagramele prin figuri geometrice:


a) De suprafață (cerc, semicerc, pătrat, dreptunghi, triunghi):
- Grafice prin areale;
- Grafice de structura (Figura 2.7):

Figura 2.7. Structura de vârstă pentru patru specii de mamifere în perioada 1998-2000
b) De volum (paralelipiped, piramidă, cilindru etc.), denumite stereograme. Graficele prin areale
se construiesc prin forma unor figuri geometrice în plan, a căror suprafață este proporțională cu mărimea
caracteristicii. De regulă se folosesc pătrate, romburi, cercuri, triunghiuri echilaterale, dreptunghiuri.
Diagramele de structură (Figura 2.7 şi Figura 2.8.) presupun un raport de proporționalitate între
suprafaţa figurii geometrice şi totalul structurii de 100%.
Figura 2.8. Structura populației după P/B

Fiecare figură geometrică se va împarți în atâtea părți câte are colectivitatea cercetată, părțile se
vor distinge prin hașurarea sau colorarea suprafețelor respective.
Modificările și structura se pot surprinde prin analiza simplă a figurilor construite.
3. Diagramele seriilor de timp (cronologice, dinamice):
- prin coloane (Figura 2.6.);
- cronograme (Figura 2.9.);
- diagrame polare (radiate).
Diagrama polară (Figura 2.10.) se utilizează, de obicei, pentru a ilustra se zonalitatea, dar poate
fi aplicată şi pentru a da o imagine grafică raportului dintre elementele unei serii de repartiție. Diagrama
polara este deosebit de sugestivă şi pentru seriile cronologice cu tendința de creștere, care sunt afectate de
sezonalitate - se obține o spirală a cărei rază crește pe măsură ce se trece de la un an la altul, iar abaterile
(deformările) sistematice de la raza standard indică intensitatea variației sezoniere.

Figura 2.9. Evoluția mișcării migratorii a unei specii de pești din r. Prut
Figura 2.10. Repartizarea precipitațiilor acide în dependență de provenire în raionul Hîncești (anii
1999, 2012).
4. Diagramele seriilor de spaţiu (teritoriale):
- Cartogramele.
- Cartodiagramele.
Cartogramele (hărți ale teritoriului) şi cartodiagramele (combinație între cartogramă şi diagrama
de suprafață) au o mare capacitate de a reda deosebirea dintre unitățile administrativ-teritoriale ale
ansamblului studiat, în acest scop limitele hărții şi unitățile administrativ-teritoriale trebuie clar conturate,
iar hașurile şi micile diagrame în fiecare unitate trebuie alese şi construite la o asemenea scară, încât să
reflecte diferențierea dintre unități, însă să nu depășească conturul, pentru a evita confuziile.
5. Diagramele seriilor de repartiție de frecvente:
a) Pentru seriile de repartiție de frecvențe unidimensionale se folosesc:
- histograme;
- poligonul frecvențelor;
- diagrama frecvențelor cumulate.
b) Pentru seriile de repartiție de frecvențe se folosește corelograma (graficul de corelație sau
diagrama norului de puncte (vezi capitolul V)).
Să exemplificăm câteva histograme ale frecvențelor absolute/relative. Acestea constituie o
reprezentare grafică care are pe abscisă variabila aleatorie X la o anumită scară, iar pe ordonată –
frecvențele absolute/relative, de asemenea la o anumită scara.
Histograma se obține construind dreptunghiuri pe axa absciselor, cîte unul pentru fiecare clasă, cu
mărimea bazei proporțională cu mărimea clasei, cealaltă dimensiune a dreptunghiului fiind proporțională
cu valoarea frecvențelor absolute/relative pentru fiecare clasă în parte.

S-ar putea să vă placă și