Sunteți pe pagina 1din 259

DANIELA DUMBRVEANU

STATISTICA APLICAT N TURISM

ISBN

DANIELA DUMBRVEANU

STATISTICA
APLICAT N
TURISM

EDITURA UNIVERSITAR
3

Bucureti, 2006

Capitolul 1
CUANTIFICAREA CA METOD DE STUDIU,
CERCETARE I CUNOATERE
A REALITII SOCIO GEOGRAFICE
1.1. Introducere
Geografia1 n mod asemntor altor discipline de
studiu sau tiine presupune un volum vast de informaie
cu care opereaz, de ordin cantitativ sau calitativ n funcie
de natura elementelor componente, a proceselor sau
fenomenelor dintr-un mediu anume. n marea majoritate a
cazurilor,

elementele

componente

ale

unui

mediu

geografic fie el fizic sau antropic, fenomenele i procesele


din natur i societate n mod normal i de la sine iau
forma unor grupuri, ansambluri sau mulimi de elemente
individuale, de acelai fel, care n mod cauzal pentru
apariie,

evoluie

dezvoltare

necesit

condiii

asemntoare sau urmeaz aceleai legi. Astfel geografia


ca tiin este pus foarte adesea n situaia de a generaliza
1

Turismul este considerat i tratat de ctre autoare din punct de vedere


conceptologic ca disciplin component a Geografiei Umane, fapt
pentru care n acest capitol nu va face referiri directe la acesta.

informaia de detaliu n vederea cunoaterii ansamblului,


de a descrie, examina i analiza critic informaia precum i
de a perfeciona ori prognoza tendine, practici, procese,
fenomene.
Cunoaterea cantitativ sau statistic reprezint un
domeniu la care geografia (la fel ca toate celelalte tiine
sociale sau ale pmntului) face apel, utiliznd n mod
selectiv acele metode statistice cu aplicabilitate, eficacitate
i relevan. Autoarea dorete s sublinieze n beneficiul
studenilor geografi, faptul ca nu toat statistica este util
sau relevant ca metod de analiz n studiile i cercetrile
geografice. La baza faptului c geografia face apel la
cunoaterea statistic utilizndu-i metodele st n primul
rnd faptul c cele dou au ceva important n comun:
obiectul de studiu este adesea acelai fenomenele de
mas, sau n limbaj geografic, procesele i fenomenele
care implic un volum forte mare de elemente componente
sau informaie.
n plus potrivit logicii formale din tiin att
inducia ct i deducia reprezint dou laturi unitare ale
procesului

de

cunoatere

tiinific

general,

completndu-se, condiionndu-se reciproc (arc, 1998),


laturi specifice ambelor domenii.
Cunoaterea geografic ca i cea statistic a
fenomenelor

complexe

se

realizeaz

pe

baza

caracteristicilor, a faptelor observate (metoda observaiei,


fundamental n geografie i statistic) sau constatate fie
n realitate, pe teren, ntr-o experien, anchet, sau ntr-o
baz de date, urmrindu-se:
desprinderea

elementelor

semnificative

din

aparent ntmpltorul joc al realitii,


determinarea unei structuri n domeniul aleator
identificarea unei legiti, tendine, teorii ,etc,
confruntarea unei teorii cu realitatea
Este bine cunoscut faptul c legile tiinifice odat
stabilite nu exprim cu certitudine cum se comport natura
sau societatea n general, ci descriu pur i simplu modul
cum se comport acestea ntre anumite limite de timp, de
spaiu i modul cum probabil se vor comporta din nou n
condiii similare. De asemenea este bine cunoscut faptul
c tiinele particulare, printre care i geografia, nu ar fi
ajuns n mod real pe o treapt superioar de dezvoltare

fr cuantificare, matematizare (aceasta reprezentnd de


fapt un stadiu evolutiv). Aceast teorie a fost verificat
mai nti n cazul tiinelor naturii iar mai recent i n
cazul tiinelor sociale, ceea ce plaseaz geografia (att
prin ramura sa uman ct i prin cea fizic) n sfera
necesitii combinrii metodelor proprii de cunoatere cu
cele ale statisticii prin prisma faptului c, esena statisticii
ca tiin const n capacitatea ei de a generaliza trsturile
i relaiile dintre procesele i fenomenele colective din
viaa economic i social, care exist n mod obiectiv i
n reflectarea lor n noiuni generale, regulariti, legiti i
legi (arc, 1998). Ori aceste aspecte reprezint stadii
fundamentale n cunoaterea geografic final.
Practic att cunoaterea geografic ct i cea
statistic, pornind de la real la abstract, cerceteaz
fenomene concrete sau colectiviti de fenomene pentru a
stabili ce au n comun, esenial i stabil n vederea
determinrii

categoriilor,

regularitilor,

legitilor.

Ambele cunoateri putnd lua forme inductive sau


deductive n funcie de realitatea fenomenelor avnd ca
scop final cunoaterea tendinei de evoluie, prognoza i
luarea de decizii.
9

Revenind la fenomenele de mas ca obiect de studiu


comun att geografiei ct i statisticii se vor prezenta n
continuare o serie de aspecte care vin s argumenteze n
detaliu ce au n plus n comun cele dou discipline sau
tiine.
Esena fenomenelor sau a proceselor de mas este
pus n eviden de numrul mare cazuri individuale din
componen. De exemplu, natalitatea unei populaii
necesit un numr mare de nateri de copii vii sau
formarea unei structuri de cazare n turism necesit un
numr mare de hoteluri de mai multe categorii.
Fenomenele de mas se caracterizeaz prin definiie
prin variabilitate, concept de baz n statistic. n cazul
geografiei acesta se numete diversitate sau complexitate.
Elementele componente sau indivizii, pn la un anumit
nivel, asemntori,
distinctive.

prezint i anumite caracteristici

Diferenierile, mai mult sau mai puin

semnificative constituind obiectivul nregistrrii prin


msurtoare

(Isaic-Maniu

colab;

2003).

Astfel

fenomenele de mas sunt rezultatele aciunii unui numr


mare de factori de influen cu componen i natur
diferit, asociaii cu sensuri, direcii i intensiti multiple.
10

Ele sunt de asemenea deterministe, produse n condiii de


incertitudine, forma lor individual de manifestare fiind
diferit.
Legitatea de manifestare a fenomenelor de mas nu
poate fi studiat i verificat dect la nivelul ntregului
ansamblu de cazuri individuale, n nici un caz la nivel de
element component individual.
Astfel studiul cantitativ al fenomenelor de mas
presupune conform lui Isaic-Maniu i colab., studiul
raportului dintre necesitate i ntmplare, a raportului
dintre legea statistic (cunoscut i sub denumirea de lege
stocastic) i legea dinamic sau a relaiei dintre modelul
statistic (stocastic) i modelul determinist (Isaic-Maniu i
colab; 2003). Dei cele dou legi i modele fac parte din
metodologia de nceput a cercetrii tiinifice fiind
considerate n prezent de ctre cercettorii britanici
(autoriti tradiionale n domeniul statisticii), uor
nvechite i depite ele rmn importante i din punct de
vedere geografic datorit aplicabilitii lor. Studiul relaiei
dintre ele ns, sau mai bine spus a raportului dintre ele
constituie o tendin conceptual i de cercetare mai nou
i mai eficient att n statistic ct i n geografie.
11

Legea statistic reprezentnd una din formele


manifestrii legturilor generale ale fenomenelor din
natur i societate (arc, 1998, p 43), constituie n
acelai timp un instrument de verificare i cercetare a
tuturor proceselor i fenomenelor din geografie. Spre
deosebire de legea dinamic , care este o form de
manifestare a fenomenelor individuale luate ca atare, legea
statistic exprim legtura necesar dintr-un ansamblu de
procese i fenomene, care se gsesc ntr-o anumit
interaciune, aparent ntmpltoare, i nu dintre dou
fenomene oarecare sau dou cazuri ale unui fenomen
(arc, 1998, p 43). Fiecare unitate sau element
component dintr-un fenomen sau ansamblu se comport
ntmpltor n raport cu ntregul, cu ansamblul de
fenomene. Legea statistic nu determin micarea sau
comportarea fiecrui element, ea este rezultanta medie a
numeroaselor aciuni individuale ale ansamblului de
fenomene, ca tendin predominant, ca medie a unui
numr mare de abateri ntmpltoare. Deoarece n
geografie intereseaz adesea, mai ales n ultimul timp i
formele de manifestare ale unitilor individuale ale
ansamblului de fenomene, aceasta trebuie s aplice i s
12

in cont i de legea dinamic cu att mai mult cu ct,


mediul geografic n ansamblu su este un mediu foarte
dinamic, caracterizat printr-o structur complex i vast
dar

n acelai

timp

cu elemente

individuale

cu

personalitate i trsturi puternice, la rndul lor, dinamice.


Practic geografia trebuie s in cont n cercetare de faptul
c ntre legea statistic i cea dinamic exist o legtur
dialectic (conform unor autori, precum arc, 1998), o
legtur determinant. Ele se coreleaz, se ntreptrund,
determinnd

mpreun

manifestarea

fenomenelor,

micarea lor, tendinele de evoluie. Devine astfel evident


de ce geografia, n mod special ramura sa, geografia
uman, pentru a atinge un nivel ridicat de rigurozitate n
cercetare, n verificarea teoriilor sale, mai ales atunci cnd
este vorba de fenomene de amploare (fenomene de mas)
trebuie s apeleze la cuantificare; urmnd practic pn la
un anumit nivel metodologia statistic cu care dup cte
am demonstrat mai sus are forte multe n comun. Ca
urmare reamintim cititorului student c geografia aplic
selectiv o parte din metodologia i instrumentarul
statisticii, ca necesitate de cuantificare n studiul
anumitor procese i fenomene att fizice dar mai ales
13

umane. Reamintim aceluiai cititor c n geografie


cuantificarea reprezint doar un stadiu n demersul su
din cercetare, geografia mai ales cea uman nu i
bazeaz metodologia exclusiv, exhaustiv, finalmente pe
cuantificare. n concluzie, cuantificarea, statistica n
geografia uman trebuie privit ca un instrument, unul
important, de analiz, de verificare a legitilor i
teoriilor privind procesele i fenomenele de amploare,
indiferent de natura acestora.
Statistica nu posed pn n prezent o definiie
universal valabil sau universal acceptat ca satisfctoare
dei un domeniu cu propria sa istorie i proces de evoluie
(separat de matematic) este considerat de unii tiin iar
alii o art. A aprut n secolul XVII ca urmare a
preocuprii unor matematicieni pentru probabiliti, s-a
dezvoltat mai nti ca sub-domeniu al matematicii
devenind un domeniu de sine stttor n secolul XIX
(Ebdon, 1977).
Termenul

de

statistic

posed

general

semnificaii diferite sau nrudite:


a) acela de activitate practic (colectarea, msurarea,
obinerea, nregistrarea, informaiei, a datelor);
14

b) metodologie cantitativ (ansamblul metodelor i


procedeelor de culegere, prelucrare i analiz a datelor);
c) metod cantitativ (modul de cercetare a
fenomenelor de mas, pe baza exprimrilor cantitative cu
ajutorul unui sistem specific de reguli, principii de
cunoatere i transformare a realitii obiective);
d) disciplin tiinific de nvmnt.
Ca rezultat domeniul statistic nu este cu siguran
unul restrns.

1.2. Funciile statistice


Din punct de vedere al demersului geografic
statistica prezint importan i relevan devenind un
instrument de cercetare indispensabil prin prisma celor 4
funcii fundamentale ale sale i care n realitate stau la
baza formrii unor ample categorii metodologice de sine
stttoare:

Funcia

descriptiv.

Cantitatea

de

informaie, de date care uneori iau form numeric, cu


care opereaz geografia, n special cea uman, este foarte
mare i n continu cretere. Aplicarea principiului

15

descrierii statistice a reprezentat i mai reprezint o faz


(faza exploratorie) a dat natere statisticii descriptive al
crui scop principal i specific este acela de a sintetiza i
structura ntr-o manier ct mai direct i mai intuitiv
datele i informaia, inclusiv caracteristicile acestora. Ori
acest principiu i este absolut necesar geografiei umane n
cercetare mai ales pentru trecerea de la demersul geografic
descriptiv la cel interpretativ.

Funcia induciei sau inferenei. Cnd

obiectul de studiu, informaia sau datele geografului au


fost obinute selectiv, ori provin din eantioane nu din
ntreg pe baza acestora sugerndu-se ipoteze cu privire la
o posibil extindere a concluziilor la nivelul ansamblului
implicnd astfel probabilitatea ca model de evoluie se
aplic principiul inferenei. Acestuia i revine rolul de a
extinde rezultatele obinute pe baza datelor din eantion la
nivelul ansamblului i de a confirma sau invalida ipotezele
emise a priori sau formulate dup faza exploratorie. Exist
astfel o statistic inductiv sau inferenial a crei
metodologie se bazeaz practic pe teoria probabilitilor
i prezint caracteristici specifice precum, caracterul
aleator al eantionrii, generalizarea concluziilor prin
16

marje specifice de eroare, recunoaterea explicit a


nesiguranei prediciilor. Aceasta presupune n esen,
msurarea incertitudinii rezultatelor i calcularea riscurilor
pe care le implic luarea unei decizii bazate pe informaii
care nu sunt exhaustive. Obiectivul ei const n a estima
parametrii unei colectiviti i n testarea ipotezelor
statistice.
n

limbaj

geografic

statistica

inductiv

sau

inferenial poart aceast denumire ca urmare a faptului


c pornete de la o presupunere (inducie) stabilit
(demonstrat) ulterior i verificat printr-un rezultat.
n geografia uman i nu numai, specialitii lucreaz
preponderent cu date selective (obinute prin generare) i
care nu sunt exhaustive. Adic aceste date reprezint
eantioane (sunt obinute eantionat) dintr-o populaie
ntreag; sunt iruri finite; incomplete deoarece
totalitatea lor absolut este imposibil a fi obinut. Ele sunt
datele care nu reproduc perfect i absolut caracteristicile
populaiei statistice. Exemplu: comportamentul decizional
n alegerea destinaiei de vacan pentru o anume grup
de vrst de turiti sau grup social. A obine datele
statistice pentru ntreaga populaie , adic toi potenialii
17

turiti fie i ai unui ora este aproape imposibil. Se


selecteaz astfel un eantion reprezentativ asupra cruia se
genereaz datele statistice necesare pe baza crora se fac
apoi presupuneri, n funcie de anumii factori i situaii
luate n calcul, pentru a se demonstra comportamentul
decizional. Acest comportament poate fi corelat n
evoluia sau desfurarea sa cu anumii ali factori etc.
Selectarea,

eantionarea

presupune

obligatoriu

probabilitatea existenei unui anumit grad de eroare n


msurtoare i n deducia final. Probabilitatea este
conceptul statistic care deosebete datele selective sau
eantioanele (incomplete, nu reprezint/implic/presupun
toat populaia fiind obinute prin eantionare) de cele
exhaustive (absolute, complete, finite, obinute n tiinele
exacte din msurtori i care reprezint/implic/presupun
toat populaia, nu un eantion). Prin urmare datele
selective, eantioanele includ probabilitatea erorii, n timp
ce datele exhaustive NU.
n concluzie funcia deductiv presupune c: n
condiii specifice, probabilitatea unei presupuneri/ipoteze
(deducii) efectuate pe baza unor eantioane de populaie ,
s fie valid, iar statistica inductiv sau inferenial pune
18

la dispoziie o serie de metode i tehnici de operare pentru


validare sau invalidare.
Profunzimea

analizei

statistice

este

dat

continuare de ndeplinirea funciei semnificaiei.

Funcia semnificaiei. Semnificaia statistic

reprezint una dintre cele mai puternice funcii din punct


de vedere al tiinelor socio-geografice. Aceasta stabilete
dac diferena sau relaia dintre dou seturi de date
selective (eantioane) este semnificativ. Constituie una
dintre cele mai utile funcii statistice n sprijinul geografiei
umane mai ales n studiile cu caracter social. Semnificaia
statistic presupune c diferena observat la dou
eantioane poate semnifica ceva anume sau altceva de
exemplu: c exist pur i simplu o diferen ntre
eantioanele respective sau c diferena aprut la nivelul
eantioanelor este rezultatul ntmplrii sau procedurii de
eantionare.
Semnificaia statistic presupune astfel operaia de
comparaie la nivel de eantion. Eantioanele, aa cum
artam mai devreme presupun prin natura lor o marj de
eroare dar mai presupun i o marj de variaie fa de un

19

interval pe care se gsesc valorile efective ale populaiei.


Astfel undeva apare o diferen!
Pentru a fi siguri c diferena dintre valorile n
eantion reflect o diferen real de valori n populaii,
la mrimile comparate ea trebuie s depeasc mrimea
intervalului pe care se afl, cu o anumit probabilitate,
valorile din populaie. Cu alte cuvinte o diferena este
semnificativ dac depete eroarea maxim admis,
adic ea nu poate fi pus (integral) pe seama fluctuaiilor
fireti de eantionare.
n caz contrar se va spune c diferena nu este
semnificativ. O diferen care nu este semnificativ
reflect o deosebire despre care nu se poate spune cu o
probabilitate suficient de mare c este real, acesta nu
nseamn c ea nu este real.
La o privire mai atent asupra informaiei privind
statistica inductiv ct i semnificaia statistic se poate
observa c ambele opereaz cu eantioane i ambele
implic probabilitatea de eroare fapt pentru care trebuie
menionat c ambele opereaz ntr-o mare msur cu
conceptul de probabilitate i teoria probabilitilor.
Statistica n sine nu poate trage concluzii, nu poate emite
20

deducii asupra unor populaii pe baza unor eantioane i


nu poate demonstra c o relaie este semnificativ sau nu.
Ceea ce poate face este a ne pune la dispoziie informaie
suficient de obiectiv pe baza creia s ne emitem
propriile deducii i trage propriile concluzii, inevitabil
subiective. Statistica ne poate pune la dispoziie
probabilitatea cu care n condiii specifice o relaie
nseamn ceva adic devine semnificativ; probabilitatea
cu care n condiii specifice deduciile efectuate pe baza
unor eantioane sunt valide.

Funcia prognozrii. Cea de a patra funcie

major a statisticii ne d posibilitatea de face prognoze sau


predicii, ori s explicm n prezent anumite procese sau
fenomene trecute. O predicie sau prognoz exact este
posibil numai atunci cnd se opereaz cu procese sau
fenomene deterministe, prin care se nelege totalitatea
proceselor sau fenomenelor care produc rezultate identice
n condiii i circumstane identice. Un exemplu de astfel
de proces l constituie acceleraia gravitaional. narmai
cu valoarea acceleraiei gravitaionale (n condiiile cderii
unui obiect n vid) putem prognoza cu certitudine la ce
distan va cdea un obiect dup un timp dat, sau care va fi
21

viteza acestuia la un moment anume din cderea sa n


aceleai condiii de vid.
Cum cel mai adesea n geografie procesele i
fenomenele nu au o natur determinist, acestea se
comport n general n feluri i moduri diferite fapt pentru
care arareori putem spune cu certitudine absolut care vor
fi rezultatele sau tendinele unui proces chiar i n condiii
strict controlate. Cu toate acestea pornind de la ideea c
procesul nu are loc la ntmplare (din hazard absolut,
deoarece s-a demonstrat c procesele i fenomenele
geografice se supun legii cauzalitii) ar putea fi posibil a
se prognoza rezultatul sau tendina acestuia n condiiile
unei anumite combinaii de circumstane i cu anumite
limite. De exemplu dac partea de suprafa a unei stnci
se erodeaz cu o anumit rat medie de centimetri pe an
este posibil a se prognoza cu o oarecare aproximaie cu
ci centimetri se va fi erodat suprafaa stncii n viitori 5
ani.
n concluzie statistica pune la dispoziia geografului
prin metodologia i principiile sale de cercetare i analiz
informaie asupra stabilitii i regularitii trecutului sau
prezentului unui proces, lucru care ajut la efectuarea unor
22

prognoze

probabile.

Astfel

predicia

unui

anumit

eveniment sau prognoza asupra rezultatului sau tendinei


unui proces, va implica ntotdeauna o anumit cantitate de
intuiie. Faptul c procesul respectiv s-a comportat cu
certitudine ntr-un anumit fel n trecut (zile, luni, ani, chiar
i secole) NU face imposibil, adic NU EXCLUDE
posibilitatea ca acesta s-i schimbe total comportamentul
n secunda urmtoare.

1.3. Noiuni statistice fundamentale cu


semnificaie n geografia uman1
Statistica opereaz cu o serie de termeni de
specialitate care reprezint noiuni fundamentale i care
sunt utilizate ca atare i de geografie atunci ct se apeleaz
la cuantificare sau metodologia statistic pentru analiz.
Geografia uman ns, are un punct de vedere mult mai
general n ceea ce privete terminologia acestor noiuni
fundamentale. Ea nu le definete i nu se preocup de
teoria lor, le preia ca atare, le utilizeaz selectiv i cel mai
adesea opereaz cu o terminologie paralel mult mai de
1

Noiunile statistice fundamentale n turism sunt considerate


componente conceptuale ale disciplinelor umanisten general i deci
i din geografia uman.

23

ansamblu n desemnarea noiunilor statistice dar derivat


din aceasta. Ca urmare autoarea consider necesar o
trecere n revist a noiunilor fundamentale ale statisticii.
Acestea vor fi prezentate n linii mari dar nu selectiv i n
corelaie cu semnificaia acestora din punct de vedere
geografic, uman i turistic.
De asemenea nainte de a trece la prezentarea
acestora autoarea consider necesar s menioneze faptul
c n literatura de specialitate, statisticienii utilizeaz
denumiri variate pentru aceeai termeni, lucru care vine s
sublinieze necesitatea prezentrii i explicrii cel puin a
noiunilor statistice fundamentale de interes pentru
geografi i lucrtorii n turism. Prezentarea care urmeaz
se bazeaz pe punctele de vedere ale autorilor M arc din
lucrarea intitulat, Tratat de statistic aplicat, A. Novak
din Statistica i sondajul de opiniei, A. Isac-Maniu,
Statistica, D. Ebdon,

Statistics in Geography, a

practical approach; I F. Clegg,

Simple statistics; a

course book for the social sciences.


n studiul cantitativ al fenomenelor de mas,
statistica folosete un numr mare de noiuni i concepte.
Dintre acestea unele au caracter general i formeaz
24

vocabularul de baz a statisticii iar altele au caracter


specific. Cele fundamentale sunt: colectivitile statistice,
unitile statistice i caracteristicile unitilor statistice.
a)

Colectivitile statistice

Colectivitile statistice mai sunt cunoscute i sub


denumirea de populaii statistice constituind principal
form sub care se delimiteaz i definesc fenomenele de
mas din natur, societate sau economie.
Conform
statistic

autorului

reprezint...

un

M.

arc,

ansamblu

Colectivitatea
de

fenomene

individuale, care au una sau mai multe caracteristici


eseniale comune, bine definite, proprii tuturor unitilor ei
componente (Tarc, 1998, p. 51). Cu alte cuvinte ea
desemneaz elementelor (inclusiv cnd acestea iau forma
unor procese sau fenomene) de aceeai natur, sunt
asemntoare sau sunt omogene din anumite puncte de
vedere sau criterii.
Conform

aceluiai

autor

colectivitile

se

caracterizeaz prin existena lor de sine stttoare, bazat


pe asociaie, pe legturi ntre elementele lor componente,
statistica ocupndu-se numai de acele colectiviti care
25

sunt finite, a cror existen este obiectiv i concret sau


faptic (arc, 1998).
Colectivitile statistice se prezint n forme foarte
variate, delimitndu-se adesea n timp i spaiu din punct
de vedere al coninutului i formelor lor de organizare.
Exist numeroase exemple de colectiviti statistice dintre
care amintim: populaia unui ora sau a unui jude,
numrul de nateri la o anumit populaie ntr-o perioad
determinat de timp, numrul cstoriilor dintr-un ora
dintr-o perioad de timp determinat, cantitile de
precipitaii dintr-o regiune pe o perioad de timp
determinat, debitul unui ru pe o perioad de timp
determinat, parcul de autovehicule ce deservesc tur
operatorii dintr-un jude sau o ar, agenii turistice dintrun jude sau ar, uniti de cazare dintr-un jude sau ar,
etc. n concluzie colectivitile statistice pot fi formate din
fiine, lucruri sau manifestri ale acestora fie c sunt ele
fapte sau evenimente.
n funcie de tipul de legi i intensitatea cu care
acestea acioneaz asupra elementelor unei colectiviti,
aceasta prezint un anumit grad de omogenitate dar i o
tipologie a omogenitii colectivitilor. Astfel exist
26

colectiviti mai mult sau mai puin omogene, mai largi


sau mai restrnse alctuite sau nu din subcolectiviti . Din
punct

de

vedere

al

tipologiei

sale

omogenitatea

colectivitilor poate fi privit sub trei aspecte principale;


calitativ, de timp i de spaiu rezultnd n principiu
omogenitate:
calitativ

dat

de

nsuirea

elementelor

componente care le definesc. De exemplu n


funcie de sex populaia unei ri poate fi
omogen masculin sau feminin sau n funcie
de vrst, format din tineri, aduli sau vrstnici
ori despre o colectivitate privind produsele
turistice oferite n funcie de destinaie acestea
pot fi interne sau externe etc.
de

timp

pentru

colectivitile

ale

cror

elementele componente au nsuirea de a


aparine aceluiai moment sau perioade de timp.
Condiia momentului sau perioadei de timp
influeneaz evoluia i dinamica colectivitii
respective. De exemplu populaia unei ri la un
anume recensmnt, numrul de turiti strini
dintr-o ar ntr-o anume perioad etc.
27

de spaiu cunoscut i sub denumirea de


omogenitate

teritorial

reprezint

nsuirea

elementelor componente ale unei colectiviti de


a aparine unui anumit teritoriu i care imprim
anumite trsturi colectivitii respective.
Colectivitile statistice se mai clasific dup natura
lor n colectiviti de fiine sau lucruri cunoscute sub
denumirea de colectiviti statice, colectiviti de fapte sau
eveniment cunoscute sub denumirea de micare (arc,
1998).

Iar

funcie

de

gradul

de

cuprindere

colectivitile pot fi generale (totale, complete)

sau

pariale (de selecie).


b)

Unitile statistice.

Elementele componente ale colectivitilor care se


nregistreaz cu nsuirile lor poart denumirea de uniti
statistice, ele sunt purttoare de informaie sau sunt
subiecte logice ale informaiei deoarece asupra lor se
efectueaz

nemijlocit

observrii

statistice

observaia.
i

Ele

nregistrrii

sunt

supuse

nsuirile

lor

corespunztoare. Ca urmare ele mai sunt ntlnite i sub

28

denumirea de uniti de observare care trebuiesc clar


definite, identificate pe teren, nregistrate i apoi analizate.
Unitile statistice mai pot fi privite ca fapte simple
elemente care fac obiectul observaiei indiferent de natura
lor, cu condiia de a rspunde cerinelor unei definiii
precise, ele putnd fi fiine, fapte, evenimente, opinii,
comportamente, atitudini, obiceiuri etc. Dup numrul de
caracteristici necesare pentru definirea, descrierea i
exprimarea lor acestea pot fi:
Uniti statistice simple reprezint unitile
formate dintr-un singur element indivizibil, cum
ar

fi

spre

exemplu

persoana

cazul

recensmntului, copilul nscut viu n cadrul


natalitii, turistul cazat ntr-o unitate hotelier,
vizitatorul unui muzeu, biletul de tratament ntro staiune balneoclimateric etc.
Unitile statistice complexe reprezint unitile
formate din dou sau mai multe uniti simple,
constituite ca rezultat al organizrii sociale i
economice a colectivitii. De exemplu: familia
format dintr-un numr oarecare de membrii,
grupa de studeni din cadrul unui an, a unei secii
29

dintr-o facultate, clasa de elevi ntr-o coal,


hotelul format dint-un anumit numr de camere
duble ori simple i un anumit numr de
apartamente, grupul de turiti dint-o anume
excursie, familia aflat ntr-o anume categorie de
vacan, agenia turistic, turoperatorul etc.
Conform autorului arc (1998) definirea clar i
precis a unitilor statistice este o condiie de baz n
cercetare deoarece este necesar ajungerea la nregistrri
de date comparabile. Definiia unic pe ntregul arealului
cuprins n cercetare st la baza comparaiilor ce trebuie
fcute ntre aspectele diferite pe care mbrac un anumit
fenomen n teritorii diferite, n funcie de condiiile
specifice ale dezvoltrii (arc, 1998).
Acelai

autor

denumete

totalitatea

unitilor

statistice care fac parte din cadrul unei colectiviti volum


al

unitii

respective.

Volumul

colectivitilor

se

determin prin identificare, nregistrare, numrare i


totalizare

unitilor

care

aparin

prin

colectivitilor respective.
c)
30

Caracteristicile unitilor statistice

definiie

Aceasta desemneaz nsuirea, proprietatea, trstura


comun unitilor unei colectiviti statistice reinut ntrun program de cercetare pentru a fi nregistrat i care
capt accepiuni diferite de la o unitate la alta sau de la
un grup de uniti la altul.
nsuirea sau trstura comun tuturor unitilor
statistice ale unei colectiviti, ale crei valori difer, n
general, de la o unitate statistic la alta sau de la un grup
de uniti la altul, poart denumirea de caracteristic
statistic(arc, 1998, p.55). De obicei fiecare unitate
statistic are mai multe caracteristici dintre care numai una
sau numai unele prezint interes pentru un studiu sau
cercetare.
Caracteristicile statistice sunt cel mai frecvent
ntlnite sub denumirea de variabile statistice iar valorile
nregistrate de aceeai caracteristic/variabil statistic se
numete variant.
Exemple bine cunoscute de variabile statistice din
geografia uman spre exemplu, sunt: populaia unui jude
cu caracteristicile privind: sexul, vrsta, calificarea,
starea civil, naionalitatea, religia etc sau turitii sosii
pentru anumit perioad ntr-o staiune balnear, cu
31

caracteristici privind: vrsta, sexul, starea civil, nivelul


de pregtire profesional, venitul lunar, domiciliul stabil
etc.
nainte de a trece la clasificarea variabilelor statistice
este necesar o concluzionare a teoriei noiunilor
fundamentale statistice. Pentru aceasta autoarea va apela la
limbajul matematic tocmai pentru a evidenia esenialul n
ceea ce reprezint de fapt cele trei noiuni fundamentale
amintite. Ca urmare din punct de vedere statistic cele trei
noiuni statistice fundamentale prezentate

mai

sus

(colectivitatea/populaia, unitatea i caracteristica/variabila) se exprim astfel: pentru un caz general valabil al


unei populaii statistice (totale sau n eantion n funcie
de cercetare/studiu dac este total sau selectiv) notat cu
P , unitile statistice ale acesteia sunt descrise printr-un
numr k (unde k

1) de elemente (sau cu alte cuvinte ea

este alctuit din k uniti), fiecare dintre acestea fiind


definit dup cum urmeaz:
Printr-o mulime de valori individuale denumite
variate sau un spaiu de observaii (M)
Printr-o

structur

algebric

specific

existent pe spaiul de observaii (M)


32

SA

Printr-o aplicaie u a lui P pe M


Variabile statistice sau caracteristicile unitilor
statistice se pot clasifica din mai multe puncte de vedere:
a) Dup proveniena, modul de colectare i treapta
de cercetare
b) Dup importana lor
c) Dup numrul de valori pe care le pot lua
d) Dup modul de exprimare i natura lor
e) Dup modul cum reflect realitatea
Dup

proveniena,

obinerea

treapta

de

cercetare/studiu utilizate, se clasific n dou grupe:


primare i secundare sau derivate
Caracteristicile primare ale variabilelor statistice
reprezint acele nsuiri ale cror valori rezult direct din
nregistrarea sau msurarea statistic a colectivitii, de
pe teren sau din realitate. Ele se exprim de regul n
mrimi absolute sau prin cuvinte fiind adesea ntlnite
direct sub denumirea de variabile statistice primare.
n geografie acestea sunt cunoscute ca fiind generate,
colectate

prin

msurtoare

sau

observaie

direct,

indiferent de forma, tehnica i metodologia acestora


33

(msurtorii, observaiei), efectuat de cercettor sau


persoanele abilitate direct pe teren. Din punct de vedere
geografic sunt incluse n categoria date i mai sunt
cunoscute i sub denumirea de date primare sau empirice
(unde termenul empiric indic faptul c au fost colectate
direct din realitate de ctre cercettor, persoana care
efectueaz studiul sau persoana abilitat, i nu s-a
intervenit asupra lor n nici un fel, conin informaie
brut). Nu este exclus prezena informaiei care nu ia
form numeric din aceast categorie.
Caracteristicile secundare sau derivate rezult din
prelucrarea informaiilor, msurtorilor, determinrilor
obinute prin nregistrarea statistic ele putnd fi
exprimate prin mrimi absolute, medii sau relative. Practic
acestea rezult n urma unei intervenii de un anume gen
(mai mult sau mai puin complex) ca de exemplu a
aplicrii de modele, metode sau simple operaii de calcul
statistic ori estimri, comparaii, evaluri. Ele sunt adesea
ntlnite sub denumirea de variabile statistice secundare
sau derivate.
n geografie sunt cunoscute ca fiind generate,
colectate de altcineva, coninnd un anume grad de
34

intervenie asupra lor i fiind publicate ntr-o form sau


alta.

Terminologia

geografic

utilizeaz

marea

majoritate a cazurilor denumirea de date secundare sau


derivate pentru aceast categorie de variabile i nu exclude
din aceast categorie prezena informaiei care nu ia form
numeric. (Vezi tabelul 1 din anexa 1.1.)
Dup importana lor n procesul cunoaterii i
cercetrii caracteristicile sau variabilele statistice pot fi
eseniale, care definesc colectivitatea i sunt prezente la
toate unitile componente, i ne eseniale sau caracter
ntmpltor.
Dup numrul de valori pe care le pot lua (niveluri
sau variante) caracteristicile sau variabilele statistice se
mpart n dou grupe: variabile alternative sau binare i
variabile nealternative. Variabilele alternative sau binare
sunt acele nsuiri ale unitilor statistice care nu pot lua
dect dou valori ca de exemplu sexul (masculin,
feminin), mediul (fizic sau antropic), mediul antropic
(rural, urban) etc. Variabilele nealterntive reprezint
trsturi ale unitilor statistice care pot lua mai mult de
dou niveluri sau valori. n marea majoritate a cazurilor
avem de a face cu variabile nealternative iar de regul
35

cnd nu se face nici o specificaie privind numrul de


niveluri sau valori ale unei variabile se presupune automat
prin aceasta una nealternativ.
Dup

modul

de

exprimare

natura

lor,

caracteristicile sau variabilele statistice se pot mpri n


dou grupe principale: variabile numerice cunoscute i
sub denumirea de variabile cantitative (care pot fi: de
timp, de spaiu) i variabile atributive sau calitative (sau
de coninut).
Caracteristicile

sau

variabilele

cantitative

reprezint nsuiri ale unitilor, care prin nsi natura lor


sunt msurabile i se pot exprima cifric, numeric sau
cantitativ; spre exemplu: vrsta vizitatorilor unui muzeu,
numrul personalului hotelier, numrul de vehicule dintrun parc auto, valoarea unui sejur de 10 zile pe litoral,
nnoptrile la un hotel, gradul de ocupare al unei uniti de
cazare, numr locuri cazare,etc.
Caracteristicile cantitative reprezint rezultatul unei
msurtori pentru care se pot defini relaii de egalitate i
nsumare. (arc, 1998). Uneori o caracteristic cantitatv
poate fi privit sau transformat calitativ n scopul
36

simplificrii i sintetizrii realitii (exemplu: veniturile


relaizate de o agenie de turism ntr-o anumit perioad de
timp pot fi mprite n trei categorii: mici, medii, mari).
Transformarea nu este posibil i invers.
Att caracteristicile cantitative ct i cele calitative
pot desemna diverse stri exprimate prin valori numerice.
Acestea se numesc variante sau modaliti. (Vezi
exerciiul 1 din anexa 1.1.)
Msurarea unei caracteristici pe care o posed o
unitate statistic const n atribuirea unui scor, care arat
n ce grad ea posed o proprietate coresunztoare
caracteristicii respective prin utilizarea unei scri de
msur. Variabilele asupra crora se poate aplica acelai
ansamblu de operaiuni de prelucrare statistic se numesc
variabile msurabile pe aceeai scar. Se cunosc i se
utilizeaz patru scri de msurare: scara interval , cea
proporional, scara nominal, scara ordinal.
Din

punct

de

vedere

pur

teoretic

statistic

caracteristicile sau variabilele cantitative utilizeaza scrile


proporional i respectiv interval. Astfel ele se mai
numesc :

37

Variabile cantitative metrice, cele care posed


un zero natural, o origine absolut i se msoar
cu ajutorul unei scri proporionale sau de
raport. De exemplu datele statistice utilizate n
meteorologie i climatologie.

Variabile cantitative scalate, nu posed un zero


natural, au origine arbitrar i se msoar cu
ajutorul unei scri de intervale.

Adesea, n statistic noiunea de caracteristic


cantitativ se nlocuiete cu noiunea de variabil iar n
geografie cu cea de dat numeric i respectiv interval.
Dat

fiind

natura

preponderent

proceselor

fenomenelor de mas din geografia uman, aceasta


utilizeaza n cea mai mare parte variabile cantitative
scalate, intervale.
Trebuie reinut faptul c un anumit nivel al
caracteristicii poart denumirea de de variant a
caracteristicii sau variant a unei anumite variabile. Din
punct de vedere al naturii variaiei, variabilele cantitative
se mpart n dou categorii: discrete (discontinue) i
continue.

38

Se spune despre o variabil c este discret dac


variantele ei posibile pe un anumit interval sunt valori
izolate, cazul cel mai frecvent de variabile discrete fiind
acela n care valorile ei posibile sunt numere ntregi. De
exemplu numrul vizitatorilor la Muzeul Naional n luna
decembrie nu poate fi exprimat dect printr-un numr
ntreg pentru intervalul respectiv.
Dimpotriv, o variabil este continu dac variantele
ei posibile sunt n numr infinit n cadrul unui anumit
interval. De exemplu: distana medie parcurs n timpul
unei cltorii, consumul mediu al unui anumit produs,
gradul de ocupare a unei anumite uniti de cazare ntr-o
anumit peioad. Variabilele continue continue pot fi
exprimate prin orice fel de numr.
Caracteristicile

sau

variabilele

atributive

ori

calitative reprezint variabilele statistice ale cror variante


(modaliti)

reprezint

nomenclator

stabilit

diferite
astfel

nct

rubrici

ale

acestea

unui
s

fie

incompatibile i exhaustive. Ele reprezint nsuiri ale


unitilor statistice care se exprim att numeric ct i prin
cuvinte (n cazuri excepionale prin imagini) ca de
exemplu: starea civil a populaiei, destinaii de vacan,
39

percepia unui eantion de populaie asupra a ceva anume,


gradul de satisfacie privind un produs turistic sau
rezultatele unor teste, opinii privind un anume eveniment,
proces, fenomen, gradul de satisfacie, calitatea unui
produs turistic, etc. (Vezi exerciiul 2 din anexa 1.1.)
Din

punct

de

vedere

pur

teoretic

statistic

caracteristicile sau variabilele calitative utilizeaz scrile


nominale i respectiv ordinale. Astfel ele se mai numesc :

Variabile calitative nominale, cnd acestea pot


fi doar numite, reprezint simple etichete de
identificare. Astfel scala nominal are mai mult
funcia de procedeu de clasificare dect de
msurare dnd numai o relaie de echivalen
asupra crora nu se pot face operaii aritmetice
elementare. (Vezi exerciiul 3 din anexa 1.1.)

Variabile calitative ordinale, cnd acestea pot fi


clasificate dup o dimensiune, direcie sau
criteriu de proprietate considerat, n sensul c
unitatea statistic posed grade diferite ale
proprietii considerate.Cu acestea nu se pot
efectua operaii aritmetice. (Vezi exerciiul 4 din
anexa 1.1.)

40

n geografie i nu numai, aceste variabile se ntlnesc


sub denumirea simplificat de date numerice cantitative
(intervale i proporionale) sau calitative (nominale i
ordinale). Cu meniunea c forma de exprimare cifric a
unei variabile are dimensiune (variant, nivel) atributiv
sau calitativ ncazul datelor cantitative.
Dup modul cum reflect realitatea variabilele
statistice pot fi clasificate n dou categorii: certe (precise)
cele cu valori observate, rezultate dintr-un raionament a
posteriori n cadrul analizei retrospective i; aleatoare cu
valori care nu au fost observate, rezultate dintr-un
raionament a priori n cadrul analizei retrospective.

41

Anexa 1.1.
Tabelul 1
Numrul de vizitatori n staiunile
balneoclimaterice romneti n perioada
1985 - 2000
Destinaiile de vacan ale unui eantion de
100 de studeni ai Facultii de Geografie,
Bucureti
Reprezentarea Spaniei ca destinaie turistic
ntr-un eantion de 10 brouri diferite
Comportamentul spaial al turitilor din
staiunea Poiana Braov n perioada 6 - 21
decembrie 2002
Contribuia turismului la PNB-ul arii n
perioada 1970 2000
Ghidul Lonely Planet pentru Europa de
Est
Percepia cetenilor britanici asupra
Romniei ca destinaie turistic
Ilustrate ale staiunii Mamaia din perioada
1970 2000
Preul unui pachet de vacan de 2 sptmni n Grecia la 10 agenii turistice diferite
Cantitatea de precipitaii din judeul Braov
din anii 1980 - 2000
Preul ceramicii artizanale din pieele
bucuretene
Pre cazare la Hotelurile din Judeul
Mehedini
Mesaje coninute de materialele
promoionale turistice ale Ungariei
42

secundar
primar
primar
primar
secundar
secundar
secundar
primar
primar
secundar
primar
prim.+ sec.
secundar

Exerciiul 1
Privii cifrele de mai jos n relaie cu ceea ce exprim ele.
Sunt asemntoare sau difer? Prin ce?
Cele mai
recente
destinaii
turistice:

Exprimai gradat
nivelul de
satisfacie al celei
mai recente
vacane, unde:

Numrul de
vizitatori la
muzeul
memorial Liviu
Rebreanu n
ultimii 5 ani:

1 = Croaia
2 = Ungaria
3 = SUA
4 = Maramure
5 = Egipt

1 = excelent
2 = bine
3 = satisfctor
4 = nesatisfctor
5 = ru

125.000
138. 258
132.289
120.610
125.000

Da / Nu
Diferena
1............................................................................................
Diferena
2............................................................................................
Diferena
3............................................................................................

43

Tabelul 2
Durata medie a sejurului pentru vizitatorii
oraului Sighioara
Densitatea schiorilor de pe prtia... din
Poiana Braov
Modul de prezentare al Franei ca destinaie
turistic de ctre Rough Guide
Mesaje coninute de materialele
promoionale turistice ale Ungariei
Numrul de vizitatori la Muzeul Militar
Central din Bucureti
Impresiile de cltorie ale vizitatorilor
Indiei n ghidurile de cltorie din secolul
XIX
Strategiile de dezvoltare turistic prevzute
de Ministerul turismului pentru patrimoniul
istoric
Poluarea vizual din Parcul Natural Porile
de Fier
Observaii asupra comportamentului
vizitatorilor Muzeului ranului Romn
Proporia vizitatorilor americani din
hotelurile oraului Manchester

44

cantitativ
cantitativ
calitativ
calitativ
cantitativ
calitativ
calitativ
calitativ
calitativ
cantitativ

Exerciiul 2
Observai cifrele de mai jos. Exprim o caracteristic
cantitativ sau una calitativ?
Destinaii de vacan Forme de
turism

Organizaii
turistice statutare
din Marea
Britanie

1 = Austria
2 = Tenerife
3 = Poiana Braov
4 = Grecia

1 = ETB
2 = WTB
3 = STB
4 = NITB
5 = BTA

1 = odihn
2 = tranzit
3 = afaceri
4 = conferine

Exerciiul 3
Determinai destinaia preferat de vacan a unui eantion
de populaie utiliznd ntrebarea: Unde v-ai petrecut o
parte din vacana de iarn?, i rspunsurile urmtoare:
1 = la munte
2 = la mare
3 = acas cu familia
4 = la bunici
5 = n strintate
6 = n vizit la rude sau prieteni
7 = alte situaii
Ce fel de variabile reprezint cifrele variantelor de
rspuns?

45

Exerciiul 4
Ce fel de variabile reprezint cifrele variantelor de
rspuns?
Indicai nivelul de
satisfacie atins n timpul
ultimei vacane de iarn

Oraul Caracal nu este


foarte cutat ca destinaie
turistic:

5 = excelent
4 = bine
3 = n regul
2 = nesatisfctor
1 = plictisitor; ru

5 = foarte de acord
4 = de acord
3 = fr opinie
2 = nu sunt de acord
1 = total mpotriv

46

Capitolul 2
PROCESUL DE GRUPARE A INFORMAIEI
GEOGRAFICE DE ORDIN STATISTIC
2.1. Gruparea informaiei geografice statistice
concept teoretic
Primul pas n utilizarea informaiei geografice de
ordin statistic n care se regsete i informaia strict
turistic, dup colectare este
sistematizare

sau

clasificare

acela de grupare,
a

evenimentelor

fenomenelor pe care le-au studiat nc din antichitate.


Acesta a aparut ca urmare, mai ales a posibilitilor
limitate de stocare a unui volum mare de fapte i de
cunotiine, descoperite, n toate etapele istorice ale
dezvoltrii umanitii, n condiiile n care acesta a
reprezentat un proces n continu cretere. Asfel apariia i
dezvoltarea metodei gruprilor este strns legat de
necesitatea

de

ordona,

ierarhiza

sistematiza

fenomenele i faptele din natur i societate dup criterii


logice.

47

nceputul a presupus recurgerea la clasificrile


taxonomice care necesitau un criteriu uor de aplicat, cum
ar fi succesiunea cronologic a faptelor i evenimentelor.
Primele aspecte teoretice privind clasificrile au fost
ntocmite n Grecia antic de ctre Platon (427 .e.n. 348
.e.n.), avnd la baz dihotomia, (diviziunea la doi
membri),

considerat

principiul

raional

al

orcrei

clasificri. Ulterior acest principiu a fost criticat de ctre


Aristotel ( 384 .e.n. 322 .e.n care a susinea c n
realitate, cel mai frecvent, clasificarea dihotomic
superficial i dificil de aplicat (arc, 1998).
Gruparea informaiei statistice a continuat s
intereseze i s constituie o disput n ceea ce privete
acurateea ei tiiific. Metoda gruprilor, aprut de
asemenea din antichitate a fost permanent subiect de
perfecionare pn n prezent. Aspectele conceptologice
fundamentale ale gruprilor nu au fost nc deplin
clarificate i contin (arc, 1998).
Geografia Uman i ramura sa, turismul opernd cu
aspecte msurabile ale fenomenelor colective, reprezint
domenii interesate de clasificarea noiunilor, principiilor i
metodelor de grupare a unitilor unei colectiviti, n
48

vederea eficientizrii prelucrrii, analizei i sintezei lor.


Aceasta urmez ns tendina general de operare a
statisticii.
Informaiile

geografice

statistice

obinute

prin

nregistrarea caracteristicilor unitilor cercetate prezint,


n general, un numr mare de variante care nu permite
formarea unei imagini concrete i complete asupra unor
colectiviti i de aceea este necesar ordonarea unitilor
n funcie de nivelul de dezvoltare al caracteristicilor
eseniale. Dac numrul variantelor unei variabile
statistice este foarte mare, aceasta nu d posibilitatea
evidenie-rii anumitor regularitice se manifest n cadrul
colectivitii la diferite grupe de uniti.
mprirea colectivitilor statistice n grupe
omogene de uniti, dup variaia uneia sau a mai multor
caracteristici

eseiale,

comune

tuturor

unitilor

colectivitii, poart denumirea de grupare statistic,


stratificare sau clasificare, iar grupele se mai numesc
straturi sau clase (arc, 1998, p. 74).
Gruparea informaiei geografice reprezint un stadiu
foarte important n special n ceea ce privete informaia
statistic deoarece, de modul cum sunt alctuite grupele,
49

depinde n mare parte, cunoaterea tipurilor calitative care


se contureaz n cadrul colectivitilor social-economice,
structura

colectivitilor,

coninutul

indicatorilor

ce

urmeaz a fi calculai i pe baza acestora lor a rezultatelor


obinute. Astfel, orice grupare a unitilor unei colectiviti
trebuie s fie precedat de o analiz multilateral a esenei
fenomenelor cercetate.
Pornind de la informaiile sistematizate prin grupare,
se pot obine indicatori generalizatori, difereniai pe
grupe, care s permit o analiz stiinific a fenomenelor i
proceselor social-economice, a legturilor eseniale dintre
acestea.
Gruparea

informaiei

presupune

alegerea

unui

criteriu care s exprime cel mai clar esena fenomenului


studiat i care rspunde cel mai bine scopului cercetrii.
Procesul

de

grupare

statistic

informaiei

presupune respectarea unor reguli elementare precum:


a)

Gruparea

unitilor

statistice

(respectiv

variantelor unei variabile) nu este raional i nici


avantajoas dect dac numrul variantelor variabilei de
grupare este suficient de mare.

50

b) Gruprile nu prezint interes dect n cazul n care


numrul de grupe (clase) este relativ redus (de obicei pn
la 15).
c) Numrul de grupe trebuie s fie suficient de mare
pentru a putea a scoate n eviden anumite particulariti
ale distribuiei unitilor statistice n cadrul colectivitii
studiate.

2.2. Tipurile de grupri ale informaiei


geografice statisice
n practic de fapt exist o mare diversitate de
grupri ceea ce necesit o clasificare a lor n funcie de
anumite criterii, cum ar fi natura colectivitilor i scopul
cercetrii.
a). n funcie de numrul de caracteristici care stau
la baza gruprilor exist: grupri simple i grupri
combinate sau complexe.
Gruprile simple iau natere n urma aplicrii unei
singure caracteristici de grupare, de exemplu, gruparea
unitilor de cazare dup numrul salariailor, n anul 2000
(tabelul 2.1.)

51

Regrupnd unitaile de cazare pe intervale de variaie


mai mari (vezi ultima coloan a tabelului 2.1.) se poate
obine o imagine a tipurilor calitative care se difereniaz
n cadrul colectivitii. Astfel, se disting tipurile:
uniti mici, care cuprind pan la 200 de salariai;
uniti mijlocii, avnd numrul salariailor ntre
201 i 1000;
uniti mari, n care lucreaz ntre 1001 i 5000
salariai;
uniti foarte mari, care au numrul salariailormai
mare de 5000.
Tabelul 2.1. Distribuia unitilor de cazare din judeul
Mehedini dup numrul salariailor i total numr
cazai la sfritul anului 2000
Uniti
cazare
<2
2 -5
5 -10
10 20
20 30
52

Salariai
Valori
absolute %
1
0,7
4
2,9
6
4,5
15
10,2
24
16,9

Total numr cazai


Valori
absolute
24288
162505
391386
723116
592538

%
1,9 1,9
5,2 15,9
10,7
18,9
14,3

30 50
>50
TOTAL

38
46
143

27,2
34,1
100,0

768760 20,6 53,8


1039263 28,4 28,4
3701856 100,0 100,0

Sursa: Direcia judeean de statistic Mehedini

Gruprile simple sunt utile pentru caracterizarea


structurii colectivitilor, pentru determinarea tendinei de
concentrar a fenomenelor, pentru evidenierea tipurilor
calitative care se contureaz n dezvoltarea fenomenelor i
pentru rezolvarea altor probleme ale cercetrii statistice,
dar nu permit studierea legturilor existente ntre
fenomene. Acest neajuns se nlatur cu ajutorul gruprilor
combinate.
Gruprile combinate utilizeaz dou sau mai multe
caracteristici, de exemplu, gruparea unitilor de cazare
dup numrul de salariai i dup mrimea numrul total
de cazai, gruparea salariailor dup vrste, sexe i medii
sociale, gruparea cazailor dup domiciliu, numrul de
nnoptri etc. n cadrul procesului de grupare combinat,
colectivitatea se mparte n grupe dup o anumit
caracteristic, apoi aceste grupe se mpart n alte grupe
mai mici dup o alt caracteristic i aa mai departe. Deci

53

numrul grupelor crete o dat cu numrul caracteristicilor


de grupare considerate.
n statistica aplicat i cu precdere n turism pentru
a se evita divizarea n exces a colectivitilor se aleg cel
mult trei sau patru caracteristici de grupare, iar pentru
fiecare caracteristic (de grupare) nu se formeaz un
numr prea mare de grupe. Gruprile combinate se
utilizeaz, n general, pentru cercetarea fenomenelor
complexe ntre care exist o legtur reciproc. De
exemplu, populaia unei ri nregistrat cu ocazia unui
recensmnt, poate fi grupat n mod combinat astfel:
dup mediul social n care triete, se poate mpri
n populaia urban i populaia rural;
att populaia urban ct i cea rural se poate
mpri pe sexe n populaia masculin i populaia
feminin;
la rndul lor populaia masculin i cea feminin,
astfel obinute se poate mpri n funcie de
caracteristica stare civil n patru grupe mai
omogene: necstorit, cstorit, divorat i vduv.

54

Bineneles c gruparea ar putea continua, n acest


caz, mai departe dup alte caracteristici sociale i
demografice. n mod similar se procedeaz cu informaia
turistic.
b) Coninutul caracteristicilor de grupare reprezint
un alt criteriu utilizat n ntocmirea de grupri,obinnduse urmtoarele grupri: dup caracteristici de timp, dup
caracteristici de spaiu i dup caracteristici calitative.
Gruprile statistice dup caracteristici de timp
permit efectuarea analizei dependenei fenomenelor
cercetate de timp i evidenierea tendinei lor centrale de
dezvoltare de lung durat, determinarea i separarea
oscilaiilor sezoniere i a celor ciclice, pentru fenomenele
care poart acest caracter i constituie informaia de baz
pentru efectuarea prognozelor. n cazul gruprilor dup o
caracteristic

de

timp,

unitile

colectivitii

se

repartizeaz n grupe dup timpul n care au aprut, au


existat sau au suferit un anumit eveniment.
Gruprile dup caracteristici de spaiu se utilizeaz
n practic pentru caracterizarea dezvoltrii fenomenelor
n profil teritorial, de exemplu: gruparea turitilor dup
destinaie, numrul mediu al angajailor n turism per
55

unitate teritorial, volumul comerului exterior pe ri,


populaia lumii pe ri, producia principalelor produse de
export pe ri etc.
Gruprile dup o caracteristic calitativ

se

utilizeaz n statistica aplicat pentru studierea structurii


diferitelor colecticviti i uneori a tipurilor calitative care
se separ n cadrul acestora, iar n acest caz se numesc
grupri tipologice. De exemplu, gruparea tur-operatorilor
dup numrul angajailor, structura turitilor pe sexe,
medii, grupe de vrst, categorii de destinaie, structura
fondurilor de dezvoltare naionale etc.
c). Forma de exprimare a caracteristicii reprezint
un alt utilizat n grupare pentru difereniere, gruprile
putndu-se mpri n dou categorii:
grupri dup caracteristici calitative, exprimate
prin cuvinte, numite i grupri tipologice sau
clasificri;(vezi capitolul 1, variabile calitative)
grupri dup caracteristici cantitative exprimate
numeric;(vezi capitolul 1, variabile cantitative).
La rndul lor gruprile dup caracteristici
cantitative pot fi de dou feluri, dup cum variaia lor este
discret sau continu. n cazul unor caracteristici discrete
56

gruparea se poate face, de regul, pe variante ale acesteia,


iar n cazul unor caracteristici continue, pe intervale de
variaie.

2.3. Intervalele utilizate n grupare


Adesea procesele i fenomenele evolueaz sub
aspectul nivelului unor caracteristici prezintnd un numr
foarte mare de variante, iar gruparea unitilor dup
variante ar duce la o divizare a colectivitii ntr-un numr
foarte mare de grupe mici, fr nici o semnificaie.nastfel
de situaii se procedeaz la reunirea colectivitii n grupe
pe anumite intervale de variaie. Fiecare interval are o
limit inferioar i o limit superioar. n funcie de
natura colectivitilor i scopul urmrit n cercetare, se pot
stabili intervale egale sau neegale de grupare .
Numrul de intervale de grupare, considerat pentru
o anumit variabil continu, depinde de mrimea
preciziei msurtorilor, de natur i volumul colectivitii
studiate i de scopul cercetrii. Stabilirea unui numr mare
de intervale poate determina apariia unor neregulariti
accidentale, datorit numrului redus de uniti cuprinse n
fiecare interval, dimpotriv, considerarea unui numr
57

foarte mic de intervale poate determina o pierdere de


informaie. ntre aceste dou situaii extreme de precizie
iluzorie i costisitoare dat de un numr foarte mare de
intervale mici i informaia insuficient exist n mod
logic un numr optim de intervale. Stabilirea numrului de
grupe este rezultatul unui compromis care depinde, mai
ales, de natura colectivitii cercetate. n funcie de natura
caracteristicii studiate, numrul optim de intervale se
situeaz n general ntre 10 i 15.
Un interval de grupare ( xi 1 xi )

i=

1, k

este

descris de trei elemente:


mrimea sau amplitudinea intervalului de
grupare:
a xi

= xi xi 1

centrul intervalului de grupare:


x i' =

xi 1 + xi
2

densitatea intervalului de grupare:


di=
58

ni
a xi

n cazul intervalelor neegale, d i permite mai buna


apreciere a greutii specifice (a pondereii relative) a
unitilor statistice care i aparin fa de volumul total al
colectivitii.
Mrimea intervalelor este determinat de necesitatea
obinerii de efective comparabile adic de acelai ordin
de mrime de la un interval la altul. n practic se
folosesc att intervale egale ca mrime, ct i intervale
neegale.
Limitele intervalelor trebuie s fie ntotdeauna valori
simple, de regul numere ntregi sau rotunjite.
n cazul unor intervale egale de grupare se
recomand, n literatura de specialitate, determinarea
acestora dup formula lui H.A.Sturges:
d=

x max x min
1 + 3,322 log N

n care:
d

= mrimea intervalului de grupare;

x max =varianta maxim a caracteristicii de


grupare;
x min =varianta minim a caracteristicii de grupare;
N = numrul unitilor colectivitii cercetate.

59

Cu ajutorul acestei formule se stabilete, n funcie


de numrul unitilor colectivitii cercetate N, mrimei
intervalelor d n care se pot grupa variantele unei
caracteristicipentru a limita volumul calculelor i nu a
pierde din informaie. Numitorul formulei mai sus
prezenate, reprezint tocmai numrul intervalelor de
grupare k.
Dac se cunoate numrul de intervale egale de
grupare k pentru o anumit colectivitate, atunci mrimea
acestora d se poate determina cu ajutorul formulei:
d=

x max x min
k

Din aceast relaie rezult c, atunci cnd se


cunoate mrimea intervalelor de grupare d ,numrul
acestora k se va determina astfel:
x max x min
d
Trebuie s precizm c asemenea formule de

k=

stabilire a mrimii intervalelor de grupare, cum este cea


elaborat de statisticianul american H. Sturges, au mai
mult o valoare orientativ i nu pot, n nici un caz, s
suplineasc analiza cantitativ a fenomenului cercetat.

60

Aplicarea n mod mecanic a acestei formule poate s duc


la rezultate nesatisfctoare n practic. De regul, pentru
fenomenele n curs de formare i dezvoltare, se recomand
a se utiliza intervale neegale de grupare, mai mici ctre
partea inferioar i mai mari spre partea superioar (arc,
1998).
O alt problem a gruprilor pe intervale este
stabilirea limitelor intervalelor de grupare.
Se disting mai multe cazuri:
a.

cnd

limita

superioar

face

parte

din

interval( tabelul 2.2. sau tabelul 2.3.)


Tabelul 2.2.
Caracteristica

Numrul unitilor

0-5

5-10

10-15

15-20

20-25

Total

16

61

Tabelul 2.3.
Caracteristica

Numrul unitilor

0
5

10

15

20

25

Total

16

b. cnd se precizeaz n mod explicit limitele intervalelor


de grupare:
Tabelul

62

Caracteristica

Numrul unitilor

0,1-5,0

5,1-10,0

10,1-15,0

15,1-20,0

20,1-25,0

Total

16

Desigur, cea mai precis modalitate de stabilire a


limitelor intervalelor este varianta b , dar ea nu se
utilizeaz n mod obinuit la una din formele variantei a.
n activitatea statistic se ntlnesc i situaii n care
nu se cunoate una dintre limitele intervalelor marginale
(limita inferioar a primului interval sau limita superioar
a ultimului interval). Dac n cercetare este absolut
necesar cunoaterea acestor limite, se va recurge la
obinerea

informaiilor

suplimentare

cu

privire

la

colectivitatea cercetat sau se vor utiliza mijloace indirecte


de estimare, numai n cazul n care prima modalitate este
inaplicabil.

63

Capitolul 3
INFORMAIA GEOGRAFIC
DE ORDIN STATISTIC PREZENTARE
I REPREZENTARE GRAFIC
3.1. Seriile de repartiie - terminologie,
importan i tipologie
Datele geografice de ordin statistic iniiale, obinute
n urma observrii fenomenelor i proceselor colective, se
prezint sub form brut ca o mas neordonat de date.
nainte ca acestea s fie supuse prelucrrii, analizei
ulterioare i generalizrilor, ele trebuie s fie ordonate,
grupate i sistematizate, astfel nct s permit obinerea
unei imagini clare asupra colectivitii la care se refer i
s se preteze la calcule algebrice ulterioare.
Ca rezultat al gruprii i centralizrii datele statistice
se sistematizeaz cu ajutorul unor tabele, sub forma a dou
iruri paralele de date, dintre care unul reprezint
variantele

sau

intervalele

de

vatiaie

ale

unei

caracteristici(variabile), iar cellalt, numrul de uniti

64

statistice corespunztoare fiecrei variante (sau fiecrui


interval de variaie), numit frecven.
S considerm, pentru exemplificare, o colectivitate
de fenomene constituit din n uniti statistice pentru care
se nregistreaz un anumit numr de caracteristici. Pentru
fiecare caracteristic X, Y,...Z se pot nregistra k niveluri
distincte ( x 1 , x 2 ,...,x i ,...,x k ), .....(z 1 , z 2 ,...,z i ,....,z
k

), a cror succesiune poate fi apariiei lor, n ordinea

mrimii lor sau la ntmplare (fr un criteriu bine


determinat). Un anumit nivel al caracteristicii (o anumit
variant a unei variabile) x i se poate ntlni fie la o
singur unitate statistic, fie la mai multe uniti. Numrul
unitilor statistice n i care poart un anumit nivel x i al
caracteristicii se numete frecven absolut, deoarece se
exprim n mrimi absolute.
Dac se mparte fiecare frecven absolut n i la
volumul total al colectivitii, se obine frecvena relativ,
notat cu f i , care se poate exprima sub form de
coeficieni sau n procente.

65

3.2. Seriile de repartiie unidimesionale


Prezentarea paralel a celor dou iruri de date x i i
n i sau x i i f i poart denumirea de serie de repartiie
sau distribuie statistic unidimensional ( dup o singur
caracteristic) sau distribuie empiric unidimensional.
Seriile de repartiie caracterizeaz fenomenele sub aspect
static i prezint distribuia unitilor unei colectiviti n
funcie de variaia unei variabile calitative de grupare,
prezint deci structura colectivitilor.
Suma

frecvenelor

absolute

ale

nivelurilor

individuale este egal cu volumul colectivitii la care se


k

refer seria

n
i =1

= n , iar suma frecvenelor relative este

egal cu unitatea:
k

f
i =1

f
i =1

66

100 = 100

=1

sau

ni
unde

fi =

n
i =1

100 =

ni
i =1

fi

100

i
i

Un anumit nivel al caracteristicii mpreun cu


frecvena lui reprezint un termen al seriei (x i , n i ) sau
(x i ,f i ).
Dac n 1 = n 2 = n 3 = ....= n i = ......= n k =
constant t, atunci se poate renuna n practic la scrierea
celui de al doilea ir n i ,iar irul x i poart denumirea de
serie de repartiie simpl.
n general, frecvenele n i sunt diferite unele de
altele (aceasta nu exclude egalitatea unora dintre ele) i
este necesar s se menin cel de al doilea ir de valori, iar
aceast prezentare paralel a celor dou iruri de valori
poart denumirea de serie de repartiie cu frecven.

67

Datele statistice sistematizate cu ajutorul seriilor de


repartiie constituie un element esenial al sistemului
informaional statistico-economic.
Alturi de distribuiile empirice unidimensionale
exist i distribuii teoretice, care corespund unei anumite
legi de probabilitate cu o singur variabil. Distribuiile
empirice iau natere pe baza unor experiene practice i au
un caracter statistic, de aceea se mai numesc i distribuii
statistice.
Distribuiile empirice ale fenomenelor reale din
natur i societate sunt studiate de ctre statistica aplicat,
n timp ce distribuiile teoretice sunt studiate de ctre
calculul probabilitilor i statistica matematic.
ntre disribuiile teoretice i cele empirice exist o
strns legtur. De multe ori este suficient nlocuirea
cuvntului probabilitate cu cel de frecven pentru a se
trece de la o demonstraie privind o anumit proprietate a
unei

distribuii

teoretice

la

demonstraia

privind

proprietatea analog a unei distribuii empirice.


Datele

statistice,

sistematizate

cu

ajutorul

distribuiilor empirice, constituie un element esenial n

68

cadrul cercetrii staistice pe baza cruia se pot determina


indicatorii derivai.
Frecvenele empirice se pot cumula din aproape n
aproape, ajungndu-se astfel la stabilirea distribuiilor
frecvenelor cumulate. Fie c este vorba de frecvena
absolut sau de cea relativ, frecvena cumulat a unei
valori empirice x i a caracteristicii este egal cu suma
frecvenelor tuturor valorilor mai mici sau mai mari dect
x i , inclusiv aceea a lui x i , n funcie de sensul cumulrii
N(x i ) i F(x i ) respectiv N(x i ) i F(x i ) n cazul
retrocumulrii.
Dac cumularea se face pornind de la nivelul minim
al lui x i spre cel maxim, ultima frecven cumulat este
egal cu totalul frecvenei seriei i deci cu volumul
colectivitii:
k

N(x k ) =

n
i =1

F(x

)=

f
i =1

Seriile de repartiie au o mare rspndire n statistica


social-economic, fiind utilizate pentru a reprezenta
69

structura diferitelor fenomene sociale i economice pe


sfere ale economiei naionale, pe sectoare de activitate, pe
ramuri ale economiei, pe forme de proprietate etc., de
exemplu,

distribuia

populaiei

dup

caracteristici

demografice, sociale, economice etc.


Dup modul de exprimare a caracteristicii de grupare
(numeric sau prin cuvinte), seriile de repartiie se pot
mpri n dou categorii:
serii de repartiie cu caracteristica exprimat
numeric sau cantitativ, numite i serii cu atribut
cantitativ; (vezi capitolul 1, variabile cantitative).
serii de repartiie cu caracteristica exprimat prin
cuvinte, care se mai numesc i serii cu atribut calitativ,
(vezi capitolul 1, variabile calitative)..
n cazul unor astfel de serii, frecvenele (absolute sau
relative) sunt funcii de anumite intervale, care sunt
compatibile de la un interval la altul, atunci cnd
intervalele sunt egale i necompatibile n cazul unor
intervale neegale.
Pentru a deveni compatibile de la un interval la altul,
i n acest caz se determin anumite mrimi abstracte,
numite
70

frecvene

transformate,

prin

mprirea

frecvenelor absolute sau a celor relative la mrimea


intervalelor corespunztoare, astfel:
'

ni =

ni
xi

'

fi =

fi
xi

unde: n i' - frecvena absolut transformat;


'

f i - frecvena relativ transformat;


xi = x i - x i 1
'

'

Frecvenele transformate n i i f i se mai numesc i


frecvene unitare sau frecvene pe intervale unitare.
Tabelul 3.1. Populaia total a Romniei pe grupe de
vrst la recensmntul din 7 ianuarie 1992
Grupa de
Numrul
Grupa de
Numrul
vrst
populaiei
vrst
populaiei
(ani)
(ani)
04
1 613 419
45 49
1 173 644
59
1 653 885
50 54
1 347 530
10 14
1 914 598
55 59
1 363 062
15 19
20 24

1 916 936
2 042 068

60 64
65 69

1 232 053
1 029 195

71

25 29
30 34

1 255 780
1 546 138

70 74
75 79

558 656
475 007

35 39
40 44

1 713 144
1 527 519

80 84
85 i peste

303 819
143 582

Total

22 810 035

Sursa: Anuarul statistic al Romnei, CNS, 1993, pp.96 98

Termenii seriei iniiale se pot grupa pe intervale


egale sau neegale, n funcie de natura fenomenului la care
se refer i de scopul ce se urmrete prin alctuirea seriei.
S considerm acum seria de distribuie cu
caracteristica exprimat numeric, reperentnd gruparea
municipiilor i oraelor din Romnia dup numrul
populaiei la recensmntul din 7 ianuarie 1992 (tabelul
3.2.)
Deci, din cele 260 de orae ale Romniei, existente la
data recensmntului, un numr de 109 aveau o populaie
de peste 20 de mii de locuitori, iar 25 de orae aveau o
populaie de peste 100 de mii de locuitori, din care 12
peste 200 de mii de locuitori. Paralel cu dezvoltarea
social-economic a rii a avut loc o cretere continu a
gradului de urbanizare, care s-a concretizat n sporirea
numrului de locuitori n localitile urbane vechi i n
72

cele nou nfiinate, ca i prin creterea numrului de orae


cu o populaie mai numeroas, cu importante implicaii
asupra structurii populaiei pe medii.

73

Tabelul 3.2. Distribuia municipiilor i oraelor din


Romnia dup numrul populaiei existente la
recensmntul din 7 ianuarie 1992
Grupe de orae dup
numrul de locuitori

Numrul
municipiilor
i oraelor

Sub 2000
2000 4999
5000 - 9999
10000 19999
20000 - 49999
50000- 99999
100000 - 199999
200000 - 999999
1000000 i peste
Total

1
10
54
86
61
23
13
11
1
260

Numrul populaiei
Persoane
%
1 969
37 848
414 173
1 183 395
1 910 006
1 723 713
1 827 016
3 226 154
2 067 545
12 391 819

*
0,3
3,3
9,6
15,4
13,9
14,8
26,0
16,7
100,0

* sub 0,1 %
Sursa: Anuarul statistic al Romniei 1993, CNS, Bucureti, p.91.

Distribuia municipiilor i oraelor din Romnia s-a


fcut pe intervale neegale de grupare, deoarece procesul de
urbanizare n ara noastr este n curs de desfurare. n
procesul complex de transformare a localitilor rurale n
centre urbane, se difereniaz o serie de etape cu o anumit
succesiune i semnificaie. De aceea este necesar, pentru
oraele cu un numr redus de locuitori, s se formeze
intervale de grupare mai mici, iar pe msur ce numrul
locuitorilor oraelor va crete , va crete i mrimea
74

intervalelor. n general, se poate aprecia c oraele dintrun anumit interval au trsturi i roluri specifice n viaa
economico-social din zon.
Astfel, oraele mici sunt fie centre industriale,
comerciale sau agro-industriale nou nfiinate, fie centre
urbane mai vechi cu importan turistic restrns. Oraele
mari municipiile concentreaz n ele o important
activitate economico-social i cultural, i sunt nuclee
puternice de urbanizare pentru zonele din care fac parte.
3.2.1. Seriile unidimensionale de repartiie
i reprezentarea lor grafic
Pentru a uura analiza i generalizarea rezultatelor,
seriile statistice pot fi reprezentate grafic prin intermediul
punctelor, liniilor, suprafeelor i a altor forme geometrice,
prin figuri naturale i simbolice, precum i cu ajutorul
hrilor. Aceast metod intuitiv, flexibil i foarte util
pentru lmurirea, interpretarea i analiza fenomenelor i
proceselor social-economice, poart denumirea de metoda
reprezentrii grafice a informaiilor statistice inclusiv
geografice.

75

Reprezentarea grafic a seriilor de distribuie


urmrete s scoat n eviden diferite pri ale
colectivitii studiate pe baza variaie caracteristicii i a
frecvenelor corespunztoare. Prin reprezentarea grafic a
acestor serii se obine o prim imagine asupra formei
distribuiei, asupra structurii i modificrilor structurale
n timp i n spaiu ale colectivitii i se pot determina
anumii indicatori.
Graficele utilizate pentru reprezentarea distribuiilor
statistice sunt numeroase. Forma i tipul acestora depinde
de natura fenomenului studiat i de scopul urmrit. Astfel,
n practic, se folosesc: diagrame prin benzi, histograme,
diagrame triunghiulare, diagrame de structur, diagrame
cu figuri naturale, simbolice etc.
Diagramele prin benzi sunt reprezentrile grafice
cele mai simple i foarte rspndite n practic. Lungimea
benzilor este direct proporional cu indicatorii reprezentai, iar limea lor este aceeai pentru toate benzile dintr-o
diagram. Aceste diagrame se utilizeaz n practic mai
ales pentru reprezentarea grafic a seriilor de distribuie cu
caracteristica exprimat prin cuvinte (fig. 3.1.)

76

Figura 3.1. Diagrama prin benzi


4

Nord

Vest
2

Est

1
0

50

100

O form specific de diagram prin coloane, utilizat


pentru reprezentarea distribuiilor statice unidimensionale,
este histograma.
Figura 3.2. Histograma
100
80
60

Est

40

Vest
Nord

20
0
1

Pentru construirea pe abscis, se trece mrimea


intervalelor de variaie a caracteristicii, respectndu-se
77

principiul ca intervale egale s fie repezentate prin distane


egale. Pe ordonat se construiete scara frecvenelor.
Pentru fiecare termen al seriei se ridic cte un dreptunghi
avnd baza pe axa absciselor egal cu mrimea
intervalului, iar nlimea proporional cu frecvena.
Coloanele se construiesc alturat, iar laturile superioare
formeaz o linie frnt, n trepte, cu caracter de
continuitate, care ofer

o imagine clar asupra formei

distribuiei.

suprafeele

Deoarece

coloanelor

sunt

proporionale cu frecvene reprezentate, suprafaa total a


histogramei este proporional cu volumul colectivitii
cercetate.
Un aspect deosebit de important care apare la
ridicarea i construirea histogramelor,
scrilor pe cele dou

este alegerea

axe de coordonate, deoarece de

mrimea lor i de raportul dintre ele depinde forma


graficului dar mai ales depinde expresivitatea lor i
relevana pentru procesul sau fenomenul exprimat. Este
astfel necesar un plus de atenie i analaz deoarece nu
exist criterii general valabile i bine conturate. Se ine n
general seama de urmtorul principiu: cu ct mrimea

78

intervalelor pe axa absciselor este mai mare, cu att


variaia fenomenului reprezentat apare mai uniform. n
situaia

invers

intervalele

prea

mici

frmieaz

dezvoltarea fenomenelor evideniind i variaiile lor


nesemnificative. Evident, ntre aceste dou situaii extreme
exist o variant care este cea mai potrivit pentru fiecare
fenomen reprezentat.
La construirea histogramelor se difereniaz dou
cazuri distincte dup cum seriile de repartiie au
intervalele egale sau neegale astfel acestea pot lua forma
diagramelor n trepte.

Figura 3.3. Diagrama n trepte

Poligonul frecvenelor este un alt tip de grafic


utilizat pentru reprezentarea seriilor de distribuie cu
atribut cantitativ. El se poate construi n dou feluri:
79

Dac se pornete de la histograma seriei, atunci,


pentru a obine poligonul frecvenelor, se unesc succesiv
mijloacele capetelor de sus ale coloanelor histogramei prin
segmente de dreapt (fig. 3.4.)
Aria poligonului frecvenelor este egal cu aria
histogramei pe baza creia a fost construit , deoarece linia
frnt a poligonului frecvenelor las n afar, din
suprafaa histogramei, o suprafa egal cu cea ncorporat
de poligonul frecvenelor din exteriorul histogramei.
Figura 3.4. Poligonul de frevcvene
100
80
Est

60

Vest

40

Nord

20
0
1

Poligonul frecvenelor poate fi construit i direct pe


baza seriei. n acest scop, de pe axa absciselor, din
mijlocul intervalelor, se ridic perpendiculare (linii

80

punctate) ale cror nlimi sunt proporionale cu


frecvenele respective. Unind, succesiv, prin segmente de
dreapta, capetele de mai sus ale perpendicularelor, se
obine poligonul frecvenelor.
Diagramele de structur reprezint forme speciale
de

grafice

construite

cu

ajutorul

suprafeelor

(dreptunghiuri, ptrate, cercuri, semicercuri etc.) i se


utilizeaz pentru reprezentarea structurii colectivitilor i
a modificrilor structurale intervenite n timp sau n spaiu.
Principiul de baz de care trebuie s se in seama la
construirea graficelor de structur este proporionalitatea
ntre mrimea fenomenului cercetat i mrimea suprafeei
figurii geometrice folosit pentru reprezentare. Grupele
din cadrul colectivitii se reprezint prin poriuni de
suprafa proporionale cu volumul lor. Modalitile
concrete de construire a acestor diagrame difer n funcie
de figura geometric de baz.
n cazul folosirii diagramelor prin dreptunghiuri,
suprafaa acestora trebuie s fie direct proporional cu
volumul colectivitilor cercetate, iar grupele din cadrul
colectivitii se reprezint prin poriuni proporionale din
suprafaa dreptunchiurilor. Raportul dintre suprafeele
81

acestor poriuni i suprafaa total a dreptunghiului trebuie


s fie egal cu raportul dintre volumul fiecrei grupe i
volumul total al colectivitii.
Figura 3.5. Diagrame prin dreptunghiuri i ptrate.

Diagramele de structur prin ptrate se constuiesc


pe baza respectrii aceluiai principiu al proporionalitii
ntre

suprafaa

ptratului

volumul

colectivitii

prezentate. Pentru aceasta se consider un ptrat care


reprezint colectivitatea (100 %) i apoi acesta se mparte
n 100 de ptrele, fiecare corespunznd unui procent. n
continuare, pentru fiecare grup a colectivitii, se separ
unnumr de ptrele egal cu ponderea prcentual a grupei
n totalul colectivitii.
82

Diagrama de structur prin cerc

const n

reprezentarea structurii colectivitilor prin sectoare de


cerc. Suprafaa cercului ntreg va fi proporional cu
volumul colectivitii de reprezentat:
S = R 2

de unde

R=

Figura 3.6. Diagrama de structur prin cerc

5%

27%

11%

1 5%

20%
22%

83

3.3. Seriile de repartiie multidimensionale


Alturi de distribuiile unidimensionale, n statistic
se utilizeaz numeroase distribuii dup dou, trei sau mai
multe caracteristici. Deoarece frecvenele n acest caz se
refer la mai multe caracteristici, distribuiile respective se
numesc distribuii multidimensionale sau serii de repartiie multidimensionale.
Cu toate c disribuiile multidimensionale nglobeaz, ca un caz particular, distribuiile unidimensionale,
n studiul lor apar i anumite probleme specifice care nu
au sens n cazul distribuiilor unidimensionale, cum ar fi
analiza legturilor dintre fenomene.
Ca i seriile de repartiie unidimensionale, seriile de
repartiie multidimensionale pot fi teoretice i empirice.
3.3.1. Seriile de repartiie bidimensionale
n cazul studierii a dou caracteristici ale unitilor
statistice ale unei colectiviti, distribuiile obinute se
numesc distribuii bidimensionale sau serii de repartiie
bidimensionale.
84

S considerm o colectivitate format din n uniti


statistice, care poart simultan dou caracteristici X i Y i
s notm cu x 1 , x 2 , x 3 ,.....,x i ,...., x k cele k variante
ale caracteristicii X, cu y 1 , y 2 , y 3 ,...., y i ,...., y

cele

p variante ale caracteristicii Y. Fie n ij numrul de uniti


ale colectivitii care poart n acelai timp varianta x i a
caracteristicii X i varianta y i a caracteristicii Y, deci n ij
este frecvena absolut, iar f ij frcvena relativ de la
intersecia lui i cu j.
3.3.2. Reprezentarea grafic a seriilor de repartiie
bidimensionale
Distribuia unitilor statistice ale unei colectiviti
dup dou caracteristici se poate reprezenta grafic n
spaiul bidimensional sau n cel tridimensional, n timp ce
distribuiile unidimensionale se reprezint n plan.
Pentru

reprezentarea

grafic

distrubuiilor

bidimensionale se pot utiliza diferite figuri geometrice, cu


scopul de a reda repartiia n ansamblu prin puncte,
suprafee, cercuri, paralelipipede dreptunghiulare etc.

85

Un grafic sugestiv, simplu de construit i de aceea


des utilizat n practica statistic este diagrama prin puncte
(Figura 3.7a), numit i diagrama sub forma unui nor de
puncte. Pentru construirea acestui grafic, se ia un sistem
de axe rectangulare pe care se nscriu cele dou
caracteristici X i Y, iar fiecare pereche de valori (x i ; y i
) se reprezint printr-un punct. Dac variaia celor dou
caracteristici se prezint sub form de intervale, atunci n
planul

xoy

se

construiete

reea

format

din

perpendicularele ridicate pe cele dou axe din punctele


corespunztoare limitelor intervalelor. Apoi n fiecare
ptrat (sau dreptunghi) al reelei se construiete un numr
de puncte egal cu frecvena corespunztoare.
Concentrarea acestor puncte ntr-o anumit zon din
planul axelor de coordonate ia forma unui nor, de unde
deriv i denumirea de nor de puncte (3.7b).

86

Figura 3.7a Diagrama prin puncte


20

Variabila B

15
10
5
0
0

10

15

20

Variabila A

Figura 3.7b
25

20

15

10

0
0

10

12

14

Cu ajutorul acestui grafic se poate aprecia existena


unei legturi dintre cele dou variabile X i Y , iar n
funcie de forma norului de puncte se apreciaz forma i
intensitatea acesteia. Astfel, dac punctele se disperseaz
fr nici o regul n ntreg planul xoy, nseamn c
87

informaiile empirice pe care le-am reprezentat grafic nu


ne spun nimic cu privire la existena vreunei legturi ntre
cele dou variabile. Dimpotriv, concentrarea punctelor
empirice ntr-o anumit zon a graficului constituie un
argument n favoarea ipotezei c ntre variabilele
reprezentate poate exista o anumit legtur.
Un exemplu clasic de reprezentare grafic a
distribuiilor

bidimensionale

constituie

piramida

vrstelor. Cu ajutorul ei se poate reprezenta distribuia


populaiei pe vrste i sexe la un anumit moment. Pentru a
construi un astfel de grafic pe axa vertical se trece vrsta
populaiei de la 0 la 100 de ani, iar pe orizontal, numrul
populaiei. Numrul populaiei de diferite vrste sau grupe
de vrste se reprezint printr-o band a crei baz mic
corespunde intervalului de vrst, iar lungimea ei este
proporional cu numrul populaiei. Se construiesc, de
fapt, dou grafice (histograme) alturate, cte unul pentru
fiecare sex. Pentru a se putea interpreta mai uor este
indicat ca pe ambele pri ale piramidei s se treac i anii
de natere a populaiei de diferite vrste (fig.3.8). Pentru
exemplificare se prezint piramida vrstelor populaiei.

88

Figura 3.8. Piramida vrstelor

3.3.3. Repartiii tridimensionale


Distribuiile tridimensionale rezult din considerarea
a trei caracteristici cantitative sau calitative i calitative
pentru fiecare unitate statistic.
n cazul unui numr redus de uniti statistice,
distribuiile tridimensionale se prezint sub forma a trei
iruri de date paralele, cte unul pentru fiecare
caracteristic X, Y i Z:

89

X: (x 1 , x 2 ,.....,x i ,.......,x n )
Y: (y 1 , y 2 ,.....,y i ,.......,y n )
Z: (z 1 ,z 2 ,.....,z i ,.......z n )
Aceste iruri de date pot fi eventual ordonate
cresctor sau descresctor, dup variantele uneia dintre
cele trei variabile.
Ca i n cazul distribuiilor bidimensionale, cnd
numrul unitilor statistice n este suficient de mare, se
recomand sistematizarea datelor iniiale sub forma unei
distribuii de frecven a celor trei variabile pe variante sau
pe grupe de variante ale caracteristicilor. Se obine, astfel,
un tabel statistic cu tripl intrare care cuprinde frecvenele
n ijk

ale ansamblului de variante (x i , y j , z k ),

=1,2,...., p; j = 1,2,..., q;

(i

k = 1,2,...., r) i frecvenele

marginale n . jk , n i.k , n . j . i n .k . .

3.4. Seriile dinamice


Cunoaterea tiinific a evoluiei fenomenelor n
timp constituie o problem complex i deosebit de
important. Acest lucru se explic prin faptul c
schimbrile
90

timp

care

au

loc

dezvoltarea

colectivitilor se refer la variaia volumului i structurii


lor, la variaia caracteristicilor proprii diferitelor uniti ale
lor i la forma i caracterul legturii dintre aceste
caracteristici. Toate aceste schimbri sunt, la rndul lor,
interdependente.
Seriile dinamice, de timp sau cronologice se
caracterizeaz prin faptul c termenii lor se difereniaz n
funcie de o caracteristic de timp.
Ca orice serie statistic, i cele dinamice se compun
din dou iruri paralele de date. Primul se refer la variaia
caracteristicii t i

i reprezint diferite momente sau

intervale de timp i al doilea la nivelurile fenomenului


studiat y i .
O caracteristic esenial a seriilor dinamice o
constituie faptul c ele sunt construite pentru colectiviti
omogene. Aceasta asigur comparabilitatea indicatorilor
de la o perioad la alta sau de la un moment la altul.
Seriile dinamice se pot construi pentru perioade de timp
mai lungi sau mai scurte cu condiia ca, n aceste perioade
s nu fi avut loc modificri calitative importante n cadrul
colectivitii i ele servesc pentru caracterizarea evoluiei
91

fenomenelor individuale sau colective pe diferite trepte


sau etape din dezvoltarea lor.
O alt trstur caracteristic a seriilor dinamice
const n faptul c fenomenele i faptele sociale i
economice, oglindite n indicatorii care formeaz seria,
sunt dependente ntre ele. Nivelul unui fenomen,
corespunztor unui anumit moment sau perioad din
dezvoltarea lui, depinde i de nivelul aceluiai fenomen
nregistrat n perioadele anterioare, ca i de ambiana n
care a avut loc dezvoltarea.
De

aceea,

schemele

teoretice

ale

calculului

probabilitilor bazate, n general, pe independena


fenomenelor nu sunt aplicate n analiza seriilor
dinamice.
La rndul lor seriile dinamice, dup natura
colectivitii la care se refer, se mpart n dou categorii
i anume: serii de momente i serii de intervale.
Seriile de momente caracterizeaz variaia n timp a
colectivitilor de stri, iar termenii lor reprezint volumul
acestor colectiviti nregistrat n diferite momente
succesive ale timpului. De exemplu: volumul stocurilor de
92

produse existent n ntreprinderi la nceputul fiecrei luni,


numrul

populaiei

obinut

cu

ocazia

diferitelor

recensminte sau la data de 1 ianuarie a fiecrui an,


numrul

animalelor

domestice,

obinut

pe

baza

recensmintelor etc.
Din aceast serie dinamic se poate constata c
populaia globului a nregistrat n era noastr un proces de
cretere continu, mai lent la nceput, apoi din ce n ce mai
accelerat pn n prezent.
Seriile de momente se caracterizeaz prin faptul c
indicatorii lor succesivi nu se pot nsuma, o asemenea
operaie nu ar avea un coninut real. Astfel, ar fi lipsit de
coninut i n discordan

cu realitatea

nsumarea

numrului populaiei lumii la diferite momente, deoarece o


parte din populaia care a fost luat n calcul, de exemplu,
n anul 1995, exist i n momentele precedente 1900,
1950, 1960, 1970, 1980 i 1990.
O alt particularitate a seriilor dinamice de momente
este i aceea c ele se ntocmesc pentru fenomenele a cror
nregistrare nu este posibil s se fac n mod curentcontinuu. Momentele unei astfel de serii pot fi egal sau
93

neegal distanate ntre ele i aceast particularitate prezint


interes pentru alegerea celor mai potrivite metode i
tehnici de calcul i analiz a seriilor de momente.
Seriile dinamice de intervale se refer la fenomenele
care se nregistreaz n mod curent i cu caracter de
continuitate pe msura producerii lor, totalizndu-se
pentru anumite perioade de timp (zi, sptmn, lun,
trimestru, semestru, an, cinci ani, zece ani etc). De
exemplu,

producia

industrial,

producia

agricol,

volumul vnzrilor de mrfuri, numrul nscuilor-vii,


numrul

cstoriilor,

numrul

divorurilor,

numrul

deceselor etc., se pot totaliza pe perioade de timp


calendaristice.
Deoarece

seriile

de

intervale

se

obin

prin

nregistrarea curent-continu a fenomenelor, indicatorii


statistici care caracterizeaz nivelul dezvoltrii lor pe o
anumit perioad de timp, se pot cumula din aproape n
aproape, obinndu-se n felul acesta indicatori corespunztori unor intervale de timp mai mari.

94

Mrimea intervalelor seriilor dinamice se stabilete


n funcie de natura colectivitilor i de necesitile
practice ale analizei statistice.
Din punct de vedere al naturii indicatorilor, care
reprezint

variantele

caracteristicii

cercetate,

seriile

dinamice pot fi de mai multe feluri: serii dinamice


construite din mrimi absolute, serii dinamice construite
din mrimirelative i serii dinamice construite din mrimi
medii.
Seriile dinamice construite din mrimi absolute
caracrerizeaz variaia nivelului absolut al fenomenelor la
anumite date sau pe anumite perioade de timp, mai mult
sau mai puin ndelungate, ele pot fi de momente sau de
intervale.
Tabelul 3. 3. Populaia Romniei n anii 1891 1996
Data
12 februarie
31 decembrie
31 decembrie
31 decembrie
29 decembrie
6 aprilie

Numrul populaiei
10 000 000
11 168 000
12 898 000
(recensmnt)
12 419 000
14 280 129
(recensmnt)
16 126 063
(recensamnt)
95

25 ianuarie
21 februarie
15 martie
20 iunie
5 ianuarie
1 iulie
3 decembrie
1 iulie
1 iulie
7 ianuarie
1 iulie
1 iulie
1 ianuarie

15 872 624
17 489 450
19 103 163
20 000 000
21 559 910
22 201 387
23 000 000
23 206 720
23 185 084
22 810 035
22 755 260
22 730 622
22 656 145

(recensmnt)
(recensmnt)
(recensmnt)
(recensmnt)

(recensmnt)

Sursa: Recensmntul populaiei i locuinelor din 15 martie 1996,


vol.I, Partea I-a,
DCS, 1969, p.XVII; Anuarul statistic al Romniei 1995,
CNS, p.82

Seriile dinamice pot fi construite i din mrimi


relative, n raport cu o anumit baz fix sau variabil a
fenomenelor n diferite momente sau perioade de timp.
Prin urmare i aceste serii pot fi de intervale sau de
momente. De exemplu: dinamica produsului intern brut,
produsului social, dinamica venitului naional, dinamica
productivitii muncii pe un muncitor din industrie,
dinamica populaiei ocupate, dinamica numrului mediu
scriptic al salariailor pentru diferite perioade de timp i n

96

funcie de nivelul unui anumit indicator dintr-o anumit


perioad sau moment considerat ca baz etc.
Prezentm, pentru concretizare, n paralel dou serii
dinamice ai cror termeni se exprim n mrimi relative, i
anume dinamica produsului social i a venitului naional
creat n Romnia n perioada 1950-1990, n care nivelul
anului 1950 este considerat ca baz.
Seriile dinamice construite din mrimi medii
caracterizeaz dezvoltarea medie a fenomenelor pe diferite
trepte ale evoluiei lor, de exemplu, evoluia numrului
mediu scriptic al salariailor din economia rii noastre n
perioada 1950-1995.
La elaborarea oricrei serii dinamice trebuie s se
respecte anumite condiii eseniale care ar putea fi
sistematizate astfel:
compararea nivelului de dezvoltare a fenomenelor
s se efectueze numai pentru perioade de timp egale;
stabilirea mrimii intervalului de timp, n cazul
seriilor de intervale, trebuie s se fac innd seama de
natura specific de dezvoltare a fenomenului respectiv, de
schimbrile

calitative

care

se

produc

cadrul

colectivitilor ca i de necesitile practice;


97

s se asigure comparabilitatea indicatorilor seriilor


dinamice din punct de vedere metodologic, teritorial, al
preurilor etc;
orice serie dinamic trebuie s fie construit numai
din indicatori de acelai fel (mrimi absolute, mrimi
medii sau mrimi relative).

3.5. Seriile de spaiu


Seriile de spaiu sau teritoriale sunt acele serii
statistice n care criteriul de difereniere a termenilor lor
este

teritoriul

sau

spaiul

(comuna,

judeul,

ara,

continentul etc.) n care fenomenele au aprut, au existat


sau au suferit un anumit eveniment. De exemplu:
distribuia pe judee a numrului i densitii populaiei, a
numrului

salariailor,

principalilor

indicatori

ai

industriei, a produciei totale de fructe, a volumului


vnzrilor de mrfuri cu amnuntul, populaia i densitatea
ei pe continente, pe ri, durata medie a vieii pe tri etc.
nregistrarea elementelor unei colectiviti pe diferite
uniti teritoriale se efectueaz fie pentru o anumit
perioad de timp sau la un moment dat, fie n funcie de

98

natura fenomenelor cercetate i acest fapt trebuie precizat


n titlul tabelului care prezint seria.
3.5.1 Reprezentarea grafic a seriilor de spaiu
Distribuia

spaial

fenomenelor

se

poate

reprezenta grafic cu ajutorul diagramelor prin benzi, care


scot n eviden variaia volumului fenomenului n teritorii
diferite.
Caracterul de distribuie teritorial a seriilor de
spaiu nu poate fi scos n eviden, n mod clar, numai cu
ajutorul graficelor obinute (diagrame), ci ci este necesar,
pentru localizarea fenomenelor cercetate, s se apeleze la
un tip special de grafice, construite cu ajutorul hrilor de
contur a diviziunilor teritoriale.
Desigur,

economistul

nu

este

geograf

reprezentrile sale spaiale nu vizeaz acelai scop; n loc


de a ncerca reproducerea detaliat a fenomenelor n
spaiu, economistul consider c introduce n lucrrile sale
o variabil suplimentar, spaiul. Reprezentarea grafic cu
ajutorul hrilor este tot att de important pentru analiza
statistico-economic i pentru testarea ipotezelor statistice,
ca i diagramele. Scopul statisticii este i deglobalizarea
99

spaial a colectivitiilor, relevarea diversitii care se


ignor de ctre volumul acestora sau de ctre nivelul
mediu al diferitelor caracteristici. Spaiul pentru economist
apare deci mult mai abstract dect pentru geograf.
nainte de a prezenta unele modele ale diagramelor
spaiale, se impun cteva precizri:
a) hrile geografice sunt reprezentri prin suprafee:
fiecare unitate geografic este reprezentat printr-o
suprafa proporional cu cea real;
b) importana fiecrei zone geografice este foarte
diferit din mai multe puncte de vedere;
c)

subzonele

individualitate

unui

proprie:

anumit

teritoriu

caracteristicile

au

geografice

(temperatur, precipitaii); sociodemografice (regimul de


activitate, nivelul mortalitii generale i specifice,
numrul de locuine etc.); economice (mrimea i forma
suprafeei, dezvoltarea industriei i structura ei, preurile
produselor de sezon etc.)
d) analiza unei cartograme trebuie s vizeze cel
puin dou aspecte:
intensitatea luminoas trebuie s fie n
concordan cu nivelul caracteristicii zonei
100

luate n studiu (dou zone geografice apropiate


sau chiar identice se reprezint prin aceeai
tonalitate luminoas, culoare sau haurare);
numrul de tonaliti diferite care se pot utiliza
ntr-o cartodiagram este limitat de posibilitile de percepie ale omului;
Pornind de la aceste precizri de ordin general, se
prezint n continuare cteva modele de grafice ale
distribuiilor spaiale.
Graficele specifice utilizate pentru reprezentarea
distribuiilor dup o caracteristic teritorial sunt de dou
tipuri: cartograme i cartodiagrame.
Cartogramele, la fel ca oricare alte grafice, trebuie s
fie ct mai simple pentru a putea fi uor de citit i
interpretat. Uneori, din dorina unor reprezentri ct mai
precise i mai complexe, se pierde din claritate. n astfel
de cazuri este preferabil s se descompun o cartogram,
foarte ncrcat, n dou sau mai multe cartograme mai
simple, mai expresive i, deci, mai eficace.
Cu ajutorul cartogramelor se reprezintnivelul atins
de ctre diferite fenomene n teritorii diferite sau variaia
acestora de la o unitate teritorial la alta, cu scopul de a
101

nlesni caracterizarea statistic a diferitelor zone din punct


de vedere al caracteristicii sau a caracteristicilor cercetate.
Cartogramele pot fi construite prin puncte, n culori sau n
nuane de culori, haurate, cu izolinii (sau curbe de nivel)
etc.
Harta care st la baza construciei cartogramei
trebuie s aib bine conturate unitile teritoriale, fra s se
precizeze formele de relief, apele, oraele etc. dect n
msura n care este nevoie de localizarea fenomenelor
cercetate, pentru a nu ncrca n mod inutil cartograma.
Pentru reprezentarea pe hart a variaiei diferitelor
fenomene sau a intensitii acestora n teritorii diferite, se
utilizeaz n practic cartograma prin puncte. n acest caz,
indicatorii se reprezint printr-un anumit numr de puncte,
fiecare avnd o anumit mrime. Problema principal a
construciei acestor cartograme const n alegerea
raional a mrimii etalon a punctului (cerculeului). Dac
punctele vor reprezenta valori mai mari, ele se vor uni cu
cele nvecinate i vor da o nuan de gol teritoriului din
imediata apropiere. Dimpotriv, dac punctele vor
reprezenta valori prea mici, ele vor fi prea dese prea hart
se vor contopi i nu vor da o imagine clar. Cartogramele
102

prin puncte se utilizeaz mai ales pentrureprezentarea


seriilor formate din mrimi absolute (populaie, producie,
vnzri etc.).
Mai rspndite n practic sunt cartogramele cu
culori diferite i cele cu intensiti diferite ale aceleiai
culori. Dac se ntrebuineaz culori diferite, apare
dificultatea reprezentrii culorilor ntr-o progresie optic
cu scopul de a permite identificarea precis i logic a
variaiei i intensitii fenomenelor. n literatura de
specialitate s-a propus urmtoarea scar de culori, n
ordine cresctoare a intemsitii: alb, galben-deschis,
galben auriu, portocaliu, roz, maro-deschis, maro-nchis,
verde-nchis, rou-nchis i negru. Din practic, s-a
constatat c`n locul utilizrii mai multor culori, este
preferabil utilizarea mai multor nuane ale aceleiai
culori. Intensitatea culorii este strns legat de intensitatea
fenomenului n zonele respective, astfel nct, acolo unde
aceasta este mai mare, i nuana culorii va fi mai
pronunat i invers.
Cartogramele haurate pot nlocui cartogramele n
culori. Haurarea diferitelor zone se face pe baza acelorai
principii ca i n cazul cartogramelor n culori: cu ct
103

intensitatea fenomenului este mai mare, cu att haurarea


are un fond mai nchis, ce se realizeaz fie prin desimea
liniilor, fie prin grosimea lor i invers.
Figura 3.9 Cartogram haurat

104

Capitolul 4
ANALIZA RELAIILOR DINTRE
PROCESELE I FENOMENELE SOCIALE
4.1. Introducere
Statistica folosindu-se de metodele proprii de
cercetare, contribuie alturi de celelalte tiine la
descoperirea legilor, legitilor i regularitilor care se
manifest n interiorul i ntre fenomenele colective. De
altfel, problema fundamental a oricrei cunoateri
tiinifice, a oricrei tiine este descoperirea legilor care
acioneaz asupra fenomenelor care fac obiectul lor de
studiu.
Fenomenele i procesele din natur i societate iau
natere i se dezvolt sub influena aciunii unui mare
numr de factori principali i secundari, eseniali i
neeseniali, cuantificabili i necuantificabili sau cuantificabili cu aproximaie.
n aceast seciune vom depi aceast prim faz
descriptiv de studiere a legturilor dintre fenomene,
introducnd elemente noi de msurare mai precis a lor.
105

Fenomenele naturale, care iau natere ca urmare a


micrii mecanice, fizice, chimice i biologice a materiei,
sunt legate ntre ele prin legturi funcionale.
De exemplu, fiind dat o bar metalic supus unor
temperaturi diferite: t 1 , t 2 , t 3 ,...., t n ea se va dilata i va
lua lungimile, respectiv: l1 , l 2 , l 3 ,.....l n . De fiecare dat
cnd bara va fi supus temperaturii t i , va lua lungimea l i
. Astfel, putem spune c unei temperaturi (dintr-un anumit
interval al temperaturilor) i corespunde (sau i se poate
asocia) o anumit lungime a barei i numai una. Legtura
dintre temperatur i lungimea barei este o legtur
funcional. Acest tip de legturi, specific fenomenelor
naturii,

nu

este

aplicabil

fenomenelor

sociale

economice.
Fenomenul social-economice le este caracteristic
faptul c asupra lor acioneaz, alturi de cauze
determinate pentru legtura sau dependena cercetat,
numeroi ali factori nu luai n calcul, accidentali, a cror
aciune poate influena dezvoltarea lor. Acest fapt
determin existena unor legturi de forme i tipuri variate
ntre fenomene cu grade diferite de complexitate. Natura

106

legturii dintre fenomene se stabilete pe baza unei analize


calitative multilaterale.
n unele cazuri, ntre fenomene exist o legtur
cauzal, atunci cnd unul dintre fenomene joac rolul de
cauz, iar cellalt de efect. De exemplu, creterea
productivitii muncii determin n mare msur reducerea
costului produciei.
Intre alte fenomene poate exista o legtur sau o
interaciune reciproc, cnd nici unul dintre fenomene nu
poate fi considerat cauz sau efect. Astfel, se constat cu
caracter de legitate, c vrsta la cstorie a soului
concord cu cea a soiei, deci se cstoresc, n general,
persoane care au o vrst apropiat. n acest caz, nici
vrsta soului, nici cea a soiei nu poate fi considerat
numai cauz sau numai efect.
n alte cazuri, variaia paralel a dou fenomene nu
se datoreaz legturii dintre ele, ci influenei unui al
treilea factor, care le determin pe ambele. Aa, de
exemplu, cererea de mrfuri i economiile bneti ale
populaiei variaz n acelai sens, cu toate acestea nici
unul dintre ele nu poate fi considerat cauz sau efect al
celuilalt. Ambele fenomene sunt influenate de un al
107

treilea factor i anume, de mrimea veniturilor bneti ale


populaiei.
n cadrul fenomenelor sociale i economice,
legtura nu se manifest n fiecare caz n parte aa cum
se ntmpl n cadrul fenomenelor naturii ci n general i
n medie, ntr-un mare numr de cazuri. Fenomenul efect
este rezultatul conjugrii influenei mai multor fenomenecauz i n acest sistem de legturi nu toate raporturile de
dependen au aceeai importan, iar uneori aciunea
unora dintre ele se compenseaz reciproc. Studierea
acestor fenomene, cunoaterea legilor, legitilor i
regularitilor de producere a lor nu se poate face pe cale
experimental, ci folosind mai ales metoda abstractizrii,
prin care se nltur ceea ce este ntmltor i neesenial n
dezvoltarea lor, desprinznd astfel raporturile obviective
de cauzalitate i descoperind condiiile de formare i
dezvoltare a acestora.
Variaiile cantitative ale caracteristicii (variabilei)
efect Y pot fi mai mari sau mai mici dect variaiile
cantitative determinate de caracteristicile cauzale X i
explicite. Unele valori ale caracteristicii efect (sau
rezultative) pot avea chiar sens contrar sensului de variaie
108

pe care-l au caracteristicile cauzale. O astfel de legtur


ntre caracteristicile fenomenelor sau proceselor sociale
colective poart denumirea de dependen sau legtur
stohastic.
Legturile statistice sau stohastice se caracterizeaz
prin faptul c o caracteristic X

exercit o anumit

influen asupra altei caracteristici Y, i determin ntr-o


anumit msur variaia, ns aupra caracteristicii Y mai
acioneaz i ali factori n afar de X, care, din punct de
vedere al legturii dintre X i Y, se consider ntmpltori.
De exemplu, ntre gradul nzestrrii tehnice a muncii
i nivelul productivitii muncii exist o legtur bine
determinat n sensul c, pe msura creterii nivelului
nzestrrii tehnice a muncii, crete i nivelul productivitii
muncii; dar productivitatea muncii este influenat i de
ali factori, n afar de nzestrarea tehnic, cum ar fi:
experiena n producie, nivelul de calificare, salarizarea,
forma de organizare, factori psihologici etc.
Legtura statistic dintre dou sau mai multe
caracteristici exprimate numeric poart denumirea de
corelaie. n general, se poate spune c ntre dou sau mai

109

multe fenomene exist corelaie, dac ntre ele exist o


anumit legatur logic, cuantificabil.
n opoziie cu legturile funcionale, se pot ntlni n
realitate i fenomene n care s nu existe nici un fel de
legtur, adic fenomenele respectice sunt independente
ntre

ele.

Deci,

corelaia

este

intermediar

ntre

independen absolut dintre fenomene i legturile


funcionale.
Studiul corelaiei este ndreptat spre stabilirea
existenei unei legturi reale ntre fenomenele cercetate i
apoi, cu ajutorul unor metode i tehnici adecvate, se
caracterizeaz direcia, forma i intensitatea legturii.
Mulimea legturilor statistice dintre fenomenele
colective se poate clasifica dup mai multe criterii cum ar
fi: numrul variabilelor corelate, modul de exprimare a
caracteristicii,

direcia

legturii,

forma

legturii

intensitatea ei.
a)

Dup

numrul

caracteristicilor

corelate,

legturile dintre fenomene se pot mpri n dou grupe:


legturi simple i legturi multiple. Legturile simple se
stabilesc numai ntre dou caracteristici, n timp ce
legturile dintre trei sau mai multe caracteristici poart
110

denumirea de legturi multiple. O astfel de legtur exist


(de exemplu) ntre recolta medie la hectar, pe de o parte i
calitatea

solului,

msurile

agrotehnice,

condiiile

meteorologice, pe de alt parte; legtura dintre producia


industrial pe judee, capitalul fix i numrul de personal
din industrie etc.
Dac legturile dintre fenomene sunt cauzale, atunci
caracteristicile care joac rol de cauz poart denumirea de
variabile sau caracteristici independente, factoriale sau
determinate i se noteaz cu

X 1 , X 2 , X 3 ,..... X n , iar

caracteristica efect sa mai numete i caracteristic sau


variabil determinat sau variabil dependent sau
variabil rezultativ i se noteaz cu Y.
b) Dup direcia sau sensul lor, legturile statistice
pot fi directe sau pozitive i inverse sau negative.
Legturile directe apar atunci cnd variabila (sau
variabilele) factorial, ct i variabila rezultativ variaz
mereu n acelai sens. Dac variaia caracteristicilor
factoriale

are

sens

contrar

variaiei

caracteristicii

rezultative, atunci legtura dintre ele este invers. De


exemplu, ntre nregistrarea tehnic a muncii i nivelul
productivitii muncii exist o legtur direct, iar ntre
111

productivitatea muncii i costul produciei exist o


legtur invers.
c) Dup forma lor, legturile dintre variabile pot fi
liniare sau curbilinii (hiperbol, parabol, exponenial etc.).
Orice studiu statistic concret de corelaie trebuie s
porneasc de la identificarea existenei unei legturi reale
ntre fenomene i apoi s treac la msurarea ei statistic.
De asemenea, trebuie s se in seama de faptul c orice
studiu concret se sprijin pe un numr limitat de observaii
i c, pe baza rezultatelor obinute prin prelucrarea i
analiza multilateral a acestora, se ncearc apoi
caracterizarea colectivitii generale. De aceea, rezultatele
calculelor de regresie i corelaie trebuie s fie interpretate
probalistic.
Pentru studierea legturilor statistice dintre fenomene se
pot utiliza n practic metode elementare (metoda seriilor
paralele interdependente, metoda gruprilor, metoda tabelului
de corelaie, metoda balanelor, metoda grafic etc.) i
metode analitice (regresie i corelaie simpl i multipl,
determinaia simpl i multipl, verificarea ipotezei
existente i formei legturii, verificarea semnificaiei
indicatorilor de regresie, corelaie i determinaie).
112

4.2. Metode de analiz


Metodele

statistice

elementare

de

studiere

dependenelor dintre fenomene sunt uor de aplicat, se


bazeaz pe analiza calitativ a variabilelor corelate i ofer
informaii importante asupra naturii caracteristicilor legturii
cercetate. Ele servesc ca punct de plecare n vederea
aplicrii metodelor analitice mai complexe i mai precise.
4.2.1. Metoda seriilor statistice interdependente
Aceast metod const n stabilirea existenei i
caracterizarea legturilor dintre fenomene pe baza
comparrii indicatorilor provenii din dou serii paralele:
una care prezint variaia variabilei factoriale X i alta
pentru variabila rezultativ Y. Se pot supune comparaiei
dou serii de timp, dou serii de spaiu sau dou serii de
distribuie. n primul caz, termenii celor dou serii
dinamice se nscriu n ordine cronologic, iar n cazul al
doilea i al treilea, se procedeaz la ordonarea termenilor
seriilor n ordine cresctoare sau descresctoare a
variabilei factoriale X i n paralel se nscriu termenii
corespunztori ai variabilei rezultative Y. Prin aplicarea
acestei metode este posibil s se obin o prim imagine
113

asupra existenei i direciei legturii dintre variabile, dar


nu se poate aprecia forma i intensitatea ei.
n cazul seriilor cronologice interdependente este
necesar ca, pe lng identificarea legturilor dintre
fenomene, s se precizeze i perioada pentru care ar loc
legtura respectiv. Astfel, se pot evidenia legturi
sincrone dintre fenomene, cnd variaia variabilei factoriale determin concomitent variaia variabilei rezultative
i legturi asincrone n cazul n care variaia variabilei
factoriale se exercit asupra variabilei rezultative, dup o
anumit perioad de timp, deci cu un anumit decalaj.
Procedeul seriilor paralele interedependente se poate
aplica att n cazul legturilor simple, ct i n cazul
legturilor multiple cnd este necesar ca, pe baza analizei
critice calitative, s se procedeze la ierarhizarea influenei
factorilor cauzali n funcie de mrimea influenei lor
asupra variabilei rezultative. Dac variabilele factoriale nu
sunt independente ntre ele, n cazul corelaiei multiple,
apare fenomenul de multicoliniaritate, care trebuie diminuat
ct mai mult posibil nainte de a trece la calculul indicatorilor de regresie i corelaie multipl. Exist n literatura
de specialitate metode de verificare a existenei multico114

liniaritii i de diminuare a efectelor ei n cazul corelaiei


liniare multiple. Eliminarea ei total nu este posibil.
Aplicarea metodei seriilor paralele interdependente
devine mai dificil n cazul seriilor formate dintr-un numr
foarte mare de termeni i implic n mare msur
subiectivismul cercettorului. Pentru a nltura acest
neajuns, se poate utiliza metoda gruprilor.
4.2.2. Metoda gruprilor
Metoda gruprilor reprezint o metod bazat n
analiza legturilor dintre fenomene i const n mprirea
unitilor statistice dup variaia variabilei factoriale X i
calcularea indicatorilor sintetici (mrimi medii, dispersii,
mrimi relative de structur) ai caracteristicii rezultative
Y, pentru fiecare grup n care a fost mprit
colectivitatea.

Aceast

metod

ofer

posibilitatea

aprecierii existenei legturii i sensul ei, dar, ca i n cazul


metodei anterioare, aprecierea formei i intensitii
legturii este cu totul subiectiv, depinznd n mare
msur de competena i experiena cercettorului.

115

n cazul legturilor simple se utilizeaz gruprile


simple, iar n cazul legturilor multiple se vor utiliza
gruprile combinate.
4.2.3. Metoda grafic
Aceast metod permite prezentarea ntro form
geometrica, expresiv i vizual a legturilor dintre dou
sau mai multe variabile.
n cazul a dou variabile, metoda grafic se bazeaz
pe sistemul de axe rectangulare, n care valorile variabilei
factoriale se nscriu pe abscis, iar cele ale variabilei
rezultative pe ordonat. Perechile de valori corelate xi , y i
, se reprezint prin cte un punct n spaiul xoy. Mulimea
acestor puncte dispersate n grafic ofer imaginea
cmpului de corelaie asemntoare cu un nor de
puncte- de unde deriv i denumirea acestui procedeu.
Dup forma i poziia norului de puncte n plan se
poate aprecia existena, forma, direcia i intensitatea
legturii dintre variabile. Concentrarea punctelor n jurul
unei anumite drepte sau curbe ne va sugera faptul c ntre
variabile exist o legtur.

116

Capitolul 5
REZUMATUL I DESCRIEREA
INDICATORILOR CARACTERISTICILOR
STATISTICE UTILIZATE
N GEOGRAFIA UMAN

Una dintre funciile de baz ale statisticii aa cum


amintem n primul capitol al acestei lucrri este funcia
descriptiv.

Aceasta

presupune

aplicarea

principiului

descrierii statistice tehnic ce a dat natere statisticii


descriptive al crui scop principal i specific este acela de
a sintetiza i structura ntr-o manier ct mai direct i mai
intuitiv datele i informaia, inclusiv caracteristicile
acestora.
Valorile ataate variabilelor statistice n special
cantitative, prin intermediul crora informaia coninut n
ndistribuia de frecvene respective este exprimat
sintetic, sunt desemnate prin termenul indicator .
Acetia mai sunt ntlnii sub o mare varietate de denumiri
precum: indici (Rateau, 2004) valori reprezentative
117

(Novak, 1998), parametri (Moineagu, Negur i Useanu,


1976) etc., n funcie de de tipul de informaie oferit,
aceti indicatori se mpart n dou mari clase principale:
1. indicatori de poziie (sau de nivel ori ai tendinei
centrale);
2. indicatori de dispersie (sau de mprtiere ori de
variaie).
3. indicatori ai formei distribuiei.
Aceast ultim categorie constituind o categorie mai putin
utilizata datorita calitilor sale mai puin expresive. Astfel
aceat lucrare se va concentra asupra care apar mai
frecvent n aplicaiile statisticii n tiinele sociale n care
se ncadreaz i turismul.

5.1.Indicatorii de poziie
Iindicatorii de poziie reprezint indicatorii ce redau
printr-o singur valoare numeric nivelul general al
valorilor seriei sau ordinul de mrime al acestor valori. De
exemplu variabila ce reprezint distribuia familiilor care
au optat pentru o destinaie n strintate dintr-o anumit
ar dup venitul lor lunar, exprimat n euro. Un indicator
de poziie va fi o valoare, s zicem veuro, care va reda
nivelul de ansamblu al ctigului familiilor respective.
118

Exprimarea exact a semnificaiei generale a indicatorilor


de poziie este imposibil pentru c, strict vorbind, o
asemenea semnificaie general acoper un coninut relativ
redus sau, altfel spus, fiecare indicator posed o doz
specific de semnificaie care-l individualizeaz clar de
ceilali. O astfel de valoarea (cea mai des utilizat n
tiinele sociale) este media aritmetic.
5.1.1. Modul
Modul (i nu modulul !) sau valoarea modal, se
noteaz cu Mo i reprezint valoarea sau caracteristica ce
apare sau este luat cu cea mai mare frecven. Ca
interpretare, putem spune c aceasta este valoarea ce
caracterizeaz individul tipic al populaiei.
Acest indicator este specific pentru variabilele
(caracteristicile) calitative nominale fiind singurul care
poate exprima nivelul general al unei populaii alctuite
din astfel de variabile. Se nelege imediat c acest
indicator este specific cazului n care lucrm cu frecvene.
(Vezi exerciiul 1, anexa 2).
Pentru variabilele continue, despre mod se poate
vorbi doar dac vom construi intervale de valori. n acest
119

caz, este recomandabil ca lucrurile s se opreasc la


gsirea intervalului modal, adic a intervalului cu cea mai
ridicat frecven A merge aici mai departe, la a determina
o valoare modal, pentru distribuii empirice, ni se pare, n
multe cazuri, un lucru foarte riscant.
De pild, pentru distribuia din tabelul 4.1.intervalul
modal este cel dat de limitele 25-29 ani. Pentru o
eventual poziionare a valorii modale pe acest interval, se
poate apela la frecvenele din intervalele alturate (din
stnga i din dreapta celui modal). Astfel, notnd cu k i
frecvena intervalullui modal, cu k i 1 i k i +1 frecvenele
intervalelor premodal i postmodal, cu x i

valoarea

inferioar a intervalului modal i cu d i lungimea acestuia,


o formul de calculare a valorii modale este urmtoarea:
Mo = x i +d i

k i k i 1
( k i k i 1 ) + ( k i k i +1 )

Pentru datele din tabelul 4.1., mrimile din formula


de mai sus sunt:
x i =25 de ani; d i = 5 ani; k i = 4.411; k i 1 = 2.269 i
k i +1 = 2.655 ,
ceea ce conduce la valoarea:
120

Mo = 27,75 ani.
Subliniem nc o dat artificialitatea acestei valori,
nu att datorit ipotezelor folosite, ct faptului c
semnificia valorii modale este aceea de valoare tipic,
cea mai frecvent. Or, este limpede c n cazurile reale,
cnd valorile, orict de multe ar fi, sunt totui discrete, nu
se poate vorbi de o valoare modal, valoare la care se
ajunge doar n domeniul matematicii, n cazul variabilelor
aleatorii continue, printr-un proces de trecere la limit.
Ceea ce se poate eventual spune, invocnd valoarea
calculat cu formula de mai sus, este, interpretnd datele
exemplului nostru, c cele mai multe situaii de turiti cu
diagnostic, n 1985, sunt ale persoanelor aflate n jurul
vrstei de 27,75 ani.
n concluzie modul este un indicator de poziie
expresiv pentru caracteristicile calitative nominale sau
eventual ordinale i mai puin pentru cele intervale
indiferent de natura acestora din urm.
5.1.2. Mediana
Prezentarea valorii mediane, notat Me, ca indicator
al poziiei necesit o introducere n care se va defini
121

individul median. Presupunnd c cei n indivizi din


populaie sunt aezai n ordinea cresctoare sau
descresctoare a valorilor pe care le iau, atunci individul
care se gsete la mijlocul acestui ir, adic are n stnga
sa tot attea uniti statistice cte i n dreapta lui, se
numete individ median. Valoarea pe care o ia individul
median se numete valoare median sau, simplu,
median.
Este evident c un individ median exist, propriu-zis
vorbind, doar atunci cnd n este un numr fr so, cci
doar atunci fr el rmne un efectiv cu so (n-1), care
poate fi mprit n dou pri egale: cte (n-1)/2 n stnga
i n dreapta. n caz contrar, vom considera un individ
median virtual, plasat ntre unitatea de rang n/2 i cea de
rang n/2+1, individ cruia i acordm ca valoarea medie
aritmetic a valorilor celor dou uniti care-l ncadreaz.
(vezi exerciiul 2, anexa 2)
Acest indicator al poziiei este specific varibilelor
calitative ordinale fiind foarte expresiv. El se folosete
frecvent i pentru stabilirea poziiei poulaiei pentru
variabile intervale.

122

Lucrurile se complic puin atunci cnd ne gsim n


situaia n care apar frecvene. Mai mult, aceast situaie,
la rndul su, are dou forme diferite: a) cnd frecvenele
corespund unor valori univoce i b) cnd frecvenele
corespund unor intervale de valori. n ambele cazuri,
iererhia presupune c indivizii afalai sub o aceeai valoare
sau sub acelai interval de valori ocup un acelai rang.
S ne oprim la primul caz. Dac n este fr so, va
exista un individ median care se va gsi sub acea valoare
pentru care frecvena cumulat ascendent depete 50%
din efectivul populaiei. Iar acea valoare va fi valoarea
median. Dac n este cu so, atunci indivizii de rang n/2 i
n/2+1 pot fie s ia o aceeai valoare i atunci aceasta este
chiar mediana, fie s ia dou valori diferite i consecutive,
x i i x i +1 , luate cu frecvenele k i , respectiv k i +1 i
atunci mediana va fi:
Me =

k i xi + k i +1 xi +1
k i + k i +1

adic media celor dou valori, luate cu frecvenele respective.


Cazul al doilea, cel cu intervale de valori, induce n
plus fa de cel precedent cutarea medianei atunci cnd
se cunoate intervalul median, adic intervalul pe care se
123

gsete individul median ( real sau virtual). Cu alte cuvinte,


trebuie aleas o metod de a determina o valoare din
intervalul respectiv care s fie atribuit individului median.
Tabelul 5.1. Distribuia turitilor sosii n sejur balnear
la Bile Herculane n 1985, avnd diagnostic
anterior stabilit, n funcie de vrsta la care s-a
stabilit diagnosticul
Vrsta

Frecvene

Vrsta

Frecvene
cumulate

15-19 ani

253

Sub 15 ani

20-24 ani

2.269

Sub 20ani

253

25-29 ani

4.411

Sub 25 ani

2.522

30-34 ani

2.655

Sub 30 ani

6.933

35-39 ani

2.516

Sub 35 ani

9.588

40-44 ani

1.857

Sub 40 ani

12.104

45-49 ani

1.133

Sub 45 ani

13.961

50-54 ani

541

Sub 50 ani

15.094

55-59 ani

361

Sub 55 ani

15.635

60 i peste

344

Sub 60 ani

15.996

Total

16.340

Total

16.340

Sursa: Direcia Judeean pentru Statistic Cara Severin

Se vede c efectivul total fiind un numr cu so,


16.340, vom avea un individ median virtual, cuprins ntre

124

cel cu rangul 8.170 i 8.171, s zicem al 8.170,5-lea. Acest


individ se va gsi n intervalul 30-34 de ani, dat fiind c
pn la 30 de ani se stabilesc dignostice la 6.933 turiti i
pn la 35 de ani, 9.588. Vom presupune c cele 2.516
persoane se distribuie uniform pe acest interval. Pentru a
afla rangul individului nostru virtual n rndul celor 2.516
din intervalul median, vom face diferena:
8170,5 6933 = 1237,5
n continuare, aplicm regula de trei simpl:
dac la 2216 persoane corespund 5 ani de vrst,
atunci la 1237,5, corespund x ani.
Deci:

x=

1237,5 5
= 2,46
2516

valoare care, adugat celei de la captul din stnga


al intervalului, ne d mediana. Adic, n 1995, vrsta
median a turitilor sosii la Bile Herculane avnd un
diagnostic stabilit este de 32,46 ani.
O procedur echivalent de a calcula mediana este
cea care face apel la reprezentarea grafic. Presupunnd c
pe o hrtie gradat (milimetric) se deseneaz o linie
poligonal a frecvenelor cumulate ascendente, ducnd o
dreapt paralel cu axa X, la nlimea n/2, aceasta va
125

intersecta graficul ntr-un punct a crui abscis este tocmai


mediana.

126

5.1.3. Media (aritmetic)


Dup cum se tie, exist mai multe mrimi ce poart
denumirea de medie , dintre care cea mai cunoscut este
aa-numita medie aritmetic. Dat fiind faptul c n
lucrarea de fa nu vom aborda i celelalte genuri (media
geometric i cea armonic) n capitolul de fa se va
utiliza simplu denumirea de medie sau valoare medie,
nelegndu-se prin aceasta media aritmetic.
Exist mai multe modaliti de a defini valoarea
medie. Pentru c se raporteaz direct la formula cea mai
cunoscut de calcul a mediei, vom alege ca definiie
propoziia conform creia media este acea valoare care se
obine mprind suma valorilor tuturor indivizilor din
populaie la numrul acestora, ceea ce semnific, n fapt,
c ea este acea valoare comun pe care ar trebui s o ia
fiecare individ din populaie astfel nct s se pstreze
neschimbat suma valorilor.
Notaia clasic a mediei pornete de la simbolul
variabilei statistice, cruia i se aplic o bar superioar.
Astfel, pentru o variabil X , valoarea medie se noteaz
frecvent cu

i este dat de formula:

127

x
=
i =1

n
Proprieti mai importante ale mediei sunt urmtoarele:

Media este o valoare cuprins n intervalul ale


crui capete le constituie valoarea minim i cea
maxim a seriei de valori.

Media este o mrime exprimat n aceeai unitate


de msur n care sunt exprimate i valorile
variabilei respective.

Media

aritmetic

rmne

neschimbat

dac

frecvenele se nmulesc sau se mpart cu un acelai


numr.

Valoarea medie poate fi calculat chiar dac nu


cunoatem distribuia caracteristicii, ci numai
suma valorilor. De pild, dac o ntreprindere are n
salariai i ntr-o lun sunt cheltuii S lei pentru
fondul de salarii (suma valorilor), atunci, fr a
mai urmri ce salariu (valoare) are fiecare individ,
putem spune c salariul mediu este S/n.

Media este o mrime folosit foarte des pentru


ilustrarea nivelului general al valorilor unei

128

caracteristici. Se ntmp ns c semnificaia ei nu


este clar neleas. Mai exact, pornindu-se de la
proprietatea (1), conform creia media este o
valoare din interiorul seriei, se absolutizeaz
considerndu-se c este valoarea mijlocie sau
tipic a serei.
Important pentru cei ce folosesc indicatorii statistici
media n cazul de fa este s neleag exact
semnificaia valorii calculate i s o utilizeze exclusiv n
limitele ce corespund acestei semnificii. Mediile nu au un
caracter fix, nu sunt lipsite de coninut, nu sunt
neprezentative n situaii ca aceea invocat anterior, aa
cum sunt adeseacaracterizate. Ele pur i simplu nu dau
ceea ce unii ateapt de la ele sau pretind c dau.
Media, ca orice indicator, nu poate reflecta dect o
parte din informaia surprins n caracteristic i este
evident c, cu ct populaia este mai omogen, cu att
media va reproduce mai mult din aceast informaie. La
limit, dac toi indivizii iau aceeai valoare, aceasta va fi
chiar media i informaia este complet. Faptul c
situaiile reale sunt departe de acest caz limit i doar
aa devin interesante, cci nu redau situaii omogene nu
129

trebuie s duc la interzicerea calculului mediei, ci la


necesitatea de a determina i ali indicatori, cum sunt cei
de mprtiere.

5.2. Indicatorii de dispersie


Statistica descriptiv opereaz cu

indicatorii din

aceast categorie, indicatori ce vin s completeze


indicatorii de poziie, pentru a mbogi caracteristicile
variante ale variabilelor studiate. Cu alte cuvinte acetia
msoar gradul de mpratiere a indivizilor n cadrul seriei
de valori pe care le iau. Astfel indicatorii de dispersie
caracterizeaz o populaie statistica din punctul de vedere
al omogenitii/eterogenitii, n raport cu o variabil dat.
n anumite situaii, n special cnd variabila reflect
anumite ierarhii recunoscute sau valorizate ntre indivizii
statistici (adic n sensul c valori mai mari sunt
considerate ca fiind mai bune sau preferabile celor mai
mici, cum e cazul salariilor, de pild), indicatorii de
dispersie reflect gradul de inegalitate ntre indivizi, n
raport cu factorul social tradus n caracteristic.
Indicatorii de dispersie devin importani prin faptul
c li se atribuie semnificaia de a reproduce gradul de
130

nedeterminare, de variabilitate al unui fenomen. Or,


explicaia, cel puin din punct de vedere statistic, nseamn
reducerea acestei nedeterminri sau variabiliti, adic
sporirea posibilitii de a prezice starea unui fenomen.
ntr-adevr, aa cum am sugerat deja, un fenomen este
tradus ntr-o caracteristic de tip statistic, care, la rndul ei
este exprimat printr-un indicator de poziie (s spunem
media). A afirma c, de pild, media gradului de
satisfacie al unui grup de turiti ntori dintr-un sejur este
8,50 nseamn a afla ceva despre nivelul gradului de
satisfacie al grupului respectiv. Dispersia scorurilor din
care rezult aceast valoare medie va indica msura n care
valoarea individual este reprodus prin cea de grup sau
calitatea prediciei situaiilor indivizilor prin mrimea la
nivelul colectiv. Dac n analiz se introduce o variabil
nou, cu rol explicativ pentru ca cea iniial, atunci,
presupunnd cunoscut poziia indivizilor dup aceast
caracteristic

zis

independent,

se

va

reduce

nedeterminarea situaiei lor dup variabila de baz, n


msura n care ntre cei doi factori exist o legtur. Astfel
spus, indicatorul de dispersie va pune n eviden ct din

131

nedeterminarea variabilei cercetate se poate reduce prin


introducerea n modelul explicativ a unei noi variabile.
Cei mai cunoscui ndicatori de dispersie sunt
prezenai n aceast lucrare insistnd mai ales asupra
logicii construciei lor, dar mai ales asupra semnificaiei
pe care o posed i a limitelor n utilizarea lor.
5.2.1 Amplitudinea
In mod superficial se pornete de la ideea c
problema dispersiei poate fi uor rezolvat urmrind doar
ntinderea scalei de valori a caracteristicii. Spre exemplu,
dac media scorurilor de satisfacie menionat mai sus
rezult dintr-un calcul n care valorile individuale sunt
cuprinse ntre nota 7 i nota 9, atunci vom spune c
dispersia este mai redus (grupul este mai omogen) dect
atunci cnd ea rezult din scoruri cuprinse ntre 3 i 10
(grupul este mai eterogen). Indicatorul de dispersie astfel
folosit poart denumirea de amplitudine, notat cu A, i se
calculeaz simplu, ca diferen ntre cea mai mare i cea
mai mic valoare:
A = x max - x min

132

Neajunsul fundamental al acestui indicator const n


faptul c valoarea sa este determinat doar de dou dintre
valorile variabilei, celei extreme. Acasta nseamn c pot
aprea situaii de genul:
a) valorile maxim i respectiv minim, pentru dou
caracteristici, pot fi aceleai, dar distribuia
indivizilor pe scala respectiv de valori este
diferit;
b) exist o valoare maxim i/sau una minim care se
abat ( se abate) foarte mult de la seria celorlalte
valori.
Prima situaie are evident nevoie de o atenie sporit,
n ceea ce privete indicatorul de dispersie, i aceast
mprtiere a indivizilor pe setul celorlalte valori, aflate
ntre cea minim i cea maxim. n al doilea caz se
sugereaz existena unor valori foarte ndeprtate de marea
mas, numite n statistic valori aberante, ultimul cuvnt
nesugernd neaprat imposibilitatea existenei unui astfel
de caz i apariia lui printr-o eroare de msurare (dei nu
este exclus i aceast posibilitate), ci faptul c e vorba de
cazuri cu totul atipice, adic puine la numr, i care nu ar
trebui luate ca reflectnd situaia populaiei.
133

Pentru

rafinarea

procedurilorde

construcie

indicatorilor de dispersie, se poate avansa pe calea


reducerii sau chiar a eliminrii neajunsurilor sugerate fie
de situaia (a), fie de cea de la punctul (b). Cei mai
cunoscui indicatori astfel construii sunt abaterile.
5.2.2. Abaterea standard
Abaterea standard cunoscut i sub denumirea de
deviaia standard reprezentnd o variant special a
abaterii medii ptratice de la o valoare a

care se

calculeaz, aa cum arat i denumirea, prin ridicarea la


ptrat a diferenelor dintre valorile individuale i o mrime
constant, arbitrar aleas, a, urmat de nsumarea
ptratelor respective i de raportarea la numrul cazurilor
observate, adic la n. ntruct rezultatul acestei operaie
de medie este o mrime ptratic, n sensul c se msoar
n uniti ale lui X ridicate la ptrat, pentru a reveni la
dimensiunea normal, deci la unitile lui X, n final se
extrage radicalul din valoarea obinut. Aadar, abaterea
medie ptratic de la a, notat cu S(a), va fi dat de
formula:

134

S(a) =

(x
i =1

a) 2

n
Pentru o caracteristic dat, mrimea S(a) este n
funcie de valorile lui a. Aa cum abaterea medie atinge
minimul pentru cazul cnd valoarea de reper este mediana,
tot aa, se poate arta ( vezi, de exemplu, Yule i Kendall,
1969, p.147) c cea mai mic abatere medie ptratic este
cea fa de medie. Aceast form particular a abaterii
medii ptratice poart denumirea de abatere standard. Ea
se noteaz cu litera mic greceasc sigma

, i se obine

cu formula:
n

(x
i =1

x) 2

n lucrrile de statistic sau n alte texte din


domeniul tiinelor sociale, unde se ntlnete acest
indicator, el mai apare destul de frecvent i sub alte
denumiri: deviaie standard, ecart tip sau, pur i simplu,
dispersie.
Aplicaie: vezi anexa 2

135

5.2.3. Coeficientul de variaie


Indicatorii dispersiei se aplic i se aleg pentru
expresivitate n funcie de variabila aleas i, n general,
n funcie de variabilele care se compar, iar criteriu
fundamental de aplicare ine cont de faptul aceti
indicatori se msoar n unitile de msur ale variabilei
respecive i c schimbarea unitii de msur a unei
variabile are drept consecin obinerea unei valori, care,
n comparaie cu prima, conduce la alt raport sau la alt
diferen. Spre exemplu,

nu poate compara dispersia

veniturilor populaei englez (lire sterline) i cea a celor


din Romnia (lei), calculnd, simplu, abaterile standard
pentru

dou

distribuii

(ale

veniturilor

din

rile

respective).
Valoarea indicatorilor de dispersie este dependent
i de nivelul general al valorilor variabilei, exprimat, s
zicem, de valoarea medie. Pentru dou variabile de aceeai
natur, evaluate n aceleeai uniti de msur, abaterea
standard va fi, mai mare pentru cea cu media mai mare.
Pentru relevan se poate apela la un exemplu
contrastant, s presupunem c ne intereseaz greutatea
136

corporal la pentru dou specii, una de insecte - libelula,


s zicem i alta de mamifere de pild rinocerii. n
primul caz, diferenele dintre indivizi i dintre valorile
acestora i cea medie sunt de ordinul gramelor, pe cnd n
al doilea de ordinul kilogramelor sau chiar al zecilor de
kilograme. E limepede c orict de omogen ar fi
populaia de elefani, abaterea standard obinut aici va fi
de un cu totul alt ordin de mrime dect cea calculat la
nivelul albinelor, dac se utilizeaz aceeai unitate de
msur. Ridicarea nivelului mediu al valorilor dilat
practic scara de valori i atrage, aa cum spuneam, o
mrire i a indicatorilor de dispersie.
Pentru a se nltura aceste dificulti de comparaie,
s-a propus (Pearson) un indicator numit coeficient de
variaie notat cu v, i dat de formula:
vx =

x
x

Prin mprirea abaterii standard la medie se nltur


att unitatea de msur, ct i diferena n nivelul valorilor.
Coeficientul de variaie dei aparent utiln domeniul
tiinelor sociale, se aplic rareori, datorit capcanelor n
care se poate cdea deorece adesea se uit faptul c acest
137

indicator este aplicabil doar n cazul variabilelor


msurate pe scala de rapoarte, cu origine zero natural.
Schimbarea originii scalei las diferenele dintre valori
nemodificate, ceea ce nsemn c i abaterea standard va
rmne invariabil (proprietatea a doua a abaterii standard
menionat mai sus); n schimb media se modific la
translaia valorilor i, drept urmare, i raportul din formula
coeficientului de variaie se schimb. Mai mult, originea
poate fi astfel plasat nct media s fie zero i atunci
raportul devine fr sens.

5.3. Indicatori ai formei distribuiei


Aspecte privind formele intr n discuie atunci cnd
avem de a face cu variabile continue, ce pot fi aranjate ca
distribuii de frecvene, prin apelul la intervale de grupare,
deoarece, aa cum am sugerat n capitolul anterior,
distribuiile empirice se por raporta la nite entiti
perfecte (curbele matematice, constituite n condiii ideale)
i deci se va prelua de la aceste curbe ideea de form a
acestora, care, presupune dou aspecte:
1. n ce msur distribuia se abate de la cazul-limit
al simetriei n jurul valorilor centrale, caz de
138

simetrie ilustrat, n statistica matematic, n modul


cel mai clar de distribuia normal. Se introduc
astfel indicatori ai oblicitii.
2. n ce msur distribuia este mai plat sau mai
boltit, comparativ cu o distribuie normal de
abatere standard respectiv. Se exprim prin
indicatori ai boltirii sau de exces.

139

Anexa 2
Exerciiul 1: Determinai destinaia de vacan a unui
eantion de 17 studeni ai facultii dumneavoastr
utiliznd urmtoare ntrebare cu variante de rspuns:
Unde v-ai petrecut o parte din vacana de iarn?
1 = la munte
2 = la mare
3 = acas cu familia
4 = la bunici
5 = n strintate
6 = n vizit la rude sau prieteni
7 = alte situaii
Exemplu rspunsuri obinute la nivelul fiecrui student:
Rspunsuri: S1 =3, S2 =1, S3 = 3,S4 = 2, S5 = 1, S6 = 3, S7 =
3, S8 = 4, S9 = 3, S10 = 5, S11 = 3, S12 = 3, S13 = 6, S14 = 3,
S15 = 6, S16 = 3, S17 = 3

140

Mo = 3, acesta reprezentnd rspunsul cel mai frecvent sau


cel care caracterizeaz populaia respectiv, la nivel
general

Exerciiul 2: Repetai sau utilizai rspunsurile de la


exerciiul 1. Acestea sunt:
Rs = 3,1,3,2,1,3,3,4,3,5,3,3,6,3,6,3,3
Aranjai-le n ordine cresctoare sau descresctoare
Rs = 1,1,2,3,3,3,3,3,3,3,3,3,3,4,5,6,6
Me = 3

Aplicaie : abaterea standard


Pentru a realiza necesitatea i rolul abaterii standard privii
cele dou iruri de date numerice (reprezentnd numrul
de vizitatori la 2 muzee diferite ntr-o perioad de 10 zile)
de mai jos:
141

A) 34, 40, 37, 30, 35, 33, 38, 39, 32, 34


B)1, 6, 153, 10, 0, 100, 14, 5, 1, 60
Pasul 2: Calculai media aritmetic a fiecrui ir
x

= 35

= 35

Concluzie: media aritmetic nu exprim variaiile n


dispersie, lsnd la o parte aspecte importante.
Calculul

abaterii

standard

prin

aplicarea

formulei

presupune 6 stadii dup cum urmeaz:


S presupunem c avem de calculat abaterea standard
pentru numrul de vizitatori ai Muzeului Naional de
Istorie n perioada 1986 - 2000. Datele valorice fiind
urmtoarele:

142

Anul

Numr vizitatori (mii)

1986
1987
1988
1989

Nv
2
2.8
3.5
5.1

1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000

6
5.5
5
5
5.3
5.7
4.9
4.5
4.5
4.5
4.5

Stadiul 1
Se calculeaz media aritmetic a irului de date
x

= 4,59

143

Stadiul 2
Se calculeaz diferena Nv -

, pentru fiecare valoare a

lui Nv, adic diferena dintre fiecare valoare a numrului


de vizitatori i media aritmetic obinut la stadiul anterior
Nv
2
2.8
3.5
5.1
6
5.5
5
5
5.3
5.7
4.9
4.5
4.5
4.5
4.5
Stadiul 3

Diferena Nv - x , ( x = 4.59)
-2.59
-1.79
-1.09
0.51
1.41
0.91
0.41
0.41
0.71
1.11
0.31
-0.09
-0.09
-0.09
-0.09

Se ridic diferena la ptrat (Nv Nv


2
2.8
3.5
144

Nv - x
-2.59
-1.79
-1.09

)2 dup cum urmeaz:


(Nv - x )2
6.708
3.20
1.188

5.1
6
5.5
5
5
5.3
5.7
4.9
4.5
4.5
4.5
4.5

0.51
1.41
0.91
0.41
0.41
0.71
1.11
0.31
-0.09
-0.09
-0.09
-0.09

0.26
1.988
0.828
0.168
0.168
0.504
1.232
0.096
0.008
0.008
0.008
0.008

Stadiul 4
Se calculeaz suma tuturor diferenelor ptrate

(Nv -

)2 = 16,372

Stadiul 5
Suma obinut se divide la numrul total de valori
existente n irul de date (15)
16,372 : 15 = 1, 0914
Stadiul 6

145

Se calculeaz radical din rezultatul obinut.

Acesta

reprezint valoarea deviaiei standard.


1,0914

= 1,044

Semnificaia acestei valori: n general cu ct


deviaia standard are o valoare mai mare (n comparaie cu
media aritmetic) cu att dispersia, distribuia datelor este
mai mare fa de aceast medie cu ct deviaia standard
are o valoare mai mic cu att mai concentrate, mai
apropiate de medie sunt datele.

146

147

Capitolul 6
STATISTICA INFERENIAL
INTRODUCERE
6.1. Introducerea termenilor de populaie
i eantion
n introducerea acestui capitol este poate util s fie
trecute n revist de data aceast n mod simplificat
elementele eseniale studiate teoretic n primul capitol
dar cu care ncepnd din acest punct se trece la aplicaii.
Folosit n sensul obinuit, noiunea de populaie
este foate adesea asociat cu aspectele demografice:
populaia unei ri, populaia unui ora etc. n statistic,
sensul dat noiunii de populaie este mai puin restrictiv:
se numete populaie mulimea indivizilor care au n
comun cel puin o caracteristic.
Urmeaz apoi noiunea de individ trebuie i ea
neleas intr-un sens larg. Nu este vorba neaprat despre
indivizi umani, ci i despre grupuri de persoane (familie,
grupuri

148

Termenul de caracteristic este la rndul su foarte


vast dup cum s-a putut constata, mai ales din punct de
vedere teoretic. Am amintit mai sus c o populaie este
compus din indivizi care pot fi orice element definit. O
populaie poate fi caracteizat n orice fel, ceea ce
ndeprteaz aceast noiune de sensul ei obinuit, care o
asociaz unui numr mare. n statistic, populaia nu
nseamn mii de indivizi. Caracterul ei esenial const n
faptul c putem gsi toi indivizii care rspund criteriului
ce definete populaia. Astfel, toate femeile divorate de
dou ori, toi brbaii nscui n Patagonia n luna aprilie,
toate ntreprinderile de microinformatic sunt tot attea
exemple de populaii diferite, n sensul statistic al
termenului. Cu alte cuvinte, definirea caracteristicilor unei
populaii nu este lilitat. Singura condiie este ca aceste
caracteristici s fie perfect stpnite, pentru a evita
includerea n populaia care ne intereseaz a indivizilor
nepotrivii. Nici mrimea populaiei nu este limitat.
Eantionul reprezint un subansamblu al unei
populaii. Pentru a trage concluzii asupra ansamblului
populaiei, msurtorile se vor efectua pe acest eantion.
Sigur c felul n care se construiete eantionul (adic
149

eantionarea, sondajul) este crucial. Calitatea eantionrii


garanteaz c informaia culeas din eantion poate fi
considerat ca fiind cea pe care am fi cules-o dac am fi
interogat ntreaga populaie. Acest eantion trebuie deci s
fie ct mai reprezentativ pentru populaia de care aparine.
Am

vzut,

de

asemenea,

aplicarea

metodei

experimentale implic adesea echivalena eantioanelor


luate n considerare. Aceast echivalen este asigurat
dac eantioanele sunt la fel de reprezentative pentru
populaia din care sunt extrase. Iat pe scurt cteva dintre
principalele metode de eantionare, prezentate cu titlu
ilustrat.
Prelevarea esntioanelor
1) Metodele empirice
Acest

termen

reunete

metodele

legate

de

cunoaterea prealabil a caracteristicilor populaiei.


Metoda prin cote
Este frecvent citat n mass-media, ntruct este
folosit n cunoscutele sondaje politice. ndivizii care
formeaz eantionul sunt alei astfel nct caracteristicile
eseniale ale populiei (vrst, sex, categorie socio150

profesional, stare civil etc.) se regsesc n eantion n


aceleai proporii, conform anumitor cote. Proporia
repartiiei criteriilor n cadrul populaiei este aadar
respectat n cadrul eantionului.
Metoda prin uniti tip
Aceast metod const n mprirea populaiei n
categorii, pornind de la variabilele considerate eseniale
pentru problematica studiului respectiv.
2) Metodele probabiliste
Acest termen reunete metodele care fac apel la
extracia aleatorie a indivizilor ce formeaz eantionul.
Tragerea la sori elementar
Const n numerotarea tuturor indivizilor care
formeaz populaia studiat i apoi extragerea, la
ntmplare, a unui numr definit de numere. Teoretic,
diferitele caractere ale populaiei sunt identic reprezentate
n eantion. Un exemplu clasic const n a imagina o urn
cu 100 de bile, dintre care 60 sunt roii, 30 albastre i 10
verzi. Dac bilele sunt bine amestecate, extragerea
aleatorie a 10 bile trebuie s prezinte culorile n aceleai

151

proporii, adic 6 bile roii, 3 albastre i una verde. La fel


se ntmpl i pentru caracterele umane. La sfritul unei
trageri la sori, dispunem astfel de indivizi care, teoretic,
prezint totalitatea caracterelor populaiei i, drept urmare,
constituie un grup reprezentativ pentru aceast populaie.
Metoda are ns un dezavantaj: necesit foarte mult
timp pentru recenzarea tuturor indivizilor care formeaz
populaia i gsirea indivizilor al cror numr a fost tras la
sori. Drept urmare, n majoritatea cazurilor, aceast
metod se folosete pentru populaii reduse, n care
indivizii care o compun pot fi evaluai i recunoscui.
Tragerea la sori secvenial
Este tragerea la sori dupa crirerii succesive. O
populaie se definete print-un anumit criteriu, dup care
se extrage aleatoriu un eantion ce rspunde acestui
criteriu. Se definete apoi un alt criteriu i, din interiorul
primilui eantion, se treage din nou la sori pe baza acestui
nou criteriu etc. De exemplu, vrem s facem un studiu
asupra studenilor din primul an de psihologie. Se
preleveaz la ntmplare un anumit numr de studeni, iar
dintre ei se repereaz cei care sunt nscrii la psihologie.
Se face o nou tragere la sori dintre aceti indivizi, dup
152

care i reperm pe cei nscrii n anul I i facem i facem a


treia tragere la sori. Putem spori numrul de criterii, dar
fiecare criteriu suplimentar limiteaz numrul de indivizi
disponibili: probabilitatea

de a ntlni indivizii care

rspund tuturor criteriilor scade pe msur ce crete


numrul de criterii.
Metoda stratificrii
Populaia se mparte n subpopulaii numite straturi,
care au, fiecare, caracteristici proprii. Se trage apoi la sori
un eantion din interiorul fiecrui strat. Mulimea acestor
eantioane constituie eantionul de studiu.
Desigur, prezentarea metodelor de eantionare ar
necesita o lucrare ntreag. Ce trebuie nels aici este c
extrapolarea la ansamblul populaiei a rezultatelor obinute
pe un eantion nu este fiabil dect dac acest eantion
este ct mai reprezentativ pentru populaia respectiv. Tot
aa, compararea a dou msurtori realizate pe dou
eantioane distincte nu este valid dect dac acestea sunt
echivalente 1n planul reprezentativitii. Vom vedea ns
c n statistic se ia o marj de eroare la eantionare, ceea
ce nu nsemn ns abandonarea msurilor de precauie
elementare n construirea eantionului.
153

O dat eantionul construit, se procedeaz la diferite


msurtori cu scopul de a trage anumite concluzii despre
populaia din care a fost extras. Este ns posibil i s
efectum msurtorile asupra mai multor eantioane,
pentru ale compara mai ulterior. Aa se ntmpl practic
ntotdeauna n cadrul unei experiene. n acest caz, este
foarte important s evalum dac msurtorile au fost
realizate asupra unor eantioane distincte (eantioane
independente) sau asupra acelorai indivizi ( eantioane
perechi;).

6.2. Legea normal


Prezentarea aa-numitei legi normale permite
nelegerea mai clar a caracteristicilor noiunii de
inferen statistic. S lum un exemplu fictiv: se
administreaz un test cu scoruri al gradului de satisfacie
unui eantion de 30 de turiti care au avut aceeai
destinaie de vacan. Pentru fiecare scor, se noteaz
efectivul obinut:

154

Scor la test

Efectiv

30
31
32
33
34
35
36
37
38
39
40

0
1
2
3
5
8
5
3
2
1
0

Se efectueaz apoi reprezentarea grafic a acestei


distribuii printr-o diagrama cu bee (Figura 6.1.):
Fig.6.1.

155

Dac rezumm distribuia cu ajutorul mediei i


abaterii standard, se obin o medie de 35 i o abatere
standard de 1,87. Se constat o simetrie perfect a curbei
distribuiei, de o parte i de cealalt a mediei. Aceasta este
curba unei distribuii numite normal (curba lui Gauss).
De ce normal? Pur i simplu pentru c majoritatea
caracteristicilor fizice i umane se repartizeaz astfel. De
exemplu, nlimea: exist muli oameni a cror nlime
este apropiat de medie i , cu ct ne apropiem de nlimi
extreme, cu att numrul indivizilor scade. La fel pentru
greutate, inteligen, numrul de copii, puls etc. Exist o
mulime de distribuii normale, dar ele se deosebesc prin
valorile variabilei msurate i prin valorile mediilor i
abaterilor standard. Toate aceste distribuii sunt ns
identice n ceea ce privete repartiia proporiilor pe un
continuum de variaii. Aceasta nseamn c pentru o
anumit valoare a oricrei distribuii care urmeaz legea
normal se poate ti proporia de valori care i sunt
superioare i inferioare. n acest scop dispunem de o lege
standard numit legea normal centrat i redus, pentru
care valoarea mediei i a abaterii standard au fost fixate o
dat pentru totdeauna.
156

6.2.1. Legea normal centrat i redus

Definiie
Orice distribuie care urmeaz legea normal poate fi
transformat n distribuie normal centrat i redus. n
acest scop, fiecare dintre valorile x ale distribuiei se
transform ntr-o valoare normal centrat i redus
(notat z) cu formula urmtoare:
z=

x mediadistributiei
abatereas tan dardadistributiei

n exemplul precedent avem:


30 35

z1= 1,87

31 35

z2= 1,87

32 35

z3= 1,87

33 35

z4= 1,87

34 35

z5= 1,87

z6= 1,87

= 2,13

z7= 1,87

= 1,60

z8= 1,87

= 1,06

z9= 1,87

= 0,53

z10= 1,87

40 35

z11= 1,87

35 35

= 2,6

36 35
37 35
38 35

=0
= 0,53
= 1,06

=1,60

39 35

= 2,13

= 2,6

157

Obinem deci o nou distribuie (distribuie normal


centrat i redus) creia i putem calcula media i
abaterea standard. Se observ c media este egal cu 0 i
abaterea standard este egal cu 1. Aceast distribuie fiind
standardizat, este uor de alctuit un tabel cu proporiile
de valori care se gsesc de o parte i de alta a unei valori z
date, tabelul legii normale centrate i reduse. Se citete n
felul urmtor:
S presupunem c vrem s gsim proporiile asociate
lui z = 1,96 (care, datorit caracteristicilor legii normale
centrate i reduse, nseamn proporiile de valori aflate la
o distan de 1,96 abateri standard de medie).
n prima coloan a tabelului, cutm ntregul i
prima zecimal a valorii z (adic 1.9); pe prima linie
cutm complementul, adic a doua zecimal (aici:0.06).
La intersecia lor se afl valoarea 0.05000), care
corespunde frecvenei (exprimat pe o scal de la 0 la 1)
sumei probabilitilor valorilor aflate de la o distan de
1,96 abateri standard de medie. Aceasta nseamn pur i
simplu c, n procente, 5% din valori sunt inferioare lui
1,96 i superioare lui + 1,96. Sau, cu alte cuvinte, c 2,5%

158

din valori sunt inferioare lui 1,96 i 2,5% - superioare lui


1,96.
Legea normal centrat i redus are numeroase
utilizri, pe care nu le vom enumera aici. Cea care ne ve
interesa este aceea care permite estimarea probabilitii de
apariie a diferitelor valori ale unei variabile.
De exemplu, un studiu asupra a 1.000 de copii mici
arat c primele cuvinte apar n medie la vrsta de 11,5
luni, cu o abatere standard de 3,2 luni, aceast distribuie
fiind normal. S presupunem c mama unui copil de 14
luni care nu a spus nc primul cuvnt vrea s tie ce
proporie de copii se afl n aceeai situaie cu al ei. Pentru
a-i rspunde, transformm valoarea 14 n variabil
normal centrat i redus, cu ajutorul formulei de mai
sus. Se obine:
z=

14 11,5
= 0,78
3,2

Raportndu-ne la tabel, observm c proporia


asociat lui z =0,78 este de 0,43539. Deci 43,53 % dintre
copii spun primele cuvinte dup 14 luni i nainte de
[11,5-(14-11,5)] = 9 luni. Dat fiind simetria strict a legii,
putem rspunde mamei c 21,76 % (43,53/2) dintre copii
159

spun primele cuvinte dup vrsta de 14 luni i c, prin


urmare copilul ei nu este un caz izolat.

De la descriere la inferen
Principiul general
Am vzut c legea normal centrat i redus
permite evaluarea frecvenelor de apariie a anumitor
valori ntr-un eantion al unei populaii date. Aceast lege
permite deci descrierea distributiei eantionului n funcie
de medie i de abaterea standard.
Foloasele ei merg ns mai departe. Plecnd de la
cunotiinele asupra eantionului (media, abaterea standard
i mrimea lui), putem estima mai mult sau mai puin
precis, parametri ce caracterizeaz populaia din care s-a
extras acest eantion. Plecnd de la anumii parametri ai
eantionului, ncercm extrapolarea lor la o populaie.
Trecem astfel de la procedur descriptiv la una
inferenial.
Se pune deci ntrebarea urmtoare: putem deduce
media i abaterea standard a unei populatii pornind de la

160

media i abaterea standard a unui eantion de mrime n,


extras din aceast populaie?
Ca s rspundem acestei ntrebri trebuie s zbovim
puin asupra legii normale centrate i reduse.
Fie o populaie din care s-au prelevat un numr mare
de eantioane. Facem aceeai msurtoare pe toate aceste
eantioane i se calculeaz mediile i abaterile standard
corespunztoare. Putem deci s ne apropiem de distribuia
respectivelor medii i s-i calculm media i abaterea
standard. Observm c aceast medie este egal cu aceea a
populaiei i c abaterea standard, numit eroare de
eantionare (eroare de sondaj) pe medie, este egal cu
abaterea standard a populaiei mprit la

Ori, n realitate, acest lucru este imposibil, ntruct


nu putem extrage un numr mare de eantioane. ncercm
atunci s evalum, pornind de la un singur eantion,
valoarea probabil a mediei populaiei din care s-a extras.
Se demonstreaz c, dac distribuia msurtorilor
realizate pe eantion urmeaz legea normal, media este
aproximativ egal cu

cea a populaiei din care a fost

extras, iar eroarea de eantionare este egal cu abaterea


standard a eantionului mprit la

.
161

Noiunea de prag de ncredere


Aceasta mai apare n anumite lucrri de specialitate
i sub denumirea de grad de confiden sau de certitudine.
Media populaiei este doar aproximativ egal cu cea
a eantionului deci nu poate fi dedus strict. Se pot ns
calcula limitele ntre care se situeaz. Ele se numesc limite
de ncredere ale mediei populaiei i vom vedea cum se
determin. Vom ncerca, desigur, s definim aceste limite
cu cea mai mare certitudine. Ori, ntr-un fel, gradul de
certitudine se poate controla adoptnd un risc de eroare:
media s nu se gseasc ntre limitele calculate.
Principiul este uor de neles: s ne imaginm patru
studeni care au dat un examen de statistic i sunt
ntrebai ce not cred c vor lua. Primul estimeaz, fr
siguran, c va lua 10. Al doilea afirm, ezitnd, c va lua
ntre 9 i 11. Al treilea spune c este rezonabil s ia ntre 7
i 13. n sfrit, al patrulea este absolut sigur c va lua
ntre 0 i 20. Aceast poveste ilustreaz bine c, pe msur
ce intervalul de ncredere crete, crete i sigurana
studentului. Invers, cu ct riscul asumat este mai mare, cu
att intervalul este mai mic. Astfel, cnd afirmm c,
innd cont de media i de abaterea standard ale
162

eantionului, media populaiei este strict egal cu o anume


valoare, precizia este mare, dar ne asumm riscul enorm
de a nela. Dac estimm ns c media populaiei
fluctueaz ntr-un interval foarte larg, riscul de a ne nela
este mic, dar precizia este i ea redus. Trebuie deci s
gsim cel mai bun compromis ntre riscul de eroare i
precizia inferenei.
O convenie a comunitii tiinifice ne poate ajuta la
asumarea acestei grele responsabiliti: toi autorii sunt de
acord c nivelul maxim de risc trebuie plasat la 5% - ceea
ce nseamn c media populaiei are minimum 95 de anse
din 100 s aparin intrevalului calculat (i deci 5% anse
s nu aparin acestui interval). ntruct pragul de 95%
este un minimum acceptabil, el poate fi ridicat (99 anse,
99,9 anse...). Tot prin convenie tiinific valorile
acestora sunt precalculate i se gasesc de regul la sfritul
publicaiei n care se utilizeaz.

163

Aplicaie
S revenim la problema noastr. Am vazut c, dac
distribuia valorilor prelevate ntr-un eantion urmeaz o
lege normal, atunci: Media eantionului = Media
populaiei i
Eroarea de eantionare =
Abatereas tan dardaesantionului
.
n

Distribuia fiind normal, media eantionului poate fi


transformat n variabil normal centrat i redus cu
formula
z=

x Mediadistributiei
Abatereas tan dardadistributiei

care, aici,

devine:
Mediaesantionului
Abatereas
tan dardaesantionului
z=
n

Adic, dup rezolvare:


Media populaiei = Media eantionului

Abatereas tan dardaesationului


z

Aici intervine gradul de certitudine pe care l-am


amintit. Valoarea z se va fixa conform pragului de
164

ncredere dorit (risc de eroare 5%, de 1%...). Dac fixm


ca prag de ncredere maximul stabilit de comunitatea
stiinific (5%, adic 0,05), este suficient s ne raportm la
tabelul legii normale centrate i reduse i s-l citim invers,
pentru a determina valoarea z corespunztoare acestui
prag. Gsim z = 1,96. Astfel, cu un risc de eroare de 5%,
se poate afirma c media populaiei se situeaz ntre:
Media eantionului (1,96
Abatereas tan dardaesantionului

)
n

i
Media eantionului + (1,96
Abatereas tan dardaesantionului

)
n

Aplicaie
Gradul de satisfacie al unui grup de 280 de copii de
aceeai vrst aflai ntr-o tabr a fost examinat cu
ajutorul unei scale cu scoruri. Media scorurilor observate
a fost de 108, cu o abatere standard de 14,6. Dorim s
estimm, la pragurile de 0.05 i 0.01, media populaiei din
care s-a extras acest eantion.
In tabelul legii normale centrate i reduse se observ
c, la pragul 0.05, z = 1,96. Se poate calcula acuma
165

intervalul cruia i aparine media populaiei din care s-a


extras acest eantion:
- limita inferioar = 108 (1,96

1,96
) =106,28;
280

- limita superioar = 108 +(1,96

1,96
) =109,71
280

Se estimeaz deci, cu un risc de eroare de 5%, c


media coeficienilor

ai copiilor de clasa a asea este

cuprins ntre 106,28 i 109,71.


La pragul de 0.01, valoarea z este 2,56. Formulele
devin:
- limita

inferioar

108 ( 2,56

limita
108 + ( 2,56

1,96
) = 105,76
280

superioar

1,96
) = 110,23
280

n consecin, cu un risc de eroare de 1%, se


estimeaz c media coeficienilor intelectuali ai copiilor de
clasa a asea este cuprins ntre 105,76 i 110,23.
Observaie. Se constat c intervalul se mrete
cnd riscul de eroare este mai slab. Aceasta este o ilustrare
166

perfect a gradului de certitudine amintit mai sus. Cu ct


gradul de certitudine este mai slab, cu att imprecizia este
mai mare, i invers.
Eantioane mici i mari
Am vzut la nceputul acestei seciuni c repartiia
mediilor

posibile

ale

eantioanelor

extrase

dintr-o

populaie tinde s aib alura unei curbe normale. La fel,


cnd dintr-o populaie se extrage un numr suficient de
indivizi a cror distribuie este normal, curba repartiiei
valorilor eantionului tinde s urmeze legea normal.
Aceast condiie nu este ns ndeplinit dect dac
efectivul eantionului este suficient de numeros. n cazul
contrar, curba repartiiei valorilor eantionului tinde s
urmeze legea lui Student. Muli autori fixeaz acest efectiv
la 30. Cu alte cuvinte, cnd efectivul eantionului este mai
mare de 30, distribuia valorilor tinde s urmeze legea
normal; cnd efectivul eantionului este mai mic sau egal
cu 30, distribuia valorilor tinde s urmeze legea lui
Student.
Ca i legea normal centrat i redus, legea lui
Student permite determinarea probabilitii de apariie a
unor abateri teoretice. Aceste abateri se desemneaz prin
167

litera t (spre deosebire de z pentru legea normal centrat


i redus). Ca i distribuia normal, distribuia lui t este
simetric. i ea are media egala cu 0, dar abaterea standard
depinde de gradul ei de libertate egal cu (efectivul
eantionului-1).
Formula de determinare a intervalelor de fluctuaie a
mediei populaiei este, desigur, aceeai. Singura schimbare
reprezint, n cazul eantioanelor mai mici sau egale cu
30, valoarea z nlocuit printr-o valoare t dat de tabelul t a
lui Student.
Acest tabel se citete astfel:
- n prima coloan se afl gradele de libertate (gdl);
- pe prima linie, pragurile de probabilitate;
- n interiorul tabelului, valorile lui t.
Aplicaie
Un grup de 25 de copii de aceeai vrst aflai ntro tabr au fost rugai s-i exprime atracia pentru un
set de activiti utilitnd o scr cu scoruri . Media
scorurilor a fost de 98, cu o abatere standard de 10.
Dorim s estimm, la pragul de 0.02, media populaiei din
care s-a extras acest eantion.

168

Avem un eantion cu efectiv redus. n tabelul t a lui


Student, la pragul de probabilitate de 0.02 i gradul de
libertate gdl = 25 1 = 24, gsim t = 2,4. Se poate calcula
acum intervalul cruia i aparine media populaiei din care
s-a extras acest eantion:
- limita inferioar = 98 (2,4

10
) = 93,2 ;
25

- limita superioar = 98 + (2,4

10
) = 102,8 .
25

n consecin, cu un risc de eroare de 2% se


estimeaz c media coeficienilor
intelectuali ai copiilor de clasa a asea este cuprins ntre
93,2 i 102,8.
6.2.2. Principiul testelor statistice
Reamintim c scopul colectrii datelor l reprezint,
dup analiz i tratament, confirmarea sau infirmarea unei
ipoteze. n acest scop, dispunem n statistic de multe teste
care ne permit s rsundem unor ipoteze. Exist, de
asemenea, teste care compar ntre ele medii, proporii,
variane, teste care studiaz corelaiile ntre dou variabile
etc. Folosirea oricrui tip de test este supus unui

169

tratament prealabil: trebuie formulate dou ipoteze, n


general contrare, care vor fi testate alternativ.
Ipoteza nul. Aceast ipotez, notat Ho, presupune
c fenomenul studiat se datoreaz unor factori ntmptori,
i nu unor factori sistematici. Cu alte cuvinte, a formula
ipoteza nul nseamn a afirma c toate msurtorile pe
care dorim s le comparm sunt strict egale sau c
diferenele dintre ele se datoreaz numai ntmprii (adic
eantionrii aleatorii, faptului c eantioanele comparate
nu sunt strict echivalente sau faptului c, prin definiie, n
tiinele umane, fiecare individ dintr-un eantion este
diferit de un altul etc.)
Ipoteza alternativ sau iniial. Notat Hi, aceasta
corespunde n general ipotezei c fenomenul observat nu
se datoreaz fluctuaiilor de eantionare, ci unor factori
manipulai sau studiai. Aceast ipotez presupune deci c
ntmplarea

nu

este

suficient

pentru

explicarea

diferenelor obinute ntre eantioane.


Dintre aceste dou ipoteze, cea verificat de testele
statistice este ntotdeauna ipoteza nul. Orice test este
construit pe baza absenei de efect a unei variabile
oarecare. Sunt deci posibile dou soluii:
170

Ipoteza nul fie se pstreaz, fie se respinge, i


atunci putem reine ipoteza alternativ.
Meninerea sau respingerea Ho nu este dat totui de
rezultatul absolut al testului, ci este mai ales legat de
riscul de eroare pe care carcettorul i-l asum atunci cnd
afirm c una dintre cele dou ipoteze este adevrat.
Acest risc de eroare se numete prag de semnificativitate,
prag de probabilitate sau prag de ncredere, aa cum l-am
numit mai sus. Valoarea lui fixeaz riscul pe care ni-l
asumm atunci cnd afirmm c fenomenul observat se
datoreaz mai degrab unui factor sistematic dect unor
erori de eantionare. Am vzut c, de obicei, pragul
acestui risc se fixeaz la 5%.
Cu alte cuvinte, testul ne spune c: potrivit datelor
colectate, dac afirmai c se respinge ipoteza nula, v
asumai un risc de 5% sau de 1%... s v nelai. Sau:
putei afirma c se respinge ipoteza nul, dar avei 5% sau
1%... anse s nu fie adevrat. n jargonul statistic, se
spune c un anumit rezultat este semnificativ la 0.05 sau
0.01.. Dincolo de pragul celor 0.05, despre acest rezultat
se spune c este nesemnificativ sau c riscul de a afirma
c HO este fals este prea mare.
171

6.3. Teste parametrice i teste neparametrice


Se disting dou familii de teste statistice: cele numite
teste parametrice, a cror formulare se sprijin pe legile
probabilitii care cer ca distribuiile studiate s aib
anumite caracteristici, i cele numite teste neparametrice,
care nu cer respectarea acestor caracteristici.
Pentru folosirea unui test parametric, este de dorit ca,
mcar ntr-o msur aproximativ:
- distribuia sau distribuiile s urmeze o lege
normal;
- datele de care dispunem s provin dintr-o scal
de intervale;
- dac dorim s comparm mediile a dou sau mai
multe distribuii, varianele acestora s fie
omogene

(adic

nu

trebuie

existe

dezechilibre mari ale dispersiilor).


naintea folosirii oricrui test parametric, trebuie s
ne convingem c aceste condiii sunt ndeplinite. n
realitate ns, majoritatea utilizatorilor efectueaz foarte
rar o asemenea verificare. Riscul asociat acestei omisiuni

172

este c ipoteza nul se respinge n mod greit i c se


constat diferene sau relaii acolo unde ele nu exist.
Testele

neparametrice

nu

impun

condiii

de

normalitate i omogenitate ale dispersiilor. Se spune c ele


sunt independente de distribuie. Ar trebui deci ca ele s
fie folosite sistematic ori de cte ori datele culese pe o
scal de intervale nu se distribuie conform legii normale i
sunt deosebit de indicate pentru msurtori efectuate pe
scale ordinale sau de tip clasament. Testele neparemetrice
au ns reputaia de a fi mai puternice dect cele
parametrice, de unde frecvena excesiv de sczut a
utilizrii lor, consecinele acestei pretinse slbiciuni fiind
creterea riscului de respingere greit a ipotezei nule.

173

Capitolul 7
TESTELE N ANALIZA STATISTIC
APLICAT
Analiza statistic presupune aplicarea unor metode de
calcul datelor sau irurilor de date statistice n vederea:
testrii anumitor caliti, caracteristici ale acestora
stabilirii existenei unei relaii ntre acestea
determinarea tipului de relaii dintre acestea
determinarea semnificaiei relaiei dintre date
Aminteam la sfritul capitolului precedent faptul c n
statisic exist dou categorii de teste:

parametrice i

neparametrice. Testele parametrice sunt teste care se


utilizeaz mai ales n tiinele exacte , aplicndu-se n
general dalor intervale cu frecvene absolute. Datele
crora li se aplic trebuie s aib o distribuie normal.
Sunt cunoscute ca fiind teste foarte riguroase, cu
greutate tiinific. Datorit acurateii privind calitatea
datelor aceste teste se utilizeaz mai rar n tiinele sociale
i deci i n turism sau geografia uman.

174

Testele neparametrice. Acestea se aplic tuturor


categoriilor de caracteristici (nominale, ordinale sau
intervale). Distribuia normal a datelor nu este o condiie
pentru

a putea fi utilizate n testele non parametrice.

Aceste teste sunt mai puin pretenioase n ceea ce


pvivete calitatea datelor ca cele parametrice dar sunt mult
mai robuste i flexibile.
n turism aproape toate metodele aplicate sunt
neparametrice.
Cu alte cuvinte n acest curs de statistic aplicat se
vor utiliza numai metode i tehnici neparametrice

7.1. Corelaia
7.1.1. Introducere
Definiii.
Corelaia... reprezint un test utilizat pentru
exprimarea gradului de asociere sau a intensitii unei
relaii existente ntre dou valori sau mai multe
variabile(Goodall 1987)

175

Corelaia ... este o metod... de descriere a gradului


de asociere dintre 2 seturi de valori pereche (Hammond
and McCullagh 1982)
Corelaia este o metod eficient de a detecta i
nsuma relaiile dintre dou variabile. Aspectul cel mai
important privind corelaia este acela privind citirea lor,
adic interpretarea rezultatului obinut. Acest rezultat, de
fapt , msoar legtura dintre variabile; stabilete gradul
de legtur dintre ele. Aceast msurtoare sau grad se
numete , coeficient.
Exist un numr mare de coefcieni de corelaie n
statistic, n funcie de natura variabilelor , a legturii, a
modului de colectare a datelor etc. Toi coeficienii de
corelaie n final detecteaz dac valorile unor variabile
co-variaz

(variaz

mpreun).

Adic

indic

dac

diferenele aprute la nivelul valorilorilor unei variabile


tind s se asocieze cu diferenele aprute la nivelul alteia.
Odat stabilit corelaia, aceast NU presupune automat,
faptul c o variabil este determinat sau cauzat de
cealalt. Corelaia stabilete prezena de relaii cauzale,
dar nu este suficint pentru a demonstra cauzalitatea

176

unei relaiI. Cu alte cuvinte corelaia poate indica prezena


unei relaii de cauzalitate dar nu o demonstreaz.
n afar de faptul c prin corelaie se stabilete covariaia, coeficienii de corelaie pot furniza trei tipuri de
informaie asupra relaiei descoperite:
1. intensitatea relaiei, indicat de valoarea
coeficentului de corelaie; cu ct acesta este
mai mare cu att relaia este mai puternic
2. direcia relaiei (mai ales pentru datele
ordinale i intervale), pozitiv sau negativ
3. linearitatea, tendina de distribuia a datelor
variabile, liar sau non-linear
Mai concret: n statistic corelaia are un neles,
semnificaie, specific/. Presupune automat faptul c , spre
exemplu ,n timp ce o variabil crete sau descrete ca
valoare a doua variabil crete sau descrete i ea. Pentru
exemplificare privii figura de mai jos. ( Fig. 7.1.)
Ea reprezint un exemplu de distribuie a dou variabile A
i B. Vizual, se poate detecta vreo relaie, corelaie ntre
ele? Adic putem spune c se ntmpl ceva cu A n timp
ce cu B se ntmpl ceva sau altceva? Exist o relaie de
covariaie?
177

Variabila B

Fig. 7.1.
18
16
14
12
10
8
6
4
2
0
0

10

15

20

Variabila A

Rspuns corect: nu !
Dar n figura de mai jos?
Fig. 7.2.
25

20

15

10

0
0

178

10

12

14

Rspuns corect: da! Mai mult observm c atunci cnd


una crete, cealalt crete i ea. n limbaj statistic avem de
a face cu o corelaie pozitiv ntre cele 2 variabile.
Repetm jocul observaei i cu figura de mai jos!
(Figura 7.3.) Exist vreo relaie, corelaie ntre variabilele
de mai jos?
Fig. 7.3.

25
20
15
10
5
0
0

10

15

Rspuns corect: da! Mai mult observm c atunci cnd


una scade, cealalt scade i ea. n limbaj statistic avem de
a face cu o corelaie negativ ntre cele 2 variabile.
Pn n acest stadiu am putut determina doar vizual
existena sau inexistena unei co-variaii i direcia.
Firete pentru a determina aspecte privind intensitatea
179

relaiei i linearitatea ei este nevoie de mult mai mult


dect o observaie vizual. Este nevoie de obinerea prin
calcul a coeficientului de corelaie.
Corelaia ca i metod de calcul statistic va avea
ntotdeauna ca rezultat o valoare numeric cuprins ntre
-1 i +1
Acesta poart denumirea de coeficient de corelaie i
se noteaz cu r i va avea precum aminteam mai sus
valori ce se pot nscrie/reprezenta pe axa de mai jos
-1____________ 0 ___________+1
Ca urmare n funcie de valorile nregistrate de r, n
teoria modelelor de corelare apar situaiile ideale i
anume: corelaia perfect negativ i cea perfect pozitiv,
cu distribuie perfect linear ; adic valorile ambelor
variabile se distribuie perfect linear ascendent sau
descendent (cu inclusiv situaia exccepional cnd cele
dou variabile se suprapun ca valoare). Privii figurile
7.4a, 7.4b.

180

Fig. 7.4a : Corelaia perfect negativ (r = -1)

Variabila B

16
14
12
10
8
6
4
2
0
0

10

15

20

Variabila A

Fig .7.4b: Corelaie perfect pozitiv (r = +1)

Variabila B

20
15
10
5
0
0

10

15

20

VariabilaA

Ele reprezint modelele ideale, perfecte de corelare.


Acestea sunt evident situaiile de exccepie, n realitate,
relaia dintre variabile nregistrnd intensiti, direcii i
lineariti diferite comportndu-se ca atare!
181

Aa cum aminteam anterior, exist un numr foarte


mare de metode statistice de corelare ! Cele mai cunoscute
i utilizate sunt:
1)

Coeficientul de corelaie produs-moment,

Person (Pearsons Product Moment Correlation Coefficient).


Acesta este un coeficient de corelaie parametric, adic
mai rar utilizat n tiinele sociale i deci i n turism
(prezentat n capitolul anterior, vezi capitolul 6).
2)

Coeficientul de corelaie cu rang, Spearman

(Spearmans rank Correlation Coefficient). Formula


acestuia ca variant simpl linear este:

rs = 1 -

(d )
2

n3 n

7.1.2. Coeficientul de corelaie cu rang, Spearman:


condiii de aplicare
- date (variante) pentru 2 variabile.
- acelai numr de valori pentru ambele variabile.
- minimum 4 perechi de valori.
- date ordinale sau intervale.
Calculul formulei coeficientului de corelaie presupune
12 stadii !
182

Studiu de caz
Rmania, perioada 1991 - 2000
Variabila 1: PNB (per cap loc.)
Variabila 2: Numr vizitatori strini
An

PNB(US$)

1991
1992
1993
1994
1995
1996
1997
1998
1999
2000

1243
859
1159
1323
1564
1563
1565
1872
1585
1645

Numr vizitatori
strini
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000

Dorim s vedem dac exist vreo relaie/corelaie ntre


PNB i numrul de vizitatori strini, adic dorim s
stabilim dac cele dou variabile co-variaz.
Stadiul 1

183

Se ntocmete reprezentarea grafic de distribuie a


valorilor celor 2 variabile pentru analiz vizual.
Dac distribuia nu pare s ia o form corelativ
nseamn c nu exist o corelaie i calculul nu se mai
justific. Adic : dac aparent nu putem stabili c cele 2
variabile co-variaz, c dezvolt vreo relaie atunci
calculul coeficientului de corelaie este inutil!
Pentru studiul nostru de caz distribuia valorilor se
prezint ca n figura (fig. 7.5.) de mai jos:
Fig. 7.5.

Aparent

ele

co-variez,

avnd

tendin

descendent, direcie negativ. adic pare s existe o


relaie ntre cele dou, o relaie cu tendin neativ,
descresctoare.

184

Stadiul 2
Observnd datele i distribuia acestora situaia este
aparent i neclar. n acest caz, se formuleaz o ipotez.
aceasta de regul se bazeaz pe observaia efectuat. se
numete ipotez iniial i se noteaz cu H i. n cazul de
fa o ipotez Hi , evident. ar putea fi : Exist o relaie
ntre PNB i numrul de vizitatori strini n Romnia
n perioada 1991 2000
Conform conveniei statistice n rigoare aceast
ipotez se exprim ntotdeauna negativ. Adic invers
dect pare s fie situaia. .
Aceasta ipotez se numete ipoteza nul i se noteaz
cu HO. i dac aparent exist o relaie ntre cele dou,
ipoteza nul se va exprima:

Nu exist nici un fel de

relaie ntre PNB i numrul de vizitatori strini n


Romnia n perioada 1991 2000

185

Stadiul 3
Se construiete un tabel cu 6 coloane n care se nscriu
mai nti datele exsitente, utilizndu-se primele 2 coloane
(1 i 2)
Variabila 1

Variabila 2

(PNB)

(vizitatori)

1243
859
1159
1323
1564
1563
1565
1872
1585
1645

5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000

186

Stadiul 4
Se acord rang de mrime valorilor variabilei 1 (i.e.
cea mai mare valoare =1, urmtoarea = 2 etc). nscriei
rangul fiecrei valori n coloana 3.
Stadiul 5
n mod similar acordai rang de mrime valorilor
variabilei 2. nscriei rangul fiecrei valori n coloana 4.
Tabelul va arta acum aa!
Variabila 1

Variabila 2

Rang

Rang

(PNB)

(numr

Varia-

Varia-

vizitatori)
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000

bila 1
8
10
9
7
5
6
4
1
3
2

bila 2
5
1
3
2
4
8
9
10
7
6

1243
859
1159
1323
1564
1563
1565
1872
1585
1645

187

Stadiul 6
Se calculeaz diferena dintre ranguri (rang 1 rang
2). Adic din coloana 3 se scade coloana 4. Diferena de
rang se noteaz cu d i se nscrie n coloana 5.
Variabi

Variabila 2

Rang

Rang

la 1

(numr

Varia-

Variabila

(PNB)
1243
859
1159
1323
1564
1563
1565
1872
1585

vizitatori)
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000

bila 1
8
10
9
7
5
6
4
1
3

5
1
3
2
4
8
9
10
7

2
3
9
6
5
1
-2
-5
-9
-6

1645

5,264,000

-4

Stadiul 7
Se ridic la ptrat d (diferena de rang). Aceasta se
noteaz cu d2 i se nscrie n coloana 6.
Variabila

Variabila 2

1 (PNB)

(numr

1243

188

vizitatori)
5,359,000

Rang

Rang

d2

Variabila Variabila 2
1
8

859
1159

6,401,000
5,786,000

10
9

1
3

9
6

81
36

1323
1564
1563

5,898,000
5,445,000
5,205,000

7
5
6

2
4
8

5
1
-

25
1
4

2
-

25

10

5
-

81
16
16

1565
1872

5,149,000
4,831,000

4
1

1585

5,224,000

9
-

1645

5,264,000

4
4

Stadiul 8:
Se calculeaz d2 adic suma tuturor valorilor d2.
d2 = 294

189

Stadiul 9:
Utilizai datele obinute n formula urmtoare:

rs = 1 -

(d )
2

n3 n

unde
rs = este coeficientul de corelaie)
n = numrul de perechi ale variabilelor 1i 2 (sau A
i B)
6 294
1000 10
1764
=1
990
= 1 1,78 = 0,78
=1

rs = - 0.78 (aceasta este Coeficientul de de corelaie)


Stadiul 10:
Se

analizeaz

semnificaia

coeficientului

de

corelaie. Analiza semnificaiei presupune n primul rnd


testarea semnificaiei. Testarea semnificaiei presupune
sigurana, corectidunea, ncrederea n rezultatul obinut.
Aceasta se exprim prin gradul de confiden al
coeficientului de corelaie.
190

De regul n tiinele sociale este nevoie de un grad


de confiden de cel puin 95% nainte s se accepte un
coeficient. n statistic gradul de confien este notat cu p.
El este pre calculat i se gsete n tabele consacrate. Un
grad de confiden de 95% se noteaz n aceste tabele sub
forma de p = 0.05. Gradul de confiden este menionat
ntotdeauna n interpretare i analiz i nscris
obligatoriu n forma p = 0.05
Pentru o siguran i o rigoare tiinific mai mare se
poate merge la

99% grad de confiden asupra

rezultatului. Acesta se noteaz cu

p = 0.01

Cu ct

valoarea lui p este mai mic cu att gradul de confiden


este mai mare ceea ce implic o siguran mai mare i
rigoare de calcul mai mare. Gradul de confiden cu
care se lucreaz se stabilete nc din stadiile incipiente
de calcul n funcie de natura variabilelor i numrul de
perechi de date disponibile. n general pentru studiul
proceselor, fenomene sociale cu caracter amplu, general
cnd sunt disponibile puine perechi de date i ne
raportm la perioade de timp mari, se lucreaz cu p =
0,05. Cnd se studiaz procese, fenomene de detaliu cu

191

numr mare de perechi de date,pe perioade mici de timp


se lucreaz c cu p = 0,01.
Tabelul de mai jos reprezint o variant simplificat
a unui tabel consacrat cu grade de confiden.
Pentru stabilirea semnificaiei din studiul nostru de
caz se utilizeaz coloana 1 n care se afl N = numrul de
perechi de variabile. n studiul nostru de caz am utilizat 10
perechi. Astfel urmrim pentru N = 10, valorea de
semnificaie pentru p = 0.05.
N
(numr de
perechi de
variabile)
5
6
7
8
9
10
12
14
16

95%
(p = 0.05)

99%
(p= 0.01)

1.000
0.886
0.786
0.738
0.683
0.648
0.591
0.544
0.506

1.000
0.929
0.881
0.833
0.794
0.777
0.715
0.665

Se raporteaz valoarea lui r la valorile p = 0.05 pentru


N =10.
192

Dac coeficientul de corelaie r este egal sau mai


mare dect valoarea lui p [se ignor semnul lui r (plus sau
minus)] SE RESPINGE IPOTEZA NUL.
Coeficientul de corelaie r, este 0.78, mai mare dect
valorea lui p = 0,05 ( de 95%) aceasta fiind de0.648. n
concluzie se respinge ipoteza nul (Nu exist nici un fel
de relaie ntre PNB i numrul de vizitatori strini n
Romnia n perioada 1991 2000) i se accept ipoteza
iniial, (Exist o relaie ntre PNB i numrul de vizitatori
strini n Romnia n perioada 1991 2000)
Dac s-ar fi ales ca grad de confiden

p = 0,01

situaia ar fi fost coplect diferit. S-a stabilit ca grad de


confiden p = 0,05 deoarece: variabilele se refer la
indicatori destul de ampli, la nvel de ar pe o perioad
destul de limitat de timp cu valori la nivel anual.
n concluzie se poate spune c cele dou variabile sunt
corelate cu un grad de confiden de 95%

193

Stadiul 11
Cel mai important lucru din punct de vedere al
tiinelor sociale i deci i al turismului este interpretarea
i analiza rezultatelor. Ce nseamn

valoarea lui rs i

faptul c am acceptat Hi ?
n final oricine poate calcula un coeficient de
corelaie. Important este cum este interpretat rezultatul i
ce nseamn el!
Pn aici s-a stabilit (ce-i drept, tiinific) faptul c
exist o relaie. Care este, ns natura relaiei dintre PNB i
numrul vizitatorilor strini din Romnia n perioada
1991-2000?
De ce numrul turitilor strini pare s scad n timp
ce al PNB-ului s creasc?
Ce putem spune despre contribuia turismului la
PNB-ul Romniei?

194

Stadiul 12:
Se scriu intepretrile. Aici este locul i momentul n
care se folosete coeficientul de corelaie, pentru
interpretarea rezultatelor
De regul se folosete formula:
Exist o puternic corelaie negativ ntre PNB
inumrul de vizitatori strini n Romnia n perioada
1991 2000 (rs = -0.78,

p = 0.05).

Acest fapt se

datoreaz

7.2. Testele neparametrice de semnificaie.


Semnificaia statistic .
Definiie
Semnificaia statistic reprezint una dintre cele patru
funcii de baza ale statisticii. n literatura de specialitate
aceast tema se mai gsete i sub denumirea de testarea
semnificaiei statistice sau testarea diferenei la nivel de
set de date

195

7.2.1. Introducere
Pentru a pune ntreaga tem ntr-un context clar i
logic este necesar n acest moment o trecere n revist a
teoriei funciilor statisticii.
Din punctul de vedere al tiinelor sociale (inclusiv a
turismului i ) statistica devine util prin cele 4 funcii de
baz ale sale:

funcia descriptiv

funcia deductiv

funcia semnificaiei

funcia prognozrii

n primele capitole ale cursului s-a insistant n mod


deosebit asupra teoriei datelor i operaiilor statistice
elementare sau a primelor stadiile de operare statistic. La
o privire mai atent se poate concluziona c acestea
reprezint de fapt instrumente ale funciei descriptive.
Ele nu fac altceva dect s descrie ntr-o msur mai mic
sau mai mare, mai superficial sau mai profund elemente,
componente, procese sau fenomene ale activitii sociale
sau .turistice n cazul nostru.

196

A fost prezentat anterior i o metod de determinare


i stabilrea existenei unei relaii ntre dou variabile care
nu a reprezentat altceva dect un exemplu aplicativ al
funciei deductive . Astfel de metode se mai numesc i
metode statistice deductive sau pur i simplu statistici
deductive ca urmare a faptului c pornesc de la o supoziie
(deducie) stabilit (demonstrat) ulterior i verificat
printr-un rezultat. n turism ca i n geografie, specialitii
lucreaz preponderent cu date selective (obinute prin
generare) i care nu sunt exhaustive. Adic aceste date
reprezint eantioane (sunt obinute eantionat) dintro populaie ntreag; sunt iruri finite; incomplete
deoarece totalitatea lor absoluta este imposibil a fi
obinut. Exemplu: comportamentul decizional n alegerea
destinaiei de vacan pentru o anume grup de vrst de
turiti sau grup social. A obine datele statistice pentru
ntreaga populaie , adic toi potenialii turiti fie i ai
unui ora este aproape imposibil. Se selecteaz astfel un
eantion reprezentativ asupra cruia se genereaz datele
statistice necesare iar cu datele respective se fac aprecieri,
deducii, n funcie de anumii factori sau situaii luate n
calcul, pentru a se demonstra comportamentul decizional.
197

Acest comportament poate fi corelat n evoluia sau


desfurarea sa cu anumii ali factori etc (co-variaia).
Selectarea,

eantionarea

presupune

obligatoriu

probabilitatea existenei unui anumit grad de eroare n


msurtoare i n deducia final (a se revedea toat teoria
cu gradul de confiden). Probabilitatea este conceptul
statistic care deosebete datele selective, (finite, obinute
prin eantionare) de cele exhaustive (absolute, complete,
obinute n tiinele exacte din msurtorile de laborator i
care reprezint toat populaia nu un eantion). Prin
urmare

datele

selective,

eantioanele,

includ

probabilitate de eroare n timp ce cele exhaustive NU


(acestea fiind cele folosite n metodele parametrice).
Metodele de analiz statistic precum coeficienii de
corelaie stabilesc o relaie i serie de caracteristici dar nu
dau posibilitatea aprofundrii cauzalitii sau a altor
aspecte relaionale. n concluzie funcia deductiv
presupune c: n condiii specifice, probabilitatea unei
presupuneri/ipoteze (deducii) efectuate pe baza unor
eantioane de populaie , s fie valid.
Profunzimea

analizei

statistice

este

continuare de ndeplinirea funciei semnificaiei.


198

dat

7.2.2 Semnificaia statistic


Aspectele privind semnificaia statistic a unor
mrimi, valori, variabile sau mai frecvent cea a
semnificaiei diferenei dintre dou mrimi, valori,
variabile atunci cnd se compar , presupune c cel puin
una dintre ele se obine prin eantionare. Acest ultim fapt
presupune la rndul su ideea de probabilitate de eroare.
Semnificaia statistic reprezint una dintre cele mai
puternice funcii din punct de vedere al tiinelor sociogeografice i deci i turistice. Aceasta stabilete dac
diferena sau relaia dintre dou seturi de date selective
(eantioane) este semnificativ.
Ea presupune n primul rnd comparaia ntre valori
(cel puin una) determinate la nivel de eantion, adic
acele valori care nu reproduc perfect i absolut
caracteristicile

populaiei

statistice.

Aceste

valori

presupun prin natura lor o marj de variaie adic un


interval pe care se gsesc valorile efective ale populaiei.
Undeva apare o diferen!
Pentru a fi siguri c diferena dintre valorile n
eantion reflect o diferen real de valori n populaii,
distana dintre mrimile comparate trebuie s depeasc
199

mrimea

intervalului pe care se afl , cu o anumit

probabilitate, valorile din populaie. Cu alte cuvinte o


diferen este semnificativ dac depete eroarea
maxim admis, adic ea nu poate fi pus (integral) pe
seama fluctuaiilor fireti de eantionare.
n caz contrar se va spune c diferena nu este
semnificativ (exclus a se folosi nesemnificativ). O
diferen care nu este semnificativ reflect o deosebire
despre care nu se poate spune cu o probabilitate suficient
de mare c este real, acesta nu nseamn c ea nu este
real.
7.2.3. Testele de semnificaie sau testarea diferenei
la seturi de date/eantioane
Ce presupun testele de semnificaie sau testarea unei
diferene la seturi de date/eantioane? Obiectivul final al
acestora este acela de a explica diferena aparent. nainte
de a se cuta explicaii cauzale, se dorete a se determina
ct de mare este aceast diferen ct de semnificativ este
ea.
n domeniul turismului i al studiilor privind
recreerea, n mod frecvent i de regul se folosesc date

200

relevante pentru comparaie ca de exemplu : locaii


diferite, ori asupra unor grupe umane diferite sau nainte i
dup un anume eveniment.
n astfel de situaii apare necesitatea determinrii
semnificaiei diferenelor dintre valori, mrimi, variabile;
adic

se

testa

diferenele

presupuse,

(incluse,

implementate ori induse) de seturile respective de


eantioane de date.
Exemple de eantioane de date utilizate:

Preul mediu hotelier la cazare n 2 staiuni

diferite.

Comportamentul

decizional

asupra

destinaiei de vacan a 2 grupe sociale diferite.

Grupele de vrst ale vizitatorilor unui

obiectiv din zilele cu eveniment sau fr eveniment.

Atitudini ale turitilor privind destinaia de

vacan nainte i dup vizitarea acesteia.


Practic avem date asupra a 2 locaii diferite sau
grupe umane, diferenele presupuse de acestea pot fi
evidente strict valoric numeric dar nu indic nimic despre
semnificaia diferenei dintre ele prin prisma intervalului
201

de raport la valorile probabile ale populaiilor respective


(total necunoscute n cazul de fa i total lipsite de altfel
de relevan) n limitele maxime acceptabile de eroare. Cu
alte cuvinte dorim s testm aceast diferena dintre ele i
din punct de vedere al semnificaiei statistice
(cuantificarea calitii diferenei).
Exist 3 teste de semnificaie statistic

mai bine

cunoscute:
Testul T, un test parametric
Testul U sau Mann Whitney, un test
neparametric
Testul Wilcoxen sau testul perechilor legate
de

asemenea

un

test

neparametric

sau

neparametric
7.2.4. Testul Usau Mann Whitney
Fiind un test de semnificaie statistic va presupune
automat

compararea

dou

eantioane

de

date,

probabilitatea unei erori datorate de presupusa diferen


dintre caracteristicile acestora i cele ale populaiilor
respective, diferen arbitrat de o marj de eroare
maxim, acceptat. Include n calcul mediile aritmetice
202

sau medianele seturilor de date. Varianta cea mai


cunoscut de formul pentru testul U este:

U = nanb +

na ( na + 1)
ra
2

Condiii de aplicare:
a) Date ordinale sau intervale
b) 2 seturi de date necesar a fi comparate ( nu este
necesar un numr egal de perechi de variabile)
c) Minimum 4 valori din fiecare set de variabil
d) IPOTEZE, Ho - ca punct de pornire, n replic
pentru

Hi.

Ipoteza

nul

(H0)

presupune

ntotdeauna c; nu exist nici o diferen ntre


cele 2 seturi de date. Cu alte cuvinte, diferena
dintre cele 2 seturi de date nu este semnificativ.
Obiectivul final al testului

este acela de a

respinge H0. n ideea acceptrii Hi care presupune


existena

unei

diferene

semnificative,

acceptabil n raport cu marja maxim acceptabil


de eroare.

203

Studiu de caz aplicativ pentru testul U sau


Mann-Whitney

Studiul de caz presupune testarea semnificaiei


diferenei pentru numrul de turiti romni cazai n Bile
Herculane i Drobeta Turnu Severin din 1991 pn n
2000
Dorim deci s testm dac din punct de vedere
statistic exist o diferen semnificativ la nivelul
numrului de vizitatori din cele 2 locaii n aceeai
perioad de timp.
Atenie, nu este vorba despre diferen ca operaie
aritmetic, aceasta nu are nici o semnificaie, n afara
celei pur matematice. Semnificaia statistic presupune la
un loc ideea de eantion, de perioad de timp ,de locaii
diferite ce pot implica la nivelul raportrii n populaia
statistic respectiv anumite aspecte cu caracter social.
Observai tabelul de mai jos !
Sunt ndeplinite condiiile de aplicare? Da iar
aplicarea testului poate continua chiar i condiiile
absenei unei valori la ultima valoare a variabile 2,
204

respectiv turitii romni cazai la Drobeta Turnu


Severin.
Anul

Turiti romni cazai la

Turiti romni

Drobeta Turnu Severin

cazai la
Bile
Herculane
1991
1992

72211
42968

64537
56566

1993
1994

72352
113242

39182
40989

1995
1996
1997

95085
96631
66268

46227
47271
48885

1998
1999

75441
100606

32293
31515

2000

110286

Stadiul 1:
n funcie de tipul de date pe care le deinem se
calculeaz media aritmetic sau mediana.

205

n studiul de caz de mai sus dispunem de date


intervale; se calculeaz media aritmetic pentru fiecare
dintre cele dou variabile.
Dac
Am dispune de date ordinale se va calcula, mediana
pentru fiecare coloan de date.
Rezultatele se compar. n mod evident, dac
diferena dintre medii/mediane nu este semnificativ
continuarea testului este inutil.
Astfel:
Pentru variabla A (B. Herculane): media aritmetic =
84.509
Pentru variabla B (D.T.Severin): media aritmetic =
45.274
Diferen valoric semnificativ!
Stadiul 2:
Se stabilete ipoteza nul pe baza inversrii uneia
iniiale

care

presupune

semnificative. Astfel:

206

existena

unei

diferene

Ipoteza nul este nu exist o diferen semnificativ


ntre numrul turitilor cazai la Bile Herculane i cei
cazai la D.T. Severin n perioada 1991 2000
Stadiul 3:
Se ntocmete un tabel cu 4 coloane. Variabila A se
nscrie n coloana 1 iar variabila B n coloana 3, dup cum
urmeaz:.
Variabla A
(Turiti romni

Variabla B
(Turiti romni

cazai la Bile

cazai la Drobeta

Herculane)

Turnu Severin)

72211
42968
72352
113242
95085
96631
66268
75441
100606
110286

64537
56566
39182
40989
46227
47271
48885
32293
31515

207

Stadiul 4:
Acordai ranguri de importan tuturor valorilor, n
ordine

cresctoare.

Pentru

acordarea

rangului

de

importan se iau n consideraie valorile ambelor


variabile. Cu alte cuvinte rangul NU se acorda separat pe
coloane ci la ambele mpreun. Astfel valoarea cea mai
mic va primi rangul 1, urmtoarea ca mrime va primi
rangul 2 ...amd.
Rangurile acordate pentru valorile variabilei A se
plaseaz n coloana 2. Acesta se noteaz cu ra
Rangurile acordate pentru valorile variabilei B se
plaseaz n coloana 4. Acesta se noteaz cu rb.
Variabla A
(Turiti romni cazai
la Bile Herculane)
72211

12

Variabla B
(Turiti romni cazai
la Drobeta Turnu
Severin)
64537

42968
72352

5
13

56566
39182

9
3

113242
95085

19
15

40989
46227

4
6

96631
66268
75441

16
11
14

47271
48885
32293

7
8
2

100606

17

31515

208

ra

rb

10

110286

18

n cazul n care apar valori identice se procedeaz


la calcularea mediei rangurilor acestora indiferent de
numrul lor. Vezi tabelul de mai jos (caz didactic ipotetic,
nu are nici o legtur cu studiul de caz, este folosit ca
exemplu). Valoarea 45 apare de 2 ori i ar primi rangul 3
ca mrime de importan. Rangul urmtor, 4, nu se nscrie
niciunde i se folosete la calculul mediei rangurilor. (3 +
4) : 2 = 3,5
VA
30
35
45
50
75
80

ra
1
2
3,5
5,5
11
12

VB
45
50
58
62
69
70

rb
3,5
5,5
7
8
9
10

Stadiul 5:
Se calculeaz separat suma ranguilor variabilei A,
notat cu ra.
ra =

140

209

Stadiul 6:
n mod similar se calculeaz suma rangilor variabilei
B, notat cu rb.
rb = 50
Stadiul 7:
Formula pentru testul U este:

U = nanb +

unde:

na ( na + 1)
ra
2

na este numrul de valori al variabile A,


nb este numrul de valori al variabile B

Ea se aplic fiecrei variabile n parte!


n cazul nostru, pentru variabila A:
U = (10 9 ) +

10 11
140
2

= 90 + 55 140 = 5

Stadiul 8:
Variabila B:
210

U = nanb +

nb ( nb + 1)
rb
2

U = (10 9 ) +

10 11
50
2

= 90 + 55 50 = 95

Stadiul 9:
Dintre cele dou valori U se alege prin convenie
valoarea cea mai mic. n cazul studiului de caz de mai
sus, este vorba despre Ua = 5
Stadiul 10:
Se decide nivelul gradului de confiden la care
dorim s avem rezultatul. De regul n tiinele sociale se
lucreaz cu cel puin 95% adic p = 0.05
Stadiul 11:
Se face apel la tabelele consacrate cu valori critice
ale gradului de confiden pentru testul U n vederea
stabilirii acestora la p = 0.05 (95%)

211

nb
na
1
2
3
4
5
6
7
8
9
10
11
12

0
0
0
0
1

0
1
1
2
2
3
3
4

10

11

12

0
1
2
3
4
4
5
6
7

0
1
2
3
5
6
7
8
9
11

1
2
3
5
6
8
10
11
13
14

1
3
5
6
8
10
12
14
16
18

0
2
4
6
8
10
13
15
17
19
22

0
2
4
7
10
12
15
17
20
23
26

0
3
5
8
11
14
17
20
23
26
29

0
3
6
9
13
16
19
23
26
30
33

1
4
7
11
14
18
22
26
29
33
37

Valoarea critic pentru un test cu 10 variante n


variabile unde p 005 = 20

212

Stadiul 12:
Dac valoarea de test U aleas (cea mai mic dintre
cele dou calculate) este mai mic sau egal cu valoarea
critic a gradului de confiden stabilit, p = 0,05 atrage
dup sine RESPINGEREA ipotezei nule.
n acest caz valoarea critic este 20 iar valoarea de
test U = 5.
Ipoteza nul = nu exist o diferen semnificativ
ntre numrul turitilor cazai la Bile Herculane i cei
cazai la Dr.Tr. Severin n perioada 1991 2000; se
respinge.
Se accept ipoteza iniial, conform creia exist o
diferen semnificativ ntre numrul turitilor cazai la
Bile Herculane i cei cazai la Dr.Tr. Severin n perioada
1991 2000

Stadiul 13:
Iportant!

Interpretarea rezultatului final este mai

important dect faptul c dup o serie de calcule am


respins o ipotez nul i am acceptat una iniial. n cazul
213

de fa rezultatul final este exist o diferen ntre cele


dou seturi de date.
Ce semnificaie are aceast diferen? De ce exist
aceast diferen semnificativ?
Stadiul 14
Interpretarea i analiza rezultatului includ ntotdeauna
argumente sau explicaii. Exprimarea acestora se face de
regul prin formula de debut: Exist o diferen statistic
semnificativ ntre numrul turitilor romni cazai la
Bile Herculane i cei cazai la Drobeta Turnu Severin (U
= 5, p = 0,05), fapt datorat.......spre exemplu faptului c
cele dou locaii reprezint atracii diferite n care se
practic dou tipuri diferite de turism: turimul balnear i
respectiv cel de tranzit, de conferin i week end.
n analiz i argumentare se utilizeaz informaie ct
mai exact asupra celor dou locaii.
Testul U sau Mann Whitney mai este cunoscut i sub
denumirea de test al nivelului de semnificaie.

214

7.2.5. Testul Wilcoxen sau testul perechilor legate


Acest test se aplic doar datelor intervale, fapt pentru
care este privit ca un test mai special. El se deosebete i
prin condiiile pe care le pune la nivelul datelor intervale
ce urmeaz a fi testate.
Constituie o metod statistic util n testarea
diferenelor la nivel de serii de date, deseori folosit n
tiinele sociale. Acest test este la fel de important ca cel
anterior mai ales prin faptul c testeaz semnificaia
eantionului. Pentru turism el este adesea crucial ca
importana, cu precdere n situaiile de sondaje la scar
medie i mic.
Condiii de aplicare:

Obligatoriu numai date intervale.

Cel puin 6 perechi de date.

ntre cele dou iruri de date (sau variabile) trebuie


s existe o anume (presupus, dedus) legtur,
tendin. Cu alte cuvinte s formeze un anume tip

215

de pereche, s se cupleze conform unui criteriu


comun.
ntre seriile de date sau ntre

datele aceleiai

variabile trebuie s existe, cel puin aparent, un anume gen


de relaie, legtur.
Exemple:
Ex 1: Vizitatori europeni n Romnia n anii 1999 i 2000
1999

2000

Austria

63,000

66,000

Belgia

18,000

19,000

Danemarca

9,000

10,000

n acest caz relaia este stabilit de cei 2 ani, caz n


care dac pentru o ar numrul de vizitatori a fost redus n
1999 este probabil s fie redus i n 2000.
Ex 2

Gradul de ocupare al hotelurile de pe litoralul

romnesc al Mrii Negre (%)

216

2000

2001

Ianuarie

25

20

Februarie

30

29

Martie

50

48

Dac gradul de ocupare a fost redus n ianuarie al


unui an este foarte probabil s fie redus i n alt an
relaia aparent dintre seturile de date, suficient pentru a
forma perechi.
Dac
a)

ntre date nu exist o relaie aparent prin prisma


creia ele s poat forma perechi dintr-un anumit
punct de vedere sau de un anume tip

sau
b)

Datele sunt nominale sau ordinale

217

Testul Wilcoxen NU se poate aplica i se apeleaz


n schimb la testul Mann-Whitney sau U
n aplicarea acestui test analiza teoretic a relaiei
aparente

dintre

variabile

este

foarte

imoprtant.

Semnificaia aparent a relaiei este ceea ce se cere de la la


testul U i ce fel de diferen privim acolo n antitez cu
perechea de la Wilcoxen. Astfel se poate concluziona c
felul datelor sau mai bine spus a relaiilor aparente dintre
ele, dinamismul i tendina evoluiei acesteia determin
ntr-o oarecare msur alegerea testului ce urmeaz a fi
utilizat.

Mod de calcul
Studiu de caz: serii de date privind gradul de
ocupare (%) al hotelurilor din Bile Herculane i Drobeta
Turnu Severin n perioada 1991-2000
Bile Herculane
1991
1992
1993
1994
218

36
31
38
41

Drobeta Turnu
Severin
45
30
24
38

1995
1996
1997
1998
1999
2000

43
35
29
37
41
45

32
32
54
49
44
43

Exist o relaie aparent ntre datele de aici? Evident!


Fiind vorba de 2 localitii situate n aceeai zon turistic
i gradul de ocupare al hotelurilor acestora se presupune
c gradul de ocupare la nivelul amndurora are cam
acelai comportament pentru aceeai perioad de timp.
Gradul de ocupare (n aceast situaie) pentru aceeai
categorie de unitate de cazare, este criteriul de
mperechere
Presupusa relaie de reprezint punctul de plecare n
stabilirea ipotezei nule pe baza creia se poate trece la
calculul acestui test

219

Stadiul 1:
Se formuleaz ipoteza nul (Ho) asupra seriilor de
date n concordan cu o ipotez iniial (.H i). (Ho
ntotdeauna exprim negativul/inversul ipotezei iniiale
Hi):
Ex. Nu exist o diferen semnificativ n gradul de
ocupare al hotelurilor din Bile Herculane i Drobeta
Turnu Severin n perioada 1991-2000
Stadiul 2:
Se construiete un tabel cu 6 coloane. n coloanele 1
i respectiv 2 se introduc seriile de date (denumite pentru
convenien variabile: A=Bile Herculane
B=Drobeta Turnu Severin)
B

(Turnu

(Herculane)
36
31
38
41
220

Severin)
45
30
24
38

i respectiv

43
35
29
37
41
45

32
32
54
49
44
43

Stadiul 3
Se calculeaz diferena aritmetic dintre A i B (AB). Rezultatul obinut amplaseaz n coloana 3 ignornd
semnul (+;-)
A

A-B

36

45

31
38

30
24

1
14

41
43

38
32

3
11

35
29

32
54

3
25

37
41

49
44

12
3

45

43

Stadiul 4
221

Dac n coloana (A-B) avem valori egale cu 0,


acestea se exclud din analiz (se exclud i perechile cu
totul, utilizndu-se restul perechilor). Cu meniunea c n
acest caz se reduce numrul de perechi luat n calcul!
n studiul de caz nu exist astfel de situaii, calculul
continundu-se fr alte modificri de condiii.
Stadiul 5
Se acord rang de importan valorilor din coloana
(A-B) pornindu-se de la valoarea cea mai mic creia i se
atribuie rangul 1. Valorile rangurilor se nscriu n coloana 4.
n cazul valorilor identice se procedeaz la
calcularea mediei rangurilor valorilor variabilor identice
ca valoare indiferent de numrul acestora.
A

(A B)

Rang de
(A-B)

36
31

45
30

9
1

6
1

38
41
43

24
38
32

14
3
11

9
4
7

222

35
29

32
54

3
25

4
10

37
41

49
44

12
3

8
4

45

43

Stadiul 6
Se

compar

pe

rnd

valorile

din

perechile

variabilelor A i B. Acolo unde valoarea lui A este mai


mare dect a lui B se nscrie rangul atribuit diferenei (A-B)
n coloana 5. Unde valoarea lui B este mai mare dect a lui
A rangul atribuit diferenei (A-B ) se nscrie n coloana 6.

A-B

Rang de A>B

36
31
38
41
43
35
29
37

45
30
24
38
32
32
54
49

9
1
14
3
11
3
25
12

A-B
6
1
9
4
7
4
10
8

B>A
6

1
9
4
7
4
10
8
223

41
45

44
43

3
2

4
2

4
2

Stadiul 7
Se calculeazi suma rangurilor pe fiecare coloan n
parte (A>B i B>A din coloanele 5 i 6).
A

A-B

Rank

36
31
38
41
43
35
29
37
41
45

45
30
24
38
32
32
54
49
44
43

9
1
14
3
11
3
25
12
3
2

of A-B
6
1
9
4
7
4
10
8
4
2

A>B

B>A
6

1
9
4
7
4
10
8
4
2

Suma din coloana A>B (5) = 27


SUMA DIN COLOANA B>A (6)= 28
Stadiul 8
Se selecteaz valoarea cea mai mic dintre cele 2
sume i se notez cu T

224

T = 27
Stadiul 9
Se decide cu ce grad de confiden se lucreaz (95%
sau 99%) pentru stabilirea semnificaiei rezultatului.
Se continu fcnd apel la tabelele consacrate, ale
valorilor critice pentru testul Wilcoxen. n cazul n care a
fost redus numrul de perechi n timpul calcului el se
reduce i la interpretare. Exempl daca au fosrt eliminate 2
perechi din calcul la interpretare n loc de 10 perechi se va
urmri valoarea critic pentru 8 perechi.
Nr perechi A i B
6
7
8
9
10
11
12
13
14
15
16

P=0.05
0
2
4
6
8
11
14
17
21
25
30

P=0.01
0
2
3
5
7
10
13
16
20
225

17
18
19
20

35
23
40
28
46
32
52
38
Dac valoarea obinut pentru T este mai mic dect

valoarea critic (pentru numrul corect de perechi i la


gradul de confiden ales) se respinge ipoteza nul. n
orice alt situaie aceasta se accept.
Conform studiului de caz T = 27, valoare critic = 8
(95%) sau 3 (99%):
IPOTEZA NUL SE ACCEPT! Adic nu exist o
diferen semnificativ n gradul de ocupare al hotelurilor
celor 2 locaii.

Stadiul 9
Interpretarea rezultatului obinut:
n studiul de caz de mai sus s-a demonstrat
statistic faptul c nu exist o diferen, semnificativ, n
gradul de ocupare al hotelurilor din Bile Herculane i
Drobeta Turnu Severin n perioada .... (n ciuda faptului c
aparent exista o diferen valoric).
De ce?

226

Stadiul 10
Analiza i exprimarea rezultatului final:
Dac ar fi existat o diferen semnificativ analiza ar
fi fost exprimat ncepndu-se cu formularea:
Exist o diferen (relaie) semnificativ ntre
gradul de ocupare din Bile Herculane i Drobeta
Turnu Severin; T = 2,

p = 0.01.

Aceasta se

datoreaz......
n cazul nostru nu exist o diferen semnificativ
ntre cele dou pentru T = 2, p = 0.01. Aceast realitate
se datoreaz faptului c n calcul este luat gadul de
ocupare i dei cele dou locaii sunt diferite ca destinaie
turistic, caracterizndu-se prin tipuri dierite de turism ele
se afl n aceeai zon turistic, la distan relativ mica
una de cealalt. Factorul care ns determin inexisten
diferenei semnificative este raportul numr locuri cazare
destinaie turistic.

227

7.2.6. Testarea semnificaiei diferenei la nivel de


set de date absolut independente. Testul 2

228

Aminteam anterior faptul c testarea semnificaiei


statistice presupune n primul rnd procesul de comparaie.
Testele precedente de semnificaie statistic au stabilit
semnificaia

diferenei

la

nivelul

datelor

selective

(eantioane) asemntoare sau parte din aceeai mare


categorie.

general

fost

vorba

despre

date

asemntoare. Cu alte cuvinte s-a pornit de la ideea


comparrii unor date asemntoare (unii autori le
denumesc dependente) pentru a se determina diferena de
semnificaie statistic dintre ele (n final demonstrat sau
nu prin acceptarea sau respingerea ipotezei nule).
Acelai proces de comparaie statistic (att de util n
ndeplinirea funciei de semnificaie statistic) mai
presupune

situaia

invers:

se

compar/testeaz

semnificaia statistic la nivelul datelor ne asemntoare


sau independente pentru a se determina asemnarea lor.
Cu alte cuvinte pentru a se determina n ce msur ele au
ceva n comun, i ce presupune acest lucru (n final fapt
demonstrat sau nu prin acceptarea sau respingerea ipotezei
nule). Acest proces se efectueaz prin ceea ce este
cunoscut i sub denumirea de:

229

Testul de contingen
Ce este contingena?
Contingena
Contingena msoar gradul de relaionare sau
intensitatea legturii dintre dou elemente, fenomene,
procese,n

final

dintre

variabile/seturi

de

date

selective/eantioane.
Cu alte cuvinte fiind vorba de date independente,
contingena msoar modul n care un aspect, o variabil,
un set de date influeneaz sau este influenat de un altul/a.
Astfel n limbajul de specialitate apar formulri de
genul: unele variabile sunt contingente cu altele sau dein
un contingent asupra altora.
EX:

Clasa

social

are

contingent

asupra

numrului de vacane pe care o familie i le poate


permite.

Sezonalitatea este contingen cu gradul de

ocupare al unui hotel.


Contingena ns nu este acelai lucru cu corelaia.

230

Reamintim ce exprim corelaia i aume o covariaie. Aceasta indic pur i simplu faptul c o variabil
prezint

anumit

tendin

sau

are

un

anumit

comportament iar cealalt sau cellalte prezint i ele o


anumit tendin sau are un anumit comportament.
Corelaia nu spune nimic despre cauzalitate sau cum se
determin ori se influeneaz variabilele ntre ele.
Cel

mai

cunoscut

test

pentru

investigarea/cunatificarea contingenei este testul chi2


sau testul 2
Testul 2
Condiii de utilizare:

n cazul necesitii investigrii tipului de

relaie ntre dou aspecte, fenomene, indici, indicatori


INDEPENDENI etc (adic a modului n care
ceva/cum ceva, se leag de altceva, influeneaz.

n cazul n care avem la dispoziie 2

variabile independente.

Avem la dispoziie date nominale, ordinale

sau intervale.

231

Testul 2 sau Chi2 este un test non-parametric ale


crui cteva caracteristici implic aspecte precum:

Datele exprim categorii numrabile de

elemente.

Chi2 este foarte util mai ales n analiza

statistic a datelor chestionarelor (unde sunt necesare


cel puin 100 de chestionare pentru relevana analizei)

Mod de aplicare

Chi2 pornete ntotdeauna de la ipoteza

iniial, Hi, conform creia exist o relaie ntre datele


analizate fapt pentru care ipoteza nul, Ho, va avea
ntotdeauna forma conform creia NU exist nici o
relaie ntre variabile analizate.

clasific

datele

utilizate

n:

OBSERVATE (notate cu O) reprezint datele


prezente, aflate la dispoziie; i PRESUPUSE (notate cu
P) - determinate pe baza celor observate.

Datele presupuse reprezint datele la care

se ateapt testul , sau pe care testul le prognozeaz n

232

cazul n care nu ar exista nici o legtur ntre ele sau cu


alte cuvinte n cazul n care ipoteza nul ar fi adevrat.

Comparnd datele, testul X2 stabilete n

final dac cele ntre cele dou variabile exist sau nu o


relaie i care este ea.
Elemente necesare pentru aplicarea testului X2
1)

Date pentru 2 variabile.


2)

Datele trebuie s exprime categorii de

elemente numrabile. NUMERE REALE.


3)

Indiferent de forma n care se afl datele acestea se

introduc ntr-un tabel de contingen.


4)

Datele nu pot avea form de procente

Studiu de caz
Date provenite de la Comisia Naional pentru
Statistic privind numrul vizitatorilor strini n Romnia
pentru anii 1985 i respectiv 1995, n funcie de motivaia
vizitei.

233

n acest caz se poate discuta despre o posibil


relaie existent ntre date: dinamica motivelor pentru care
strinii doresc s viziteze Romnia n perioada respectiv.
Datele sunt:
Mii turiti strini n vacan:
1985 = 2498
1995 = 2274
Mii turiti strini sosii n Romnia pentru alte
motive:
1985 = 2607
1995 = 2838
Testul 2 sau Chi2 presupune pentru aplicare12
stadii
Stadiul 1
Formularea ipotezelor iniial i respectiv nule (Hi,
Ho) pentru datele luate ca baz de studiu. Reamintim ca :
Ipoteza nul Ho exprim ntotdeauna negativul, inversul
ipotezei iniiale Hi

234

n cazulacestui studiu de caz Ho este :nu exist


nici relaie (din punct de vedere al semnificaiei statistice
aceasta este tot o diferen, diferena dintre date chemat
s arate o asemnare, aceeai dinamic a motivelor
vizitei) ntre numrul turitilor strini venii n Romnia
pentru o vacan i cei sosii pentru alte motive att n
timpul perioadei comuniste ct i dup ncheierea
acesteia.
Stadiul 2
Construirea tabelului de contingen pentru cele
dou variabile prin simpla introducere a datelor prezente i
calcularea totalurilor coloanelor i rndurilor tabelului
obinut.
1985

1995

Total

Vizite pentru vacan

2498

2274

4772

Vizite pentru alte motive


Total

2607
5105

2838
5112

5445
10217

Aceste date se numesc datele cu valori OBSERVATE


235

Stadiul 3
Se examineaz valorile observate. n cazul n care
exist valori egale cu 0 ntregul test devine invalid!
Stadiul 4
Se calculeaz valorile PRESUPUSE. (adic valorile
ATEPTATE sau presupuse de test n cazul n care nu ar
exista nici o relaie ntre cele 2 variabile)
n

calculul

valorilor

presupuse

se

pornete

ntotdeauna de la valorile observate. Pentru fiecare dat


observat se calculeaz echivalentul presupus dup cum
urmeaz :
Valoarea presupus =
(Total rnd) x (Total coloan )
Total general

236

1985

Vizite

1995

Total

O
2498

P
2384.4

O
2274

P
2387.6

4772

2607

2720.6

2838

2724.4

5445

pentru
vacan
Vizite
pentru
alte
motive
5105

Total

5112

10217

Stadiul 5
Se examineaz valorile presupuse. n cazul n care
exist valori mai mici dect 5, testul devine invalid i se
abandoneaz.
Stadiul 6
Se calculeaz X2 dup formula:
2

(O P)
=

Practic pentru fiecare valoare observat:


237

Se calculeaz diferena (O P)
Se ridic la ptrat fiecare rezultat
Acesta se mparte la valoarea presupus respectiv
Se calculeaz suma tuturor rezultatelor obinute
1985
O
P

1995
O
P

Tota

Vizite pentru

249

2384.

5.

227

2387.

5.

l
477

vacan
Vizite pentru

8
260

4
2720.

4
4.

4
283

6
2724.

4
4.

2
544

alte motive
Total

7
510

8
511

5
102

17

Valoarea total 2 = 5.4 + 4.7 + 5.4 + 4.7 = 20.2

Stadiul 7
Se calculeaz gradul de libertate (gf), revenindu-se
la stadiul 2 (tabelul de contingen), ignornd totalurile.

238

Formula gradului de libertate este:


gf = (nr) - 1 x (nc) 1
Unde : nr = numr de rnduri
nc = numr de coloane
Pentru acest studiu de caz :gf = (2-1) x (2-1) = 1
Stadiul 8
Se alege gradul de confiden.
95% (p= 0.05)
99% (p=0.01)
99.9%(p=0.001)
95% reprezint gradul minim de confiden acceptat n
tiinele sociale .

239

Stadiul 9
Se face apel la tabelul valorilor critice al gradului de
confiden pentru testul X2.
95%

99%

99.9%

(p=0.05)

(p=0.01)

(p=0.001)

libertate
1

3.84

6.64

10.83

5.99

9.21

13.82

7.82

11.34

16.27

9.49

13.28

18.46

11.07

15.09

20.52

12.59

16.81

22.46

14.07

18.48

24.32

15.51

20.09

26.12

Grad de

Stadiul 10

240

Dac valoarea

2 este mai mare dect valoarea

critic se respinge ipoteza nul.


Dac valoarea

2 este mai mic dect valoarea

critic se accept ipoteza nul


n acest studiul de caz - 2 = 20.2 pentru o valoare
critic de 3,84 , l grad de libertate 1, cu grad de confiden
95%, fapt ce atrage dup sine respingere ipotezei nule cu
grad de confiden 95%
Stadiul 11
Interpretarea rezultatului
ntotdeauna se face apel la tabelul cu valorile
observate i presupuse dar i la toate toate informaiile
colaterale venite de acolo.
Ex: n 1985 numrul vizitatorilor strini pentru alte
motive, a fost mai mare dect al celor (O=2607 , P =
2720.6) dar mai mic dect al celor sosii n vacan
n 1995 numrul vizitatorilor strini sosii pentru o
vacan a fost mai mare dect al celor (O=2274 , P =
2387.6) i mai mic dect al celor sosii pentru alte motive

241

Concluzia: odat cu cderea comunismului un numr


mai mare de vizitatori strini au sosit n Romnia pentru
vacan dect pentru alte motive.
Stadiul 12
Se argumenteaz concluzia anterioar utilizndu-se
ca baz de pornire expresii precum: Exist o relaie
semnificativ ntre motivaia vizitrii Romniei i anul n
care are loc vizita (2 = 20.2, p=0.001) deoarece...
Se poate observa c acest test este primul test cu o
dimensiune de prognozare. Este o form incipient i
insuficient pentru ndeplinirea funciei statistice de
prognoz. Aceast funcie se ndeplinete odat cu trecerea
la tehnici de regresie i analiz factorial.

242

BIBLIOGRAFIE

Clegg, F. (1985) Simple Statistics; A course book for


social sciences, Cambridge University Press,
Cambridge
Dickinson G.C. (1963) Statistical Mapping and the
Presentaton of Statistics, Edward Arnold Publishers,
London
Dumitrache, L. (2004) Starea de sntate a populaiei
Romniei. O abordare geografic, Editura Univers
Enciclopedic, Bucureti.
Ebdon, D (1977) Statistics in Geography. A practical
approach, Blackwell, Oxford
Gregory, S (1973) Statistical Methods and the
Geographer, Longman, London
Isaic-Maniu, A (2003) Statistic, Editura Universitar,
Bucureti
Kranzler, G.; Moursund, J Cliffs, (1995) Statistics for
theTerrified, Prentice Hall. Englewood, New Jersey
Mathew, H.; Foster, I. (1992) Geographical Data;
Sources, presentation and analysis, Oxford
University Press, Oxford
Nocak, A. (2004) Statististica i sondajul de opinie,
Editura Universitar, Bucureti
Rateau, P. (2004) Metodele i statisticile experimentale n
tiinele umane, Polirom, Burureti
Rogerson, P. (2003) Statistical Methods for Geography,
Sage Publication, London
243

Rotaru, T i colab. (1999) Metode statistice aplicate n


tiinele sociale, Polirom, Bucureti
Sauvain, P. (1974) Advances Techniques and Statistics,
Hulton
arc, M. (1998), Tratat de statistic aplicat, Editura
Didactic i Pedagogic, Bucureti
Vaus de, D. (2004) Analyzing Social Science Data, Sage
Publications, London

244

245

246

247

248

249

250

251

252

253

254

255

CUPRINS

Capitolul 1........................................................................5
Cuantificarea ca metod de studiu, cercetare
i cunoatere a realitii socio geografice........................5
1.1. Introducere........................................................5
1.2. Funciile statistice...........................................14
1.3. Noiuni statistice fundamentale cu
semnificaie n geografia uman......................22
Capitolul 2......................................................................45
Procesul de grupare a informaiei geografice
de ordin statistic..............................................................45
2.1. Gruparea informaiei geografice
statistice concept teoretic..............................46
2.2. Tipurile de grupri ale informaiei
geografice statisice...........................................50
2.3. Intervalele utilizate n grupare........................56
Capitolul 3......................................................................63
Informaia geografic de ordin statistic
prezentare i reprezentare grafic..................................63

256

3.1. Seriile de repartiie - terminologie,


importan i tipologie.......................................63
3.2. Seriile de repartiie unidimesionale.................65
3.3. Seriile de repartiie multidimensionale...........82
3.3.1. Seriile de repartiie bidimensionale.........82
3.3.2. Reprezentarea grafic a seriilor
de repartiie bidimensionale.........................83
3.3.3. Repartiii tridimensional..........................87
3.4. Seriile dinamice...............................................88
3.5. Seriile de spaiu...............................................96
3.5.1 Reprezentarea grafic a seriilor
de spaiu........................................................97
Capitolul 4....................................................................103
Analiza relaiilor dintre procesele
i fenomenele sociale ...................................................103
4.1. Introducere....................................................103
4.2. Metode de analiz ........................................111
4.2.1. Metoda seriilor statistice
interdependente...........................................111
4.2.2. Metoda gruprilor..................................113
4.2.3. Metoda grafic.......................................114
Capitolul 5....................................................................115
Rezumatul i descrierea indicatorilor caracteristicilor
statistice utilizate n geografia uman.........................115
5.1.Indicatorii de poziie......................................116
5.1.1. Modul....................................................117
5.1.2. Mediana.................................................119
5.1.3. Media (aritmetic).................................124
257

5.2. Indicatorii de dispersie..................................127


5.2.1 Amplitudinea..........................................129
5.2.2. Abaterea standard..................................131
5.2.3. Coeficientul de variaie.........................133
5.3. Indicatori ai formei distribuiei.....................135
Capitolul 6....................................................................145
Statistica inferenial introducere.............................145
6.1. Introducerea termenilor de populaie
i eantion......................................................145
6.2. Legea normal...............................................151
6.2.1. Legea normal centrat i redus..........154
6.2.2. Principiul testelor statistice...................166
6.3. Teste parametrice i teste neparametrice......169
Capitolul 7....................................................................171
Testele n analiza statistic aplicat.............................171
7.1. Corelaia .......................................................172
7.1.1. Introducere...........................................172
7.1.2. 7.1.2. Coeficientul de corelaie
cu rang, Spearman......................................179
7.2. Testele neparametrice de semnificaie.
Semnificaia statistic....................................192 .
7.2.1. Introducere............................................193
7.2.2 Semnificaia statistic.............................196
7.2.3. Testele de semnificaie sau testarea
diferenei la seturi de date/eantioane.........197
7.2.4. Testul Usau Mann Whitney ...............199

258

7.2.5. Testul Wilcoxen sau testul perechilor


legate.........................................................212
7.2.6. Testarea semnificaiei diferenei
la nivel de set de date absolut
independente. Testul 2.............................226
Bibliografie...................................................................240

259