Documente Academic
Documente Profesional
Documente Cultură
s t a t is t ic a
I n st iin ie l e s o c i a l e
Probleme teoretice §i aplicafii
pentru invafamintul universitar
%f ■
B U C U RE $ T I
- 1992 -
STRUCTURA GENERALA A LUCRARII
Cum este conceput votumul §i cum poate fiutilizat
1.RELATV INTRE DOUA VARIABILE regresie simplS
CANT1TATIVE corclape
covariape
2. REGRESIE MULTIPlA -regresie parpalS nestandardizatS
• regresie parpalS standardizatS
• coefficient^ dc elasticitate
• determinate parjialS §i multiple
• corelape multiplS
• folosirea variabilelor fictive
LT 0,99 473,18* 2
LD 0,91 42,17* 2
LS 0,26 1,42 2
TD 0,77 13,81* 1
TS 0,09 0,40 1
DS 0,34 2,13 1
5.1. OBIECTIVE
119
U |W v V ,1 Q M C v Ij
Primul este principiul economiei (sau „parcimoniei“) iar cel de-al doilea al
validitdfii. Arta clasific2rii constd in identificarea liniei de echilibru dintre aceste dou&
principii, adesea contradictorii.
Solupa de principiu in realizarea unui astfel de echilibru este selectarea §i aplicarea
acelei metode de clasificare capabile s& genereze clase cit mai naturale in raport cu
structure datelor la care se aplici. Mai mult decit hi oricare alt domeniu al statisticii,
in taxonomia (clasificarea) numerical, la diversitatea obiectului de analizd s-a r&spuns
cu diversitatea metodelor.
Inainte de a intre in „anatomia“ clasificdrilor, s& explicitSm cele douS principii
de baz3 ale clasificdrii.
O clasificare economics presupune nu numai un numSr redus de clase, ci §i
absenja sau reducerea la minimum a cazurilor de unit&p cu apartenentS multiple. (la
grupe entente). Suprapunerea ciaseior pnn unu din membrii lor creeazS obstacole
in calea reducerii diversitSpi urm&rite prin clasificare. Similar, din punct de vedere
prectic, unitSple cu apartenen# la mai multe grupe constituie cazuri marginale care
necesitS o tratare specifica. Acestea sint motive pentru care cerinja de eviu e a
suprapunerilor in clasificari poate fi subsumata principiului general al economic sau
reducerii maxime a diversMpi. Aceasta exigeh# de maximizare a diferenjelor
intergrupale fa# de cele intragrupale se subsumeazS principiului general al
economicitiipi clasifidsrii.
Acela§i principiu este urmarit ?i prin cerinfa de completitudine a clasificarii:
toate elementele mulpmii care sint supuse partipei trebuie sa fie circumscrise
unei clase.
Deci, in sens strict, o clasificare este cu atit mai economica, sau eficienta, cu cit
are un numar mai redus de clase §i cu cit sint respectate in mai mare m&suiS cerin)ele
de completitudine, nesuprapunere a ciaseior §i maximizare a varian(ei intre clase fa#
de cea din interiorul ciaseior.
Daca nu restringem clasificarea la simpla repartipe a unor unitap in anumite
clase, ci includem in sfera ei §i intregul proces de construire §i identificare a ciaseior,
atunci poate fi relevata §i o alta faJetS a principiului economicitapi. §i anume, econo-
micitatea indicatorilor folosip pentru recunoa§terea ciaseior. Cu cit este mai redus
numarul de indicatori in funcpe de care pot fi identificate elementele gruparilor rezultate
din clasificare, cu atit este mai adecvat atributul de economicitate pentru aceasta.
Vechea cerin# aristotelica de a uni in minte ceea ce este unit in realitate §i de
a separa ceea ce este separat ?i in aceasta din urmS este valabilS nu numai pentru
raponament ci $i pentru clasificare. Caracterul natural al clasificSrilor este asocial
tocmai cu respectarea acestei exigence. Asupra procedeelor de validare vom reveni.
DeocamdatS menponSm numai c& acestea pot fi de tip extern sdu intern, in primul tip
de validare se comparS clasificarea obpnutS in funcpe de un set de criterii cu
clasificare ale acelora§i unitdp, in funcpe de alte criterii. Validarea intemd se face,
in esenjd, prin compararea informapei de intrare cu cea de iejire din procesul de
clasificare.
In $tiin(ele sociale mai ales, clasificdrile empirice au funcpq predominant
exploredvd. Nu lipsesc, desigur, nici cele orientate spre confirmarea teoriilor. In acest
spapu, al confirmdrii teoriilor, lucreazd insd mult mai putemic modele de tipul
regresiei, analizei de covarian{d etc.
121
3. alncarea unitatilor la clase; to exemplul
4. validarea clasificarii: criterii prin
5. Hfttp.rminarea profilului specific al ciaseior. Punctul
Introducerea nopunilor §i procedeelor de baza asociate cu aceste operapi o vom nele demogi
realiza prin prezentarea to continuare a trei variante de analiza cluster cu legSturi grare). In fun
mcdii. cu legaturi complete §i cu o singurS legSturl ~ NAT
Analizele cluster stot metode de clasificare empirics multidimensional . M
Specified lor se definite prin opozipe cu cel at ciasmcaruor strict teoretice 51/sau INF
unidimensionale. In clasificSrile teoretice, accentul cade pe construcpa spapului de DIV
atribute. Repartipa obiectelor de clasificat to clasele acestui spapu, nu este obligatorie. NUP
In schimb, to analizele cluster, co n stru ct spapului de atribute §i distribupa obiectelor IM
to clasele sale sint asociate nemijlocit. In sfera largS a clasificSrilor empirice, analizele EM
cluster se disting prin caracterul lpr multidimensional. !n abordfirile unidimensionale MN
cantitative, grupSrile se fac to funcpe de niveiul variabilei - criteriu de clasificare. in
cele multidimensionale, esentialS este analiza to functie de „profilul‘* fiecSrei unitap, Pentru
dat de valorile pe care aceasta le ia simultan pe indicatorii de clasificare. Boto§ani. 0
Din punct de vedere istoric, metodele de clasificare de tip cluster au apSrut to data de vale
psihologie (Zubin, 1938, Tryon, 1931) §i antropologie (Driver §i Kroeber, 1932). Un
cimp privilegial al dezvoltSrii lor il va constitui biologia (Sorensen, 1948, Sneath,
1957, Sokal §i Sneath, 1963) unde apare sub numele de taxonomie sau clasificare
numeric^. Proliferarea metodelor de tip cluster in diferite arii de cercetare este
indisolubil legata de extindeiea calculului automatizat Trecerea de la clasifictoile teoretice
strict speculative, sau de la cele empirice foarte s&race, la clasifictoi multicriteriale
cu grad ridicat de standardizare s-a produs sub influenta nemijlocita a calculatoarelor
electronice (pentru o prezentare de ansamblu a analizei cluster, vezi K. Bailey, 1975).
122
1
In e^emplul nostru) se in(elege pozipa pe care acesta o ocupd simultan pe un sen de
criterii prin care se specified punctul de vedere de referinid.
Punctul de vedere sau domeniul de referinpl in clasificarea noastrd sint fenome-
ii o void nele demografice (natalitate, mortalitate, nuppalitate, divorpalitate, emjgrare ;i imi-
legdturi grare). In funcpe de datele disponibile vom folosi urmdtorii indicatori ai acestor fenomene:
NAT - rata natalitdtii (ndscup vii la 1000 locuitori);
nsionald. M -ra ta mnmlitdtii generale(decesela 1000 locuitori);
ce ;i/sau INF -ra ta mortalitflfii infantile (decese copii sub un an la 1000 ndscup vii);
(iului de DIV - rata divorfialitdtii (divorpiri la 1000 locuitori);
ligatorie. NUP - rata nuptialitdtii (cdsdtorii la 1000 locuitori);
biectelor IM - rata imigrdrii (sosiri in localitate la 1000 locuitori);
analizele EM - rataemigr&rii (plecdrii din localitate la 1000 locuitori);
msionale MN - rata migratiei nete (diferenja dintre sosiri ;i plecdri la 1000 locuitori).
ficare. in
Pentru inceput sd considerdm numai patru ora^: Arad, Urgu Mure;, Bacdu ;i
;i unitap.
Boto^mi. O primd aproximare a profilurilor demografice care le caracterizeazd este
data de valorile ratelor corespunzdtoare celor 8 indicatori ale;i:
apdrut in
932). Un Arad TJrgu Mure? BacJu Botofani
, Sneath,
lasificare NAT 11,55 14,00 19,22 24,30
M 11,71 8,32^ 5,45 5,36
stare este
INF 24,71 19,84 17,73 24,31
;teoretice DIV 3,44 2,84 2,71 2,27
criteriale NUP 9,89 8,89 8,04 6,48
atoarelor IM 8,47 8,99 20,98 32,25
y, 1975). EM 4,67 3,93 3,87 4,41
MN 3,80 5,06 17,11 27,83
123
trei ora§e se siiueazd la distanjele 24,30-19,22=5,08 pentru Bacdu, 10,03 pentru Tirgu
Mure§ §i 12,75 pentru Arad. Apropierea sau similitudinea maxima se inregsitreazd,
deci, intre Bacdu §i Botojani In schimb, similitudinea minima sau distanpi maxima este
inregistrata in raportul Arad-Boto§ani.
Cit de mari sint distance sau similitudinile globale, in funcpe de top indicatorii
intre cele patru ora§e.
Solupa cea mai simpia ar fi sd calcuiam suma distantelor pentru fiecare pereche
de ora$e, adunind valorile absolute ale diferenfelnr Tnregistrate nentni fiecar^ inHiratnr
Astfel distanpt dintre Arad §i Boto§ani ar fi egaia cu:
d = 124,30-11,551 + 15,36-11,711 + 124,31-24,711 + 12,27-3,441 + 16,48-9,891 +
+ 132,25 -8,471 + 14,41-4,671 + 127,83-3,801 = 12,75 + 6,35 + 0,4 + 1,17 + 3,41 +
23,78 + 0,26 + 24,03 =72,15
Folosind acelea§i procedee s-ar obpne urmatoarea matrice a distantelor dintre
cele patru ora§e:
Arad Tirgu Mure? BacSu Botosani
Arad - (R 8 5 ? 50,11 Cj 2 ,l§ >
Tg. Mure? 35,28 6722
Bacdu — 36,28
Distanta maxima ar fi, conform acestei proceduri de calcul, intre Arad $i Boto§ani
iar cea minima intre Arad §i Tg. Mure?.
Exista ins3 cel pupn doud motive sd nunem sub semnnl intrehdrii acest mod de
ralrnlarp. a distantelor. in primul rind, daca indicatorii ar ft exprimap in nnitdti de
mdsurd diferite, atunci adunarea diferen{elor respective ar ft fost fdrd sens. In al doilea
rind, cmar dacd itemii de clasificare ar fi exprimap in acelea§i unitap de mdsurd
(precum in cazul de fajd), atunci tot ar mai rdmine problema variapei lor diferite. Cu
cit un item are o variape mai mare (mdsuratd in abateri standard), cu atit el poate
infiuen(a mai mult pozipa diferitelor unitap in spapul de atribute folosit ca referinja
pentru clasificare.
Sd urmdrim valorile medii, abaterile standard si coeficientii de variatie (egali cu
raportul dintre abaterea standard §i medie inmulpt cu 100 ) pentru intreaga serie de 21
oraje. coeficient de
media abaterea standard variape %
NAT 15,36 3,03 19,7
M 7,88 1,60 20.3
INF 19,51 4,67 24,0
DIV 2,59 0,65 25.3
NUP 8,81 1,03 1L7
IM 13,78 6,35
EM 4,67 1,94
MN 9,18 6,21 rw
124 O '
C.v » —— • AOO
, Imigrarea (IM) ?i migrapa netS (MN) au cea mai putemicS variape. in baza
acestui fapt, conform principiului menponai, este de agteptat ca importanta lor in
clasificarea oraselor sS fie mult mai mare decit a celortalp mdicatori. Chiar din exempluT
de calcul referitor la distanpi dintre Arad $i Boto$ani este evident cS ceidoi indicatori
cu variape maxima au cea mai mare contribupe la suma totals a diferenjelor care
indicS distan(a demograficS dintre ora§ele respective.
Pentru a inlStura efectul unitSplor de mSsurS diferite §i al amplitudinilor diferite
de variape a indicatorilor, ace$tia se normalizeazS inainte de calcularea distantelor.
Prin normalizarea cu scorul Z, fiecare variabilS se transtorma astf&l iflCll SS SlbS'maHS'
zcto §i abaterea standard 1 (vezi 1.2.14). Pentru o citire §i mai intuitivS a datelor
adoptSm transformarea Hull a fiecSrei variabile:
x. - x
H * 50 + 14 — — 5.3.1
in cele douS variante de calcul ierarhia se menpne aceea$i. DiferS insS conside-
rabil intervalul dintre indici. Astfel, in prima variants de calcul distan(a Tg. Mure$-BacSu
apare ca fund de 2,4 ori mai mare decit cea dintre Tg. Mure$-Arad. Acela§i raport,
in cea de-a doua variants de calcul este de numai 1,4. ‘
125
,100
Tabelul 5 3 .1 .
Indicatori! pentru clasificarea ora^elor marl (cu pasta 100 000 da locuitori) din
90-
punctul da vedara al fenomenelor demografica. Valorl normalizata cu scorul
Hull*). Date 1985
60
INDICATORI 10
26
0
Fig. 53.1 Exemplu de profile paralele (cu forme identice) dar cu nivele diferite.
Din reprezentarea lor grafted (fig. 5.3.1) se observd clar cd acestea sunt paralele
dar situate la nivele diferite. Paralelismul respectiv este o caracteristicS a formei
Diofilelor. Notdm cu raneuri de la 1 (minimum! la 7 (maximum! valorile coresDunzdtoare
lor sint identice. Paralelismul este o formd extrema a „convergen(ei“ formei unor
perechi de profile.
Nivelul unui profit este dat de media scomrilor sale. Astfel, nivelul profilului A
este'egal cu (50 + 70 + 60 + 75 + 90 + 55 + 65) / 7 = 66,4. Comparativ, cel
de-al doilea profit, B, are un nivel mediu mult mai mic, de 21,4.
Variatia. profilului poate fi estimate prin coeficientul de variape, abaterea stan
dard, dispersia sau, cel mai simplu, prin radicalul din suma pStratelor abaterilor pe care
le au valorile de nrofjl fap< df» n iv p .ln l W p ttin a rW p g p n n T g tn r a rp c ro i u ltim o v a ria n t*
de calcul, variatia profilului A este egald cu:
127
Din accasti „disecare“ a profilelor rezulte ci, la un nivel mai analitic, gruparea
difcritelor entitep trebuie se precizeze clar, in funcpe de ce anume se reaiizeazS:
asemaniri de forme, de nivel, de imprS^tiere sau de combinajii ale acestora.
Revenind din lumea exemplelor ideale in cea a realitepi, ilustrem in graful din
figura 5.3.2. raportul dintre douS profile demogTafice convergente, cele ale ora$elor
Brajov §i Timijoara. Evident, forma profilelor tinde se fie aceea$i dar atit nivelurile
cit ji variapile lor sint considerabil diferenpate. In condipile unui relativ izomorfism,
niveiul pentru Timisoara (61,59) este mai mare decit pentru Brafov (45,6). Similar,
primul profit este mai ,jucat“ sau mai imprHstiat decit cel de-al doilea. Coeficienpi
de variape sint pentru profilul Timisoara 27% iar pentru Brasov 19%.
128
O altS mdsurd frecvent utilizatd este distanta calculate ca radical din
suma pdtratelor diferen(clor, pe fiecare indicator pentru cazurile comparate:
, 5-3.3-
Raportul dintre profilurileunitdplor comparate p<5ate fi estimat nu numai in
termeni de distant ci §i de asemdnare sau similaritate. O mdsurd frecvent folositd in
acest sens este coeficientul de corelatie Bravais-Pearson. Senile de date puse in cprelape
sint cele corespunzdtoare profilelor comparate. Dacd la datele din tabelul 5i3.1.
corespunzdtoare ora§elor Arad §i Tg. Mure§ aplicdm formula cunoscutd a coeficientului
de corela(ie (Vezi capitolul 1 .2 .6 .), rezultd cd similaritatea demograficd dintre acestea
este de nivelu(r = 0,91^eam intind cd intervalul de variape al acestui coeficient este
intre -1 gi + l ^SBTspune cd similaritatea este cu atit mai accentuatd cu cit valoarea
coeficientului este mai apropiatd de j . Valorile anropiate de -1 indicd un raport de
opozitie (divergentd) sau de distantd maximd intre profilele comparate. Pentru doud
profile identice (intre care distanta este 0) r va avea valoarea 1. In schimbTdacd linnle
de profil variazd exact in sens invers gi cu aceeagi amplitudine, r va avea valoarea -L ,
Cum poate fi interpretat nivelul 0 al coreiatiei dintre protne'i In cazurile de acest tip,
vom spune cd profilele comparate au asemdndri ji deosebiri egale sub aspectul
frecventei si intensitdtii. Sau. orintr-o analoeie cu interoretarea reiauiior difltfe Vdfia-
bile, se poate Spune cd in astfel de cazuri profilele comparate au o variatie indepen-
dentd a semnifirapilnr
Mdsuri diferite ale proximitdtii (distanfd sau similaritate) au capacitdti diferite de
reflectare a raporturilor dintre anumite componente ale profilelor.
Coeficientii de corelatie mdsoard raportul dintre forma profilelor. Ei nu spun
nimic insd in legdturd cu raportul dintre nivelunle §i xmpra§uenle pfOfltSlor comparate.
in schimb, mdsuri ale distantei, precum distanta euclidiand sau cea modulard iau
in consideratie toate cele trei asoecte ale unui profil - nivel, formd si imprdstiere.
O pozipe mtermediard intre coeficienpi de corelatie $i mdsurile distantei o ocupd
coeficientii de congruentd.
Un astfel de coeficient estimeazd raportul dintre doud profile in funcpe de forma
si nivelurile lor, egalizind imprdstierile.
Calcularea coeficientului de congrientd (rc) se face cu o formuld derivatd din cea
a coreiatiei:
rc = JL*Z 5.3.4.
V Ex2 • Ey2
unde x §i y sint valorile profilelor comparate. (Se observd cd din valorile varia
bilelor puse in relate nu se mai scade media, ca in cazul coeficienplor de corelape).
De§i foarte promitdtoare, §i aceastd formuld i§i are deficientele ei considerabile. Mdsurile
de similaritate pe care le genereazd suit foarte mult afectate de tipul de normalizare
129
CU)i
a variabilelor care ii precede aplicarea. in plus, dac& variabilele sint aormalizate pe fat
o scaia pozitiva (de tipul Scalei Hull), vatorile^oeficienplor de congruent, cu variape
hire 0 §i 1 tind s5 se aglomereze spre limita maxima a intervalului de variape. Din obit
acest motiv, raporturile de similitudm&dintre perechile de unitap comparate se diferenpaza atm
foarte pupn intre ele. can
Cele trei tipuri de m&suri mentionate pentru proximitate - distanta, corelape ?i indi
congruenja - nu sint numai orientate diferenpat, in raport cu componentele protilunlor con
pe care le estimeazl Fiecare dintre ele are §i avantaje §i dezavantaje specifice. MenponSm nest
in continuare citeva dintre acestca:
fC oeficientul de corelape^una dintre mSsurile cele mai utilizate in' analiza cluster, poz
este influenpit de modul in care sint scalate - direct sau invers - variabilele de profil. neg
O seal are este directs atunci cind valoarea de scald create proportional cu cregterea nifu
atributului mdsurat. Invers, scalarea este indirecta dacd valoarea de scald variazS irivers
proporponal cu intensitatea variabilei masurate. Schimbind modul de scalare al unei dist
variabile intf-o matrice de date de M unitap x P variabile, se modifica §i raporturile resj
de similaritate dintre cele M unitap daca masurarea se face cu ajutorul coeficienplor fort
de corelape. mas
0 modalitate (propusd de Cohen, 1969, apud M. Lon, 1983:35-36) pentru depdjirea aspi
acestei deficient lucreazd cu afa-ziselegzoruri ieflectatejScorurile reflectate ale unei dad
variabile sint calculate dupd formula - 2 m - x_~ r unde m - punct neutru al efet
scalei originate. Respectivul punct poate fi media seriei originare, sau un punct neutru dist
sub aspect psihologic (exemplu - valoarea 4 pe o scald de opinie de la 1 la 7). Prin lor,
acest procedeu, se realizeazd o dublare a variabilelor originare cu variabile reflectate. de i
Profilul fiecdrei unitdfi este determinat in funcfie de valorile de scald originare fi in i
reflectate.
Principala criticd adusd coeficienfilor de corelafie in analiza cluster se referd la
dif£
faptul cd acefiia sint calculafi pe baza unor medii ce rezultd din insumarea scorurilor mai
corespunzdtoare unei unitdfi pe variabilefoarte diferite ca naturd. Critica adusd corelafiei,
din acest punct de vedere, este, de fapt, o criticd la adresa mediilor calculate pentru pro!
fiecare profil. Desigur, normalizdrile (cu scorul Z, Hull sau de alt tip) atenueazd astfel
de deficienfe dar nu le inldturd definitiv.
fun
0 altd problemd pe care o pune coeficientul de corelafie este legatd de faptul cd
de
valoarea sa maximd, 1, poate semnifica o simold relatie de crestere monotond a valorilor
unui profil in raport cu cele ale altui profil.
ogo
Prezenfa unui punct neutru (valoarea zero) pe scala coeficienfilor de corelafie
in s
pune probleme de interpretare. Cu cit valoarea unui astfel de coeficient este mai
pup
aproape de zero pentru dotid profile, cu atit este mai mare incertitudinea asupra
rqportului de similitudine dintre acestea. Prin opozifie, apropierea de 1 sau -1 poate
ei (
fi consideratd ca sporire a gradului de certitudine asupra raportului dintre formele
mas
profilelor comparate. Cum in realitate existd frecvent situafii de incertitudine, clase
130
cu\granife difute, este normal, cred, sd operdm }i in planul cunoasterii cu mdsuri care
fac distinc{ie dintre clar-neclar, cert-incert, orientat-neorientat.
Dacd acceptdm cd indicatorii folosifi pentru definirea profilurilor unui set de ■
obiecte sint un esantion din totalul indicatorilor posibili pentru domeniul de referinid,
atunci se poate lucrq si cu no{iunea de prag de semnificape in interpretarea coeficienfilor
care estimeazd similaritatea dintre profilele a doud obiecte definite in funcjie de p
indicatori. Pe aceastd bazd poate f i ales pragul de semnficafie al coeficientului de
corelaiie ca linie de demarcate intre similitudinile semnificative (c u r t raitjJ si cele
nesemnificative (cu r < rjiUJ.
DacS pentru raportul dintre doufl profiluri se inregistreaza un coeficient de corelape
pozitiv, vom spune cd formele tor tind sS fie convergente. Dac&valoarea respectiva este
riegativl atunci re vom cnnsioera diveryente. Convergent sau divergent este sem-
nificativa to mflsura in cnrefatia ohservata depSseste pragul ei critic.
Masurile distan(ei ordoneazS raporturile de proximitate de la identitate, in cazul
distanfei zero, la different foarte mare pentru valori corespunzatoare ale indicelui
respectiv. Nu mai apar in acest caz distincpile dintre convergen|a~divergenia a
formelor, certitudine-incertitudine in raporturile dintre profile. La prima vedere,
masurile distan{ei sint mai bogate pentru ca includ informapi despre toate cele trei
aspects ale {»ofilului - nivel, forma §i imprS§tiere. Acesta poate fi in k $i un dezavantaj
daca avem in vedere faptul ca indicii de distanta cumuleaza indistinct toate cele trei
efecte. Nu se mai §tie, in finalul unei clasificdri realizatd pomind de la mdsuri ale
distan(elor ce anume a dus la gruparea obiectelor in aceea§i clasd - forma profilului
lor, niveiul profilelor sau impr&§tierea acestora. Efectele de compensate intre apropieri
de nivel §i diferenperi die forma a profilelor, spre exemplu, pot crea serioase probleme,
in interpretarea gruparilor realizate prin clasificare.
Distanta euclidiana fata de cea modulard (Manhattan) accentueazd importanpt _
diferentelorman intreroofile. Altfel spus, in prima variantd demasurare se pondereaza 10-
mai mult distan(ele mari decit cele mici.
Alegerea celei mai bune mdsuri in analizele clustre este departe de a fi o
problems elucidatd.
In principiu, se poate spune cd o astfel de alegere trebuie s3 fie fdcutS in
funcpe de scopurile sau ipotezele de cercetare pe de o parte $i de natura datelor pe
de altd parte.
Dacd se urmaregte gruparea obiectelor in functie de forma profilelor atunci este
oportuna folosirea coeficientilor de corelape. De asemenea, ace§tia sint indicap
in special in condipile in care mediile corespunzatoare seriilor de profile sint relativ
pupn diferenpate intre ele.
Dacd itemii pe baza cdrora se determind profilele sint relativ slab corelap intre
ei (sau corelap top in sens pozitiv) se recomandd, de asemenea, apelul la corelapi ca
mdsuri de similitudini (M. Lon, 1983 : 42).
131
Pentru realizarea clasificdrii In funcpe de forma si nivelul profilelor, coeficientii
de congruen(d shit cea mai indicatd mdsurd de similaritate.
Corelafiile sint de preferat distanfelor ca mdsurd a proximitdfii $i in situafiile in
care pentru apartenenta unui obiect la o anumitd clasd, mai importante sintraporturile
de mdrime dintre caracterisdcile obiectelor de clasificat decit nivelul respectivelor
caracteristici.
„S p re exemplu, dacd se grupeazd oase de animate, pot interesa nu
difeienfele reale ale mdrimii oaselorcit relapile intre dimensiunile lor,
$tiut fund cd chiar animate ale aceleiagi specii diferd ca mdrime".
(M NoruSis, 1985 : 179).
• - Dintre cele trei caracteristici ale unui profil, Jbrma este cea mai calitativd, fiind
practic ireductibild la o mdsurd de tip indice. Din acest motiv se poate adopts o clasificare
in trepte, favorizind diferenfele de profil. Astfel, intro primd etapd se realizeazd grupdrik
in funcpe de similaritatea profilelor. In secven|a urmdtoare se determind subgrupdri in
cadrul aceleia$i clase In funcpe de nivelul §i/sau imprd$tierea profilelor. (Solu(ii de
acest tip au fost propuse de Guertin, 1966 $i Skinner, 1978 - vezi M. Lorr, 1983; 43).
Nici aceastd clasificare „in trepte" nu este scudtd insd de deficienie. Siht cazuri
in care diferenjele de nivel au o semnifica(ie majord. Or, dacd doud unitd{i au
profiluri de forme asemdndtoare dar niveluri diferite, ele vor apdrea in cadrul aceleia$i
grupdri. Faptul cd ulterior pot fi departajate in subgrupe diferite nu este o solute
mulpimitoare. Problema generdrii unor grupdri artificiale pomind de la indici de
similitudine de tip corelatie se pune in special atunci cind se lucreazd cu profiluri
„scurte" formate dintr-un numdr redus de indicatori (sub 10-15). In astfel de cazuri,
corelapilereflectd numai asemdnarea formelor. Profile cu nivele §i imprd§tieri foarte
diferite pot apdrea to aceea$i grupd doar datoritd apropierii formelor lor. In schirnb, dacd
profilele sint Jungi", constitute in baza unui numdr mare de indicatori, atunci
coeficientii de corelatie transmit nu numai1informape in legdturS cu r^ortul dintre
formele profilelor ci, indirect, si asupra raporturilor dintre nivelele §i imprd§tierile
profilelor comparate. Doud profile lungi, cu forme asemdndtoare au, foarte probabil,
$i valori apropiate ale nivelelor §i imprd§tierilor lor. Numeroasele experimentdri pe care
le-am efectuat in acest sens cu calculatorul, suspn o astfel de ipotezd. Temeiul teoietic
al acestei ipoteze metodologice nu ne este incd foarte clar.
Pomind de la aceastd premisd, propun ca in cazurile in care se lucreazd cu profile
scurte, sd fie realizate clasificdri in care forma, nivelul §i imprd$tierea profilelor sd fie
luate in considerape simultan §i fdrd a admite efecte de „compensare“ intre acestea.
Este vorba de a udliza o mdsurd a proximitd(ii bazatd pe nopunea de profil desf3§urat
(dezagregat, extins). In formulele distantei, profilul este folosit fdrd a distinge intre
componentele sale (sd-1 numim, din acest motiv, profil agregatsau „infd§urat“). Indicii
de similitudine de tipul coeficientului de corelape lucreazd cu un profil abstract (simplu),
132
redus la forma.La setul de ranguri sau vakni normalizate, prin care se descrie forma
unor profile se poate adauga valoarea medie care reprezinta nivelul sau/§i abaterea ■
standard (sau coeficientul de variape) prin care se m&soar& impr£§tierea profilului
respectiv. Noul profil obpnut din forma, nivel §i impr&sPere este ceea cp am desemnat
prin nopunea de profil desfa$urat (extins).
Mai precis, operapile de constitute a sa sint urmatoarele: /
1. normalizarea celor p variabile de profil;
2 . calcularea mediei §i a abaterii standard corespunzatoare fiecarui profil ^pentru
cele n unitap de clasificat);
3. normalizarea seriilor de medii §i abateri standard;
4. normalizarea fiecarui profil inipal (infa§urat);
5. completarea fiecarui profil de p valori cu incS doua valori reprezentind media
p abaterea standard;
6 . renormalizarea celor p + 2 valori ale fiecarui profil desfa$urat;
7. calcularea coeficienplor de corelape dintre profilele desfa§urate.
Masurarea similaritaplor pe baza profilelor desfa$urate poarte fi considerata ca o
modalitate de corectare acorelapilor dintre forma profilelor inipale cu media §i abaterea
standard corespimzatoare lor. Este de presupus ca o astfel de corectare este cu atit mai
necesara cu cit numarul valorilor (indicatorilor) de profil este mai redus. in astfel de
cazuri exista un rise sporit de a considera ca fiind foarte apropiate doua unitap numai
In baza asemanarii de forma, indiferent de nivelurile lor. Atunci cind profilurile sint
Jungi*. construite in funcpe de un numar mare de indicatori, este mai pupn probabil
sa se observe o corelape inalta intre profilele Iot dac8 au $i medii de profil fo«te
diferite). :
Pentru ilustrarea modului in care tipul de masurare influen(eaza ierarhia simili- *
tudinilor, prezentam in tabelul 5.3.2. proximitatea demografica dintre Timi§oara §i
celelalte ora^e in difoite variante de masurare. Asemanarea demografka dintre Timi$oara
§i Arad este cea mai puternica in doua dintre cele cinci Ppuri de estimari. Indicele de
similaritate calculat pe baza profilelor desfa§urate diferenpaza cel mai putemiC intre
asemanarea Timi§oara-Arad, pe de o parte, §i Timijoara-Brajov, pe de alta parte. Nu
se poate spune care este cel mai bun indice de proximitate numai prin referire la acest
exemplu. Examinarea comparadva (in finalul capitolului) a clasificarilor realizate cu
aceea§i metoda pomind de la Ppuri diferite de esPmare a proximitaplor va permite
astfel de aprecieri. Deocamdata not3m numai ca este mai plauzibiia o asem2nare demografica
maxima a Timijoarei cu Aradul, ora§ apropiat, decit cu Bra§ovul.
Odata precizate, aspectele referitoare la modul de masurare a raporturilor dintre
profile se poate trece la analiza problemelor referitoare la selectarea indicatorilor in
funcpe de care se definesc profilele pentru clasificarile mulPcriteriale.
133
(Desigur, in aplicarea analizei cluster, ordinea este inverse - intii se aleg indica
torii $i dup# aceea se m#soar# distan|ele sau similaritaple dintre profilele comparate).
134
, Nerespectarea priirsei cerinje inseamna omiterea unor indicatori semnsficaiivi
din analiza. Consecinfa unei astfel de omisuni este generarea unor grupuri artificiaie
in care se realizeaza o aglomerare de unitap excesivd sau neconforma cu grupSriie
naturale. .
Aceea§: este consecin^ p in cazui nerespect&rii ceiei de-a doua cerin(e. Dac3
pentru un suMomeniu este selectat un nuniSr mult mai mare de indicatori, atunci acei
subdomeniu va fi supraestimat ca im portant In consecintd, clasificarea va reflecta in
principal sobdomeniului respectiv.
Domeniul fenomenelor demografice este reflectat, relativ complet, prin setul celor
8 indicatori pe care i-am men(ionat in 5.3. (alte fenomene precum morbiditatea, spre
exemplu, sint mai pupn importante §i nu au un caracter demografic pur).
S3 vedem in ce masur& este respectatS. cerinfa egalei reprezentari a fiecarei dimensiuni
a domeniului Reamintim pentru aceasta dimen siuniie §i indicatorii corespunzatori lor:
135
in cazul ora§elor mari din exemplu, imigrarea (x“= 13,78) este net superioard
emigrarii (3T= 4,67). Migrapa neta este de a§teptat s&aibi, in consecinpi, aceea§i struc
ture cauzaie cu imigrarea. Corelapa indicilor respectivi este, corespunzator acestei
a§tept2ri, foarte mare (r = 0.96).
Tabel 5.4.1.
Corelapi Intre indicatorii fenomenelor demografice din ora§ele mari, 1985
136
Analiza clustefjs e desfdjoard in condnuare cu seriile de scorm i factoriale care
uiesc cele v variabile inijiale. Dacd factorii objinuji nu au » mterpretare foarte
rd, atunci nu este indicatd folosirea scorurilor factoriale.
Jn cazul in care se presupune cd variabilele care urmeazd sd fie reduse se sub-
eazd unei singure dimensiuni, poate f i folositd o modalitate simpld de calculare a
orurUor factoriale. (Este vorba de abaliza path cu variabile latknte - vezi Loehlin,
In cazul in care dorim reducerea a trei indicatori xr x2 f i x3 la o singuri
ensiune f i se cunosc corelaiiUe dintre acefiia, atunci se poateadopta o modalitate
calcul derivatd din analiza path.
Notdm cu a corelafia dintre dimensiunea latentd fi xt. cu b pe cea dintre x2 fi
dimensiune fi cu c pe cea corespunzdtoare relapei x3 - dimensiune. Corelapile dintre
cele trei variabile fu n d r1Jt ru fi r ^ , pdtratul coeficienplor cdutap va fi:
a * * (ru • b * = ( r 12 • r ^ , ; c 1 = ( r 13 • t j / t l2
138
c u , scorul Hull (formula 53.1.). Spre exemplu pentru fara noastrd, la nivehd
anului 1984, indicele respectiv are valoarea DEZV ■ 0340 • (100 - 63) + 0$34 •
• (100 - 74) + 0.602 • 30 * 623.
Cu cit indicele are o valoare mai mare, cu atU este mai accentuafd dezvoltarea
sociourband a unitdfii teritoriale de referintd. In mod similar a fa st calculat indicele
respectiv §i pentru celelalte \&ri analizate: Austria (120), Belgia (118), Bulgaria (89),
Cehoslovacia (89), Danemarca (132), RD .G . (116), R.F.G. (134), Ungaria (79), Olanda
(126), Norvegia (106), Polonia (67), Suedia (127), Elvetia (116), Marea Britanie
(123), SUA (111), Jugoslavia (45). (Pentru detalii asupra acestui exemplu vezi
D .Sandu, 19 9 0 a).
Rezultat al operapilor succesive de selectare a indicatorilor §i mdsurare a distan(elor
sau similarityjilor dintre perechile de obiecte care urmeazd sd fie clasificate sint matricile
de proximitate (de distaste sau similaritdp ale obiectelor). Pomind de la aceste matrici
pot fi realizate diferite variants de clasificare empiricd In funcpe de metoda de grupare
adoptatd. Exists o Intreagd „pddure“ de astfel de metode. Dintre acestea, cele mai
folosite sint cele „aglomeratiye“. Particularitatea lor este cd pomesc de la considera-
rea fiecdrei unitdp ca grupare'sau duster. Ulterior,TiecarecicHt de grupare contope§te
clusterele din etapa anterioard. In final rezultd o singuid grupare ecfiivalentd cu totalul
unitdplor din populapa supusd analizei. Metodele de clasificare care pomesc astfel, de
jos In sus, se cheatnd cd smt aglomerative. Ele se opun celor divizive In care se pomejte
de sus In jos, de la considerarea setului inipal de unitdp drept cluster care se subdivide
cu fiecare ciclu de grupare pind cind se ajunge, eventual la clusters echivalente cu
fiecare dintre unitdple de analizd.
Principiile de operare ate celor doud categorii de metode sint, evident, opuse.
In clasificdrile aglomerative se cautd unitdple sau subgrupdrile cele mai asemdndtoare.
In cele divizive se urm5re§te identificarea celor mai diferite subgrupdri.
139
aleq „ a lm
mai multe cicluri, gruperile anterioare pot ft formate eie insele din mai multe unitap,
a§a cum au rezultat din pa$ii precedent ai algoritmului). denumitft (d
• in noua matrice recalculate se caute din nou perechea de grupSri cu nearest neig
maxima similaritate. Gruperile corespunzHtoare acestei perechi sint contopite intr-o independent,
noua gnipare. singuri legth
Cicluri de grupare continue pine la un anumit prag de teiere sau de stopare a Distant
aglomerarilor. Existe mai multe reguli de stopare la care ne vom referi pe parcursul al „celui m
capitolului. dintre unitat
Se presupunem d din examinarea unei matrici de distance a rezultat perechea In exempiul
reciproce (i, j) pe care o denumim k. In subgruparea i existe n. unitap iar in j, n.. Pentru in care k ji
a recalcula matricea distantelor incluzind noua grupare k, trebuie mesurate distanpi este egali c
dintre oricare alte unitate h §i k, d^. Raporturile dintre gruperile implicate ir aceaste grupe. Acea
recalculare pot fi simbolizate ca in fig. 5.5.1. dace in analize sint implicate numai doua minime pe
caracteristici de grupare. ’ (jifcpie. Me\
variabila 2 ktate,iaincc
lor minime.
o pereche d
Noua i
are, in rapo
sau mai mic
cel mai pup
top vechii i
urme are ui
grupeidein
complete* 5
com|
accesti
decitjfar*<
compacte d
asemenare i
Fig. 5J.1. Relapa dintre trei grupSri constituite in funcpe de doui criterii de clasificare
decit d a d i
Metodele de clasificare aglomerative difera intre ele in funcpe de modul in care O meti
se determine distant dintre gruperile h §i k. medie a legi
Una dintre cele mai simple metode de analize cluster considere ce distanfa dintre este cunosc
o unitate candidat (h) si gruparea in care aceasta ar putea fi incluse (k) este date de Sorensen in
cea mai mice dintre distance care existe intre h §i oricare dintre membrii grupSrii de
Toate
incluziune. Rentru inceput se presupunem ce gruperile i. i sTh sint formate din numai
clustere pe I
cite o unitate $i ce i §i j formeazS perechea reciproce desemnate prin k. Dace d^ = 5
intragrupal
iar d^ = 3 atunci, conform regulii anterior menponate de d ^ = 3. Altfel spus, a fost
a le s „cel mai apropiat vecin" pentru a mdsura distanta dintre unitatea candidat fi
gruparea de incluziune. Datoritd acestei analogii spatiale, metoda respectiva a mai fost
denumitft (de cStre Lance $i Wiliams fin 1976) metoda celui mai apropiat vecin (the
nearest neighbor method). Ea a fost introdusd1a circuital ftiintific lb. 1957, in mod
independent, de cdtre Sneath fi McQuitty fi este cunoscutfi c&analizd cluster cu o
singurd legdturd (single linkage clustering). ' “
~ Distanta dintre doud clustere poate ft mdsurata fi pomind de la principiul opus
al ncelui mai depBrtat vecin*4 (furtherest-neighbor method): distanta cea mai mare
dintre unitatea h fi unitdtile gmpei It este cea care da masura diferenjei dintre h $i k.
!n exemphil de mai sus, conform acestui principiu d ^ = dy = 5. Pentru cazul general
In care k fi h sint compuse din mai multe unitdti, se considerd deci ca distanta d ^
este egali cu distanta maxima dintre perechile care reunesc elemente din cele doua
grupe. Aceastd metoda de grupare (propusdde Sokal fi Michener in 19S8) imfica limita
minima pe care o pot avea distantele dintre ncrechile de elemente sitn^nuam ne.
difgpte. Metoda lesdturilor complete, cum mai este denumita to literatura de specia-
litate, ia in cbhsideratie toate legaturile dintrecele doua gtupBriprin Spedficarea dimensiunii
lor minime. O „legaturB“ intergrupe nu este altceva decit masura proximitdpi dintre
o pereche de unitati ale cdrei elemente apartin cite uneia din gruparile comparate.
Noua unitate, admisd in cadrul unei grupdri in baza metodei legdturilor complete
are, in report cu toate unitdtile anterior admise in grupa respectiva, o distanta egaia
sau mai mica decit cea data de „cel mai indepartat vecin** (unitatea cu care se aseamana
cel mai putin). In gruparea cu o singura legaturanu este spccificatd distanta dintre
to{i vechii mcmhrii ai grupei si ultima imitate admisd, Se ftie numai ca aceasta din
urmd are un report de asemdnare maxima cu numai una dintre unitatile vechi ale
grupei de incluziune. Din acest punct de vedere trebuie injelese sintagmele de „legdturi
complete" fi„legdturd unicd‘‘ pentru cele doud metode. Analiza cluster cu legatigi
complete este. deci. mult mai rtstrictivg decit cea cu o singurd legatura. Corespunzator,
accesul intr-o grupare constituitd in functie de prima metoda este mult mai dificil -
decit <fac8 <te. aplicfl cea de-a doua metoda. Gruparile rezultate in nrimul caz sint mai
cnmpacte dectt tn cel de-al doilea. Altfel spus, omogenitatea sau gradul mediu de
asemdnare in interiorul grupelor este mai mare dacd se folosesc legdturile complete
decit dacd se utilizeazd metoda celui maiapropiat vecin.
O metodd intermediara intre cde doud calculeazd distanta dintre doua clustere ca.
medie a legdturilor sau distanfelor dintre elementele grupelor respective. Corespunzator
este cunoscutd sub numele de metoda a legdturilor medii dintre grupdri (propusd de
Sorensen in 1948). — —— —— —r - *
Toate cele trei metode menponate au in comun determinarea proximitdfii dintre
clustere pe baza distanfelor sau similaritdfilor intre grupe, ignorind complet proximitdfile
intragrupale. '
141
Alte metode la care ne vom referi mai tirziu (centroide sau bazate pe variant^)
iau in considerate §i proximitaple intragrupale. ! Alg(
in continuare vom detalia in primul rind algoritmii de realizare a clasificarilor, urmatoar
bazate pe leg&turi intergrupale (linkage methods) §i problemele pe care le pune 1. S
aplicarea ?i interpretarea lor. Dupfi aceea, pe scurt, vom menpona §i trei algoritmi proximity
in care, pentru calcularea distanfelor intergrupale, se iau in considerate §i distanfele maxima).
intragrupale. 2. S
Pentru a
5.5.2. Algoritmi de calcul dendogm
Clasificdri cu o singurd legdturd doua unit
Exemplul de calcul 5.5.1. Fiind dat un set de 8 unitap A, B, C, D, E, F, G, H „ramuri“,
caracterizate prin valori pe trei variabile 1, 2, 3 se pune problema clasificSrii acestor corespuni
unitap folosind metoda celui mai apropiat vecin. Op
v E §i F. G
Matrice cu date impale Matrice cu date normalizate cu scor z
vertical (
1 _2 _! 1 1_ _3_ 3. S(
dintre ori
A 3 2 1 A -0,68 -1,07 -0 ^ 8 lui X §i t
B 7 5 5 B 0,13 -0,50 -0,30 0,79 faja
C 4 10 5 C -0,48 0,45 -0,30
D 11 20 2 D 0,93 2,35 -0,81 rezulta ui
E 1 8 9 E -1,08 0,07 0,38
F 2 7 10 F -0,88 -0,12 0^5
G 6 3 2 G -0,08 -0,88 -0,81
H 17 6 20 H 2,13 -0,31 2,26
Pomind de la matricea cu date normalizate, se determina distanfele euclidiene
medii pentru fiecare pereche de elemente. Conform procedeului menponat in 5.3.,
distan|a dintre A §i B spre exemplu este:
AB = 0,68 - 0,13)2 + (- 1,07 + 0.50)2 + (- 0,98 + 0.30)2) /3 = 0,69
In mod similar se obpne matricea distanfelor dintre toate unitaple, considerate
cite doud:
Matricea distan{elor euclidiene medii 4. S
in noua n
A B C D E F G H
forma no
A 0,00 0,69 0,97 2,18 1,05 1,05 0,38 2,51 fig. 5.5.2
B 0,69 0,00 0,65 1,73 0,86 0,79 0,39 1,88 Dac
C 0,97 0,65 0,00 1,39 0,57 0,64 0,85 2,15 de grupai
D 2,18 1,73 1,39 0,00 1,88 1,93 1,95 2,44 In fi
E 1,05 0,86 0(51 1,88 0,00 0,19 1,05 2,15
F 1,05 0,64 meration
0,79 1,93 0,19 0,00 1,01 2,00
G 0,38 0,39 0,85 1,95 1,05 l,6l 0,00 2,20 prin: nun
H 2,51 1,88 2,15 2,44 2,15 2,00 2,20 0,00 la care s<
care se r
142
1
i Algoritmul de grupare a unitaplor pome§te de la aceasta matrice, operind in
urmatoarele secvenfe:
1. Se cautS in matricea distanjelor perechea reciproca de valoare minima. (Dac2
proximitaple ar fi fost masurate prin indici de similaritate se considera.cea cu valoare
maxima), in exemplu, aceasta este perechea EF pentru care d^, = 0,19;
2. Se atribuie aceleia§i grupari (EF) unitaple din perechea reciproca respectiva.
Pentru a reprezenta grafic procesul de grupari, in figura S.S.2.a se construie§te o
dendogramd, adicS un grafic de tip arbore. Nivelul la care se unesc doua clustere sau
doua unitap este marcat printr-o linie orizontaia care une§te liniile verticale, denumite
„ramuri“, corespunzatoare gruparilor unite. Ramurile care pomesc de la baza figurii
corespund situapei inipale, in care un cluster era echivalent cu o unitate.
O prima grupare este marcata deci la nivelul 0,19 unind ramurile pentru unitaple
E §i F. Gruparea nou formata este reprezentata, in condnuare, prin ramura care pleaca
vertical de la linia de nivel 0,19;
3. Se reface matricea distantelor cu (EF), considerata ca o singura unitate. Distanja
dintre orice cluster X §i (EF) este data de valoarea distantei minime dintre unitap ale
lui X §i ale lui (EF). Spre exemplu, unitatea B se afia la distanjele 0,86 fata de E §i
0,79 fata de F. Din regula menponata rezulta ca d g ^ = 0,79. Aplitiund acest principiu,
rezulta urmatoarea matrice a distantelor
A B G D (EF) G H
143
Figv 5.5.2.C Ex
dendogrami pi
analizichu
legStun cot
E F C A 0 B M D E F C A 0 B H
O) b)
1 F 0,19 4
2 A G 038 3
3 AG B 039 5
'■■■■■4 EF ■ c ■
. 037 5
5' ■ AGB EFC 0,65 6
6 AGBEFC D 139 7
7 AGBEFCD H 1,88
astfel de zonS pare sS fie cea situatS in jurul nivelului 0,60. DacS se adopts
segmentaiea arboreiui in punctul respectiv atunci rezultS douS gnipSri relativ compacte:
(A, G, B) $i (E, F, Q §i douS unitSp izolate D §i H, in afara oricSror grupari. Necu-
noscind nimic despre natura criteriilor in funcpe de care se face clasificarea, aceasta
pare sS fie tSierea cea mai potrivitS. Schimbarea liniei de tSiere a arboreiui duce la o
configurate diferitS a grupSrilor. DacS, spre exemplu, secponarea s-ar face la nivelul
1,40, atunci ar rezulta o singurS grupare, care cuprinde 7 unitap (de la D la B) $i o
unitate izolatS H.
Pentru stabilirea nivelului de secponare este utilS §i examinarea listei secvenjelor
de grupare (vezi tabel 5.5.1.). Secponarea este indicat sS se producS intre ciclurile
despSrpte printr-o „rupturS“ considerabilS (M. NoruSis, 1985:174) in seria coeficienplor
care exprimS nivelul de contopire a grupelor. Prima rupturS de acest gen apare intre
secven{ele 5 §i 6 . RezultS, deci, cS nivelul indicat pentru secponare este 0,66.
Obiectivele clasificSrii, natura criteriilor de clasificare precum §i informapile
disponibile in legSturS cu alte ClasificSri ale acelora§i unitSp pot infiuen(a hotSritor
alegerea nivelului de secponare a dendogramei.
Bin citirea dendogramei se poate spune, spre exemplu, cS unitatea C se aseamSnS
cu E sau F la nivelul 0,57. Nu §tim exact cu care dintre aceste unitSp inregistreazS
distanpt respectivS. Sigur este cS distanpt lui C fa(S de A, G sau B nu este mai micS
de 0,57 ci mai mare.
Comparind grupele (E, F, C) §i (A, G, B), din dendograma 5.5.2a. putem citi doar Si .J
cS o distanjS minimS dintre un membru al primei grupe §i urt membru al celei de-a
doua este de 0,65. Pot exista mai multe perechi de astfel de distan{e intergrupale.
146
Obligatoriu este sa existe, insa, una de aceasta valoare. Restul distantelor intergrupale
pot fi mai mare de 0,65.
Existft §i alte variante de analiza cluster, cu o singura legatura, diferita de cea
standard, pe care am prezentat-o anterior. ,
Principala deficient a analizelor cluster cu o singura legatura rezida in permisi-
vitatea lor sporita fa{3 de fenomenul de „iniantuire“. Proximitatea dintre grupari este
masurata numai prin o singura distanta, §i anume prin cei mai apropiati vecini. Dat fiind
faptul ca aceasta este o masura foarte slaba (care ignora raporturile de distanta dintre
perechile pe care le formeaza toate elementele grupelor comparate) pot rezulta cu
u§urinta, prin aglomerare, noi grupari foarte eterogene. Gradul de similitudine ridicata
dintre dou3 elemente situate in clase diferite nu asigura in nici un fel o similaritate
asemanatoare §i intre grupe in ansamblul lor.
Conform dendogramei din fig. 5.5.2(a), grupele E, F, C §i A, G, B au intre ele
o distanta de 0,65. Aceasta este insa numai valoarea corespunzatoare perechii BC.
Distanfa intre A §i E, spre exemplu, este mai mare, respectiv de 1,05.
Pentru a obpne grupe cit mai omogene se adopta solupa masurarii distantelor
dintre grupari luind in considerate toate distanfde intergrupale. Dupd cum am menponat
deja, analizele cluster cu legaturi medii §i complete lucreaza tocmai in acest sens.
Clasificdri cu legdturi medii
Sa consideram, in continuarea analizei anterioare, cazul grupelor E F G §i A G
B. Din matricea distantelor calculata cu ocazia prezentarii analizei cluster cu o singura
legatura extragem valorile corespunzatoare pentru cele doua grupe:
E F c
A 1,05 1,05 0,97
B 0,86 0,79 0,65
G 1,05 1,01 0,85
Proximitatea dintre grupele respective nu va mai fi estimata prin distan(a minima,
respectiv prin d ^ = 0,65. Se va lucra cu o masura mult mai „tare“, respectiv cu media
distantelor pentru toate perechile intergrupale:
d = (1,05 + 1,05 + 0,97 + 0,86 + 0,79 + 0,65 + 1,05 + 1,01 + 0,85) 79 = 0,92.
!n aceasta varianta de calcul grupele sint mai distantate, deci, decit lasa sa se
inteleaga masura folosita m analiza cluster cu o singura legatura.
in general in clasificarea cu legaturi medii intre grupari, o grupare „i“ va fi
contopitd cu o alta desemnatd prin , j “ dacd fi numai dacd distanta medie dintre „i“
fi , j “ este mai micd decit cea dintre „i" fi orice altd grupare „h".
Algoritmul de lucru are aceea§i structura ca ;i in cazul gruparii cu o singura
legatura.
Punctul de pomire il constituie o matrice de similitudini sau distan(e intre unitaple
supuse clasificarii. in matricea respectiva se determina perechea reciproca de valoare
147
minims (daeSmsfirteen< m to tifta n fe ) sontna& nS(dac*» p k a & d e l a o matrice
de similitudine). ,
UnitSple din aceea§i pereche reciprocS se afii&trfe acdets& gnrpSri, UrrneazS re-
calcularea distantelor dintre noua grupare §i celelalte grupSri (fit primal cichi acestea
sint identice cu cite o unitate). Matricea initials este inlocuitS cu cea care include
recalculSrile respective.
Aceasta din'urmS este secven(a diferitS fa[S de cea din algoritnfal grupSrii cu o
singurS legSturS. Diferenta provine din faptul cS distance dintre grupSri se determinS
ca distante medii §i nu minime (bazate pe o singurS legSturS).
Reluind datele din exemplul folosit §i la prezentarea clasificSrii cu o singurS
legSturS, se inregistreazS perechea reciprocS cu distanta minimS intre elemente - EF.
Distanfele medii dintre aceastS grupare §i restul elementelor de clasificat A, B,
C, D, 0 §i H ant 1,05, 0,83, 0,61, 1,91, 1,03, 2,08. Se reface in continuare matricea
distantelor, incluzind aceste valori pe coloana $i linia corespunzStoare grupSrii EF.
Ciclurile se reiau cu determinarea perechii reciproce de distantS minimS din noua
matrice $.a.m.d.
!n tabelul 5.5.2. este prezentat rezultatul aplicSrii analizei cluster cu tegSturi medn
la datele din exemplul de calcul. Dendograma corespunzStoare grupSrilor din acest
tabel este prezentatS in rig. 3.5.2(b).
Comparind cele douS dendograme corespunzStoare grupSrii cu o singurS legSturS
(fig. 5.5.2.a) §i grupSrii cu legSturi medii (fig. 5.5.2.b) §i listele secvenjelor de clasi
ficare (tabelele 5.5.1. §i5.5.2.) rezultS:
- configurapa generals a grupSrilor este aceea§i:
T abel5 5 2 .
Llsta secvenjelor de grupare a unitSplor din exemplul 5.5.1. folosind analiza
cluster cu legSturi medii.
4.
GnipSri contfopite
Cidul de Nivel de Cichil urm&tor la care
grupare Prima grupare A doua grupare contopire reapare gruparea
3"
5.i
1 E : ■ F . 0,19
2 A G :■ 0,38 4 Ti
3 EF 0,64 . 5 '
' ■-•'4 AO 0,69 5
5 AGB CEF 1,05 6
6 AGBCEF ■:: I) 2,18 7
7 AGBCEFD H 2,51
150
, Tabel 55.4.
Parametrii din formula da calculare a distantalor Intergrupale pantm 6 metode
de clasificare ierarhici
Metoda Parametral ,
A B C D
1 _1 1
1. legftturi unice o "T
2 ‘*4 2
1 1 ' 1
2. legftturi complete 2 2 0 T
3. legSturi medii J L _St_ o 0
ni + nj nt + ni
4. variance minimi
(Ward) 0
n* + ni nk+ nt
5. centroidi "i "j “V i
i^ + n, 11, + ^ (n,+ n))2 0
6. medianft 1 1 _ 1
2 2 4 0
Sursa: M. Lorr, 1983 : 85
Primele trei metode din tabel sint cele la care ne-am referit deja. Dupd cum am
menfionat in introducerea capitolului, aceste metode au in comun considerarea
parametrului C = 0. Astfel spus, in calcularea distantei intergrupale kh nu se ia in
considerate §i distan{a intragrupald ij. Algoritmul propus de Lance fi William pentru
calcularea distanielor intergrupale fi recalcularea matricilor de distanie dupd fiecare
ciclu de grupare este deosebit de util in realizarea programelor de calcul pentru
cluster. Avantajul sdu principal rezidd in faptul cd permite o considerabild economie
de memorie a calculatorului, operind cu numai o singurd matrice a distanielor. Aceasta
este redusd ca dimensiuni de la un ciclu de grupare la altul.
Metodele centroidd §i mediand
Toate cele trei metode anterior prezentate opereazS pe baza determinarii Jeg&turilor"
in sens de ..distance intergrupale, calculate f&rS luarea in considerate a diferenjelor
intragrupale“ §i prin raportare la profilele netransformate ale unitaplor din grupele
comparate. !n clasificarea bazatS pe o singurS legSturS, se comparS profilele cele mai
apropiate din cele douS grupe posibile de reunite, in analiza cu legSturi complete,
profilele comparate sint cele mai depSrtate. Analiza cluster cu legSturi medii
comparS seturile de profile din cele douS grupSri de referintS calculind distan(a medie
dintre ele.
O altS serie de metode de clasificare lucreazS prin compararea unor profiluri
standard calculate la nivel de grupS. Se contopesc grupSrile care au profilurile standard
cele mai apropiate.
151
Metoda centroida realizeaza o astfel de clasificare in termeni de medii: pentru ' s
unitaji care aparjin aceleia§i grupe se calculeazS media pentru fiecare variabiia a declas
profilului; §irul sau vectorul de medii astfel calculat define§te profitul standard al
grupei; se contopesc grupele care au cele mai apropiate profiluri. L it
Centroidul unui cluser este format dintr-o serie de medii. Unitajile din aceeagi
grupare se aseamSn& mai mult cu centroidul lor decit cu centroidul altui cluster. Pentru
a reduce efectele de compensare asociate cu calculul mediei, poate fi utilizata mediana. Cicl
Profilul standard al grupei se determine calculind medianele pentru fiecare variabiia gru
de profil la niveiul unitajilor din grupa.
fn metoda medianfl, clusterele combinate au acelagi efect asupra celui rezultat,
indiferent de numSrul de unitaji din care se compun.
Cele dou& metode centroida §i mediana - se aplicd numai pe matrici de distanje
euclidiene §i nu §i pe cele de siipilitudini.
in tabelul 54.5. sint prezentate secvenjele de grupare, centroida §i median! realizate
pe baza datelor din exemplul pe care 1-am folosit pentru ilustrare §i la celelalte metode
analizate. 1
Tabel 5-5J . contoj
Llsta secvenjelor de grupare a unit&Jilor din exemplul 5.5.1 folosind metodele
controidd ?i mediand:
adopt:
Metoda centroida Metoda mediani
Ciclul de I
grupare Prima Adoua Nivel de Prima A doua Nivel de fi ceh
grupare grupare contopire grupare grupare contopire recurt
1 E F 0,19 E F 0,19 Aplici
2 A G 0,38 A ■ 0,38 unitat
3 AG B 0,44 AG : B 0,44
4 CE F 045 EF A. C 045
5 AGB EFC 0,60 AGB EFC 044
6 AGBEFC D 144 AGBEFC D 1,48
7 AGBEFCD H 1,74 AGBEFCD H 1.76
iar h
unde x - media variabilei de profil pentru grupa respective.
152
A
; Se calculeazd deci, pentru fiecare grupd, setul de medii corespunzdtoare variabilelor
de clasificare (de profil).
Tabel5J.6.
L i s t a s e c v e n j i l o r d e g r u p a r e a u n i t d $ i l o r d i n e x e m p l u l 5 .5 .1 f o l o s i n d m e t o d a
v a r i a |i e i m in im e ( W a r d )
_ nB+n n» + no
(AG)B " '^BG
“ b + I'AO **B+ nAO nB+ n.'AO ' ^AO ~
153
Aceasta este relapa ultrametricS. In mSsura In care este respectatS in constmirea gmpSrilor,
orice cluster contopit, incepind cu ciclul doi de grupare se contopegte la o distant mai
mare decit cea specifics oricSrui alt cluster care a fost contopit anterior. Examinind
coloana nivel de contopire din toate listele de secvenfe de grupare menponate, se
observS u$or cre§terea monotonS a coeficientului respectiv odatS cu ciclul de grupare,
exceptind cazurile metodelor centroidS §i medians.
S .S 3 . in a p o i la g r u p a r e a d e m o g ra fic S a o ra § e lo r m a r i: u n e x e m p lu d e a p li-
c a r e a a n a liz e i c lu s te r
154
u n o r g r a p e c i t m a i c o m p a c ts . A n a liz a c l u s e k r c u le g S tu ri c o m p le te a p lic a tS u n e i m a tric i
d e s im ititu d in e a p r o f ile lo r e x tin s e s e a p r o p ie f o a r te m u lt d e a c e s t m o d e l d e c e rin fe .
D a c S v a lid S ri d e tip in te m ; i e x te r n n u s u s p n c la r ip o te z a u n o r g ru p S ri c o m p a c ts ,
a tu n c i s e tr e c e l a a n a liz e c u m e to d e m a i p u fin r e s tr ic tiv e d e g e n u l c e lo r b a z a te p e
le g S tu r i m e d i i s a u u n ic e .
O ra je le p in d ic a to rii d e a n a liz S a p a r In ta b e lu l 5 3 .1 .
A p lic in d m a tric ii c o e f ic ie n p lo r d e c o re la p e ( in tr e p r o f ile e x tin s e ) a g lo ritm u l
a n a liz e i c lu s te r c u le g S tu ri c o m p le te , r e z u ltS c o n f ig u r a p a d e g r u p a r e p re z e n ta tS I n
ta b e lu l 5 .5 .8 p ia d e n d o g ra m a d m f i g u r e 5 .5 .3 .
U r m S r in d c o l o a n a c u n i v e i u l d e c o n t o p i r e d i n l i s t a s e c v e n |e l o r d e g r u p a r e , p o t
fi re m a rc a te d o u S „ ra p tu ri“ in tr e c ic lu rile 4 - S f i 1 0 - 1 1 . V o m r e p n e c e a d e - a d o u a d is -
c o n tin u ita te p e n tr u c S e s te m a i m a re d e c it p r im a ( 0 ,3 6 - 0 ,4 0 ) > ( 0 ,7 9 - 4 ,6 8 ) . in p lu s ,
e x is ts p u n m o tiv p r a c t i c d e a p r e f e n s e c p o n a re a d e n d o g ra m e i d u p S c ic lu l 1 0 : d a cS
am a c c e p ta s e c p o n a r e a e i im e d ia t d u p S c ic lu l 4 , a tu n c i fo a rte p u p n e d in tr e o ra ^ e
s - a r in c a d r a ln tr - o g r u p a r e d e c e l p u |i n d o u S e le m e n te .
O p e r in d ,d e c i, s e c p o n a r e a d e n d o g r a m e id u p S c ic lu l 1 0 , re z u ltS u rm S to a re le g ru p S ri
de oa§e:
I. G a la p IV . R ep fa O m m im h B !
la p S ib iu
P lo ie $ ti V. ‘ B acS u V IIL B rS ila
T g . M u re ; . B a ia M a re D C .P ia tr a N e a m i
IL C lu j V I. B o to ^ n i X . C o n s ta n p i
O ra d e a B uzS u ' X L P ite p i
S a tu M a re V IL B ra p > v —
m . A ra d C ra io v a
T im i^ ia re
I n a c e a s tS v a ria n tS d e c la s if ic a r e , 5 d in c e le 7 g ru p S ri d e m in im u m d o u S o ra je
s in t f o r m a te (tin n u m a i d o u S o ra $ e . I z o la te , c u u n g r a d r id ic a t d e s p e c if ic ita te rS m in
B rS ila , C o n s t a n t a , P ite g ti g i P i a t r a H e a m p
D a c S s e c o n s id e r s f ie c a re o r a ; iz o la t to t c a g r a p S , a tu n c i b ila n p il g e n e ra l a le c o n o m ie i
re a liz a te p rin c la s if ic a re n u e s te fo a r te b u n : c e l e 2 1 d e o ra § e a u f o s t re d u s e la 11 c la s e ,
d in c a r e 4 n u c o n p n d e c it c ite u n e le m e n t, i n a c e a s tS v a r ia n ts d e c la s if ic a re g ru p e le
s in t, e s te d r e p t, f o a r te o m o g e n e . S im ilitu d in e a m in im S in tr a g r a p a lS e s te d e 0 ,5 6 .
E c o n o m ia c la s if ic S rii e s te c u a t i t m a i n ia r e c u c it n u m S ra l d e g ru p S ri o b p n u t e s te
m a i m ic f a # d e c e l a l e le m e n te lo r l o r d e c la s if ic a t p c u c it d im e n s iu n e a m in im S a
u n e i g ru p S ri e s te m a i m a re . A m p u te a d e fin i u n in d ic e e le m e n ta r a l e c o n o m ie i unei
c la s ific S ri ( E C ) p r in u rm S to a re a fo r m u la :
j numfeul de grupfai
~ ” numSrul de elemente de clasificat ‘
155
1 Co
in cazul
'■ E v i
relate in
intr
criteriu i
nivel de
cel pu(in
5.5.8, n
variants
Lists
Ciclul (
grupar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
156
A
1 C u c it in d ic e le a r e o v a lo a re m a i m a re , c u a tit c a la s ific a re a e s te m a t e c o n o m ic s .
* 1 13 ' 14 ; 0,86 10
2 17 '21''"' 0,83 10
3 9 15 0,80 7
4 1 12 0,79 15
8 20 0,68 16
5
6 2 3 ' ' 0,67 11
7 9,15 19 0,66 15
8 6 7 0,64 12
9 4 11 0,64 17
10 13,14 1731 056 14
11 .2 3 - 16 0,40 12
12 23.16 034 16
10 18 031 18
13
14 5 13.14.1731 03 17
15 1,12 9,15,19 0,06 19
16 23,16,63 -0,14 18
83,
17 4,11 5,13,14,1731 -0,1 6 19
18 2 ,3 ,1 6,6 .7 ,8 3 10,18 -0 3 9 20
1,12,9,15,19 4,115,13,14.1731 -0,47 20
19
20 10294549411513144721 2 3 .1 6 5 .7 3 3 ,1 0 ,1 8 -0 3 4
157
De la 0,48, cit era indicele de economie a clasificSrii in varianta anterioarS, in
varianta actuals se ajunge la 0,67. Sponil de economie se rSsfringe insS negativ asupra
omogenitSpi grupelor. similitudinea minimS intragrupalS se reduce de la 0,56 in
varianta cu 11 clase, la 0,20 in cazul celor 7 clase.
Intre cele 7 grupe predominS raporturile de neasemSnare. (UrmSrind principiul
general al analizei cluster cu legSturi complete, raporturile intergrupale sint estimate
prin coeficientul de corelape minim dintre perechile de unitSp comparate).
Matricea similitudinilor minime intra $i intergrupale
i n m rv V VI vn
I (0,79) -0,77 -0 3 -0 3 -0 3 0,06 -0 3 1
n -0,77 (0.34) -0,76 -0,87 -0,14 -0,69 -0,39
in -0 3 -0,76 ‘ (0,64) -0,16 -0 3 -0,16 ■-0,47
O
IV
1
V -0 3 -0,14 -0 3 -0 3 3 (0,68) -0 3 2 -0 3 5
VI 0,06 -0,69 -0,16 -0,47 -0 3 2 (0,66) -0,94
vn -0 3 -0 3 9 -0,47 -0 3 6 -0 3 5 -0,94 (0,21)
Gruparea cea mai omogenS este formats din ora§ele Arad ;i Timisoara. Cele mai
eterogene sint grupSrile IV §i VII.
In raporturile dintre grupe, dominante sint aspectele de neasemSnare (r < 0).
Singura exceppe este relapa dintre Arad-Timi§oara pe de o parte §i Cluj-Oradea-Satu
Mare, pe de altS parte.
Identificarea profilurilor specifice ale grupelor.
Modalitatea adoptatS cel mai frecverit pentru caracterizarea grupelor obpnute prin
analiza cluster este construirea profilului mediu al fiecSrei dintre grupe. Pentru
aceasta se calculeazS, in cadrul fiecSrei grupe, media pe indicatorii folosip la realizarea
clasificSril
Pomind de la datele din tabelul 5.5.9, se calculeazS mediile pe indicatori in cadrul
grupelor. RezultS profilurile medii din tabelul 5.5.10.
Grupa a U-a, spre exemplu, este caracterizatS in principal prin natalitate mare,
mortalitate generals de nivel redus, imigrare putemicS §i niveluri reduse ale nuppalitSpi
§i divorpalitSpL Un profil opus se ingregistreazS, spre exemplu, la grupa I-a, cu
natalitate redusS, mortalitate mare, nuppalitate §i divorpalitate intensS §i imigrare de
nivel redus.
O astfel de procedurS este indicatS in special in situapile in care grupele sint
constituite dintr-un numSr mare de membrii.
158
i in condipile in care acestea au un voium relativ redus, cred cd poate fi utild 9
procedura construirii unor profiluri dominante. Realizarea unui astfel de profil se face
prin reducpi succesive atit la niveiul membrilor grupei cit ;i al indicatorilor care le
caracterizeazd. In primul rind se elimind subgrupele sau unitdple marginale (caracte-
rizate astfel in funcpe de niveiul de acces in grupd al unitdpi). In tabelul 5.5.9,
unitdple marginale (plasate sub linia punctatd prin care se segmenteazd unele dintre
grupe) sint: Piteju, Constanta, Brdila §i Piatra Neamp
Tabel 5 5 .9
Profilul demografic al oragelor, pa grupa da simllitudlne
159
Tabel 5J.10
Profllul demografic mediu al grupelor de ora^e
TabHlul 5J.11
Profllul demografic dominant al flec&rei grup&ri de ora^e
Indicatorii profilului
Gruparea
NAT M INF DIV NUP IM EM
1 Arad. Timijoara +* + +* +* -
m Brasov, Craiova - _i * + - -
V Sibiu, Re§i{a - - - - +*
acesta se exclude din setul indicilor specifici grupei. Emigrarea, spre exemplu, este
un indicator nespecific pentru grupa II, cu doud valori sub medie §i cu doud peste
medie. Pentru aceea§i grupd se exclud ca nespecifici indicatorii mortalitate infantild,
divorpalitate §i nivel mediu al profilului.
Dupd efectuarea acestor reducpi, profilurile sau pattemurile dominante pentru
fiecare grupare au configurape din tabelul 5.5.11. in acela§i tabel sint marcap indi
catorii care au un grad maxim de specificitate pentru o anume grupare. Marcarea
respectivd a fost fdcutd pomind de la premisa cd un indicator este cu atit mai specific
pentru o grupare cu cit valorile sale la nivelul acesteia sint mai dbpdrtate fa{d de medie.
Convenponal am considerat cd respectiva condipe de extrem pozitiv (abated mari
peste medie) sau extrem negativ (abateri mari sub medie) este indeplinita in cazurile
in care valoarea normalizata este mai mare de 1 sau mai mica de -1. (Altfel spus, daca
valoarea medie a indicatorului pentru grupa respectiva se abate cu mai mult de o
abatere standard de la media generaia a acelui indicator).
Natalitatea in. grupa II este mai mare decit media, pentru toate cele 4 ora§e
nemarginale care o compun. Media valorilor ei normalizate fiind de 1,44, deci mai
mare decit 1, o putem considera ca indicator cu inalt grad de specificitate pentru
grupa respectiva. Aceea§i este situapa cu mortalitatea generaia, nuppalitatea §i
imigrarea in cadrul grupei n.
Grupele cu grad maxim de structurare a profilelor sint cele in care se inregis-
treaza cel mai mare numar de valori medii cu specificicate ridicata, marcate in tabelul
S.S.11 prin In exemplul ales, aceasta situape o au grupele I, II §i IV.
In seria ora§elor mari din (ara noastra existau, deci, la mijlocul anilor ’80, trei
tipuri demografice dominante:
A. Ora$e cu natalitate mare, mortalitate mica, imigrare intensa §i, surprinzator,
nuppalitate redusa. Din perspectiva cauzelor care genereaza pattem-ul
demografic respectiv, se poate vorbi de ora$e cu atracpe migratorie putemicd,
§i populape predominant tinara. Bacdu, Boto§ani §i Baia-Mare erau
reprezentative pentru acest tip demografic;
B. Ora§e cu natalitate redusd, mortalitate mare §i nivel ridicat al divorpalitapi
§i nuppalitapi. imbatrinirea structurii pe virste §i modele culturale specifice
sint principals factori care genereaza comportamentele demografice
menponate. Arad $i Timisoara sint ora§ele reprezentative pentru acest tip
demografic;
C. Ora§e cu circulape migratoarie redusa §i mi§care matrimoniaia intensa, cu
divorpalitate ridicata in special. Acesta este cazul ora§elor Galap, Ia§i,
Ploie§P §i Tg. Mure§.
in afara grupelor I, II §i IV care au o maxima integrate in unui dintre cele trei
tipuri demografice exista grupele relativ marginale. Profilul dominant al acestora din
urma este apropiat de unui din cele tipice sau izolat in raport cu acestea. Gruparea
a Vl-a are o apropiere maxima fata de tipul Arad-Timi§.
in ansamblu, cele 21 de ora§e pot fi ordonate in baza urmatoarelor axe de similitudini
§i opozipi: a) ora§e cu populape relaPv imbatrinita (grupele I §i VI) opuse ca profil
celor (b) cu populape tinara (grupa II); c) ora§e cu mortalitate infanti 15 scazuta §i
emigrare putemica (grupa a-V-a) cu profil opus ora§elor d) cu emigrare redusa (grupa
a-IV-a); e) ora§e cu specificitate demografica pronunjata (grupele III §i VII plus
ora§ele marginale din celelate grupe).
161
■Efectul metodei de grupare
DacS in locul legSturilor complete vom folosi pe cele medii, vom obfine o cla
sificare $i mai economics (fig. 5.5.4). Se vor obpne deci grupe mai pupne, dar mai
eterogene. Similar, adoptarea clasificSrii pe baza metodei celui mai apropiat vecin
(cluster cu o singurS legSturS) va duce la o ?i mai mate economie insojitS insS de o
§i mai mare eterogenitate a ciaseior.
Configura(ia grupSrii demografice a ora§elor in funcpe de cele trei metode este
prezentatS in fig 5.5.5.
RTwl
Etlol
J--0.A5
j-o,«
-0.30
0.25
-0.20
-0.15
-0.10
0,05
0,00
005
0,10
0,15
0,20
0,25
0,30
0;3S
0,40
0,45
0,50
0,55
0,(0
0,65
0,70
0,75
0.80
0,85
0,90
0,95
100
r§ » I l s »
r Z ■s . i r
* (2 ,2 & A
Fig. 55.4. Dendrograma profilelor demografice ale ora$elor mari. Cluster cu legSturi medii
162
’ Stoparea procesului de grupare s-a realizat to toate celetreicazuri in punctek
in care a apSrut {nimul decalaj considerabil in seria indicilor de acces in grupa.
Ora$ele care erau impreunS in clasificarea cu leg&tun complete se menpn k
aceea§i grupare $i in clasificSrile cu legftturi medii §i unite In trecerea de la prima
spre ultima clasificare se realizeazS grupari tot mai largi..
Judecind in fucpe de criterii de valabilitate extern*, clasificaneacu legaturi medii
pare sa fie cea mai adecvata. Specificitatea ei este cSregrupeazgtrei dintre clasele
generate prin legaturi complete, Bacdu-Baia Mare, Boto$ani-BuzSu $i Piatra Neam{ in
aceea§i clasS, Trei dintre ora§ele noii grupari sint din Moldova (Bacau, Botojani §i
Piatra Neamj, iar celelalte doud din zone culturale apropiate Moldovei).
Aceea§i tending agteptat* - de reducere a numarului de grupari prin trecere de
I9 legaturi complete la legaturi medii, §i, in final, la legaturi unice - se inregistreaza
§i in cazul in care se pome§te de la indiciidistan{eloreuclidiene medii (vezi fig. 5.S.6).
Fig. 5.5.5
Grupari pe baza slm ilaiitd|il Intre profiluri derrtograflce extinse
AnalizS cluster cu legSturi -
Complete Medii Unice
Galap Galafi Galap
Ia?i Ia?i Ia?i
Ploie?ti Ploie?ti Ploie?ti
Tg. Mure? Tg. Mure? Tg. Mure?
Arad Arad Arad...
Timi?oara Timi?oara Timi?oara
Cluj Cluj Cluj
Oradea Oradea Oradea
Satu Mare Satu Mare Satu Mare
Craiova Craiova Craiova
Bra?ov Bra?ov Bra?ov
Re?i{a Re?i(a Re?ita
Sibiu Sibiu Sibiu
BacSu BacSu BacSu
Baia Mare Baia Mare Baia Mare
Boto?ani Boto?ani Boto?ani
Buz&u Buz&u Buz&u..
Piatra Neamt Piatra Neamt Piatra Neamt
Pitejd Pite?ti Pitefti
Constanta Constan{a Constan|a
BrSila BrSila BrSila .
163
• Similaritate versus distanfd
Compararea figurilor 5.5.5. §i 5.5.6 este relevant^ pentru efectul pe care il induce
tehnica de mSsurare a proximitSplor dintre perechile de unitSp pentru configurapa
grupSrilor.
SS considerSm, spre exemplu, raportul dintre analizele cluster cu legSturi complete
pomind de la cele douS tipuri de mSsurare a proximitSplor.
Clasificarea cu distance euclidiene genereazS numai 7 grupSri fa(S de cele 11
rezultate in cazul utilizSrii indicilor de similaritate (corelapi intre profiluri extinse).
Prima este, deci, mai economics decit cea de-a doua, indicii de economie coiespunzStori
fund de 0,67 ?i, respectiv, 0,48.
Trei dintre grupSri se menpn exact cu aceea§i components in ambele clasificSri:
Arad-Timi§, Resi{a-Sibiu §i Galafi-Iaji - Ploiesti-Tg. Mures. Acestea ne par a fi §i cele
mai „sigure“ grupSri, in sensul cS se manifests independent de efectul tehnicii de
mSsurare a proximitSpi binare (intre perechile de unitSp).
Care clasificare este mai bunS, cea bazatS pe distante sau cea care pleacS de la
similaritSp? O validare extemS nesistematicS, intuitivS suspne in mai mare mSsurS,
clasificarea pomind de la similaritatea profilelor extinse. in spatele fenomenelor
demografice stau, in esenjS, structuri culturale §i de virstS. Or, din aceastS perspectivS
este greu de inteles cel pupn una dintre gmpSrile pe care le genereazS analiza cluster
cu legSturi complete lucrind cu distan{e medii. Este vorba de cea constituitS din Brasov,
Craiova, BrSila, Constanta, Cluj, Oradea §i Satu Mare. O astfel de grupare pare sS fie
mai degrabS un artefact statistic favorizat de efectele de amalgamare asociate cu
utilizarea distantelor euclidiene. Reamintim cS folosirea acestora din urmS duce la
efecte de compensare intre acpunile celor trei componente ale profilului (formS, nivel
$i imprS§fiere). in schimb, folosirea corelapei intre profilele extinse permite evitatea
acestor efecte de compensare. Clasificarea se realizeazS in acest ultim caz in principal
in funcpe de forma profilelor, corectatS cu niveiul §i imprS§tierea lor.
Situarea ora§elor BrSila §i Oradea in aceea§i grupS, spre exemplu, nu poate fi
in(eleasS decit ca efect al tehnicii de mSsurare a proximitSplor. Din punct de vedere
cultural, cele douS ora§e sint, dupS cite §tim, aparpnStoare de zone diferite. Nu avem
informapi in legSturS cu structurarea pe virste in cele douS ora$e. Din compararea
indicilor de mortalitate, nuppalitate $i imigrare rezultS, insS, cS este foarte probabil ca
virsta medie sS fie mai micS la BrSila decit la Oradea.
Greu de inteles este §i modul in care apare in clasificarea pe baza distantelor
ora§ul Botojani. Indiferent de metoda de grupare utilizatS, acesta nu este atribuit nici
unci clase. Are o mare specificitate atunci cind analiza este intreprinsS in termeni de
distan(e euclidiene. in analizele care lucreazS cu similaritatea, Boto§aniul se incadreazS
firesc, in gmpSri dominante de ora§e ale Moldovei sau ale unor tone culturale inmdite
cu Moldova, in figura 5.5.5. este notat faptul cS profilul extins al ora§ului Botojani
se aseamSnS cel mai mult cu cel al ora§ului BuzSu. Ce anume determinS insS situarea
celor doud ora§e in grupe diferite atunci cind analiza se face ift termeni de distance
euclidiene? Rdspunsul poate fi citit cu u$urintd in tabelul 55.9. Forma profiluri lor
pentru cele doud ora§e este foarte apropiatd, Ceea ce diferd considerabil este iuvelul
$i imprd§tierea lor. Nivelul media este mai mare pentru profilui de la Botojani decit
pentru cel de la Buzdu (1,03 fajd de -0,48). De asemenea, variatia profilului este mai
mare in primul (2,69) fa{d de cel de-id doilea ora§ (0,74). Deci, de§i au o formd
apropiatd, profil urile celor doud ora§e difera considerabil sub aspectul niveiului $t al
imprd§tierii lor. Cum analiza ca distance nu privilegiaza efectui formei, se impune
efectui niveiuhai ji si imprdftiera.
Un aft ora? ca profil demografic foarte specific este Piteftiul. Aceastd specifi
citate este foarte putemicd indiferent dacd analiza opereazd cu similaritdp sau cu distance
(vezi fig.5.5.5 §i 5.5.6).
Ceea ce sugereazd toatd analiza comparativd pe care am intreprins-o este
recomandarea de a compare atit rezultatele obpnute cu metode diferite de grupare cit
§i in functie de tehnici diferite de mdsurare a proximitdtilor.
Grupdrile care se mentin dincolo de efectui metodei de grupare sau al tehnicii
de estimare a proximitdtilor, sint cele „tari“, cu credibilitate sporitd.
Fig. 5J.6.
Grupdri pe baza distantelor (demografice) medii euclidiene
Analizd cluster cu legdturi
complete medii unice
Bra§ov Bra?ov Bra?ov
Craiova Craiova Craiova
Briila BrSila Briila
Constanfa Constanta Constan(a
Cluj Cluj Cluj
Oradea Oradea Oradea
Satu Mare Satu Mare Satu Mare
165
5.6. STRUCTURI, TIPURI $1 ARII SOCIOCULTURALE RURALE:
CLUSTERE DE UNITATI §1 CLUSTERE DE INDICATORI
5 .6 .1 . P ro filu l c u ltu ra l a l u n e i z o n e r u r a le
• Cit de diversS este via|a cultural^ in mediul rural rom&nesc din spapul jSrii
noastie? ■
• in mSsura in care exists o astfel de diversitate, care sint principalele tipuri de
unitSp p arii teritoriale care dau conpnutul acestei diversitSp?
• §i, in fine, ce a generat diversitatea culturalS a statelor noastre gi prin ce poate
ea fi identificatS?
La aceste intrebSri se poate r&spunde etnologic, demografic gi sociologic, calitativ
sau cantitativ, analizind sate, comune sau jude|e, adoptind perspective sincronice
sau diacronice etc. Multitudinea perspectivelor posibile de abordare este evidentl
Importanja teoredcS gi practicS a intrebSrilor puse, de asemenea.
Un demers integrator care sS valorizeze toate prspectivele angajate intr-o astfel
de analizd rSmine un deziderat major in domeniu. In dmmul spre realizarea imaginii
de ansamblu asupra ariilor culturale rurale, ar putea fi utild §i o abordare „neortodoxg“
in care se pome§te de la urmStoarele premise:
- integralitatea specificului cultural al unor unitSp teritoriale rezultS mai degrabS
din invesdgarea condiponSrilor imediate ale comportamentelor culturale - §i a feno-
menelor socio-culturale rezultate prin agregarea acestor comportamente - decit din
analiza ..bucatS cu bucatS“ a comportamentelor culturale. Caracterul difuz $i multidi
mensional al fenomenelor culturale provoacS apelul la analiza specificului cultural
prin sursele sale.
- specificitatea culturalS a ariilor rurale rezultS, pe de o parte, din acpunea
factorilor care orienteazS comportamentele culturale spre unui dintre cei doi poli ai
axei „tradiponal-modem“ iar, pe de altS parte, din cei care indue orientSrii valorile
independente de aceastS polaritate.
Profilul cultural al unei zone este dat, deci, nu numai de pozipa acesteia pe
continuumul „tradiponal-modem“ ci §i de setul valorilor cu specificitate locals, care
nu se subsumeazS dimensiunii respective.
Exists cel pupn cinci tipuri de structuri „tari“ cu rol fundamental in condiponarea
intensitSpi de manifestare in profil teritorial a orientSrilor valorice tradiponale sau
modeme:
• demografice
. educaponale
• de ocupare $i salarizare a forjei de muncS
• de urbanizare
• de comunicare (prin mass-media, refea stradalS etc.)
166
i Raponalitatea in genere, ca adecvare a mijloacelor la scopuri §i, in particular,
promovarea acpunilor §tiinpfic fundamentate sint principalele criterii de recunoa§tere
a prezenfei modemitapi $i modemizSrii culturale. in plan atitudinai §icomportamen-
tal forme concrete de manifestare a modemit&pi culturale pot ft toleran{a religioasS,
laicizarea, adoptarea mijloacelor contraceptive, valorizarea $i contabilizarea timpului,
mobilitatea sociaia, investipi sporite in calitatea copilului, fertilitate redusa, empatie
sporitS etc.
Corespondenja ipoteticS dintre polii atitudinali §i comportamentali ..tradiponal-
modem“, pe de o parte, §i valorile unora dintre dimensiunile subsumate structurilor
menponate, poate fi reprezentatS astfel:
Favorizare a orientSrilor Dimensiuni ale structurilor Favorizare a orientSrilor
.TOADrpONALE locale MODERNE
167
Profilui cultural al unei zone rurale se determine insfl nu numai prin indicatorii
fenomenelor §i structurilor subsumabile opozipei tradiponal-modem. Indefinirea acestui
profil trebuie considerate §i informapile referitoare la structuri ecologice $i sociale care
favorizeazS orientari specifice, neinterpretabile in termeni de traditional sau modem,
in seria acestor structuri pot fi incluse:
Structuri ecologice: naturale: munte-deal-cimpie
constitute istoric: (to plan regiuni istorice
social }i cultural)
Structuri socio-demografice: grapuri etnice
Profilui cultural al zonelor rurale din (am noastril poate fi conturat deci pomind
de la indicatori ai structurilor $i fenomenelor menpdnate, relevante pentru orient&rile
valorice §i comportamentele cultprale ale populapei.
Vom realiza in continuare o clasificare a zonelor rurale ale Romdniei'din pers-
pectiva profilului lor sociocultiiral. Din sfera largS a indicatorilor pe care i-am con*
siderat ca relevanp pentru acest profil am selectat pe cei pentru care am avut date
disponibile la nivel de jude| - total comune. in mod relativ convenponal am considerat
c i totalitatea comunelor dintr-un judej constituie o arie sau zond socio-culturalft rural!
Criterii pentru clasificarea empiricd a ariilor socio-culturale rurale:
DIMENSIUNI INDICATORI
in agriculturi SC
tip de agriculturi pondere teren agricol in gospodSriil*
particulare GP
urbanizare pondere populape urbanS in jude
to 1985 U8
pondere populape urbani to jude
to 1966 U6
categoriamedjedemarimeaorajela
din jude{ OM
refea stradali pondere strizi modemizate STM
participare la rejel< numSr abonamente TV la 100(
de comunicart locuitori TV
extralocalS numir abonamente telefonice li '
1000 locuitori TEL
Structuri locale. relief dominant scor mediu al reliefului in comur
neinterpretabile in termeni (5-munte; 4-deal-jnunte; 3-deaJ
de tradiponal/modem 2-deal-cimpie; 1-cimpie) calcula
ca medie ponderati cu populapa REL
168
DIMENSIUNI INDICATORI
ntgkne islorici di Transilvania + Banat +
ioCS&ZXPC& Gnfana-Maramure; t TRANS
Moldova MOLD
Mnntenia + Oltenia + Dobrogea MUNT
Fenomene socio-demografice profil etnice pondere romani in 1977 ROM
interpretabilein tenneni de fenilitate rata total* a fertilitl(ii
traditional/modem mortalitate rau RHHtalititii infantile INF
divortialitate rata divorpaliti^i DIV
imigrare rata imigririi IM
indice imigrare din alte judefe
(migrant pe durata viepi in 1977) IMV
(Exceptind cazurile in care re face o alt& men(iune, indicatorii sint calcula(i pentru
anul 1985 sau 1986 la nivel de total comune din jude(. Surse de date: DCS, Recensamint
1977, Anuare statisdce, Anuanil demografic, 1974).
Valorile pe care le inregistreazS un jude| (total comune) pe top cei 20 de indicatori
menfionati deflnesc profilul socio-cultural empiric al acestuia.
Profilurile culturale latente care stau in spatele acestor profiluri empirice pot
rezulta in urma unor procese de interpretare a ciaseior de jude{e generate {Min analiza
cluster.
: Vom incerca sa ajungem la astfel de profiluri latente prin analiza rela|iilor dintre
indicatori prin deteradnarea ciaseior de jude|e cu maxima similaritate a profilelor
socio-culturak empirice ?i a profilurilor lor dominante sub aspect empiric.
Judefele care aparjin aceluia§i cluster ji sint invecinate constituie o arie
socio-culturald ruraUL
in fine, pentru ordonarea $i interpretarea datelor poate ft utila §i clasificarea
indicatorilor in termeni de structuri (stare) - fenomene (in sensul de clasS de
evenimente sau schimb&ri de acela§i tip) ;i volum-distribupe-localizare.
Intersectind cele doud dimensiuni, obpnem urmatoarea clasificare a indicatorilor
de analizd:
vohun/ intensitate distribute (compozijie) localizare
structuri sau stiri OM. TV, TEL VRS, SLR, SC, GP. U6, REL, TRANS,
U8, STM. ROM MOLD.MUNT
fenomene FERT, INF, DIV, IM,
IMV
169
5.6.2. Structuri socio-culturale rurale
Modul in care se grupeazS indicatorii inclu§i in analizS poate sugera ipoteze in
legSturS cu confinutul structurilor socio-culturale latente care ordoneazS universul cultural
al viejii rurale, in profil teritorial.
ConsiderSm ca punct de pomire matricea coeficienfilor de corelafie dintre cei 20
de indicatori menfionafi. Fiecare dintre ace§ti indicatori are un profil dat de valorile
pe care le inregistreazS pentru toate cele 40 de judefe. DouS profile de indicator sint
cu atit mai ..legate* cu cit coeficientul de corelafie corespunzStor lor are o valoare
absolute mai mare. Pe matricea coeficienfilor de' corelafie dintre indicatori poate fi
aplicat oricare dintre procedeele de analizS cluster cunoscute. in prealabil se realizeazS
o pozitivare a tuturor valorilor. Grupele de indicatori rezultate pot fi considerate ca
refele empirice cu grad, maxim de conectivitate, sau covariafie intre elementele care
le compun.
Ce semnificS aceste grupSri? Ce anume le genereazS? Pe de o parte ele sint
rezultat al infiuenfelor sau interinfluenfelor directe dintre perechi de variabile semni-
ficate de indicatorii pu§i in relafie. Urbanizarea judefului ;i imigrarea in comune, spre
exemplu, pot contribui la intinerirea populafiei rurale sau la reducerea ritmului de
imbStrinire al acesteia. De asemenea, atracfia migratorie a ora§elor a stimulat (in
special in cazul in care acestea au fost „inchise’) sporirea imigrSrii in comunele din
apropierea acestor ora§e.
In baza acestei relafii cauzale ne putem ajtepta, deci, ca indicatorii mSrime medie
a ora?elor din judef, populafie urbanS in judef, ratS de imigrare in comune §i pondere
persoane de peste 60 ani in populafia comunelor sS aparS in aceeafi grupare.
Pe de altS parte, gruparea indicatorilor in acela§i cluster poate fi $i rezultat al unor
relafii de semnificafie a acestora in raport cu aceea§i variabilS latentS. Intre mortali-
tatea infantilS §i numSrul de telefoane din comune, spre exemplu, nu poate fi stability
o relafie cauzalS directs. DacS statistic se inregistreazS o astfel de relafie §i este de sens
negativ, atunci ea poate fi interpretatS prin raportare la o variabiiS latentS, sau la o a
treia variabiiS, manifests, care mediazS legStura lor. La un nivel foarte mare de generalitate
se poate considera cS cei doi indicatori exprimS, in planuri diferite, aceea§i trSsSturS
latentS a modemizSrii comunitare. Cu cit aceasta este mai accentuatS, cu atit cultura
§i refeaua medicals vor fi mai evoluate §i, implicit, mortalitatea infantilS va fi mai
redusS. Similar, o modemizare sporitS se va exprima §i printr-o refea de telefoane
dezvoltatS. In temeiul acestui rafionament este de a§teptat ca indicatorii rata mortalit&lii
infantile §i numdrul de telefoane la 1000 locuitori sS aparS in aceea§i grupS.
Situarea unor indicatori in aceea§i grupS, in baza unui precedeu de analizS cluster
poate fi, deci, generatS fie de relafii cauzale directe, sau indirecte intre ace§tia, fie de
capacitatea lor de a semnifica o aceea§i variabiiS latentS, sau un set de variabile latente,
aflate in raporturi cauzale intre ele.
; inainte de a trece la gruparea propriu-zisa a indicatorilor, se impune o analiza a
matricei de corelafie dintre ace§tia, in vederea folosirii lor ulterioare pentru clasifi
carea judejelor. Aceasta clasificare va fi distorsionata daca pentru o anume dimensiune
am repnut un numSr de indicatori mai mare decit pentru altele. Ocupapa, urbanizarea
$i imigrarea sint dimensiunile masurate prin cite 2 sau 3 indicatori fa(a de situapa
generaia de numai un indicator pentru o dimensiune. !n situapile in care indicatorii
aceleia§i dimensiuni coreleaza foarte putemic intre ei, este indicata reducerea numarului
lor. Dacd ace$tia coreleaza moderat sau slab, rezulta ca desemneaza un conpnut mul
tidimensional, nu unui unidimensional cum s-a presupus inipal.
Distribupa ocupaponaia, spre exemplu, a fost masurata prin SLR - salariap la
1000 locuitori §i SC - raportul intre numarul de salariap p cel de cooperatori din
agricultural Corelapa coiespunzatoaie relapei dintre ei este de 0,69. Nefiind o corelape
foarte mare, rezulta ca distribupa ocupaponaia este multidimensionaia. in consecin(a
repnem ambii indicatori.
Intre totalul imigrarilor in comune in decursul anului 1986 ji imigrarea in comunele
judeptlui de la mare distanpl (calculat cu cifre de migranp pe durata viepi in 1977,
la recensamint) este o corelape de 0,82. Conform uzan(elor de practica statistica, o
astfel de corelape este la limita inferioara a unei corelapi foarte putemice. Repnem
totup ambii indicatori in analiza, dat fund faptul ca ei semnifica aspecte diferite de
imigrari, oricum foarte semnificative pentru aspectele culturale locale.
Urbanizarea este masurata prin trei indicatori: U6 - pondere populape urbana in
1966, pondere populape urbana in 1985 - U8 §i marimea medie a oragului din jude(
(sub aspectul numarului de populape) - OM.
Corelapile corespunzatoare lor sint:
U6 U8 OM
U6 x 0,93 0,70
U8 0,93 x 0,75
Evident, urbanizarea din 1966 coreleaza foarte putemic cu cea din 1985, relevind
o inerpe foarte mare in ierarhia urbanizarii judefelor. in acest caz, se impune, credem,
renun {area la unui dintre cei doi indicatori (U6 sau U8 ). Pentru a lua o decizie in acest
sens, acccptam ca premise ideea ca va trebui repnut acel indicator care este covariant
in mai mare mSsura cu indicatori de maxima relevanpl pentru comportamentele cul
turale locale. Aceasta condipe o indeplinesc mai ales indicatorii referitori la fertilitate
(FERT), mortalitate infantiia (INF) ;i divorpalitate (DIV). Corelapile in baza cSrora
se ia decizii de selectare a unuia dintre indicatori de urbanizare sint date mai jos:
FERT INF DIV
171
Urbanizarea „veche" din 1966 coreleazd mai putemic decit cea „noudu, din 1
cii indicatorii demografici. §i este ftresc s& fie a§a, pentru cd fenome
cultural-demografice ale fertilitdpi, mortalitdpi infantile 0 divorjialitdpi au
inerpe mai mare, suspnutd mai mult de istoria urbanizdrii decit de urbanizarea
moment.
tn urma acestei examindri, am renunjat, deci, la un singur indicator - U8 .
totalul celor 20. Toate dimensiunile incluse in analizd sint mdsurate prin tmu sau
indicatori. Din acest punct de vedere, tehnica de analizd nu va favoriza Decontrols!
anume dimensiune in raport cu celelalte. .»
Sd analizdm in continuare modul in care se grupeazd cei 19 indicatori in baza u
analize cluster cu legdturi complete prezentatd sintedc in tabelul 5.6.1.
Tabel 5.6.1.
Gruparea indicatorilor folosifi pentru deflnirea profilulul soclo-cultural al zonelor;
rurale (analizd cluster cu legdturi complete)
Denumirea/ Indice de
Cod
semnificapa major! Grupe ;i subgrupe de indicatori consistent
atribuit! grupei 0,16
Diferenpere jude[ din Transilvania, Banat sau (0,40)
regional-etnici Crijana-Maramure? TRANS
pondere romani ROM
abonamente telefon ____ ____ TEL_
mortalitate infantil! "INF ” ‘j m :
jude(e din Muntenia, Oltenia, Dobrogea MUNT
~W
n Migrape $i imigrare m comune IM (0,82)
urbanizare imigrare de la mare distant! IMV
ora; mediu ’OM—
urbanizare 1966 U6
virstnici__________________ VRS
0.19
m Diferenpere salariap SLR (0,69)
ocupaponal! salariati/cooperatori_____ s< L _
fertilitate ‘ fer t ‘ 'T O T
judet in Moldova_______ MOLD
divorpalitate "DIV W JV '
strSzi modemizate STM
0,48
w Diferenpere relief dominant REL
geografk! agricultur! necooperatist! GP
abonaaaeme TV TV . JO*
*) Consistent fiecSrei subgrupe este indicat! prin valoarea pus! intre paranteze. Indicii
corespunz!tori grupelor sint notap f!ri paranteze. Cu cit indicele are o valoare mai mare, cu atit
grupa sau subgrupa este mai consistent!, are indicatorii mai „legap‘*intre ei. Liniile punctate
demarci subgrupe de indicatori.
' I p o te z a c e a m a i g e n e r a l s d e g a ja tS d i n a c e a s tS a n a liz S e s te c S v i a |a s o c io - c u l tu r a lS
a a r iilo r r u r a le s e s tru c tu re a z S , in p rin c ip a l, to f u n c p e d e p a tru d im e n s iu n i: .
• a p a rte n e n (a re g io n a l-e tn ic S
• migrape p urbanizare <
• s tru c tu rS o c u p a p o n a l!
• zonS geogiaficS
Diferenperea regional-etnicS opune to principal zonele central-nord-vestice ale
(Srii, cu cele sudice. in planul fenomenelor demografice, opozipa cea mai putemicS
pe aceastS axS se inregistreazS in legSturS cu mortalitatea infantilS. Gruparea sudicS
lalomita, CSlSrap, Tulcea, BrSila p Constanta, spre exemplu, are o mortalitate infantilS
considerabil mai mare decit cea formats din Cara? Severin, Hunedoara, Alba, Mara-
mure? §i Bistript-NSsSud, situatS central-nord-vestic. Este suspnutS, de altfel, ipoteza
cS una din axele principale de diferenpere a viepi demografice rurale din (ara noastrS
era structuratS pe opozipa nord-sud (D. Sandu, 1989 a.).
Indicatorii fenomenelor demografice de maximS semnificape pentru diferenperea
cultural! rural! - fertilitate, mortalitate infantild §i divorjialitate - apar to cadrul
grupSrilor I §i III. Acestea sint grupSri care au o localizare regional! specific!
Mortalitatea infantilS se situeaz! to aceeap grupS cu indicatorul apartenent! la zona
central-nord-vesPc! Fertilitatea p divorpalitatea in schimb sint incadrate in aceea§i
grupS cu indicatorul MOLD - localizare a judepilui to Moldova.
Acest mod de plasare suspne ipoteza c ! fenomenele cultural-demografice rurale
(spre deosebire de cele urbane - vezi to acest D. Sandu, 1989 b.) au toe! o putemicS
diferenpere regional!
Migrapa, fenomen demografic a cSrui cauzalitate economic! pare s! fie mai putemicS
decit cea cultural! apare intr-un factor care nu include apartenen(e regionale, ci numai
urbanizarea. Este firesc, deci, s! presupunem c ! migrapa to rural are in teritoriu o
configurape concordant! to mai mare mSsur! cu diferenperea urban! decit cu cea
regional-istoric!
Absenpt oricSrui indicator al unui fenomen demografic din gruparea a IV-a trimite
la ipoteza cS diferenperea geografic! este o dimensiune cu important! redus! (fa(S de
cea regional-etnicS, urban! p ocupaponal!) to structurarea comportamentelor
cultural-demografice rurale. In alte planuri ale culturii rurale - folclor, spre exemplu
- aceastS ulpm! dimensiune poate fi foarte important!
De obicei, gruparea variabilelor se realizeazd cu tehnici de analizd factorials.
Aplicarea acesteia se face in baza ipotezei cd datele se grupeazd conform unui model
factorial: existd una sau mai multe variabile latente care determind varia(ia unor
indicatori specifici. Corelafiile dintre acegti indicatori sint explicate numai prin relatiile
lor cu variabilele latente fi nu prin influenfe cauzale directe intre variabile observa-
bile. 0 astfel de ipotezd poate fi susfinutd mai ales in psihologie unde atitudinile, spre
exemplu, au caracter latent, iar opiniile fi comportamentele derivd din astfel de
trdsdturi latente.
173
Covariafia opiniilor poate f i pusd pe seama subsumdrii lor la o aceeafi
atitudine. In astfel de caxuri, se poate presupune cd opiniile nu se interinfluenteazd
direct Intre ele.
in sociologie, in analizele de morfologie sociald in special, ipoteza modelului
factorial este greu de susfinut. Indicatorii cu care se lucreazd sint foarte diferip intre
ei. Covaria{ia lor se explicd atit prin raportare la variabilele latente, cit fi prin
inftuente cauzale directe intre variabilele manifeste pe care le desemneazd. ;
Acesta este motivul pentru Care, in sociologie, analizele cluster pot fi, frecvent,
mai indicate decit cele factoriale atunci cind se dorefie gruparea unor indicatori.
In cercetdrile exploratorii de generare a unor ipoteze, analizele cluster pot fi
deosebit de utile pentru cercetarea sociologies. D efi mai pupn elaborate din punct de
vedere matematic decit cele factoriale, analizele cluster sint mai conforme cu natura
datelor fi relapilor cu care se lucreazd de obicei in sociologie. Desigur, decizia de
aplicare a analizelor cluster sau factoriale se ia, de la caz la caz, in funcpe de datele
cu care se lucreazd fi de obiectivele cercetdrii.
in aplicalia referitoare la viapt socio-culturald rurald, datele sint foarte diferite
iar relapile dintre indicatori sint explicabile atit prin variabile latente cit fi prin
structuri cauzale in variabile manifeste. Acesta este motivul pentru care in gruparea
variabilelor am adopted analiza cluster fi nu pe cea factorials.
5 .6 .3 . G ru p S r i §i a r ii s o c io - c u ltu ra le r u r a le
DacS cei 19 indicatori selectap sint realmente semnificativi pentru viaja culturalS
a comunelor, atunci grupSrile de jude(e obpnute prin analiza cluster pe baza lor, ar
trebui sS fie relativ compacte sub aspect teritorial. Cu cit clasele §i subclasele de jude[e
sint alcStuite din judefe mai apropiate, cu atit ele vor ft mai naturale. §i aceasta
deoarece similaritSple culturale dintre acestea izvorSsc in special din procese de
comunicare culturalS intre vecini, pe durate mari de timp. Desigur, similaritSple
culturale se pot manifesta §i discontinuu, intre jude{e neinvecinate. In acest caz, ele
pot rezulta in special din asemSnSri asociate cu profilul etnic sau cu modelul de
urbanizare.
!n genere, grupSrile de jude|e vor fi cu atit mai ..naturale* cu cit vor putea ft
interpretate in mai mare mSsurS prin raportare la vecinstate, etnie, urbanizare sau zonS
geograficS. Aceste dimensiuni, esenpale pentru via{a culturalS pot acpona indepen
dent sau in interacpune.
In figura 5.6.1. sint prezentate douS variante de grupare a judefelor in funcpe de
similaritatea lor socio-culturalS. O clasificare este realizatS prin analiza cluster cu
legSturi complete iar o alta apelind la varianta cu legSturi medii a aceleia§i tehnici.
Se observS clar economicitatea sporitS a grupSrii prin legSturi medii fa{S de cea
cu legSturi complete, in primul caz, indicele de economie a clasificSrii este de 0,90
fa(S de 0,83 in cel de-al doilea. Prin schimbarea metodei se trece de la 4 la 7 clase.
174
' Analiza cu legdturi medii contope§te in aceea§i grupd mai multe clase rezultate
din clasificarea cu legdturi complete.
Pentru interpretarea sociologies prezintd un interes deosebit clasificarea pe baza
de legdturi complete. 1
• Gruparea cea mai compacts este formats din judefele Covasna, Harghita, Mure§
$i Sdlaj. Corelapa minimd intre toate perechile de judeje din aceastd grupd este de 0,34.
Toate sint judefe transilvdnene, cu pondere de populape maghiard in comune peste
media pe total jude(e. tn special in primele 3 - Covasna, Harghita §i Mure§, aceastd
poodere este sporitfi.
La data recensdmintului din 1977, ponderea populapei romdne§ti in comunele
jude(elor acestei grupe era:
%
Covasna 14
Harghita 10
Mure§ 54
Sdlaj 77
medie pe cele 40 de judete
analizate 87,2
Fig. 5.6.1. Gruparea Jude)elor (total comune) tn functie de profilui lor socio-cultural
(estimat prin 19 indicatori)
Ouster cu legdturi medii Cluster cu legdturi complete
Cara$-Severin 0,18 Cara$-Severin 0,01
Hunedoara Hunedoara
Alba Alba
Maramurej Maramurc$
Bistrita-Ndsdud (0.48) Bistrita-Ndsdud (031)
Gori Gori
Brajov 0,19 Brasov 0,04
Sibiu (0,78) Sibiu
Arad Arad
Ifflik - (0,68) Tunis. _J032)
Bihor Bihor
Cluj Quj
Satu Mare (037) Satu Mate (031)
Covasna Covasna 034
Harghita Harghita
Mure; Mure;
Sdlai (0.47> Sdlai
Dtmbovifa 0,09 Dunbovi(a 0,30
Vilcea Vilcea
Arge$ Arge$
Prahova (0,48) Prahova
Ialomi(a Ialomi(a , 038
Cdldrap Cdldrap
175
(continuare)
Cluster .cu legSturi medii
Tulcea Tulcea
Briila BrSila
Constanta (0,41) Constanta
Giurgiu Giurgiu 0,30
Teleorman Teleorman
O il Olt
Mehedinp Mehedinp
Poll J0.49) Doli
Neam( 0,27 Neam( 0,01
Vrancea Vrancea
Botojani Boto^ani
Vaslui Vaslui
>
Bacdu Bacdu
Gala[i Galap
lap la? (0,37)
Suceava __ (0,59) Suceava
Buzdu Buz&u (0,43)
176
itinuare) este mai eterogena, avind numai douS perechi de judeje invecinate, Bra§ovul cu Sibiui
$i Timi§ul cu Arad. Toate cele 7 jude}e din aceasta grupa sint situate in zona
central-nord-vestica a {arii. Este probabil cd prezenja ora§elor mari, de lunga tradipe
industrial-urbana impune specified cultural al acestei grupe.
In acela§i spajiu central-nord-vestic se situeaza §i subgrupa Cara$-Severin,
0,30 Hunedoara, Alba, Maramure§ §i Bistri^ N3saud. Profilul ei cultural pare sa fie dominat
de prezenja ora§elor mijlocii §i mici. Gorjul graviteaza la mare distant in jurul acestei
subgrupe.
Ariile culturale rurale pot fi identificate la niveiul judetelor care aparpn aceleia§i
0,01 grupari la un nivel ridicat de consisten# (de peste 0,30) §i sint continue sub aspect
teritorial.
In harta din fig. 5.6.2. sint prezentate ariile socio-culturale (sau, pe scurt, cul
turale) ale tarii, rezultate din aplicarea acestui principiu.
Intregul teritoriu al #rii este divizat in 17 arii culturale. Dintre acestea, 7 sint
r) arii culturale ,punctuate" formate din cite un singur judep Saiaj, Alba, Gorj, Buzdu,
Suceava §i Constanta §i Bucure§ti. Restul este format din 10 arii culturale extinse
0 (interjudetene).
ten# ai
# au o
ini mai
ior sint
dere al
iritorial
:arpa(ii
lomane
i3iara§i,
bgrupe:
, Ia§i (o
ai mare
0,37).
llturaia,
iistan#
n urmd Fig. 5.5.2. Ariile socio-culturale ale Romaniei
177
__ J
Ariile culturale punctuale sint, majoritar, zone de contact intre regiuni istorice
diferite, sau de separare a unor grupuri etnice. Tipicd este suuapa Buzdului, in zona
Carpaplor de curburd, la intretdierea drumurilor dintre Muntenia, Moldova fi Transil-
vania. Similar, Gorjul poate fi considerat punct de contact intre Oltenia, Muntenia,
Transilvania fi Banat. Suceava este punct de contact intre Moldova fi Transilvania.
Specificitatea sa culturald derivd insd, in special, din apartenen{a la Bucovina de al
cdrai trap este tdiatd numai administrativ. Cultural fi istoric, judepil Suceava aparpne
majoritar acestei ultime provincii istorice.
Specificitatea Sdlajului rezidd in pozipa sa la zona de contact dintre Transilvania
fi Crifana-Maram uref. Dar nu numai. Important# pare sd fie fi ponderea populapei
romanefti (77% in 1977), mai mare decit in jude(ele invecinate: Satu Mare (61%),
Bihor (71%). Clujul fi Sdlajul pot fi considerate ca zond predominant romaneascd de
segmentare a unei „benzi cultural^etnice* formatd din Covasna, Harghita, Muref, Satu
Mare, Bihor.
La Alba, mai mult decit la Sdlaj, este evidentd specificitatea etnicd in context
teritorial. Fa(d de 90% populape romaneascd in comunele din Alba la majoritatea
vecinilor sdi se inregistrau (in 1977) ponderi corespunzdtoare mai mici: Sibiu - 76%,
Muref - 54%, Cluj - 80%, Bihor - 71% fi Arad - 79%. Numai Hunedoara avea o
situape similard, cu 99% populape romaneascd in comune.
In afara ariilor culturale punctuale, cu caracter de zone de contact sau segmentare
cultural-istoricd, pot fi distinse fi cele al cdror profil cultural este dat de pattem-ul de
urbanizare. Este cazul comunelor din Constant §i din jural orafului BucurefU. Nu
•numai comunele din aceste zone, ci zonele respective in intregime au un grad sporit
de specificitate. §i aceasta se datorefte altor factori decit plasarea lor in zone de contact
cultural interzonal.
Bucureftiul este capitala (drii. A fost suficient acest destin istoric de lungd duratd
pentru a-i asigura, un profil cultural specific lui fi comunelor care il inconjoard. La
un mod operaponal de analizd trebuie addugat cd oraful-capitald a fost cel mai putemic
centra de atracpe migratorie din jard pe lungd duratd. Or, aceastd circulape migratorie
sporitd a dus, inevitabil, la crearea unor tipare culturale specifice pentru populapa sa.
Similar, comunele din judepil Constanta au constituit pe lungd duratd o zond
privilegiatd de atracpe migratorie. Circulapa migratorie, pattem-ul de urbanizare fi
turismul par sd fie principals factori care au generat o situape culturald specified in
judepil Constanta.
Distribuirea judetelor in cadrul celor 17 arii socio-culturale are o mare inerpe
in timp. In plus, clasificarea respectivd cred cd este valabild nu numai din perspectiva
viepi socio-culturale rurale ci fi pentru localitdple de pe intreg teritoriul jude{ean.
Avind in vedere aceste premise, clasificarea prezentatd are nu numai o valoare de
exemplu metodologic ci fi una practic-aplicativd. Realizarea unor efantioane naponale
pentru cercetarea fenomenelor condiponate cultural poate porni de la ariile culturale
178
rnenponate. Acestea pot fi considerate ca straturi in procesul de realizare a unor
itonce ejantioane stratificate.
i zona Pentru aprofundarea analizelor culturale in profil tentorial poate fi utiia §i pre-
ransil- zentarea subgrupelor in cadrul ariilor cu mai mult de doud judeje (cifrele indicS niveiul
itenia, minim de acces in grupa sau subgrupa respective):
vania. Botosani 0,88 Giurgiu Q75
de al Vaslui Teleorman
arpne Olt
NeamJ 0,88
Vrancea Mehedinji
vania
ila(iei BacSu Dolj
51%), Galaji 0,83
cS de Iasi Covasna 0,69
Satu Harghita
lalomita 0,78 Mure§
>ntext catara?
itatea Tulcea
Dlmbovita 0,73
76%, BrSila VTIcea
v'ea o
Arge§ 0,68
Bihor Prahova
ntare Cluj
ul de
Nu Satu Mare
iporit
Validitatea clasificdrilor rnenponate nu se reduce numai la ariile rurale ci include
intact
§i ariile judejene.
Se poate considera ca profilul cultural latent al unui jude( poate fi estimat, in
esenfd, prin urmStoarele categorii de indicatori:
A. regiune istoricd de apartenenpi
B. formS de relief predominant in judej
C. pattem-ul de urbanizare al judepilui:
gradul de urbanizare
marime medie a ora§elor
D. compozipa populapei (separat pentru rural §i urban):
• virstd
• ocupape
lerpe • etnie
ctiva E. fenomene socio-demografice (separat pentru rural §i urban)
lean, • fertilitate
• mortalitate infantiia
e de
• divorpalitate ‘
male • migrape '
urale
179
F. retele de comunicare (separat pentru rural §i urban): •
• televizoare
• telefoane
• re(ea stradalS modemizatS
Indicatorii din categoriile D, E §i F calculap pentru mediul rural dau profilul
cultural specific al comunelor din judep Valorile lor pentru urban sint semnificative
pentru profilul cultural al ora§elor.
Indicatorii din categoriile A, B §i C semnificS profilul cultural de bazS al judetului.
in clasificarea pe care am realizat-o anterior am operat cu toate cele §ase categorii
de indicatori. Compozipa populapei, fenomenele socio-demografice §i refelele de
comunicare sint estimate numai pentru mediul rural. Ceea ce se obpne prin a<~est mod
de analizS este un profil cultural 9I judetului cu supraponderarea criteriilor rurale de
estimare a acestuia. 0 astfel de modalitate de abordare este jusdficatS in condipile in
care se urm3re§te obpnerea unor arii culturale care sS integreze pe cit posibil judeje
similare §i invecinate.
Includerea in analizS a indicatorilor urbani de tip D, E §i F ar duce la obpnerea
unor profiluri culturale „complete“ ale judeteior, in sensul cS ar fi luate in considerape
51 dimensiunile culturale generale §i cele specifice, rurale §i urbane. Nu s-ar mai ob{ine
in acest caz, insS, decit foarte pupne arii culturale constitute din jude(e invecinate.
Ora§ele §i urbanizarea sint elemente de favorizare a segmentSrii ariilor culturale. Gradul
inalt de standardizare a modului de via{S urban (dat de locuinle, Industrie, mass-media
etc.) genereazS 0 astfel de scgmentare tocmai pentru faptul cS logica modului de via{S
urban este structural diferitS de cea a modului de viapl rural.
Ipoteza generald pe care 0 susfin este cd specificul cultural al judelului este dat
in principal de conjuncfia dintre factorii istorici, geografici, cei asociafi cu urbani
zarea fi cu profilul cultural rural al acestuia. Ceea ce rdmine din cultura urband dupd
ce se exclude influen{a acestor factori este nespecific, comun in bund mdsurd tuturor
zonelor urbane.
Acesta este temeiul considerSrii clasificSrii pe care am prezentat-o ca semnifica-
tivS pentru zonele culturale interjudetene.
G t de stabilS este clasificarea culturalS a judeteior? G t de mult este afectatS de
variapi reduse in baza de date sau in metoda de clasificare? DacS unor variapi
metodologice minore le corespund schimbSri foarte mari in configurapa grupurilor,
rezultS cS am obpnut o clasificare instabilS cSreia nu trebuie sS-i acordSm un credit prea
mare, in situapa inversS, de variape redusS a rezultatelor analizei, configurapa obpnutS
poate fi consideratS ca stabilS.
in figura 5.6.3. sint prezentate alte douS variante de clasificare socio-culturalS a
judejelor. Una este realizatS folosind analiza cluster, cu legSturi complete pe setul
inilial.de 20 indicatori. DiferSde varianta prezentata prin aceea ca se introduc in analiza
§i valorile referitoare la urbanizarea prezenta (pondere populapa urbana In 1985) nu
numai la urbanizarea anterioarS (din 1966).
CealaM clasificare, inclusS in fig, 5.6.3. lucreaza cu acelagi set 'de 20 de indi
i profilul catori, dar cu varianta ANSCOR a analizei cluster. Particularitatea acestei metode este
nificative cS suprapondereaza importanja perechilor reciproce, permipnd formarea de grupe numai
in jurul acestor perechi (D. Sandu, 1990 b).
judepilui. Comparind figurile 5.6.1. §i 5.6.3., rezuM ca introducerea unui indicator in plus
categorii (grad de urbanizare in 1985) duce la cre§terea numanilui de grupari.
(elele de Indiferent de metoda cu care se lucreaza pe setul celor 20 de indicatori, configurapa
rest mod generaia din fig. 5.6.3. o urmeazd pe cea din 5.6.1., daca judecdm subgrupele ca unitap
rurale de de comparape.
idipile tn Primele trei grupe din fig. 5.6.3, coincid cu grupari sau subgrupari din fig. 5.6.1.
bil judeje Atrage atenpa pozipa judepilui Goij. !n fig. 5.6.3. apare in aceea^i grupare cu
Vilcea ;i Dimbovi(a iar in fig. 5.6.1., aiaturi de Caraf-Severin, Hunedoara, Alba,
obpnerea Maramure§ $i Bistrita-Nasaud. Aceasta fluctuape de pozipe in funcpe de metoda cu
isiderape care se lucreaza poate fi considerata ca expresie a situapei sale de zona intre diferite
lai obpne regiuni geografice, avind un grad ridicat de specificitate. Este suspnuta, deci, ipoteza
vecinate. jude(ului Gorj ca arie culturaia punctuaia, de contact.
e. Gradul Reunirea judejelor Bra§ov, Sibiu, Cara§-Severin ;i Hunedoara in aceea§i grupare,
ss-media in cadrul analizei cluster cu legaturi complete (fig. 5.6.3.), ne pare a fi un efect
i de viapl metodologic negativ. Supraponderarea importan(ei acordate urbanizarii prin includerea
indicatorului pondere populapei urbana in 1985, duce la formarea unei grupe etero-
i este dat gene cu judeje, situate discontinu in plan teritorial.
u. urbani- Varianta ANSCOR a analizei cluster genereaza, in acest exemplu, cel mai mare
and dupd num3r de grupari, corespunzator cu numarul mare de perechi reciproce. Configurapa
•d tuturor pe care o genereaza aceasta metoda este insS foarte apropiata de cea produsS prin
analiza cluster cu legaturi complete.
emnifica- Desigur, daca numarul de perechi reciproce ar fi fost redus, metoda ar fi dus la
un numdr scdzut de grupari.
fectata de Din acest experiment metodologic conchidem ca supraponderarea dimensiunii
>r variapi urbanizare (prin includerea celui de al 20-lea indicator) are ca efecte reducetea gradului
rupurilor, de compactitate teritoriaia a jude(elor din aceea$i grupa p reducerea economicitapi
xedit prea clasificarilor (0,73 pentru cluster-ul cu legaturi complete §i 0,65 pentru aplicarea
a obpnuta ANSCOR). In varianta cu legaturi complete din fig. 5.6.1., indicele de economie
este de 0,83).
ulturalS a Pare sa fie indicata, deci, excluderea indicelui grad de urbanizare in 1985, pentru
5 pe setul a nu suprapondera dimensiunea ..pattern de urbanizare** in cadrul analizei.
181
Tabel 5.6.2
Profilui arillor culturale
TnHir.atori*
Judc|e pe grupe ;i arii culturale. FERT INF DIV IM IMv OM U6 TV TEL STM REL GP VRS ROM SRL SC
GRUPAI
CS; HD _* 0 + - + + © - - 0 + © 0 0 + ©
AB - + — - — + + _ © + 0 + 0 +
MM, BN 0 - - 0 - 0 0 - 0 + © © - 0 0
GJ + - + + * © + © 0 + © ©
GRUPA n
BV.SB 0 + 0 + © © + © + + _ _
+ ©
AD, TM _ _
0 © © + + © + _ _
© _ + 0
BH.CJ.SM - + - - - © + - 0 + - - 0 -
g r u pa in
DB, VL, AG, PH -■ - © - - - 0 0 0 0 0 + + © -
GRUPA IV
NT, VR.BT, VS.BC, GL, IS © + _* _* 0 _ _* _* + 0 © _j r
BZ - - + - _ _ + + + _ - + + —
SV + _ + _ — - - - + - © - +
GRUPAV
IL. Cl, TL, BR + © + + 0 — © 0 _ * — * 0 + + +
CT + 0 0 © © + + + - + _ _ *
+ © ©
GRUPA VI
CV, HG, MS 0 + + + © 0 0 _* _ 0
SJ — - - - - - + + + + — + - _ —
GRUPA v n
G, TL, OT, D'J, MH - + - - - - + - - - - © + -
tn foarte pupne cazuri pot fi analizate toate elementele unei mulpmi pentru care
dorim sd formuldm concluzii valide. Examinarea exhaustivd se poate realiza numai cu
costuri foarte mari.
Recensdmintele naponale ale populapei, spre exemplu, sint astfel de examindri
exhaustive. Ele produc informapi utile asupra structurilor pe virste, sexe, stare civild,
naponalitate, categorie sociald etc. Datoritd costurilor pe care le implied, nu pot fi
184