Sunteți pe pagina 1din 68

UNIVERSITATEA BUCURE$TI

FACULTATEA DE SO C IO L O G IE , PSIH O LO G IE §1 PED A G O G IE

Conf. untv, dr. DUMITRU SANDU

s t a t is t ic a
I n st iin ie l e s o c i a l e
Probleme teoretice §i aplicafii
pentru invafamintul universitar

%f ■

B U C U RE $ T I
- 1992 -
STRUCTURA GENERALA A LUCRARII
Cum este conceput votumul §i cum poate fiutilizat
1.RELATV INTRE DOUA VARIABILE regresie simplS
CANT1TATIVE corclape
covariape
2. REGRESIE MULTIPlA -regresie parpalS nestandardizatS
• regresie parpalS standardizatS
• coefficient^ dc elasticitate
• determinate parjialS §i multiple
• corelape multiplS
• folosirea variabilelor fictive

3. RELAJ1I INTRE VARIABILE corelapa rangurilor


MASURATE NOMINAL coeficientul gama
SAU ORDINAL • coeficienpi lambda §i tau
• testul x 2pcntru asociere §i concordant

4. MODELE LOG-LINIARE • modele log-liniare nerestrictive


(analizd muKivarlatd cu variablle -modele log-liniare Testrictivc
calitative) - compararea modelelor log-liniare

5. CLASIRCARI EMPIRICE ■clasificare §i ordonare


MULTICRITERIALE (anallza - nivelul, variapa $i forma profilelor
Cluster) • mSsuri ale distanjei §i similaritSjii
• metode de grupare: cu o legSturS
cu legSturi medii
cu legSturi complete
centroidS
medians
------ — — -------- — — ---------— —--------- — ; 'Ward
6. E§ANT10NARERA • obiective §i principii
• selecfie: simplS aleatoare
sistematicS
stratificatS
a grupSrilor (cluster)
• reprezentativitate §i interval de incredere
___________ _______________ • mSrimea e jantionului _______ -
7. MODUL STATISTIC DE ■reducfionism statistic reducfionism in aplicarea statisticii
GlND»RElN?TllNTELE ■paradigme de selecfie, analizS f i sintezS in statistics
; SOCIALE__________ ______• constructivismul statistic in ftiinfele sociale
ANEXE - distribufia normals
- tabele statistice
niveiul 0.01. Rezultd deci cd interacpunea intre distan{a de desffyurare a migrapei p
sexul migranplor = este relativ slabd, fdrd infiuenfd considerabild asupra dislribuiiei
de frecvenfe din tabelul de rtferinfd.
in mod similar, se calculeazd $i alii coeficienp de determinatie parpald (vezi
label 4.4.2.) pornind de la testele de concordanfd din tabelul 4.4.1. Rezultd cd
interactiunile cele mai puternice in structurarea migrapei totale sint intre pet chile
formate de variabilele tipul de localitate, distanfd fi tipul de migra[ie. Acefii coeficienp
de determinate parpald nu explicd nici niveiul, nici variapa unei variabile depen-
dente, precum in analizade regresie. Ei pot fi interpretap mai degrabd ca mdsuri ale
variapei unui cimp de evenimente sub influenia interacpunii dintre anumite varia­
bile.
Pentru aplicdri ale modelelor log-iiniare, similare cu cele din modelele cu ecuapi
structurale poate fi consultat Goodman (1972).
T a b el 4.4 .2 .
Contribuiia efectelor de interacjlune de gradul dol la explicarea variapei
frecven$elor celulare

Efect de Determinapa parpali a efectului X* NumSr de grade de


interactiune cu distribujia defrecven{e libertate

LT 0,99 473,18* 2
LD 0,91 42,17* 2
LS 0,26 1,42 2
TD 0,77 13,81* 1
TS 0,09 0,40 1
DS 0,34 2,13 1

* - valori semnificative pentru p = 0,01.

5. RELAT1I DE ASEMANARE: CLASIFICARI EMPIRICE


UNI- §1 MULTICRITERIALE

5.1. OBIECTIVE

Atit practicienii cit §i cercetatorii i§i pun frecvent problema de a reduce


diversitatea lumilor cu care interacponeaza fie pentru a putea acpona asupra lor mai
u§or, cu costuri mai reduse, fie pentru a le injelege in liniile lor esenpale. Unealta
comund pentru implinirea acestui scop sint clasific2rile, ordonSrile elementelor pe
grupuri sau clase.
O clasificare este cu atit mai buna (din perspectiva sociologica, cel pupn) cu cit
{ine seama in mai mare mSsura de urmatoarele principii: a) clase reduse ca numar §i
b) clase concordante cu modul real de ordonare a elementelor. i

119

U |W v V ,1 Q M C v Ij
Primul este principiul economiei (sau „parcimoniei“) iar cel de-al doilea al
validitdfii. Arta clasific2rii constd in identificarea liniei de echilibru dintre aceste dou&
principii, adesea contradictorii.
Solupa de principiu in realizarea unui astfel de echilibru este selectarea §i aplicarea
acelei metode de clasificare capabile s& genereze clase cit mai naturale in raport cu
structure datelor la care se aplici. Mai mult decit hi oricare alt domeniu al statisticii,
in taxonomia (clasificarea) numerical, la diversitatea obiectului de analizd s-a r&spuns
cu diversitatea metodelor.
Inainte de a intre in „anatomia“ clasificdrilor, s& explicitSm cele douS principii
de baz3 ale clasificdrii.
O clasificare economics presupune nu numai un numSr redus de clase, ci §i
absenja sau reducerea la minimum a cazurilor de unit&p cu apartenentS multiple. (la
grupe entente). Suprapunerea ciaseior pnn unu din membrii lor creeazS obstacole
in calea reducerii diversitSpi urm&rite prin clasificare. Similar, din punct de vedere
prectic, unitSple cu apartenen# la mai multe grupe constituie cazuri marginale care
necesitS o tratare specifica. Acestea sint motive pentru care cerinja de eviu e a
suprapunerilor in clasificari poate fi subsumata principiului general al economic sau
reducerii maxime a diversMpi. Aceasta exigeh# de maximizare a diferenjelor
intergrupale fa# de cele intragrupale se subsumeazS principiului general al
economicitiipi clasifidsrii.
Acela§i principiu este urmarit ?i prin cerinfa de completitudine a clasificarii:
toate elementele mulpmii care sint supuse partipei trebuie sa fie circumscrise
unei clase.
Deci, in sens strict, o clasificare este cu atit mai economica, sau eficienta, cu cit
are un numar mai redus de clase §i cu cit sint respectate in mai mare m&suiS cerin)ele
de completitudine, nesuprapunere a ciaseior §i maximizare a varian(ei intre clase fa#
de cea din interiorul ciaseior.
Daca nu restringem clasificarea la simpla repartipe a unor unitap in anumite
clase, ci includem in sfera ei §i intregul proces de construire §i identificare a ciaseior,
atunci poate fi relevata §i o alta faJetS a principiului economicitapi. §i anume, econo-
micitatea indicatorilor folosip pentru recunoa§terea ciaseior. Cu cit este mai redus
numarul de indicatori in funcpe de care pot fi identificate elementele gruparilor rezultate
din clasificare, cu atit este mai adecvat atributul de economicitate pentru aceasta.
Vechea cerin# aristotelica de a uni in minte ceea ce este unit in realitate §i de
a separa ceea ce este separat ?i in aceasta din urmS este valabilS nu numai pentru
raponament ci $i pentru clasificare. Caracterul natural al clasificSrilor este asocial
tocmai cu respectarea acestei exigence. Asupra procedeelor de validare vom reveni.
DeocamdatS menponSm numai c& acestea pot fi de tip extern sdu intern, in primul tip
de validare se comparS clasificarea obpnutS in funcpe de un set de criterii cu
clasificare ale acelora§i unitdp, in funcpe de alte criterii. Validarea intemd se face,
in esenjd, prin compararea informapei de intrare cu cea de iejire din procesul de
clasificare.
In $tiin(ele sociale mai ales, clasificdrile empirice au funcpq predominant
exploredvd. Nu lipsesc, desigur, nici cele orientate spre confirmarea teoriilor. In acest
spapu, al confirmdrii teoriilor, lucreazd insd mult mai putemic modele de tipul
regresiei, analizei de covarian{d etc.

5.2. CLASIFICARE $1 ORDONARE

Restringem, in continuare, analiza la clasificdrile empirice, operate asupra unor


mulpmi reale de obiecte, folosind procedee standardizate. Acestea sint opuse clasificdrilor
teoretice care pot avea ca obiect nu numai aspecte reale ci §i posibile (Gh. Enescu,
1985: 44).
O mulpme datd de obiecte poate ft organizatd in funcpe de unul sau mai multe
criterii fie in retele, fie in clase. In sociologie, criteriile de organizare folosite cel mai
frecvent sint cele de comunicare. putere. rol, influentd. similitudine etc. Metodele
de ordonare sint cele care urmdresc in special, constituirea unor retele,evidenperea
structurii care organizeazd raporturile dintre obiecte. TipicS in acest sens este
analiza retelelor.
Metodele de clasificare realizeazS organizarea obiectelor pe clase sau submul(imi.
Dupd cum va rezulta din prezentarea lor, intre cele dou& tipuri de metode limitate nu
sint foarte precise. Ceea ce le distinge esenpal este orientarea metodelor de ordonare
spre identificarea structurilor iar a celor de clasificare spre delimitarea grani(elor, a
liniilor care segmenieazd o mulpme in submulpmi.
Ceea ce le une§te in bund m3sur& este faptul c&opereazd ordonarea sau clasificarea
in funcpe de un „spapu de atribute“ (proprietdp) (A. Barton, 1957).
Un set de criterii folosit pentru ordonarea sau clasificarea unor obiecte se trans-
forma in ..spapu de atribute“ prin intersectarea sau agregarea lor in vederea consbtuirii
unui cadru de referin(d destinat plasdrii obiectelor in retele sau clase.
Odatd introdusd nopunea de spafiu de propriet&ti, precizdm principalele tipuri de
operapi care pot fi implicate in realizarea unei clasificSri:
1. construirea spapului de proprietdp
• selectarea indicatorilor
• transformarea indicatorilor sub aspectul
- scalei de mlisurare; t
- agregSrii lor inainte de distribuirea obiectelor in clase;
- ponderdrii lor.
2 . mdsurarea distantelor sau similitudinilor dintre toate perechile de obiecte care
urmeazd sd fie clasificate prin raportare la spapul de atribute;

121
3. alncarea unitatilor la clase; to exemplul
4. validarea clasificarii: criterii prin
5. Hfttp.rminarea profilului specific al ciaseior. Punctul
Introducerea nopunilor §i procedeelor de baza asociate cu aceste operapi o vom nele demogi
realiza prin prezentarea to continuare a trei variante de analiza cluster cu legSturi grare). In fun
mcdii. cu legaturi complete §i cu o singurS legSturl ~ NAT
Analizele cluster stot metode de clasificare empirics multidimensional . M
Specified lor se definite prin opozipe cu cel at ciasmcaruor strict teoretice 51/sau INF
unidimensionale. In clasificSrile teoretice, accentul cade pe construcpa spapului de DIV
atribute. Repartipa obiectelor de clasificat to clasele acestui spapu, nu este obligatorie. NUP
In schimb, to analizele cluster, co n stru ct spapului de atribute §i distribupa obiectelor IM
to clasele sale sint asociate nemijlocit. In sfera largS a clasificSrilor empirice, analizele EM
cluster se disting prin caracterul lpr multidimensional. !n abordfirile unidimensionale MN
cantitative, grupSrile se fac to funcpe de niveiul variabilei - criteriu de clasificare. in
cele multidimensionale, esentialS este analiza to functie de „profilul‘* fiecSrei unitap, Pentru
dat de valorile pe care aceasta le ia simultan pe indicatorii de clasificare. Boto§ani. 0
Din punct de vedere istoric, metodele de clasificare de tip cluster au apSrut to data de vale
psihologie (Zubin, 1938, Tryon, 1931) §i antropologie (Driver §i Kroeber, 1932). Un
cimp privilegial al dezvoltSrii lor il va constitui biologia (Sorensen, 1948, Sneath,
1957, Sokal §i Sneath, 1963) unde apare sub numele de taxonomie sau clasificare
numeric^. Proliferarea metodelor de tip cluster in diferite arii de cercetare este
indisolubil legata de extindeiea calculului automatizat Trecerea de la clasifictoile teoretice
strict speculative, sau de la cele empirice foarte s&race, la clasifictoi multicriteriale
cu grad ridicat de standardizare s-a produs sub influenta nemijlocita a calculatoarelor
electronice (pentru o prezentare de ansamblu a analizei cluster, vezi K. Bailey, 1975).

5.3. DISTANJE §1 SIMILARITAp INTRE PROFILE


Coloan
Cum se grupeazi demografic oragele mari? rilor demogi
Exemplul 5.3.1. Cum se grupeazS din punct de vedere demografic orajele mari asemanari 0
ale Romaniei, la mijlocul anilor '80? Comportamentul demografic al populapilor lor §i Boto§ani
este omogen, in virtutea faptului c3 toate sint ora§e mari? Care este raportul intre Diferenperil
gruparea demograficS a ora§elor respective §i apartenenfa lor la diferite regiuni istorice, Cele dou3 c
structure lor sociaia sau calitatea fondului locativ? Carpap. Dil
Acestea sint intrebari la care clasificSri de tip cluster pot oferi rdspunsuri. Prin moldovene§
exemple succesive' vom desf&§ura atit introducerea nopunilor §i operapilor comportame
fundamentale ale analizei cluster cit §i elucidarea problemelor puse prin setul de cu dezvoltai
intrebari de la inceputul acestui subcapitol. de peste mi
Pentru a grupa ora$ele din punct de vedere demografic este necesar s3 cunoa§tem nuppalitate
profilul lor specific din acest punct de vedere. In general, prin profilul unui obiect (ora§ Diferei
pe fiecare c

122

1
In e^emplul nostru) se in(elege pozipa pe care acesta o ocupd simultan pe un sen de
criterii prin care se specified punctul de vedere de referinid.
Punctul de vedere sau domeniul de referinpl in clasificarea noastrd sint fenome-
ii o void nele demografice (natalitate, mortalitate, nuppalitate, divorpalitate, emjgrare ;i imi-
legdturi grare). In funcpe de datele disponibile vom folosi urmdtorii indicatori ai acestor fenomene:
NAT - rata natalitdtii (ndscup vii la 1000 locuitori);
nsionald. M -ra ta mnmlitdtii generale(decesela 1000 locuitori);
ce ;i/sau INF -ra ta mortalitflfii infantile (decese copii sub un an la 1000 ndscup vii);
(iului de DIV - rata divorfialitdtii (divorpiri la 1000 locuitori);
ligatorie. NUP - rata nuptialitdtii (cdsdtorii la 1000 locuitori);
biectelor IM - rata imigrdrii (sosiri in localitate la 1000 locuitori);
analizele EM - rataemigr&rii (plecdrii din localitate la 1000 locuitori);
msionale MN - rata migratiei nete (diferenja dintre sosiri ;i plecdri la 1000 locuitori).
ficare. in
Pentru inceput sd considerdm numai patru ora^: Arad, Urgu Mure;, Bacdu ;i
;i unitap.
Boto^mi. O primd aproximare a profilurilor demografice care le caracterizeazd este
data de valorile ratelor corespunzdtoare celor 8 indicatori ale;i:
apdrut in
932). Un Arad TJrgu Mure? BacJu Botofani
, Sneath,
lasificare NAT 11,55 14,00 19,22 24,30
M 11,71 8,32^ 5,45 5,36
stare este
INF 24,71 19,84 17,73 24,31
;teoretice DIV 3,44 2,84 2,71 2,27
criteriale NUP 9,89 8,89 8,04 6,48
atoarelor IM 8,47 8,99 20,98 32,25
y, 1975). EM 4,67 3,93 3,87 4,41
MN 3,80 5,06 17,11 27,83

Coloanele de valori corespunzdtoare fiecdrui ora; dau coordonatele profilu­


rilor demografice ale acestora. Exam inarea comparative a profilelor respective indicd
§ele mari asemdndri (similitudini) putemice intre Arad ;i Tirgu Mure;, pe de o parte, ;i Bacdu
ipilor lor ;i Boto;ani pe de altd parte. Primele doud sint clar deosebite de ultimele doud.
Diferenperile cele mai putemice se inregistreazd in legdturd cu natalitatea ;i migrapa.
rtul intre
Cele doud ora;e din Moldova au o natalitate mult mai mare decit cele de dincolo de
i istorice,
Carpap. Diferen(ele de structure pe virste - pondere mai mare de tineri in oracle
moldovene;ti fa{d de cele transilvdnene - ;i modele culturale explicd aceste situapi in
suri. Prin
iperapilor comportamenuil de reproducere al populapei. Sub aspectul migrapei, oracle moldovene;ti
setul de cu dezvoltare industriald de datd mai recentd au un indice de imigrare net superior celor
de peste munp. In mai micd mdsurd se impun diferenperile ;i asemdndrile legate de
unoa;tem nuppalitate ;i mortalitate.
Diferenjele sau „distan{ele“ intre oricare pereche de ora;e pot fi u;or calculate
>iect (ora;
pe fiecare criteriu. Astfel, fa{d de Boto;ani, din punct de vedere al natalitdpi, celelalte

123
trei ora§e se siiueazd la distanjele 24,30-19,22=5,08 pentru Bacdu, 10,03 pentru Tirgu
Mure§ §i 12,75 pentru Arad. Apropierea sau similitudinea maxima se inregsitreazd,
deci, intre Bacdu §i Botojani In schimb, similitudinea minima sau distanpi maxima este
inregistrata in raportul Arad-Boto§ani.
Cit de mari sint distance sau similitudinile globale, in funcpe de top indicatorii
intre cele patru ora§e.
Solupa cea mai simpia ar fi sd calcuiam suma distantelor pentru fiecare pereche
de ora$e, adunind valorile absolute ale diferenfelnr Tnregistrate nentni fiecar^ inHiratnr
Astfel distanpt dintre Arad §i Boto§ani ar fi egaia cu:
d = 124,30-11,551 + 15,36-11,711 + 124,31-24,711 + 12,27-3,441 + 16,48-9,891 +
+ 132,25 -8,471 + 14,41-4,671 + 127,83-3,801 = 12,75 + 6,35 + 0,4 + 1,17 + 3,41 +
23,78 + 0,26 + 24,03 =72,15
Folosind acelea§i procedee s-ar obpne urmatoarea matrice a distantelor dintre
cele patru ora§e:
Arad Tirgu Mure? BacSu Botosani
Arad - (R 8 5 ? 50,11 Cj 2 ,l§ >
Tg. Mure? 35,28 6722
Bacdu — 36,28

Distanta maxima ar fi, conform acestei proceduri de calcul, intre Arad $i Boto§ani
iar cea minima intre Arad §i Tg. Mure?.
Exista ins3 cel pupn doud motive sd nunem sub semnnl intrehdrii acest mod de
ralrnlarp. a distantelor. in primul rind, daca indicatorii ar ft exprimap in nnitdti de
mdsurd diferite, atunci adunarea diferen{elor respective ar ft fost fdrd sens. In al doilea
rind, cmar dacd itemii de clasificare ar fi exprimap in acelea§i unitap de mdsurd
(precum in cazul de fajd), atunci tot ar mai rdmine problema variapei lor diferite. Cu
cit un item are o variape mai mare (mdsuratd in abateri standard), cu atit el poate
infiuen(a mai mult pozipa diferitelor unitap in spapul de atribute folosit ca referinja
pentru clasificare.
Sd urmdrim valorile medii, abaterile standard si coeficientii de variatie (egali cu
raportul dintre abaterea standard §i medie inmulpt cu 100 ) pentru intreaga serie de 21
oraje. coeficient de
media abaterea standard variape %
NAT 15,36 3,03 19,7
M 7,88 1,60 20.3
INF 19,51 4,67 24,0
DIV 2,59 0,65 25.3
NUP 8,81 1,03 1L7
IM 13,78 6,35
EM 4,67 1,94
MN 9,18 6,21 rw

124 O '
C.v » —— • AOO
, Imigrarea (IM) ?i migrapa netS (MN) au cea mai putemicS variape. in baza
acestui fapt, conform principiului menponai, este de agteptat ca importanta lor in
clasificarea oraselor sS fie mult mai mare decit a celortalp mdicatori. Chiar din exempluT
de calcul referitor la distanpi dintre Arad $i Boto$ani este evident cS ceidoi indicatori
cu variape maxima au cea mai mare contribupe la suma totals a diferenjelor care
indicS distan(a demograficS dintre ora§ele respective.
Pentru a inlStura efectul unitSplor de mSsurS diferite §i al amplitudinilor diferite
de variape a indicatorilor, ace$tia se normalizeazS inainte de calcularea distantelor.
Prin normalizarea cu scorul Z, fiecare variabilS se transtorma astf&l iflCll SS SlbS'maHS'
zcto §i abaterea standard 1 (vezi 1.2.14). Pentru o citire §i mai intuitivS a datelor
adoptSm transformarea Hull a fiecSrei variabile:
x. - x
H * 50 + 14 — — 5.3.1

unde x - media seriei de date, a - abaterea standard iar x. - valoarea variabilei


x pentru unitatea i.
Valoarea standardizatS cu aceastS formula pentru niveiul natalitSpi la Botogani
este: 24,30-1536
H = 50+ 14- 3,03

Noua transformare a dus la o serie cu valoarea medie 50 §i abaterea standard 14.


Scorurile Hull pentru toate cele 8 variabile de clasificare sint prezentate in tabelul 5.3.1
Cu aceste valori normalizate reluSm calculul distanfelor demografice dintre cele
patru ora§e la care ne-am referit inipal. Rezultatul noilor calcule le prezentSm comparativ
cu cele inipale:

Distanfe intre profilele demografice, folosind valori:


Ora$ele comparate nenormalizare normalizate

Arad-Tg. Mure; 14,83 91


Tg. Mure^-BacSu 35,28 124
Bac5u-Boto§ani 36,28 127
Arad-Baciu 50,11 215
Tg. Mure$-Boto$ani 67,22 237
Arad-Boto^ni 72,15 296

in cele douS variante de calcul ierarhia se menpne aceea$i. DiferS insS conside-
rabil intervalul dintre indici. Astfel, in prima variants de calcul distan(a Tg. Mure$-BacSu
apare ca fund de 2,4 ori mai mare decit cea dintre Tg. Mure$-Arad. Acela§i raport,
in cea de-a doua variants de calcul este de numai 1,4. ‘

125
,100
Tabelul 5 3 .1 .
Indicatori! pentru clasificarea ora^elor marl (cu pasta 100 000 da locuitori) din
90-
punctul da vedara al fenomenelor demografica. Valorl normalizata cu scorul
Hull*). Date 1985
60

INDICATORI 10

mortali­ mortalita- divorti- i


Ora$ul natalitate tea miptialitatc imigrare emigrare migrape *0
tate infantili alitate
SO
1. Arad 32 83 66 68 64 38 50 38
2. Baciu 68 29 45 53 39 66 44 68 40-
3. Baia Mare 74 41 46 34 54 72 54 71
4. Bra$ov 36 40 *41 54 63 40 45 . 42 30-
5. Briila 42 58 43 48 33 39 39 42
6. Botogani 91 28 64 43 18 91 48 92
20-
7. Buziu 63 47 64 20 28 61 51 61
8. Re§i{a 46 50 43 39 42 54 75 46
10-
9. Cluj 42 65 35 40 58 50 40 53
10.Constan(a 40 49 56 25 50 42 ' 43 44
43 42 0-
11.Craiova 44 32 50 38 38 42
12. Timi$ 38 71 51 73 90 45 64 40
13.Galap 48 47 44 72 53 37 41 39 F ig . 5 J J
14. Ia$i 58 46 51 68 52 38 33 43 D in re p re z
15. Oradea 50 65 37 47 51 56 51 56
dar situate la i
16. Piatra
40 55
nrofilelor. NotlBj
Neam( 54 58 41 65 58 63
17. Roicjti 45 60 65 66 52 38 38 41
fiecdrui profil. I
18. Pitefd 44 27 86 54 52 41 43 43 lor sint identic
19. Satu Mare 55 61 52 46 58 57 52 57 perechi de pi
20. Sibiu 37 48 21 47 50 42 96 31 Nivelul un
21. Tg. Mure; 44 54 51 55 51 39 45 41 este egal cu (f
de-al doilea pr
Variatia. p
*) valoarea maximS posibilS 100; valoareaminimi posibilS 0; media seriei de date 50; abaterea dard, dispersia;
tandard 14. le au valorile d
Componente ale unui profit. Pentru a compara intre ele diferite profile este util de calcul, varu
&distingem intre forma, nivelul §i variatia sau impra§tierea lor (M. Lorr, 1983: 23-32).
S& consider&m doud cazuri ideale de ora§e A §i B ale cdror profile demografice
int caracterizate prin urmdtoarele seturi de valori (normalizate deja): Cel de-al <
Ora§ul A: 50 70 60 75 90 55 65 « Gradul de
Ora§ul B 5 25 15 30 45 10 20 estimat de obii

26
0

Fig. 53.1 Exemplu de profile paralele (cu forme identice) dar cu nivele diferite.
Din reprezentarea lor grafted (fig. 5.3.1) se observd clar cd acestea sunt paralele
dar situate la nivele diferite. Paralelismul respectiv este o caracteristicS a formei
Diofilelor. Notdm cu raneuri de la 1 (minimum! la 7 (maximum! valorile coresDunzdtoare

lor sint identice. Paralelismul este o formd extrema a „convergen(ei“ formei unor
perechi de profile.
Nivelul unui profit este dat de media scomrilor sale. Astfel, nivelul profilului A
este'egal cu (50 + 70 + 60 + 75 + 90 + 55 + 65) / 7 = 66,4. Comparativ, cel
de-al doilea profit, B, are un nivel mediu mult mai mic, de 21,4.
Variatia. profilului poate fi estimate prin coeficientul de variape, abaterea stan­
dard, dispersia sau, cel mai simplu, prin radicalul din suma pStratelor abaterilor pe care
le au valorile de nrofjl fap< df» n iv p .ln l W p ttin a rW p g p n n T g tn r a rp c ro i u ltim o v a ria n t*
de calcul, variatia profilului A este egald cu:

V(50 - 66 ,4)2 + (70 - 6 6 ,4)2 + ... + (65 - 6 6 ,4)2 = 32,9


Cel de-al doilea profil, B, are, in condipi de paralelism perfect, aceea§i variape.
Gradul de convergent sau divergent dintre formele unei perechi de profile este
esfimat de obicei prin coeficientul de corelape. 1

127
Din accasti „disecare“ a profilelor rezulte ci, la un nivel mai analitic, gruparea
difcritelor entitep trebuie se precizeze clar, in funcpe de ce anume se reaiizeazS:
asemaniri de forme, de nivel, de imprS^tiere sau de combinajii ale acestora.
Revenind din lumea exemplelor ideale in cea a realitepi, ilustrem in graful din
figura 5.3.2. raportul dintre douS profile demogTafice convergente, cele ale ora$elor
Brajov §i Timijoara. Evident, forma profilelor tinde se fie aceea$i dar atit nivelurile
cit ji variapile lor sint considerabil diferenpate. In condipile unui relativ izomorfism,
niveiul pentru Timisoara (61,59) este mai mare decit pentru Brafov (45,6). Similar,
primul profit este mai ,jucat“ sau mai imprHstiat decit cel de-al doilea. Coeficienpi
de variape sint pentru profilul Timisoara 27% iar pentru Brasov 19%.

Fig. 5.3.2. Exemplu de profile demografice convergente, dar de nivel diferit

Mdsuri ale distan[ei gi similaritdfii


in exemplele anterioare, distanja dintre dou3 profile a fost determinate ca sum3
a diferen(elor absolute dintre acestea pentru fiecare variabile.
Dace sint i variabile, atunci distanpi dintre obiectele A si B este
d (A 3 ) = Z I A - B . I ^ 5.3.2
Aceasta este a$a-zisa distanfd modular i, denumite si Manhattan sau city-block.

128
O altS mdsurd frecvent utilizatd este distanta calculate ca radical din
suma pdtratelor diferen(clor, pe fiecare indicator pentru cazurile comparate:

, 5-3.3-
Raportul dintre profilurileunitdplor comparate p<5ate fi estimat nu numai in
termeni de distant ci §i de asemdnare sau similaritate. O mdsurd frecvent folositd in
acest sens este coeficientul de corelatie Bravais-Pearson. Senile de date puse in cprelape
sint cele corespunzdtoare profilelor comparate. Dacd la datele din tabelul 5i3.1.
corespunzdtoare ora§elor Arad §i Tg. Mure§ aplicdm formula cunoscutd a coeficientului
de corela(ie (Vezi capitolul 1 .2 .6 .), rezultd cd similaritatea demograficd dintre acestea
este de nivelu(r = 0,91^eam intind cd intervalul de variape al acestui coeficient este
intre -1 gi + l ^SBTspune cd similaritatea este cu atit mai accentuatd cu cit valoarea
coeficientului este mai apropiatd de j . Valorile anropiate de -1 indicd un raport de
opozitie (divergentd) sau de distantd maximd intre profilele comparate. Pentru doud
profile identice (intre care distanta este 0) r va avea valoarea 1. In schimbTdacd linnle
de profil variazd exact in sens invers gi cu aceeagi amplitudine, r va avea valoarea -L ,
Cum poate fi interpretat nivelul 0 al coreiatiei dintre protne'i In cazurile de acest tip,
vom spune cd profilele comparate au asemdndri ji deosebiri egale sub aspectul
frecventei si intensitdtii. Sau. orintr-o analoeie cu interoretarea reiauiior difltfe Vdfia-
bile, se poate Spune cd in astfel de cazuri profilele comparate au o variatie indepen-
dentd a semnifirapilnr
Mdsuri diferite ale proximitdtii (distanfd sau similaritate) au capacitdti diferite de
reflectare a raporturilor dintre anumite componente ale profilelor.
Coeficientii de corelatie mdsoard raportul dintre forma profilelor. Ei nu spun
nimic insd in legdturd cu raportul dintre nivelunle §i xmpra§uenle pfOfltSlor comparate.
in schimb, mdsuri ale distantei, precum distanta euclidiand sau cea modulard iau
in consideratie toate cele trei asoecte ale unui profil - nivel, formd si imprdstiere.
O pozipe mtermediard intre coeficienpi de corelatie $i mdsurile distantei o ocupd
coeficientii de congruentd.
Un astfel de coeficient estimeazd raportul dintre doud profile in funcpe de forma
si nivelurile lor, egalizind imprdstierile.
Calcularea coeficientului de congrientd (rc) se face cu o formuld derivatd din cea
a coreiatiei:

rc = JL*Z 5.3.4.
V Ex2 • Ey2
unde x §i y sint valorile profilelor comparate. (Se observd cd din valorile varia­
bilelor puse in relate nu se mai scade media, ca in cazul coeficienplor de corelape).
De§i foarte promitdtoare, §i aceastd formuld i§i are deficientele ei considerabile. Mdsurile
de similaritate pe care le genereazd suit foarte mult afectate de tipul de normalizare

129
CU)i
a variabilelor care ii precede aplicarea. in plus, dac& variabilele sint aormalizate pe fat
o scaia pozitiva (de tipul Scalei Hull), vatorile^oeficienplor de congruent, cu variape
hire 0 §i 1 tind s5 se aglomereze spre limita maxima a intervalului de variape. Din obit
acest motiv, raporturile de similitudm&dintre perechile de unitap comparate se diferenpaza atm
foarte pupn intre ele. can
Cele trei tipuri de m&suri mentionate pentru proximitate - distanta, corelape ?i indi
congruenja - nu sint numai orientate diferenpat, in raport cu componentele protilunlor con
pe care le estimeazl Fiecare dintre ele are §i avantaje §i dezavantaje specifice. MenponSm nest
in continuare citeva dintre acestca:
fC oeficientul de corelape^una dintre mSsurile cele mai utilizate in' analiza cluster, poz
este influenpit de modul in care sint scalate - direct sau invers - variabilele de profil. neg
O seal are este directs atunci cind valoarea de scald create proportional cu cregterea nifu
atributului mdsurat. Invers, scalarea este indirecta dacd valoarea de scald variazS irivers
proporponal cu intensitatea variabilei masurate. Schimbind modul de scalare al unei dist
variabile intf-o matrice de date de M unitap x P variabile, se modifica §i raporturile resj
de similaritate dintre cele M unitap daca masurarea se face cu ajutorul coeficienplor fort
de corelape. mas
0 modalitate (propusd de Cohen, 1969, apud M. Lon, 1983:35-36) pentru depdjirea aspi
acestei deficient lucreazd cu afa-ziselegzoruri ieflectatejScorurile reflectate ale unei dad
variabile sint calculate dupd formula - 2 m - x_~ r unde m - punct neutru al efet
scalei originate. Respectivul punct poate fi media seriei originare, sau un punct neutru dist
sub aspect psihologic (exemplu - valoarea 4 pe o scald de opinie de la 1 la 7). Prin lor,
acest procedeu, se realizeazd o dublare a variabilelor originare cu variabile reflectate. de i
Profilul fiecdrei unitdfi este determinat in funcfie de valorile de scald originare fi in i
reflectate.
Principala criticd adusd coeficienfilor de corelafie in analiza cluster se referd la
dif£
faptul cd acefiia sint calculafi pe baza unor medii ce rezultd din insumarea scorurilor mai
corespunzdtoare unei unitdfi pe variabilefoarte diferite ca naturd. Critica adusd corelafiei,
din acest punct de vedere, este, de fapt, o criticd la adresa mediilor calculate pentru pro!
fiecare profil. Desigur, normalizdrile (cu scorul Z, Hull sau de alt tip) atenueazd astfel
de deficienfe dar nu le inldturd definitiv.
fun
0 altd problemd pe care o pune coeficientul de corelafie este legatd de faptul cd
de
valoarea sa maximd, 1, poate semnifica o simold relatie de crestere monotond a valorilor
unui profil in raport cu cele ale altui profil.
ogo
Prezenfa unui punct neutru (valoarea zero) pe scala coeficienfilor de corelafie
in s
pune probleme de interpretare. Cu cit valoarea unui astfel de coeficient este mai
pup
aproape de zero pentru dotid profile, cu atit este mai mare incertitudinea asupra
rqportului de similitudine dintre acestea. Prin opozifie, apropierea de 1 sau -1 poate
ei (
fi consideratd ca sporire a gradului de certitudine asupra raportului dintre formele
mas
profilelor comparate. Cum in realitate existd frecvent situafii de incertitudine, clase

130
cu\granife difute, este normal, cred, sd operdm }i in planul cunoasterii cu mdsuri care
fac distinc{ie dintre clar-neclar, cert-incert, orientat-neorientat.
Dacd acceptdm cd indicatorii folosifi pentru definirea profilurilor unui set de ■
obiecte sint un esantion din totalul indicatorilor posibili pentru domeniul de referinid,
atunci se poate lucrq si cu no{iunea de prag de semnificape in interpretarea coeficienfilor
care estimeazd similaritatea dintre profilele a doud obiecte definite in funcjie de p
indicatori. Pe aceastd bazd poate f i ales pragul de semnficafie al coeficientului de
corelaiie ca linie de demarcate intre similitudinile semnificative (c u r t raitjJ si cele
nesemnificative (cu r < rjiUJ.
DacS pentru raportul dintre doufl profiluri se inregistreaza un coeficient de corelape
pozitiv, vom spune cd formele tor tind sS fie convergente. Dac&valoarea respectiva este
riegativl atunci re vom cnnsioera diveryente. Convergent sau divergent este sem-
nificativa to mflsura in cnrefatia ohservata depSseste pragul ei critic.
Masurile distan(ei ordoneazS raporturile de proximitate de la identitate, in cazul
distanfei zero, la different foarte mare pentru valori corespunzatoare ale indicelui
respectiv. Nu mai apar in acest caz distincpile dintre convergen|a~divergenia a
formelor, certitudine-incertitudine in raporturile dintre profile. La prima vedere,
masurile distan{ei sint mai bogate pentru ca includ informapi despre toate cele trei
aspects ale {»ofilului - nivel, forma §i imprS§tiere. Acesta poate fi in k $i un dezavantaj
daca avem in vedere faptul ca indicii de distanta cumuleaza indistinct toate cele trei
efecte. Nu se mai §tie, in finalul unei clasificdri realizatd pomind de la mdsuri ale
distan(elor ce anume a dus la gruparea obiectelor in aceea§i clasd - forma profilului
lor, niveiul profilelor sau impr&§tierea acestora. Efectele de compensate intre apropieri
de nivel §i diferenperi die forma a profilelor, spre exemplu, pot crea serioase probleme,
in interpretarea gruparilor realizate prin clasificare.
Distanta euclidiana fata de cea modulard (Manhattan) accentueazd importanpt _
diferentelorman intreroofile. Altfel spus, in prima variantd demasurare se pondereaza 10-
mai mult distan(ele mari decit cele mici.
Alegerea celei mai bune mdsuri in analizele clustre este departe de a fi o
problems elucidatd.
In principiu, se poate spune cd o astfel de alegere trebuie s3 fie fdcutS in
funcpe de scopurile sau ipotezele de cercetare pe de o parte $i de natura datelor pe
de altd parte.
Dacd se urmaregte gruparea obiectelor in functie de forma profilelor atunci este
oportuna folosirea coeficientilor de corelape. De asemenea, ace§tia sint indicap
in special in condipile in care mediile corespunzatoare seriilor de profile sint relativ
pupn diferenpate intre ele.
Dacd itemii pe baza cdrora se determind profilele sint relativ slab corelap intre
ei (sau corelap top in sens pozitiv) se recomandd, de asemenea, apelul la corelapi ca
mdsuri de similitudini (M. Lon, 1983 : 42).

131
Pentru realizarea clasificdrii In funcpe de forma si nivelul profilelor, coeficientii
de congruen(d shit cea mai indicatd mdsurd de similaritate.
Corelafiile sint de preferat distanfelor ca mdsurd a proximitdfii $i in situafiile in
care pentru apartenenta unui obiect la o anumitd clasd, mai importante sintraporturile
de mdrime dintre caracterisdcile obiectelor de clasificat decit nivelul respectivelor
caracteristici.
„S p re exemplu, dacd se grupeazd oase de animate, pot interesa nu
difeienfele reale ale mdrimii oaselorcit relapile intre dimensiunile lor,
$tiut fund cd chiar animate ale aceleiagi specii diferd ca mdrime".
(M NoruSis, 1985 : 179).
• - Dintre cele trei caracteristici ale unui profil, Jbrma este cea mai calitativd, fiind
practic ireductibild la o mdsurd de tip indice. Din acest motiv se poate adopts o clasificare
in trepte, favorizind diferenfele de profil. Astfel, intro primd etapd se realizeazd grupdrik
in funcpe de similaritatea profilelor. In secven|a urmdtoare se determind subgrupdri in
cadrul aceleia$i clase In funcpe de nivelul §i/sau imprd$tierea profilelor. (Solu(ii de
acest tip au fost propuse de Guertin, 1966 $i Skinner, 1978 - vezi M. Lorr, 1983; 43).
Nici aceastd clasificare „in trepte" nu este scudtd insd de deficienie. Siht cazuri
in care diferenjele de nivel au o semnifica(ie majord. Or, dacd doud unitd{i au
profiluri de forme asemdndtoare dar niveluri diferite, ele vor apdrea in cadrul aceleia$i
grupdri. Faptul cd ulterior pot fi departajate in subgrupe diferite nu este o solute
mulpimitoare. Problema generdrii unor grupdri artificiale pomind de la indici de
similitudine de tip corelatie se pune in special atunci cind se lucreazd cu profiluri
„scurte" formate dintr-un numdr redus de indicatori (sub 10-15). In astfel de cazuri,
corelapilereflectd numai asemdnarea formelor. Profile cu nivele §i imprd§tieri foarte
diferite pot apdrea to aceea$i grupd doar datoritd apropierii formelor lor. In schirnb, dacd
profilele sint Jungi", constitute in baza unui numdr mare de indicatori, atunci
coeficientii de corelatie transmit nu numai1informape in legdturS cu r^ortul dintre
formele profilelor ci, indirect, si asupra raporturilor dintre nivelele §i imprd§tierile
profilelor comparate. Doud profile lungi, cu forme asemdndtoare au, foarte probabil,
$i valori apropiate ale nivelelor §i imprd§tierilor lor. Numeroasele experimentdri pe care
le-am efectuat in acest sens cu calculatorul, suspn o astfel de ipotezd. Temeiul teoietic
al acestei ipoteze metodologice nu ne este incd foarte clar.
Pomind de la aceastd premisd, propun ca in cazurile in care se lucreazd cu profile
scurte, sd fie realizate clasificdri in care forma, nivelul §i imprd$tierea profilelor sd fie
luate in considerape simultan §i fdrd a admite efecte de „compensare“ intre acestea.
Este vorba de a udliza o mdsurd a proximitd(ii bazatd pe nopunea de profil desf3§urat
(dezagregat, extins). In formulele distantei, profilul este folosit fdrd a distinge intre
componentele sale (sd-1 numim, din acest motiv, profil agregatsau „infd§urat“). Indicii
de similitudine de tipul coeficientului de corelape lucreazd cu un profil abstract (simplu),

132
redus la forma.La setul de ranguri sau vakni normalizate, prin care se descrie forma
unor profile se poate adauga valoarea medie care reprezinta nivelul sau/§i abaterea ■
standard (sau coeficientul de variape) prin care se m&soar& impr£§tierea profilului
respectiv. Noul profil obpnut din forma, nivel §i impr&sPere este ceea cp am desemnat
prin nopunea de profil desfa$urat (extins).
Mai precis, operapile de constitute a sa sint urmatoarele: /
1. normalizarea celor p variabile de profil;
2 . calcularea mediei §i a abaterii standard corespunzatoare fiecarui profil ^pentru
cele n unitap de clasificat);
3. normalizarea seriilor de medii §i abateri standard;
4. normalizarea fiecarui profil inipal (infa§urat);
5. completarea fiecarui profil de p valori cu incS doua valori reprezentind media
p abaterea standard;
6 . renormalizarea celor p + 2 valori ale fiecarui profil desfa$urat;
7. calcularea coeficienplor de corelape dintre profilele desfa§urate.
Masurarea similaritaplor pe baza profilelor desfa$urate poarte fi considerata ca o
modalitate de corectare acorelapilor dintre forma profilelor inipale cu media §i abaterea
standard corespimzatoare lor. Este de presupus ca o astfel de corectare este cu atit mai
necesara cu cit numarul valorilor (indicatorilor) de profil este mai redus. in astfel de
cazuri exista un rise sporit de a considera ca fiind foarte apropiate doua unitap numai
In baza asemanarii de forma, indiferent de nivelurile lor. Atunci cind profilurile sint
Jungi*. construite in funcpe de un numar mare de indicatori, este mai pupn probabil
sa se observe o corelape inalta intre profilele Iot dac8 au $i medii de profil fo«te
diferite). :
Pentru ilustrarea modului in care tipul de masurare influen(eaza ierarhia simili- *
tudinilor, prezentam in tabelul 5.3.2. proximitatea demografica dintre Timi§oara §i
celelalte ora^e in difoite variante de masurare. Asemanarea demografka dintre Timi$oara
§i Arad este cea mai puternica in doua dintre cele cinci Ppuri de estimari. Indicele de
similaritate calculat pe baza profilelor desfa§urate diferenpaza cel mai putemiC intre
asemanarea Timi§oara-Arad, pe de o parte, §i Timijoara-Brajov, pe de alta parte. Nu
se poate spune care este cel mai bun indice de proximitate numai prin referire la acest
exemplu. Examinarea comparadva (in finalul capitolului) a clasificarilor realizate cu
aceea§i metoda pomind de la Ppuri diferite de esPmare a proximitaplor va permite
astfel de aprecieri. Deocamdata not3m numai ca este mai plauzibiia o asem2nare demografica
maxima a Timijoarei cu Aradul, ora§ apropiat, decit cu Bra§ovul.
Odata precizate, aspectele referitoare la modul de masurare a raporturilor dintre
profile se poate trece la analiza problemelor referitoare la selectarea indicatorilor in
funcpe de care se definesc profilele pentru clasificarile mulPcriteriale.

133
(Desigur, in aplicarea analizei cluster, ordinea este inverse - intii se aleg indica­
torii $i dup# aceea se m#soar# distan|ele sau similaritaple dintre profilele comparate).

5.4. SELECTAREA §1 REDUCEREA INDICATORILOR

Orice clasificare multicriterial# se realizeaz# in func(ie de un set de indicatori


(criterii) prin care se specified punctul de vedere al clasificSrii sau domeniul de similaritate.
In exemplul nostru, domeniul respectiv H constituie fenomenele demografice.
Acelea$i ora$e puteau fi comparate din diferite alte puncte de vedere - situapa fondului
locativ, structura lor social#, calitatea serviciilor sociale, starea de s#n#tate a populapei.
Schimbind domeniul de similaritate §i indicatorii de clasificare se modifies, evident,
$i modul de grupare a unitS(ilor.
Cerintele majnre in seieetarea indicatorilor de clasificare se refer# la:
a) comoletitudinea lor logic# in report cu domeniul de referint# $i '
hi reprezentarea HlforiteW Riihriimp.ppuni ale domeniului orintr-un num#r reiativ
egal de indicatori.
" Tabel 5.3 2.
Proxlmttatea demografic# dintre Tlmifoara fi ceielaite orafe mari In func}ie de
diferite variante de mdsurare a distaniel/similarit#iii
Indicatorii similarit&|ii Indicatori ai distanjei
corela(ii cu corela(ii cu
Qra$ul cu care este corelatii cu profile profile infS;urate euclidiene modul are
comparat profilul de la profile abstracte folosind scoruri
Timifoara desfa$urate (simple) reflectate
Arad 0,79 0,70 0,76 13,6 11.9
Brasov 0,37 0,86 0,37 19,1 16,0
Ploiejti 0,35 0,37 0,39 19,0 15,7
Tg. Mure; 0,33 0,67 0,37 19,0 15,0
Galap 0,29 0,49 0,33 19,6 15,9
Sibiu 0,23 0,31 0,23 26,0 22,0
Cluj 0,20 0,49 0,23 20,7 17,1
Oradea 0,15 0,19 0,23 20,1 17,3
Satu Mare 0,14 0,04 0,42 18,6 15,8
Ia$i 0,07 0,15 0,09 22,2 18,0
Pitejti -0,04 -0,10 -0,10 27,8 23,7
Craiova -0,05 027 -024 25,2 22,4
Re$i(a -0,11 -0,13 -0,11 24,4 19,8
Boto$ani -024 -096 -0,67 43,5 38,9
Baia Mare -028 -0,64 -027 29,0 26,2
Constan[a -021 -0,02 -023 26,3 20,0
BrSila -022 0,00 -029 26,0 19,7
Piatra Neamt -0,40 -0,70 -026 • 25,2 21,1
BacSu -027 -0,72 -0,64 30,5 27,2
BuzSu -0,67 -026 -0,78 342 29,2

134
, Nerespectarea priirsei cerinje inseamna omiterea unor indicatori semnsficaiivi
din analiza. Consecinfa unei astfel de omisuni este generarea unor grupuri artificiaie
in care se realizeaza o aglomerare de unitap excesivd sau neconforma cu grupSriie
naturale. .
Aceea§: este consecin^ p in cazui nerespect&rii ceiei de-a doua cerin(e. Dac3
pentru un suMomeniu este selectat un nuniSr mult mai mare de indicatori, atunci acei
subdomeniu va fi supraestimat ca im portant In consecintd, clasificarea va reflecta in
principal sobdomeniului respectiv.
Domeniul fenomenelor demografice este reflectat, relativ complet, prin setul celor
8 indicatori pe care i-am men(ionat in 5.3. (alte fenomene precum morbiditatea, spre
exemplu, sint mai pupn importante §i nu au un caracter demografic pur).
S3 vedem in ce masur& este respectatS. cerinfa egalei reprezentari a fiecarei dimensiuni
a domeniului Reamintim pentru aceasta dimen siuniie §i indicatorii corespunzatori lor:

DIMENSIUNI SUBDIMENSIUNI INDICATORI


fenomene asociate virstei natalitate - NAT
demografice mortalitate - M
vitale asociate calitdpi viepi mortalitate infantiia - INF
fenomene formarea familiei nuppaiitate - NTJP
ale familiei disolu(ia familiei divorfiaiitate - DIV
migrape atracfie migratorie imigrare - IM
respingere migratorie emigrare - EM
relape intre atracfie migrape neta - MN
§i respingere migratorie

Daca vom considera ca dimensiuni fenomenele demografice vitale, familia $i


migrapa, atunci, indicatorii ale$i sint relativ apropiap ca nuniSr. Pentru prima dirnen-
sitme 3, pentru a doua 2 §i pentru a treia 3. Aceste dimensiuni sint ins3 mult prea
generale. Cred ca este util sa considerSm ca dimensiune fiecare subdomeniu cu structura
cauzaia specifica. in acest sens, se pot considera ca dimensiuni natalitatea, mortalitatea,
mortaiitatea infantiia, nupfialitatea, divorpalitatea, imigrarea §i emigrarea. Fiecareia
dintre aceste dimensiuni ii corespunde cite un indicator. Migrapa neta este un indicator
derivat din imigrare §i emigrare.
in situapile In care imigrarea este mult mai intensa decit emigrarea, structura
cauzaia a migrapei nete este, dominant, cea a imigrSrii. Similar, daca emigrarea este
mult mai putemicd decit imigrarea, atunci explicarea migrapei nete se face precumpanitor
prin factorii imigrarii. Doar in situapile in care emigrarea §i imigrarea sint dc intensitap
relativ egaie se poate presupune ca migrapa neta are o structura cauzaia distincta.

135
in cazul ora§elor mari din exemplu, imigrarea (x“= 13,78) este net superioard
emigrarii (3T= 4,67). Migrapa neta este de a§teptat s&aibi, in consecinpi, aceea§i struc­
ture cauzaie cu imigrarea. Corelapa indicilor respectivi este, corespunzator acestei
a§tept2ri, foarte mare (r = 0.96).
Tabel 5.4.1.
Corelapi Intre indicatorii fenomenelor demografice din ora§ele mari, 1985

NAT M INF DIV NUP IM EM MN


N a T-------- 1,00 -0 3 6 0,l9 - 03d -0,61 0.87 -0,12 0,92
M -0.56 1,00 -0,14 0,27 0.55 -0,42 0,07 -0,45
INF 0,19 -0,14 1,00 0,11 -0,12 0,12 -0 3 3 031
DIV -0 3 0 0,27 0,11 1,00 032 -0,42 -0,13 -0,89
NUP -0.61 0,55 -.0,12 0,52 1,00 -0 3 2 0,08 -0 3 5
IM MI -0,42 0,12 -0,42 -0 3 2 1,00 0,17 v 0,96
EM -0,12 0,07 -0.33 -0,13 0,08 0,17 1,00 -0,10
MN 0,92 -0,45 0,21 -0,89 -0 3 5 0,96 0,10 1,00

Dacd in setul criteriilor de clasificare ar fi menpnuta §i migrapa neta (MN),


s-ar realiza o supraponderare a im portant imigrarii cu care migrapa neta este corelata
foarte putemic. In consecinpi, excludem acest ultim indicator din seria ceior iolosip
pentru clasificare.
in situapile in care numarul de indicatori disponibili pentru clasificare este mare,
§i informapa lor este redundanta, se poate proceda la o reducere a lor nu prin eliminare
ci prin regrupare pe dimensiuni. Rolul analizei dimensionale este tocmai acela de a
realiza o astfel de reducere.
Se pot regrupa in aceea§i dimensiune indicatorii care coreleaza putemic §i pozitiv
intre ei, pe de o parte, iar, pe de aM parte, se subsumeaza logic acelea§i dimensiuni.
Cel mai utUizat procedeu de reducere a num&rului de indicatori este analiza
factorial!
Calcularea scorurilor factoriale este modalitatea concretd de realizare a analizei
dimensionale cu ajutorul analizei factoriali^Scorul factoriaTyores^lkzdtor se obline
ca insumare a produselor dintre valorile standarSTzate ale variabilelor si saturapile
variabilelor respective in factorul de referintd. Pentru fiecare factor (j) se genereazd
v/a s tfe l un set de scc/fhlri factoriale (S.j), egal cu numdrul unitdplor de analizd:
S..= k5 , pk. • x^, unde S.. - scorul factorial al unitdpi i pentru factorul j, -
satura{ia variabilei k in factorul j ji - valoarea normalizatd a variabiiei k pentru
unitatea i iar v - numdrul de variabile inclose in analiza factoriald. Dacd se pleacd
C 1 ae la rezultatele metodei comoonentelor principale. atunci scorurile factoriale care se
obpn sint exacte. In funcpe de alte tipuri de anaiizd factoriald scorurile factoriale
calculate sint estimdri ale pozi{iei unitdplor de referintd, infuncpe de valoarea factorului.

136
Analiza clustefjs e desfdjoard in condnuare cu seriile de scorm i factoriale care
uiesc cele v variabile inijiale. Dacd factorii objinuji nu au » mterpretare foarte
rd, atunci nu este indicatd folosirea scorurilor factoriale.
Jn cazul in care se presupune cd variabilele care urmeazd sd fie reduse se sub-
eazd unei singure dimensiuni, poate f i folositd o modalitate simpld de calculare a
orurUor factoriale. (Este vorba de abaliza path cu variabile latknte - vezi Loehlin,
In cazul in care dorim reducerea a trei indicatori xr x2 f i x3 la o singuri
ensiune f i se cunosc corelaiiUe dintre acefiia, atunci se poateadopta o modalitate
calcul derivatd din analiza path.
Notdm cu a corelafia dintre dimensiunea latentd fi xt. cu b pe cea dintre x2 fi
dimensiune fi cu c pe cea corespunzdtoare relapei x3 - dimensiune. Corelapile dintre
cele trei variabile fu n d r1Jt ru fi r ^ , pdtratul coeficienplor cdutap va fi:
a * * (ru • b * = ( r 12 • r ^ , ; c 1 = ( r 13 • t j / t l2

intr-o clasificare multicriteriald a 17 fitri din punct de vedere al conditiilor de


locuire au fast folosip fi indicatorii rata generald a fertUitdpi (x,) consideratd ca invers
proporjionald cu nivelul de instrucpe fi calitatea viepi, mortalitatea infantili (x2) fi
gradul de urbanizare (x3). Top acefii indicatori pot f i considerafi ca semnificativi
pentru dezvoltarea social-urband a Idrii. Construirea unui singur indice care sd
incorporeze informajia celor trei indicatori a fo st realizatd in baza procedeului
anterior menponat. CorelaiiUe dintre indicatori la nivelul celor 17 [dri erau la nivelul
anului 1985:
V *2 *3
1.00 0.71 -057
1,00 -0.75
Notind cu a, b fi c corelapile dintre dimensiunea latentd a dezvoltdrii social-
urbane fi indicatorii xv x2 fi respectiv x3, conform formulei anterior menponate,
coeficienpi a2, b* fi c* au valorile:
#2= rn - fi3 _ (+0,71). (-0,57) _
0,540
-0,75

ru ’ r23 0,71 (-0,75)


b2= = 0,934
*13 = -0,57
13 *23 (-0 3 7 ) (-0,75)
= 0,602
*12
0,71
Coeficientul corespunzdtor lui x2, b2, are valoarea cea mai mare. Rezultd
deci, cd mortalitatea infantild este corelatd cu dezvoltarea socio-urband mai mult
decit urbanizarea fi fertilitatea. Prin extragerea rdddcinii pdtrate se obpn valorile:
a = Vo,540 = 0,735, b = Vo,934 = 0,966, c= Vo,602 = 0,776
Sensul acestor coeficienfi (denumifi „epistemici" de c&tre Costner) dintre varia-
bila latentd si indicatori este atribuit de cercetdtor, in conformitatecu cunostinfele pe cu ,scorul
anului 1984\
care le are despre domeniul de refierinfd, si respectind in plus si exigenfe derivate din
• (100 ’- 741
semnul coeficienfilor de corelafie. Grafic, relafiile intre dimensiune si indicatori poate
Cu cit
fi reprezentat ca in figura:
sociourb
respectiv f i j
DEZVOLTARE
SOCIAL-URBANA Cehoslovacil
(126), A t o r v l
(123), SUA\
D. Sandu,
Rezulti
sausimilarit
de proximit
p o tfn
adoptatH.
FERTILITATE MORTALITATE URBANIZARE folosite sintl
enfantelA rea fiecdrei I
clusterele <
unit&plor dij
jos in su s,:
r = 0,71 r = - 0,75 de sus in jc
cu fiecare
r = - 0,57 fiecare dint
Princip
In clasificS
in cele divil
Fig. 5.4.1. Relapii intre variabila latent^ „dezvoltare social-urbanS" $i indicatorii fertilitate,
mortalitate infantill §i grad de urbanizare (coeficienpi epistemici).

Pentru a verifica dacd semnele coeficienfilor epistemici au fast corect atribuite,


se face produsul algebric al semnelor corespunzdtoare arceior pentru perechi de astfel 5.5.1.
de coeficienfi si se compard cu semnul coeficientului de corelafie care unesle indi­ Algori
catorii de referinfd. Coeficienfii a si b avind semn negativ, produsul lor algebric este . Se_
de semn pozitiv. Corespunzator, este de asteptat ca si corelafia dintre fertilitate si mor-
toate perecl
talitatea infantild sd fie pozitivd. Corelafia observatd intre cei doi indicatori satisface metodei. M
cerinfa menfionatd. menpionate
Considerind a?, b2 si c2 drept coeficienfi de ponderare, reducerea celor trei • in m
indicatori la o singurd dimensiune a fost realizatd dupd formula: ■ Aces
DEZV. = 0540 ■ (100-xH) + 0,934 (100-x.J + 0,602 ■ x,., unde DEZV. - • Sere
indicele dezvoltdrii social-urbane pentru fara i x , x2i, x}i - valorile celor crei dintre noul
indicatori pentru aceeasi fard i. In prealabil, indicatorii respectivi fuseserd normaiizap urmS sint e

138
c u , scorul Hull (formula 53.1.). Spre exemplu pentru fara noastrd, la nivehd
anului 1984, indicele respectiv are valoarea DEZV ■ 0340 • (100 - 63) + 0$34 •
• (100 - 74) + 0.602 • 30 * 623.
Cu cit indicele are o valoare mai mare, cu atU este mai accentuafd dezvoltarea
sociourband a unitdfii teritoriale de referintd. In mod similar a fa st calculat indicele
respectiv §i pentru celelalte \&ri analizate: Austria (120), Belgia (118), Bulgaria (89),
Cehoslovacia (89), Danemarca (132), RD .G . (116), R.F.G. (134), Ungaria (79), Olanda
(126), Norvegia (106), Polonia (67), Suedia (127), Elvetia (116), Marea Britanie
(123), SUA (111), Jugoslavia (45). (Pentru detalii asupra acestui exemplu vezi
D .Sandu, 19 9 0 a).
Rezultat al operapilor succesive de selectare a indicatorilor §i mdsurare a distan(elor
sau similarityjilor dintre perechile de obiecte care urmeazd sd fie clasificate sint matricile
de proximitate (de distaste sau similaritdp ale obiectelor). Pomind de la aceste matrici
pot fi realizate diferite variants de clasificare empiricd In funcpe de metoda de grupare
adoptatd. Exists o Intreagd „pddure“ de astfel de metode. Dintre acestea, cele mai
folosite sint cele „aglomeratiye“. Particularitatea lor este cd pomesc de la considera-
rea fiecdrei unitdp ca grupare'sau duster. Ulterior,TiecarecicHt de grupare contope§te
clusterele din etapa anterioard. In final rezultd o singuid grupare ecfiivalentd cu totalul
unitdplor din populapa supusd analizei. Metodele de clasificare care pomesc astfel, de
jos In sus, se cheatnd cd smt aglomerative. Ele se opun celor divizive In care se pomejte
de sus In jos, de la considerarea setului inipal de unitdp drept cluster care se subdivide
cu fiecare ciclu de grupare pind cind se ajunge, eventual la clusters echivalente cu
fiecare dintre unitdple de analizd.
Principiile de operare ate celor doud categorii de metode sint, evident, opuse.
In clasificdrile aglomerative se cautd unitdple sau subgrupdrile cele mai asemdndtoare.
In cele divizive se urm5re§te identificarea celor mai diferite subgrupdri.

5.5. METODE DE GRUPARE AGLOMERATIVA

5.5.1. Caracteristici generate


Algoritmul principalelor metode aglomerative este acela§i.
• Se pomeste de la o matrice a proximitdplor (similaritdp sau distanfe) dintre
toate perechile de unitdp de clasificai. Aceasta iunlizeazd setul datelor de intrare ale
metodei. Mdsurile folosite pentru identificarea proximitdplor pot fi oricare dintre cele
menponate (sau altele asemdndtoare).
• In matricea proximitdplor se identified unitdple i $i j cele mai apropiate.
• Acestea sint atribuite aceluiasi cluster k. " '--- -----
• Se recalcuieazd matricea proximitdtilor pentru a determina distanjele/similaritdple
dintre noul cluster k si grupdrile anterioare. (Dupd primul ciclu de grupare, acestea din
urmd sint echivalente cu fiecare dintre unitdple din afara clusteralui k. Ulterior, dupd

139
aleq „ a lm
mai multe cicluri, gruperile anterioare pot ft formate eie insele din mai multe unitap,
a§a cum au rezultat din pa$ii precedent ai algoritmului). denumitft (d
• in noua matrice recalculate se caute din nou perechea de grupSri cu nearest neig
maxima similaritate. Gruperile corespunzHtoare acestei perechi sint contopite intr-o independent,
noua gnipare. singuri legth
Cicluri de grupare continue pine la un anumit prag de teiere sau de stopare a Distant
aglomerarilor. Existe mai multe reguli de stopare la care ne vom referi pe parcursul al „celui m
capitolului. dintre unitat
Se presupunem d din examinarea unei matrici de distance a rezultat perechea In exempiul
reciproce (i, j) pe care o denumim k. In subgruparea i existe n. unitap iar in j, n.. Pentru in care k ji
a recalcula matricea distantelor incluzind noua grupare k, trebuie mesurate distanpi este egali c
dintre oricare alte unitate h §i k, d^. Raporturile dintre gruperile implicate ir aceaste grupe. Acea
recalculare pot fi simbolizate ca in fig. 5.5.1. dace in analize sint implicate numai doua minime pe
caracteristici de grupare. ’ (jifcpie. Me\
variabila 2 ktate,iaincc
lor minime.
o pereche d
Noua i
are, in rapo
sau mai mic
cel mai pup
top vechii i
urme are ui
grupeidein
complete* 5
com|
accesti
decitjfar*<
compacte d
asemenare i
Fig. 5J.1. Relapa dintre trei grupSri constituite in funcpe de doui criterii de clasificare
decit d a d i
Metodele de clasificare aglomerative difera intre ele in funcpe de modul in care O meti
se determine distant dintre gruperile h §i k. medie a legi
Una dintre cele mai simple metode de analize cluster considere ce distanfa dintre este cunosc
o unitate candidat (h) si gruparea in care aceasta ar putea fi incluse (k) este date de Sorensen in
cea mai mice dintre distance care existe intre h §i oricare dintre membrii grupSrii de
Toate
incluziune. Rentru inceput se presupunem ce gruperile i. i sTh sint formate din numai
clustere pe I
cite o unitate $i ce i §i j formeazS perechea reciproce desemnate prin k. Dace d^ = 5
intragrupal
iar d^ = 3 atunci, conform regulii anterior menponate de d ^ = 3. Altfel spus, a fost
a le s „cel mai apropiat vecin" pentru a mdsura distanta dintre unitatea candidat fi
gruparea de incluziune. Datoritd acestei analogii spatiale, metoda respectiva a mai fost
denumitft (de cStre Lance $i Wiliams fin 1976) metoda celui mai apropiat vecin (the
nearest neighbor method). Ea a fost introdusd1a circuital ftiintific lb. 1957, in mod
independent, de cdtre Sneath fi McQuitty fi este cunoscutfi c&analizd cluster cu o
singurd legdturd (single linkage clustering). ' “
~ Distanta dintre doud clustere poate ft mdsurata fi pomind de la principiul opus
al ncelui mai depBrtat vecin*4 (furtherest-neighbor method): distanta cea mai mare
dintre unitatea h fi unitdtile gmpei It este cea care da masura diferenjei dintre h $i k.
!n exemphil de mai sus, conform acestui principiu d ^ = dy = 5. Pentru cazul general
In care k fi h sint compuse din mai multe unitdti, se considerd deci ca distanta d ^
este egali cu distanta maxima dintre perechile care reunesc elemente din cele doua
grupe. Aceastd metoda de grupare (propusdde Sokal fi Michener in 19S8) imfica limita
minima pe care o pot avea distantele dintre ncrechile de elemente sitn^nuam ne.
difgpte. Metoda lesdturilor complete, cum mai este denumita to literatura de specia-
litate, ia in cbhsideratie toate legaturile dintrecele doua gtupBriprin Spedficarea dimensiunii
lor minime. O „legaturB“ intergrupe nu este altceva decit masura proximitdpi dintre
o pereche de unitati ale cdrei elemente apartin cite uneia din gruparile comparate.
Noua unitate, admisd in cadrul unei grupdri in baza metodei legdturilor complete
are, in report cu toate unitdtile anterior admise in grupa respectiva, o distanta egaia
sau mai mica decit cea data de „cel mai indepartat vecin** (unitatea cu care se aseamana
cel mai putin). In gruparea cu o singura legaturanu este spccificatd distanta dintre
to{i vechii mcmhrii ai grupei si ultima imitate admisd, Se ftie numai ca aceasta din
urmd are un report de asemdnare maxima cu numai una dintre unitatile vechi ale
grupei de incluziune. Din acest punct de vedere trebuie injelese sintagmele de „legdturi
complete" fi„legdturd unicd‘‘ pentru cele doud metode. Analiza cluster cu legatigi
complete este. deci. mult mai rtstrictivg decit cea cu o singurd legatura. Corespunzator,
accesul intr-o grupare constituitd in functie de prima metoda este mult mai dificil -
decit <fac8 <te. aplicfl cea de-a doua metoda. Gruparile rezultate in nrimul caz sint mai
cnmpacte dectt tn cel de-al doilea. Altfel spus, omogenitatea sau gradul mediu de
asemdnare in interiorul grupelor este mai mare dacd se folosesc legdturile complete
decit dacd se utilizeazd metoda celui maiapropiat vecin.
O metodd intermediara intre cde doud calculeazd distanta dintre doua clustere ca.
medie a legdturilor sau distanfelor dintre elementele grupelor respective. Corespunzator
este cunoscutd sub numele de metoda a legdturilor medii dintre grupdri (propusd de
Sorensen in 1948). — —— —— —r - *
Toate cele trei metode menponate au in comun determinarea proximitdfii dintre
clustere pe baza distanfelor sau similaritdfilor intre grupe, ignorind complet proximitdfile
intragrupale. '

141
Alte metode la care ne vom referi mai tirziu (centroide sau bazate pe variant^)
iau in considerate §i proximitaple intragrupale. ! Alg(
in continuare vom detalia in primul rind algoritmii de realizare a clasificarilor, urmatoar
bazate pe leg&turi intergrupale (linkage methods) §i problemele pe care le pune 1. S
aplicarea ?i interpretarea lor. Dupfi aceea, pe scurt, vom menpona §i trei algoritmi proximity
in care, pentru calcularea distanfelor intergrupale, se iau in considerate §i distanfele maxima).
intragrupale. 2. S
Pentru a
5.5.2. Algoritmi de calcul dendogm
Clasificdri cu o singurd legdturd doua unit
Exemplul de calcul 5.5.1. Fiind dat un set de 8 unitap A, B, C, D, E, F, G, H „ramuri“,
caracterizate prin valori pe trei variabile 1, 2, 3 se pune problema clasificSrii acestor corespuni
unitap folosind metoda celui mai apropiat vecin. Op
v E §i F. G
Matrice cu date impale Matrice cu date normalizate cu scor z
vertical (
1 _2 _! 1 1_ _3_ 3. S(
dintre ori
A 3 2 1 A -0,68 -1,07 -0 ^ 8 lui X §i t
B 7 5 5 B 0,13 -0,50 -0,30 0,79 faja
C 4 10 5 C -0,48 0,45 -0,30
D 11 20 2 D 0,93 2,35 -0,81 rezulta ui
E 1 8 9 E -1,08 0,07 0,38
F 2 7 10 F -0,88 -0,12 0^5
G 6 3 2 G -0,08 -0,88 -0,81
H 17 6 20 H 2,13 -0,31 2,26
Pomind de la matricea cu date normalizate, se determina distanfele euclidiene
medii pentru fiecare pereche de elemente. Conform procedeului menponat in 5.3.,
distan|a dintre A §i B spre exemplu este:
AB = 0,68 - 0,13)2 + (- 1,07 + 0.50)2 + (- 0,98 + 0.30)2) /3 = 0,69
In mod similar se obpne matricea distanfelor dintre toate unitaple, considerate
cite doud:
Matricea distan{elor euclidiene medii 4. S
in noua n
A B C D E F G H
forma no
A 0,00 0,69 0,97 2,18 1,05 1,05 0,38 2,51 fig. 5.5.2
B 0,69 0,00 0,65 1,73 0,86 0,79 0,39 1,88 Dac
C 0,97 0,65 0,00 1,39 0,57 0,64 0,85 2,15 de grupai
D 2,18 1,73 1,39 0,00 1,88 1,93 1,95 2,44 In fi
E 1,05 0,86 0(51 1,88 0,00 0,19 1,05 2,15
F 1,05 0,64 meration
0,79 1,93 0,19 0,00 1,01 2,00
G 0,38 0,39 0,85 1,95 1,05 l,6l 0,00 2,20 prin: nun
H 2,51 1,88 2,15 2,44 2,15 2,00 2,20 0,00 la care s<
care se r
142

1
i Algoritmul de grupare a unitaplor pome§te de la aceasta matrice, operind in
urmatoarele secvenfe:
1. Se cautS in matricea distanjelor perechea reciproca de valoare minima. (Dac2
proximitaple ar fi fost masurate prin indici de similaritate se considera.cea cu valoare
maxima), in exemplu, aceasta este perechea EF pentru care d^, = 0,19;
2. Se atribuie aceleia§i grupari (EF) unitaple din perechea reciproca respectiva.
Pentru a reprezenta grafic procesul de grupari, in figura S.S.2.a se construie§te o
dendogramd, adicS un grafic de tip arbore. Nivelul la care se unesc doua clustere sau
doua unitap este marcat printr-o linie orizontaia care une§te liniile verticale, denumite
„ramuri“, corespunzatoare gruparilor unite. Ramurile care pomesc de la baza figurii
corespund situapei inipale, in care un cluster era echivalent cu o unitate.
O prima grupare este marcata deci la nivelul 0,19 unind ramurile pentru unitaple
E §i F. Gruparea nou formata este reprezentata, in condnuare, prin ramura care pleaca
vertical de la linia de nivel 0,19;
3. Se reface matricea distantelor cu (EF), considerata ca o singura unitate. Distanja
dintre orice cluster X §i (EF) este data de valoarea distantei minime dintre unitap ale
lui X §i ale lui (EF). Spre exemplu, unitatea B se afia la distanjele 0,86 fata de E §i
0,79 fata de F. Din regula menponata rezulta ca d g ^ = 0,79. Aplitiund acest principiu,
rezulta urmatoarea matrice a distantelor

A B G D (EF) G H

A 0 0,69 0,97 2,18 1,05 0.38 231


B 0,69 0 0,65 1,73 0,79 0,39 1,88
C 0,97 0,65 0 139 037 0,85 2,15
D 2,18 1,73 1,39 0 1,88 1,95 2,44
EF 1,05 0,79 037 1,88 0 1,01 2,00
G 0.38 0,39 0,85 1,95 1,01 0 2,20
H 231 1,88 2,15 2,44 2,00 2 30 0

4. Se reia procesul de grupare de la pasul 1 cdutind perechea reciproca maxima


in noua matrice. in cazul de fa(2 aceasta este corespunzatoare unitaplor A, G. Ele vor
forma nucleul unei grupe m i marcate corespanz2 tor la nivelul 0 3 8 in dendograma din
fig. 5.5.2.a.
Daca num2rul total al unitaplor de clasificat este egal cu n, atunci reluarea ciclurilor
de grupare de la pasul 1 se face de (n - 1) ori.
in final rezulta dendograma din fig. 5.5.2a. §i „lista ciclurilor de grupare" (aglo-
meration schedule), (vezi §i M. NoruSis, 1985:174). Orice secven{2 este caracterizata
prin: numarul de ordine, unita(ile pe care le grupeaza, nivelul distantei sau similaritapi
la care se produce contopirea unor grupuri diferite §i numarul secventei urmatoarc la
care se reia gruparea respectiva pentru a fi unit2 cu o alta.

143
Figv 5.5.2.C Ex
dendogrami pi
analizichu
legStun cot

E F C A 0 B M D E F C A 0 B H
O) b)

Fig. 5.5.2. Exemplu de dendogramS pentru doui tipuri de clasificSri multicriteriale (a - cu o


singurS leg&tur&; b - cu leg5turi medii).

Unitatea B, spre exemplu, se une§te cu (A,G) la niveiul 0,39, in decursul celui


de-al treilea ciclu. Noua grupare se va contopi cu o alta (E, F, Q in secven{a 5.
5. Obpnerea grup&rilor propriu-zise se realizeaz2 prin „tSierea“ dendogramei la
un anumit nivel. Nu exist# o regul# unanim admis#, in leg£tur& cu niveiul la care
s2 fie fScutii aceasta operape. Jocul liniilor orizontale de unire a diferitelor ramuri din
arbore poate sugera niveiul de tiiere. Zona in care liniile orizontale uicep s3 se distanjeze
considerabil intre ele este cea in care poate fi adecvatS „t2ierea“. in figura 5.5.2a. o
Figi 5.5.2.C Exemplu de
dendogrami pe bazi de 2,50
analizi cluster cu
legituri compete 2.40
2.30
2,20
2,10
2,00
1,90
1,80
1,70
1,60
1,50
1.40
1.30
1,20
1,10
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
D E F A G B H
145
TabelSJ.l.
Llsta Mcventelor da grupare a unitaplor din exemplul 5.5.1. foloslnd analiza
clustercu o singurS legaturS

Ciclude GrupUri contopite Nivel de contopire Ciclul urm&tor la care


grupare Prima grupare A doua grupare exprimat ca distanpt* reapare grupare

1 F 0,19 4
2 A G 038 3
3 AG B 039 5
'■■■■■4 EF ■ c ■
. 037 5
5' ■ AGB EFC 0,65 6
6 AGBEFC D 139 7
7 AGBEFCD H 1,88

* In cazurile in care se pamegte de la o matrice de similitudini, nivelul de contopiie poate fi


exprimat adtin termeni de distan(i cit $i de corelape, folosind transformarea Dij=2-2*Rij, unde R
- corelapa iar D - distanfa.

astfel de zonS pare sS fie cea situatS in jurul nivelului 0,60. DacS se adopts
segmentaiea arboreiui in punctul respectiv atunci rezultS douS gnipSri relativ compacte:
(A, G, B) $i (E, F, Q §i douS unitSp izolate D §i H, in afara oricSror grupari. Necu-
noscind nimic despre natura criteriilor in funcpe de care se face clasificarea, aceasta
pare sS fie tSierea cea mai potrivitS. Schimbarea liniei de tSiere a arboreiui duce la o
configurate diferitS a grupSrilor. DacS, spre exemplu, secponarea s-ar face la nivelul
1,40, atunci ar rezulta o singurS grupare, care cuprinde 7 unitap (de la D la B) $i o
unitate izolatS H.
Pentru stabilirea nivelului de secponare este utilS §i examinarea listei secvenjelor
de grupare (vezi tabel 5.5.1.). Secponarea este indicat sS se producS intre ciclurile
despSrpte printr-o „rupturS“ considerabilS (M. NoruSis, 1985:174) in seria coeficienplor
care exprimS nivelul de contopire a grupelor. Prima rupturS de acest gen apare intre
secven{ele 5 §i 6 . RezultS, deci, cS nivelul indicat pentru secponare este 0,66.
Obiectivele clasificSrii, natura criteriilor de clasificare precum §i informapile
disponibile in legSturS cu alte ClasificSri ale acelora§i unitSp pot infiuen(a hotSritor
alegerea nivelului de secponare a dendogramei.
Bin citirea dendogramei se poate spune, spre exemplu, cS unitatea C se aseamSnS
cu E sau F la nivelul 0,57. Nu §tim exact cu care dintre aceste unitSp inregistreazS
distanpt respectivS. Sigur este cS distanpt lui C fa(S de A, G sau B nu este mai micS
de 0,57 ci mai mare.
Comparind grupele (E, F, C) §i (A, G, B), din dendograma 5.5.2a. putem citi doar Si .J
cS o distanjS minimS dintre un membru al primei grupe §i urt membru al celei de-a
doua este de 0,65. Pot exista mai multe perechi de astfel de distan{e intergrupale.

146
Obligatoriu este sa existe, insa, una de aceasta valoare. Restul distantelor intergrupale
pot fi mai mare de 0,65.
Existft §i alte variante de analiza cluster, cu o singura legatura, diferita de cea
standard, pe care am prezentat-o anterior. ,
Principala deficient a analizelor cluster cu o singura legatura rezida in permisi-
vitatea lor sporita fa{3 de fenomenul de „iniantuire“. Proximitatea dintre grupari este
masurata numai prin o singura distanta, §i anume prin cei mai apropiati vecini. Dat fiind
faptul ca aceasta este o masura foarte slaba (care ignora raporturile de distanta dintre
perechile pe care le formeaza toate elementele grupelor comparate) pot rezulta cu
u§urinta, prin aglomerare, noi grupari foarte eterogene. Gradul de similitudine ridicata
dintre dou3 elemente situate in clase diferite nu asigura in nici un fel o similaritate
asemanatoare §i intre grupe in ansamblul lor.
Conform dendogramei din fig. 5.5.2(a), grupele E, F, C §i A, G, B au intre ele
o distanta de 0,65. Aceasta este insa numai valoarea corespunzatoare perechii BC.
Distanfa intre A §i E, spre exemplu, este mai mare, respectiv de 1,05.
Pentru a obpne grupe cit mai omogene se adopta solupa masurarii distantelor
dintre grupari luind in considerate toate distanfde intergrupale. Dupd cum am menponat
deja, analizele cluster cu legaturi medii §i complete lucreaza tocmai in acest sens.
Clasificdri cu legdturi medii
Sa consideram, in continuarea analizei anterioare, cazul grupelor E F G §i A G
B. Din matricea distantelor calculata cu ocazia prezentarii analizei cluster cu o singura
legatura extragem valorile corespunzatoare pentru cele doua grupe:
E F c
A 1,05 1,05 0,97
B 0,86 0,79 0,65
G 1,05 1,01 0,85
Proximitatea dintre grupele respective nu va mai fi estimata prin distan(a minima,
respectiv prin d ^ = 0,65. Se va lucra cu o masura mult mai „tare“, respectiv cu media
distantelor pentru toate perechile intergrupale:
d = (1,05 + 1,05 + 0,97 + 0,86 + 0,79 + 0,65 + 1,05 + 1,01 + 0,85) 79 = 0,92.
!n aceasta varianta de calcul grupele sint mai distantate, deci, decit lasa sa se
inteleaga masura folosita m analiza cluster cu o singura legatura.
in general in clasificarea cu legaturi medii intre grupari, o grupare „i“ va fi
contopitd cu o alta desemnatd prin , j “ dacd fi numai dacd distanta medie dintre „i“
fi , j “ este mai micd decit cea dintre „i" fi orice altd grupare „h".
Algoritmul de lucru are aceea§i structura ca ;i in cazul gruparii cu o singura
legatura.
Punctul de pomire il constituie o matrice de similitudini sau distan(e intre unitaple
supuse clasificarii. in matricea respectiva se determina perechea reciproca de valoare

147
minims (daeSmsfirteen< m to tifta n fe ) sontna& nS(dac*» p k a & d e l a o matrice
de similitudine). ,
UnitSple din aceea§i pereche reciprocS se afii&trfe acdets& gnrpSri, UrrneazS re-
calcularea distantelor dintre noua grupare §i celelalte grupSri (fit primal cichi acestea
sint identice cu cite o unitate). Matricea initials este inlocuitS cu cea care include
recalculSrile respective.
Aceasta din'urmS este secven(a diferitS fa[S de cea din algoritnfal grupSrii cu o
singurS legSturS. Diferenta provine din faptul cS distance dintre grupSri se determinS
ca distante medii §i nu minime (bazate pe o singurS legSturS).
Reluind datele din exemplul folosit §i la prezentarea clasificSrii cu o singurS
legSturS, se inregistreazS perechea reciprocS cu distanta minimS intre elemente - EF.
Distanfele medii dintre aceastS grupare §i restul elementelor de clasificat A, B,
C, D, 0 §i H ant 1,05, 0,83, 0,61, 1,91, 1,03, 2,08. Se reface in continuare matricea
distantelor, incluzind aceste valori pe coloana $i linia corespunzStoare grupSrii EF.
Ciclurile se reiau cu determinarea perechii reciproce de distantS minimS din noua
matrice $.a.m.d.
!n tabelul 5.5.2. este prezentat rezultatul aplicSrii analizei cluster cu tegSturi medn
la datele din exemplul de calcul. Dendograma corespunzStoare grupSrilor din acest
tabel este prezentatS in rig. 3.5.2(b).
Comparind cele douS dendograme corespunzStoare grupSrii cu o singurS legSturS
(fig. 5.5.2.a) §i grupSrii cu legSturi medii (fig. 5.5.2.b) §i listele secvenjelor de clasi­
ficare (tabelele 5.5.1. §i5.5.2.) rezultS:
- configurapa generals a grupSrilor este aceea§i:
T abel5 5 2 .
Llsta secvenjelor de grupare a unitSplor din exemplul 5.5.1. folosind analiza
cluster cu legSturi medii.

Ciclu de GrupSri contopite Ciclul urmStor la care


Nivel de contopire
grupare Prima grupare A doua grupare reapare gruparea
1 E F 0,19 4
2 A G 0,38 3
3 AG B 0,54 5
4 EF C 0,60 5
5 AGB CEF 0,92 6
6 AGBEFC. D 1,85 7
7 AGBEFCD H 2,19 - .

- contopirea grupSrilor se face la distante mai mari Si analiza cluster cu legSturi


medii. GrupSrile EFC §i AGB, spre exemplu se contopesc, in clasificarea cu aceastS
ultimS metodS, la niveiul 0,92 (mai mare deci decit 0,65 in .varianta cu o singuri
legSturS);
I - prima rupturft majors in seria coeficientilor cate indict nivelul de contopire se
produce intre ciclurile 4 §i 5, mai repede, deci, decit in varianta de cluster cu o singurft
legftturft (unde roptura se produce intre ciclurile 5 ?i 6 ). In funcfie de aceasta situape,
rezulta eft nivelul optim de sectionare a dendogramei din fig. 5.5.2.bi este 0,61 iar
pentru cea din 5.5.2.a este de 0,66.
Corespunzfttor, se obpn douft ClasificSri, diferite, in cele douft variante de analizft:

Analiza cluster cu o singurft legftturi Analiza cluster cu legftturi medii


grupal ' EFCAGB grupal EPO
grupa2 ■ D • grupa2 AGB
grupa3 H grupa3 D
grupa4 H

Capacitatea metodei de grupare cu legftturi medii de a reduce efectul de inlftntuire


este evidentft prin „spargerea“ clasei EFCAGB in douft clase mult mai omogene
EFC $i AGB. ;-
ClasificSri cu legSturi complete
Distanpt intre gnipftri ui clasificarea cu o singurS legSturS este bazatft pe principiul
minimului (elementele cele mai apropiate din grupe diferite dau distanpt dintre acestea).
In analizele cluster cu legftturi medii, distan(a dintre grupftri este datft de media distantelor
dintre perechile formate cu elemente din grupele comparate (principiul mediei). Prin­
cipiul minimului duce la fnlftnpiiri, la grupftri de multe elemente foarte eterogene.
Principiul mediei reduce efectele de inlftntuire §i sporegte omogenitatea grupelor. In
schimb, rezultatele aplicftrii sale sint afectate de limita cunoscutft a mediei: favorizarea
efectelor de compensate: distanje foarte man se pot combina cu distance foarte mici
pentru a da o distan(ft medie indepftrtatft de proximitatea perechilor de elemente cu care
se lucreazft. Cu alte cu'vinte, distan(a medie dintre grupftri pOate fi o mftsurft foarte
artificials. Din acest motiv, se impune uneori adoptarea unei alte mftsuri intergrupale:
distanpt bazatft pe principiul maximuhii. In aceastft ultima variants, distanfa dintre douft
grupftri x (constituitft din x,, x2 . . . x. . . .) $i y (constituitft din y,, y2, y 3 . . .
y. . . .) este datft de distanja maximft dintre elementele celor douft grupftri.
Sft vedem cum opereazft cele trei principii de mftsurare a distantei intergrupale
pentru raportul dintre grupele EFC §i AGB din exemplu la care ne-am referit (ca sursft
de date vezi matricea distantelor euclidiene medii):
- in cazul analizei cluster cu o singurft legftturft intemeiatft pe principiul minimului
(celui mai apropiat vecin), distanja dintre cele douft grupe este de 0.65:
- in situapa in care se aplicft analiza cluster cu legftturi medii §i, deci, principiul
distantei medii, neasemftnarea dintre grupele comparate este de 0.92:
- in fine, dacft se adoptft principiul maximului (celui mai indepftrtat vecin) distan(a
dintre grupftri este mai mare decit in ambele cazuri anterioare, respectiv 1.05.
Cu alte cuvinte, adoptarea pnncipiului distantei maxime in analiza cluselor maxi-
mizeazd difcren(ele intergrupale. i
Pei
Algoritmul de realizare a clasificdrilor bazate pe legdturi complete diferd de cel
folosit in analiza cluster cu legdturi medii numai intr-o singurd secven{d: calculates
distan(elor dintre grupdri se face adoptlnd principiul maximului in locul celui bazat
pe medie.
in tabelul S.S.3. este prezentat rezultatul aplicdrii analizei cluster cu legdturi 1.
complete le cele opt unitdti din exemplul S.S.1.
Tabel 5 5 3 . 2.
Lista Mcv.enlelor da grupare a unltajllor din exemplul 5.5.1. foloaind analiza
cluster cu legdturi complete 3.

4.
GnipSri contfopite
Cidul de Nivel de Cichil urm&tor la care
grupare Prima grupare A doua grupare contopire reapare gruparea
3"
5.i
1 E : ■ F . 0,19
2 A G :■ 0,38 4 Ti
3 EF 0,64 . 5 '
' ■-•'4 AO 0,69 5
5 AGB CEF 1,05 6
6 AGBCEF ■:: I) 2,18 7
7 AGBCEFD H 2,51

Configuratia generald a grupdrilor este aceea§i ca $i in cazul analizei cluster cu


legdturi medii. Clasele se contopesc insd la distanje mai mari in analiza cu legdturi
complete decit in cea cu legdturi medii (compard tabelele 5.5.2. §i 5.5.3).
Recalcularea matricei distanjelor dupd determinarea perechii reciproce cu ter-
menii cei mai apropiafi se face in baza unei scheme irihotomice la care ne-am referit
deja in 55.1, Se considerd cd perechea reciprocd notatd prink este formatd dingrupdrile
i gi j. Distanta dintre (k) gi o altd grupare (h) se calculeazd pentru 6 dintre metodele
de clasificare aglomerativd, jblosind urmdtoarea formuld (Lance gi Williams, 1967,
apud M. Lorr, 1983:85):
d ^ = A . d w + B . d 1, + C . d . . + D . l d u - d ^ '

unde, d - mdsura distantei iar AJB.C gi D sint parametrii variabili de la o metodd la


alta. Acegti parametrii se calculeazd in functie de numdrul de unitdti (n) din cele trei
grupdri i . j gi k. In analiza cluster cu legdturi medii, spre exemplu, A = n J (n. + nj,
B = nj(n. + nj), C = 0 gi D - 0. Numai pentru primal ciclu de grupare in care fiecare
unitate constituie o clasd, A = 7/2 gi B = 1/2. In tabelul 55.4.'sint prezentate valorile
parametrilor pentru 6 metode de clasificdri ierarhice aglomerative:

150
, Tabel 55.4.
Parametrii din formula da calculare a distantalor Intergrupale pantm 6 metode
de clasificare ierarhici
Metoda Parametral ,
A B C D
1 _1 1
1. legftturi unice o "T
2 ‘*4 2
1 1 ' 1
2. legftturi complete 2 2 0 T
3. legSturi medii J L _St_ o 0
ni + nj nt + ni
4. variance minimi
(Ward) 0
n* + ni nk+ nt
5. centroidi "i "j “V i
i^ + n, 11, + ^ (n,+ n))2 0
6. medianft 1 1 _ 1
2 2 4 0
Sursa: M. Lorr, 1983 : 85
Primele trei metode din tabel sint cele la care ne-am referit deja. Dupd cum am
menfionat in introducerea capitolului, aceste metode au in comun considerarea
parametrului C = 0. Astfel spus, in calcularea distantei intergrupale kh nu se ia in
considerate §i distan{a intragrupald ij. Algoritmul propus de Lance fi William pentru
calcularea distanielor intergrupale fi recalcularea matricilor de distanie dupd fiecare
ciclu de grupare este deosebit de util in realizarea programelor de calcul pentru
cluster. Avantajul sdu principal rezidd in faptul cd permite o considerabild economie
de memorie a calculatorului, operind cu numai o singurd matrice a distanielor. Aceasta
este redusd ca dimensiuni de la un ciclu de grupare la altul.
Metodele centroidd §i mediand
Toate cele trei metode anterior prezentate opereazS pe baza determinarii Jeg&turilor"
in sens de ..distance intergrupale, calculate f&rS luarea in considerate a diferenjelor
intragrupale“ §i prin raportare la profilele netransformate ale unitaplor din grupele
comparate. !n clasificarea bazatS pe o singurS legSturS, se comparS profilele cele mai
apropiate din cele douS grupe posibile de reunite, in analiza cu legSturi complete,
profilele comparate sint cele mai depSrtate. Analiza cluster cu legSturi medii
comparS seturile de profile din cele douS grupSri de referintS calculind distan(a medie
dintre ele.
O altS serie de metode de clasificare lucreazS prin compararea unor profiluri
standard calculate la nivel de grupS. Se contopesc grupSrile care au profilurile standard
cele mai apropiate.

151
Metoda centroida realizeaza o astfel de clasificare in termeni de medii: pentru ' s
unitaji care aparjin aceleia§i grupe se calculeazS media pentru fiecare variabiia a declas
profilului; §irul sau vectorul de medii astfel calculat define§te profitul standard al
grupei; se contopesc grupele care au cele mai apropiate profiluri. L it
Centroidul unui cluser este format dintr-o serie de medii. Unitajile din aceeagi
grupare se aseamSn& mai mult cu centroidul lor decit cu centroidul altui cluster. Pentru
a reduce efectele de compensare asociate cu calculul mediei, poate fi utilizata mediana. Cicl
Profilul standard al grupei se determine calculind medianele pentru fiecare variabiia gru
de profil la niveiul unitajilor din grupa.
fn metoda medianfl, clusterele combinate au acelagi efect asupra celui rezultat,
indiferent de numSrul de unitaji din care se compun.
Cele dou& metode centroida §i mediana - se aplicd numai pe matrici de distanje
euclidiene §i nu §i pe cele de siipilitudini.
in tabelul 54.5. sint prezentate secvenjele de grupare, centroida §i median! realizate
pe baza datelor din exemplul pe care 1-am folosit pentru ilustrare §i la celelalte metode
analizate. 1
Tabel 5-5J . contoj
Llsta secvenjelor de grupare a unit&Jilor din exemplul 5.5.1 folosind metodele
controidd ?i mediand:
adopt:
Metoda centroida Metoda mediani
Ciclul de I
grupare Prima Adoua Nivel de Prima A doua Nivel de fi ceh
grupare grupare contopire grupare grupare contopire recurt
1 E F 0,19 E F 0,19 Aplici
2 A G 0,38 A ■ 0,38 unitat
3 AG B 0,44 AG : B 0,44
4 CE F 045 EF A. C 045
5 AGB EFC 0,60 AGB EFC 044
6 AGBEFC D 144 AGBEFC D 1,48
7 AGBEFCD H 1,74 AGBEFCD H 1.76

Metoda variafiei minime (Ward)


Principiul de grupare al acestei metode este diferit de cele cu care opereazl atit
metodele bazate pe legSturi intergrupale cit §i cele de tip centroid §i median.
Accesul intr-o grupa este condijionat in metoda Ward de varianja pe care o grupa
induce noul candidat in grupa respectiva. Ca §i in cazul analizei de varianja, estimarea
se face prin suma patratelor variajiei intergrupale a valorilor fiecSrei variabile faja de a§a-z:
mediile de grupa. DacS profilul este definit prin p variabile xr x 2 . . . x , iar grupa nues
conjine k unitSji, atunci variajia intragrupaia (W) este: mai l

iar h
unde x - media variabilei de profil pentru grupa respective.

152

A
; Se calculeazd deci, pentru fiecare grupd, setul de medii corespunzdtoare variabilelor
de clasificare (de profil).
Tabel5J.6.
L i s t a s e c v e n j i l o r d e g r u p a r e a u n i t d $ i l o r d i n e x e m p l u l 5 .5 .1 f o l o s i n d m e t o d a
v a r i a |i e i m in im e ( W a r d )

Ciclul de GrupSri contopite Ciclul urm&tor la care


grupare Nivel de contopire reapare gruparea
Prima grupare A doua grupare
1 E F 0,19 4
2 A G 0,38 3
3 AG B 0,59 5
4 EF C 0,74 5
5 AGB ETC 1,81 7
6 D H 2,44 7
7 AGBEFG DH 3(23 -

!n raport cu aceste medii de grupd se determini suma pdtratelor abaretilor. Se


contopesc clustrele pentru care sporul de variafie intragrupald prin contopire e«te minim.
In tabelul 5.5.6 apar rezultatele aplicdrii agloritmului Ward la datele din exemplul
adoptat pentru ilustrarea clasificdrilor aglomerative.
Procedeele de realizae a clasificdrrlor centroide, mediate sa t de tip W ad pot
fi cele descrise anterior. Mai simplu este, insd, sd fie adoptatd a§a-zisa formuld
recurentd Lance-Williams, cu paam etrii specifici fiecdrei metode (vezi tabelul 55.4).
ApliciruT metoda W ad, conform acestei formule, distanta dintre grupaea AG si
unitatea B este:

_ nB+n n» + no
(AG)B " '^BG
“ b + I'AO **B+ nAO nB+ n.'AO ' ^AO ~

1+1 1+1 1+1


= t + t ' 0,69 + r + 2 ' 0, 39 ~ r + 2 * 0 ,3 8 = 0 ,5 9
(In formuld, n - numdrul de unitdti in grupa de referintd i a d - distanta inter-
grupald)
Metodele cu legdturi unice, medii sau complete §i cea a varianjei minime satisfac
a§a-zisa inegalitate sau relape ultrametricd (Johnson, 1967, apud M. Lorr, 1983:93):
nu este posibil ca un cluser contopifih ierarhie sd aibd o valoare a distanfei de contopire
mai micd decit cea a oricdrui cluser contopit anterior" (M. Lorr, 1983:93).
Dacd i §i j sint grupdrile din perechea reciprocd de distan(d minimd in matrice,
iar h o altd grupare din aceea§i matrice, atunci
dy ^ max [<!,„, d^]

153
Aceasta este relapa ultrametricS. In mSsura In care este respectatS in constmirea gmpSrilor,
orice cluster contopit, incepind cu ciclul doi de grupare se contopegte la o distant mai
mare decit cea specifics oricSrui alt cluster care a fost contopit anterior. Examinind
coloana nivel de contopire din toate listele de secvenfe de grupare menponate, se
observS u$or cre§terea monotonS a coeficientului respectiv odatS cu ciclul de grupare,
exceptind cazurile metodelor centroidS §i medians.
S .S 3 . in a p o i la g r u p a r e a d e m o g ra fic S a o ra § e lo r m a r i: u n e x e m p lu d e a p li-
c a r e a a n a liz e i c lu s te r

• Generarea grupdrilor pe baza leg&turtior complete


Pentru a vedea cum lucreazS o metodS de analizS cluster in situapi „naturale‘ de
cercetare, revenim la exemplul grupSrii demografice a ora§elor mari. In 5.3. am inceput
deja prezentarea acestui exemplu pentru a introduce nopuni de bazS ale analizpi cluster
profil, distanfd, similaritate.
Reamintim intrebarea cu care debuta exemplul respecdv: cum se grupau, din
punct de vedere demografic, ora?ele mari ale RomSniei la mijlocul anilor '80
(in 1985)? §i, in continuare: are vreo legSturS aceastS grupare cu regiunea istoricS,
apropierea ora§elor sau mSrimea lor?
Un prim rSspuns Q vom da folosind analiza cluster cu legSturi complete. Matricea
de proximitSp la care se aplicS metoda este cea a indicilor de similitudine intre
profilele desfS§urate. Reamintim cS profilul desfS$urat se obpne prin corectarea celui
inipal (simplu) cu media $i abaterea standard a respectivului profit.
Deoarece este vorba de profile „scurte“ (definite) in funcpe de numai 7 indica­
tori), am optat pentru similitudinile cu profile desfSjurate. in acest fel se evitS, pe de
o parte, efectele de compensare pe care le dS folosirea distanfelor euclidiene iar, pe
de altS parte, se iau totu$i in considerape diferenperile de nivel ;i imprSjPere pe care
similitudinile cu profil simple le ignorS. in cazul distanielor (euclidiene sau de alt up),
nu se §tie dacS asemSnarea dintre douS unitSp este datoratS formei profilului lor,
nivelurilor sau variapilor de profil.
Metoda legSturilor complete favorizeazS consPtuirea unor grupe foarte compacte.
DacS modul natural de grupare a unitSplor este compact, atunci rezuitatcle metodei
sint conforme cu realitatea. DacS insS in realitate unitSple sint grupate reticular sau
in lanp atunci metoda legSturilor complete Pnde sS producS foarte multe grupSri mici.
In cazul profilului demografic al orajelor ne putem a§tepta la grupSri de Pp
compact, putemic diferenpate intre ele datoritS influenfelor regionale, vechimii de
urbanizare, proximitSpi teritoriale etc. DatoritS aceste a§teptSri am optat pentru metoda
legSturilor complete.
in general, credem cS este uPl sS fie pomitS analiza cu o variants standard de
clasificare caracterizatS prin grad maxim de dezagregare a profilelor §i prin favorizarea

154
u n o r g r a p e c i t m a i c o m p a c ts . A n a liz a c l u s e k r c u le g S tu ri c o m p le te a p lic a tS u n e i m a tric i
d e s im ititu d in e a p r o f ile lo r e x tin s e s e a p r o p ie f o a r te m u lt d e a c e s t m o d e l d e c e rin fe .
D a c S v a lid S ri d e tip in te m ; i e x te r n n u s u s p n c la r ip o te z a u n o r g ru p S ri c o m p a c ts ,
a tu n c i s e tr e c e l a a n a liz e c u m e to d e m a i p u fin r e s tr ic tiv e d e g e n u l c e lo r b a z a te p e
le g S tu r i m e d i i s a u u n ic e .
O ra je le p in d ic a to rii d e a n a liz S a p a r In ta b e lu l 5 3 .1 .
A p lic in d m a tric ii c o e f ic ie n p lo r d e c o re la p e ( in tr e p r o f ile e x tin s e ) a g lo ritm u l
a n a liz e i c lu s te r c u le g S tu ri c o m p le te , r e z u ltS c o n f ig u r a p a d e g r u p a r e p re z e n ta tS I n
ta b e lu l 5 .5 .8 p ia d e n d o g ra m a d m f i g u r e 5 .5 .3 .
U r m S r in d c o l o a n a c u n i v e i u l d e c o n t o p i r e d i n l i s t a s e c v e n |e l o r d e g r u p a r e , p o t
fi re m a rc a te d o u S „ ra p tu ri“ in tr e c ic lu rile 4 - S f i 1 0 - 1 1 . V o m r e p n e c e a d e - a d o u a d is -
c o n tin u ita te p e n tr u c S e s te m a i m a re d e c it p r im a ( 0 ,3 6 - 0 ,4 0 ) > ( 0 ,7 9 - 4 ,6 8 ) . in p lu s ,
e x is ts p u n m o tiv p r a c t i c d e a p r e f e n s e c p o n a re a d e n d o g ra m e i d u p S c ic lu l 1 0 : d a cS
am a c c e p ta s e c p o n a r e a e i im e d ia t d u p S c ic lu l 4 , a tu n c i fo a rte p u p n e d in tr e o ra ^ e
s - a r in c a d r a ln tr - o g r u p a r e d e c e l p u |i n d o u S e le m e n te .
O p e r in d ,d e c i, s e c p o n a r e a d e n d o g r a m e id u p S c ic lu l 1 0 , re z u ltS u rm S to a re le g ru p S ri
de oa§e:

I. G a la p IV . R ep fa O m m im h B !
la p S ib iu
P lo ie $ ti V. ‘ B acS u V IIL B rS ila
T g . M u re ; . B a ia M a re D C .P ia tr a N e a m i
IL C lu j V I. B o to ^ n i X . C o n s ta n p i
O ra d e a B uzS u ' X L P ite p i
S a tu M a re V IL B ra p > v —
m . A ra d C ra io v a
T im i^ ia re

I n a c e a s tS v a ria n tS d e c la s if ic a r e , 5 d in c e le 7 g ru p S ri d e m in im u m d o u S o ra je
s in t f o r m a te (tin n u m a i d o u S o ra $ e . I z o la te , c u u n g r a d r id ic a t d e s p e c if ic ita te rS m in
B rS ila , C o n s t a n t a , P ite g ti g i P i a t r a H e a m p
D a c S s e c o n s id e r s f ie c a re o r a ; iz o la t to t c a g r a p S , a tu n c i b ila n p il g e n e ra l a le c o n o m ie i
re a liz a te p rin c la s if ic a re n u e s te fo a r te b u n : c e l e 2 1 d e o ra § e a u f o s t re d u s e la 11 c la s e ,
d in c a r e 4 n u c o n p n d e c it c ite u n e le m e n t, i n a c e a s tS v a r ia n ts d e c la s if ic a re g ru p e le
s in t, e s te d r e p t, f o a r te o m o g e n e . S im ilitu d in e a m in im S in tr a g r a p a lS e s te d e 0 ,5 6 .
E c o n o m ia c la s if ic S rii e s te c u a t i t m a i n ia r e c u c it n u m S ra l d e g ru p S ri o b p n u t e s te
m a i m ic f a # d e c e l a l e le m e n te lo r l o r d e c la s if ic a t p c u c it d im e n s iu n e a m in im S a
u n e i g ru p S ri e s te m a i m a re . A m p u te a d e fin i u n in d ic e e le m e n ta r a l e c o n o m ie i unei
c la s ific S ri ( E C ) p r in u rm S to a re a fo r m u la :

j numfeul de grupfai
~ ” numSrul de elemente de clasificat ‘

155
1 Co

in cazul
'■ E v i
relate in
intr
criteriu i
nivel de
cel pu(in
5.5.8, n
variants

Lists

Ciclul (
grupar

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Fig: 5 5 3 Dendrograma similaritS{ii demografice a ora$elor mari. Cluster cu legSturi


complete

156

A
1 C u c it in d ic e le a r e o v a lo a re m a i m a re , c u a tit c a la s ific a re a e s te m a t e c o n o m ic s .

in cazul de fat&, EC = 1 - * 0,48


E v id e n t, in tr e v a r i a |i a in tr a g r u p a lS a c la s e lo r $i e c o n o m ia c la s ific S rii e x is ts o
r e l a t e in v e rs S : s p o r u l d e e c o n o m ie d u c e l a r c d u c e r e a o m o g e n itS p i g ru p S r ilo r §i in v e rs .
in tr e a g a c la s if ic a r e d e m o g ra fic S a o ra § e k > r p o a te f i re c o n s id e r a td a c c e p tin d u n
c r ite riu m a i p u (in e x ig e n t d e s e g m e n ta re a d e n d o g ra m e i. A s tfe l, p o a te f i a d o p ta td c a
riiv e l d e s e le c p o n a r e s e c v e n ja d u p & c a r e f ie c a r e u n ita te a f o s t a tr ib u it& u n e i g r u p e d e
c e l p u (in d o u d e le m e n te . In a n a l i z a c lu s te r c u le g d tu ri c o m p le te p re z e n ta tS i n ta b e lu l
5 ,5 .8 , n iv e lu l d e s e c p o n a r e c o n fo rm a c e s tu i p r in c ip iu e s te d u p S s e c v e n ja 1 4 . in n o u a
v a r ia n ts d e c la s if ic a re re z u ltS u rm S to a re le g ru p e :
Tabel 5J.8.
Llsta secventelor de grupare demografiei a ora$eior marl foioalnd analiza
cluster cu iaigituri complete

GrupSri contopite Nivel de contopire Ciclul urmStor


Ciclul de (pentru coduri vezi 5.3.1) (corelatie la care reapare
grupare P rim e grupare A doua grupare intergnipalft) gruparea

* 1 13 ' 14 ; 0,86 10
2 17 '21''"' 0,83 10
3 9 15 0,80 7
4 1 12 0,79 15
8 20 0,68 16
5
6 2 3 ' ' 0,67 11
7 9,15 19 0,66 15
8 6 7 0,64 12
9 4 11 0,64 17
10 13,14 1731 056 14
11 .2 3 - 16 0,40 12
12 23.16 034 16
10 18 031 18
13
14 5 13.14.1731 03 17
15 1,12 9,15,19 0,06 19
16 23,16,63 -0,14 18
83,
17 4,11 5,13,14,1731 -0,1 6 19
18 2 ,3 ,1 6,6 .7 ,8 3 10,18 -0 3 9 20
1,12,9,15,19 4,115,13,14.1731 -0,47 20
19
20 10294549411513144721 2 3 .1 6 5 .7 3 3 ,1 0 ,1 8 -0 3 4

I And m Bra§ov V SiMu


Timijoara Craiova Re$i{*
n Baciu IV Br&ila VI Cluj
Baia Marc Gala{i Oradca
Botojani Ia$i Satu Mare
BuzSu Pkrie§ti VII , Constanta
Piatra Ncam{ Tg. Mure? Pitejti

157
De la 0,48, cit era indicele de economie a clasificSrii in varianta anterioarS, in
varianta actuals se ajunge la 0,67. Sponil de economie se rSsfringe insS negativ asupra
omogenitSpi grupelor. similitudinea minimS intragrupalS se reduce de la 0,56 in
varianta cu 11 clase, la 0,20 in cazul celor 7 clase.
Intre cele 7 grupe predominS raporturile de neasemSnare. (UrmSrind principiul
general al analizei cluster cu legSturi complete, raporturile intergrupale sint estimate
prin coeficientul de corelape minim dintre perechile de unitSp comparate).
Matricea similitudinilor minime intra $i intergrupale
i n m rv V VI vn
I (0,79) -0,77 -0 3 -0 3 -0 3 0,06 -0 3 1
n -0,77 (0.34) -0,76 -0,87 -0,14 -0,69 -0,39
in -0 3 -0,76 ‘ (0,64) -0,16 -0 3 -0,16 ■-0,47
O

IV
1

-0,87 -0,16 (0,20) -0,83 -0,47 -0 3 6


b

V -0 3 -0,14 -0 3 -0 3 3 (0,68) -0 3 2 -0 3 5
VI 0,06 -0,69 -0,16 -0,47 -0 3 2 (0,66) -0,94
vn -0 3 -0 3 9 -0,47 -0 3 6 -0 3 5 -0,94 (0,21)

Gruparea cea mai omogenS este formats din ora§ele Arad ;i Timisoara. Cele mai
eterogene sint grupSrile IV §i VII.
In raporturile dintre grupe, dominante sint aspectele de neasemSnare (r < 0).
Singura exceppe este relapa dintre Arad-Timi§oara pe de o parte §i Cluj-Oradea-Satu
Mare, pe de altS parte.
Identificarea profilurilor specifice ale grupelor.
Modalitatea adoptatS cel mai frecverit pentru caracterizarea grupelor obpnute prin
analiza cluster este construirea profilului mediu al fiecSrei dintre grupe. Pentru
aceasta se calculeazS, in cadrul fiecSrei grupe, media pe indicatorii folosip la realizarea
clasificSril
Pomind de la datele din tabelul 5.5.9, se calculeazS mediile pe indicatori in cadrul
grupelor. RezultS profilurile medii din tabelul 5.5.10.
Grupa a U-a, spre exemplu, este caracterizatS in principal prin natalitate mare,
mortalitate generals de nivel redus, imigrare putemicS §i niveluri reduse ale nuppalitSpi
§i divorpalitSpL Un profil opus se ingregistreazS, spre exemplu, la grupa I-a, cu
natalitate redusS, mortalitate mare, nuppalitate §i divorpalitate intensS §i imigrare de
nivel redus.
O astfel de procedurS este indicatS in special in situapile in care grupele sint
constituite dintr-un numSr mare de membrii.

158
i in condipile in care acestea au un voium relativ redus, cred cd poate fi utild 9
procedura construirii unor profiluri dominante. Realizarea unui astfel de profil se face
prin reducpi succesive atit la niveiul membrilor grupei cit ;i al indicatorilor care le
caracterizeazd. In primul rind se elimind subgrupele sau unitdple marginale (caracte-
rizate astfel in funcpe de niveiul de acces in grupd al unitdpi). In tabelul 5.5.9,
unitdple marginale (plasate sub linia punctatd prin care se segmenteazd unele dintre
grupe) sint: Piteju, Constanta, Brdila §i Piatra Neamp
Tabel 5 5 .9
Profilul demografic al oragelor, pa grupa da simllitudlne

Indicatori normalizap cu scorul Z


Grupa Orapil
NAT M INF DIV NUP IM EM Nivel Abaterc
I 1 Arad -126 2,39 1,11 129 1,03 054 051 128 0,87
12 Tunijoara -029 1,47 0,10 1,66 2,83 027 1,00 2,46 0,88

II 2 BacAu 127 -122 028 0,18 0 ,7 5 1.13 0,41 020 0,19


3 Baia Mare 1,73 -0,65 021 -1,13 0,27 125 022 0,75 0,35
6 Botojani 2,95 -127 1,03 0 ,4 9 -226 2,91 0 ,1 4 1,03 2,69
7 Buziu 0,92 -024 0.98 -2,11 -125 0,78 0,09 0 ,4 8 0,74
16 Piatra
Neamt 021 -0,75 026 0.35 026 1,08 026 0,62 021

m 4 Bra$ov -058 -0,74 0 ,6 7 029 0,90 0 ,6 8 -0 2 4 054 0,61


11 Craiova -0,45 -0,47 -121 027 0,02 055 059 -152 -122

VI 13 Galap -0,15 -023 0 ,4 5 129 0,19 054 025 028 025


14 lap 027 021 0,04 126 0,17 053 -120 0 .1 2 0 2 3
Ploie$ti -028 0,74 1,09 1.11 0,15 058 054 0,41 0 ,1 6
______ Ik.M ares_ -0,45 0,27 _0,07 _JL28_ O J6 0 ,3 4 _-122_
Brdila -027 025 0 /4 6 0 ,1 6 -120 052 0 ,7 6 -1,45 0 5 9

V 8 Sibiu -021 051 0 ,4 7 0 ,7 7 026 0,27 1,80 051 0 ,1 4


20 Re;i(a -054 0,1 5 -256 020 052 024 3,31 025 1.74

VI 9 Cluj -0,60 1,04 1,08 029 028 0,00 0 ,6 9 0,61 027


15 Oradea -051 1,08 -0 5 2 020 0,10 0,42 0,05 022 -577
19 Satu Mare 028 0,75 0,11 026 028 022 0,15 0,95 -1,40

_VII 10 Constanta -0,70 -0,04 _0,43 -1J ? 053 0 ,4 6 1,33 0^3


18 Pite;ti -0,46 -1,62 2,60 027 1 0,13 022 021 0,09 0,92

In continuare, in cadrul fiecdrei grupe se examineazd sensul valorilor normalizate


ale indicatorilor. Dacd un indicator are aproximabv jumdtate din valori peste medie
(cu semn poziuv) iar cealaltd parte a valorilor sub medie (cu seihn negadv) atunci

159
Tabel 5J.10
Profllul demografic mediu al grupelor de ora^e

Gupa NAT M INF DIV NUP IM EM Nivel Abateie

I -1,08 1,93 0,61 1,48 1,93 -0,61 0,50 2,02 0,88


II 1,44 -0,95 0,38 -0,64 -009 1,49 0,08 0,34 0,66
in -0,72 -0,61 -009 -0,14 0,46 -0,77 -0,62 -1,43 -0,92
iv -020 0,20 0,06 0,84 -0,12 -0,85 -0,77 -036 -055
V -0,63 -0,08 -127 -0,49 -029 -0,14 2,56 -0,13 0,94
VI -008 0,96 -0,63 -038 0,42 0,31 -0,16 0,19 -035
vn -058 -003 1,52 -0,76 0,05 -059 -049 -0,71 0,15

TabHlul 5J.11
Profllul demografic dominant al flec&rei grup&ri de ora^e

Indicatorii profilului
Gruparea
NAT M INF DIV NUP IM EM
1 Arad. Timijoara +* + +* +* -

n BacSu, Baia Mare,


Boto$ani BuzSu, Piatra
Neam| +* +*

m Brasov, Craiova - _i * + - -

IV Galap, Ia$i, Ploiejti,


Tg. Mure§, BrSila - +* +

V Sibiu, Re§i{a - - - - +*

VI Cluj, Oradea, Satu Mare +* + +

acesta se exclude din setul indicilor specifici grupei. Emigrarea, spre exemplu, este
un indicator nespecific pentru grupa II, cu doud valori sub medie §i cu doud peste
medie. Pentru aceea§i grupd se exclud ca nespecifici indicatorii mortalitate infantild,
divorpalitate §i nivel mediu al profilului.
Dupd efectuarea acestor reducpi, profilurile sau pattemurile dominante pentru
fiecare grupare au configurape din tabelul 5.5.11. in acela§i tabel sint marcap indi­
catorii care au un grad maxim de specificitate pentru o anume grupare. Marcarea
respectivd a fost fdcutd pomind de la premisa cd un indicator este cu atit mai specific
pentru o grupare cu cit valorile sale la nivelul acesteia sint mai dbpdrtate fa{d de medie.
Convenponal am considerat cd respectiva condipe de extrem pozitiv (abated mari
peste medie) sau extrem negativ (abateri mari sub medie) este indeplinita in cazurile
in care valoarea normalizata este mai mare de 1 sau mai mica de -1. (Altfel spus, daca
valoarea medie a indicatorului pentru grupa respectiva se abate cu mai mult de o
abatere standard de la media generaia a acelui indicator).
Natalitatea in. grupa II este mai mare decit media, pentru toate cele 4 ora§e
nemarginale care o compun. Media valorilor ei normalizate fiind de 1,44, deci mai
mare decit 1, o putem considera ca indicator cu inalt grad de specificitate pentru
grupa respectiva. Aceea§i este situapa cu mortalitatea generaia, nuppalitatea §i
imigrarea in cadrul grupei n.
Grupele cu grad maxim de structurare a profilelor sint cele in care se inregis-
treaza cel mai mare numar de valori medii cu specificicate ridicata, marcate in tabelul
S.S.11 prin In exemplul ales, aceasta situape o au grupele I, II §i IV.
In seria ora§elor mari din (ara noastra existau, deci, la mijlocul anilor ’80, trei
tipuri demografice dominante:
A. Ora$e cu natalitate mare, mortalitate mica, imigrare intensa §i, surprinzator,
nuppalitate redusa. Din perspectiva cauzelor care genereaza pattem-ul
demografic respectiv, se poate vorbi de ora$e cu atracpe migratorie putemicd,
§i populape predominant tinara. Bacdu, Boto§ani §i Baia-Mare erau
reprezentative pentru acest tip demografic;
B. Ora§e cu natalitate redusd, mortalitate mare §i nivel ridicat al divorpalitapi
§i nuppalitapi. imbatrinirea structurii pe virste §i modele culturale specifice
sint principals factori care genereaza comportamentele demografice
menponate. Arad $i Timisoara sint ora§ele reprezentative pentru acest tip
demografic;
C. Ora§e cu circulape migratoarie redusa §i mi§care matrimoniaia intensa, cu
divorpalitate ridicata in special. Acesta este cazul ora§elor Galap, Ia§i,
Ploie§P §i Tg. Mure§.
in afara grupelor I, II §i IV care au o maxima integrate in unui dintre cele trei
tipuri demografice exista grupele relativ marginale. Profilul dominant al acestora din
urma este apropiat de unui din cele tipice sau izolat in raport cu acestea. Gruparea
a Vl-a are o apropiere maxima fata de tipul Arad-Timi§.
in ansamblu, cele 21 de ora§e pot fi ordonate in baza urmatoarelor axe de similitudini
§i opozipi: a) ora§e cu populape relaPv imbatrinita (grupele I §i VI) opuse ca profil
celor (b) cu populape tinara (grupa II); c) ora§e cu mortalitate infanti 15 scazuta §i
emigrare putemica (grupa a-V-a) cu profil opus ora§elor d) cu emigrare redusa (grupa
a-IV-a); e) ora§e cu specificitate demografica pronunjata (grupele III §i VII plus
ora§ele marginale din celelate grupe).

161
■Efectul metodei de grupare
DacS in locul legSturilor complete vom folosi pe cele medii, vom obfine o cla­
sificare $i mai economics (fig. 5.5.4). Se vor obpne deci grupe mai pupne, dar mai
eterogene. Similar, adoptarea clasificSrii pe baza metodei celui mai apropiat vecin
(cluster cu o singurS legSturS) va duce la o ?i mai mate economie insojitS insS de o
§i mai mare eterogenitate a ciaseior.
Configura(ia grupSrii demografice a ora§elor in funcpe de cele trei metode este
prezentatS in fig 5.5.5.
RTwl
Etlol
J--0.A5
j-o,«
-0.30
0.25
-0.20
-0.15
-0.10
0,05
0,00
005
0,10
0,15
0,20
0,25
0,30
0;3S
0,40
0,45
0,50
0,55
0,(0
0,65
0,70
0,75
0.80
0,85
0,90
0,95
100

r§ » I l s »
r Z ■s . i r
* (2 ,2 & A

Fig. 55.4. Dendrograma profilelor demografice ale ora$elor mari. Cluster cu legSturi medii

162
’ Stoparea procesului de grupare s-a realizat to toate celetreicazuri in punctek
in care a apSrut {nimul decalaj considerabil in seria indicilor de acces in grupa.
Ora$ele care erau impreunS in clasificarea cu leg&tun complete se menpn k
aceea§i grupare $i in clasificSrile cu legftturi medii §i unite In trecerea de la prima
spre ultima clasificare se realizeazS grupari tot mai largi..
Judecind in fucpe de criterii de valabilitate extern*, clasificaneacu legaturi medii
pare sa fie cea mai adecvata. Specificitatea ei este cSregrupeazgtrei dintre clasele
generate prin legaturi complete, Bacdu-Baia Mare, Boto$ani-BuzSu $i Piatra Neam{ in
aceea§i clasS, Trei dintre ora§ele noii grupari sint din Moldova (Bacau, Botojani §i
Piatra Neamj, iar celelalte doud din zone culturale apropiate Moldovei).
Aceea§i tending agteptat* - de reducere a numarului de grupari prin trecere de
I9 legaturi complete la legaturi medii, §i, in final, la legaturi unice - se inregistreaza
§i in cazul in care se pome§te de la indiciidistan{eloreuclidiene medii (vezi fig. 5.S.6).
Fig. 5.5.5
Grupari pe baza slm ilaiitd|il Intre profiluri derrtograflce extinse
AnalizS cluster cu legSturi -
Complete Medii Unice
Galap Galafi Galap
Ia?i Ia?i Ia?i
Ploie?ti Ploie?ti Ploie?ti
Tg. Mure? Tg. Mure? Tg. Mure?
Arad Arad Arad...
Timi?oara Timi?oara Timi?oara
Cluj Cluj Cluj
Oradea Oradea Oradea
Satu Mare Satu Mare Satu Mare
Craiova Craiova Craiova
Bra?ov Bra?ov Bra?ov
Re?i{a Re?i(a Re?ita
Sibiu Sibiu Sibiu
BacSu BacSu BacSu
Baia Mare Baia Mare Baia Mare
Boto?ani Boto?ani Boto?ani
Buz&u Buz&u Buz&u..
Piatra Neamt Piatra Neamt Piatra Neamt
Pitejd Pite?ti Pitefti
Constanta Constan{a Constan|a
BrSila BrSila BrSila .

• Indice de economie a olasificirii:


0,48 0,57 0,67

163
• Similaritate versus distanfd
Compararea figurilor 5.5.5. §i 5.5.6 este relevant^ pentru efectul pe care il induce
tehnica de mSsurare a proximitSplor dintre perechile de unitSp pentru configurapa
grupSrilor.
SS considerSm, spre exemplu, raportul dintre analizele cluster cu legSturi complete
pomind de la cele douS tipuri de mSsurare a proximitSplor.
Clasificarea cu distance euclidiene genereazS numai 7 grupSri fa(S de cele 11
rezultate in cazul utilizSrii indicilor de similaritate (corelapi intre profiluri extinse).
Prima este, deci, mai economics decit cea de-a doua, indicii de economie coiespunzStori
fund de 0,67 ?i, respectiv, 0,48.
Trei dintre grupSri se menpn exact cu aceea§i components in ambele clasificSri:
Arad-Timi§, Resi{a-Sibiu §i Galafi-Iaji - Ploiesti-Tg. Mures. Acestea ne par a fi §i cele
mai „sigure“ grupSri, in sensul cS se manifests independent de efectul tehnicii de
mSsurare a proximitSpi binare (intre perechile de unitSp).
Care clasificare este mai bunS, cea bazatS pe distante sau cea care pleacS de la
similaritSp? O validare extemS nesistematicS, intuitivS suspne in mai mare mSsurS,
clasificarea pomind de la similaritatea profilelor extinse. in spatele fenomenelor
demografice stau, in esenjS, structuri culturale §i de virstS. Or, din aceastS perspectivS
este greu de inteles cel pupn una dintre gmpSrile pe care le genereazS analiza cluster
cu legSturi complete lucrind cu distan{e medii. Este vorba de cea constituitS din Brasov,
Craiova, BrSila, Constanta, Cluj, Oradea §i Satu Mare. O astfel de grupare pare sS fie
mai degrabS un artefact statistic favorizat de efectele de amalgamare asociate cu
utilizarea distantelor euclidiene. Reamintim cS folosirea acestora din urmS duce la
efecte de compensare intre acpunile celor trei componente ale profilului (formS, nivel
$i imprS§fiere). in schimb, folosirea corelapei intre profilele extinse permite evitatea
acestor efecte de compensare. Clasificarea se realizeazS in acest ultim caz in principal
in funcpe de forma profilelor, corectatS cu niveiul §i imprS§tierea lor.
Situarea ora§elor BrSila §i Oradea in aceea§i grupS, spre exemplu, nu poate fi
in(eleasS decit ca efect al tehnicii de mSsurare a proximitSplor. Din punct de vedere
cultural, cele douS ora§e sint, dupS cite §tim, aparpnStoare de zone diferite. Nu avem
informapi in legSturS cu structurarea pe virste in cele douS ora$e. Din compararea
indicilor de mortalitate, nuppalitate $i imigrare rezultS, insS, cS este foarte probabil ca
virsta medie sS fie mai micS la BrSila decit la Oradea.
Greu de inteles este §i modul in care apare in clasificarea pe baza distantelor
ora§ul Botojani. Indiferent de metoda de grupare utilizatS, acesta nu este atribuit nici
unci clase. Are o mare specificitate atunci cind analiza este intreprinsS in termeni de
distan(e euclidiene. in analizele care lucreazS cu similaritatea, Boto§aniul se incadreazS
firesc, in gmpSri dominante de ora§e ale Moldovei sau ale unor tone culturale inmdite
cu Moldova, in figura 5.5.5. este notat faptul cS profilul extins al ora§ului Botojani
se aseamSnS cel mai mult cu cel al ora§ului BuzSu. Ce anume determinS insS situarea
celor doud ora§e in grupe diferite atunci cind analiza se face ift termeni de distance
euclidiene? Rdspunsul poate fi citit cu u$urintd in tabelul 55.9. Forma profiluri lor
pentru cele doud ora§e este foarte apropiatd, Ceea ce diferd considerabil este iuvelul
$i imprd§tierea lor. Nivelul media este mai mare pentru profilui de la Botojani decit
pentru cel de la Buzdu (1,03 fajd de -0,48). De asemenea, variatia profilului este mai
mare in primul (2,69) fa{d de cel de-id doilea ora§ (0,74). Deci, de§i au o formd
apropiatd, profil urile celor doud ora§e difera considerabil sub aspectul niveiului $t al
imprd§tierii lor. Cum analiza ca distance nu privilegiaza efectui formei, se impune
efectui niveiuhai ji si imprdftiera.
Un aft ora? ca profil demografic foarte specific este Piteftiul. Aceastd specifi­
citate este foarte putemicd indiferent dacd analiza opereazd cu similaritdp sau cu distance
(vezi fig.5.5.5 §i 5.5.6).
Ceea ce sugereazd toatd analiza comparativd pe care am intreprins-o este
recomandarea de a compare atit rezultatele obpnute cu metode diferite de grupare cit
§i in functie de tehnici diferite de mdsurare a proximitdtilor.
Grupdrile care se mentin dincolo de efectui metodei de grupare sau al tehnicii
de estimare a proximitdtilor, sint cele „tari“, cu credibilitate sporitd.
Fig. 5J.6.
Grupdri pe baza distantelor (demografice) medii euclidiene
Analizd cluster cu legdturi
complete medii unice
Bra§ov Bra?ov Bra?ov
Craiova Craiova Craiova
Briila BrSila Briila
Constanfa Constanta Constan(a
Cluj Cluj Cluj
Oradea Oradea Oradea
Satu Mare Satu Mare Satu Mare

Galap Gala|i Gala|i


Ia?i Ia?i Ia?i
Ploie?ti Ploiejti Ploie?ti
Tg. Mure? Tg. Mure? Tg. Mure?

Arad Arad Arad


Timi? Timi? Timi?

Re?i{a Re?i(a Re?i|a


Sibiu Sibiu Sibiu

Bacdu Bacdu Bacdu


PiatraNepit PiajMNeamt Piatra Neamj
Bara Mare BaiaMare Baia Mare
Buzdu Buzin Buzdu
Indice de Pite?ti Pite?ti Pite?ti
economic a Botojani Boto?arti Botojani
clasificirii 0.67 0.71 0.76

165
5.6. STRUCTURI, TIPURI $1 ARII SOCIOCULTURALE RURALE:
CLUSTERE DE UNITATI §1 CLUSTERE DE INDICATORI
5 .6 .1 . P ro filu l c u ltu ra l a l u n e i z o n e r u r a le

• Cit de diversS este via|a cultural^ in mediul rural rom&nesc din spapul jSrii
noastie? ■
• in mSsura in care exists o astfel de diversitate, care sint principalele tipuri de
unitSp p arii teritoriale care dau conpnutul acestei diversitSp?
• §i, in fine, ce a generat diversitatea culturalS a statelor noastre gi prin ce poate
ea fi identificatS?
La aceste intrebSri se poate r&spunde etnologic, demografic gi sociologic, calitativ
sau cantitativ, analizind sate, comune sau jude|e, adoptind perspective sincronice
sau diacronice etc. Multitudinea perspectivelor posibile de abordare este evidentl
Importanja teoredcS gi practicS a intrebSrilor puse, de asemenea.
Un demers integrator care sS valorizeze toate prspectivele angajate intr-o astfel
de analizd rSmine un deziderat major in domeniu. In dmmul spre realizarea imaginii
de ansamblu asupra ariilor culturale rurale, ar putea fi utild §i o abordare „neortodoxg“
in care se pome§te de la urmStoarele premise:
- integralitatea specificului cultural al unor unitSp teritoriale rezultS mai degrabS
din invesdgarea condiponSrilor imediate ale comportamentelor culturale - §i a feno-
menelor socio-culturale rezultate prin agregarea acestor comportamente - decit din
analiza ..bucatS cu bucatS“ a comportamentelor culturale. Caracterul difuz $i multidi­
mensional al fenomenelor culturale provoacS apelul la analiza specificului cultural
prin sursele sale.
- specificitatea culturalS a ariilor rurale rezultS, pe de o parte, din acpunea
factorilor care orienteazS comportamentele culturale spre unui dintre cei doi poli ai
axei „tradiponal-modem“ iar, pe de altS parte, din cei care indue orientSrii valorile
independente de aceastS polaritate.
Profilul cultural al unei zone este dat, deci, nu numai de pozipa acesteia pe
continuumul „tradiponal-modem“ ci §i de setul valorilor cu specificitate locals, care
nu se subsumeazS dimensiunii respective.
Exists cel pupn cinci tipuri de structuri „tari“ cu rol fundamental in condiponarea
intensitSpi de manifestare in profil teritorial a orientSrilor valorice tradiponale sau
modeme:
• demografice
. educaponale
• de ocupare $i salarizare a forjei de muncS
• de urbanizare
• de comunicare (prin mass-media, refea stradalS etc.)

166
i Raponalitatea in genere, ca adecvare a mijloacelor la scopuri §i, in particular,
promovarea acpunilor §tiinpfic fundamentate sint principalele criterii de recunoa§tere
a prezenfei modemitapi $i modemizSrii culturale. in plan atitudinai §icomportamen-
tal forme concrete de manifestare a modemit&pi culturale pot ft toleran{a religioasS,
laicizarea, adoptarea mijloacelor contraceptive, valorizarea $i contabilizarea timpului,
mobilitatea sociaia, investipi sporite in calitatea copilului, fertilitate redusa, empatie
sporitS etc.
Corespondenja ipoteticS dintre polii atitudinali §i comportamentali ..tradiponal-
modem“, pe de o parte, §i valorile unora dintre dimensiunile subsumate structurilor
menponate, poate fi reprezentatS astfel:
Favorizare a orientSrilor Dimensiuni ale structurilor Favorizare a orientSrilor
.TOADrpONALE locale MODERNE

imbStriniti structuri pc virste indneritS


agricolS ocupare a populafiei neagricolS
cooperatistS salarizare destat
individuals agricultura de grup
redus stocde invdfdmint ridicat
redusl concentrate urband sporitSi
micS pondere populafie urband mare .
inzond
redusS expunere sociald la mass- sporitS
media
nemodemizatS refea Stradald modemizatS
redusS re\ea §i dotare §colara extinsS

in localitaple sau zonele in care structurile locale au valori de favorizare a-


modemizarii exista o mai mare probabilitate de dezvoltare a unor comportamente
sociale modeme decit in cazurile in care respectivele structuri sint de tip tradiponal.
Principalele clase de comportamente care prin agregare dau fenomene demogra­
fice sau sociale, interpretabile in termenii dihotomiei tradiponal-modem sint
urmatoarele:
Intensitatea favorabilS pentru Intensitate favorabilS pentru
orientSri valorice Fenomen social/demografic orientSri valorice
TRADITIONALE MODERNE

mare fertilitate micS


mare mortalitate infantilS micS
micS divorpalitate mare
micS mobilitate socialS mare
mici migrape mare

167
Profilui cultural al unei zone rurale se determine insfl nu numai prin indicatorii
fenomenelor §i structurilor subsumabile opozipei tradiponal-modem. Indefinirea acestui
profil trebuie considerate §i informapile referitoare la structuri ecologice $i sociale care
favorizeazS orientari specifice, neinterpretabile in termeni de traditional sau modem,
in seria acestor structuri pot fi incluse:
Structuri ecologice: naturale: munte-deal-cimpie
constitute istoric: (to plan regiuni istorice
social }i cultural)
Structuri socio-demografice: grapuri etnice

Profilui cultural al zonelor rurale din (am noastril poate fi conturat deci pomind
de la indicatori ai structurilor $i fenomenelor menpdnate, relevante pentru orient&rile
valorice §i comportamentele cultprale ale populapei.
Vom realiza in continuare o clasificare a zonelor rurale ale Romdniei'din pers-
pectiva profilului lor sociocultiiral. Din sfera largS a indicatorilor pe care i-am con*
siderat ca relevanp pentru acest profil am selectat pe cei pentru care am avut date
disponibile la nivel de jude| - total comune. in mod relativ convenponal am considerat
c i totalitatea comunelor dintr-un judej constituie o arie sau zond socio-culturalft rural!
Criterii pentru clasificarea empiricd a ariilor socio-culturale rurale:
DIMENSIUNI INDICATORI

Structuri dc favorizare a virsti pondere populape de +60 am Is


orientirilor valorice 1.01.1988 VRS
tradiponalc/modeme
ocup&pe salariap la 1000 locuitori SLR
salariapycooperatori care au lucrai -

in agriculturi SC
tip de agriculturi pondere teren agricol in gospodSriil*
particulare GP
urbanizare pondere populape urbanS in jude
to 1985 U8
pondere populape urbani to jude
to 1966 U6
categoriamedjedemarimeaorajela
din jude{ OM
refea stradali pondere strizi modemizate STM
participare la rejel< numSr abonamente TV la 100(
de comunicart locuitori TV
extralocalS numir abonamente telefonice li '
1000 locuitori TEL
Structuri locale. relief dominant scor mediu al reliefului in comur
neinterpretabile in termeni (5-munte; 4-deal-jnunte; 3-deaJ
de tradiponal/modem 2-deal-cimpie; 1-cimpie) calcula
ca medie ponderati cu populapa REL

168
DIMENSIUNI INDICATORI
ntgkne islorici di Transilvania + Banat +
ioCS&ZXPC& Gnfana-Maramure; t TRANS
Moldova MOLD
Mnntenia + Oltenia + Dobrogea MUNT
Fenomene socio-demografice profil etnice pondere romani in 1977 ROM
interpretabilein tenneni de fenilitate rata total* a fertilitl(ii
traditional/modem mortalitate rau RHHtalititii infantile INF
divortialitate rata divorpaliti^i DIV
imigrare rata imigririi IM
indice imigrare din alte judefe
(migrant pe durata viepi in 1977) IMV

(Exceptind cazurile in care re face o alt& men(iune, indicatorii sint calcula(i pentru
anul 1985 sau 1986 la nivel de total comune din jude(. Surse de date: DCS, Recensamint
1977, Anuare statisdce, Anuanil demografic, 1974).
Valorile pe care le inregistreazS un jude| (total comune) pe top cei 20 de indicatori
menfionati deflnesc profilul socio-cultural empiric al acestuia.
Profilurile culturale latente care stau in spatele acestor profiluri empirice pot
rezulta in urma unor procese de interpretare a ciaseior de jude{e generate {Min analiza
cluster.
: Vom incerca sa ajungem la astfel de profiluri latente prin analiza rela|iilor dintre
indicatori prin deteradnarea ciaseior de jude|e cu maxima similaritate a profilelor
socio-culturak empirice ?i a profilurilor lor dominante sub aspect empiric.
Judefele care aparjin aceluia§i cluster ji sint invecinate constituie o arie
socio-culturald ruraUL
in fine, pentru ordonarea $i interpretarea datelor poate ft utila §i clasificarea
indicatorilor in termeni de structuri (stare) - fenomene (in sensul de clasS de
evenimente sau schimb&ri de acela§i tip) ;i volum-distribupe-localizare.
Intersectind cele doud dimensiuni, obpnem urmatoarea clasificare a indicatorilor
de analizd:
vohun/ intensitate distribute (compozijie) localizare

structuri sau stiri OM. TV, TEL VRS, SLR, SC, GP. U6, REL, TRANS,
U8, STM. ROM MOLD.MUNT
fenomene FERT, INF, DIV, IM,
IMV

169
5.6.2. Structuri socio-culturale rurale
Modul in care se grupeazS indicatorii inclu§i in analizS poate sugera ipoteze in
legSturS cu confinutul structurilor socio-culturale latente care ordoneazS universul cultural
al viejii rurale, in profil teritorial.
ConsiderSm ca punct de pomire matricea coeficienfilor de corelafie dintre cei 20
de indicatori menfionafi. Fiecare dintre ace§ti indicatori are un profil dat de valorile
pe care le inregistreazS pentru toate cele 40 de judefe. DouS profile de indicator sint
cu atit mai ..legate* cu cit coeficientul de corelafie corespunzStor lor are o valoare
absolute mai mare. Pe matricea coeficienfilor de' corelafie dintre indicatori poate fi
aplicat oricare dintre procedeele de analizS cluster cunoscute. in prealabil se realizeazS
o pozitivare a tuturor valorilor. Grupele de indicatori rezultate pot fi considerate ca
refele empirice cu grad, maxim de conectivitate, sau covariafie intre elementele care
le compun.
Ce semnificS aceste grupSri? Ce anume le genereazS? Pe de o parte ele sint
rezultat al infiuenfelor sau interinfluenfelor directe dintre perechi de variabile semni-
ficate de indicatorii pu§i in relafie. Urbanizarea judefului ;i imigrarea in comune, spre
exemplu, pot contribui la intinerirea populafiei rurale sau la reducerea ritmului de
imbStrinire al acesteia. De asemenea, atracfia migratorie a ora§elor a stimulat (in
special in cazul in care acestea au fost „inchise’) sporirea imigrSrii in comunele din
apropierea acestor ora§e.
In baza acestei relafii cauzale ne putem ajtepta, deci, ca indicatorii mSrime medie
a ora?elor din judef, populafie urbanS in judef, ratS de imigrare in comune §i pondere
persoane de peste 60 ani in populafia comunelor sS aparS in aceeafi grupare.
Pe de altS parte, gruparea indicatorilor in acela§i cluster poate fi $i rezultat al unor
relafii de semnificafie a acestora in raport cu aceea§i variabilS latentS. Intre mortali-
tatea infantilS §i numSrul de telefoane din comune, spre exemplu, nu poate fi stability
o relafie cauzalS directs. DacS statistic se inregistreazS o astfel de relafie §i este de sens
negativ, atunci ea poate fi interpretatS prin raportare la o variabiiS latentS, sau la o a
treia variabiiS, manifests, care mediazS legStura lor. La un nivel foarte mare de generalitate
se poate considera cS cei doi indicatori exprimS, in planuri diferite, aceea§i trSsSturS
latentS a modemizSrii comunitare. Cu cit aceasta este mai accentuatS, cu atit cultura
§i refeaua medicals vor fi mai evoluate §i, implicit, mortalitatea infantilS va fi mai
redusS. Similar, o modemizare sporitS se va exprima §i printr-o refea de telefoane
dezvoltatS. In temeiul acestui rafionament este de a§teptat ca indicatorii rata mortalit&lii
infantile §i numdrul de telefoane la 1000 locuitori sS aparS in aceea§i grupS.
Situarea unor indicatori in aceea§i grupS, in baza unui precedeu de analizS cluster
poate fi, deci, generatS fie de relafii cauzale directe, sau indirecte intre ace§tia, fie de
capacitatea lor de a semnifica o aceea§i variabiiS latentS, sau un set de variabile latente,
aflate in raporturi cauzale intre ele.
; inainte de a trece la gruparea propriu-zisa a indicatorilor, se impune o analiza a
matricei de corelafie dintre ace§tia, in vederea folosirii lor ulterioare pentru clasifi­
carea judejelor. Aceasta clasificare va fi distorsionata daca pentru o anume dimensiune
am repnut un numSr de indicatori mai mare decit pentru altele. Ocupapa, urbanizarea
$i imigrarea sint dimensiunile masurate prin cite 2 sau 3 indicatori fa(a de situapa
generaia de numai un indicator pentru o dimensiune. !n situapile in care indicatorii
aceleia§i dimensiuni coreleaza foarte putemic intre ei, este indicata reducerea numarului
lor. Dacd ace$tia coreleaza moderat sau slab, rezulta ca desemneaza un conpnut mul­
tidimensional, nu unui unidimensional cum s-a presupus inipal.
Distribupa ocupaponaia, spre exemplu, a fost masurata prin SLR - salariap la
1000 locuitori §i SC - raportul intre numarul de salariap p cel de cooperatori din
agricultural Corelapa coiespunzatoaie relapei dintre ei este de 0,69. Nefiind o corelape
foarte mare, rezulta ca distribupa ocupaponaia este multidimensionaia. in consecin(a
repnem ambii indicatori.
Intre totalul imigrarilor in comune in decursul anului 1986 ji imigrarea in comunele
judeptlui de la mare distanpl (calculat cu cifre de migranp pe durata viepi in 1977,
la recensamint) este o corelape de 0,82. Conform uzan(elor de practica statistica, o
astfel de corelape este la limita inferioara a unei corelapi foarte putemice. Repnem
totup ambii indicatori in analiza, dat fund faptul ca ei semnifica aspecte diferite de
imigrari, oricum foarte semnificative pentru aspectele culturale locale.
Urbanizarea este masurata prin trei indicatori: U6 - pondere populape urbana in
1966, pondere populape urbana in 1985 - U8 §i marimea medie a oragului din jude(
(sub aspectul numarului de populape) - OM.
Corelapile corespunzatoare lor sint:
U6 U8 OM
U6 x 0,93 0,70
U8 0,93 x 0,75

Evident, urbanizarea din 1966 coreleaza foarte putemic cu cea din 1985, relevind
o inerpe foarte mare in ierarhia urbanizarii judefelor. in acest caz, se impune, credem,
renun {area la unui dintre cei doi indicatori (U6 sau U8 ). Pentru a lua o decizie in acest
sens, acccptam ca premise ideea ca va trebui repnut acel indicator care este covariant
in mai mare mSsura cu indicatori de maxima relevanpl pentru comportamentele cul­
turale locale. Aceasta condipe o indeplinesc mai ales indicatorii referitori la fertilitate
(FERT), mortalitate infantiia (INF) ;i divorpalitate (DIV). Corelapile in baza cSrora
se ia decizii de selectare a unuia dintre indicatori de urbanizare sint date mai jos:
FERT INF DIV

U8 -0,13 -0,11 0,18


U6 -025 -0.19 0,39

171
Urbanizarea „veche" din 1966 coreleazd mai putemic decit cea „noudu, din 1
cii indicatorii demografici. §i este ftresc s& fie a§a, pentru cd fenome
cultural-demografice ale fertilitdpi, mortalitdpi infantile 0 divorjialitdpi au
inerpe mai mare, suspnutd mai mult de istoria urbanizdrii decit de urbanizarea
moment.
tn urma acestei examindri, am renunjat, deci, la un singur indicator - U8 .
totalul celor 20. Toate dimensiunile incluse in analizd sint mdsurate prin tmu sau
indicatori. Din acest punct de vedere, tehnica de analizd nu va favoriza Decontrols!
anume dimensiune in raport cu celelalte. .»
Sd analizdm in continuare modul in care se grupeazd cei 19 indicatori in baza u
analize cluster cu legdturi complete prezentatd sintedc in tabelul 5.6.1.
Tabel 5.6.1.
Gruparea indicatorilor folosifi pentru deflnirea profilulul soclo-cultural al zonelor;
rurale (analizd cluster cu legdturi complete)

Denumirea/ Indice de
Cod
semnificapa major! Grupe ;i subgrupe de indicatori consistent
atribuit! grupei 0,16
Diferenpere jude[ din Transilvania, Banat sau (0,40)
regional-etnici Crijana-Maramure? TRANS
pondere romani ROM
abonamente telefon ____ ____ TEL_
mortalitate infantil! "INF ” ‘j m :
jude(e din Muntenia, Oltenia, Dobrogea MUNT
~W
n Migrape $i imigrare m comune IM (0,82)
urbanizare imigrare de la mare distant! IMV
ora; mediu ’OM—
urbanizare 1966 U6
virstnici__________________ VRS
0.19
m Diferenpere salariap SLR (0,69)
ocupaponal! salariati/cooperatori_____ s< L _
fertilitate ‘ fer t ‘ 'T O T
judet in Moldova_______ MOLD
divorpalitate "DIV W JV '
strSzi modemizate STM
0,48
w Diferenpere relief dominant REL
geografk! agricultur! necooperatist! GP
abonaaaeme TV TV . JO*
*) Consistent fiecSrei subgrupe este indicat! prin valoarea pus! intre paranteze. Indicii
corespunz!tori grupelor sint notap f!ri paranteze. Cu cit indicele are o valoare mai mare, cu atit
grupa sau subgrupa este mai consistent!, are indicatorii mai „legap‘*intre ei. Liniile punctate
demarci subgrupe de indicatori.
' I p o te z a c e a m a i g e n e r a l s d e g a ja tS d i n a c e a s tS a n a liz S e s te c S v i a |a s o c io - c u l tu r a lS
a a r iilo r r u r a le s e s tru c tu re a z S , in p rin c ip a l, to f u n c p e d e p a tru d im e n s iu n i: .
• a p a rte n e n (a re g io n a l-e tn ic S
• migrape p urbanizare <
• s tru c tu rS o c u p a p o n a l!
• zonS geogiaficS
Diferenperea regional-etnicS opune to principal zonele central-nord-vestice ale
(Srii, cu cele sudice. in planul fenomenelor demografice, opozipa cea mai putemicS
pe aceastS axS se inregistreazS in legSturS cu mortalitatea infantilS. Gruparea sudicS
lalomita, CSlSrap, Tulcea, BrSila p Constanta, spre exemplu, are o mortalitate infantilS
considerabil mai mare decit cea formats din Cara? Severin, Hunedoara, Alba, Mara-
mure? §i Bistript-NSsSud, situatS central-nord-vestic. Este suspnutS, de altfel, ipoteza
cS una din axele principale de diferenpere a viepi demografice rurale din (ara noastrS
era structuratS pe opozipa nord-sud (D. Sandu, 1989 a.).
Indicatorii fenomenelor demografice de maximS semnificape pentru diferenperea
cultural! rural! - fertilitate, mortalitate infantild §i divorjialitate - apar to cadrul
grupSrilor I §i III. Acestea sint grupSri care au o localizare regional! specific!
Mortalitatea infantilS se situeaz! to aceeap grupS cu indicatorul apartenent! la zona
central-nord-vesPc! Fertilitatea p divorpalitatea in schimb sint incadrate in aceea§i
grupS cu indicatorul MOLD - localizare a judepilui to Moldova.
Acest mod de plasare suspne ipoteza c ! fenomenele cultural-demografice rurale
(spre deosebire de cele urbane - vezi to acest D. Sandu, 1989 b.) au toe! o putemicS
diferenpere regional!
Migrapa, fenomen demografic a cSrui cauzalitate economic! pare s! fie mai putemicS
decit cea cultural! apare intr-un factor care nu include apartenen(e regionale, ci numai
urbanizarea. Este firesc, deci, s! presupunem c ! migrapa to rural are in teritoriu o
configurape concordant! to mai mare mSsur! cu diferenperea urban! decit cu cea
regional-istoric!
Absenpt oricSrui indicator al unui fenomen demografic din gruparea a IV-a trimite
la ipoteza cS diferenperea geografic! este o dimensiune cu important! redus! (fa(S de
cea regional-etnicS, urban! p ocupaponal!) to structurarea comportamentelor
cultural-demografice rurale. In alte planuri ale culturii rurale - folclor, spre exemplu
- aceastS ulpm! dimensiune poate fi foarte important!
De obicei, gruparea variabilelor se realizeazd cu tehnici de analizd factorials.
Aplicarea acesteia se face in baza ipotezei cd datele se grupeazd conform unui model
factorial: existd una sau mai multe variabile latente care determind varia(ia unor
indicatori specifici. Corelafiile dintre acegti indicatori sint explicate numai prin relatiile
lor cu variabilele latente fi nu prin influenfe cauzale directe intre variabile observa-
bile. 0 astfel de ipotezd poate fi susfinutd mai ales in psihologie unde atitudinile, spre
exemplu, au caracter latent, iar opiniile fi comportamentele derivd din astfel de
trdsdturi latente.

173
Covariafia opiniilor poate f i pusd pe seama subsumdrii lor la o aceeafi
atitudine. In astfel de caxuri, se poate presupune cd opiniile nu se interinfluenteazd
direct Intre ele.
in sociologie, in analizele de morfologie sociald in special, ipoteza modelului
factorial este greu de susfinut. Indicatorii cu care se lucreazd sint foarte diferip intre
ei. Covaria{ia lor se explicd atit prin raportare la variabilele latente, cit fi prin
inftuente cauzale directe intre variabilele manifeste pe care le desemneazd. ;
Acesta este motivul pentru Care, in sociologie, analizele cluster pot fi, frecvent,
mai indicate decit cele factoriale atunci cind se dorefie gruparea unor indicatori.
In cercetdrile exploratorii de generare a unor ipoteze, analizele cluster pot fi
deosebit de utile pentru cercetarea sociologies. D efi mai pupn elaborate din punct de
vedere matematic decit cele factoriale, analizele cluster sint mai conforme cu natura
datelor fi relapilor cu care se lucreazd de obicei in sociologie. Desigur, decizia de
aplicare a analizelor cluster sau factoriale se ia, de la caz la caz, in funcpe de datele
cu care se lucreazd fi de obiectivele cercetdrii.
in aplicalia referitoare la viapt socio-culturald rurald, datele sint foarte diferite
iar relapile dintre indicatori sint explicabile atit prin variabile latente cit fi prin
structuri cauzale in variabile manifeste. Acesta este motivul pentru care in gruparea
variabilelor am adopted analiza cluster fi nu pe cea factorials.
5 .6 .3 . G ru p S r i §i a r ii s o c io - c u ltu ra le r u r a le

DacS cei 19 indicatori selectap sint realmente semnificativi pentru viaja culturalS
a comunelor, atunci grupSrile de jude(e obpnute prin analiza cluster pe baza lor, ar
trebui sS fie relativ compacte sub aspect teritorial. Cu cit clasele §i subclasele de jude[e
sint alcStuite din judefe mai apropiate, cu atit ele vor ft mai naturale. §i aceasta
deoarece similaritSple culturale dintre acestea izvorSsc in special din procese de
comunicare culturalS intre vecini, pe durate mari de timp. Desigur, similaritSple
culturale se pot manifesta §i discontinuu, intre jude{e neinvecinate. In acest caz, ele
pot rezulta in special din asemSnSri asociate cu profilul etnic sau cu modelul de
urbanizare.
!n genere, grupSrile de jude|e vor fi cu atit mai ..naturale* cu cit vor putea ft
interpretate in mai mare mSsurS prin raportare la vecinstate, etnie, urbanizare sau zonS
geograficS. Aceste dimensiuni, esenpale pentru via{a culturalS pot acpona indepen­
dent sau in interacpune.
In figura 5.6.1. sint prezentate douS variante de grupare a judefelor in funcpe de
similaritatea lor socio-culturalS. O clasificare este realizatS prin analiza cluster cu
legSturi complete iar o alta apelind la varianta cu legSturi medii a aceleia§i tehnici.
Se observS clar economicitatea sporitS a grupSrii prin legSturi medii fa{S de cea
cu legSturi complete, in primul caz, indicele de economie a clasificSrii este de 0,90
fa(S de 0,83 in cel de-al doilea. Prin schimbarea metodei se trece de la 4 la 7 clase.

174
' Analiza cu legdturi medii contope§te in aceea§i grupd mai multe clase rezultate
din clasificarea cu legdturi complete.
Pentru interpretarea sociologies prezintd un interes deosebit clasificarea pe baza
de legdturi complete. 1
• Gruparea cea mai compacts este formats din judefele Covasna, Harghita, Mure§
$i Sdlaj. Corelapa minimd intre toate perechile de judeje din aceastd grupd este de 0,34.
Toate sint judefe transilvdnene, cu pondere de populape maghiard in comune peste
media pe total jude(e. tn special in primele 3 - Covasna, Harghita §i Mure§, aceastd
poodere este sporitfi.
La data recensdmintului din 1977, ponderea populapei romdne§ti in comunele
jude(elor acestei grupe era:
%
Covasna 14
Harghita 10
Mure§ 54
Sdlaj 77
medie pe cele 40 de judete
analizate 87,2

Fig. 5.6.1. Gruparea Jude)elor (total comune) tn functie de profilui lor socio-cultural
(estimat prin 19 indicatori)
Ouster cu legdturi medii Cluster cu legdturi complete
Cara$-Severin 0,18 Cara$-Severin 0,01
Hunedoara Hunedoara
Alba Alba
Maramurej Maramurc$
Bistrita-Ndsdud (0.48) Bistrita-Ndsdud (031)
Gori Gori
Brajov 0,19 Brasov 0,04
Sibiu (0,78) Sibiu
Arad Arad
Ifflik - (0,68) Tunis. _J032)
Bihor Bihor
Cluj Quj
Satu Mare (037) Satu Mate (031)
Covasna Covasna 034
Harghita Harghita
Mure; Mure;
Sdlai (0.47> Sdlai
Dtmbovifa 0,09 Dunbovi(a 0,30
Vilcea Vilcea
Arge$ Arge$
Prahova (0,48) Prahova
Ialomi(a Ialomi(a , 038
Cdldrap Cdldrap

175
(continuare)
Cluster .cu legSturi medii
Tulcea Tulcea
Briila BrSila
Constanta (0,41) Constanta
Giurgiu Giurgiu 0,30
Teleorman Teleorman
O il Olt
Mehedinp Mehedinp
Poll J0.49) Doli
Neam( 0,27 Neam( 0,01
Vrancea Vrancea
Botojani Boto^ani
Vaslui Vaslui
>
Bacdu Bacdu
Gala[i Galap
lap la? (0,37)
Suceava __ (0,59) Suceava
Buzdu Buz&u (0,43)

linie de separare a grupelor


----------- linie de separare a subgrupelor
in colpil din dreapta sus al fiecdrei grupe sint notap indicii de consistent ai
grupei, egali cu nivelul minim de acces in grupd. Cu cit indicii de consistent au o
valoare mai mare, cu atit grupa sau subgrupa este mai omogend, cu similitudini mai
putemice intre unitdple componente. Intre paranteze 0> in interioml chenarelor sint
inregistrap indicii de consistent a subgrupei respective.
Sdlajul ocupd o pozipe marginald in grupd, nu numai din punct de vedere al
profilului etnic, clar dominat de populape romaneascd. De asemenea, sub aspect tentorial
este situat izolat f a t de grupa in care se incadreazd statistic.
Un grad ridicat de consiistent au ?i grupele cu localizare dom inant in Subcarpalii
Meridionali - Dimbovipt, Vilcea, Arge§, Prahova, in sudul §i vestul Cimpiei Romane
(Giurgiu, Teleorman, Olt, Dolj, Mehedinp) §i in zona Btir&gan-Delta Dundrii (Cdldra§i,
Ialomipt, Brdila, Tulcea).'
Gruparea cea mai numeroasd este cea a jude}elor moldovene§ti, cu doud subgrupe:
- Moldova propriu-zisd: Neamp Vrancea, Boto§ani, Vaslui, Bacdu, Galap, Ia§i (o
vom denumi prescurtat subgruparea Moldova);
- Suceava (din Bucovina) $i Buzdu (din Muntenia).
De§i cuprinde numdrul maxim de jude(e, subgruparea Moldova are cea mai mare
omogenitate culturald (corelape minimd intre profilele judelelor componente: 0,37).
Bihorul, Qujul §i Satu-Mare sint o subgrupd cu grad sporit d? omogenitate culturald,
dispusd in bandd conPnud sub aspect teritorial. In aceeaji grupd, dar la o distant
considerabild se incadreazd §i subgrupa Bra§ov, Sibiu, Arad, Timi?. Aceasta din urmd

176
itinuare) este mai eterogena, avind numai douS perechi de judeje invecinate, Bra§ovul cu Sibiui
$i Timi§ul cu Arad. Toate cele 7 jude}e din aceasta grupa sint situate in zona
central-nord-vestica a {arii. Este probabil cd prezenja ora§elor mari, de lunga tradipe
industrial-urbana impune specified cultural al acestei grupe.
In acela§i spajiu central-nord-vestic se situeaza §i subgrupa Cara$-Severin,
0,30 Hunedoara, Alba, Maramure§ §i Bistri^ N3saud. Profilul ei cultural pare sa fie dominat
de prezenja ora§elor mijlocii §i mici. Gorjul graviteaza la mare distant in jurul acestei
subgrupe.
Ariile culturale rurale pot fi identificate la niveiul judetelor care aparpn aceleia§i
0,01 grupari la un nivel ridicat de consisten# (de peste 0,30) §i sint continue sub aspect
teritorial.
In harta din fig. 5.6.2. sint prezentate ariile socio-culturale (sau, pe scurt, cul­
turale) ale tarii, rezultate din aplicarea acestui principiu.
Intregul teritoriu al #rii este divizat in 17 arii culturale. Dintre acestea, 7 sint
r) arii culturale ,punctuate" formate din cite un singur judep Saiaj, Alba, Gorj, Buzdu,
Suceava §i Constanta §i Bucure§ti. Restul este format din 10 arii culturale extinse
0 (interjudetene).

ten# ai
# au o
ini mai
ior sint

dere al
iritorial

:arpa(ii
lomane
i3iara§i,

bgrupe:
, Ia§i (o

ai mare
0,37).
llturaia,
iistan#
n urmd Fig. 5.5.2. Ariile socio-culturale ale Romaniei

177

__ J
Ariile culturale punctuale sint, majoritar, zone de contact intre regiuni istorice
diferite, sau de separare a unor grupuri etnice. Tipicd este suuapa Buzdului, in zona
Carpaplor de curburd, la intretdierea drumurilor dintre Muntenia, Moldova fi Transil-
vania. Similar, Gorjul poate fi considerat punct de contact intre Oltenia, Muntenia,
Transilvania fi Banat. Suceava este punct de contact intre Moldova fi Transilvania.
Specificitatea sa culturald derivd insd, in special, din apartenen{a la Bucovina de al
cdrai trap este tdiatd numai administrativ. Cultural fi istoric, judepil Suceava aparpne
majoritar acestei ultime provincii istorice.
Specificitatea Sdlajului rezidd in pozipa sa la zona de contact dintre Transilvania
fi Crifana-Maram uref. Dar nu numai. Important# pare sd fie fi ponderea populapei
romanefti (77% in 1977), mai mare decit in jude(ele invecinate: Satu Mare (61%),
Bihor (71%). Clujul fi Sdlajul pot fi considerate ca zond predominant romaneascd de
segmentare a unei „benzi cultural^etnice* formatd din Covasna, Harghita, Muref, Satu
Mare, Bihor.
La Alba, mai mult decit la Sdlaj, este evidentd specificitatea etnicd in context
teritorial. Fa(d de 90% populape romaneascd in comunele din Alba la majoritatea
vecinilor sdi se inregistrau (in 1977) ponderi corespunzdtoare mai mici: Sibiu - 76%,
Muref - 54%, Cluj - 80%, Bihor - 71% fi Arad - 79%. Numai Hunedoara avea o
situape similard, cu 99% populape romaneascd in comune.
In afara ariilor culturale punctuale, cu caracter de zone de contact sau segmentare
cultural-istoricd, pot fi distinse fi cele al cdror profil cultural este dat de pattem-ul de
urbanizare. Este cazul comunelor din Constant §i din jural orafului BucurefU. Nu
•numai comunele din aceste zone, ci zonele respective in intregime au un grad sporit
de specificitate. §i aceasta se datorefte altor factori decit plasarea lor in zone de contact
cultural interzonal.
Bucureftiul este capitala (drii. A fost suficient acest destin istoric de lungd duratd
pentru a-i asigura, un profil cultural specific lui fi comunelor care il inconjoard. La
un mod operaponal de analizd trebuie addugat cd oraful-capitald a fost cel mai putemic
centra de atracpe migratorie din jard pe lungd duratd. Or, aceastd circulape migratorie
sporitd a dus, inevitabil, la crearea unor tipare culturale specifice pentru populapa sa.
Similar, comunele din judepil Constanta au constituit pe lungd duratd o zond
privilegiatd de atracpe migratorie. Circulapa migratorie, pattem-ul de urbanizare fi
turismul par sd fie principals factori care au generat o situape culturald specified in
judepil Constanta.
Distribuirea judetelor in cadrul celor 17 arii socio-culturale are o mare inerpe
in timp. In plus, clasificarea respectivd cred cd este valabild nu numai din perspectiva
viepi socio-culturale rurale ci fi pentru localitdple de pe intreg teritoriul jude{ean.
Avind in vedere aceste premise, clasificarea prezentatd are nu numai o valoare de
exemplu metodologic ci fi una practic-aplicativd. Realizarea unor efantioane naponale
pentru cercetarea fenomenelor condiponate cultural poate porni de la ariile culturale

178
rnenponate. Acestea pot fi considerate ca straturi in procesul de realizare a unor
itonce ejantioane stratificate.
i zona Pentru aprofundarea analizelor culturale in profil tentorial poate fi utiia §i pre-
ransil- zentarea subgrupelor in cadrul ariilor cu mai mult de doud judeje (cifrele indicS niveiul
itenia, minim de acces in grupa sau subgrupa respective):
vania. Botosani 0,88 Giurgiu Q75
de al Vaslui Teleorman
arpne Olt
NeamJ 0,88
Vrancea Mehedinji
vania
ila(iei BacSu Dolj
51%), Galaji 0,83
cS de Iasi Covasna 0,69
Satu Harghita
lalomita 0,78 Mure§
>ntext catara?
itatea Tulcea
Dlmbovita 0,73
76%, BrSila VTIcea
v'ea o
Arge§ 0,68
Bihor Prahova
ntare Cluj
ul de
Nu Satu Mare
iporit
Validitatea clasificdrilor rnenponate nu se reduce numai la ariile rurale ci include
intact
§i ariile judejene.
Se poate considera ca profilul cultural latent al unui jude( poate fi estimat, in
esenfd, prin urmStoarele categorii de indicatori:
A. regiune istoricd de apartenenpi
B. formS de relief predominant in judej
C. pattem-ul de urbanizare al judepilui:
gradul de urbanizare
marime medie a ora§elor
D. compozipa populapei (separat pentru rural §i urban):
• virstd
• ocupape
lerpe • etnie
ctiva E. fenomene socio-demografice (separat pentru rural §i urban)
lean, • fertilitate
• mortalitate infantiia
e de
• divorpalitate ‘
male • migrape '
urale
179
F. retele de comunicare (separat pentru rural §i urban): •
• televizoare
• telefoane
• re(ea stradalS modemizatS
Indicatorii din categoriile D, E §i F calculap pentru mediul rural dau profilul
cultural specific al comunelor din judep Valorile lor pentru urban sint semnificative
pentru profilul cultural al ora§elor.
Indicatorii din categoriile A, B §i C semnificS profilul cultural de bazS al judetului.
in clasificarea pe care am realizat-o anterior am operat cu toate cele §ase categorii
de indicatori. Compozipa populapei, fenomenele socio-demografice §i refelele de
comunicare sint estimate numai pentru mediul rural. Ceea ce se obpne prin a<~est mod
de analizS este un profil cultural 9I judetului cu supraponderarea criteriilor rurale de
estimare a acestuia. 0 astfel de modalitate de abordare este jusdficatS in condipile in
care se urm3re§te obpnerea unor arii culturale care sS integreze pe cit posibil judeje
similare §i invecinate.
Includerea in analizS a indicatorilor urbani de tip D, E §i F ar duce la obpnerea
unor profiluri culturale „complete“ ale judeteior, in sensul cS ar fi luate in considerape
51 dimensiunile culturale generale §i cele specifice, rurale §i urbane. Nu s-ar mai ob{ine
in acest caz, insS, decit foarte pupne arii culturale constitute din jude(e invecinate.
Ora§ele §i urbanizarea sint elemente de favorizare a segmentSrii ariilor culturale. Gradul
inalt de standardizare a modului de via{S urban (dat de locuinle, Industrie, mass-media
etc.) genereazS 0 astfel de scgmentare tocmai pentru faptul cS logica modului de via{S
urban este structural diferitS de cea a modului de viapl rural.
Ipoteza generald pe care 0 susfin este cd specificul cultural al judelului este dat
in principal de conjuncfia dintre factorii istorici, geografici, cei asociafi cu urbani­
zarea fi cu profilul cultural rural al acestuia. Ceea ce rdmine din cultura urband dupd
ce se exclude influen{a acestor factori este nespecific, comun in bund mdsurd tuturor
zonelor urbane.
Acesta este temeiul considerSrii clasificSrii pe care am prezentat-o ca semnifica-
tivS pentru zonele culturale interjudetene.
G t de stabilS este clasificarea culturalS a judeteior? G t de mult este afectatS de
variapi reduse in baza de date sau in metoda de clasificare? DacS unor variapi
metodologice minore le corespund schimbSri foarte mari in configurapa grupurilor,
rezultS cS am obpnut o clasificare instabilS cSreia nu trebuie sS-i acordSm un credit prea
mare, in situapa inversS, de variape redusS a rezultatelor analizei, configurapa obpnutS
poate fi consideratS ca stabilS.
in figura 5.6.3. sint prezentate alte douS variante de clasificare socio-culturalS a
judejelor. Una este realizatS folosind analiza cluster, cu legSturi complete pe setul
inilial.de 20 indicatori. DiferSde varianta prezentata prin aceea ca se introduc in analiza
§i valorile referitoare la urbanizarea prezenta (pondere populapa urbana In 1985) nu
numai la urbanizarea anterioarS (din 1966).
CealaM clasificare, inclusS in fig, 5.6.3. lucreaza cu acelagi set 'de 20 de indi­
i profilul catori, dar cu varianta ANSCOR a analizei cluster. Particularitatea acestei metode este
nificative cS suprapondereaza importanja perechilor reciproce, permipnd formarea de grupe numai
in jurul acestor perechi (D. Sandu, 1990 b).
judepilui. Comparind figurile 5.6.1. §i 5.6.3., rezuM ca introducerea unui indicator in plus
categorii (grad de urbanizare in 1985) duce la cre§terea numanilui de grupari.
(elele de Indiferent de metoda cu care se lucreaza pe setul celor 20 de indicatori, configurapa
rest mod generaia din fig. 5.6.3. o urmeazd pe cea din 5.6.1., daca judecdm subgrupele ca unitap
rurale de de comparape.
idipile tn Primele trei grupe din fig. 5.6.3, coincid cu grupari sau subgrupari din fig. 5.6.1.
bil judeje Atrage atenpa pozipa judepilui Goij. !n fig. 5.6.3. apare in aceea^i grupare cu
Vilcea ;i Dimbovi(a iar in fig. 5.6.1., aiaturi de Caraf-Severin, Hunedoara, Alba,
obpnerea Maramure§ $i Bistrita-Nasaud. Aceasta fluctuape de pozipe in funcpe de metoda cu
isiderape care se lucreaza poate fi considerata ca expresie a situapei sale de zona intre diferite
lai obpne regiuni geografice, avind un grad ridicat de specificitate. Este suspnuta, deci, ipoteza
vecinate. jude(ului Gorj ca arie culturaia punctuaia, de contact.
e. Gradul Reunirea judejelor Bra§ov, Sibiu, Cara§-Severin ;i Hunedoara in aceea§i grupare,
ss-media in cadrul analizei cluster cu legaturi complete (fig. 5.6.3.), ne pare a fi un efect
i de viapl metodologic negativ. Supraponderarea importan(ei acordate urbanizarii prin includerea
indicatorului pondere populapei urbana in 1985, duce la formarea unei grupe etero-
i este dat gene cu judeje, situate discontinu in plan teritorial.
u. urbani- Varianta ANSCOR a analizei cluster genereaza, in acest exemplu, cel mai mare
and dupd num3r de grupari, corespunzator cu numarul mare de perechi reciproce. Configurapa
•d tuturor pe care o genereaza aceasta metoda este insS foarte apropiata de cea produsS prin
analiza cluster cu legaturi complete.
emnifica- Desigur, daca numarul de perechi reciproce ar fi fost redus, metoda ar fi dus la
un numdr scdzut de grupari.
fectata de Din acest experiment metodologic conchidem ca supraponderarea dimensiunii
>r variapi urbanizare (prin includerea celui de al 20-lea indicator) are ca efecte reducetea gradului
rupurilor, de compactitate teritoriaia a jude(elor din aceea$i grupa p reducerea economicitapi
xedit prea clasificarilor (0,73 pentru cluster-ul cu legaturi complete §i 0,65 pentru aplicarea
a obpnuta ANSCOR). In varianta cu legaturi complete din fig. 5.6.1., indicele de economie
este de 0,83).
ulturalS a Pare sa fie indicata, deci, excluderea indicelui grad de urbanizare in 1985, pentru
5 pe setul a nu suprapondera dimensiunea ..pattern de urbanizare** in cadrul analizei.

181
Tabel 5.6.2
Profilui arillor culturale
TnHir.atori*
Judc|e pe grupe ;i arii culturale. FERT INF DIV IM IMv OM U6 TV TEL STM REL GP VRS ROM SRL SC
GRUPAI
CS; HD _* 0 + - + + © - - 0 + © 0 0 + ©
AB - + — - — + + _ © + 0 + 0 +
MM, BN 0 - - 0 - 0 0 - 0 + © © - 0 0
GJ + - + + * © + © 0 + © ©
GRUPA n
BV.SB 0 + 0 + © © + © + + _ _
+ ©
AD, TM _ _
0 © © + + © + _ _
© _ + 0
BH.CJ.SM - + - - - © + - 0 + - - 0 -

g r u pa in
DB, VL, AG, PH -■ - © - - - 0 0 0 0 0 + + © -

GRUPA IV
NT, VR.BT, VS.BC, GL, IS © + _* _* 0 _ _* _* + 0 © _j r

BZ - - + - _ _ + + + _ - + + —

SV + _ + _ — - - - + - © - +
GRUPAV
IL. Cl, TL, BR + © + + 0 — © 0 _ * — * 0 + + +
CT + 0 0 © © + + + - + _ _ *
+ © ©
GRUPA VI
CV, HG, MS 0 + + + © 0 0 _* _ 0
SJ — - - - - - + + + + — + - _ —

GRUPA v n
G, TL, OT, D'J, MH - + - - - - + - - - - © + -

* FERT-fertilitate, INF-mortalitate infantile, DlV-divoiJialitate, IM-imigrare,


+ valori peste medie IMv-imigrarepe durataviejii, 0M-m3rime ara§mediu, U6-
- valori sub medie
urbanizarein 1966, TV-abonamenteTV,TEL-abonamente telefon, STM-
0 v alori foarte apropiate de medie sau absen(a unei tending dominante strizi modemizate, REL-relief domi ant, GP-teren agricol in gospodSrii
in cadrul ariei individuate, VRS-virstnici, ROM-romani, SRL-salaria[i, SC-salariaji/
© abatere pozitivS maximi de la medie cooperatori in agriculture.
-* abatere negative maximS fa{i de medie
u i m uiiiuuiil apiupianuim im esauauscniauiieilenainteaom m am e------r r - :------ j — ^—7 ' ’ ' Z Z ----- -----------
in cadrul ariei strazi modemizate, REL-relief domi ant, GP-teren agricol in gospod&rii
, © abatere pozitivS maxima de la medie individual,„ VRS-virstnici, ROM-romani, SRL-salariaji, SC-salaria|i/
-* abatere negativa maxima fa|8 de medie cooperaton m agncultura.
5.6.4. Profilurile dominante ale ariilor culturale
Un anume indicator este cu atit mai specific pentru o grupd sau o arie cultural
cu eft valorile sale se abat mai mult de la media, pe totalul unitdplor incluse in
clasificare.
Aplicind acest principiu conform procedurii prezentate in capitolul 5.5.3., rezultd
profilele dominante ale fiecdrei arii culturale prezentate in tabelul 5.6.2.
fnaintea oricdrui comentariu, sd ilustrdm modul de citire a acestui tabel.
Aria formats din jude^ele Cara§-Severin ?i Hunedoara, spre exemplu, era carac-
terizatd in principal prin fertilitate redusd, vechime mare a urbanizdrii ?i numdr mult
mai mare de salariap, decit de cooperatori.
Mortalitatea infantild, ponderea virstnicilor, a populapei romdne§ti §i a strdzilor
modemizate au valori foarte aprqpiate de media pe total judeje. Fdrd a fi specifice
acestei arii, au valori peste medie indicatorii referitori la imigrarea pe durata viejii,
mdrimea medie a ora§ului din judep altitudinea medie la care sint situate comunele
§i numdrul de salariap la 1000 locuitori. Valori sub medie, pe total judeje, se inre-
gistreazd la imigrarea anuald, abonamentele TV §i telefon.
Setul de semne (+, - sau 0) de pe linia corespunzdtoare fiecdrei grupe semnificd
profilui acesteia. (In analiza cluster au fost incluse §i informapi referitoare la regiunea
istoricd de care aparpn judeiele. In tabelul 5.6.2. am omis aceste informapi din motive
de spapu disponibil).
O arie culturald este cu atit mai specificatS cu cit este definitd prin mai multe
valori extreme (semne de + sau - marcate). Conform acestui principiu, aria cu grad
maxim de specificare este cea formatd din judejele Moldovei: 9 din cei 16 indicatori
utilizap au valori extreme pentru aria respectivd. Regdsim pe aceastd cale imaginea
cunoscutd a unei arii culturale caracterizatd prin tradiponalism ?i dezvoltare economics
relariv redusd: fertilitate foarte mare, divorpalitate redusd, respingere migratorie puter-
nicd in comune, re{ele de comunicare slab dezvoltate §i ocupare redusd a populapei
acuve in sectoral de stat. Sub aspect etnic, populapa romaneascd este dominants §i in
proporpe mult mai mare decit in jude(ele Transilvaniei, spre exemplu.

6. RELAJII DE REPREZENTATIVITATE: E§ANT10NAREA


6.1. OBIECTIVE

tn foarte pupne cazuri pot fi analizate toate elementele unei mulpmi pentru care
dorim sd formuldm concluzii valide. Examinarea exhaustivd se poate realiza numai cu
costuri foarte mari.
Recensdmintele naponale ale populapei, spre exemplu, sint astfel de examindri
exhaustive. Ele produc informapi utile asupra structurilor pe virste, sexe, stare civild,
naponalitate, categorie sociald etc. Datoritd costurilor pe care le implied, nu pot fi

184

S-ar putea să vă placă și