Sunteți pe pagina 1din 14

CAPITOLUL 3 Analiza multivariat.

Metode de interdependen

Ce este analiza multivariat ? Analiza multivariat, n sensul cel mai general, cuprinde toate tehnicile statistice care analizeaz simultan valorile mai multor variabile pentru fiecare dintre obiectele sau cazurile din eantion. Ca atare, multe tehnici de analiz multivariat sunt extensii ale analizei univariate (analiza distribuiei de frecven a unei variabile) si ale analizei bivariate (analiza tabelelor de contingen, analiza de corelaie, analiza de varian, regresia simpl) 1. Regresia liniar multipl, de exemplu, este o extensie a regresiei liniare simple, astfel nct sunt incluse mai multe variabile independente n explicarea variabilei dependente. Aceste metode reprezint o modalitate de a obine printr-o singur analiz rezultatele care s-ar obine prin realizarea mai multor analize univariate sau bivariate. Dar multe tehnici de analiz multivariat au fost concepute n mod particular pentru a investiga diferite probleme multivariate. Analiza factorial, de exemplu, a fost proiectat pentru a identifica structura latent a unui set de variabile intercorelate i reducerea lor la civa factori explicativi.

Cf. Hair et al., 1995, p. 5. Vezi pp. 5-6 pentru diferite moduri de a nelege analiza multivariat i pentru distincia dintre analiza mai multor variabile {mulivariable analysis) i analiza multivariat {multivariate analysis).

Pentru a restrnge i clarifica sensul noiunii de analiz multivariat, voi considera multivariate acele probleme n care relaiile dintre variabile sunt de aa natur nct diferitele efecte ale variabilelor nu pot fi interpretate separat, fr a lua n considerare efectele celorlali variabile. Crucial n analiza multivariat este variaia. n ultim instana, tot ceea ce facem prin tehnicile de analiz multivariat este sa explicm variaia unei variabile ntr-o populaie (ntr-un eantion) sau variaia mai multor variabile. Dac o variabil nu variaz ntr-o populaie, cu alte cuvinte dac toi indivizii sunt identici dup caracteristica msurat de acea variabil, nu avem nimic de explicat. Toi sunt la fel, toi vor fi la fel i n orice moment vom putea prezice valoarea pe care o va lua un individ pentru caracteristica respectiv, n schimb, atunci cnd indivizii variaz n funcie de o caracteristic (au ocupaii diferite, ctig diferit, voteaz diferit, percep diferit gradul de corupie din societate i aa mai departe), vom ncerca s explicm variaia n funcie de variaia altei variabile. Astfel, indivizii au ocupaii diferite pentru c au un nivel de educaie diferit, pentru c au preferine diferite, pentru c au fost socializai diferit, pentru c sistemul economic n care se gsesc este foarte difereniat etc. Variaia unei variabile este explicat prin variaia altor variabile. Ceea ce investigheaz analiza multivariat este modul specific n care variaia unui set de variabile influeneaz variaia altor variabile. Ceea ce urmrete analiza multivariat este s dezvluie forma i intensitatea relaiilor multiple dintre variabile i s le interpreteze ntr-o manier substanial. Clasificarea tehnicilor de analiz multivariat Este extrem de important din punct de vedere analitic s nelegem diferena dintre tehnicile de dependen i tehnicile de interdependen.

Tehnicile de dependen presupun existena unei variabile dependente sau a mai multor variabile dependente care sunt explicate determinate, prezise) de alte variabile, numite variabile independente (predictori, variabile explicative). Acest lucru nseamn c valoarea care o ia un obiect (caz) pentru variabila dependent depinde de valorile luate de obiect (caz) pentru variabilele independe. Tehnicile de dependen sunt folosite pentru a prezice valorile variabile dependente i pentru a nelege forma i msura determinarii acesteia de ctre variabilele independente. Tehnicile de interdependen nu presupun vreo diferen n stabilul ontologic al variabilelor. Nu exist variabile dependente sau independente. Procedura de analiz le implic simultan i n acelai fel. Tehnicile de interdependen sunt folosite pentru a identifica structura datelor, fie prin reducerea variabilelor, fie prin gruparea obiectelor sau a cazurilor, fie prin reprezentarea relaiilor dintre obiecte i atributele lor pe o hart perceptual. Fiecare dintre aceste grupuri de tehnici este alctuit din mai multe tipuri de analiz, dup cum urmeaz. Tehnicile de dependen variaz n funcie de numrul variabilelor dependente i tipul de relaii de dependen i de scala de msur a variabilelor dependente si independente. Tehnicile de interdependen variaz n funcie de natura structurii studiate : a relaiilor dintre variabile, a relaiilor dintre cazuri sau a relaiilor dintre obiecte. Pentru a avea o imagine general a tehnicilor de analiz multivariat i a numelor lor, le voi prezenta n tabelul 1 (tehnici de dependen) i tabelul 2 (tehnici de interdependen)2.

Tabelul 1
2 Cele dou scheme sunt o adaptare a figurii 1.2 din Hair et al., 1995, pp. 18-19. [cte variabile sunt explicate/prezise ? ]

Tehnici de dependent: predicia unei (mai multor) variabile dependente prin alte variabile independente [cte variabile sunt explicate/prezise ? ] 1. relaii multiple ntre variabile dependente i independente MODELE CU ECUAII STRUCTURALE/ LISREL ANALIZ PATH 2. cteva variabile dependente n relaii individuale [scala de msur a variabilei dependente] 2.1. metric ANALIZ DE CORELAIE CANONIC (variabile independente metrice) MANOVA (variabile independente non-metrice) 2.2. non-metric ANALIZ DE CORELAIE CANONIC (variabile dummy) 3. o singur variabil dependent ntr-o singur relaie [scala de msur a variabilei dependentei 3.1. metric REGRESIE MULTIPL LINIAR I NON-LINIAR REGRESIE CU DATE CATEGORIALE ANALIZ CONJOINT 3.2. non-metric ANALIZ DISCRIMINATIV MULTIPL ANALIZ LOGLINEAR Tehnicile de dependen difer prin gradul de generalitate i tipul variabilelor analizate. Analiza de corelaie canonic poate fi considerat modelul general al tehnicilor de dependen, ntruct este cea mai flexibil n ceea ce privete numrul i tipul variabilelor, dependente i independente. Din tabelul urmtor, n care voi prezenta forma general a tehnicilor de analiz dependente, se nelege mai bine relaia dintre aceste tehnici. (Expresiile Y 1+Y2+...Yn i X,+ +X2+...+Xn trebuie nelese ca fiind combinaii liniare ntre variabilele

respective,adic a1Y1+a2Y2+...anYn i b1X1+b2X2+... +bnXn.

Aceste expresii sunt folosite pentru simplificarea reprezentrii matematice a relaiilor dintre variabile, fr ns a pierde esena lor.)

Tabelul 2 Tehnici de interdependen: identificarea structurii interrelaiilor dintre variabile, cazuri i obiecte [structura relaiilor ntre] 2.1. variabile ANALIZ FACTORIAL/ ANALIZA COMPONENTELOR PRINCIPATE. 2.2. cazuri ANALIZ CLUSTER 2.3. obiecte [cum sunt msurate atributele ? ] 2.3.1. metric SCALARE MULTIDIMENSIONAL 2.3.2. non-metric ANALIZ DE CORESPONDEN/ ANALIZ DE OMOGENITATE

Majoritatea tehnicilor de dependen au fost prezentate n detaliu ntr-un alt manual publicat de editura de fa i cele mai multe volume de metode i tehnici de cercetare sociologic le includ 3. Ca atare, pentru acest volum am decis s m concentrez asupra celuilalt tip de tehnici de analiz multivariat, tehnicile de interdependen. Tehnicile de analiz multivariat de interdependen sunt relativ puin cunoscute comunitii de specialitate din Romnia, iar din cauza complexitii aparatului matematic sunt abordate cu timiditate i reinere. Eu cred c, o dat ce este neleas logica tehnicii - ce urmrete s obin, care este forma datelor pentru care este aplicat, care sunt principiile urmate pentru a ajunge la rezultate, ce reprezint

rezultatele i cum se interpreteaz -, partea matematic va fi mult mai uor de urmrit i priceput. Pentru a uura aceast nelegere, am descris i explicat
3 Rotariu et al., 1999; Sandu, 1992

procedura matematic a fiecrei tehnici n cuvinte, aa nct oricine s poat urmri secvena de transformri i calcule sau algoritmul de estimare a rezultatelor. n cele ce urmeaz, voi descrie n cteva cuvinte tehnicile de analiz multivariat de interdependen i voi evidenia diferenele dintre ele. Tabelul 3 Forma general a tehnicilor de analiz multivariat de dependen Tehnica de dependen Analiza de corelaie canonic Analiza multivariat de varian (MANOVA) Analiza simpl de varian (ANOVA) Analiza discriminativ multipl Analiza de regresie multipl liniar Analiza conjoint Forma general Tipul varia- Tipul variabilelor bilelor dependente independente (Xi) (Yi) Yl+Y2+...Yn = Metrice i Metrice i nonXl+X2+...+Xn non- metrice metrice Yl+Y2 + ...Yn = Metrice Xl+X2+...+Xn YI=XI+X2 + ... + Xn Yl=Xl+X2 + ... + Non-metrice Metrice Xn Yi=XI+X2 + ... + Metrice Xn Metrice i nonmetrice Metrice Non-metrice

Non-metrice

Yl=Xl+X2 + ... + Metrice sau Non-metrice Xn non-metrice Yl=Xll+Xl2+.. , Metrice Metrice i nonAnaliza path/ metrice Modele cu ecuaii +Xi Y2 = structurale X21+X22+.. , (LISREL) +X2n Ym==Xml +Xml + . .. Xmn

Analiza multivariat de interdependen Tehnicile de interdependen investigheaz simultan relaiile n cadrul unui set de variabile. Scopul principal al acestor tehnici este acela de a dezvlui structura ascuns" a datelor: de a identifica modele de grupare a variabilelor, cazurilor, obiectelor sau atributelor. Analiza factorial i analiza componentelor principale, tratate n acelai capitol ntruct au aceeai logic i implic acelai aparat matematic, reduc un set de variabile intercorelate la un numr mic de variabile (factori lateni), neobservabile empiric, care explic structura de relaii dintre acestea. Analiza pornete de la matricea de corelaii dintre variabile. Analiza cluster grupeaz cazurile (i.e. unitile statistice, care pot fi indivizi, obiecte, organizaii etc.) pe baza similaritii caracteristicilor lor. Aceast clasificare produce grupuri omogene intern i eterogene extern. Analiza pleac de la matricea de similariti ntre cazuri, unde msura de similaritate (sau disimilaritate) poate fi definit n diferite moduri. Scalarea multidimensional produce o hart perceptual" a poziionrii relative a obiectelor n funcie de dou sau mai multe dimensiuni subiective. Analiza se bazeaz pe evaluri de similaritate sau preferine ale respondenilor, transformate n distane ntre obiecte. Criteriile care constituie baza evalurii nu sunt specificate (i pot rmne neformulate chiar celor care fac evaluarea). n schimb, ele pot fi interpretate ca dimensiuni de grupare a obiectelor, pe baza atributelor lor obiective. Analiza de coresponden i analiza de omogenitate, care este o extindere a celei dinti, investigheaz relaiile de asociere dintre variabilele calitative i dintre categoriile acestora, producnd o reprezentare grafic de dimensiuni reduse n care categoriile similare sunt aezate aproape una de cealalt, iar cele diferite sunt aezate la distan. Tehnicile de analiz multivariat de interdependen pot urma o abordare compoziional sau o abordare decompoziional n identificarea

structurii unui set de date. Metoda decompoziional pornete de la evaluri generale sau msuri globale ale obiectelor i ncearc s obin un spaiu multidimensional n care poziiile obiectelor reflect ct mai bine aceast apreciere general. Metoda este n general asociat cu scalarea multidimensional. In contrast, metoda compoziional pornete de la un set de cazuri, variabile, obiecte sau atribute i ncearc s formeze o reprezentare sau evaluare pe baza combinaiilor (interrelaiilor) dintre acestea. Compunerea datelor (cazuri, variabile, obiecte sau atribute) ntr-o structur cu dimensionalitate redus se face pe baza unei msuri de similaritate, definit n mod particular pentru fiecare tip de problematic. Aceast metod este asociat celorlalte tehnici de analiz multivariat de interdependen, tradiionale (analiza facto- rial, analiza cluster) i special proiectate pentru a produce hri perceptuale (analiza de coresponden, analiza de omogenitate). Metodele de analiz multivariat de interdependen pot fi folosite complementar n rezolvarea unei probleme practice de cercetare. Drept ilustrare, n continuare voi discuta problematica identificrii structurii unui cmp social prin analiza de reea i voi arta cum fiecare dintre tehnicile de analiz multivariat de interdependen poate fi folosit pentru a da o soluie particular. Recomand cititorilor s reciteasc seciunea urmtoare dup parcurgerea volumului, cnd deja vor fi familiarizai cu tehnicile i vor fi trecut prin exemple pentru fiecare dintre ele. Mai mult, cum n capitolele dedicate tehnicilor de analiz multivariat de interdependen voi discuta diferenele i asemnrile dintre ele, va fi clar ct i n ce fel vor diferi diferitele soluii obinute pentru aceeai problem.

Alegerea tehnicii de analiz. Exemplu: Identificarea structurii unui cmp social prin analiza de reea Analiza de reea face parte din metodologiile asociate perspectivei relaionale n sociologie. Contrastnd cu perspectiva sistemic - aceasta i mprumuta reprezentarea din biologie, concepnd societatea ca pe un organism, caracterizat de o static i o dinamic sociale, noiuni corespunztoare celei de anatomie i fiziologie ale organismului" social 4 -, perspectiva relaional ndreapt nelegerea socialului ctre societate ca proces 5, ca ir de evenimente6, ca b construcie7 sau ca un cmp de relaii8. Propoziiile principale pe care se sprijin analiza de reea sunt urmtoarele. (1) Orice actor social iniiaz relaii ctre ali actori sociali i este prins ntr-o serie de relaii iniiate de ali actori sociali. (2) Relaiile unui actor cu ali actori sociali i poziia sa n configuraia de relaii din spaiul social influeneaz percepiile, atitudinile, credinele, valorile i comportamentul su. (3) Configuraia relaiilor din spaiul social indic poziiile sociale (grup de status, clas social, rol social, clas politic n sensul lui Mosca etc.) i raporturile dintre acestea9. Relaia trebuie neleas ca proprietate a conectrii a cel puin dou uniti de analiz (fie ele indivizi, organizaii, evenimente sociale, preferine, apartenen la o organizaie etc.). Relaiile, spre

4Concepte datorate lui Comte, 1970. 5Giddens, 1984; Elias, 1982, sociologia istoric n general. 6Archer, 1988. 7Schtz, 1972; Berger, Luckmann, 1999. 8Bourdieu, 1977, 1986. 9 Exemplul de analiz pentru capitolul de scalare multidimensional din acest volum, n care investighez structura cmpului scriitorilor din Cluj-Napoca, face parte, de asemenea, din abordarea relaional, iar metodologia folosit este analiza de reea.

deosebire de atribute (caracteristici, nsuiri), care sunt intrinsece unitii de analiz, sunt dependente de context i se transform sau dispar atunci cnd una dintre prile relevante este ndeprtat sau cnd contextul n care au aprut ori dezvoltat se schimb. Dac anul naterii, genul, nivelul studiilor unui individ sunt, n principiu, date sau ataate acestuia indiferent de context, relaia sa de prietenie cu alt individ se schimb dac se schimb domiciliul, locul de munc, statutul marital sau regimul politic. Caracteristicile relaionale ale unui cmp social pot da seama de fenomene pe care atributele individuale i analiza lor la un nivel de complexitate mai ridicat sau mai cobort nu le pot explica. De exemplu, structura relaiilor de prietenie i a diferendelor n cadul unui grup de munc formal poate explica performana acestuia, ntr-o manier pe care analiza vrstei, experienei, productivitii individuale etc. nu o poate face. Prin aceasta nu vreau s spun c analiza de reea este mai util n explicarea comportamentelor, evenimentelor, fenomenelor sociale etc., dect analiza de tip atribut. Nici c acest tip de analiz trebuie s-l nlocuiasc pe cellalt. Ceea ce doresc s art este faptul c analiza de reea vine s completeze analiza de tip atribut i c, n acest sens, este uneori extrem de puternic n nelegerea i explicarea fenomenelor respective. Un alt lucru care trebuie neles este faptul c relaia, rezultat al conectrii a cel puin dou uniti de analiz, nu se refer doar la sensul n care folosim n mod obinuit acest cuvnt: prietenie, colaborare, afectivitate, altfel spus interaciune. Relaia ntre doi indivizi poate fi dat, de exemplu, de apartenena lor comun la o organizaie, fr ca aceasta s presupun neaprat interaciunea ntre cele dou persoane sau chiar faptul c cele dou se cunosc. La fel, dou persoane pot fi legate prin aceea c au absolvit acelai liceu, fr ca acest lucru s nsemne c s-au ntlnit vreodat. De asemenea, ntre dou persoane poate exista o relaie dat de faptul c au un acelai interes particular, fr ca ele s fie contiente de acest lucru

10

sau s i-l fi mprtit. Intr-un sens, relaia este dat aici de faptul c cele dou persoane au acelai atribut. Acest lucru este extrem de important, cci indic o lrgire imens a metodelor i tehnicilor de analiz de reea: aceasta poate fi realizat prin metode i tehnici care folosesc date de tip atribut, i nu doar date de reea. Tehnicile statistice de analiz multivariat de interdependen, utilizate n identificarea proprietilor structurale ale unui cmp social, folosesc date de reea definite n toate aceste sensuri. Studiul reelelor sociale se poate realiza la diferite niveluri de analiz : nivelul egocentric - al unitii statistice (al actorului individual), la nivelul diadelor (structura legturilor ntre perechi de uniti statistice), la nivelul triadelor (relaii ntre triunghiuri determinate de trei uniti statistice) - i nivelul sociocentric ntreaga reea. Ultimul dintre acestea este nivelul analizei prin care identificm proprietilor structurale ale cmpului social, adic poziiile definite obiectiv, n existena i n determinrile pe care le impun asupra ocupanilor lor, ageni sau instituii, prin situarea lor n structura de distribuie a speciilor de putere [...]" 10., precum i a relaiilor dintre acestea. Prin structur social neleg deci poziiile sociale i
raporturile dintre ele, rezultate din configuraiile de relaii dintre actorii unui cmp social.

Exist dou principii fundamentale pe baza crora se realizeaz identificarea structurii sociale n analiza de reea: principiul coeziunii sociale i principiul echivalenei structurale. Logica acestor dou principii este diferit i, n consecin, produce rezultate diferite. Conform principiului coeziunii sociale, actorii sunt agregai ntr-o poziie comun dac densitatea relaiilor (reciproce) ntre acetia este foarte ridicat. Nu ntmpltor terminologia asociat metodei de identificare a structurii sociale dup principiul coeziunii sociale folosete termenul clic" pentru a desemna poziiile astfel obinute. Evident, ne ateptm ca atitudinile, valorile generale, comportamentele,

10 Bourdieu, Wacquant, 1992, p. 97.

11

afilierile, categoria de profesiuni i aa mai departe s fie relativ similare pentru membrii unei clici. Probabil c rezultatul unei astfel de analize se apropie n mare msur de identificarea grupurilor de status n sens weberian 11. Analiza de reea, care urmeaz principiul coeziunii i care este concentrat asupra relaiilor reciproce ntre indivizi, este limitativ din mai multe puncte de vedere, i aceasta chiar din cauza logicii principiului n cauz (spunem acest lucru fr ns a-i nega calitile, ndeosebi n cazul grupurilor mici). n primul rnd, pentru identificarea structurii n funcie de coeziunea grupurilor, putem folosi doar un tip particular de date de reea (de felul celor reprezentate prin matrice de adiacen). Mai mult, coninutul legturii (relaiei) care conecteaz dou uniti statistice se refer la situaii de rudenie i descenden, interaciune, comunicare, schimb i altele asemenea, i. e. cele care necesit contactul direct ntre unitile statistice (care, evident, sunt n majoritatea cazurilor persoane). n consecin, i tehnicile statistice care pot fi folosite sunt limitate: calcul al diferiilor indici de conectivitate, densitate, coeziune a reelei etc., adic lucrul cu matrice 12 Cellalt principiu dup care putem identifica structura unui cmp social este principiul echivalenei structurale. Dou uniti statistice (indivizi, organizaii, evenimente i aa mai departe) sunt echivalente structural dac i configuraiile de relaii ntreinute cu celelalte uniti statistice sunt similare. Ceea ce identificm conform acestei abordri sunt clasele sociale n sens weberian, rolurile sociale, n ultim instan grupurile de status. Un exemplu simplu i imediat ar fi urmtorul: doctorii unui spital constituie o poziie social, ntruct configuraiile de relaii pe care le au cu restul actorilor din spital

11 Weber, 1978, capitolul The Distribution of Power Within the Polni| Community: Class, Status, Party" pp. 926-939. 12 Pentru aceast seciune, vezi introducerea n analiza de reea a lui Knot I Kuklinski, 1982. n limba romn, vezi Culic, 1997.

12

(surori i asistente medicale, personalul administrativ i, nu n ultimul rnd, pacienii internai), deci cu celelalte poziii sociale din campul social respectiv, sunt similare. Acest lucru nu nseamn neaprat c doctorii se cunosc i comunic unul cu cellalt sau c intre ei exist relaii reciproce de prietenie. Abordarea structurii cmpului social dup principiul echivalenei structurale permite folosirea unor tehnici de analiz multivariat care prelucreaz att date de reea, ct i date de tip atribut. Relaiile pot fi definite, n acest caz, n cel mai larg sens, aa cum s-a artat mai sus. Evident, tehnicile statistice pe care le putem folosi pentru ii identifica poziiile i relaiile dintre acestea sunt multe, iar alegerea uneia adecvate pentru obiectul nostru de cercetare depinde de tipul de date de care dispunem, de finalitile cognitive, de ntrebrile pe care le punem, de nivelul explicaiei. Atunci cnd dorim s aflm structura unui cmp social n termeni de clici, vom folosi o tehnic de grupare a unitilor statistice (cazurilor) n funcie de distana dintre ele, unde distana dintre cazul A i cazul B este definit prin numrul de legturi necesare lui A pentru a ajunge la B (aceast msur poart numele de conectivitate). n acest caz vom folosi analiza cluster. n acelai timp, putem folosi scalarea multidimensional utiliznd aceste distane ca date de preferin, pentru a obine o hart perceptual a siturii cazurilor ntr-un spaiu bidimensional. Dac dorim identificarea structurii sociale dup principiul echivalenei structurale, vom aborda problema diferit. O variant este s realizam o analiz factorial pentru matricea legturilor directe dintre cazuri (pe linii avem cazurile, pe coloane - adic drept variabile - vom avea din nou cazurile). O corelaie puternic ntre dou variabile nseamn o similaritate a relaiilor iniiate ctre cele dou cazuri de ctre toate celelalte. De asemenea, pentru aceeai baz de date putem realiza o scalare multidimensional pentru similariti - similaritatea este dat de faptul c valorile luate de cele

13

dou variabile pentru cazurile de pe linii sunt aceleai 12. Dac baza de date definete relaiile n termeni de atribute, vom realiza o analiz de omogenitate 13. Cum se vede din aceast trecere n revist succint a modurilor de analiz prin care putem identifica structura unui cmp social, felul n care definim conceptele principale cu care lucrm influeneaz decisiv alegerea tehnicilor de analiz folosite. ncepnd de la definirea structurii n termeni de reele de relaii i continund cu un mod sau altul de a concepe poziia social, una sau alta dintre tehnicile multivariate de interdependen ne va fi de folos n rezolvarea problemei de cercetare. O dat familiarizat cu tehnicile de interdependen, deosebit de utile n desluirea structurii unor cmpuri sociale, a structurii de relaii ntre obiecte ori atribute sau n investigarea unor fenomene complexe, cititorul va nelege, din acest exemplu scurt, complexitatea problematicii cercetrii sociale i legtura organic dintre teoretic i empiric, dintre concepte i date.

12 13Aceast variant de rezolvare a problemei identificrii structurii unui cmp social este prezentat infra, n exemplul din capitolul Scalarea multidimensional". 13 14Vezi exemplul din capitolul Analiza de coresponden i analiza de omogenitate" pentru o abordare de acest fel.

14

S-ar putea să vă placă și