Sunteți pe pagina 1din 5

CURS 12

ANALIZA MULTIVARIATĂ. ANALIZA FACTORIALĂ

Analiza multivariată cuprinde toate tehnicile statistice care analizează simultan


valorile mai multor variabile pentru fiecare dintre obiectele sau cazurile din
eșantionul cercetat. De fapt, diferitele tehnici de analiză multivariată nu sunt altceva
decât extensii ale analizei univariate (adică analiza modulul în care se distribuie
frecvența unei singure variabile) sau analizei bivariate.
Multe tehnici de analiză multivariată au fost concepute pentru a se investiga diferite
probleme multivariate. De exemplu, analiza factorială a fost proiectată pentru a
indentifica structura latentă a unui set de variabile intercorelate si reducerea lor la un
număr mic, dar esențiali, de factori explicativi.
Cel mai important aspect al analizei multivariate îl reprezintă variația. In fond, tot
ceea ce facem prin tehnicile de analiza multivariată este de a explica variația uneia sau
mai multor variabile într-o populație (adică la toate cazurile unui eșantion determinat). Cu
alte cuvinte, dacă o variabilă nu oscilează (variază) într-o populație, adică dacă toți
indivizii sunt identici din punctul de vedere al acelui aspect, atunci nu avem practic nimic
de explicat. Toți sunt la fel, toți vor fi la fel în orice moment ceea ce înseamnă că
întotdeauna ei vor avea constantă acea caracteristică, ceea ce pentru cercetător
înseamnă un maximum de predictibilitate. Problema în cercetarea socială o reprezintă
însă variabilitatea caracteristicilor. Deci provocator este să reușim să înțelegem și
explicăm variația variabilelor. Ba chiar mai mult, să explicăm modul specific în care
variația unui set de variabile influențează variația altor variabile. Ceea ce urmărește
analiza multivariată este să dezvăluie forma și intensitatea relațiilor multiple dintre
variabile și să le interpreteze într-o manieră substanțială.
Tipuri de tehnici de analiză multivariată. Există 2 categorii de analiză multivariată,
anume:
1. Tehnicile de dependență. Acestea presupun existența uneia sau mai multor
variabile dependente care sunt explicate (prezise, determinate) de alte variabile,
numite variabile independente (sau variabile explicative, predictori). Concret,
asta înseamnă că valoarea pe care o ia un obiect (un caz) pentru variabila
dependentă depinde de valorile luate de acel obiect (caz) pentru variabilele
independente. Tehnicile de dependență sunt folosite pentru a prezice valorile luate
de varibilele dependente, pentru a înțelege forma și măsură în care sunt ele
determinate de variabilele independente.
Tehnicile de dependență diferă prin gradul lor de generalitate și tipul
variabilelor analizate. Cele mai cunoscute și utilizate astfel de tehnici sunt:
- Modelele de analiză cu ecuații structurale / analiza path;
- Regresia multiplă lineară si non-lineară;
- Analiza de corelație canonică;
- Analiza discriminativă multiplă;

2. Tehnicile de interdependență. Acestea nu mai țin cont de faptul că există o


diferență ontologică între variabile, adică de faptul că unele sunt dependente și
altele independente. Procedura de analiză le presupune simultan în același fel.
Acest tip de tehnici sunt utilizate pentru a identifica structura datelor, fie prin
reducerea variabilelor, fie prin gruparea obiectelor (sau a cazurilor), fie prin
reprezentarea relațiilor dintre obiecte pe o hartă perceptibillă. Analiza
multivariată de interdependență este încă puțin utilizată în Romania. Ea
investighează cu succes relațiile în cazul unui set de variabile. Scopul principal al
acestor tehnici este acela de a dezvălui structura ascunsă a datelor: de a
indentifica modele de grupare a variabilelor, a cazurilor, obiectelor sau atributelor.
Cele mai cunoscute tehnici de analiză multivariată de interdependență sunt
următoarele:
- Analiza factorială;
- Analiza cluster;
- Scalarea multidimensională;
- Analiza de corespondență (analiză de omogenitate);

ANALIZA FACTORIALĂ
Analiza factorială este denumirea generică a unei colecții de metode statistice
multivariate, al căror scop principal este acela de a identifica structura latentă a
unui set de date care descriu un fenomen, un concept sau caracterizează o
populație determinată de obiecte.
De exemplu, nivelul liberalismului sau conservatorismului într-o țară, evaluarea
performanței guvernului, satisfacția față de muncă, modul de percepție a corupției, toate
acestea sunt concepte și fenomene imposibil de surprins doar cu ajutorul unei variabile.
Aceste fenomene nu sunt observabile empiric, dar, în schimb, putem avea la dispoziție
mai multe variabile observabile care măsoară diferite aspecte ale conceptului sau
fenomenului respectiv studiat.
Tema generală la care răspunde analiza factorială este următoarea: având un set de
date alcătuit dintr-o mulțime de variabile care descriu un concept/fenomen sau o mulțime
de obiecte putem considera că ele sunt determinate de către un număr mic de variabile
neobservabile direct, care descriu însă acel concept/fenomen. Analiza factorială
răspunde la aceste întrebări:
- câți astfel de factori ascunși sunt;
- cât de bine descriu acești factori setul de date original;
- ce variabile observate determină acești factori ascunși;
- ce sunt acești factori greu observabili sau greu de identificat.

Pornind de la analiza corelațiilor observate între variabilele ce descriu conceptul,


fenomenul sau populația care de interesează, analiza factorială ne ajută să
identificăm structura acestor date, semnalând existența unui număr redus de
dimensiuni latente (variabile neobservabile direct). Variabilele care compun o anume
dimensiune latentă (factor latent) vor fi puternic corelate între ele și într-o măsură mai
mică corelate și cu celelalte variabile.
Două avantaje de aduce analiza factorială vizavi de structurile de date cercetate:
sumarizarea datelor și reducerea datelor. Sumarizarea se referă la reducerea
multitudinii apectelor aceluiași concept, caracteristici ale unei populații de obiecte sau
fenomene la doar câteva dimensiuni cheie, care le sumarizează pe toate celelalte. In
urma sumarizării se pot calcula scorurile factoriale ale fiecărei dimensiuni a datelor și
astfel reduce dimensionalitatea datelor.
Cum se realizează o analiză factorială?

i. Definirea problemei conceptuale. Primul pas în realizarea unei analize factoriale


este reprezentat de fixarea obiectivelor. În funcție de acestea se vor aborda apoi
datele și se a pregătir setul de date care trebuie să fie analizate. Se va căuta să se
reducă cât mai mult posibil erorile de eșantionare și de măsurare. Întrebările cheie
ale acestei etape vor fi următoarele: ce dorim să obținem? Dorim să aflăm structura
unui set de date? Dorim să explorăm dimensiunile unui fenomen? Dorim să
înțelegem cum funcționează un concept? Toate aceste lucruri trebuie să fie foarte
bine clarificate de către cercetătorii din domeniul vieții sociale.
De exemplu, dacă dorim să aflăm cum se structurează opiniile cetățenilor cu
privire la performanțele guvernului, vom ancheta un eșantion de cetățeni (de
obiecte) asupra felului în care evaluează diferite activități ale guvernului, (variabile
observabile). Fiind o analiză de corelație, variabilele care pot intra într-o analiză
factorială trebuie să fie măsurate pe scale de intervale sau de rapoarte. Apoi va
trebui să ne decidem dacă acceptăm în analiză variabile ordinale, dacă toate
variabilele care intră în analiză pot fi măsurate pe aceași scală de măsură. De
exemplu, toate opiniile sunt măsurate pe aceeai scală cu, să zicem, 4 trepte: total
dezacord, dezacord parțal, acord parțial, acord total. In acest caz putem atribui
valorile 0-1-2-3 treptelor scalei.

ii. Matricea de corelație. Acest al doilea pas este de examinare a datelor obținute
și de calculare a matricei de corelație sau de covarianță. Mai clar, este vorba de a
căuta să stabilim dacă există suficientă corelație între variabilele observate pentru
a analiza factorial datele. Dacă între variabile nu există o corelație substanțială,
atunci nu are rost să căutăm factori comuni care să le determine. Aceasta matrice
de corelație ne ajută să depistăm existența unei structuri latente a datelor.

iii. Extragerea factorilor inițiali reprezintă al treilea pas în realizarea unei analize
factoriale. In această fază este important să stabilim numărul minim de factori
comuni care să stea la baza producerii corelațiilor dintre variabile. Dacă nu avem
erori în date, iar presupunerea de cauzalitate a factorilor este corectă, atunci
există o corespondență între numărul minim de factori ce determină corelațiile
dintre variabile și rangul matricei de corelație. Algoritmul de extragere a acestor
factori pornește de la ipoteza existenței unui factor comun unic. De fapt, există un
test numit al discrepanței dintre matricea de corelații observate și cea produsă.
Discrepanța minimă reprezintă de fapt și un criteriu al potrivirii sau adecvării
maxime. Există mai multe metode de extragere a factorilor si corespunzător
acestui lucr există și mai multe criterii de testare a discrepanței dintre cele două
matrici de corelație. Enumerăm cu titlu informativ câteva: a).Metoda pătratelor
mici; b). metoda probabilității maxime; c).metoda de extragere factorială Alpha; d)
analiza imaginii; e) metoda factorilor principali; f). metoda componentelor
pcincipale.

iv. Rotația factorilor. Extragerea factorilor ne va desluși relația dintre factori și


variabilele individuale. Ea este necesară atunci când relatiile dintre factori si
variabile nu este clara sau usor interpretabila. În urma procesului de extracție a
factorilor se obține o matrice de saturații. Rotația factorilor permite modificarea
și îmbunătățirea matricei de saturații inițiale și astfel să se ajungă la o matrice mai
bună, mai simplă și mai ușor de interpretat. Saturațiile ne indică gradul de
corespondență dintre variabilă și factor. Adică saturația factorială ridicată este o
dovadă a faptului că variabila respectivă este reprezentatitvă pentru factor.
Pentru un număr n de variabile observabile (VO) pot exista k factori (F) care
explică variația acestora. Factorii care explică variația a cel puțin două variabile se
numesc factori comuni, cei care explică toate variabilele se numesc factori
generali, iar dacă explică doar o singură variabilă se numesc factori specifici.

VO = sunt așadar variabilele observabile dependente (obiecte, cazuri etc);


F = sunt de fapt variabilele independente, latente;
Saturația factorială (SF) ne spune în ce măsură factorii F latenți determină o
VO. Sau, altfel spus, SF ne indică relațiile (gradul de corespondență) dintre
F și VO, precum și intensitatea lor.

Finalitatea rotației factorilor o constituie ajungerea la o soluție cât mai simplă cu


putință vizavi de configurația de variabile care saturează factorii. Iar efectul cel mai
important al rotației matricei factorilor este acela că redistribuie varianța explicată de
factorii soluției inițiale la o alta, ai cărei factori sunt mult mai ușor observabili.

v. Interpretarea factorilor. Extracția soluției factoriale ne indică cea mai bună


combinație liniară a variabilelor, în sensul explicării unei cantități cât mai mari de
varianță în date. În general interpretarea factorilor este facilitată atunci când
variabilele saturează în mod semnificativ doar unul dintre factori. Totuși,
cercetătorul trebuie să examineze și variabilele care saturează mai mulți factori
sau eventual niciunul.

vi. Validarea analizei factoriale. Aspectul central urmărit de analiza factorială îl


reprezintă generalizarea rezultatelor obținute la nivelul populației din care a fost
extras eșantionul. Situația tipică în cercetarea socială este aceea în care
dispunem de date obținute pe un eșantion de obiecte (indivizi, localități, produse,
partide etc.) din populație. In cazul analizei factoriale datele originale de la care
pornim sunt corelațiile (covarianțele) din cadrul unui set de variabile observate ,
obținute pe un eșantion.

Există două tipuri de inferențe pe care cercetătorul trebuie să le facă. O serie


de judecăți implicative trebuie să le facă vizavi de estimarea structurii factoriale
latente. Aceste inferențe țin de logica naturală a fenomenului studiat. Cealaltă
serie de inferențe se referă la generalizarea aspectelor depistate la nivelul întregii
populații. În acest caz judecățile implicative se aplică rezultatelor obținute, care
sunt de tip statistic. Există chiar un capitol separat al statisticii numit inferența
statistică. Aceasta presupune estimarea magnitudinii și a probabilității erorii pe
care le facem atunci când extindem rezultatele descoprite pe eșantion la nivelul
întregii populații.
Dincolo de problemele de inferență statistică, validarea analizei factoriale are o
seamă de aspecte de natură logic-conceptuală, adică extrastatistice. Metoda cea
mai utilizată de validare a rezultatelor este trecerea de la perspectiva exploratorie
la cea confirmatorie și evaluarea replicabilității rezultatelor. Acest lucru se poate
face, de exemplu, prin împărțirea eșantionului în două și compararea rezultatelor
pentru cele două eșantioane, fie prin folosirea unui alt eșantion extras din aceeași
populație. Analiza factorială confirmatorie este cea mai utilizată metodă din
ultimele trei decenii de cercetări sociale.

S-ar putea să vă placă și