Sunteți pe pagina 1din 5

1

Analiza factoriala Tehnic statistico-matematic pentru reducerea datelor. Prin a.f. se determin factorii (variabilele latente) care pot explica varia ia unui set de variabile direct observabile (manifeste), corela iile dintre ele i intensitatea leg turii dintre factori i fiecare dintre variabilele manifeste. Inten ia de schimbare a locului de munc (SLM), spre exemplu, poate fi influen at de factori precum rela iile cu colegii (COLEG), recompensele materiale asociate locului de munc (RECOM), condi iile fizice de lucru (CFIZ) i con inutul muncit (CONM). Fiecare dintre factorii respectivi este m surat prin cte un set de variabile. Dac toate variabilele observabile incluse n analiz snt standardi zate (au media 0 i abaterea standard 1) atunci SLM poate fi exprimat ca o combina ie liniar a factorilor men iona i: SLM = a. COLEG + b . RECOM + c. CFIZ + d. CONM + U unde a - m sur a influen ei factorului COLEG asupra SLM, iar 6, c i d - m suri similare pentru factorii RECOM, CFIZ i CONM. Prin U snt semnificate alte influen e asupra variabilei SLM. n general, pentru un set de n variabile observabile pot exista k factori, care explic varia ia acestora (k < p). Factorii care explic varia ia a cel pu in dou variabile se numesc factori comuni. Cei care explic varia ia tuturor variabilelor snt denumi i factori general i, iar cei limita i la numai un set de variabile factori de grup. n cazuln care snt asocia i numai cu varia ia unei singure variabile se cheam c snt factori specifici. Orice variabil x, standardizat , poate fi exprimat printr-o ecua ie asem n toare cu cea de regresie multipl : xi = a1iF1 + a2i F2 +-... + aji Fj + akiFk + uj. Coeficien ii a ij poart numele de coeficien i de satura ie ai variabilei i n factorul j i snt o m sur a influen ei factorului j asupra variabilei i. n cazul n care a.f. este astfel realizat nct factorii ob inu i snt independen i ( a.f. ortogonal ) ntre ei (precum n cazul metodei componentelor principale a lui Hetelling) a ij pot fi considera i coeficien i de corela ie simpl ntre indicatori i factori. Dac a.f. genereaz factori neindependen i, atunci satura iiie pot fi interpretate ca echivalente cu coeficien ii de regresie par ial standardizat (beta). Suma p tratelor coeficien ilor de satura ie pentru o variabil dat n to i factorii comuni poart numele de comunalrtate i semnific propor ia din varia ia variabilei respective explicat de factorii comuni. Comunalitatea are aceea i semnifica ie ca i coeficientul de determina ie multipl din analiza de regresie. Diferen a const doar n faptul c variabilele independente pentru calcularea comunalit ii snt factori cu caracter latent. Coeficientul ui m soar influen a factorilor specifici i a erorilor de m surare asupra variabilei Xj. P tratul coeficientului ui poart numele de unicitate i indic ponderea din varia ia lui Xj neexplicat de factorii comuni. Matricea n care snt nscri i pe coloane factorii ob inu i iar pe linii satura iiie corespunz toare fiec rei variabile poart numele de matrice a factorilor sau a pattern -ului factorial. Dac n a.f. snt incluse p variabile atunci varia ia total din matricea respectiv este egal cu suma varia iilor specifice fiec rei variabile. n cazul n care se lucreaz cu variabile normalizate, care au abaterea standard i dispersia egal cu 1, dispersia total din matr icea datelor ini iale este egal cu num rul de variabile (p x 1). Fiecare factor explic o anumit parte din aceast dispersie. Contribu ia factorului la explicarea dispersiei totale este dat de suma p tratelor satura iiior din factorul respectiv i poart numele de valoare

proprie a factorului (eigen -valoare"). Aceasta poate fi exprimat ca cifr absolut sau relativ prin raportare la dispersia total din matricea de date. Cei mai simplu model de a.f. este cel n care se presupune existen a unui singur factor comun. Acesta este modelul pe care Charles Spearman (1904), fondatorul a.f., l-a folosit pentru analiza rezultatelor ob inute de c tre b ie ii dintr -o coal din Anglia la ase tipuri de m sur tori: notele la limbi clasice (C), englez (E), francez (F), matematic (M), evaluarea talentului muzical (T) i o m surare a capacit ii sportive (P). Coeficien ii de corela ie dintre cele ase m sur ri snt baza de pornire pentru a.f.:
C C F E 1,00 0,83 0,78 F 0,83 1,00 0,67 0,67 0,65 0,57 E 0,78 0,67 1,00 M 0,70 0,67 0,64 P 0,66 0,65 0,54 0,45 1,00 T 0,63 0,57 0,51 0,51 0,40

M 0,70 P T 0,66 0,63

0,64 1,00 0,54 0,51 0,45 0,51

0,40 1,00

Prelucrnd aceste date cu ajutorul unei variante de a.f. (metoda centroid propus de Cyril Burt, 1917) se ob in urm toarele rezultate: Factorul comun, inteligen a general , explic , deci, n principal, performan ele elevilor la
C satura ie F E M P T

0,962 0,883 0,815 0,743 0,662 0,645

comunalitate unicitate

0.92 0,78 0,66 0,55

0,44 0,42

0,08 0,22 0,34 0,45

0,56

0,58

limbile clasice (92%), la francez (78%) i la englez (66%), Performan ele lor muzicale i sportive au, n schimb, determin ri specifice puternice, independente de inteligen a general . Dac modelul factorial adoptat este adecvat datelor, atunci este de a teptat ca matricea coeficien ilor de corela ie observa i s poat fi ct mai fidel reconstituit pe baza coeficien ilor de satura ie. n condi iile n care diferen ele ntre corela iile empirice i cele teoretice (reconstruite) snt reduse, se poate considera c modelul factorial adoptat este concordant cu datele. Procedura de reconstruire a unei matrice de corela ii din coeficien ii de satura ie este extrem de simpl n cazul a.f. ortogonale (cu factori independen i). Corela ia teoretic dintre dou variabile este egal , n astfel de cazuri, cu suma produselor dintre satura iile corespunz toare

ariabile entru fiecare fact r. n exemplul anteri r, exi tnd un ingur fact r, acel corela ia teoretic dintre notele la limbi clasice i matematic , spre exemplu, este x , , . orela ia empiric dintre acelea i ariabile este egal cu , practic identic , . n matricea de mai jos snt date corela iile corespunz toare exemplului men ionat i, n paranteze, corela iile reziduale ca diferen e ntre corela iile empirice i cele teoretice:

ac alorile corela iilor reziduale snt neglijabile, precum n exemplul men ionat, atunci modelul factorial adoptat poate fi considerat ca adecvat testul X2 poate fi folosit pentru estimarea concordan ei modelului cu date le). iferite tehnici factoriale au capacit i diferite de identificare a modelului cel mai simplu, adecvat unui set de date. Pornind de la principiile structurii simple, formulate de hurstone , ), n practica statistic actual J. oehlin, ) se consider c un model factorial este cu att mai simplu cu ct a. extrage un num r mai redus de factori criteriul parcimoniei), b. con ine un num r mai redus de satura ii cu valoare diferit de sau are mai multe satura ii cu valoare ab solut foarte mic . u importan mai redus n evaluarea simplit ii snt i cerin ele ca: c. factorii s fie independen i i d. satura iile s aib o distribu ie egal pe factori sau pe variabile, n leg tur cu primele dou exigen e se definesc secven ele de baz n . . explo-ratorie cea n care nu se porne te de la un set de ipoteze ini iale n leg tur cu satura ii le nule, precum n . . de confirmare): extragerea factorilor i rota ia factorilor. n cadrul primei secven e se determin cel mai mic num r de factori care explic o parte semnificativ din varia ia total a indicatorilor folosi i pentru analiz . ele mai utilizate metode pentru .Burt, ), analiza componentelor principale aceasta snt metoda centroid . otelling, ), metoda factorilor canonici ao, , arris, 2) i cea a factorilor Alfa Kaiser i affrey, ). Analiza componentelor principale are un statut aparte n raport cu celelalte metode. omponenteleprincipale snt simple combina ii liniare de variabile observabile i nu factori propriu-zi i n sensul de variabile latente. Prin aceast metod se transform un set de p variabileobservabile corelate ntr-un set de variabile necorelate componente principale). um rul de factori este egal cu num rul de variabile n acest caz. intre ace tia, pentru recalcularea comunalit ilor i pentru interpretare se re in numai cei cu valori proprii mari. Pentru a decide num rul de variabile latente factori) care pot fi considerate ca semnificative pentru a explica intercorela iile dintre va riabilele observabile, pot fi folosite mai multe procedee. el mai simplu este dat de regula Kaiser-Quttman prin care se indic re inerea n model a tuturor factorilor care au o valoa re proprie mai mare dect

1. Testul grohoti ului" (scree test, denumit astfel de c tre R.B. Cattel, 1966) opereaz n baza unei dia grame n care se noteaz pe ordonat m ri mea valorii proprii a factorilor iar pe abscis num rul factorului. Tendin a este ca dup primele valori proprii de nivel ridicat s urmeze valori proprii cu nivel din ce n ce mai redus. Punctul de cotitur al liniei care poate fi trasat n func ie de cele dou axe indic num rul de factori care trebuie re inu i n model. Dup extragerea factorilor se proce deaz la a azisa lor rotire, opera ie prin ca re se urm re te satisfacerea criteriului 2 de simplitate a modelului factorial. Practic, n urma unei astfel de rotiri rezult cu mai mult claritate variabilele care definesc un anume factor (n cadrul aceluia i factor se acce ntueaz decalajele dintre valorile satura iilor). Rota ia de tip Quartimax (Neuhaus, Wrigley, 1954) este indicat n special n cazurile n care se presupune existen a unui factor general, n schimb, analizele de tip Varimax (Kaiser, 1958) snt mai potrivite n ipoteza existen ei unor factori de grup. Ambele va riante de rotire a factorilor permit transform ri ortogonale, n care factorii r mn inde penden i. A.f. oblice snt indicate n situa iile n care se poate sus ine ipoteza c factorii nu snt independen i ntre ei. Ie irile numerice din a.f. ortogonale snt satura ii le (a c ror distribu ie pe factori poart numele de pattern factorial), comunaiit ile, unicitatea i va lorile proprii. n plus fa de acestea, a.f. oblice dau i corela iile dint re factori (matricea intercorela iilor factoriale) i corela iile dintre variabile i factori (matricea structurii factoriale). Interpretarea factorilor se face n func ie de satura iile maxime specifice fiec ruia dintre ei. Utilizarea a.f. n sociologie pune o serie de probleme legate n primul rnd de natura foarte diferit a variabilelor utilizate. Standardizarea variabilelor pentru a avea media 0 i abaterea standard 1 atenueaz oarecum aceast problem dar nu o elimin . Pe ct posibil, este indicat, deci, ca n a.f. s fie incluse variabile m surate cu acelea i unit i ( . Torrens-lbern, 1972). Atunci cnd datele de intrare snt coeficien i de corela ie, rezultatele a.f. au o valabilitate local , dependent de ab aterile standard nregistrate pentru variabile n e antionul fo losit. Pentru a compara patternurile factoriale ale aceluia i model n e antioane sau loturi diferite este mai indicat folosirea covarian telor n locul corela iilor ca date de intrare. n al doilea rnd, structura cauzal presupus de modelul factorial este, se pare, mai pu in ntlnit n sociologie dect n psihologie. O astfel de structur are configura ia dat de o variabil latent de la care pleac influen e spre variabilele m surate. n tre acestea din urm se presupune c nu exist rela ii cau zale directe. Or, o astfel de situa ie este destul de greu de ntlnlt n analizele de tip so ciologic. Linearitatea rela iilor dintre factori i indicatori este o alt condi ie a aplic rii teh nicilor obi nuite de a.f. Acestea snt destul de robuste" din acest punct de vedere. Fo losirea cea mai frecvent a a.f. se face n cadrul modelelor de m surare. Obiectivul acestora este de a determina ct de bine es timeaz anumi i indicatori o variabil l atent . Supraaprecierea importan ei sau relevan ei unor indicatori n raport cu o variabil latent se produce n baza unor erori de selectare a indicatorilor respectivi. Dac al turi de indica tori corela i moderat ntre ei se includ n a.f. i indicatori cu grad foarte ridicat de intercorelare, inter anjabili ntre ei, atunci este de a teptat ca satura iile i respectiv comuna lit iie corespunz toare acestora din urm s fie foarte mari n detrimentul celorlalte. Omi terea unor indicatori cu relevan spor it pentru o anume variabil latent poate duce ia subestimarea satura iilor corespunz toare respectivei variabile. Pe de alt parte, itemii care coreleaz foarte

slab n matricea de corela ii ini iale este indicat s fie elimina i din a.f. deoarece este pu in probabil ca ei s fie explica i prin factori comuni adecva i pe ansamblul matricei. Calitatea rezultatelor a.f. este influen at i de num rul de variabile i de unit i utilizate. Cu ct num rul de variabi le observabile luate n considera ie este mai mare, cu att este mai mic eroarea posibil asociat cu modul de estimare a comunalit iior (La peste aproximativ 40 de variabile, o astfel de eroare are influen e neglijabile asupra rezultatelor a.f.). n leg tur cu num rul de unit i, n mod relativ conven io nal se consider c acesta ar trebui s fie de aproximativ cinci ori mai multe dect num rul de variabile. n a.f. de confirmare snt implicate att un model de m surare, ca re predetermin rela iile dintre variabilele latente i indicatori, ct i un model structural prin care se specific rela iile dintre variabile le latente. De obicei, acesta din urm este redus la simpla intercorelare dintre factori. n patternul factoria l snt nscrise de la nceputul analizei satura iile cu valoarea zero n baza ipotezelor referitoare la raportul dintre va riabilele latente i indicatori. Restul satura iilor se determin astfel nct corela iile teoreti ce la care se ajunge pe baza lor s difere ct mai pu in de corela iile empirice. Metode iterative orientate de exigen e ale metodei celor mai mici p trate snt folosite n acest sens. Modele de analiz cu variabile latente de mare complexitate, n care snt implicate att modele de m sur ct i modele structu rale, snt abordate cu metode i programe de tip LISREL (Linear structural relations, Joreskog i Sorbom, 1084). D.S.