Analiza Factorilor

Analiza Factorilor O sarcina majora este de a dezvolta constructe teoretice care aduc impreuna mai multe fenomene observate.
Exemplele istorice ale acestui lucru includ atat studii de abilitate cat si de personalitate.In trecut,media corelatiei majore observata in timpul studierii abilitatii a dus la constructul teoretic al inteligentei generale.In trecut,media corelatiei majore dintre variabilele personalitatii cum ar fi emotia si frustrarea au dus la constructul teoretic de anxietate(sau nevroza).Validitatea constructului a acestor constructe teoretice a fost examinata prin analiza factorilor.Analiza factorilor este o tehnica de statistic ace reproduce datele folosind cat mai putini factori(potentiale constructe teoretice sau variabile latente ) cu putinta.O metoda uzuala in analiza factorilor e dezvoltarea la scara.Cand alegem o submultime a itemilor pentru o scara trebuie sa stim cate constructe pot fi masurate din multimea de elemente si care elemente pot masura fiecare construct.Aceasta informatie este oferita de analiza factorilor.Elementele sunt analizate pentru a gasi cel mai mic numar de factori care pot reprezenta campurile acoperite de elemente.Relatia fiecarui element cu factorii indica cum pot fi folositi pentru a masura unul dintre factori. Pe de alta parte o analiza a factorilor poate rezulta intr-o scala pentru a masura un construct teoretic intr-un studiu viitor,analiza factorilor confirmatoare si analiza extinsa in analiza factorilor exploratoare permit o alta optiune.Analiza factorilor poate fi folosita intr un nou studio pentru a confirma sau infirma relatiile dintre factori sau cu alte variabile ce nu sunt in analiza factorilor .Nu sunt necesare scoruri ale factorilor. Desi nicio analiza a factorilor nu este in totalitate exploratoare-este intotdeauna un model teoretic de baza de care datele sunt colectate-unele analize ale factorilor sunt initial exploratoare dar fara ipoteze si altele sunt initial confirmatoare testand in special ipoteze.Ambele tipuri de analize a factorilor sunt studiate in acest capitol. Scopul acestui capitol este de a a oferi o prezentare de baza dar cuprinzatoare a analizei factorilor.Intentia este de a oferi cititorului un fundament de a citi,a aprecia si a critica cercetarile folosind o perspective a analizei factorilor,un articol ce foloseste analiza factorilor intr un mod gresit sau un articol care ar putea fi imbunatatit daca s ar folosi analiza factorilor.Desi nu se foloseste un studiu statistic particular ,acest capitol ofera materialul necesar de a selecta optiuni pentru o analiza a studiului care sunt mai adecvate pentru scopul studiului. Capitolul incepe cu ecuatiile si definitiile de baza ale analizei factorilor.Aceasta parte introduce termenii necesari pentru a intelege modelele analitice factoriale si variatiile modelelor.A doua parte a acestui capitol prezinta modele factoriale, incluzand analiza componentelor si analiza factorilor comuni.AFC include atat analiza factorilor exploratoare cat si analiza factorilor confirmatoare. Mai mult,toate
aceste variabile pot fi folosite impreuna cu modele factoriale corelate sau necorelate.Sa fie prezentata cu fiecare model este informatia teoretica esentiala pentru a intelege modelul si informatia practica esentiala pentru a folosi modelul. In loc sa reevaluam toate proceurile posibile ce se pot aplica fiecarui model,fiecare sectiune include toate procedurile care acum au baza empirica si teoretica suficienta pentru a fi procedura generala dorita pentru acel model.In unele cazuri mai sunt unele variatii minore in cadrul procedurilor folosite si acestea sunt analizate impreuna cu modelul in care se aplica variatia. Desi ultimele decenii au dus la alegeri clare a unor proceduri pentru unul sau mai multe modele,cateva domenii privind analiza factorilor prezinta inca probleme majore nerezolvate .Trei astfel de probleme au aparut dupa ce modelele au fost prezentate.Prima este dezbaterea continua dintre adeptii a doua tipuri de analiza exploratoare:componente si factori comuni.Cea de a doua este problema extragerii factorilor dintr un anumit set de date.Cea de a treia este intrebarea a cum pot fi legati factorii dintr un set de date cu alte variabile care erau in setul de date ,dar care nu erau incluse in analiza factorilor si cum pot fii factorii relationati in studii. Sectiunea de incheiere se refera la elementele de design din cercetare care trebuie amintite in proiectarea studiului analizei factorilor.In aceasta sectiune sunt incluse si discutiile despre necesitatea variabilelor de inalta calitate si de cate cazuri este nevoie. Sunt folosite trei exemple pentru a ilustra analiza factorilor.Primul este cel a 6 teste psihologice pentru care structura este usor de observat in matricea de corelare (Gorsuch,1983).Trei dintre variabile sunt corelate cu abilitatea verbala si trei cu anxietatea.Cel de al doilea exemplu este un caz in care cunoastem ceea ce factori ar trebui sa fie:rubrici(Gorsuch,1983).Studentii absolventi au luat 10 masuri din rubricile pe care le au gasit acasa.Pentru ca acestea sunt toate masurile intre spatiul tridimensional,ne asteptam ca factorii sa fie acele trei dimensiuni :lungime,inaltime si latime. Cele trei exemple folosesc esantionul folosit pentru Wechsler Adult Intelligence Scale III(WAIS-III;Gorsuch,2000).Matricea este publicata intre scorurile scalate din analiza de baza.Structura factorilor WAIS si versiunile lui ,WISC(Wechsler Intelligence Scale for Children) au fost analizate intens. Bazele analizei factorilor Scopul analizei factorilor este acela de a rezuma relatiile chiar si acelea care sunt incluse,cu referire la variabile ,cu un set de cateva constructe,factori.Analiza serveste drept ajutor in dezvoltarea teoriei si contruirea scalei.Termenul de variabile este folosit pentru cele mai multe analize ale factorilor sunt facute pe scale ce masoara
carui termen i se poate aplica imediat;oricum,alte tipuri de date ,precum oamenii,pot fi folosite (vezi Gorsuch,1983.Thompson,2000). Intelegerea este de ajutor cand sunt gasite mai multe variabile care masoara acelasi construct si pot fi astfel puse in relatie(exp: factori). De exemplu,in zona inteligentei ,scalele cu etichete de vocabular si similitudini puternic corelate pot fi considerate manifestari ale abilitatii verbale.Pentru ca vocabularul si similitudinile au fost descoperite in relatie cu acelasi factor,dezvoltarea teoretica poate fi luata in considerare in acelasi timp pentru vocabular si similitudini luand in seama factorii. Constructia scalei este de folos cand relatiile dintre elemente arata elementelor sa se imparta intr un anumit numar de grupuri.In psihologia religiilor,elementele motivatiei,de exemplu, se impart in grupuri de elemente reprezentand o motivatie intrinseca ( de exemplu:Motivul principal pentru care merge la Biserica este pentru a ma inchina lui Dumnezeu) si motivatie extrinseca (exp:Singurul motiv pentru a merge la Biserica este de a intalnii prietenii).Elementele se impart in diferite grupuri astfel incat intr un grup elementele sunt in relatie cu un factor si nu cu ceilalti factori.Elementele pot fi alese dupa factorii de pe scala. Observati ca exista o mica generalizare a factorilor( pentru ca variabilele unui factor nu coreleaza cu variabilele altui factor) si astfel analiza factorilor identifica calitativ dimensiuni diferite.Intr un factor este identificata o generalizare cu diferente cantitative ( exp: cum coreleaza fiecare variabila cu factorii). In plus,in analiza clasica pe scale a factorilor, sunt alte utilitati ale analizei factorilor.Poate fi folosita pentru a reduce diferite probleme gasite in analizarea datelor. O problema in analiza datelor este problema de colinearitate.Aceasta apare cand mai multe scale care sunt proiectate pentru a masura acelasi construct sunt folosite in acelasi studiu.Astfel de scale coreleaza asa de bine incat afecteaza statisticile ca si corelatiile multiple.In primul rand cu colinearitate multipla sunt instabile mai multe regresii beta si ,prin urmare,greu de reprodus.In al doilea rand un alt grad de libertate este folosit pentru fiecare scala aditionala care masoara ceea ce si alta scala masoara.Este de dorit sa cunosti masurarile aditionale pentru ca ele cresc acuratetea generala a studiului.Colinearitatea multipla poate fi chiar printre variabilele dependente sau independente. O solutie pentru problema colinearitatii multiple este sa factorizam variabilele;apoi factorii sunt folositi in locul variabilelor.Aceleasi domenii intra sub incidenta cu analiza factorilor si cele de sub incidenta variabilelor si analiza factorilor arata suprapunerea intre scale.Factorul de colinearitate multipla va fi scazut.
O alta problema cu statistici ca corelarile multiple este ca greutatile de regresie au eliminat toate covariatiile dintre variabile.Face asta separand celelalte variabile din greutati.Ceea ce este comun-asta este variatia de predictie pe care 2 sau mai multe variabile o au in comun s ar putea sa nu fie vazut in toate greutatile beta.De aici inainte regresia multipla poate fi semnificativa chiar daca niciuna dintre greutati nu este semnificativa;aceasta este varianta pe care variabilele o au in comun care anticipeaza variabila dependenta.Solutia este sa extragi cat mai multi factori cate variabile sunt si sa restrictionezi solutia pentru care factorii sunt necorelati.Cand acestea sunt folosite ca anticipatori intr o regresie multipla ,toate covariatiile sunt distribuite intre variabile si apar in greutati. Dezvoltarea analizei factorilor este o procedura statistica care provine din mici patrate generalizate(GLS) model folosit in regresie si alta analiza a patratelor .Presupunand ca toate variabilele sunt in forma scorului Z dupa o conventie ,modelul se bazeaza pe acest set de ecuatii: X i1 =w 1a Ai+w1bBi+w1cCi+w1dDi++ui1 Xi2=w2aAi+w2bBi+w2cCi+w2dD2++ui2 Xi3=w3aAi+w3bBi+w3cCi+w3dDi++ui3 Xiv=wvaAi+wvbBi+wvcCi+wvdDi++uiv (6.1) Unde,pentru prima linie X este scorul pentru persoana i la variabila 1,w este greutatea pentru variabila 1 pentru factorul A si A este scorul pentru persoana i la factorul A.Ecuatia exprima factorii de la A la D si indica faptul ca ar putea fi mai multi.Variabilele aditionale sunt indicate pentru un total de v variabile in analiza. Ultimul element al fiecarei ecuatii ,u, este acela care este unic pentru variabila particulara,numita des eroare sau reziduu.Fiecare u este intr o coloana separata pentru a indica ca fiecare este diferit de un alt u.Sunt asa de multi u diferiti cate variabile sunt.Este important sa observam ca unicitatea fiecarei variabile (u) include doua surse de variante.Prima este eroarea aleatoare din cauza lipsei de fiabilitate si a doua este ca varianta din variabila nu este estimabila din factori. Cand ecuatia precedenta este rezolvata pentru fiecare variabila depandenta ,corelatia multipla dintre factori cu care variabila poate fi calculata.In analiza factorilor ,patratul aceste corelatii multiple este numit communality (h 2 ) pentru ca este un index care arata cat de multe are variabila in comun cu factorii. Ce valoare maxima poate atinge `communality`?Valoarea maxima este 1.0 pentru ca altfel toate variantiile variabilelor vor fi reproduse de factor.Dar maximul psihometric este coeficientul de fiabilitate al variabilei ,care,este definit ca proportia maxima a variabilei care poate fi reprodusa dintr-o forma perfect paralela,desi exista
sansa de a produce un esantion de communality mai usor prin capitalizarea ocazionala.Bineinteles,fiabilitatea ofera comunul doar daca toate variantele noneronate sunt reproduse de factori.Cel mai bun rezultat este cel pe care factorii il treproduc doar ca parte a unei variante fiabile si astfel,lucrurile comune se asteapta sa fie mai putine decat fiabilitatile. In timp ce ecuatia 6.1 ofera definitia matematica a analizei factorilor in termenii matricei de date (X),analiza insasi poate,ca in analizele regresiilor sa treaca matematic de la corelatiile lui Pearson la variabile.Analiza factorilor poate fi prezentata ca analiza corelatiei fara nicio referire la scorurile actuale,dar ele pot fi induse in eroare.Unele technici care rezulta din matricea corelatiei (ex:analiza grupurilor) nu au o relatie matematica directa cu variabilele observate.Analiza factorilor are;este o analiza a datelor observate folosind corelatiile doar ca un pas intermediar favorabil. Analiza factorilor ar fi putut rezulta din covariante in locul corelatiilor.Daca,covariantele sunt folosite atunci variabilei cu cea mai mare varianta ii este data o greutate mai mare in solutie.De exemplu,daca veniturile erau calculate in dolari pe an si educatia era masurata in numarul de ani petrecuti in scoala ,varianta trecuta,fiind in zeci de mii ar fi influentat rezultatele mai mult decat in trecut,a carui varianta ar fi mai mica de 10.Cu datele stiintei sociale in care variantele sunt arbitrare ,rareori este util sa se incline balanta cu solutia spre variabilele cu variante inalte.Retineti ca,corelatiile sunt afectate de restrictiile din rand.Cand randul cu variabile este gasit mai putin normal,corelatiile sunt slabe.Cand sunt puse astfel de restrictii,sarcinile factorilor vor fi mai scazute decat atunci cand randurile sunt mai mari.Intr o astfel de situatie,este necesar sa fie corecte corelatiile pentru restrictie sau sa se foloseasca covariantele.Factorizarea covariantelor produce greutati ale factorilor care sunt aceleasi in ciuda restrictiilor.Ei pot ,in afara greutatii inconveniente sa fie mai dificil de interpretat pentru ca nu sunt in intervalul de la 1 la 1 cum sunt corelatiile.Se considera corelatiile ca fiind factorizate fara sa fie stabilite. Tabelul 6.1 da un exemplu simplu de 6 variabile.Partea stanga a tabelului reda matricea corelatiilor observate si cea de a doua parte reda corelatia factorilor cu variabilele.Arata ca primele trei variabiel formeaza un factor si urmatoarele trei formeaza alt factor.Motivul pentru care aspectele comune sunt putine este ca acestea toate sunt forme de scurta durata cu un nivel scazut pentru a modera fiabilitatile din esantion. Rezultatele unei analize a factorilor include gradul in care fiecare factor se afla in legatura fiecare variabila.Cand un factor se afla in legatura cu o variabila,cel mai bine e sa spui ca factorul incarca variabila.Incarcarea se refera la relatia dintre un factor si o variabila in general dar nu o valoare numerica particulara.Este mai bine sa se foloseasca termenul de incarcare pentru a stabili daca un factor contribuie la o variabila.De cate ori se face referire la un numar,trebuie raportat tipul de incarcare a
factorului.Astfel ,este necesar sa se intrebe Incarca factorul A variabila 3? si sa se raspunda Da,coreleaza.58 cu variabila.Sunt trei tipuri de factori care incarca.Primii sunt factorii scorurilor z pentru a estima scorurile variabilelor z.Urmatorii sunt corelatiile dintre fiecare factor cu fiecare variabila.Si ultimul si cel mai putin folosit este corelatia partiala dintre fiecare factor cu fiecare variabila cu altii factori din afara. Este o presupunere in analiza ultimelor patrate ale ecuatiei 6.1,care include analiza factorilor.Folosirea modelului presupune ca fiecare ecuatie sa fie aplicata la fel pentru fiecare persoana.Este greu pentru aceste analize sa se lucreze bine daca X este o functie a factorilor A si B pentru jumatate din esantion si o functie a factorilor C si D pentru celalalta jumatate.Asta se poate intampla ,de exemplu,cand sunt mai multe cai de schimbare a variabilelor.Sa consideram o situatie ipotetica in care copiii din comunitatile sarace obtin numai rezultate bune la examene daca ei sunt destepti din nastere(pentru ca ,trebuie sa recunoastem,comunitatile sarace nu pot contribui mult la rezultatele lor).Apoi,cei din comunitatile bogate vor obtine rezultate mari la examene mai putin relationate cu luminozitatea(desteptaciunea) innascuta din cauza resurselor care au dus la un mediu puternic de invatare.Pentru ca sunt influente diferite in munca in diferite parti ale esantionului,analiza factorilor va fi depasita si nu reprezinta bine nicio comunitate. In analiza factorilor,scopul este gasirea unui numar limitat de factori care vor reproduce foarte bine scorurile observate.Acesti factori,odata cantariti,vor reproduce scorurile observate in esantionul original si ,in noul esantion va estima care vor fi scorurile observate dupa masurare.Bineinteles,inversul poate fi de asemenea de interes:folosind scorurile observate pentru a masura factorul.Dar in cel din urma caz,factorul nu este masurat pentru a estima scorurile observate ci mai degraba pentru a generaliza variabilele care sunt de asemenea corelate cu factorul.Aceste doua abordari sunt vazute in exemple.Casetele sunt analizate pentru a indentifica factorii:lungime,inaltime si latime.Cunoscand factorii putem doar sa masuram direct lungimea ,inaltimea si latimea si sa calculam alte variabile ca si cum ar fi o diagonala.Opusul interesului intr un test de inteligenta;scale precum Similitudini si Vocabular sunt folosite pentru masurarea capacitatii de vorbire.Psihologii examineaza apoi,de exemplu,impun unei persoane exigente de inalta capacitate verbala pentru a observa ,indiferent daca acestea sunt cum se asteptau, capacitatea verbala a persoanei. Retineti ca in analiza factorilor sunt cunoscute doar scorurile observate,Xs in ecuatia 6.1;scorurile factorilor (A,B,etc.),greutatile(ws),originalitatile(us) sunt necunoscute.Cu o cunoscuta si trei necunoscute este imposibil ,din punct de vedere matematic sa se rezolve ecuatiile fara restrictii suplimentare.Restrictiile adoptate pentru a permite rezolvarea pentru ambii factori si greutatile lor sunt functia modelului de factor.
MODELELE ANALITICE ALE FACTORILOR SI ANALIZELE LOR Pentru a rezolva ecuatia 6.1 pentru ambii factori si greutatile lor,trebuiesc impuse restrictiile.Acestea pot fi minime sau extinse.Vechile restrictii-cele minimaleinclud clasa modelelor cunoscute ca analizele factorilor exploratoare(EFA).Principiile matematice sunt selectate pentru restrictii dar nu exista restrictii care sa tina cont de orice teorie pe care ar putea sa o aiba investigatorul.Rezultatele se bazeaza doar pe datele observate.Acestea din urma restrictiile extinse-includ modelele cunoscute ca analizele factorilor confirmatoare(CFA).Bazandu se pe teorii sau cercetari anterioare,este propus si testat un set de greutati daca greutatile adecvate reproduc variabilele observate.Se observa ca restrictiile nu sunt neaparat o dicotomie intre minimal si extins.Unele forme de EFA sunt mult mai restrictionate decat altele si unele forme de CFA sunt mai putin restrictionate decat altele.Aceste variatii decurg din ceea ce investigatorul este dispus sau este nevoie sa specifice.
Analiza componentelor Componenta analizelor (CA) restrictioneaza ecuatia 6.1 prin eliminarea termenului unicitatii,u.Astfel interesul este pentru factorii(de asemenea numito componente cand se foloseste CA) care reproduc fiecare dintre toate variabilele si se asteapta la elemente comune de la 1.0.Utilizatorii CA nu sustin niciodata ca variabilele lor au fiabilitati de 1.0 si valoarea elementelor comune este in general mult mai mica de 1.0 .Si utilizatorii Ca stiu ca variabilele nu vor avea corelatii multiple de aproape 1.0 cu alte variabile( necesar pentru ca factorii sa aiba o corelatie multipla de 1.0 cu fiecare variabila).Altfel nicio variabila ,exceptie facand hazardul capitalizarii,nu poate avea o valoare de elemente comune de 1.0.Dar sustinatorii simt ca CA ofera cu o corelatie solida intre variabile,o aproximare rezonabila cu o deformare neglijabila de la fiabilitatea ignorata si mai multe corelatii mai mici de 1.0 ignorate. Derivatiile arata usor faptul ca primul pas in toate analizele factorilor exploratoare este sa evaluezi corelatiile dintre variabilele observate.Este important sa observi ca,tehnic,este o matrice de covarianta intre scorurile Z care sunt factorizate.Principala diagonala contine variantele-cre sunt 1.0 din definitia scorurilor Z.Elementele din afara diagonalei sun technic covariantele dintre scorurile Z care,pentru ca scorurile Z au variantele de 1.0,sunt de asemenea corelatiidintre variabile.Procedurile mentionate sunt apoi aplicate pe matricea corelatiei pentru a extrage componentele. Pentru a extrage factori din matricea de date,trebuiesc impuse mai multe restrictii prin care se presupune ca u-urile sunt zero.Restrictiile sunt matematice si folosesc o procedura din doua.In prima procedura,principalele componente au restrictia ca primul factor este cel mai mare posibil,cel de al doilea este cel mai mare dupa ce primul a fost extras si asa mai departe pentru tori factorii.Cea de a doua ,de risc maxim ,adauga
restrictia ca fiecare ar trebui sa aiba cel mai mare risc decat cel gasit in populatie.Cea din urma este mai greu de calculat ,dar ambele sunt aproximativ similare-si amandoua devin si mai asemanatoare odata cu cresterea N-ului.Ar fi surprinzator daca ar exista diferente interpretabile intre aceste doua proceduri cu un N rezonabil. Factorii extrasi sunt direct interpretabili.De aici inainte factorii sunt rotiti,adica sunt transformati pentru a satisface anumite criterii in timp ce isi pastreaza elementele comune.Criteriul folosit de obicei pentru rotatie este o structura simpla,care poate fi definita pe scurt ca numarul maxim de variabile de incarcare a unui singur factor cu o conditie laterala ca aceste incarcari sa se imprastie intre cat mai multi factori posibili.Tabelul 6.1 arata o excelenta structura simpla.Fiecare variabila este incarcata de un singur factor si fiecare factor incarca un set diferit de variabile.Pentru ca rotatia se aplica pentru toate metodele EFA dar are modele corelate si necorelate in ceea ce priveste modul in care factorii sunt restrictionati,este discutata in sectiunea capitolului numit Restrictii ale factorilor necorelati dupa ce sunt notate celelalte metode EFA . CA sunt mult mai economice decat alte modele bazate pe ecuatia 6.1 astfel ecuatiile sunt mai simple cand singurul termen este eliminat din ecuatia 6.1.Unul dintre efecte este ca scorurile factorilor pot fi direct calculate.Acesti factori sunt combinatii lineare de variabile observate care pot servi drept rezumate pentru functiile reprezentate de factor.Astfel de factori fac referire la cei care care vor sa fie la curent cu datele si care,sustin filozofic ca toate constructele sunt convenabile pentru rezumarea datelor. CA a fost considerata ca fiind doar o procedura EFA,fara o versiune CFA.Aceasta este adevarata intr un cadru mai restrans al definitiei analizei factorilor aplicata in general.Dar in termeniimodelului ecuatiei 6.1 si logicii CA,o analiza confiramtoare a componenteloreste tehnic posibila.Problema este ca niciun test semnificativ nu este posibil pentru ca modelul CA nu are loc pentru erori. Analizele factorilor comuni Modelele factorilor comuni folosesc ecuatia 6.1,inclusiv termenul unicitatii.Fiecare unicitate este suma mai multor variante care nu se gasesc in analiza factorilor.Acestea includ erori aleatoare(de la lipsa de fiabilitate si erori simple) si erori reziduale adica o parte din variabila nu are legatura cu factorii.Termenul unicitate este folosit pentru toate erorile,aleatoare,simple si cele care nu pot fi estimate din factori pot fi considerate unice pentru fiecare variabila.In modelele CFA,concentrarea este pe variantele comune impartite a variabilelor si factorilor ,de aici analiza factorilor comuni. A avea unicitatile in ecuatie cere sa presupunem ca analiza este restrictionata suficient pentru a exista si o solutie.Aceste presupuneri pun in paralel unicitatea erorilor reziduale in analizele de regresie.Se presupune ca aceste unicitati sunt amandoua
*necorelate cu fiecare *necorelate cu factorii comuni Pentru ca unicitatea nontriviala poate exista pentru fiecare variabila,varianta asociata cu factorii este redusa pentru fiecare variabila.Variabilele scorului Z au o varianta originala de 1.0,dar partea fiecarei variabile a scorului Z pentru care pot fi numarate de factorii comuni este 1.0 minus u 2 si astfel va fi mai putin de 1.0.Aceasta se face prin estimarea generalitatilor fiecarei variabile( pentru ca acesta este corelatia multipla a factorilor pusa in concordanta cu acea variabila si la fel este si varianta variabilei reproduse) si inlocuind 1.0 pe diagonala principala din matricea corelatiei cu generalitatea.Este cel mai covenabil pentru ca matricea este o matrice de covarianta cu elementele din diagonala ca variantele variabilelor. Analizele factorilor comuni ii atrag ,in general ,pe cei care doresc sa admita faptul ca toate variabilele psihologice au erori si cei care prefera un model aflat in concordanta cu alte metode de analiza ,precum analizele regresiilor si modelul ecuatiei structurale.Initial,au simtit ca scorurile factorilor nu sunt o problema pentru ca scorul factorului coreleaza estimarile atat de mari cu factorii ca si cum problema scorurilor factorului ar fi doar o aproximare mica;sustinatoriii analizei factorilor sugereaza ca scorurile factorilor sunt rareori necesare deoarece analizele extinderii pot fi folosite in locul lor si problema scorului factorului este o intrebare pusa in discutie. Analizele factorilor comuni are un model explorator si unul confirmator.O analiza a factorilor comuni exploratoare (ECFA) este cea in care ambele restrictii sunt minime si in ceea ce priveste teoriile investigatorului.Este o analiza inductiva in care rezultatele provin din date neafectate de gandirea investigatorului.Avantajul in nespecificarea asteptarilor este ca analiza este un test multiplicat al oricarei teorii sau asteptari pe care o poate avea cercetatorul.Daca asteptarile cercetatorului sun gasite de ECFA ,atunci ele vor fi gasite cu siguranta de o analiza confirmatoare.Din cauza lipsei de restrictii sii complexitatii analizelor,testele semnificative nu sunt valabile pentru ECFA,si astfel N-urile mari sunt folosite pentru a reduce nevoia pentru importanta testelor. Generalitatile pot fi calculate exact daca factorii ar fi cunoscuti si invers:Factorii ar putea fi calculati daca ar fi cunoscute generalitatile.Pentru a reduce acest nod gordian,generalitatea poate fi estimata si apoi factorii extrasi.Generalitatile observate trebuie sa difere doar putin de cele estimate. Estimarea generalitatilor se face prin diferite metode.Urmatoarele 4: SMC:Foloseste corelatia de mai multe patrate (SMC) a tuturor variabilelor cu alte variabile.In general,aceasta functioneaza bine si este independenta de numarul factorilor.
Pseudorepetarea :Foloseste orice ca prima estimare,rezolva numarul factorilor si calculeaza generalitatile acestor factori.Apoi foloseste generalitatile observate ca noi estimari pentru generalitati,extrageti factorii din nou si calculati generalitatile pentru acesti factori.Procesul se continua pana cand se observa o mica schimbare de la o trecere la alta sau s a facut un numar maxim de treceri.Retine ca aceasta nu este o repetare adevarata.O adevarata repetare are loc atunci cand au fost dovedit atat faptul ca valorile reiterate converg in mod necesar si ca acestea converg necesar valorile corecte.Dar nu se intampla in mod necesar cu pseudoreiterarea.Gorsuch a observat un caz in care procesul nu s ar converti si astfel nu este indeplinita cerinta pentru reiterarea adevarata pe care o converg valorile.Conditia ca aceste converg la valorile corecte nu este indeplinita pentru ca ele converg uneori la o valoare mare imposibila.De exemplu,in practica,generalitatile calculate prin acest proces depasesc des 1.0.Faptul ca procesul nu are nevoie sa convearga la valori care sunt dovezi ca acest proces nu este unul de reiterare in sensul matematic.In matematica o procedura este repetabila daca si numai daca converge la populatia de valori.Altfel,asa-numita reiterare pentru generalitati este numai pseudoreiterare.De ce este acest terment folosit?Cred ca din doua motive.Primul,reiterarea matematica este o procedura excelenta ,asadar reiterarea merita incercata chiar daca nu exista o dovada care sa satisfaca criteriile matematice pentru repetare.Cel de al doilea,cand incepem de la 1.0 cu estimarea de generalitati,observam ca primele cateva pseudorepetari, sunt estimari mai scazute ale generalitatilor de la o valoare mai mare de 1.0 spre o estimare mai rezonabila. SMC cu doua sau trei repetari:Procedura incepe prin notarea anterioara a unei SMC.Apoi solutia este repetata de doua sau trei ori dupa care este oprita.Desi este inca o pseudorepetare ,nu a produs si reprodus o estimare mai mare de 1.0 niciodata Snook si Gorsuch au facut ca generalitatile rezultate sa nu difere semnificativ de cele din studiu.Aceasta este o procedura buna. Analizele Minres:Aceasta procedura minimizeaza elementele care nu sunt in diagonala si nu se foloseste de estimari ale generalitatilor.Generalitatile rezulta din analiza.Este o procedura excelenta daca se doreste aflarea generalitatilor exacte. Unele ingrijorari cu privire la estimarea generalitatilor s au dovedit a fi depasite.O estimare rezonabila produce o solutie finala care nu se distinge de de celelalte.Aceste este,probabil,motivul pentru care Minres este rar folosita. Observati ca numarul elementelor din principala diagonala a matricei de corelatie-care sunt inlocuite cu estimarile generalitatilor creste liniar cu numarul variabilelor,in timp ce numarul celorlalte elmente cresc mult mai repede.De exemplu,cu sase variabile generalitatile estimeaza 29% din valorile analizate.Cu 30 variabile ,generalitatile reprezinta doar 7 %.Cu 60 de variabile,procentul scade la
4%.Impactul generalitatilor estimate devine din ce in ce mai neimportant odata cu cresterea numarului variabilelor. In plus fata de numarul variabilelor,un alt parametru important in evaluarea generalitatilor estimate este cat de mari sunt acestea.Cu cat sunt mai mari,cu atat este mai ingusta gama de estimare a generalitatilor.Cu generalitati mari,este mai putin probabil ca folosind o alta procedura de estimare a lor ,sa rezulte o diferenta interpretabila. Tabelul 6.2 contine generalitati pentru caseta WAIS si un exemplu de variabila psihologica.Au fost calculate din trei estimari initiale,1.0,SMC si SMC plus doua repetari.Sunt date generalitatile rezultate din factorii bazati pe fiecare procedura de estimare. Pentru variabilele psihologice-unde generalitatile estimate sunt de la mici la modderate si formeaza 29% din coeficientii analizati-folosind 1.0 ca estimare a generalitatilor initiale face o diferenta ,dar una mica intre celelalte doua estimari initiale..In ambele casete si in exemplul WAIS,generalitatile sunt mari si estimarile dau un rezultat asemanator.Tabelul 6.2 Contine factori din SMR plus cele doua solutii de repetari pentru sase seturi de date ale variabilelor psihologice Oricare parametru din ecuatia 6.1 poate fi 0.Acum observati ce se intampla daca variabilele au mai multe corelatii cu celelalte variabile.Daca aceste multiple corelatii cresc ,unicitatile us,ajung 0.Daca ar fi fost 0,atuncu us ar fi fost eliminate si atunci ar fi fost CA.De acum,CA este un caz special al ECFA.Un ECFA nerestrictionat va da un CA daca variabilele au corelatii multiple cu celelalte. Ca si in cazul CA ,ECFA extrage factori prin metode de ris principale sau maximale.Restrictiile sunt schimbate in rotatia factorilor .De exemplu,rotatia reduce numarul factorilor incarcand fiecare variabila si astfel relatiile sunt simple daca mai multi factori incarca cat mai multe variabile. Table 6.2 EFA Communalities Using Different Initial Values Estimation: 1.0 SMR SMR+2 Iterations PsychologicalnVariables (2 Factors) 1. .73 .55 .59 2 .77 .61 .66 3 .56 .34 .34 4 .65 .41 .45 5 .57 .33 .35 6 .64 .41 .45 Boxes (3 Factors) 1 .95 .93 .91 2 .96 .93 .93 3 .93 .97 .98
4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 11
.96 .97 .98 .91 .87 . 98 .90 .65 .70 .76 .81 .79 .65 .69 .63 .77 .76 .84
.98 .99 .98 .90 .84 .97 .73 WAIS (4 Factors) .59 .51 .42 .44 .65 .52 .40 .34 .68 .51 .74
.98 .99 .99 .88 .82 .97 .68 .60 .54 .46 .49 .66 .55 .43 .35 .69 .56 .77
Analiza confirmatoare a factorilor comuni Analiza confirmatoare a factorilor comuni (CCFA) a fost dezvoltata si folosita in cadrul modelului de factor comun.Purcede direct din ecuatia 6.1 si include unicitatile.Spre deosebire de ECFA ,care foloseste restrictii matematice pentru a gasi o solutie,metodele confirmatoare folosesc teoria pentru a dezvolta restrictii. Restrictiile pot fi plasate in urmatoarele locuri din ecuatia 6.1: Numarul factorilor Forta unui factor de a reproduce o variabila Unicitatea fiecarei variabile Mediile si abaterile standard ale scorurilor factorilor Acestea sunt setate in general la Scorurile Z (media =0,SD=1) sau media si abaterea standard a unei variabile particulare. Este posibila si plasarea restrictiilor in plus fata de elementele ecuatiei 6.1.Primele astfel de restrictii sunt urmatoarele: *Corelatiile(sau covariantele,daca acestea sunt analizate) dintre factori.
* Corelatiile ( sau covariantele) dintre unicitati.Acestea sunt restrictionate la 0,dar pot fi plasate la alte valori.Daca nu sunt 0 ,pot reprezenta metode corelate sau erori. Restrictiile variaza in valorile care pot fi folosite.Cele mai utile variatii sunt pentru restrictionarea unui parametru 1 sau 0.Cand mediile si abaterile standard sunt setate la 0,respectiv 1,factorii sunt scoruri Z.Corelatiile dintre factori sunt setate la 0 pentru a restrictiona necorelarea factorilor. Greutatile pot fi restrictionate in mai multe moduri.Acestea sunt cele mai folosite: Cea mai folosita este aceea de a seta unele greutati la 0.Asta inseamna ca variabila este definita fara legatura cu acel factor. Poate fi folosita o greutate predefinita; aceasta este utila in a evalua daca greutatile dintr un alt studiu sunt validate in acest studiu. Cateva greutati pot fi restrictionate in a fi aceasi valoare cu cea nedefinita;de exemplu,aceasta este folosita daca una are doua forme paralele ale aceleiasi masurari. Daca greutatea nu este restrictionata,atunci factorul extras se asteapta sa aiba o greutate non zero in variabila si cercetatorul doreste sa stie daca este asa.Numarul restrictiilor trebuie sa fie suficient pentru identificarea unei solutii.Identificarea poate fi o problema pentru ca nimeni nu a dezvoltat o formula pentru a spune cand o solutie unica este identificata.Ar fi fost imposibil sa se dea un raspuns specific pentru ca valoarea nu depinde doar de numarul de restrictii ,ci si de locatia lor.O corelatie bazata pe CCFA este suficient restrictionata daca fiecare variabila este incarcata doar de un factor si fiecare factor are cel putin 3 astfel de variabile.De obicei,programul calculatorului raporteaza unele probleme care ar putea fi cauzate de restrictionarile insuficiente ,referindu-se la subidentificari. Table 6.3 Analiza confirmatoare a factorilor comuni pentru problemele a 6 variabile psihologice Hypothesized Weights ECFA Principal Factor Weights CCFA Weights (maximum likelihood) 1. ? 0 .77 0 .77* 0 2. ? 0 .87 0 .86* 0 3. ? 0 .57 0 .57* 0 4. 0 ? 0 -.70 0 -70*
5. .58* 6. .70*
0 0
? ?
0 0
.58 .69
0 0 r=-.21*
r=? r=-.12 Nota: *p<.0,5.? Inseamna ca valoarea este libera sa varieze.
Pentru exemplul CFA ,se considera cele 6 variabile psihologice ca exemplu.Ne asteptam de la cunostintele psihologice generale ca fiecare factor al masurarii abilitatilor verbale sa nu incarce variabilele psihologice ale suferintei si vice versa.De acum,modelul pentru care au fost stabilite ipoteze,va avea 6 valori setate pe 0.Celelalte 3 valori pentru fiecare factor va putea varia.Corelatia dintre factori nu este restrictionata. Considerati doar primul factor din tabelul 6.3.Ceea ce spune restrictiile in ipotezele greutatii este ca ultimele trei variabile nu trebuiesc considerate in solutia factorului.Dar nu spune cum se gasesc greutatile pentru primele trei variabile.Este nevoie de factorul care reproduce cel mai bine scorurile celor trei variabile.Observati ca aceasta este aceeasi intrebare de la ECFA si aceeai restrictie este folosita pentru gasirea solutiei :factorizarea principala sau factorizarea de risc maxim.Pentru a ilustra aceasta conexiune cu ECFA ,s a extras un factor principal din primele trei variabile;apoi,a fost extras un alt factor ,separat,din ultimele trei variabile,folosindu se un program ECFA.Aceasta este a doua parte a tabelului 6.3.Reda greutatile fiecarui factor pentru a reproduce fiecare variabila.Folosind extensia analizei ,corelatiile dintre acesti 2 asa-numiti factori eploratori s-a dovedit a fi -.12. Si daca se calculeaza o reala CCFA din aceste date?Folosind programul original de risc maxim CCFA obtinem ultimele 2 coloane ale tabelului 6.3.Cele mai mici diferente pot fi o functie a diferentelor dintre factorii principali si de risc maxim sau numarul repetarilor pentru generalitati. Este o avertizare in folosirea CCFA:schimbarea parametrilor modelului dupa ce privesti datele,poate duce la o solutie non replicabila.Modelul trebuie sa fie setat inainte ca analiza sa inceapa.Daca mai mult de un model trebuie testat,atunci toate modelele trebuiesc specificate complet inainte. Daca un model a carui ipoteza este emisa nu se potriveste cu s ar fi dorit cu datele,cercetatorii fac unele ajustari pentru a produce un model care se potriveste mai bine.Acest lucru este periculo pentru ca mizeaza pe sansa.Literatura sugereaza asemenea schimbari departe de modelul populatiei,nu fata de el.Niciun test semnificativ si nici masuratorile perfecte nu iau in calcul acestea.Daca sunt facute schimbari pentru imbunatatirea potrivirii,raportul trebuie sa vizeze modelul original
explicit,sa dea baza tuturor schimbarilor si sa avertizeze ca au fost facute unele valorificari.Este recomandata folosirea unui esantion de validare pentru testarea oricarui model care contine modificari de date. Care este avantajul folosirii unei reale CCFA doar pentru extragerea datelor din subseturile variabilelor?Raspunsul este :teste semnificative.In tabelul 6.3 CCFA a gasit toate incarcarile ca fiins semnificative statistic.Aceste teste sunt posibile datorita faptului ca solutia este suficient restrictionata ca sa fie usor de manuit matematic.
Restrictionarea Factorilor modelului necorelat Discutia anterioara despre componentele si despre modelele factorilor comuni se potriveste in cazurile generale in care nu sunt restrictii la corelatiile dintre factori.Aceasta este cea mai folosita in cele mai multe cazuri pentru ca este de mare interes ca fiecare variabila este extrasa din acelasi domeniu,sau modul la care se refera fiecare domeniu.Insa permiterea corelatiilor dintre factori implica unele complexitati. Simplitatea introdusa prin factorii necorelati este la fel cu necorelatiile predictive aflate in regresie.Analiza regresiilor multiple simplifica daca prezicerile sunt necorelate una cu cealalalta.Cu preziceri necorelate, *Corelatia variabilei independente cu variabila dependenta este de asemenea ponderea ei in scorul Z si corelatia ei cand toate celelalte preziceri sunt aproape eliminate(corelatia partiala). * Nu este nicio varianta care se suprapune intre variabilele independnte,deci,corelatia este neschimbata daca una din celelalte variabile independente este aproape eliminata sau nu este in ecuatie. *Corelatia multipla este radacina patrata a sumei patratelor corelatiilor variabilelor independente cu variabilele dependente. In analiza factorilor,factorii sunt predictori de variabile independente.variabilele observate sunt variabile dependente si generalitatile sunt corelatiile multiple patrate ale ale factorilor cu variabilele observate.Aceasta,cu factorii necorelati. *Corelatia factorului cu o variabila observata este tot ponderea scorului sau Z si corelatia lui cand toti ceilalti factori sunt partial eliminati (corelatia partiala). *Nu este nicio varianta care se suprapune intre factori si astfel corelatia este neschimbata daca unul din ceilalti factori este eliminat partial sau nu este in ecuatie.Din cauza ca restrictiile necorelate sunt aplicate la acest set de factori specifici,fixarea unui factor din solutie,poate schimba ponderea.
*Generalitatea este radacina patrata a sumei patratului corelatiilor factorilor cu variabila. Pentru ca corelatia este egala cu ponderea si este egala cu corelatia partiala,exista doar o interpretare pentru termenul loading cand factorii sunt necorelati.Cu predictori sau factori corelati,cele trei conditii de mai sus nu tin.In schimb,ponderea beta difera de corelatii si acealea difera de corelatiile partiale.Corelatiile multiple/generalitatile sunt calculate cu o formula mai complexa care iau in calcul corelatiile dintre variabile/factori. In analiza factorilor cu factori corelati,fiecare tip de incarcare este pus intr-o matrice separata.Acestea au fost numite *Modelul de factor care contine ponderile beta date scorurilo Z ale factorului pentru a reproduce scorurile Z ale variabilei. *Structura factorului care contine corelatiile factorilor cu variabilele. *Structura vectorului de referinta care contine corelatiile fiecarui factor cu variabilele cu toti ceilalti factori partial eliminati. Factorul general este considerat a fi cel care trebuie interpretat,dar si celelalte matrici pot fi de interes.De cele mai multe ori,structura de referinta a vectorului este mai clara decat a celorlalti deoarece corelatiile factorilor cu variabilele doar din cauza modului in care factorii intercorelati au fost inlaturati. Pentru ca se poate lucra mai usor cu factorii necorelati,de ce sa nu se restrictioneze toate solutiile factorilor de a fi necorelati?Raspunsul este ca poate duce la o reprezentare derutanta a datelor.De exemplu,scalele de abilitati sunt in general corelate impreuna.Acestea sunt date adevarate ale WAIS-III;cea mai mica corelare este .22 (Digit Span cu Digit Symbol) dar corelatiile din .50 si .60 sunt comune.Acest lucru este adevarat nu numai intre scale ci si intre scorurile IQ si Index.Restrictionarea factorilor necorelati esueaza in a ne informa ca abilitatile sunt puternic legate. Solutiile restrictionate ale factorilor necolerati mai sunt numite si ortogonale, un termen din reprezentarea geometrica a factorilor. In aceeasi maniera solutiile nerestrictionate mai sunt numite si oblice. Oricum, acel termen poate fi derutant. Se cere ca solutia sa fie restrictionata pentru a contine factori corelati ceea ce nu este valabil in cazul acesta. O rotatie nerestrictionata este doar nerestrictionata. Factorii pot si sunt deseori necorelati cand este folosita rotatia nerestrictionata a factorului. Exista mai multe proceduri pentru rotatia factorilor dar decizia se ia de obicei, dupa un criteriu de baza, factorii fiind restrictionati sa fie ortogonali sau nerestrictionati. Daca sunt restrictionati programul ales de fiecare este Varimax. Pentru rotatiile nerestrictionate sunt mai multe optiuni, cele mai multe dintre ele dand solutii rezonabile. Unele precum Oblimax au un parametru care trebuie setat astfel incat sa influenteze gradul pentru care solutia sa tinda spre ortogonalitate. Cea mai
eleganta metoda de a obtine o rotatie nerestrictionata este sa incepi cu Varimax si apoi sa folosesti Promax pentru a asigura o versiune nerestrictionata a solutie Varimax. Ca si alte solutii nerestrictionate exista un parametru care trebuie setat fiind numic k. Un avantaj al programului Promax este ca valoarea lui k nu trebuie aleasa pentru ca diferentele sunt foarte mici. Poate fi setat la 4. Cu aceasta setare factorii necorelati vor rezulta daca setarea este corespunzadoare deoarece rotatia ortogonala este un caz special de rotatie nerestricitonata.. Observati ca Promax poate produce factori prin corelarea datelor atat de neinsemnati incat pot fi considerati ca factori necorelati, ca in tabelul 6.1 in care corelatia a fost una neinsemnata-.14.Milliron(1996) gasit intr-un studiu de simulare in care Promax a fost bun pentru factorii corelati cat si pentru reproducerea modelui de factorului cunoscut mai bine decat a fost Varimax pentru factorii necorelati din populatie. In esantioane, Varimax a trebuit sa modifice usor datele pentru a mentine corelatia factorilor 0, pe cealalta parte, Promax a tinut cont de corelatiile dintre factori. Ocazional apar rezultate neasteptate in cazul lui Varimax. Nu numai ca un factor evident este complet eliminat dar si corelatiile 0 dintre factori pot disparea la urmatoarele calcule. Mai multe studii au folosit Varimax si apoi au estimat scorurile factorilor. Scorurile factorilor au fost evident corelate indicand faptul ca restrictia nu a putut fi aplicata pentru toate calculele pentru ca rotatia restrictionata nu se potrivea cu datele. Alte studii au folosit factori ortogonali ai unui studiu anterior pe un esantion nou doar pentru a gasi factorii corelati.6-.8. Datele puternic corelate nu vor fi respinse. Este bine sa fi pre-avertizat despre aceasta situatie lasand rotatia nerestrictionata. Daca factorii sunt corelati atunci aceste corelatii pot fi factorizate. Factorii din variabile sunt numiti fatori primari in timp ce aceeia extrasi din factorii primari sunt numiti factori secundari; factorii de ordinul trei vor fi factori obtinuti din factorii de ordin doi sau patru. Toti factorii care urmeaza factorului primar sunt incadrati intr-o asa numita higher-order factors. Conceptual factorii principali sunt mult mai specifici decat factorii secundari si astfel ei pot prezice mai bine mai multe variabile specifice decat factorii secundari. Cu mai multe variabile generale factorii secundari ar prezice mai bine. Folosind rezultatele unei analize a factorilor de ordin inalt si variabilele dependente dorite este posibil sa arati si chiar sa testezi care dintre factorii de ordin primar sau secundar sunt mai folositori. Un exemplu de factorizare de ordin inalt este WAIS-III. Factorii principali sunt in tabelul 6.4. Cei patru factori primari au fost corelati si un factor general de ordin doi a fost extras. Acest factor, ultima coloana a tabelului 6.4. reprezinta clasicul g sau factorul general al indicelui de inteligenta (IQ). Corelatiile scalelor individuale cu g au fost calculate prin extinderea analizelor. G are o istorie lunga in crearea de legaturi a mai multor zone de realizari.
Variabile 1.
Intelegere Verbala .25 -.08 -.01 .05 .75 .07 -.03 .10 .69 -.01 .85
Aritmetica Desen Digit span Digit symbol Informatie Rationamentul matricei Letter number cancelation Picture completion Asemanari Cautarea de simboluri Vocabular 1 2 3 4
2. Viteza de Procesare .02 .11 -.02 .69 -.05 -.03 .07 .01 .05 .68
3. Memorie activa .38 .03 .70 .00 .09 .05 .61 .01 -.08 .04 .03 principal .51 .50 1.00 .60
4.Organizarea perceptuala g .26 .70 -.01 -.03 .04 .68 .03 .51 .22 .09 -.03 .67 .56 .60 1.00 .69 .63 .47 .46 .63 .64 .48 .41 .46 .54 .66 .73 .65 .71 .85
.06 Corelatii ale factorului 1.00 .44 .44 1.00 .51 .50 .67 .56
Daca se suspecteaza ca acolo este un factor general si este folosita CA sau ECFA acel factor general va fi gasit de obicei doar daca o analiza de ordin inalt este calculata dintr-o rotatie nerestrictionata. Analiza elementelor este probabil cea mai comuna situatie in care o rotatie restrictionata la ortogonalitate este indusa gresit. Autorul unei scale include elemente care masoara fiecare caracteristicile subliniate; apoi un scor total este calculat prin imbinarea elementelor. Astfel autorul presupune existenta unui factor general-acesta apare o data cu incarcarea tuturor elementelor. Ce se intampla cand o scala este factorizata? Pentru ca analiza factorului este un instrument delicat se va lua in calcul ideea universala ca unele elemente vor corela mai bine intre ele decat cu restul celorlalte elemente. Exista in general cateva subseturi de elemente care coreleaza mai usor intre ele decat cu celelalte pentru ca au aceeasi distributie sau ca folosesc aceleasi cuvinte. Atunci vor fi gasiti cativa factori. Acesti factori pot fi cate unul pentru elementele usoare, unul pentru cele medii si unul pentru cele grele. Nici unul dintre acesti factori nu vor fi factori generali pentru ca la fel ca in tabelul 6.4 factorul general este gasit in corelatiile dintre factori. Varimax nu permite niciodata ca astfel de corelatii sa aiba loc. Decizia de a restrictiona analiza de rotatie a elementelor la
ortogonalitate este una cu implicari majore. Este mai bine sa se foloseasca Promax, o rotatie nerestrictionata, si sa vezi cand se intampla ca un factor general sa fie printre ceilalti factori. Un exemplu poate fi scos din analiza factorilor a BECK DEPRESSION INVENTORY (BDI). Chan ( Gorsuch & Chan, 1991) a analizat esantioane in China si in S.U.A. si a calculat relatiile dintre analizele factorilor din S.U.A. si Canada cu factorii lui. Tabelul a aratat clar ca: (a)factorii principali nu se repeta atat in tara si nici peste granita; (b) toti factorii principali au corelat la nivel inalt; (c)Factorii depresiei de ordin 2 s-au repetat atat in tara cat si peste granita. Acel factor general este acelasi ca scorul total. Primele studii au ratat acest fapt deoarece au folosit doar analize de ordinul intai iar concluziile eronate din acest studiu ar fi fost ca nu existau fatori de acelasi fel. Chaun a aratat concluzia corecta care ar fi ca este un factor in BDI asa cum autorul a programat. PROBLEME MAJORE NEREZOLVATE In discutiile anterioare, au fost facute sugestii pentru folosirea unei analize a factorilor ce utilizeaza solutii general acceptate si rezonabile. Acestea includ folosirea rotatiei nerestrictionate Promax. La fel acceptate sunt si patratele corelatiilor multiple impreuna cu doua repetari pentru estimarea generalitatilor. Dar unele probleme majore sunt dezbatute cu putin comun acord privind rezolvarile lor, desi sunt dovezi pentru evaluarea ineficacitatea diferitelor metode. Doua metode sunt folosite pentru evaluarea ineficacitatii unei tehnici pentru analiza unui factor. Aceste metode sunt studiile simulate si plasmidele (Cattell, 1978). Studiile de simulare incep cu o populatie de factori tipar si corelatii de factori precum cei dati ( acestia sunt selectati de cercetatori pentru a fi sensibili la parametrii investigati). Tiparele si corelatiile pot varia. Apoi sute sau mii de esantioane sunt derivate folosind parametri populatiei dar permit o variatie datorata monstrelor. Aceste esantioane multiple sunt analizate iar conditiile in care parametrii selectati sunt cel mai bine recuperati sunt notate. Plasmodes sunt seturi de date in care se poate presupune ca stim ce rezultate ar trebui sa fie. Exemplele folosite in acest capitol se potrivesc acestei categori. Istoria psihologiei sugereaza ca abilitatea verbala si factorul emotional sunt factori separati (cele 6 variabile psihologice) si care pun la indoiala necesitatea unor factori precum lungimea, inaltimea, si latimea ca baza a unor cutii? Familia WAIS de instrumeste de masurat, din care WAIS-III Canada face parte ca exemplu, are o lunga istorie de analiza a factorilor; solutia de ordin patru prezentata mai devreme a fost reprodusa folosind multuple monstre atat din WISC cat si din WAIS. Care din multele tehnici analitice de analiza a factorilor sunt mai bune pentru a descoperi rezultatul asteptat? Desi este usor sa variem parametrii dintr-un studiu simulat, exista mereu intrebarea de generalizare catre tipul de date analizat in mod normal. Desi plamodes sunt date asemanatoare cu cele analizate de obicei, este dificil sa variez parametrii sistematic. De aici inainte, discutia noastra despre zonele-problema se bazeaza foarte
mult atat pe studii de simulare cat si pe plasmodes deja prezentate ca exemplu in acest capitol. Care este arbitrul final al factorului de metodologie analitica? Ultimul arbitru in stiinta este foarte bine stabilit: replicarea. Orice procedura care duce la obtinearea unor rezultate replicate este demna de luat in considerare. Daca mai multe proceduri duc la rezultate replicabile, atunci alegerea sta la mana investigatorului in functie de situatie si teorie. Daca totusi nu este cazul, se va alege in functie de eleganta si costuri. Componente versus Modele Comune ale Factorilor pentru Analiza Factorilor Exploratori Atat CA cat si CFA sunt folostite pentru EFA. Desi existenta a doua modele nu este surprinzatoare, nivelul de dezbatere a fost extins. Pentru o discutie detaliata asupra avantajelor si dezavantajelor celor doua metode, verificati editia speciala a Studiul asupra comportamentului multivariat, 1990, Volumul 25, Editia I ( si 1996, Volumul 31, Editia 4). Pentru a intelege aceasta dezbtaetre este important sa subliniem ca toate procedurile pentru CA si ECFA sunt aceleasi exceptand una: CA incepe cu 1.0 in diagonala principala a matricii de corelare pe cand CFA incepe cu o estimare comuna. Aceasta este singura diferenta matematica dintre cele doua. Restul este identic. Cazul pentru analiza factorului comun CFA se bazeaza pe Ecuatia 6.1 si presupunerea pentru date. Includerea termenului unicat in ecuatie este ceea ce face o face o CFA. Termenul unicat include toate variabilele variatiei neasociate cu factorii, din care o parte reprezinta erori intamplatoare. Deci CFA ar trebui utilizata de fiecare data cand cel putin o parte din probabilitati sunt sub 1.0 adica, atunci cand unele variabile contin anumite erori intamplatoare. Desigur, acest argument arata, sau presupune, ca toate variabilele sunt fara erori intamplatoare? Unde sunt dovezile existentei acestor variabile in stiinta sociala? Si daca stim ca variabilele dau erori, nu este logic sa le includem in modelele matematice? Sa renuntam la termenul unic inseamna ca doar factorii stau la baza scorurilor fiecarei variabile. Deci in populatie, comun ar fi sa apara 1.0. Acesta este motivul pesntru care se foloseste 1.0 in diagonala principala a matricei de corelare. Asta inseamna ca multiplele corelari ale factorilor cu fiecare variabila este de asemenea 1.0. Din nefericire, derivatul consta in variabilele, facand parte din seturi de combinari liniare cu un numar mai mic de factori, care formeaza o matrice de corelare non-Cramian. O astfel de matrice are un numar infinit de solutii deci nu se poate lua in considerare. Deci, CA este un model care se contrazice de la sine.
Desi avocatii componentelor aduc in discutie problema estimarii comune si a scorurilor de factori, aceste estimari sunt consistente si facute cu usurinta. Variatia scorurilor factorilor sunt variatii asupra scorurilor care sunt de obicei corelate catre .9 sau mai bine in simularii si studii plasmodes. Acest lucru este mult mai bun decat in alte cazuri. De exemplu, majoritatea testelor de abiliatati coreleaza .7 pana la .8, dar totusi sunt vazute ca interschimbabile. Deasemenea corelarile dintre scorurile factorilor CA ai unui studiu cu urmatorul sunt mult mai mici decat 1.0 si probabil nu sunt mai mari decat un CFA la altul, deci unde este precizia marita a CA? Si cu o analiza extinsa, nu este nevoie sa calculam scorurile factorilor deoarece corelarile variabilelor cu analiza factorilor poate fi calculata matematic. Cazul pentru analiza componentei CA este mai economica datorita ecuatiei mult mai simple. Asta o face mai usor de invatat si mai usor de programat. Dar argumentele principale sunt dincolo de ecuatia simpla. Un rationament este cel filozofic. Factorii sunt concepte convenite pentru a ajuta generatia noastra sa se relateze cu datele folosite in acesta disciplina. Un alt rationament este ca CA este un set practic. Un exemplu este ca folosirea lui CA in loc de CFA rareori face mare diferenta. Multe analize ale factorilor sunt de 25 sau mai multe variabile cu multe parti comune. In astfel de cazuri, rezultatul este acelasi. Alte argument este ca modelul CFA este mult mai limitat decat cel CA. Pentru ca niciodata nu stim partile comune ci doar le estimam, sunt o multime de solutii care se potricesc. Cum partile comune nu pot fi decat estimate, concluziile matematice viitoare sunt ca existaun numar infinit de scoruri ale factorilor care pot fi calculate ce vor indeplini egalitatea modelului ECFA pentru orice set de date. Cu CA, scorurile factorilor sunt combinatii liniare ale variabilelor pentru care exista un singur set. Dezbaterea in desfasurare Desi existenta si folosirea a doua modele nu este surprinzatoare, nivelul de dezbatere este surprinzator. Rezultatele sunt similare, exceptand cateva cazuri speciale. Personal, am avut norocul de a studia cu un exponent al CFA (Cattell, 1978) si sa lucrez cu un exponent al CA (Nunnally, 1967), pe care ii respect profund. Ultimul mi-a fost mentor in liceu iar primul m-a anagajat pentru ai calcula toate exemplele cartii sale si mi-a dat raspuns pentru fiecare din ele. Deci am auzit argumente pentru fiecare des.
Dezbaterile profesionale sunt bune, dar cautarile se adreseaza critilor pentru ambele parti. Personal aleg CFA din doua motive. Primul, incluzand termenul unic insemna ca aceeasi ecuatie este folosita pentru analiza factorilor la fel cum este folosita pentru regresare si SEM. Al doilea, o procedura trebuie sa fie cat se poate de sigura, ceea ce inseamna ca datele bazate pe corelari intamplatoare ar trebui sa fie mici pentru a reduce sansa unei erori. Mi se pare interesant ca CFA a stat la baza analizei factorilor. Am descoperit putine relatari despre CA inainte de 1960. Pe de alta parte CFA a fost folosita si considerata singura metoda. In 1960 calculatoarele au aparut in psihologie, dar ele erau simple si incete. Primul calculator era mai slab decat primul PC Appple. Deci toate programele trebuiau sa fie simple. Atunci Henry Kaiser de la Universitatea din Illinois a scos un pachet complet pentru calculator numic Little Jiffy. Erau greu de folosit deoarece erau CA si nu aveau o procedura comuna de estimare. El a precizat ulterior ca acel pachet este unul super-simplificat. In 1970 a lansat Little Jeffy generatia a doua dar a fost prea tarziu. Pachetele scoase erau peste Little Jeffy, chiar il aveau la baza. Un lucru important pentru mine este ca diferenta dintre CA si CFA consta intrun numar rezonabil de variabile si parti comune. Ele duc la acealasi rezultat indiferent de metoda folosita. Doar cand se foloseste un numar limitat de variabile exista o diferenta, iar rezultatul cel mai bun il ofera CFA deoarece CA poate face corelari minore intre datele care par majore. Mult mai importante sunt selectiile variabile, monstrele de cazuri, numarul de factori extrasi, indiferent daca se cere restrictia solutiei catre un factor necorelat, sau daca este nevoie de o analiza de confirmare sau exploratoare. Important este subestimarea numarului de factori si orice decizie de a restrictiona roatia catre factori necorelati. Numarul de factori rezultati In urmatoarele discutii s-a ales numarul de factori. Acest lucru a fost facut pentru a asigura numarul de modele din prezent. Din pacate, nu exista o varianta adecvata pentru a determina numarul de factori in analiza confirmatoare a factorilor. Se recomanda mai multe teste pentru a determina numarul corecdt de factori. Testele ce vor urma sunt doar cateva exemple din numarul total disponibil si cuprind cele mai raspandite cazuri si cele cu rezultate foarte bune. Valorile vectorilor (Eigenvalue)/Caracteristicile criteriilor radacinei Vectorii unei matrice de corelare se pot extrage . Acestia au multe caracteristici, cel mai important fiind ca suma corelarilor la patrat a variabilelor este un factor. Ei sunt extrasi in ordinea marimii. Deci, setul de radacini a unei probleme reda marimea facorilor extrasi de la cel mai mare la cel mai mic. Radacinile fiecarul exemplu se fasesc in tabelul 6.8. Ei sunt clasificati in ordinea marimii, si prezinta tiparul tipic al radacinilor matricelor corelate.
Factorul extras 1 2 3 4 5 6 7 8 9 10 11
Variabile psihologice 2.30 1.63 .71 .53 .51 .32 -
Baze 8.22 .78 .39 .31 .18 .05 .03 .02 .02 .01 -
WAIS-III 5.36 1.06 .86 .80 .64 .60 .43 .40 .35 .26 .23
Radacini mai mari decat 1.0 Pentru ca toate radacinile ar trebui sa fie 1.0 intr-o matrice fara factori, se sugereaza ca orice radacina mai mare de 1.0 va da un rezultat mai mare decat 0 . Defapt, si radacinile mai mici pot reda corelarile. Aceeasta metoda a fost cea mai folosita dintre toate criteriile. Din pacate, studiile de simulare au descoperit ca acesta este cel mai prost criteriu incercat. In exemplele acestea, este corect doar cu variabilele psihologice.
Analiza paralela Rationamentul radacinilor mai mari ca 1 este pentru populatia matricii, nu pentru o matrice monstra. Toate matricele monstre vor avea corelari intamplatoare care vor produce radacini mai mari decat 1. Analiza paralele consta in analizarea paralela a datelor intamplatoare. Ele sunt paralele in acelasi nuamr de cazuri si variabilele sunt folosite ca factor analitic de studiu, dar cuprind doar date aleatori. 50 din 100 sunt testate, iar radacinele sunt insumate pentru a arata cum ar fi radacinile daca datele ar fi aleatorii. Radacinile incep mereu peste 1.0 apoi scad brusc. Cu cat N este mai mare, cu atat curba radacinilor va fi mai plata. Au fost facute tabele pentru ca fiecare persoana sa nu calculeze analize multiple asupra datelor aleatorii. Se pot folosi si ecuati. In fiecare din aceste cazuri, paralelismul este stabilit prin folosirea aceluiasi numar de variabile si cazuri. Ar fi
mai sigur sa se calculeze analiza paralela pe matrice astfel incat sa se potriceasca cu datele. Toate radacinile factorilor din studiu care sunt mai mari decat media numerelor aleatorii sunt considerate radacini valide. Deci, analiza paralela indica ca doi factori ar trebui extrasi pentru exista doar doua radacini care sunt peste echivalentul lor aleatorii. Studiile de simulare au gasit analize paralele care stau la baza celei mai bune proceduri privin numarul de factori exploratori.

Analiza Factorilor

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Analiza Factorilor

Încărcat de

Drepturi de autor:

Formate disponibile

Analiza Factorilor O sarcina majora este de a dezvolta constructe teoretice care aduc impreuna mai multe fenomene observate.

r=? r=-.12 Nota: *p<.0,5.? Inseamna ca valoarea este libera sa varieze.

Variabile psihologice 2.30 1.63 .71 .53 .51 .32 -

S-ar putea să vă placă și