Sunteți pe pagina 1din 12

Note de curs 2017-2018

Note de curs –Analize complexe

Interpretarea naturii factorilor.


Pornind de la matricea structurii factoriale rezultate în urma rotirii factorilor se va urmări
interpretarea factorilor extraşi. Cu cât corelaţia este mai mare cu atât variabila respectivă are un rol mai
mare în interpretarea factorului.

Etichetarea factorilor
Interpretarea factorilor este un proces subiectiv bazat pe matricea structurii factoriale sau pe matricea
modelului factorial. Denumirile factorilor au la bază o bună cunoaştere teoretică a domeniului cercetat În
unele cazuri, cercetătorii tind să creeze noi etichete pentru aceştia.

Ameliorarea structurii factoriale.


Odată cu interpretarea naturii factorilor, cercetătorii tind să finalizez procesul analizei factoriale. Totuşi,
următorul pas constă în evaluarea posibilităţilor de modificare sau îmbunătăţire a scalei. Se vor urmări câteva
aspecte, cele mai importante fiind gradul de comunalitate şi de saturaţie a fiecărei variabile incluse în studiu.
O valoare a comunalităţii sub .50 indică faptul că itemul respectiv este influenţat în mare măsură de aspectele
unice, decât de acţiunea factorilor extraşi. Totuşi, o variabilă care are o comunalitate mai redusă(0,40) poate fi
păstrată în scală, dacă este încărcată într-un singur factor comun şi ajută la definirea acestuia. Regula se aplică
în cazul comunalităţii foarte scăzute(<0,30)
Criteriul clarităţii interpretării factorilor poate sta la baza eliminării sau modificării itemilor care, deşi au
un grad ridicat de comunalitate, nu ajută la interpretarea factorilor. Valabilitate pentru SPSS în componente
principale.
În cazul analizei componentelor principale, prin comunalitate se înţelege dispersia explicată ce include
atât factori comuni cât şi factori specifici. Sensul tradiţional al comunalităţii se regăseşte în analiza factorială
exploratorie. Aici, prin comunalitate se înţelege influenţa comună asupra dispersiei datelor exercitată de
acţiunea simultană a factorilor comuni găsiţi . Prin urmare, factorii specifici sunt excluşi din comunalitate,
formând, împreună cu erorile de măsurare, unicitatea dispersiei.

Rezultatele analizei factoriale

Prezentăm rezultatele unui studiu în care s-a aplicat analiza factorială în componente principale. Studiul
este prezentat în lucrarea profesorului francez Jean Marie Seca referitoare la reprezentările sociale.1
Reprezentarea socială a consumatorului a fost studiată pe 22 de perechi de adjective bipolare, evaluabile
pe o scală în 6 puncte.. Analiza în componente principale face să apară o articulare pe trei factori care explică
care explică, în total, 45,6% din varianţă. Primul factor face referinţă la caracteristici care pun în
opoziţie”persoană tristă, nehotărâtă, singuratică şi pasivă” cu „persoană veselă, sigură pe ea, sociabilă şi
activă”. Această dimensiune este calificată drept „depresie/singurătate”, dat fiind faptul că judecăţile tind spre
o zonă negativă. Al doilea factor, regrupează elementele care opun „tendinţa la impulsivitate” cu cea la
„reflecţie”. În fine, al treilea priveşte „predominanţa atenţiei îndreptate spre sine” versus „spre celălalt”

Analiza factorială asupra caracteristicilor consumatorului.

Elemente Factori
Depresie/singurătate Impulsivitate Individualism
Trist/vesel 0,73

1
Seca, Jean Marie, Reprezentările sociale, Institutul European, Iaşi, 2008

1
Note de curs 2017-2018

Nehotărât/sigur 0,70
Singuratic/sociabil 0,67
Pasiv/activ 0,67
Timid/dezvoltat 0,64
Nemulţumit de sine/ 0,62
Fără succes/cu succes 0,60
Slab/puternic emoţ. 0,58
Curajos/prudent 0,67
Impulsiv/obişnuit să 0,67
Reflecteze
Iresponsabil/respons. 0,61
Nerăbdător/răbdător 0,58
Agresiv/blând 0,54
Cu idei neclare/clare 0,50
superficial/profund 0,47
centrat pe el/pe alţii 0,66
Egoist/altruist 0,57
Realist/visător -0,52

Elementele care saturează primul factor au fost grupate pe trei indici(depresiv, impulsiv, individualist)
incluşi ca variabile dependente într-o analiză a variaţiei la un factor independent(corespunzând tipului de drog
studiat). Datele indică faptul că atribuirea impulsivităţii domină fiecare reprezentare a consumului de droguri
Aceasta este mai consistentă când este vorba de ecstasy şi de cocaină decât atunci când este vorba de haşiş .
Individualismul şi starea de depresie par a fi, din contră, atribuite în deosebi consumatorilor de cocaină.
Reacţiile în faţa unui consumator de substanţe psihotrope se dovedesc, la modul general,mai mult negative
decât pozitive. Există câteva diferenţe, în funcţie de substanţa utilizată. Emoţiile negative sunt în mod specific
mai ridicate la un consumator de cocaină. Evaluările pozitive sunt mai degrabă reduse în cazul drogului
ecstasy

Concluzii

Analiza factorială serveşte cauzei conciziei ştiinţifice. Ea reproduce o mare cantitate de rezultate
provenite din teste psihologice şi din alte mijloace de investigaţie ştiinţifică la un set cât mai simplu de
date. În esenţă, ne spune ce măsurători sunt similare şi ce măsurători sunt diferite. Analiza factorială
reduce numărul de variabile cu care cercetătorul trebuie să se confrunte.
Odată cu crearea programelor informatice de calcul s-a asigurat accesul unei mare număr de
cercetători la această tehnică sofisticată din punct de vedere tehnic. Uşurinţa în utilizare pentru
utilizatorul neexperimentat reprezintă o potenţială sursă de erori, deoarece analiza factorială
convenţională este utilă doar în anumite tipuri de design experimental, şi anume în situaţiile în care
este vorba de tipuri sau grupe de variabile. În unele cazuri, cercetarea psaihologică este interesată
numai de anumiţi indivizi sau de anumite evenimente, situaţie pe care analiza de tip R(analiza
factorielsă convenţională) nu le poate răspunde adecvat

Modele de design în analiza factorială

R.B. Cattell a încercat o generalizare a tuturor posibilităţilor de rulare a unei analize factoriale,
propunâd un model sintetic denumit “Cubul de covariaţii(The Covariance Chart). Obiectivele
simtezei sunt:

2
Note de curs 2017-2018

 Un “exempl didactic” care să îndemne cercetătorii la gândire multidimensională în


timpul planificării design-urilor ;
 Să ilustreze istoric modalităţile şi naşterea unor noi modele şi tehnici de analiză
factorială(tehnicile P,O,S şi T)
Cubul covariaţiilor are trei dimensiuni, denumite şi moduri:
1. Subiecţi;
2. Variabile;
3. Ocazii.
Cattell denumeşte ocazii ceea ce este generic recunoscut în psihologia experimentală situaţie-
stimul.(şi nu se referă exclusiv la momentul exact în care sunt culese datele).
Cele trei moduri formează un cub, o cutie, denumită şi cutia cu date(data box), ce are pe fiecare
latură o serie de două din aceste trei moduri. Cattell introduce o formulă mai elaborată, denumită
Basic data Relation Matrix.(BDRM). El a introdus în BDRM 10 moduri: indivizi, stimuli, răspunsuri,
medii, observatori şi cinci termeni privind evenimente sau ocazii.
Cu toate că analiza factorială operează conceptual cu toate cele trei moduri, nu se poate factoriza
decât unul(considerându-l totdeauna pe unul din ele ca fiind constant iar pe al treilea ca fiind modul
care asigură o suficientă reaplicare a datelor. Cattell a creat un tabel cu 6 linii(fiecare reprezentând un
tip de analiză factorială.

Tehnica Modul factorizat Modul replicat Modul constant


O Ocazii Variabile Subiecţi
P Variabile Ocazii Subiecţi
Q Subiecţi Variabile Ocazii
R Variabile Subiecţi Ocazii
S Subiecţi Ocazii Variabile
T Ocazii Subiecţi Variabile

Aceste tehnici sunt relaţionate două câte două. De exemplu, tehnica R, care este cel mai des
folosită, ia în considerare date culese cu aceeaşi ocazie(modul constant), de la mai mulţi
subiecţi(modul replicat) pe care le analizează din punctul de vedere al variabilelor implicate(modul
factorizat). Spre deosebire de R, tehnica Q, care este perechea sa, deşi are acelaşi mod constant(date
culese cu aceeaşi ocazie), consideră date care se referă la mai multe variabile(modul replicat) şi le
analizează din punctul de vedere al subiecţilor de la care au fost culese(modul factorizat). Matricea de
date folosită în tehnica Q va avea deci subiecţii pe coloane şi variabilele pe linii, exact inversa decât
are matricea de date R

S1 S2 S3 S4 S5 S6 S7
I1 1 3 3 2 7 4 7
I2 3 4 4 3 7 5 6
I3 4 5 5 4 6 1 2
I4 5 5 6 5 4 1 4
I5 6 6 7 6 5 2 5
I6 2 1 2 1 4 3 5
I7 7 5 3 2 5 4 6

Perechea O-P

3
Note de curs 2017-2018

Tehnica O şi tehnica P sunt opuse una alteia, fiind ambele ideale pentru studiile de caz. Tehnica
O foloseşte date culese de la acelaşi subiect, privitoare la mai multe variabile, încercând să distingă
diferenţe şi similarităţi între diferitele ocazii la care respectivele date s-au manifestat. Tehnica P culege
date de la un singur subiect, dar încearcă să distingă ce variabile s-au manifestat în diferite
ocazii/evenimente. Această tehnică este precursorul acelor design-uride cercetare numite single-
subject design. Este deosebit de utilă în analiza proceselor psihoterapeutice Exemplu experiment;doi
cercetători au selectat 60 de sesiuni diferite de terapie individuală(ocazii) ale acelui subiect. Acestea au
fost evaluate de trei evaluatori diferiţi pe 18 scale, fiecare reprezentînd o variabilă diferită. Analiza
factorială a relevat faptul că acele variabile se grupează în 4 factori, care descriu relaţia dintre pacient
şi terapeut.(cei patru fiind cu mare probabilitate specifici doar pentru respectiva relaţie).Dintre cei 4
factori, doi erau corelaţi în mod semnificativ cu rezultatele terapiei)
Tehnica O încearcă să explice similarităţi între comportamente în diferite ocazii ale aceluiaşi
subiect. Exemplu : trei cercetători au dorit să exemplificae pe cât posibil modelele
didactice/pedagogice aflate la dispoziţia profesorilor din Statele Unite. În acest scop au fost alese 16
modele didactice diferite(ocazii) care au fost evaluate din punctul de vedere a 33 de
indicatori(variabile) de către un număr de 142 de subiecţi, fiecare având de evaluat 5-6 din cele 16
modele. Subiecţii în ansamblu au fost consideraţi ca fiind « entitate evaluatoare »(deci subiectul din
design-ul factorial). Analiza factorială a relevat trei meta-modele pedagogice, care stau astăzi la baza
învăţământului preuniversitar din Statele Unite

Perechea S-P.

Tehnicile S şi T nu sunt folosite practic niciodată, deoarece generalizarea pe care ele ar putea-o
încerca at fi delimitată doar de o singură variabilă. Am putea specula că rara folosire a tehnicilor S şi
T s-ar putea datora faptului că analiza factorială, ca metodă de analiză, tinde în principiu spre relevarea
diferenţelor individuale. Diferenţele individuale sunt înţelese de psihologie ca fiind variabile, deci un
design în care variabila să fie modul constant este greu de conceput.

Perechea R-Q.

Primul care a propus factorizarea indivizilor, având ca reper mai multe teste(variabile) dar fără a
denumi această abordare « Q » a fost sir Cyril Burt în 1917. Sir Godfrey Thomson a publicat articole
în care a evidenţiat posibilităţile noi şi avantajele pe care le relevă acest tip de abordare faţă de
teehnica clasică. Thomson s-a arătat pesimist faţă de viitorul şi aplicabilitatea tehnicii Q. William
Stephenson a scris şi el despre posibilitatea de a corela mai degrabă persoane decît variabile.
Stephenson a introdu metodologia Q, ca mijloc de investigare a ceea ce a numit subiectivitate
operantă

Generalizarea rezultatelor analizei factoriale.

Posibilitatea de a generaliza factorii extraşi de analiza factorială, în special în cazul unor


cercetări de avangardă, exploratorii, se află în atenţia comunităţii ştiinţifice de mai multă vreme..
Concluziile actuale recomandă prudenţă în acest domeniu. R.B. Cattell a fost printre primii care a
criticat folosirea analizei factoriale în ceea ce el a numit « universuri particulare » de variabile(private
universes od variables), prin aceasta înţelegând un context de variabile fără nici o relaţie cu cercetările
anterioare.. Cattell se referea la problema analizeri factoriale exploratorii. Metodologii contemporani
consideră că în situaţia în care analiza factorială se aplică în orb, fără a aduce factorii în contextul unor
variabile clasice, recunoscute şi teoretizate de comunitatea ştiinţifică, există posibilitatea de a da

4
Note de curs 2017-2018

naştere acestui tip de factori particulari, a unor factori nerelaţionaţi cu starea actuală a cunoştinţelor în
respectiva problematică, imposibil de folosit şi mai ales imposibil de generalizat.
Problema posibilităţii de generalizare a factorilor extraşi prin analiza factorială nu este nouă.
Analiza factorială, în pofida valenţelor ei multiple, atât în studiile confirmatorii cât şi în studiile
prospective, nu este un panaceu. Deşi factorii extraşi prin acest procedeu statistic oglindesc structura
particulară a variabilelor, nu există date suficiente care să confirme faptul că în studii cu o aranjare
diferită a variabilelor, factorii extraşi ar fi similari..
O serie de autori consideră că replicarea unui anumit factotr într-o altă cercetare este dependentă
de deciziile teoretice ce privesc selecţia variabilelor. Acest lucru în seamnă că există o probabilitate
foarte mare ca în momentul în care analiza factorială se face pe un alt set de date, culese cu o altă
metodă, chiar dacă referitoare la aceeaşi realitate studiată, factorii extraşi ar fi diferiţi.
Faptul că rezultatul oricărui demers de analiză factorială depinde de variabilele selectate este
general acceptat. Cu toate acestea, ca demers ştiinţific, desigur că şi analiza are ca obiectiv important
generalizarea concluziilor sale. Gradul maxim de generalizare ar putea fi atins, atunci când factorii ar
fi independenţi de contextual în care sunt măsurate variabilele, adică în cazurile în care, indifferent de
cercetare, analiza ar extrage din aceleaşi variabile exact aceiaşi factori.
Acesta este un deziderat theoretic şi trebuie afirmat că este imposibil să se ajungă la o
independenţă completă a factorilor în contextul variabilelor, de vreme ce factorii reprezintă relaţii
sublimate între respectivele variabile, motiv pentru care diferenţe chiar şi minime în variabile se
reflectă şi asupra factorilor extraşi.
În practică un cercetător stabileşte de cele mai multe ori un număr de factori şi o anumită
structură a acestora pe baza unei analize factoriale rezultate dintr-o structură foarte particulară de
variabile, adică a ceea ce Cattell denumea în 1988 “univers particular”. Teoretizarea ulterioară pe care
cercetătorul o va face cu siguranţă este menită să integreze factorii în corpusul cunoştinţelor
ştiinţifice ale momentului, însă posibilitatea de generalizare a soluţiei nu este dată decât cu gradul de
replicabilitate a ei, de gradul de care alţi cercetători, lucrând asupra aceleiaşi probleme cu mijloace
diferite, măsurând aceleaşi variabile în contexte diferite şi chair cu instrumente diferite, vor ajunge la
aceiaşi soluţie statistică şi vor ajunge să extragă aceiaşi factori prin analiza factorială asupra propriilor
date.
Cercetătorii au încercat evaluarea gradului în care diferite contexte de măsurare ale variabilelor
introduc erori în cadrul analizei factoriale. În acest sens s-a utilizat şi studierea intensivă a
corectitudinii cu care diferite tipuri de analiză factorială extrag aceiaşi factori. Cercetătorii au realizat
investigaţii ale sensibilităţii analizei factoriale nu doar faţă de selecţia variabilelor, ci şi în ceea ce
priveşte diferite tipuri de analiză factorială : maximum likelohood factor analysis, principal component
analisys, principal axis factor analisys, alpha factor analisys.
S-a încercat şi introducerea şi aplicarea specifică la contextul analizei factoriale a unor metode
generale de evaluare a replicabilităţii cercetărilor ştiinţifice.

Regresia liniară.

Operaţiunile de regresie statistică au drept obiectiv principal de a realiza predicţie cât mai exactă
a performanţelor din viitor pe baza unor indicatori din prezent. Termenul de regresie nu trebuie înţeles
în sensul utilizat curent( a regresa înseamnă a reveni la un nivel mai slab, a scădea în pondere), nici în
sens psihanalitic (de revenire la o stare anterioară, mai puţin complexă şi evoluată). Din contră, prin
regresia statistică încercăm să ne direcţionăm spre viitor, prin prognozarea cât mai exactă a stării
viitoare a lucrurilor şi fenomenelor. Capacitatea de predicţie este una dintre caracteristicile definitorii
ale unei discipline pentru a fi considerată ştiinţifică.
Pe lângă regresia în scop predictiv, avem şi un tip de regresie în scop explicativ. Primul fel de
regresie este utilizată pentru a prognoza performanţele viitoare ale unui grup pe baza unui sau mai

5
Note de curs 2017-2018

multor indicatori numiţi predictori . Regresia explicativă are drept obiectiv să explice influenţa unui
set de factori asupra unei variabile criteriu, postulând o relaţie cauzală între acestea. Exemplu:
influenţa consumului de droguri în adolescenţă asupra dificultăţilor de adaptare la viaţa profesională.
Însă, există un ansamblu de factori care pot influenţa adaptarea la viaţa profesională. Regresia
explicativă doar izolează(controlează) statistic influenţa factorilor respectivi pentru a vedea în ce
măsură consumul de droguri contribuie la realizarea inadaptării la exigenţele vieţii profesionale. De
exemplu, la apariţia dificultăţilor de adaptare profesională pot contribui variabile ca slaba calitate a
formării profesionale, dificultăţii materiale persistente, slaba motivare, fond aptitudinal deficitar,etc…
Prin regresia de tip explicativ se pot controla toate aceste influenţe pentru a se observa dacă consumul
de droguri în adolescenţă influenţează dificultăţile de adaptare la viaţa profesională.
Există o diferenţă de utilizare terminologică; în analiza de regresie. În scop predictiv se folosesc
predilect termenii de predictor şi criteriu, pe când în analiza de regresie explicative, se folosesc
predilect termenii de variabilă independentă şi variabilă dependentă. Pe această diferenţiere
terminologică se bazează raţiunea metodologică utilizată în cele două tipuri de analiză. Astfel, regresia
cu scop explicativ urmăreşte să vadă dacă un anumit factor influenţează evoluţia variabilei
dependente, prin controlarea influenţei exercitate de alte variabile incluse în model. Dacă prin
controlarea acestor influenţe, variabila sau variabilele independente, care prezintă interes, contribuie
semnificativ la evoluţia variabilei dependente am putea deduce existenţa unei relaţii între acestea..
Dacă relaţia este susţinută de o teorie relevantă în domeniu sau de o logică temporală sau spaţială a
relaţiilor între ele, ne vom permite să utilizăm termenii de variabilă dependentă şi variabilă
independentă, chiar dacă nu avem de-a face cu un design experimental. Regresia utilizată în sens
explicativ răspunde la întrebarea :Contribuie acest factor la evoluţia variabilei dependente în
condiţiile în care am controlat statistic influenţa altor factori asupra acesteia?
În cazul utilizării regresiei cu scop predictiv, deşi nu este exclusă posibilitatea unei relaţii
cauzale între predictori şi criteriu, interesul este de a găsi o ecuaţie care să estimeze cel mai bine
evoluţia criteriului.. Întrebarea în aceasta nouă situaţie este: care sunt predictorii care ne ajută să
estimăm cel mai bine evoluţia criteriului?..
O diferenţa terminologică semnificativă este şi între regresia liniară simplă şi regresia
multiliniară sau regresia liniară multiplă În primul caz , vorbim de o regresie bazată pe un singur
predictor, de exemplu estimarea influenţe depresiei asupra izolării sociale. Regresia multiliniară
include mai mulţi predictori în ecuaţie, precum nivelul veniturilor, starea familială, integrarea sociallă
etc…. Cu certitudine, modelele multiliniare vor prezice întotdeauna mai bine decât metodele simple,
care pornesc de la un singur predictor. O precizare importantă este aceea că regresia liniară poate fi
aplicată doar dacă măsurarea criteriul(variabila dependentă) are consistenţă scalară de interval sau
de proporţii şi dacă relaţia dintre predictor şi criteriu este liniară. Pentru variabile care satisfac alte
genuri de scale există alte tipuri de analize de regresie, de exemplu cea logistică(variabilă dependentă
dihotomică, de tipul „da-nu”) cea logistică multinomială(variabila dependentă este măsurată prin
scala nominală multinominală, alta decât cea dihotomică.) sau cea ordinală(variabila dependentă este
măsurată prin scala ordinală, de genul răspunsurilor „în mică măsură”, „în măsură satisfăcătoare”, „în
măsură medie”, „în mare măsură” .

Regresia liniară simplă. Principii ale regresiei liniare.

Prin regresie se pot estima rezultatele viitoare ale unor persoane pe baza unor indicatori din
prezent.. Se porneşte de la existenţa unei asocieri între indicatorul utilizat pentru a estima performanţa
viitoare şi criteriul ales pentru a măsura această performanţă. De exemplu, legătura dintre rezultatul la
o probă de dexteritate manuală şi performanţa la o maşină de filat) se poate aprecia printr-o corelaţie
pozitivă: se poate aprecia dacă un rezultat bun la proba de dexteritate manuală va duce la obţinerea
unei bune performanţe la maşina de filat.

6
Note de curs 2017-2018

Pornind de la această asociere se poate estima că persoanele cu un nivel ridicat al dexterităţii


manuale vor fi avantajate în randamentul în cadrul profesiei din industria textilă
Regresia urmăreşte să găsească o ecuaţie care să ne ajute să estimăm cât mai exact valoarea
performanţelor viitoare. Dacă corelaţia între cele două variabile ar fi egală ci 1 sau -1, atunci am putea
anticipa cu exactitate rezultatele viitoare, linia de regresie trecând în acest caz prin toate punctele
norului.

24,00
Textbox 12

11

10
22,00
9

8
20,00
7

6
y

18,00
5

4
16,00
3

2
14,00
1

12,00

10,00 12,00 14,00 16,00 18,00 20,00 22,00

Exemplificare: corelaţie perfectă între cele două variabile(r=1,00)

Însă, existenţa unor coeficienţi perfecţi de corelaţie este de domeniul teoreticului şi nu a


empiricului. Linia de regresie se mai numeşte şi linia celei mai bune ajustări şi estimează cât mai bine
direcţia norului de puncte. Dacă nu există corelaţie între cele două serii de rezultate, atunci linia de
regresie nu poate fi determinată şi pot exista chiar mai multe linii.

7
Note de curs 2017-2018

30,00

25,00

20,00
y

15,00

10,00

5,00

5,00 10,00 15,00 20,00 25,00 30,00

x
_
Exemplu: corelaţie nulă între variabile(re este egal sau aproape de 0

35,00

30,00

25,00
y

20,00

15,00

10,00

5,00 10,00 15,00 20,00 25,00 30,00

x
__
Exemplu: Corelaţie pozitivă între variabile

8
Note de curs 2017-2018

25,00

22,50

20,00
y

17,50

15,00

12,50

10,00

20,00 22,50 25,00 27,50 30,00 32,50 35,00

x
__

Exemplu: corelaţie negativă între cele două variabile

Ecuaţiile de regresie liniară simplă

Ecuaţia de regresie a lui X în Y Ecuaţie de regresie a lui Y în X


 
x  bx * y y  by * x
   
xX X y Y Y
y Y Y x X X
 
X  b x (Y  Y )  X Y  by ( X  X )  Y

 7,3
Exemplu:rxy = 0,85 ;sx =7,3; sy=6,5; Y = 43; X  43; Y  50 X  0,85 * (43  50)  43  35,14
6,5

Condiţiile aplicării regresiei liniare simple sunt:


 VI şi VD sunt cantitative şi normal distribuite;
 Relaţia dintre VI şi VD este una liniară;
 Erorile sunt normal distribuite;
 Evitarea cazurilor influente şi a cazurilor extreme
 O regresie liniară este doar atunci semnificativă, când predictorul X şi criteriul Y
sunt corelaţi

9
Note de curs 2017-2018

 La o regresie liniară simplă trebuie ca variabila criteriu Y să fie prognozată numai


printr-o variabilă-predictor X;; 
 Trebuie să fie găsită o funcţie liniară(ecuaţia este Y  a yx xi  byx ) care descrie
optimal raportul între X şi Y

Analiza de regresie studiază legătura între o variabilă dependentă şi una sau mai multe variabile
independente. Exemplu: De ce persoanele participă la practici oculte?

Studiu J. Mischo (1991) Okkultismus bei Jugendlichen: Ergebnisse einer empirischen


Untersuchung, Mainz: Grünenwald-Verlag.1996. Die Glaube an parapsychische
Phänomene:Schizotypische Muster im Denken und Verhaltan?TW Neurologie Psychiatrie, 10.Studiu-
Eşantion de 401 subiecţi. Practici oculte: a veni contacte cu “supra-senzorialii”, cu cei decedaţi sau
cu “spiritele”(pendul, cărţile de tarot, cititul în palmă). Pe lângă Experienţa cu practici oculte , s-a
ridicat problema credinţei în fenomene psy..Prin aceasta se înţelege credinţa în existenţa de percepţii
extrasenzoriale, de psihokinezii, de precogniţii. Variabile de legătură: religiozitatea şi existenţa
tulburărilor de personalitate

Prin intermediul unor astfel de informaţii caută să se rezolve, prin intermediul unei analize de
regresie, dacă experienţa cu practici oculte depinde de ultimele variabile denumite, adică dacă se lasă
prognozată statistic din ele. În particular, analiza de regresie la o astfel de problematică dă răspunsuri
la întrebări de genul următor :
 Depinde experienţa cu practici oculte de credinţa în fenomene psy ?
 În plus de aceasta, depinde de religiozitate ?
 Cât de bine se lasă prognozată experienţa cu practici oculte din aceste două variabile,
aceasta înseamnă care este cota parte din varianţa variabilei « Experienţa cu practici
oculte » care se lasă explicată din aceastea ?
 Este credinţa în fenomene psy un predictor mai puternic al experienţei cu practici oculte
decât religiozitatea ?
Analiza de regresie este aplicată în strânsă legatură cu analiza analiza corelaţiei, deoarece ambele metode
răspund după relaţiile « cu cât – cu atât mai ». În exemplul de mai sus se ridică întrebarea dacă cu o credinţă mai
puternică în fenomene psy intervine o mai mare experienţă cu practici oculte, deci dacă persoanele, cu cât au mai
multă experienţă în practici oculte, cu atât mai puternic cred ele în practici oculte. În exemplul anterior,
experienţa cu practici oculte este tratată ca variabilă dependentă, în timp ce celelate variabile amintite.au statut
de variabile independente. Ipoteza cercetătorului, în funcţie de scopul practic al unei aplicaţii, stabileţte care
variabile sunt considerate dependente în analiza de regresie şi care variabile sunt considerate ca indeoendente.
Experienţa arată că datele empirice se adună cu multă străduinţă dar, după o scurtă fază de evaluare, sunt
abandonate. Important de ştiut faptul care variabile sunt considerate dependente şi care sunt considerate
independente. Una şi aceiaşi variabilă, în unele studii, poate juca rolul de variabilă independentă, şi în alte studii,
rolul de variabilă dependentă De exemplu, în cercetarea dispoziţiilor, dispoziţia unui anumit comportament este
tratată de cele mai multe ori ca variabilă independentă şi comportamentul relevant dispoziţional ca variabilă
dependentă. Însă există şi cercetători, care atribuie comportamentului statusul de variabilă independentă şi dispoziţiei
cel de variabişă dependent Ipotezele verificate “cu cât – cu atât mai” din analiza de regresie stau la baza
ipotezelor cauzale în multe cazuri, variabila independentă fiind considerată cauză a variabilei dependente Cei drept,
nu demonstreză o relaţie “cu cât – cu atât mai” dovedită de analiza de regresie că ar fi vorba faptic de o relaţie
cauzală. O relaţie semnificativă statistic între două variabile X şi Y poate semnifica următoarele:
1. X este cauza transformărilor din Y,
2. Y este cauza transformărilor din X;
3. X şi Y se influenţează reciproc;

10
Note de curs 2017-2018

4. O altă variabilă Z este cauza transformărilor din Z şi Y.

Introducerea procedeelor de analiză de regresie este folositoare pentru decizia referitoare la ipotezele
cauzale, deoarece o relaţie “cu cât – cu atât mai” asigurată ca semnificativă este cel puţin consistentă cu
acceptarea unei relaţii cauzale, în timp ce o relaţie nesemnificativă contribuie la falsificarea unei ipoteze
cauzale. Analiza de regresie poate să fie introdusă fără acceptarea unei relaţii cauzale, doar pentru
scopuri de prognoză. Analiza cauzelor şi prognoza nu au scopuri deplin independente unul de altul. Într-
un caz, susţine cunoştinţele despre cauzele îmbunătăţirii prognozei, în alt caz, se bazează frecvent
modelele prognostice bune pe variabile cauzale sau pe variabile în strânsă legătură cu ele.
Un al treilea domeniu de introducere a procedeelor de analiză de regresie este analiza seriilor
temporale. În cadrul acesteia, sunt cercetate oscilaţiile variabilelor dependente ca funcţie a timpului.. De
exemplu, se cercetează problema, dacă degradarea unui produs stă la baza oscilaţiilor sezonale sau dacă
frecvenţa suicidului dobândeşte în anumite zile ale săptămânii sau în anumite luni mărimii supra-medii
regulate
O cerinţă de care trebuie să se ţină seama, atât la variabilele dependente cât şi la variabilele
independente, la analiza de regresie se referă la nivelul scalar. Această noţiune se referă la consistenţa
informaţională a cifrelor care sunt atribuite de către cercetător reliefărilor variabilelor individuale
În analiza de regresie, atât variabilele independente cât şi cele dependente, trebuie să posede cel puţin
nivelul de interval. Existenţa nivelului scalar de interval este rar verificată în aplicaţiile din ştiinţele sociale
ale analizei de regresie. Unii cercetători au părerea că îndeplinirea acestei ipoteze(condiţionări) nu trebuie
văzută în ştiinţele sociale ca un caz de regulă. Ne aflăm în faţa unui rigorism teoretic. Exemplu. Putem să
afirmăm la un test de inteligenţă că distanţa caracteristicii între valorile de punctaj între 65 şi 66 este la fel
de mare ca distanţa între 64 şi 65 sau distanţa între 66 şi 67. Astfel de deviaţii sunt însă la multe teste
psihologice şi la alte scale din ştiinţele sociale înguste şi nesistematice. Astfel de deviaţii nesistematice de
la existenţa egalităţii deviaţiilor nu contravine esenţial postulatelor unei scale de interval, ci contribuie
exclusiv la ridicarea varianţei de eroare. În cazul amintit, este această contribuţie a varianţei erorii în
comparaţie cu alte surse de eroare probabil chiar mai îngust. J.Cohen şi P.Cohen ajung la concluzia că
pentru cele mai multe măsurări psihologice şi indici sociologici – ca de exemplu, testele de randament,
testele de aptitudini, testele de inteligenţă şi testele personalitate, scalele de temperatură, testele de interese
profesionale şi scalele de dispoziţii - poate să fie acceptaţ nivelul scalar de interval.
Există o regresie liniară şi o regresie neliniară. În analiza regresiei liniare se acceptă că fiecare
variabilă independentă stă într-o relaţie liniară cu variabila dependentă. Relaţia liniară este exprimată în
general sub forma:

Y = a + bX
Un cunoscut exemplu:
Fahrenheit = 32 + 9/5 Celsius
în care.
 Coeficientul b descrie în cât de multe unităţi se transformă variabila dependentă Y când
variabila independentă X creşte cu o unitate,
 a indică valoarea lui Y pentru X = 0

În cadrul analizei de regresie se desemnează b drept coeficient de regresie şi a drept constantă.o


relaţie liniară se ilustrează printr-o dreaptă, la care b indică panta dreptei şi a punctul de intersecţie cu axa y.
La cercetările empirice, perechile de valori observate (x,y) nu stau aproape niciodată pe linie ci se dispersează
faţă de aceasta. Fundamentele pentru aceste deviaţii de la dreaptă constau, pe de o parte, în aceea că pe lângă
respectivele variabile independente acţionează şi alte mărimi de influenţare asupra variabilelor dependente,
care nu sunt cuprinse în ecuaţia de regresie, şi, pe de altă parte, astfel de deviaţii sunt de explicat prin erori de
măsură. În analiza de regresie este dreapta în aşa fel aleasă, încât deviaţiile valorii y estimate de la valoarea

11
Note de curs 2017-2018

faptică y sunt un minimum. În următoarea ecuaţie sunt luate în consideraţie astfel de deviaţii empirice de la de
la dreaptă care apar. Această ecuaţie este mai realistă decât ecuaţia precedentă.

Y = a + bX + e
Deviaţiile se numesc rezidurii şi sunt reprezentate prin variabila e. Ecuaţiile precedente sunt
desemnate ca analize de regresie simple, deoarece ecuaţia conţine numai o singură variabilă
independentă. La mai multe variabile independente se vorbeşte de analiză de regresie
multiplă,care se prezintă în felul următor în ecuaţie:

Y=a+b1X1+b2X2+….+bjXj+…..e

În care.
 Xj este j variabilă independentă(j = 1,2,3,4…J)
 bj – coeficientul de regresie pentru j-a variabilă independentă

Ţelul analizei de regresie constă în aceea de a afla coeficienţii de regresie necunocuţi b 1, b2 şi


constanta a în datele respectivului eşantion. Pentru scopuri pur descriptive, sarcina analizei de
regresie se limitează la aceasta. În cele mai multe cazuri este înserată analiza de regresie cu scopuri
dincolo de acesta, de a utiliza coeficientul aflat în eşantion ca estimaţie pentru coeficienţii din
populaţie(mulţimea de bază). Astfel eşantionul poate avea 401 de chestionaţi din populaţia de bază.
Astfel de date sunt utilizate frecvent de către cercetător, în scopul de a deduce din acest situaţia în
mulţimea de bază. Analiza de regresie decurge, de cele mai multe ori, în trei paşi:
 se concepe modelul liniar de regresie de cercetat;
 se estimează funcţia de regresie pentru populaţie;
 este verificată funcţia de regresie.

12

S-ar putea să vă placă și