Documente Academic
Documente Profesional
Documente Cultură
Metodele statistice
cele mai utilizate în analiza legăturilor
a. Metoda grafică
Fenomenul se reprezintă cu ajutorul diagramei norului de puncte, denumită şi corelogramă, astfel:
Interpretarea se realizează după cum sunt repartizate punctele pe grafic:
dacă punctele se plasează pe direcţia primei bisectoare, atunci legătura dintre cele două variabile
este directă
plasarea punctelor pe direcţia celei de-a doua bisetoare, prezintă o legătură inversă
cu cât punctele sunt mai concentrate în apropierea primei sau celei de-a doua bisectoare, cu atât
legătura estemai intensă
dacă repartizarea punctelor se face pe direcţia unei drepte, atunci forma legăturii este liniare, în
caz contrar se vorbeşte despre o legătură neliniară (parabolică, exponenţială etc)
1
b. Metoda parametrică a regresiei liniare unifactoriale
Funcţia de regresie liniară unifactorială are forma dată prin relaţia:
yˆ i b0 b1 xi
din care se observă că variabila rezultativă ŷi depine de o singură variabilă factorială xi .
Parametrii b0 şi b1 sunt estimatori ai punctului de intercepţie , respectiv ai pantei liniei de regresie
(funcţia de regresie la nivelul colectivităţii generale fiind: Yi 0 1 xi i ).
În general practica a demonstrat că metoda cea mai fidelă şi utilizată pentru estimarea parametrilor
este metoda celor mai mici pătrate.
n n
min
i 1
( y i yˆ i ) 2 = min (y
i 1
i a bxi ) 2 , care conduce la sistemul de ecuaţii normale:
n n
na b
i 1
x i
i 1
yi
n n n
a xi b xi2 xi yi
i 1 i 1 i 1
Estimatorul b0 :
- este denumit termen liber (intercept);
- are caracter de mărime medie – indică valoarea variabilei rezultative y când toţi factorii
neesenţiali au o acţiune constantă (este nivelul mediu al variabilei y determinată prin influenţa celorlalţi
factori, în afara lui xi ).
- în reprezentarea grafică, indică punctul de întâlnire dintre axa OY şi panta dreptei de regresie.
- valoarea pozitivă ( b0 0 ) sau negativă ( b0 0 ) nu are nici o relevanţă în modelul regresiei.
Estimatorul b1 :
- se numeşte şi coeficient de regresie;
- arată:
gradul de influenţă a variabilităţii factoriale x asupra rezultativei y (cu cât variază în medie y în
condiţiile modificării cu o unitate a factorului x ).
direcţia legăturii:
b1 0 , legătură directă (creşterea valorilor variabilei factoriale x determină o creştere a valorilor
ecuaţiilor de regresie şi invers).
b1 0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x determină o scădere a
valorilor ecuaţiilor de regeresie şi invers).
b1 0 , nu există legătură; variabilele sunt independente valoarea mediea a caracteristicii factoriale x
este egală cu cea a caracteristicii rezultative).
- în reprezentarea grafică, parametrii exprimă panta dreptei de regresie.
2
c. Metoda parametrică a raportului de corelaţie
Raportul de corelaţie se stabileşte în funcţie de coeficientul de determinaţie ( R 2 ) rezultat din regula
de adunare a dispersiilor:
n n
yˆ i y y yˆ i
2 2
i
R R2 i 1
n
1 i 1
n
y y y y
2 2
i i
i 1 i 1
- dacă R 0 , cele două variabile sunt independente, deci nu există o legătură între ele (toate mediile
sunt egale între ele);
- dacă R 0;0,2 , există o legătură foarte slabă între variabilele studiate;
- dacă R 0,2 ;0,5, există o legătură slabă între cele două variabile;
- dacă R 0,5; 0,75, există o legătură de intensitate medie între variabile;
- dacă R 0,75; 0,95, există o legătură puternică între cele două variabile
- dacă R 0,95 ;1, există o legătură foarte puternică între variabile;
- dacă R 1 , există o legătură perfectă, deterministă sau funcţională între cele două variabile
cov x, y
xi x y i y
n
Rezultatul obţinut prin determinarea acestui indicator ne indică direcţia legăturii stabilite între cele
două variabile x, y , astfel:
3
e. Metoda parametrică a coeficientului de corelaţie
În cazul corelaţiei simple liniare, pentru o serie bidimensională simplă, coeficientul de corelaţie se
calculează astfel:
n
x i x y i y
cov x; y s xy
r i 1
ns x s y sx s y sx s y
sau
n
x
i 1
i x y i y
r
n 2
n
2
i 1
x i x
i 1
yi y
respectiv:
n n n
n
i 1
xi y i y
i 1
xi
i 1
i
r
n n n 2 n
2
2
i 1
xi xi y i
2
y i
i 1
i 1 i 1
4
f. Metoda neparametrică a coeficienţilor de corelație a rangurilor
Spearman şi Kendall
6d
2
1 1,1
i
nn 1
C S 2
în care:
n numărul de unităţi observate
Observaţie!
Coeficientul rangurilor Spearman are o interpretare similară cu a coeficientului de corelaţie
parametrică
2 S i
CK 1,1
nn 1
în care: n numărul de unităţi observate
Observaţie!
Coeficientul rangurilor Kendall are o interpretare similară cu a coeficientului de corelaţie parametrică
5
g. Metoda neparametrică a coeficientului Yulle
Aplicabilitatea acestui coeficient se bazează pe întocmirea tabelului de asociere:
y peste sub
y y Total
x
peste x a b a+b
sub x c d c+d
Total a+c b+d a+b+c+d
Metodologia determinării coeficientului de asociere Yulle depinde de tipul caracteristicilor care stau
la baza analizei legăturii de asociere.
Etapele de determinare a coeficientului de asociere Yulle, când ambele caracteristici sunt
cantitative, sunt următoarele:
1 – se schiţează tabelul de asociere ce urmează a fi completat
n n
xi y i
2 – se determină valorile medii ale caracteristicilor ( x şi y ), astfel: x i 1
şi y i 1
n n
3 – se acordă semnul “+”, respectiv “-“, fiecărei valori xi şi yi după cum este mai mare sau egală,
respectiv mai mică în comparaţie cu valoarea medie corespunzătoare, ( x sau y );
4 – se numără câte valori perechi , , , , , , , sunt, iar rezultatele numărării se trec în
tabel astfel:
a - numărul perechilor ,
b - numărul perechilor ,
c - numărul perechilor ,
d - numărul perechilor ,
Cea mai largă aplicabilitate o are utilizarea acestui coeficient în cazul caracteristicilor nenumerice
(exemplu: când se doreşte analiza legăturii la nivelul unei firme dintre sexul salariaţilor şi opinia acestora
cu privire la momentul petrecerii concediului: vara sau iarna)