Documente Academic
Documente Profesional
Documente Cultură
parametrice i non
Corelaia Introducere
Definiii.
Corelaia... reprezint o metod utilizat pentru exprimarea gradului de
asociere sau a intensitii unei relaii existente ntre dou valori sau mai multe
variabile(Goodall 1987)
18
16
Variable B
14
12
10
8
6
4
2
0
0
10
Variable A
Rspuns corect: NU!!!
15
20
25
20
15
10
5
0
0
10
15
Rspuns corect:DA!!! Mai mult observm c atunci cnd una crete, cealalt
crete i ea. n limbaj statistic avem de a face cu o corelaie pozitiv ntre cele
2 variabile.
25
20
15
10
5
0
0
10
15
Rspuns corect:DA!!! Mai mult observm c atunci cnd una scade, cealalt scade
i ea. n limbaj statistic avem de a face cu o corelaie negativ ntre cele 2
variabile.
avea precum aminteam mai sus valori ce se pot nscrie/reprezenta pe axa de mai
jos
-1____________ 0 ___________+1
Ca urmare n funcie de valorile nregistrate de r, n teoria modelelor de
corelare apar situaiile ideale i anume: corelaia perfect negativ i cea perfect
pozitiv, cu distribuie perfect linear ; adic valorile ambelor variabile se
distribuie perfect linear ascendent sau descendent (cu inclusiv situaia
exccepional cnd cele dou variabile se suprapun ca valoare). Privii figurile de
mai jos.
16
14
Variable B
12
10
8
6
4
2
0
0
10
Variable A
15
20
16
14
Variable B
12
10
8
6
4
2
0
0
10
15
20
Variable A
Corelaie perfect pozitiv (r = +1)
Condiii de aplicare
- date pentru 2 variabile.
- non parametric ,
Studiu de caz
Rmania, perioada 1991 - 2000
Variabila 1: PNB (per cap loc.)
Variabila 2: Numr vizitatori strini
An
PNB(US$)
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
ADIC
DORIM
STABILIM
DAC
CELE
DOU
VARIABILE CO-VARIAZ.
Stadiul 1
Se ntocmete reprezentarea grafic de distribuie a valorilor celor 2
variabile pentru analiz vizual.
7000
Numar vizitatori
6000
5000
4000
3000
2000
1000
0
0
500
1000
1500
2000
PNB
Stadiul 2
Observnd datele i distribuia acestora situaia este aparent i neclar. n
acest caz, se FORMULEAZ O IPOTEZ. ACEASTA DE REGUL SE BAZEAZ
PE OBSERVAIA EFECTUAT. SE NUMETE IPOTEZ INIIAL I SE
NOTEAZ CU Hi. n cazul de fa o ipotez H i , evident. ar putea fi : Exist o
Nu exist
Variabila
(PNB)
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
Stadiul 4
Variabila
(vizitatori)
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
Se acord rang de mrime valorilor variabilei 1 (i.e. cea mai mare valoare =1,
urmtoarea = 2 etc). nscriei rangul fiecrei valori n coloana 3.
Stadiul 5
n mod similar acordai rang de mrime valorilor variabilei 2. nscriei rangul
fiecrei valori n coloana 4.
Variabila 2 (numr
Rang
(PNB)
vizitatori)
Variabila 1
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
8
10
9
7
5
6
4
1
3
2
Rang
Variabila 2
5
1
3
2
4
8
9
10
7
6
Stadiul 6
Se calculeaz diferena dintre rangi (rang 1 rang 2). Adic din coloana 3
scadei coloana 4. Diferena de rang se noteaz cu d i se nscrie n coloana
5.
Variabila 1
Variabila 2 (numr
Rang
(PNB)
vizitatori)
Variabila 1
1243
859
5,359,000
6,401,000
8
10
Rang
Variabila 2
5
1
3
9
1159
1323
1564
1563
1565
1872
1585
1645
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
9
7
5
6
4
1
3
2
3
2
4
8
9
10
7
6
6
5
1
-2
-5
-9
-6
-4
Stadiul 7
Se ridic la ptrat d (diferena de rang). Aceasta se noteaz cu
d2 i se
nscrie n coloana 6.
Variabila 1
Variabila 2 (numr
Rang
(PNB)
vizitatori)
Variabila 1
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
8
10
9
7
5
6
4
1
3
2
Stadiul 8:
Se calculeaz d2 adic suma tuturor valorilor d2.
d2 = 294
Stadiul 9:
Rang
d2
3
9
6
5
1
-2
-5
-9
-4
-4
9
81
36
25
1
4
25
81
16
16
Variabila 2
5
1
3
2
4
8
9
10
7
6
rs 1 -
d
2
n3 n
unde
rs = este coeficientul de corelaie)
n = numrul de perechi ale variabilelor 1i 2 (sau A i B)
6 294
1000 10
1764
1
990
1 1,78 0,78
1
nainte s
p = 0.01
Cu
ct valoarea lui p este mai mic cu att gradul de confiden este mai mare
ceea ce implic o siguran o mai mare siguran i rigoare de calcul. Gradul
de confiden cu care se lucreaz se stabilete nc din stadiile incipiente
de calcul n funcie de natura variabilelor i numrul de perechi de date
disponibile. n general pentru studiul proceselor, fenomene sociale cu
p = 0,05. Cnd se
N
(numr
perechi
de
95%
99%
(p = 0.05)
(p= 0.01)
1.000
0.886
0.786
0.738
0.683
0.648
0.591
0.544
0.506
1.000
0.929
0.881
0.833
0.794
0.777
0.715
0.665
de
variabile)
5
6
7
8
9
10
12
14
16
Coeficientul de corelare r, este 0.78, mai mare dect valorea lui p = 0,05 ( de
95%) aceasta fiind de0.648. n concluzie se respinge ipoteza nul (Nu exist
nici un fel de relaie ntre PNB i numrul de vizitatori strini n Romnia n
perioada 1991 2000) i se accept ipoteza iniial, (Exist o relaie ntre PNB
i numrul de vizitatori strini n Romnia n perioada 1991 2000)
Stadiul 11
Cel mai important lucru din punct de vedere al tiinelor sociale i deci i al
turismului este interpretarea i analiza rezultatelor.
Ce nseamn acea valoare rs i faptul c am acceptat Hi ?
n final oricine poate calcula un coeficient de corelare. Important este cum
interpretm rezultatul, ce nseamn el!
Pn aici am stabilit (ce-i drept, tiinific) faptul c exist o relaie. Care
este, ns natura relaiei dintre PNB i numrul vizitatorilor strini din Romnia
n perioada 1991-2000?
Stadiul 12:
p = 0.05).
Acest fapt se