Documente Academic
Documente Profesional
Documente Cultură
Aplicația 1
Pentru un muzeu s-au înregistrat în 8 luni date privind numărul mediu de vizitatori în
funcție de numărul mijloacelor de promovare utilizate lunar. În urma prelucrării datelor cu
ajutorul programului Excel şi în ipoteza unei legături liniare, s-au obţinut următoarele
rezultate:
Număr mediu vizitatori (mii persoane) în funcţie de a. Identificaţi variabilele şi caracterizaţi, pe baza
număr mijloace de promovare graficului alăturat, legătura dintre acestea.
b. Alegeţi ecuaţia de regresie cea mai adecvată şi
interpretaţi valorile estimatorilor b0 şi b1:
b.1.)
^y i=− 2 ,74+1 ,62 x i
b.3.)
y^ i=2,74−1,62 x i
b.2.)
^y i=5, 43−0 , 76 x i b.4.)
^y i=−0,51+5 ,97 x i
c. Măsuraţi intensitatea legăturii liniare dintre
variabile, utilizând un indicator adecvat al corelaţiei
parametrice, pe baza următoarele informaţii:
8 8
∑ ( x i − x̄ )2=43 , 47 ∑ ( y i− ȳ )2=1653 , 41
i=1 i=1
cov ( x i , y i )=37 , 07
d. Calculaţi coeficientul de corelaţie a rangurilor
Spearman. Interpretaţi valoarea acestuia.
Rezolvare:
yi = f ( xi )
Nr mediu vizitatori = f ( Nr. mijloace de promovare )
(mii persoane)
1
b. Alegeţi ecuaţia de regresie cea mai adecvată şi interpretaţi valorile estimatorilor b0 şi
b1:
1.)
^y i=− 2 ,74+1 ,62 x i 3.)
^y i=2,74−1,62 x i
^y i=5, 43−0 , 76 x i 4.)
^y i=−0,51+5 ,97 x i
2.)
Funcția se alege în raport cu interpretarea estimatorilor b 0 și b1.
trebuie să fie pozitiv,
Conform graficului fiind o legătură directă între variabile atunci b 1
deci avem de ales între varianta 1.) și 4.). Totodată, dacă privim graficul și încercăm să
prelungim dreapta de regresie, intersecția cu OY poate fi numai la valoarea -0,51, deci b 0
= - 0,51. Prin urmare, varianta corectă este varianta 4.) funcția de regresie:
^y i=−0 ,51+5 , 97 x i
Interpretare estimatori (b0 și b1):
b0= - 0,51 reprezintă intercept (termen liber) care arată punctul de intersecție dintre
axa OY și dreapta de regresie i ^y
(este nr mediu vizitatori în condițiile în care nr
mijloacelor de promovare=0)
b1= 5,97 reprezintă coeficientul de regresie care fiind negativ arată că, legătura dintre
nr mediu al vizitatorilor și nr mijloacelor de promovare este directă, astfel încât creșterea nr
mijloacelor de promovare cu 1 mijloc de promovare determină o creștere a nr mediu al
vizitatorilor în medie cu aproximativ 6 vizitatori (5,97).
cov ( x i ; y i )
r= =????
Coeficientul de corelație se poate determina cu relația:
sx sy
Trebuiesc determinate valorile abaterilor standard:
n
∑ ( x i −x ) 2
43 , 47
s x=√ s2x s 2x= i=1 = =6 ,21 s x=√ s2x= √6 , 21=2 , 49
unde n−1 8−1 deci
n
∑ ( y i − y )2
1653 , 41
s y =√ s 2y s 2y = i=1 = =236 , 20 s y =√ s 2y =√ 236 ,20=15, 37
unde n−1 8−1 deci
cov ( x i ; y i ) 37 , 07
r= = =0 , 9686≃0 , 97
sxsy 2, 49⋅15 ,37
r=0 ,97 arătă că, legătura dintre nr
Valoarea coeficientului de corelație (Pearson)
mediu al vizitatorilor și nr mijloacelor de promovare este directă, foarte puternică deoarece
r ∈ ( 0,95 ; 1 )
3
n
2⋅∑ S i
i=1 2⋅24
r K= = =+ 0 , 86
n ( n−1 ) 8⋅( 8−1 )
Valoarea coeficientului de corelaţie a rangurilor Kendall, r K = +0 , 86 ne arată
că, între rangurile acordate nr mijloace de promovare şi cele stabilite pentru nr mediu
vizitatori, există o corelaţie directă puternică, deoarece r K ∈ ( 0, 75 ; 0 , 95 ) .
Aplicația 2
yi = f ( xi )
Rata abandonului școlar = f ( numărul mediu al salariaților)
(%) (mii persoane)
4
x i – variabila factorială/independentă = numărul mediu al salariaților (mii persoane)
b0= 2, 29 b0 = −2 ,29
1) 3)
b1 =5 , 08 b1 =−5, 08
b0 =2 ,31 b0 = −20 , 48
2) 4)
b1 =−0 , 0082 b1 =10 , 78
Conform graficului, fiind o legătură indirectă între rata abandonului școlar și numărul
mediu al salariaților atunci b1 trebuie să fie negativ, deci avem de ales între varianta 2) și
3). Totodată, dacă privim graficul și încercăm să prelungim dreapta de regresie,
intersecția cu OY poate fi numai pozitivă deci, b0 =2 , 31 . Prin urmare, varianta corectă
b0= 2,31 reprezintă intercept (termen liber) care arată punctul de intersecție dintre axa OY
și dreapta de regresie
^y i (este rata abandonului școlar în condițiile în care numărul
mediu al salariaților = 0)
b1= - 0,0082 reprezintă coeficientul de regresie care fiind negativ arată că legătura dintre
rata abandonului școlar și numărul mediu al salariaților este indirectă, astfel încât
creșterea numărul mediu al salariaților cu o mie persoane determină o scădere a rata
abandonului școlar în medie cu 0,0082 %.
5
s 53 , 78
r=b1⋅ x =(− 0 , 0082 )⋅ =− 0 , 53
sy 0 , 83
s x=√ s2x= √2892 , 62=53 , 78
Coeficientul de corelație prin valoarea r=− 0,53 arată că între rata abandonului
școlar și numărul mediu al salariaților există o corelație indirectă ( r <0 ) de intensitate
medie deoarece r ∈ (−0 ,75 ; −0,5 ) .
137 1,1 2 5 1 6 -5 25
44 3,2 5 1 2 5 -3 9
85 1,5 3 4 3 4 -1 1
33 2,1 7 2 4 3 1 1
43 0,8 6 7 5 1 4 16
173 1 1 6 6 7 -1 1
56 1,8 4 3 7 2 5 25
7
----- ∑ d 2i =78
i=1
6∑ d 2
i 6⋅78
r S =1− =1− =−0 , 39
n ( n2 −1 ) 7⋅( 7 2 −1 )
Valoarea coeficientului de corelaţie a rangurilor Spearman, S
r = −0 ,39
ne arată că,
între rangurile acordate numărului mediu al salariați şi cele stabilite pentru rata abandonului
școlar, există o corelaţie indirectă slabă, deoarece
r S ∈ (−0,5 ; −0,2 ) .
IV. Metoda neparametrică a coeficientului de corelație a rangurilor Kendall