Sunteți pe pagina 1din 7

Aplicații_bilete de examen

Aplicația 1
Pentru un muzeu s-au înregistrat în 8 luni date privind numărul mediu de vizitatori în
funcție de numărul mijloacelor de promovare utilizate lunar. În urma prelucrării datelor cu
ajutorul programului Excel şi în ipoteza unei legături liniare, s-au obţinut următoarele
rezultate:

Număr mijloace de promovare 7 5 9 8 10 2 6 7


4 5 4
Număr mediu vizitatori (mii persoane) 32 61 8 35 34
2 0 0

Număr mediu vizitatori (mii persoane) în funcţie de a. Identificaţi variabilele şi caracterizaţi, pe baza
număr mijloace de promovare graficului alăturat, legătura dintre acestea.
b. Alegeţi ecuaţia de regresie cea mai adecvată şi
interpretaţi valorile estimatorilor b0 şi b1:
b.1.)
^y i=− 2 ,74+1 ,62 x i

b.3.)
y^ i=2,74−1,62 x i
b.2.)
^y i=5, 43−0 , 76 x i b.4.)
^y i=−0,51+5 ,97 x i
c. Măsuraţi intensitatea legăturii liniare dintre
variabile, utilizând un indicator adecvat al corelaţiei
parametrice, pe baza următoarele informaţii:
8 8
∑ ( x i − x̄ )2=43 , 47 ∑ ( y i− ȳ )2=1653 , 41
i=1 i=1
cov ( x i , y i )=37 , 07
d. Calculaţi coeficientul de corelaţie a rangurilor
Spearman. Interpretaţi valoarea acestuia.

Rezolvare:

a. Identificaţi variabilele şi caracterizaţi, pe baza graficului alăturat, legătura dintre


acestea.

yi = f ( xi )
Nr mediu vizitatori = f ( Nr. mijloace de promovare )
(mii persoane)

y i - variabila rezultativă = număr mediu vizitatori (mii persoane)

x i – variabila factorială / independentă = număr mijloace de promovare

Deoarece punctele se plasează pe direcţia primei bisectoare, atunci legătura dintre


număr mediu vizitatori și număr mijloace de promovare este directă

1
b. Alegeţi ecuaţia de regresie cea mai adecvată şi interpretaţi valorile estimatorilor b0 şi
b1:
1.)
^y i=− 2 ,74+1 ,62 x i 3.)
^y i=2,74−1,62 x i
^y i=5, 43−0 , 76 x i 4.)
^y i=−0,51+5 ,97 x i
2.)
Funcția se alege în raport cu interpretarea estimatorilor b 0 și b1.
trebuie să fie pozitiv,
Conform graficului fiind o legătură directă între variabile atunci b 1
deci avem de ales între varianta 1.) și 4.). Totodată, dacă privim graficul și încercăm să
prelungim dreapta de regresie, intersecția cu OY poate fi numai la valoarea -0,51, deci b 0
= - 0,51. Prin urmare, varianta corectă este varianta 4.) funcția de regresie:
^y i=−0 ,51+5 , 97 x i
Interpretare estimatori (b0 și b1):
b0= - 0,51 reprezintă intercept (termen liber) care arată punctul de intersecție dintre
axa OY și dreapta de regresie i ^y
(este nr mediu vizitatori în condițiile în care nr
mijloacelor de promovare=0)
b1= 5,97 reprezintă coeficientul de regresie care fiind negativ arată că, legătura dintre
nr mediu al vizitatorilor și nr mijloacelor de promovare este directă, astfel încât creșterea nr
mijloacelor de promovare cu 1 mijloc de promovare determină o creștere a nr mediu al
vizitatorilor în medie cu aproximativ 6 vizitatori (5,97).

c. Măsuraţi intensitatea legăturii liniare dintre variabile, utilizând un indicator


adecvat al corelaţiei parametrice, pe baza următoarele informaţii:
8 8

∑ ( x i − x̄ )2=43 , 47 ∑ ( y i− ȳ )2=1653 , 41 cov ( x i , y i )=37 , 07


i=1 i=1

cov ( x i ; y i )
r= =????
Coeficientul de corelație se poate determina cu relația:
sx sy
Trebuiesc determinate valorile abaterilor standard:
n
∑ ( x i −x ) 2
43 , 47
s x=√ s2x s 2x= i=1 = =6 ,21 s x=√ s2x= √6 , 21=2 , 49
unde n−1 8−1 deci
n
∑ ( y i − y )2
1653 , 41
s y =√ s 2y s 2y = i=1 = =236 , 20 s y =√ s 2y =√ 236 ,20=15, 37
unde n−1 8−1 deci
cov ( x i ; y i ) 37 , 07
r= = =0 , 9686≃0 , 97
sxsy 2, 49⋅15 ,37
r=0 ,97 arătă că, legătura dintre nr
Valoarea coeficientului de corelație (Pearson)
mediu al vizitatorilor și nr mijloacelor de promovare este directă, foarte puternică deoarece
r ∈ ( 0,95 ; 1 )

Foarte Slabă de intensitate medie Foarte Puternică


0 0,2 0,5 0,75 0,95 1
Slabă Puternică
2
d. Calculaţi coeficientul de corelaţie a rangurilor Spearman. Interpretaţi
valoarea acestuia.

I. Metoda neparametrică a coeficientului de corelație a rangurilor


Spearman
Tabel - Algoritmul de determinare a coeficientul de corelaţie neparametrică Spearman
Nr mediu
Nr mijloace
promovare
xi
vizitatori
(mii pers) Rx Ry
xcr R yf (Rx) R di 2
di
yi
7 42 4 3 1 1 0 0
5 32 7 7 2 2 0 0
9 50 2 2 3 4 -1 1
8 40 3 4 4 3 1 1
10 61 1 1 5 6 -1 1
2 8 8 8 6 5 1 1
6 35 6 5 7 7 0 0
7 34 5 6 8 8 0 0
8
----- ∑ d 2i =4
i=1
6∑ d 2
i 6⋅4
r S =1− =1− =0 , 9524≃0 , 96
n ( n2 −1 ) 8⋅( 82 −1 )
Valoarea coeficientului de corelaţie a rangurilor Spearman, S ne arată
r = 0,96
că, între rangurile acordate nr. mijloacelor promovare şi cele stabilite pentru nr.
mediu vizitatori, există o corelaţie directă foarte puternică, deoarece r S ∈ ( 0, 95 ; 1 ) .
II. Metoda neparametrică a coeficientului de corelație a rangurilor Kendall
Tabel - Algoritmul de determinare a coeficientul de corelaţie neparametrică Spearman
Nr
Nr mediu
mijloace
promovar
e
vizitatori
(mii pers) Rx Ry
xcr R yf (Rx) R Pi Qi Si
xi yi
7 42 4 3 1 1 7 0 7
5 32 7 7 2 2 6 0 6
9 50 2 2 3 4 4 1 3
8 40 3 4 4 3 4 0 4
10 61 1 1 5 6 2 1 1
2 8 8 8 6 5 2 0 2
6 35 6 5 7 7 1 0 1
7 34 5 6 8 8 0 0 0
8 8 8
∑ Pi =26 ∑ Qi =2 ∑ Si =24
i=1 i=1 i=1

3
n
2⋅∑ S i
i=1 2⋅24
r K= = =+ 0 , 86
n ( n−1 ) 8⋅( 8−1 )
Valoarea coeficientului de corelaţie a rangurilor Kendall, r K = +0 , 86 ne arată
că, între rangurile acordate nr mijloace de promovare şi cele stabilite pentru nr mediu
vizitatori, există o corelaţie directă puternică, deoarece r K ∈ ( 0, 75 ; 0 , 95 ) .

Aplicația 2

La nivelul regiunii de dezvoltare Sud-Muntenia, pe județe, s-au înregistrat date


privind rata abandonului școlar din învățământul primar și gimnazial în funcție de numărul
mediu al salariaților. În urma prelucrării datelor cu ajutorul programului Excel şi în ipoteza
unei legături liniare, s-au obţinut următoarele rezultate:
13 17
Numărul mediu al salariaților (mii persoane) 7 44 85 33 43 3 56
3, 1, 2, 0, 1,
Rata abandonului scolar (%) 1,1 2 5 1 8 1 8

b. Scrieţi ecuaţia de regresie liniară şi interpretaţi valorile


Rata abandonului școlar în funcţie de estimatorilor b0 şi b1.
numărul mediu al salariaților (mii persoane)
b0= 2, 29 b0 = −2 ,29
1) 3)
b1 =5 , 08 b1 =−5, 08
b0 =2 ,31 b0 = −20 , 48
2) 4)
b1 =−0 , 0082 b1 =10 , 78

c. Măsuraţi intensitatea legăturii liniare dintre variabile,


utilizând un indicator adecvat al corelaţiei parametrice, pe
baza unui estimator al funcției de regresie determinate și
următoarele informaţii;
Sample variance
2892,62
a. Analizaţi relaţia dintre cele două variabile, (nr mediu salariați)
utilizând graficul Standard Deviation
0,83
(Rata abandonului școlar)

d. Calculaţi coeficientul de corelaţie a rangurilor Kendall.


Interpretaţi valoarea acestuia.

a. Analizaţi relaţia dintre cele două variabile, utilizând graficul

yi = f ( xi )
Rata abandonului școlar = f ( numărul mediu al salariaților)
(%) (mii persoane)

y i - variabila rezultativă = Rata abandonului școlar (%)

4
x i – variabila factorială/independentă = numărul mediu al salariaților (mii persoane)

Deoarece punctele se plasează pe direcţia celei de-a doua bisectoare, atunci


legătura dintre rata abandonului școlar și numărul mediu al salariaților este indirectă.

b. Scrieţi ecuaţia de regresie liniară şi interpretaţi valorile estimatorilor b0 şi b1.

b0= 2, 29 b0 = −2 ,29
1) 3)
b1 =5 , 08 b1 =−5, 08
b0 =2 ,31 b0 = −20 , 48
2) 4)
b1 =−0 , 0082 b1 =10 , 78

Conform graficului, fiind o legătură indirectă între rata abandonului școlar și numărul
mediu al salariaților atunci b1 trebuie să fie negativ, deci avem de ales între varianta 2) și
3). Totodată, dacă privim graficul și încercăm să prelungim dreapta de regresie,
intersecția cu OY poate fi numai pozitivă deci, b0 =2 , 31 . Prin urmare, varianta corectă

este 2) b0 =2, 31 b1 =−0 , 0082 iar funcția de regresie este:


^y i=2, 31−0 , 0082 x i

b0= 2,31 reprezintă intercept (termen liber) care arată punctul de intersecție dintre axa OY
și dreapta de regresie
^y i (este rata abandonului școlar în condițiile în care numărul
mediu al salariaților = 0)

b1= - 0,0082 reprezintă coeficientul de regresie care fiind negativ arată că legătura dintre
rata abandonului școlar și numărul mediu al salariaților este indirectă, astfel încât
creșterea numărul mediu al salariaților cu o mie persoane determină o scădere a rata
abandonului școlar în medie cu 0,0082 %.

c. Măsuraţi intensitatea legăturii liniare dintre variabile, utilizând un indicator


adecvat al corelaţiei parametrice, pe baza unui estimator al funcției de regresie
determinate și următoarele informaţii:

s 2x=2892 , 62 Sample variance


2892,62
(nr mediu salariați)
s y =0,83 Standard Deviation
0,83
(Rata abandonului școlar)
^y i=2 , 31−0 , 0082 x i Funcția de regresie b1 =−0 , 0082

Intensitatea legăturii liniare dintre rata abandonului școlar și numărul mediu al


salariaților se poate măsura cu ajutorul coeficientului de corelație (Pearson), astfel:

5
s 53 , 78
r=b1⋅ x =(− 0 , 0082 )⋅ =− 0 , 53
sy 0 , 83
s x=√ s2x= √2892 , 62=53 , 78

Coeficientul de corelație prin valoarea r=− 0,53 arată că între rata abandonului
școlar și numărul mediu al salariaților există o corelație indirectă ( r <0 ) de intensitate
medie deoarece r ∈ (−0 ,75 ; −0,5 ) .

Foarte Slabă de intensitate medie Foarte Puternică


0 0,2 0,5 0,75 0,95 1
Slabă Puternică

d. Calculaţi coeficientul de corelaţie a rangurilor Kendall. Interpretaţi valoarea


acestuia.

III. Metoda neparametrică a coeficientului de corelație a rangurilor


Spearman
Tabel - Algoritmul de determinare a coeficientul de corelaţie neparametrică Spearman
Numărul mediu Rată abandon
salariați(mii pers)
xi
școlar (%)
yi
Rx Ry R xcr R yf (Rx)
di 2
di

137 1,1 2 5 1 6 -5 25
44 3,2 5 1 2 5 -3 9
85 1,5 3 4 3 4 -1 1
33 2,1 7 2 4 3 1 1
43 0,8 6 7 5 1 4 16
173 1 1 6 6 7 -1 1
56 1,8 4 3 7 2 5 25
7
----- ∑ d 2i =78
i=1
6∑ d 2
i 6⋅78
r S =1− =1− =−0 , 39
n ( n2 −1 ) 7⋅( 7 2 −1 )
Valoarea coeficientului de corelaţie a rangurilor Spearman, S
r = −0 ,39
ne arată că,
între rangurile acordate numărului mediu al salariați şi cele stabilite pentru rata abandonului
școlar, există o corelaţie indirectă slabă, deoarece
r S ∈ (−0,5 ; −0,2 ) .
IV. Metoda neparametrică a coeficientului de corelație a rangurilor Kendall

Tabel - Algoritmul de determinare a coeficientul de corelaţie neparametrică Spearman


Nr mediu Rată
salariați abandon
(mii pers) școlar (%) Rx Ry
xcr R R
yf (Rx)
Pi Qi Si
xi yi
137 1,1 2 5 1 6 1 5 -4
6
44 3,2 5 1 2 5 1 4 -3
85 1,5 3 4 3 4 1 3 -2
33 2,1 7 2 4 3 1 2 -1
43 0,8 6 7 5 1 1 1 0
173 1 1 6 6 7 0 1 -1
56 1,8 4 3 7 2 0 0 0
7 7 7
∑ Pi =5 ∑ Qi =16 ∑ Si =−11
i=1 i=1 i=1
n
2⋅∑ S i
i=1 2⋅(−11 )
r K= = =−0 , 52
n ( n−1 ) 7⋅(7−1 )
Valoarea coeficientului de corelaţie a rangurilor Kendall, r K = −0 , 52 ne arată
că, între rangurile acordate numărului mediu al salariați şi cele stabilite pentru rata
abandonului școlar, există o corelaţie indirectă de intensitate medie, deoarece
r k ∈ (−0 , 75 ; −0,5 ) .

S-ar putea să vă placă și