Sunteți pe pagina 1din 4

Seminar 11-12

0. Pentru 7 regiuni turistice din zona montană, s-au înregistrat numărul de pârtii de schi omologate şi încasările din turism (mil. Eur):
Număr de pârtii de schi omologate 6 7 9 10 8 6 5
Încasări din turism (mil. Euro) 12 17 18 18 21 14 11

Se cere:

a) Analizati grafic legatura dintre cele doua variabile;


b) Analizati omogenitatea distributiei regiunilor in functie de fiecare variabila
c) Estimati modelul de regresie adecvat analizei dependentei dintre variabila “Incasari din turism” si variabila “Număr de pârtii de schi
omologate”;
d) Interpretati valorile coeficientilor de regresie obtinuti;
e) Determinati coeficientul de corelatie liniara Pearson si interpretati valoarea acestuia.

1. Pentru a analiza dependenţa dintre rezultatele obţinute de studenţi la examene şi timpul alocat pregătirii individuale, pentru un
eşantion aleator de 25 de studenţi din anul II al facultatii CSIE (2014-2015) au fost înregistrate date referitoare la nota obţinută la
examenul de Baze de date şi numărul de ore de studiu individual pentru pregătirea la această disciplină. Pentru a analiza legătura
dintre aceste variabile a fost construit si rezolvat un model de regresie (intre cele doua variabile există legatură liniară). Rezultatul,
partial completat, obţinut în urma prelucrării datelor în EXCEL este:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.901
R Square ……
Adjusted R Square 0.804
Standard Error 0.825
Observations …….

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept …… 0.548 2.952 0.007 0.484 2.754
nr.ore studiu individual …… 0.016 9.981 0.0001 0.124 0.188
Se cere:
a) Completaţi adecvat informaţiile lipsă din ouput-ul obţinut în urma prelucrării datelor (se precizează formulele de calcul utilizate
pentru obţinerea valorilor lipsă);
b) Raspundeţi la următoarele întrebări (argumentând răspunsul):
b1) În ce proporţie influenţează numărul de ore de studiu individual nota obţinută la disciplina de date?
b2) Modelul de regresie obtinut este valid pentru o probabilitate de 95%?
b3) Dacă timpul alocat studiului individual creşte cu 10 ore, cu cât se va creşte, aproximativ, nota obţinută la examen?

2. Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi numărul vizitatorilor (mii pers.)
timp de 5 zile. Modelul de regresie obţinut în urma prelucrării datelor este: ŷi =9,13+3,98xi. Se cunosc: varianţa datorată regresiei

(sistematică) SSR   yˆ  y 


n n

y  yˆ i  =60. Să se testeze semnificaţia modelului de


2
=740,8; varianţa reziduală SSE 
2
i i
i 1 i 1
regresie folosind testul F, pentru un nivel de semnificaţie α=0,05.

3. O firmă ce organizează licitaţii pentru vânzarea unor antichităţi doreşte să determine relaţia dintre preţul obţinut pentru articolele
licitate (u.m.) şi numărul de persoane ce participă la licitaţie. În ipoteza unui model de regresie liniară, rezultatele prelucrării în
EXCEL sunt:
Regression Statistics
Multiple R 0.860271
R Square 0.740066
Adjusted R Square 0.707575
Standard Error 177.7908
Observations 10
1
ANOVA
df SS MS F Significance F
Regression 1 719973.5 719973.5 22.77708 0.001404
Residual 8 252876.5 31609.56
Total 9 972850

Coefficients Standard Error t Stat P-value


Intercept 1086.691 174.4825 6.228079 0.000252
Marimea audientei 9.329102 1.954748 4.772534 0.001404
a) Determinati modelul de regresie adecvat analizei dependendentei dintre cele doua variabile
b) Să se interpreteze rezultatele din tabele;
c) Determinaţi şi interpretaţi intervalele de încredere pentru parametrii modelului (tcritic=2,896).

4. Considerăm rezultatele regresiei pentru 50 de observații: Y=0.78+1.2*X, abaterea standard a intercepției este 0.4, iar abaterea
standard a coeficientului de regresie este 0.45. Care dintre variante exprimă corect valoarea testului statistic t pentru panta de
regresie și evaluează corect semnificația sa statistică la o probabilitate de 95% (t 0,025;48=2,01)? a) t = 3.00 – panta este semnificativ
diferită de 0; b) t = 1.789 – panta nu este semnificativ diferită de 0; c) t = 2.667 – panta este semnificativ diferită de 0; d) niciun
răspuns corect.

5. A fost construită o regresie liniară simplă, pe baza a 100 de observații. 𝑀𝑆𝐸 = 2,807 și 𝑀𝑆𝑅 = 117,9. Raportul de corelație
este: a) 0,3; b) 0,55; c) 0,99; d) 0,97; e) niciun răspuns corect.

6. Spre deosebire de coeficientul de determinație, coeficientul de corelație: a) indică dacă panta dreptei de regresie este pozitivă
sau negativă; b) indică procentul de variație explicat de modelul de regresie; c) măsoară exact intensitatea asocierii dintre două
variabile; d) poate fi utilizat și în cazul dependenței neliniare; e) niciun răspuns corect.

7. Care dintre următoarele afirmații referitoare la abaterea standard a erorilor pentru un model unifactorial este cel mai puțin
adevărată? a) este pătratul raportului de corelație; b) este rădăcina pătrată a sumei pătratelor abaterilor de la dreapta de regresie,
raportată la (𝑛 − 2); c) măsoară variabilitatea variabilei 𝑌 care nu este explicată de ecuația de regresie; d) este rădăcina pătrată a
măsurii 𝑀𝑆𝐸; e) niciun răspuns corect.

8. Managerul unei agenții imobiliare dorește să știe care este dependența dintre prețul de vânzare al unei case (mii Euro) și suprafața
utilă (mp). Pentru aceasta el analizează datele selectate de la ultimele 15 tranzacții, iar în urma prelucrării datelor în programul Excel
și în ipoteza unei legături liniare obține următorul grafic:
500
preț vânzare (mii euro)

400

300

200

100

0
0 2 4 6 8 10 12 14
Distanță stație metrou (km)

a) Identificați variabilele utilizate și specificați care este variabila exogenă;


b) Specificați tipul, sensul și intensitatea legăturii;
c) Identificați care dintre următoarele ecuații de regresie este cea posibilă pentru datele prezentate:
𝑌̂ = 391 − 27,513 ∙ 𝑋;
𝑌̂ = 391 + 27,513 ∙ 𝑋
𝑌̂ = 27,513 + 391 ∙ 𝑋
𝑌̂ = 100 − 0,513 ∙ 𝑋

2
9. Un cercetător este interesat de relația existentă între venitul unei persoane și vârsta acesteia. Pentru aceasta selectează aleator
un eșantion de 29 persoane si înregistrează valori pentru variabilele venit lunar (sute lei) și vârstă (ani). În urma prelucrării
datelor cu modulul Regression din EXCEL, in ipoteza unei dependențe liniare, se obțin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,797764
R Square 0,636427
Adjusted R Square 0,623442
Standard Error 3,879192
Observations 29
ANOVA
df SS MS F Significance F
Regression ………….. ………….. ………….. ………….. 0,000000130
Residual ………….. 421,3477 …………..
Total ………….. 1158,907

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 0,127095 ………….. 0,046266 0,9634266 ………….. …………..
varsta 0,511964 ………….. 7,000953 0,00000013 ………….. …………..
Se cere:
a) Completați spațiile punctate din tabelul ANOVA adecvat și testați semnificația modelului, pentru o probabilitate de
garantare a rezultatelor de 95% (Fcritic=4,21);
b) Testati semnificatia parametrilor modelului de regresie, determinati intervalele de incredere pentru acestia. Interpretați
rezultatele obținute (tcritic= 2,052).

10. În vederea realizării unui studiu privind influenţa calităţii infrastructurii asupra activităţii turistice, s-au înregistrat investiţiile în
infrastructură (mil. Eur) şi rata locurilor vacante din unităţile hoteliere (%), pentru 8 zone turistice. Datele se prezintă astfel:
Investiţii în infrastructură (mil. Eur) 60 72 120 85 104 51 140 73
Rata locurilor vacante (%) 16 17 12 15 13 21 12 15
În urma prelucrării datelor, s-au obţinut următoarele rezultate:
a. Analizaţi relaţia dintre cele două variabile, utilizând graficul alăturat.
b. Alegeţi ecuaţia de regresie liniară cea mai adecvată şi interpretaţi valorile
estimatorilor b0 şi b1:
i) ŷi = 22,65 - 0,08 xi ; ii) ŷi = 20,47 + 6,24 xi
iii) ŷi = 224,36 - 8,33 xi ; iv) ŷi = - 24,36 + 0,16 xi
c. Măsuraţi intensitatea legăturii liniare dintre variabile, utilizând coeficientul de
corelatie liniara Pearson si testati semnificatia acestuia pentru un nivel de
semnificaţie de 5%, cunoscând următoarele rezultate sintetice:
 x  
10 10

 x  x   6626,87 ;   y i  y   62,88 ;  x yi  y  -566,13


2 2
i i
i 1 i 1

11. Pentru 7 regiuni turistice din zona montană, s-au înregistrat numărul de pârtii de schi omologate şi încasările din turism (mil. Euro). În urma
prelucrării datelor cu ajutorul programului Excel si in ipoteza unei legaturi liniare, s-au obţinut următoarele rezultate:
Număr de pârtii de schi omologate 6 7 9 10 8 6 5
Încasări din turism (mil. Euro) 12 17 18 18 21 14 11

3
a. Ştiind că:
Număr de pârtii de
schi omologate Încasări din turism
Mean 7,29 15,86
𝑦̂𝑖 = 𝑏0 + 1,61 ∙ 𝑥𝑖 Variance 3,24 13,14
a. Identificaţi variabilele şi caracterizaţi, pe baza graficului alăturat,
legătura dintre acestea.
b. Identificaţi valorile estimatorilor b0 şi b1 şi interpretaţi valorile
acestora.
c. Analizaţi sensul şi intensitatea legăturii dintre variabile, utilizând
coeficientul de corelaţie liniară Pearson si testati semnificatia
acestuia.

S-ar putea să vă placă și