Sunteți pe pagina 1din 5

TEMĂ – MODELUL DE REGRESIE LINIARĂ UNI SI MULTIFACTORIALĂ

1. O firmă ce organizează licitaţii pentru vânzarea unor antichităţi doreşte să determine relaţia dintre preţul (mii
euro) obţinut pentru articolele licitate şi vechimea (ani) a obiectelor. În urma prelucrării cu EXCEL a datelor culese
de la un eşantion aleatoriu de 10 licitaţii, s-au obţinut rezultatele:

Regression Statistics Vechime


Multiple R ....
R Square ….. Mean 100
Adjusted R Square .... Standard Deviation 24.83277
Standard Error 142,1289 Sample Variance 616.6667
Observations ....
ANOVA
df SS MS F
Regression …… ……… ………… ……….
Residual …….. ……… …………
Total ……… 972850

Standard
Coefficients Error t Stat
Intercept 665,991 ……… 3,397844
Vechime 12,09009 1,907813 ………...
In ipoteza unui model de regresie liniar, se cere:
a) să se testeze semnificaţia modelului, pentru un nivel de semnificaţie de 5% (Fcritic=5,32);
b) să se determine intervalele de încredere pentru parametrii modelului şi să se comenteze rezultatele obţinute
(tcritic= 2,896).
c) Sa se completeze tabelul Regression Statistics si sa se interpreteze valorile indicatorilor.
d) Sa se estimeze punctual si pe interval de incredere pretul mediu obtinut pentru articolele cu o vechime de 94
de ani.
e) Analizaţi direcţia şi intensitatea legăturii dintre cele două variabile, utilizând coeficientul de corelaţie liniară
Pearson, scrieţi matricea de corelaţie şi testaţi semnificaţia statistică a indicatorului utilizat.
2. Pentru a analiza dacă între valoarea vânzărilor lunare şi vârsta agenţilor de vânzări, ai unei mari companii ce
comercializează produse cosmetice, există o legătură, un analist selectează aleator un esantion de 15 persoane. În
urma prelucrării în EXCEL a datelor culese pentru cele două variabile, s-au obţinut rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R ….
R Square ….
Adjusted R Square -0.066048309
Standard Error ….
Observations ...

ANOVA
df SS MS F
Regression ... ……. 3.712025 …………
Residual ... ………… ………...
Total ... 367.6

Standard
Coefficients Error t Stat Lower 95% Upper 95%
Intercept 11.67340114 ………….. ………. -0.130924113 23.47773
Varsta 0.062282291 …………… ………. -0.307204742 0.431769

1
a) Să se testeze validitatea modelului de regresie liniară pe baza căruia s-au obţinut prelucrările din tabelele de
mai sus (valoare critica: 4,67).
b) Să se testeze semnificaţtia parametrilor modelului pentru o probabilitate de 95% (tcritic= 2,624)
c) Sa se masoare intensitatea legaturii folosind un indicator adecvat si sa se testeze semnificatia acestuia.

3. O agenţie imobiliară doreşte să previzioneze preţul de vânzare al unor case (unitati monetare), pe baza unui model
de regresie liniar unifactorial, în funcţie de suprafaţa locuibilă a acestora (metri patrati). Rezultatele obţinute în urma
prelucrării în EXCEL a datelor înregistrate pentru un eşantion de 15 locuinţe sunt:
SUMMARY OUTPUT

Regression Statistics Suprafata (mp)


Multiple R ....
R Square ..... Mean 58
Adjusted R Square 0.802305 Sămple Variance 160.4286
Standard Error ...
Observations ...

ANOVA
df SS MS F
Regression ………. ………….. ........ ………..
Residual ………. ................... ……………
Total ............. 2894.933333

Coefficients Standard Error t Stat


Intercept 21.23556 ……………….
Suprafata 1.025824 ………………
a) Să se valideze modelul de regresie pentru un nivel de semnificaţie de 5% (Fcritic=4,67);
b) Să se testeze semnificaţia parametrilor şi să se interpreteze valorile acestora (tcritic= 2,65).
c) Sa se masoare intensitatea legaturii folosind un indicator adecvat si sa se testeze semnificatia acestuia.
d) Sa se estimeze punctual si pe interval de incredere pretul mediu al caselor cu o suprafata locuibila de 80 mp.

4. Pentru a analiza dependenţa dintre suprafaţa cultivată (ha) şi producţia la hectar (q/ha) s-au înregistrat date
referitoare la aceste variabile pentru 10 parcele. În urma prelucrării datelor (utilizând EXCEL) - în ipoteza legăturii
liniare care modelează dependenţa dintre cele 2 variabile - se obţine :
Supr. cultivata. (ha) X Productia la hectar (q/ha) Y
Mean 82.4 Mean 24.6
Sample Variance 127.6 Sample Variance 56.26666667
Count 10 Count 10
Stiind ca la o crestere cu 1 ha a suprafetei cultivate, productia agricola creste cu 0,576 q/ha, iar varianţa erorilor
(SSE) este 125,24 - se cere:
a) Validaţi modelul de regresie obţinut, pentru un alfa de 5% (valoare critica: 5,32).
b) Determinaţi si interpretati intervalele de încredere pentru parametrii modelului de regresie (valoare critica:
2,896).
c) Analizati intensitatea legăturii dintre cele două variabile cu ajutorul unui indicator adecvat şi testaţi
semnificaţia acestuia.
d) Estimati punctual si pe interval de incredere productia medie la hectar ce s-ar putea obtine de pe suprafetele
de 95ha.

5. Pentru un mare magazin alimentar s-au cules date privind vânzările (mii RON) şi profitul (mii RON)
realizate în 9 luni ale anului 2007. În urma studierii legăturii liniare dintre cele două variabile, s-au obţinut
următoarele rezultate:
2
ANOVA
df SS MS F Significance F
Regression 1 0,03045 ……….. ………… 0,0000779643
Residual ... …………. 0,000453
Total 8 ………….

Standard
Coefficients Error t Stat P-value Lower Upper
Intercept 0,078438 …………. ………… 0,001719 ......... ..........
Val. Vânz. 0,011712 0,001429 …………. 0,000078 ......... ..........
Ştiind că valoarea medie a vânzărilor este de 10 mii RON/luna, se cere:
a) Să se completeze informaţiile lipsă din tabelele de mai sus;
b) Să se testeze semnificaţia modelului liniar de regresie, pentru un nivel de semnificaţie de 5%
c) Să se testeze semnificaţia parametrilor modelului, pentru acelaşi nivel de semnificaţie.
d) Ce procent din variaţia profitului nu a fost determinat de variatia vanzarilor?
Valori critice : F_crit=5,59 ; t_crit= 2,365.

6. O echipa de analisti ai unei institutii de asigurari auto doreste sa analizeze legatura dintre: inteligenta
asiguratilor (masurata prin punctajul obtinut la un test de inteligenta), varsta (ani impliniti) si numarul de
accidente auto majore, in decursul ultimilor 10 ani. Pentru 50 de clienti care au incheiat contracte de
asigurare auto cu institutia respectiva, selectati aleator, s-au inregistrat valorile celor trei variabile si – in
urma aplicarii metodei regresiei liniare, s-au obtinut urmatoarele rezultate:
Model Summary
Model R R Square Adjusted R Std. Error of the
Square Estimate
1 0,583a …. ,312 1,26476
a. Predictors: (Constant), Varsta, Punctaj_inteligenta

Coefficientsa
Model Unstandardized Standardized t Sig. 99,0% Confidence
Coefficients Coefficients Interval for B
B Std. Error Beta Lower Upper
Bound Bound
(Constant) 7,971 1,680 4,746 0,000 3,463 12,480
1 Punctaj_inteligenta -0,068 …. -0,581 …. 0,000 -0,105 ….
Varsta ….. 0,042 -0,106 -0,896 0,375 …. 0,075
a. Dependent Variable: Nr_accidente

a. Identificaţi modelul de regresie liniară în eşantion, ce redă dependenta numarului de accidente auto
de varsta soferilor si de nivelul lor de inteligenta; interpretaţi valorile coeficienţilor de regresie
partiala.
b. Testaţi validitatea modelului găsit, pentru un nivel de semnificaţie de 1%. (Fcritic=5,08).
c. Testaţi semnificaţia statistică a ultimilor doi parametri ai modelului (tcritic=2,685).
d. Determinaţi şi interpretaţi intervalele de încredere ale ultimilor doi parametri ai modelului.
e. Analizaţi sensul şi intensitatea legăturii dintre variabile folosind un indicator adecvat; testaţi
semnificaţia acestuia.
f. Ce procent din variatia numarului de accidente auto nu este explicat de modelul de regresie
identificat?
g. Previzionaţi numarul de accidente auto al unui client cu varsta de 25 de ani si cu un punctaj de 60 de
puncte obtinut la testul de inteligenta.

3
7. Managerul unui lant de magazine de produse electronice doreste sa analizeze valoarea vanzarilor
realizate de Black Friday la telefoanele mobile, in functie de numarul liniilor telefonice deschise in
perioada respectiva pentru efectuarea comenzilor si de numarul unitatilor de service pentru clienti. Pentru
30 de magazine selectate aleator, s-au inregistrat valorile celor trei variabile. In urma aplicarii metodei
regresiei liniare, s-au obtinut urmatoarele rezultate:

Model Summary
Model R R Square Adjusted R Std. Error of the
Square Estimate
1 … … 0,097 8,19506
a. Predictors: (Constant), Unit_service, Nr_linii_telef

ANOVAa
Model Sum of Squares df Mean Square F Sig.
Regression … … … 2,557 0,096b
1 Residual … … …
Total … …
a. Dependent Variable: Vanzari
b. Predictors: (Constant), Unit_service, Nr_linii_telef
Coefficientsa
Model Unstandardized Standardized t Sig. 90,0% Confidence Interval for B
Coefficients Coefficients
B Std. Error Beta Lower Bound Upper Bound
(Constant) … 12,351 0,680 0,502 -12,635 29,439
1 Nr_linii_telef … 0,271 0,130 … 0,478 … 0,656
Unit_service … 0,344 0,405 2,245 0,033 0,186 …
a. Dependent Variable: Vanzari

a. Identificaţi modelul de regresie liniară în eşantion, ce redă legătura dintre cele trei variabile;
interpretaţi valorile coeficienţilor.
b. Testaţi validitatea modelului găsit şi completaţi tabelul ANOVA, pentru un nivel de semnificaţie de
10%. (Fcritic=2,51).
c. Testaţi semnificaţia statistică a parametrilor „panta” ai modelului (tcritic=1,703), pentru o
probabilitate de 90%.
d. Determinaţi şi interpretaţi intervalele de încredere ale parametrilor „panta” ai modelului.
e. Analizaţi sensul şi intensitatea legăturii dintre variabile folosind un indicator adecvat; testaţi
semnificaţia acestuia.
f. In ce masura explica modelul de regresie variatia vanzarilor?
g. Previzionaţi valoarea vanzarilor de telefoane mobile daca au fost deschise 40 de linii telefonice
pentru efectuarea comenzilor si exista 30 de unitati de service.

8. O echipa de cercetatori din cadrul Ministerului Muncii realizeaza un studiu asupra efectelor pe care le are
un program de perfectionare profesionala asupra tinerilor salariati. Pentru aceasta sunt inregistrate
variabilele: varsta salariatului (ani), marimea gospodariei din care face parte salariatul (persoane) si venitul
salarial suplimentar obtinut in urma absolvirii programului de perfectionare (unitati monetare). Datele
inregistrate pentru 35 de salariati selectati aleator au fost prelucrate prin aplicarea metodei regresiei liniare,
obtinandu-se urmatoarele rezultate:

4
Regression Statistics ANOVA
Multiple R 0,54 df SS MS F Significance F
R Square ... Regression ... ... ... ... 0,004
Adjusted R Square ... Residual ... ... ...
Standard Error ... Total ... 484,17
Observations ...

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept .... 13,39 ... 0,06 -53,46 1,08
Varsta (ani) 1,25 ... 2,85 0,01 ... 2,14
Marimea gospodariei
(persoane) ... 0,48 ... 0,03 .... ....

a. Stiind ca:
Venituri suplimentare (u.m.) Varsta (ani) Marimea gospodariei (pers.)
Mean 8,45 30,34 3

identificaţi modelul de regresie liniară în eşantion, ce redă comportamentul venitului salarial suplimentar in
functie de varsta salariatului si de marimea gospodariei; interpretaţi valorile coeficienţilor de regresie
partiala.
b. Testaţi validitatea modelului pentru o probabilitate de 95%. (Fcritic=3,295).
c. Testaţi semnificaţia statistică a celor trei parametri ai modelului (tcritic=2,037), pentru un nivel de
semnificatie de 5%.
d. Determinaţi şi interpretaţi intervalele de încredere pentru ultimii doi parametri ai modelului.
e. Analizaţi sensul şi intensitatea legăturii dintre variabile folosind un indicator adecvat; testaţi
semnificaţia acestuia.
f. In ce masura variatia surplusului salarial nu este explicata de modelul de regresie identificat?
g. Previzionaţi venitul salarial suplimentar pe care l-ar putea obtine un salariat in varsta de 35 de ani,
ce provine dintr-o gospodarie cu 4 persoane.

S-ar putea să vă placă și