Sunteți pe pagina 1din 15

3.

Despre o anumită companie se cunosc următoarele informații, referitoare la volumul vânzărilor


(în milioane de pesete) și la cheltuielile cu publicitate (în mii de pesete) din ultimii 6 ani:

Volumul vânzărilor (mil. ptas) Cheltuieli de publicitate (mii ptas.)

10 16

15 32

20 48

22 56

30 64

32 80

a) Există o relație liniară între vânzările companiei și cheltuielile sale de publicitate? Raționează-ți
răspunsul.
b) Obține cele mai mici pătrate drepte de regresie.
c) Ce volum de vânzări al companiei ar putea fi de așteptat într-un an care cheltuiește 60.000 de
pesete pe publicitate? Și pentru o cheltuială de publicitate de 200.000 de pesete?
d) Daca singurul lucru care ne-a interesat ar fi evolutia volumului vanzarilor din punct de vedere al
cheltuielilor de publicitate, fara a tine cont de cuantumul specific al fiecaruia dintre acestea, ar exista
o corelatie ordinala intre ambele variabile?

SOLUŢIE:

a) Mai întâi desenăm graficul de dispersie:

Cheltuieli de publicitate
(mii de ptas.)
Observând-o putem spune că există o relație liniară între ambele variabile.

Acum calculăm coeficientul de determinare liniară pentru a obține o măsură descriptivă a gradului de
asociere liniară care există între variabile. Expresia coeficientului de determinare este:
s2 s2xs7
-* -

unde S xy reprezintă covarianța variabilelor X și Y. a cărui expresie simplificată este:

2XY --
Sxy = nXX }

Pentru a clarifica modul de calcul construim urmatorul tabel: (variabila X= Cheltuieli de


publicitate si variabila Y= Volumul vanzarilor)

ȘI X și 2 X2 XY

10 16 100 256 160

15 32 225 1024 480

20 48 400 2304 960

22 56 484 3136 1232

30 64 900 4096 1920

32 80 1024 6400 2560

129 296 3133 17216 7312

X = 49.333; Y=21,5; s x = 20,870; sxy =158

Înlocuind, obținem că r 2 valorează 0,956, ceea ce ar putea fi de așteptat după observarea diagramei de
dispersie.

b) Dacă exprimăm dreptele de regresie ca y * = a+bx și x * =c+dy, coeficienții celor calculati sunt ca:
5
, -xy - b = —2 a = y - b y, x
-la
5-'
da d=- c =x - dxy
si '

Aplicându-le acestei probleme obținem liniile de regresie:

Y * =3,604+0,363x; X * = -7,356+2,637y

c) Pentru a face predicția volumului vânzărilor, folosim linia de regresie care arată vânzările în funcție de
cheltuielile de publicitate. Pentru o cheltuiala de publicitate de 60.000 de pesete vom obtine un volum de
vanzari de x * =3,604+0,363*60=25,384 milioane de pesete.

Dacă cheltuiala este de 200 de milioane de pesete, nu putem folosi linia de regresie deoarece valoarea 200
este în afara intervalului de cheltuieli publicitare. Dacă înlocuim, ne dă o valoare de 76204 milioane de
pesete, deoarece liniile drepte sunt valabile doar în intervalul sau pentru valori apropiate de extremele
intervalului.

d) Pentru a rezolva această secțiune calculăm coeficientul de corelație ordinal al lui Spearman.
Coeficientul lui Spearman constă în calcularea coeficientului de corelație liniară a datelor
transformate prin funcția interval.

ȘI 10 15 20 22 30 32

X 16 32 48 56 64 80

Rangul Y 1 2 3 4 5 6

Rangul X 1 2 3 4 5 6

di 0 0 0 0 0 0 0

Di 2
0 0 0 0 0 0 0

Coeficientul lui Spearman atunci când nu există legături de rang, ca în aceste date, are următoarea expresie:

n3-n

În acest caz r s este 1, prin urmare există o corelație ordinală pozitivă și perfectă, adică cu cât cheltuielile
pentru publicitate sunt mai mari, cu atât volumul vânzărilor este mai mare.

(Putem vedea că corelația liniară nu este perfectă și totuși corelația obișnuită este).
4. O bancă de stat dintr-o anumită țară studiază posibilitatea scăderii dobânzilor pentru a încuraja
investițiile private și, astfel, a deschide posibilitatea creării de locuri de muncă. Pentru a face acest
lucru, compară ratele reale ale dobânzilor din diferite țări cu
investiții private în acestea, toate în ultima perioadă. Obținerea rezultatelor care sunt reflectate în
următorul tabel:

Ratele dobânzilor (în atât de multe pentru unul)


0.05-0.10 0.10-0.15 0.15-0.20 0.20-0.25
INVESTIȚII (mii de mii

10-50 2 6

50-100 1 5

100-150 1 4

150-200 5 1

a) Există o relație liniară între ambele variabile? Raționează-ți răspunsul.


b) Construiți linia de regresie care explică investiția în fluența ratei dobânzii reale.
c) Cum s-ar schimba investiția dacă ar exista o creștere cu o unitate a ratelor reale ale dobânzii?
Raționați-l fără a fi nevoie să faceți niciun calcul.
d) Dacă rata reală a dobânzii scade de la 0,18 la 0,09, cum s-ar schimba investiția?

SOLUŢIE:

Pentru a facilita urmarirea calculelor necesare rezolvarii problemei, construim urmatorul tabel rezumativ:
(variabila X=rata reala a dobanzii; variabila Y=investitie).

YX 0.075 0.125 0.175 0.225 Marg.Y fixi f i și i

30 0 0 2 6 8 240 7200

75 0 1 5 0 6 450 33750

125 1 4 0 0 5 625 78120

175 5 1 0 0 6 1050 183750

6 6 7 6 25 2365 302850
Marg. X

fixi 0.45 0.75 1.225 1.35 3.775

fixi2 0.03375 0.09375 0.21438 0.30375 0.64563

f ij y i xj 0 0 10.5 40.5 285.375

0 9.375 65.625 0
9.375 62.5 0 0

65.625 21.875 0 0

X(medie)=0,151; Y(medie)=94,6; s x = 0,055; sy= 56.248; sxy = -2,870

1. Pentru a studia relația liniară dintre rata dobânzii și variabilele de investiție, vom folosi
coeficientul de determinare ca măsură descriptivă a acestui fapt.
2. y * =237,863-948,760x
3. Creșterea într-o unitate a variabilei independente coincide cu valoarea pantei dreptei; în acest caz
creșterea va fi -948,760 (observăm că în această problemă creșterea este fictivă deoarece 1 este în
afara intervalului variabilei independente).
4. Cresterea va fi produsul dintre panta si diferenta dintre rata dobanzii in cele doua state, adica
creste cu -948.760*(0.09-0.18)=85.388 mii milioane.

5. O casă de discuri a strâns următoarele informații despre 15 grupuri muzicale, respectiv numărul
de concerte susținute în această vară și vânzările de discuri ale acestor grupuri (în mii de LP-uri),
obținând următoarele date:

CONCERTE

LP-uri 10-30 30-50 50-70

1-6 3 2 1

6-11 1 4 1

11-16 2 1 5

a) Calculați numărul mediu de LP vândute de aceste grupuri.


b) Obţineţi dreapta de regresie care explică dependenţa liniară
c) Dacă un grup muzical a vândut 1800 de LP-uri, ce număr de concerte este așteptat în această
vară?

SOLUŢIE: a) 9000 LP-uri

c) y*=28,22+1,42x

d) y*=28,22+1,42*1,8=30776 Concerte.
6. Pentru a analiza dacă există o relație liniară între consumul de energie electrică (kw.oră),
variabila X, și volumul producției în milioane de pesete, variabila Y, s-au obținut următoarele
informații de la o firmă:

x = 0,151; y = 94,6; 5, = 0,055; S. = 56.248; s, = -2,870 - - - •

Se solicita:

1. Potriviți linia de regresie liniară care explică consumul de energie electrică în fi al volumului
producției. Raționați valabilitatea liniei de montare

SOLUŢIE:

a) y*=-10,746+2,202x

b) r=0,959

7. O companie de producție își bazează previziunile anuale de vânzări pe rezultatele oficiale ale
cererii totale din industrie. Datele pentru cererea totală și vânzările realizate de companie în ultimii
11 ani sunt prezentate mai jos.

cerere totală (mii vânzări (mii de


de mt) mt)
20 9
0
22 6
0
40 12
0
33 7
0
21 5
0
39 10
0
28 8
0
14 4
0
28 7
0
29 10
0
38 14
0
1. Desenați diagramele de dispersie ale datelor.
2. Desenați linia care se potrivește cel mai bine cu datele.

3. Prin intermediul unei ajustări cele mai mici pătrate, găsiți linia care se potrivește cel mai
bine vânzărilor companiei pe baza cererii totale. Dacă cererea industrială totală este de
300.000 de tone, ce volum de vânzări ar fi prezis folosind linia de regresie calculată? Ce se
întâmplă dacă am folosi linia găsită în partea b)?
4. Validează ajustarea liniară efectuată în secțiunea anterioară.
Folosind metoda robustă de potrivire a unei linii bazată pe mediană, pentru a obține o linie
de potrivire în termenii secțiunii c). Faceți predicția din partea c. folosind această linie
SOLUŢIE:

1. X=Cererea totală, Y=Vânzări

Diagrama de dispersie
Dem. T./Vânzări

2. y*=0,422+0,028x; y*=0,422+0,028*300=8,822 Mii de tone.


3. r=0,801; r2 = 0,642.
4. Pentru a calcula linia robustă de potrivire pe baza mediei, procedați după cum urmează:
1. Eșantionul ordonat după variabila X este împărțit în trei părți aproximativ egale, în acest
caz am luat 4, 3 și 4.
2. Mediana este calculată pentru variabilele X și Y din primul și al treilea subset de date.

Primul submult: x 1 =Me(X)=205; y1 =Me(Y)=5,5

Al treilea subset: x 2 =Me(X)=385; y2 =Me(Y)=11

3. Unind punctele obținem linia robustă de potrivire. Expresiile pentru panta(b r) și pentru
termenul independent(a r) sunt:

- 21
x2 - x1
^2y-. -
Q
x2 - x1
p
Înlocuind se obține y R =-0,764+0,031*300=8,536 mii tone.(NOTĂ: ambele linii sunt
trasate pe diagrama de dispersie. Semnul . al graficului corespunde punctelor ( x 1, y 1 ) și
(x 2 , y 2 ) iar semnul (pătratul) datelor problemei).

8. Se studiază relația dintre numărul de ani în care o persoană este afiliată la sindicat și nivelul de
satisfacție față de performanța sindicatului menționat. Pentru aceasta, începem cu datele a 7
persoane prelevate aleatoriu de la persoane afiliate partidelor politice, obținând:

Ani 8 7 10 3 6 13 4

Satisfacţie 7 5 8 5 9 9 3

1. Calculați coeficientul de corelație liniară. Comentează rezultatul obținut.


2. Preziceți rata de satisfacție a unei persoane care este membru de sindicat timp de 11 ani.
Știind că indicele de satisfacție este 6, preziceți anii în care a stat în sindicat

SOLUŢIE:

1. r=0,711
2. y*=3,118+0,474x ; y*=3,118+0,474*11=8,332 pe scala satisfacției.
3. x*=0,270+1,068*y; x*=0,270+1,068*6= 6,678 ani.

9. Într-o regiune viticolă s-a observat de câțiva ani evoluția prețului (în pesete/litru) și a cantității de
producție (în tone). Uită-te la masă:

Productie 25-35 35-45 45-55 55-65


100 2 5
110 1
120 3 1
140 4 2
160 2 3 1
200 5 2 1

1. Calculați linia de regresie liniară care pune prețul în funcție de producție.


2. Analizați în mod rezonabil validitatea dreptei obținute anterior .

Intre ce valori va fi pretul cand productia este intre 115 si 135 de tone? Raționează-ți răspunsul.
SOLUŢIE:

1. y*=68,291-0,167x
2. r=0,556; r2 = 0,309
3. y*=68,291-0,167*115= 49,086 și ey*=68,291-0,167*135=45,746; pretul va fi intre
45.746 și 68.291 de pesete

10. Având în vedere următoarele seturi de date:


SAU 1 2 3 4 5 6 7 8 9 10
V 3 5 6 5 7 9 10 9 10 10
W 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 14.117
X 6.646 6.646 6 6 6 7 7 5.684 8.838 14.186

1. Desenați diagrama de dispersie a fiecăruia dintre seturile de date.


2. Calculați linia de regresie pentru fiecare dintre seturile de date și desenați-o pe graficul de
dispersie, considerând variabilele U,W,X ca variabile independente.
3. Calculați coeficientul de corelație liniară pentru fiecare dintre mulțimi.
4. Ce putem observa?
5. Eliminarea valorii aberante recalculează secțiunile b și c.
6. Ce alte linii ar părea mai potrivite în seturile anterioare? Raționează-ți răspunsul.
7. Calculați linia de potrivire robustă

Ce concluzii putem trage din această problemă?

SOLUŢIE:

la)
2. v*=3,067+0,788u; x*=3,067+0,788w
3. r uv =0,877; r w x =0,877
4. Putem vedea că ambele linii sunt exact aceleași și că relația liniară în ambele este aceeași, dar se
poate vedea în variabilele U/V că linia este mai reprezentativă decât în celălalt caz. Observăm că
prezența valorii aberante poate modifica rezultatul așteptat.
5. Nu se observă valori aberante în diagrama de dispersie U/V. În diagrama W/X se notează prezența
unui outlier, care este punctul (14.117,14.186) dacă îl eliminăm obținem x*=6.646 și asocierea
liniară dintre ele este nulă,
6. Această secțiune va fi efectuată pentru variabilele a U/V v R =3,571+0,714u.
7. Concluzia principală este că ar trebui să desenați întotdeauna diagrama de dispersie a datelor.

11. Un manager de resurse umane vrea să determine salariul pe care trebuie să-l plătească o anumită
categorie de muncitori. Să se determine salariul care trebuie plătit unei anumite categorii de
lucrători. Pentru determinarea salariului respectiv se efectuează un studiu în care intervin
variabilele Salariul lunar (în mii de ptas), Nivelul anual de producție în companie (în milioane de
ptas) și Nivelul mediu de specializare al muncitorului (de la 0 la 10). . Managerul obține această serie
de rezultate:
Sare. 123.4 135.7 115.9 100.6 98.7 150.4 124.6 110.0 138.6 123.4

Prod. 300.5 325.9 298.6 200.9 300.4 359.8 279.6 215.6 250.0 300.0

Esp. 4.3 5.5 7.8 4.9 4.3 8.5 6.4 5.6 5.3 5.0

Se solicita:

1. Calculați planul de regresie liniară cel mai mic pătrat care explică salariile în funcție
de producție și de nivelul de specializare.
2. Studiați validitatea funcției obținute în secțiunea anterioară prin intermediul unei
măsuri descriptive. Cât este varianța reziduală?
3. Calculează coeficientul de corelație parțială pentru două variabile explicative.
4. Comentează rezultatele.

Ce salariu ar trebui plătit dacă nivelul producției ar fi de 315 milioane de pesete. iar nivelul mediu de
specializare de 6,6?

SOLUŢIE:

1) Variabila Y=Salariu X i =Producție X 2= Nivel de specializare.

Tabelul de calcul este:

ȘI X1 X2 și 2
X1 2
X2 2
YX 1 YX 2 X1 X2

123.4 300.5 4.3 15227.6 90300.1 18.5 37081.7 530.6 1292.2

135.7 325.9 5.5 18414.5 106210.8 30.3 44224.6 746.5 1792.5

115.9 298.6 7.8 13432.8 89162.0 60.8 34607.7 904.0 2329.1

100.6 200.9 4.9 10120.4 40360.8 24.0 20210.5 492.9 984.4

98.7 300.4 4.3 9741.7 90240.2 18.5 29649.5 424.5 1291.7

150.4 359.8 8.5 22620.2 129456.0 72.3 54114.0 1278.4 3058.3

124.6 279.6 6.4 15525.2 78176.2 41.0 34838.32 797.4 1789.4

110.0 215.6 5.6 12100.0 46483.4 31.4 23716.0 616.0 1207.4

138.6 250.0 5.3 19210.0 62500.0 28.1 34650.0 734.6 1325.0


123.4 300.0 5.0 15227.6 90000.0 25.0 37020.0 617.0 1500.0

1221.3 2831.3 57.6 151619.8 822889.6 349.7 350112.2 7141.8 16570.0

Linia de construit va avea forma y*= a+b 1 x 1 +b 2 x 2 iar pentru a calcula coeficienții dreptei
apare un sistem de ecuații astfel:

Cu aceste date, sistemul de ecuații de rezolvat este:

1221,3 = 10a +2831,3b 1 +57,6b 2

350112.2 =2831.3a +822889.6b 1 +16570.0b 2

7141,8 =57,6a +16570,0b 1 +349,7b 2

Care are pentru soluție a=56198 b 1 =0,158 b 2= 3,664 . Prin urmare, planul de regresie este:
y*=56,198+0,158x 1 +3,664x 2

y” = 56,198 - 0,158x1 + 3,664x2

2) Măsurile descriptive pe care urmează să le folosim sunt coeficientul de determinare și coeficientul de


corelație. Și definit ar fi așa:
nnn
>( - Media ^ z = ), SAU; -Mediay)2 + >6 - 02 i=1 i=1 i=1

Coeficientul de determinare multiplă se exprimă astfel:

pa _SCR__SCE__s2
SCT 5CT 57
unde s 2 este variabila reziduală.

O expresie a varianței reziduale care simplifică calculul este:

3 ^”=1^ - OS”=1 Ji - ¿1 )
8n

În acest caz R2 =0,438 R=0,661 s2 =138,506

3 Coeficientul de corelație parțială dintre variabila dependentă și o variabilă explicativă măsoară puterea
relației liniare dintre cele două atunci când eliminăm efectul liniar al celorlalte variabile explicative.
Rezultatul tau este:

, SCE^x^) — SCE^x^x^)
Tr
^j F SCE(x¿

Unde SCE(x i ) este variația neexplicată. Observând această expresie vedem că coeficientul de determinare
parțială ne oferă creșterea relativă a variabilei aplicate. Coeficientul de corelație parțială se obține din
rădăcina pătrată a coeficientului de determinare. În acest caz SCE(x 1 )=1582,51 SCE(x 2 )=1643,06 SCE(x
2 2
1 ,x 2 )=1385,06 r =0,157 r =0,124

y*=56,198+0,158*315+3,664*6,6=130,15

12. Managerul unei anumite firme dorește să cunoască, aproximativ, cererea anuală de produs care
va fi făcută companiei în anii următori. Pentru determinarea acestei cereri se efectuează un studiu în
care intervin variabilele Prețul mediu al produsului într-un an (în pesete), Rata anuală a inflației
(IPC) (în atâția pe unu) și Cererea anuală (în miliarde de pesete). . . Într-un eșantion de 20 de ani, el
obține următoarele rezultate: (Cerere=Y, Preț=
X1 , CPI= Xa )

16,945;>,x = 3230;),
X2 = 1,1;

>, YX, = 2609.452;}, YX ¿ = 0,83631;), X, X2 = 188,81

)y2= 15,5035;) x = 538638;>,x2 = 0,0738

Calculati:

a) Determinați din coeficientul de corelație liniară multiplă validitatea funcției


anterioare. Cât este varianța reziduală?
b) Determinați coeficientul de corelație parțială pentru fiecare dintre variabilele
explicative și calculați coeficientul de determinare pentru YX. și YX, .
c) Ce variație are loc în cerere dacă prețul crește cu 3 unități în timp ce IPC rămâne fix
și dacă IPC se reduce cu 0,03 în timp ce prețul rămâne fix? Raționează-ți răspunsul.
d) Ce variație procentuală ar avea loc în cerere dacă prețul variază de la 156 la 159 de
pesete și IPC rămâne constant și egal cu 0,04?
e) Ce volum de cerere ați prezice pentru un an în care prețul este de 159 de pesete și
IPC anual estimat este de 3,5%?

SOLUŢIE:

a) s2 = 0,008523; R' = 0,851363 'E ' 2-1-= ■

b) SCE(
x, = 0,195185; SCE(
x2) =0,458711; SCE( x,,x, )=0,17046;
rq2 = 0,6283934 ;
r2 = 0,1266746; r2g = 0,829803; r2., = 0,600013.

c) Variația cererii va fi de trei ori panta corespunzătoare variabilei Preț, în acest caz s-ar produce o
reducere a cererii de 0,0184 miliarde de pesete. Variația cererii va fi o creștere a cererii de 0,061 miliarde
de pesete.

d) Modificarea procentuală este coeficientul dintre modificarea totală și situația inițială ori 100. În această
problemă va fi:

(-0,0184/0,9115956)x100=-2,018%

e) y*=1,95191-0,00614697 159-2,03495 0,035=0,903 miliarde de pesete.

S-ar putea să vă placă și