Sunteți pe pagina 1din 20

Statisticǎ - exerciţii

Ştefan Balint, Tǎnasie Loredana

1 Noţiuni de bazǎ

Exerciţiu 1.1. Presupuneţi cǎ lucraţi pentru o firmǎ de sondare a opiniei publice şi doriţi
sǎ estimaţi proporţia cetǎţenilor care, ı̂n eventualitatea organizǎrii de alegeri astǎzi, ar
vota cu partidul de guvernǎmânt. definiţi populaţia statisticǎ pe care o eşantionaţi. Dar
dacǎ v-ar interesa sǎ estimaţi proporţia cetǎţenilor care, la viitoarele alegeri ar vota cu
partidul de guvernǎmânt, care ar fi populaţia statisticǎ?

Exerciţiu 1.2. O companie de asigurǎri doreşte sǎ determine proporţia medicilor care
au fost implicaţi ı̂n ultimul an ı̂n una sau mai multe acţiuni judiciare de rele practici.
Compania selecteazǎ ı̂ntâmplǎtor ı̂n ultimul an una sau mai multe acţiuni judiciare de
rele practici. Compania selecteazǎ ı̂ntâmplǎtor 500 de medici care au practicat ı̂n ultimul
an şi determinǎ proporţia. Identificaţi populaţia de interes.

Exerciţiu 1.3. Un cercetǎtor este interesat sǎ compare salariul de ı̂ncadrare pentru
bǎrbaţii şi femeile care au un loc de muncǎ imediat dupǎ absolvirea facultǎţii. Sunt
cercetaţi 100 de bǎrbaţi şi 100 de femei.

Exerciţiu 1.4. Identificaţi trei tipuri diferite de variabile statistice ce pot fi colectate
pentru a reflecta popularitatea a cinci publicaţii periodice similare.

Exerciţiu 1.5. Pentru urmǎtoarele cazuri, precizaţi populaţia statisticǎ şi identificaţi
variabila studiatǎ:

a) timpiii de execuţie, ı̂n secunde a 400 de programe ı̂n Java;

b) absenteismul (ı̂n zile al angajaţilor);

b) profesia a 200 de salariaţi;

d) numǎrul copiilor a 2000 de familii;

Exerciţiu 1.6. Clasificaţi urmǎtoarele grupuri ca populaţie sau eşantion:

- toate persoanele de peste 18 ani din România;

- un grup de persoane din judeţul Alba;

- toate persoanele din judeţul Cǎlǎraşi;

1
- 2 kg de mere;

- toate merele din recolta acestui an;

- câteva primǎrii din judeţul Timiş;

- 500 de gospodǎrii din România;

- o gǎleatǎ de apǎ dintr-o fântn̂ǎ.

Pentru fiecare populaţie definitǎ anterior daţi un exemplu de eşantion.

Exerciţiu 1.7. Clasificaţi urmǎtoarele variabile ı̂n variabile calitative şi cantitative:

- Numǎrul de persoane dintr-o gospodǎrie;

- Statutul marital al unei persoane;

- Numǎrul de studenţi dintr-o grupǎ care vin la seminar;

- Culoarea maşinilor;

- Lungimea sǎriturii unei broaşte;

- Culoarea ochilor;

- Chiria plǎtitǎ de chiriaşi;

- Suprafaţa locuibilǎ ı̂ntr-un apartament;

- Veniturile pensionarilor din Bucureşti;

- Coeficienţii de inteligenţǎ a copiilor din Şcoala Generala Nr. 30, Timişoara;

- Durata unei greve;

- Orientarea politicǎ a persoanelor adulte.

2
2 Determinarea frecvenţei şi gruparea datelor.
Prezentarea datelor.
Parametrii şi statistici ai tendinţei centrale

Exerciţiu 2.1. O firmǎ este interesatǎ de timpul mediu al convorbirilor telefonice şi
de distribuţia acestor timpi faţǎ de timpul mediu (dispersia) pe durata a 40 convorbiri
telefonice consecutive. Timpii s-au rotunjit n minute s-a obţinut urmǎtorul set de date:
4, 6, 4, 4, 7, 2, 3, 1, 2, 1, 1, 4, 9, 8, 11, 12, 3, 2, 1, 1, 3, 9, 4, 5, 7, 7, 9, 10, 10, 1, 2, 2, 3,
11, 12, 10, 1, 1, 3, 4. Care este seria de distribuţie? Sǎ se realizeze diagrama cerc? Care
sunt parametrii tendinţei centrale?

Exerciţiu 2.2. Considerǎm urmǎtoarea serie de distribuţie cu date grupate:

x fx
3-5 2
6-8 10
9-11 12
12-14 9
15-17 7

a) Sǎ se realizeze histograma;

b) Calculaţi media, intervalul median şi intervalul modal.

Exerciţiu 2.3. Notele obţinute de 40 de studenţi sunt urmǎtoarele:

8; 10; 4; 9; 6; 8; 10; 7; 8; 3;
9; 6; 5; 4; 8; 7; 10; 9; 6; 5;
4; 3; 6; 9; 10; 8; 7; 7; 7; 6;
5; 5; 6; 7; 9; 10; 7; 6; 3; 4;

1) Sǎ se prezinte datele sub forma unui tabel statistic;

2) Sǎ se reprezinte grafic datele;

3) Sǎ se grupeze datele pe 4 intervale;

4) Sǎ se calculeze frecvenţele cumulate crescǎtor;

5) Sǎ se reprezinte seria de date.

Exerciţiu 2.4. Se dau numǎrul de ani de pensie pentru 15 pensionari:

5 6 3 6 11 7 9 10 2 4 10 6 2 1 5

Sǎ se calculeze modul şi mediana pentru aceste date. Sǎ se com pare aceste valori şi sǎ
se precizeze care este cea mai potrivitǎ pentru a mǎsura tendinţa centralǎ a datelor.

3
Exerciţiu 2.5. Un analist financiar al unei firme este interesat ı̂n a determina salariul
mediu acordat angajaţilor a 4 filiale ale firmei. Pentru aceasta el culege datele privind
salariul mediu pe fiecare filialǎ şi fondurile de salarizare.

Filiala Salariul mediu ı̂n filialǎ Fondul de salarizare


(mii U.M.) (milioane U.M.)
1 540 45,90
2 620 33,48
3 480 16,80
4 700 19,60

Care este salariul mediu al unui salariat?

Exerciţiu 2.6. Au fost ı̂nregistrate numǎrul de ore petrecute de studenţi cu ı̂nvǎţatul:

Numǎr ore Numǎr studenţi


0-3 17
4-7 23
8-11 15
12-15 11
16-19 8
20-23 6

Sǎ se calculeze numǎrul mediu de ore petrecut de un student cu ı̂nvǎţatul.

Exerciţiu 2.7. Într-o şcoalǎ promovabilitatea elevilor a crescut astfel ı̂n perioada 1995-
2006: ı̂n perioada 1995-1998 a crescut de 1.05 ori, ı̂n perioada 1999-2002 a crescut de
1.078 ori, iar ı̂n perioada 2003-2006 a crescut de 1.098 ori. Care este valoarea medie a
creşterii promovabilitǎţii?

4
3 Parametrii si statistici ai dispersiei.
Parametrii si statistici factoriali ai variantei

Exerciţiu 3.1. Considerǎm urmǎtorul set de date: 5,-7,2,0,-9,16,10,7. sǎ se calculeze:

a) media aritmeticǎ şi pǎtraticǎ, mediana, modul;

b) deviaţia medie absolutǎ a setului de date;

c) Varianţa şi abaterea standard a setului de date; item[d)] Coeficientul de variaţie.


Exerciţiu 3.2. Considerǎm urmǎtoarea serie de distribuţie cu frecvenţe:

x f
0 1
1 3
2 8
3 5
4 3

a) Calculaţi 3 parametrii ai tendinţei centrale;

b) Determinaţi varianţa şi abaterea standard a setului de date; item[d)] Care este
coeficientul de variaţie?

Exerciţiu 3.3. Considerǎm urmǎtoarele valori:

19, 13, 20, 22, 19, 17


9, 10, 19, 13, 23, 15
22, 14, 18, 21, 20, 18
9, 15, 13, 10, 17, 19

Grupaţi datele, iar apoi calculaţi coeficientul de variaţie.


Exerciţiu 3.4. Au fost ı̂nregistrate numǎrul de ore petrecute de studenţi cu ı̂nvǎţatul:

Numǎr ore Numǎr studenţi


0-3 17
4-7 23
8-11 15
12-15 11
16-19 8
20-23 6

Sǎ se calculeze

a) media aritmeticǎ şi pǎtraticǎ, mediana, modul;

5
b) deviaţia medie absolutǎ a setului de date;

c) Varianţa şi abaterea standard a setului de date; item[d)] Coeficientul de variaţie.

Exerciţiu 3.5. Persoanele unei firme sunt ı̂mpǎrţite ı̂n trei grupe ı̂n funcţie de ı̂nǎlţime.
Se cunosc urmǎtoarele date

Grupa A Grupa B Grupa C


Înǎlţimea medie a grupei (cm) 175 171 180
Numǎrul de persoane 45 40 30

Care este varianţa mediilor de grupǎ faţǎ de media generalǎ?

Exerciţiu 3.6. Se dǎ o selectie de 150 de numere x1 ; x2 ; . . . ; x150 cu Aceste numere se


grupeazǎ ı̂n 8 intervale [80; 86]; [87; 93]; . . . ; de lungime 6 unitǎţi. Ele se repartizeazǎ ı̂n
aceste intervale dupǎ cum urmeazǎ: ı̂n primul interval avem 2 numere (n1 = 2), ı̂n al
doilea 23 de numere (n2 = 23), n3 = 22, n4 = 65, n5 = 20, n6 = 10, n7 = 0, n8 = 8. Sǎ se
calculeze varianţa fiecǎrei grupe, media varianţelor de grupǎ, varianţa mediilor de grupǎ
faţǎ de media generalǎ şi varianţǎ totalǎ.

6
4 Parametrii si statistici ai pozitiei

Exerciţiu 4.1. Se considerǎ urmǎtoarea serie statisticǎ ce prezintǎ nivelul de hemoglobinǎ


ı̂n sânge pentru 60 de persoane presupuse sǎnǎtoase. Valorile sunt date atât pentru bǎrbaţi
cât şi pentru femei (valorile pentru femei sunt marcate cu un asterisc ı̂n dreapta).

105* 110* 112* 112* 118* 119* 120* 120* 125* 126*
127* 128* 130* 132* 133* 134* 135* 138* 138* 138*
138* 141 142* 144 145* 146 148* 148* 148 149
150* 150 151* 151 153 153 153 154* 154* 154
155 156 156 158* 160 160 160 160 163 164 164
165 166 168 168 170 172 172 176 179 141

a) Scrieţi serile de distribuţie cu frecvenţe pentru femei şi pentru bǎrbaţi;


b) Determinaţi pentru fiacre dintre serii media aritmedticǎ şi varianţa;
c) Calculaţi quantilele.
d) Care este scorul standard?
Exerciţiu 4.2. Se considerǎ urmǎtoarea serie de distribuţie cu grupare:

Vechimea muncitoriloe Numǎr muncitori


4,5 3
10,5 4
16,5 6
22,5 5
28,5 2

Determinaţi quantilele şi scorul standard.


Exerciţiu 4.3. Determinaţi quantilele centilele C2 0 şi C5 0 pentryu urmǎtoarea serie de
distribuţie cu grupare.

10-15 15
16-20 30
22-27 40
28-33 50
34-39 20
40-45 5
Exerciţiu 4.4. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice
distincte: {0, 3, 6, 9}.

a) Câte eşantioane de 2 elemente se pot forma?


b) Care este seria de distribuţie a mediei acestor eşantioane?
c) Reprezentatţi grafic diagrama coloanǎ.

7
5 Teorema de limita centrala

Exerciţiu 5.1. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice
distincte: {4, 8, 12}.

a) Câte eşantioane de 2 elemente se pot forma?

b) Care este seria de distribuţie a mediei acestor eşantioane?

c) Reprezentatţi grafic diagrama coloanǎ.

d) Verificaţi validitatea Teoremei limitǎ centralǎ.

Exerciţiu 5.2. Înǎlţimea copiilor dintr-o grǎdiniţǎ considerǎm cǎ este o variabilǎ dis-
tribuitǎ aproximativ normal de medie: µ = 39 şi abatere standard 2.

a) Dacǎ se ia un copil la ı̂ntâmplare care este probabilitatea ca ı̂nǎlţimea lui sǎ fie ı̂ntre
38 şi 40 de inch?

b) Care este probabilitatea ca media ı̂nǎlţimii unei clase de 30 de copii sǎ fie ı̂ntre 30
şi 40 inch?

c) Dacǎ se ia un copil la ı̂ntm̂plare care este probabilitatea ca ı̂nǎlţimea copilului sǎ


fie mai mare decât 40?

d) Dar probabilitatea ca media ı̂nǎlţimilor copiilor dintr-o clasǎ de 30 de copii sǎ fie
mai mare decât 40?

Exerciţiu 5.3. Pentru o populaţie se cunoaşte media µ = 500 şi deviaţia standard σ = 30.
Se extrag aleator mai multe eşantioane de dimensiune 36.

a) Ce valoare are media tuturor eşantioanelor extrase?

b) Calculaţi deviaţia standard a tuturor eşantioanelor extrase.

c) Ce distribuţie urmeazǎ media acestor eşantioane?

Exerciţiu 5.4. Considerǎm 36 de date selectate dintr-o populaţie distribuitǎ normal de


medie 50 şi deviaţie standard 10.

a) Care este probabilitatea ca media datelor sǎ fie ı̂n intervalul 45 şi 55?

b) Care este probabilitatea ca media sǎ fie mai mare decât 48?

8
6 Verificarea ipotezelor statistice: varianta clasicǎ

Exerciţiu 6.1. O uzinǎ a cumpǎrat un lot de cabluri metalice destinate sǎ susţinǎ
ı̂ncǎrcǎturi grele. Fabricantul de cabluri a afirmat cǎ ı̂ncǎrcǎtura medie ce provoacǎ
ruperea acestor cabluri este de 8000 kg. Uzina a efectuat un test pe 6 cabluri şi a
constatat o ı̂ncǎrcǎturǎ medie de rupere egalǎ cu 7750 de kg şi o abatere standard de
145 kg. Uzina doreşte sǎ ştie dacǎ depune plângere contra fabricantului, poate câştiga
procesul cu o probabilitate de 99%?

Exerciţiu 6.2. Pentru a determina nivelul mediu de plumb din apa potabilǎ a unei zone
puternic industrializate se fac determinǎri ı̂n 144 de zile alese aleator.
În urma testelor s-a obţinut o medie de x = 36 de unitǎţi de plumb/100 ml apǎ, iar
abaterea medie pǎtraticǎ s = 15 unitǎţi plumb/100 ml apǎ.
Sǎ se determine un interval de ı̂ncredere de 95% pentru valoarea medie a nivelului de
plumb/100 ml apǎ.

Exerciţiu 6.3. O maşinǎ produce fiole de sticlǎ. Pentru 53 de fiole s-a observat o duratǎ
medie de viaţǎ de x = 830 de ore. Presupunem cǎ durata de viaţǎ a unei fiole urmeazǎ
o lege normalǎ, iar varianţa este σ = 415. Directorul firmei afirmǎ cǎ durata de viaţǎ a
fiolelor este x = 850 de ore. Are el dreptate la nivelul de semnificaţie α = 0, 05?

Exerciţiu 6.4. Nivelul de glicemie al unei populaţii adulte este presupusǎ distribuitǎ
dupǎ o lege normalǎ de dispersie σ = 0, 80 g/l de sânge.Se considerǎ un eşantion de
12 persoane ale acestei populaţii şi se mǎsoarǎ nivelul de glicemie la fiecare. Se gǎsesc
urmǎtoarele rezultate:

0, 6 0, 9 0, 74 0, 96 0, 85 1, 05 0, 8 0, 93 1, 17 0, 70 0, 84 0, 75

La un nivel de semnificaţie de α = 0, 05 nivelul mediu al glicemiei x este compatibil cu


nivelul mediu al glicemiei µ?

Exerciţiu 6.5. Se presupune cǎ ı̂ncǎrcǎtura suportatǎ de plǎcile de tablǎ este o variabilǎ
aleatoare de medie µ şi abatere medie pǎtraticǎ σ. În condiţiile date, s-au testat 50 de
plǎci de tablǎ, media şi abaterea observate sunt x = 320, iar abaterea medie pǎtraticǎ
este s = 35.
Câte plǎci de tablǎ trebuie testate pentru ca intervalul de ı̂ncredere al ı̂ncǎrcǎturii medii
sǎ fie determinat cu o amplitudine de 10 kg la nivelul de semnificaţie α = 0, 005?

Exerciţiu 6.6. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la

9
nivelul de semnificaţie α = 0, 05

a) H0 : µ = 100 n = 64, x = 105, σ 2 = 40


Ha : µ > 100

b) H0 : µ = 100 n = 60, x = 110, σ 2 = 20


Ha : µ > 100

c) H0 : µ = 90 n = 25, x = 84, σ 2 = 30
Ha : µ < 90

d) H0 : µ = 90 n = 36, x = 80, σ 2 = 40
Ha : µ < 90

e) H0 : µ = 100 n = 25, x = 95, σ 2 = 20


Ha : µ =
6 100

f ) H0 : µ = 100 n = 36, x = 105, σ 2 = 30


Ha : µ =
6 100

10
7 Verificarea ipotezelor statistice: varianta proba-
bilistǎ

Exerciţiu 7.1. Calculaţi p-valorile ı̂n urmǎtoarele cazuri:


a) H0 : µ = 10 z ∗ = 1, 48

Ha : µ > 10

b) H0 : µ = 105 z ∗ = −0, 85

Ha : µ < 105

c) H0 : µ = 13, 4 z ∗ = 1, 17

Ha : µ 6= 13, 4

d) H0 : µ = 8, 56 z ∗ = −2, 11

Ha : µ < 8, 56

e) H0 : µ = 110 z ∗ = −0, 93

Ha : µ 6= 110

f ) H0 : µ = 54, 2 z ∗ = 0, 46

Ha : µ > 54, 2
Exerciţiu 7.2. P-valoarea calculatǎ a unei statistici observate este P = 0, 084. Care este
decizia privind ipoteza nulǎ?
a) dacǎ nivelul de semnificaţie fixat este α = 0, 05;
b) dacǎ nivelul de semnificaţie fixat este α = 0, 10.

Exerciţiu 7.3. Un economist pretinde cǎ atunci când media Dow-Jones creşte, volumul
acţiunilor vândute la bursa din New-York tinde sǎ creascǎ. În ultimii doi ani media
volumului zilnic de acţiuni vândute este de 21, 5 milioane şi are o deviaţie standard de
2, 5 milioane.
Un eşantion aleator de 64 zile ı̂n care media Dow-Jones a crescut a fost selectat şi s-a
calculat media volumului zilnic. Media eşantionului a fost de 22 milioane. Calculaţi p−
valoarea pentru verificarea acestei ipoteze statistice.

11
8 Inferenţǎ statisticǎ privind media populaţiei

Exerciţiu 8.1. Limita legalǎ a nivelului de poluant X ı̂n deşeurile unei uzine este 5
mg/kg. Se efectueazǎ o verificare pe 10 probe de 1 kg şi se obţin urmǎtoarele valori xi
pentru nivelul de poluant:
8 9 1 3 5 10 2 6 3 9
Admitem cǎ X urmeazǎ o lege normalǎ. Verificaţi dacǎ uzina respectǎ condiţiile legale la
nivelul de ı̂ncredere de 95%.
Exerciţiu 8.2. 16 determinǎri ale procentului de apǎ dintr-o soluţie au condus la
x = 0, 822% şi s = 0, 02%. Sǎ se verifice ipoteza H0 : µ = 0, 9&, faţǎ de ipoteza
Ha := µ < 0, 9% la un prag de semnificaţie de 0, 05.
Exerciţiu 8.3. O companie are un sistem de computere care proceseazǎ 1200 de facturi
pe orǎ. S-a testat un nou sistem care ı̂n 40 de ore a procesat ı̂n medie 1260 de facturi/orǎ
cu o deviaţie standard de 215. Verificaţi dacǎ noul sistem este mai bun. ( la un prag de
semnificaţie α = 0, 01).
Exerciţiu 8.4. S-a fǎcut un studiu pentru a verifica dacǎ se poate accepta ipoteza cǎ o
scrisoare trimisǎ dintr-o localitate ı̂n alta face ı̂n medie 3 zile. Pentru un eşantion de 54
de scrisori s-au obţinut urmǎtoarele date:

zile 1 2 3 4 5 6 8 9
frecvenţe 2 6 19 15 6 4 1 1

Se poate accepta ipoteza cǎ media este 3 zile la un prag de semnificaţie α = 0, 05?
(Rezolvaţi problema folosind metoda clasicǎ şi metoda probabilistǎ)
Exerciţiu 8.5. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la
nivelul de semnificaţie α = 0, 05, calculând ı̂n fiecare caz şi p-valoarea:
a) H0 : µ = 100 n = 64, x = 105, s2 = 40
Ha : µ > 100

b) H0 : µ = 100 n = 60, x = 110, s2 = 20


Ha : µ > 100

c) H0 : µ = 90 n = 25, x = 84, s2 = 30
Ha : µ < 90

d) H0 : µ = 90 n = 36, x = 80, s2 = 40
Ha : µ < 90

e) H0 : µ = 100 n = 25, x = 95, s2 = 20


Ha : µ =
6 100

f ) H0 : µ = 100 n = 36, x = 105, s2 = 30


Ha : µ =
6 100

12
9 Inferenţǎ statisticǎ asupra varianţei şi estimarea
varianţei

Exerciţiu 9.1. Un vânzǎtor de vin se intereseazǎ de cantitatea de vin dintr-o sticlǎ. El


se ı̂ntreabǎ dacǎ conţinutul mediu nu este inferior conţinutului legal de 75cl. În acest scop
mǎsoarǎ conţinutul a 10 sticle luate la ı̂ntm̂plare şi obţine valorile urmǎtoare:

73, 2 72, 6 74, 5 75, 0 75, 0 73, 7 , 74, 1 , 75, 1 74, 8 74, 0

a) Presupunând normalitatea distribuţiei conţinutului sticlelor, se pune ı̂ntrebarea dacǎ


conţinutul mediu este mai mic decât 75 cl, la nivelul de semnificaţie de 0, 05?

b) Dacǎ σ 2 este varianţa distribuţiei conţinutului sticlelor, testaţi ipoteza H0 : σ 2 = 1.

Exerciţiu 9.2. Un cercetǎtor vrea sǎ studieze valoarea cheltuielilor sǎptǎmânale ale
studenţilor de la Universitatea din Geneva. La un eşantion aleator de 20 de studenţi
obţine rǎspunsurile:

120 150 180 200 130 150 170 160 190 100
125 145 175 200 120 130 135 165 150 180

Poate sǎ tragǎ concluzia cǎ abaterea standard e superioarǎ lui 25?

13
10 Generalitǎţi despre corelaţie

Exerciţiu 10.1. Considerǎm urmǎtorul tabel de date:

x y1 y2 y3
2 4 8 2
3 5 7 4
3 5 7 5
4 5 8 7
4 7 7 4
5 7 5 3
5 8 4 2
6 8 4 1
6 8 5 1
6 8 4.5 3
7 9 4 4
7 9 3 7
7 10 3 8
8 9 2 9
8 10 3 9

a) Calculaţi coeficientul de corelaţie folosind definiţia şi formula alternativǎ de calcul


pentru seriile x şi y1 , x şi y2 , x şi y3 .

b) Desenaţi diagrama de ı̂mprǎştiere şi precizaţi tipurile de corelaţii existente ı̂n cele
trei cazuri prezentate la punctul a).

Exerciţiu 10.2. Pentru seturile de date care urmeazǎ:

1) calculaţi coeficientul de regresie liniarǎ (pentru seriile x şi y1 , x şi y2 , x şi y3 ı̂n
fiecare din cele douǎ cazuri);

2) precizaţi dacǎ existǎ sau nu corelaţie liniarǎ (pentru fiecare din cazurile prezentate
anterior).

14
Cazul 1. Cazul 2.

Cx y1 y2 y3 x y1 y2 y3
2 5 5 2 2 5 5 2
3 5 5 4 3 5 5 4
3 5 7 5 3 5 7 5
4 5 5 7 4 5 5 7
4 7 7 4 4 7 7 4
5 7 7 3 5 7 7 3
5 8 4 2 5 8 4 2
6 8 6 1 6 8 6 1
6 8 9 1 6 8 9 1
6 8 8 3 6 8 8 3
7 9 7 4 7 9 7 4
7 9 9 7 7 9 9 7
7 10 10 8 7 10 10 8
8 8 8 9 8 8 8 9
8 11 9 9 8 11 9 9
8 9 9 2
9 10 7 4
10 10 10 8
10 10 9 7
9 10 8 8

15
11 Analiza de corelaţie liniarǎ
P P
Exerciţiu 11.1. Explicaţi de ce (x − x) = 0 şi (y − y) = 0.
Exerciţiu 11.2.

a) Construţi diagrama de ı̂mprǎştiere pentru datele din urmǎtorul tabel:

x 1 1 3 3 5 5 7 7 9 9
y 1 2 2 3 3 4 4 5 5 6

b) Calculaţi covarianţa.
c) Calculaţi sx şi sy .
d) Calculaţi r folosind definiţia.
e) Calculaţi r folosind formula de calcul practic.
f) Dacǎ existǎ o depedenţǎ liniarǎ ı̂ntre x şi y determinaţi ecuaţia dreptei de regresie.
Exerciţiu 11.3.

a) Calculaţi covarianţa ı̂n cazul setului de date:

x 20 30 60 80 110 120
y 10 50 30 20 60 10

b) Calculaţi deviaţiile standard ale celor şase valori ale lui x şi ale celor şase valori ale
lui y.
c) Calculaţi coeficientul de corelaţie liniar r pentru tabelul de date
considerat.
d) Comparaţi acest rezultat cu cel gǎsit ı̂n cazul tabelului de date
considerat la ı̂nceput.
e) Dacǎ existǎ o depedenţǎ liniarǎ ı̂ntre x şi y determinaţi ecuaţia dreptei de regresie.
Exerciţiu 11.4. Se considerǎ urmǎtorul tabel de date bidimensionale:

x 0 1 1 2 3 4 5 6 6 6 7
y 6 6 7 4 5 2 3 0 1 1

a) Determinaţi diagrama de ı̂mprǎştiere .


b) Calculaţi covarianţa.
c) Calculaţi sx şi sy .
d) Calculaţi r folosind definiţia.
e) Calculaţi r folosind formula de calcul practic.
f) Dacǎ existǎ o depedenţǎ liniarǎ ı̂ntre x şi y determinaţi ecuaţia dreptei de regresie.

16
12 Inferenţǎ privind coeficientul de corelaţie liniarǎ

Exerciţiu 12.1.

a) Un eşantion de 20 de date bidimensionale are un coeficient de corelaţie liniar


r = 0, 43. Este acesta suficient pentru a respinge ipoteza nulǎ H0 : ρ = 0 ı̂n
favoarea unei alternative bilaterale la nivel de semnificaţie α = 0, 10?

b) Un eşantion de 18 date bidimensionale are un coeficient de corelaţie liniar r = −0, 50.


Este acesta suficient pentru a susţine cǎ la nivelul de semnificaţie α = 0, 10
coeficientul de corelaţie a populaţiei este negativ?

c) Un eşantion de 10 date bidimensionale are un coeficient de corelaţie liniar r = −, 067.


Este aceasta suficient pentru a susţine cǎ la nivelul de semnificaţie α = 0, 05? (ρ
este nenul)

d) Valoarea r = 0, 24 este ea semnificativǎ pentru a arǎta cǎ ρ > 0 la nivelul de


semnificaţie α = 0, 05 ı̂n cazul unui eşantion de mǎrime 62.

17
13 Regresie liniarǎ

Exerciţiu 13.1. Pentru doi hamali ce ı̂şi desfǎşoarǎ activitatea ı̂n Gara de Nord, se
cunosc datele de mai jos cu privire la numǎrul de bagaje transportate pe parcursul a cinci
zile de lucru:

Ziua Numǎr bagaje transportate Numǎr bagaje transportate


de primul hamal de al doilea hamal
1 30 35
2 32 32
3 31 29
4 35 28
5 40 26

Se cere:

1) Sǎ se reprezinte diagrama de ı̂mprǎştiere pentru cele douǎ seturi de date.

2) Sǎ se mǎsoare coeficientul de variaţie pentru fiecare variabilǎ.

3) În ipoteza legǎturii liniare determinaţi parametrii dreptei de regresie.

4) Sǎ se calculeze coeficientul de corelaţie liniarǎ ı̂ntre cele douǎ variabile.

Exerciţiu 13.2. Se dau datele privind pulsul şi temperatura pentru zece pacienţi:

Pacienti Pulsul Temperatura


1 75 38,2
2 80 37,5
3 70 36,5
4 90 38,3
5 75 37,1
6 85 38
7 80 37,6
8 90 38,5
9 100 39,4
10 95 38,9

a) Calculaţi coeficientul de corelaţie liniarǎ.

b) Determinaţi parametrii dreptei de regresie.

18
14 Analiza de regresie liniarǎ

Exerciţiu 14.1.

a) Sǎ se determine diagrama de ı̂mprǎştiere şi dreapta de regresie


ŷ = b0 + b1 · x ı̂n cazul tabelului de date:

x 1 1 3 3 5 5 7 7 9 9
y 1 2 2 3 3 4 4 5 5 6

b) Sǎ se determine ordonatele ŷ ale punctelor de pe linia de regresie având abscisele:


x = 1, 3, 5, 7 şi 9.

c) Sǎ se determine e = y − ŷ pentru fiecare punct din tabel.

d) Sǎ se determine s2e .

Exerciţiu 14.2. Aceleaşi ı̂ntrebǎri ı̂n cazul tabelului de date:

x 0 1 1 2 3 4 5 6 6 6 7
y 6 6 7 4 5 2 3 0 1 1
Exerciţiu 14.3. Datele din tabelul urmǎtor aratǎ numǎrul orelor de studiu x pentru un
examen şi nota y primitǎ la acel examen:

x 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
y 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9

a) Sǎ se determine diagrama de ı̂mprǎştiere.

b) Sǎ se gǎseascǎ linia de regresie.

c) Sǎ se gǎseascǎ ŷ pentru x = 2, 3, 4, 5, 6, 7 şi 8.

d) Determinaţi valorile lui e pentru x = 3 şi x = 6.

19
15 Inferenţǎ referitoare la panta unei drepte de re-
gresie liniarǎ

Exerciţiu 15.1. Un eşantion de 10 studenţi a fost ı̂ntrebat referitor la distanţa parcursǎ


şi la timpul necesar pentru a ajunge la facultate astǎzi. Rǎspunsurile date sunt cuprinse
ı̂n tabelul urmǎtor:

x 1 3 5 5 7 7 8 10 10 12
y 5 10 15 20 15 25 20 25 35 35

a) Determinaţi diagrama de ı̂mprǎştiere.

b) Determinaţi ecuaţia dreptei de regresie ı̂n acest caz.

c) Valoarea obţinutǎ pentru b1 este probǎ suficientǎ pentru a concluziona cǎ β1 > 0 la
nivelul de semnificaţie α = 0, 05.

d) Determinaţi intervalul de ı̂ncredere de 98% pentru estimarea lui β1 .

Exerciţiu 15.2. Rata dobânzii este aleasǎ astfel ı̂ncât sǎ aibe un efect asupra şomajului.
Urmǎtorul tabel de date reprezintǎ rata dobânzii pe perioade de 3 luni pentru ı̂mprumuturi
pe termen scurt (x) şi rata şomajului (y).

x 12,27 12,34 12,31 15,81 15,67 17,75 11,56 15,71 19,91 19,99 21,11
y 5,9 5,6 5,9 5,9 6,2 7,6 7,5 7,3 7,6 7,2 8,3

a) Sǎ se determine dreapta de cea mai bunǎ aproximare.

b) Este acest eşantion o dovadǎ suficientǎ pentru a respinge ipoteza nulǎ (pantǎ zero)
ı̂n favoarea unei ipoteze alternative cǎ panta este pozitivǎ la nivelul de semnificaţie
0.05?

20

S-ar putea să vă placă și