Documente Academic
Documente Profesional
Documente Cultură
1 Noţiuni de bazǎ
Exerciţiu 1.1. Presupuneţi cǎ lucraţi pentru o firmǎ de sondare a opiniei publice şi doriţi
sǎ estimaţi proporţia cetǎţenilor care, ı̂n eventualitatea organizǎrii de alegeri astǎzi, ar
vota cu partidul de guvernǎmânt. definiţi populaţia statisticǎ pe care o eşantionaţi. Dar
dacǎ v-ar interesa sǎ estimaţi proporţia cetǎţenilor care, la viitoarele alegeri ar vota cu
partidul de guvernǎmânt, care ar fi populaţia statisticǎ?
Exerciţiu 1.2. O companie de asigurǎri doreşte sǎ determine proporţia medicilor care
au fost implicaţi ı̂n ultimul an ı̂n una sau mai multe acţiuni judiciare de rele practici.
Compania selecteazǎ ı̂ntâmplǎtor ı̂n ultimul an una sau mai multe acţiuni judiciare de
rele practici. Compania selecteazǎ ı̂ntâmplǎtor 500 de medici care au practicat ı̂n ultimul
an şi determinǎ proporţia. Identificaţi populaţia de interes.
Exerciţiu 1.3. Un cercetǎtor este interesat sǎ compare salariul de ı̂ncadrare pentru
bǎrbaţii şi femeile care au un loc de muncǎ imediat dupǎ absolvirea facultǎţii. Sunt
cercetaţi 100 de bǎrbaţi şi 100 de femei.
Exerciţiu 1.4. Identificaţi trei tipuri diferite de variabile statistice ce pot fi colectate
pentru a reflecta popularitatea a cinci publicaţii periodice similare.
Exerciţiu 1.5. Pentru urmǎtoarele cazuri, precizaţi populaţia statisticǎ şi identificaţi
variabila studiatǎ:
1
- 2 kg de mere;
Exerciţiu 1.7. Clasificaţi urmǎtoarele variabile ı̂n variabile calitative şi cantitative:
- Culoarea maşinilor;
- Culoarea ochilor;
2
2 Determinarea frecvenţei şi gruparea datelor.
Prezentarea datelor.
Parametrii şi statistici ai tendinţei centrale
Exerciţiu 2.1. O firmǎ este interesatǎ de timpul mediu al convorbirilor telefonice şi
de distribuţia acestor timpi faţǎ de timpul mediu (dispersia) pe durata a 40 convorbiri
telefonice consecutive. Timpii s-au rotunjit n minute s-a obţinut urmǎtorul set de date:
4, 6, 4, 4, 7, 2, 3, 1, 2, 1, 1, 4, 9, 8, 11, 12, 3, 2, 1, 1, 3, 9, 4, 5, 7, 7, 9, 10, 10, 1, 2, 2, 3,
11, 12, 10, 1, 1, 3, 4. Care este seria de distribuţie? Sǎ se realizeze diagrama cerc? Care
sunt parametrii tendinţei centrale?
x fx
3-5 2
6-8 10
9-11 12
12-14 9
15-17 7
8; 10; 4; 9; 6; 8; 10; 7; 8; 3;
9; 6; 5; 4; 8; 7; 10; 9; 6; 5;
4; 3; 6; 9; 10; 8; 7; 7; 7; 6;
5; 5; 6; 7; 9; 10; 7; 6; 3; 4;
5 6 3 6 11 7 9 10 2 4 10 6 2 1 5
Sǎ se calculeze modul şi mediana pentru aceste date. Sǎ se com pare aceste valori şi sǎ
se precizeze care este cea mai potrivitǎ pentru a mǎsura tendinţa centralǎ a datelor.
3
Exerciţiu 2.5. Un analist financiar al unei firme este interesat ı̂n a determina salariul
mediu acordat angajaţilor a 4 filiale ale firmei. Pentru aceasta el culege datele privind
salariul mediu pe fiecare filialǎ şi fondurile de salarizare.
Exerciţiu 2.7. Într-o şcoalǎ promovabilitatea elevilor a crescut astfel ı̂n perioada 1995-
2006: ı̂n perioada 1995-1998 a crescut de 1.05 ori, ı̂n perioada 1999-2002 a crescut de
1.078 ori, iar ı̂n perioada 2003-2006 a crescut de 1.098 ori. Care este valoarea medie a
creşterii promovabilitǎţii?
4
3 Parametrii si statistici ai dispersiei.
Parametrii si statistici factoriali ai variantei
x f
0 1
1 3
2 8
3 5
4 3
b) Determinaţi varianţa şi abaterea standard a setului de date; item[d)] Care este
coeficientul de variaţie?
Sǎ se calculeze
5
b) deviaţia medie absolutǎ a setului de date;
Exerciţiu 3.5. Persoanele unei firme sunt ı̂mpǎrţite ı̂n trei grupe ı̂n funcţie de ı̂nǎlţime.
Se cunosc urmǎtoarele date
6
4 Parametrii si statistici ai pozitiei
105* 110* 112* 112* 118* 119* 120* 120* 125* 126*
127* 128* 130* 132* 133* 134* 135* 138* 138* 138*
138* 141 142* 144 145* 146 148* 148* 148 149
150* 150 151* 151 153 153 153 154* 154* 154
155 156 156 158* 160 160 160 160 163 164 164
165 166 168 168 170 172 172 176 179 141
10-15 15
16-20 30
22-27 40
28-33 50
34-39 20
40-45 5
Exerciţiu 4.4. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice
distincte: {0, 3, 6, 9}.
7
5 Teorema de limita centrala
Exerciţiu 5.1. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice
distincte: {4, 8, 12}.
Exerciţiu 5.2. Înǎlţimea copiilor dintr-o grǎdiniţǎ considerǎm cǎ este o variabilǎ dis-
tribuitǎ aproximativ normal de medie: µ = 39 şi abatere standard 2.
a) Dacǎ se ia un copil la ı̂ntâmplare care este probabilitatea ca ı̂nǎlţimea lui sǎ fie ı̂ntre
38 şi 40 de inch?
b) Care este probabilitatea ca media ı̂nǎlţimii unei clase de 30 de copii sǎ fie ı̂ntre 30
şi 40 inch?
d) Dar probabilitatea ca media ı̂nǎlţimilor copiilor dintr-o clasǎ de 30 de copii sǎ fie
mai mare decât 40?
Exerciţiu 5.3. Pentru o populaţie se cunoaşte media µ = 500 şi deviaţia standard σ = 30.
Se extrag aleator mai multe eşantioane de dimensiune 36.
a) Care este probabilitatea ca media datelor sǎ fie ı̂n intervalul 45 şi 55?
b) Care este probabilitatea ca media sǎ fie mai mare decât 48?
8
6 Verificarea ipotezelor statistice: varianta clasicǎ
Exerciţiu 6.1. O uzinǎ a cumpǎrat un lot de cabluri metalice destinate sǎ susţinǎ
ı̂ncǎrcǎturi grele. Fabricantul de cabluri a afirmat cǎ ı̂ncǎrcǎtura medie ce provoacǎ
ruperea acestor cabluri este de 8000 kg. Uzina a efectuat un test pe 6 cabluri şi a
constatat o ı̂ncǎrcǎturǎ medie de rupere egalǎ cu 7750 de kg şi o abatere standard de
145 kg. Uzina doreşte sǎ ştie dacǎ depune plângere contra fabricantului, poate câştiga
procesul cu o probabilitate de 99%?
Exerciţiu 6.2. Pentru a determina nivelul mediu de plumb din apa potabilǎ a unei zone
puternic industrializate se fac determinǎri ı̂n 144 de zile alese aleator.
În urma testelor s-a obţinut o medie de x = 36 de unitǎţi de plumb/100 ml apǎ, iar
abaterea medie pǎtraticǎ s = 15 unitǎţi plumb/100 ml apǎ.
Sǎ se determine un interval de ı̂ncredere de 95% pentru valoarea medie a nivelului de
plumb/100 ml apǎ.
Exerciţiu 6.3. O maşinǎ produce fiole de sticlǎ. Pentru 53 de fiole s-a observat o duratǎ
medie de viaţǎ de x = 830 de ore. Presupunem cǎ durata de viaţǎ a unei fiole urmeazǎ
o lege normalǎ, iar varianţa este σ = 415. Directorul firmei afirmǎ cǎ durata de viaţǎ a
fiolelor este x = 850 de ore. Are el dreptate la nivelul de semnificaţie α = 0, 05?
Exerciţiu 6.4. Nivelul de glicemie al unei populaţii adulte este presupusǎ distribuitǎ
dupǎ o lege normalǎ de dispersie σ = 0, 80 g/l de sânge.Se considerǎ un eşantion de
12 persoane ale acestei populaţii şi se mǎsoarǎ nivelul de glicemie la fiecare. Se gǎsesc
urmǎtoarele rezultate:
0, 6 0, 9 0, 74 0, 96 0, 85 1, 05 0, 8 0, 93 1, 17 0, 70 0, 84 0, 75
Exerciţiu 6.5. Se presupune cǎ ı̂ncǎrcǎtura suportatǎ de plǎcile de tablǎ este o variabilǎ
aleatoare de medie µ şi abatere medie pǎtraticǎ σ. În condiţiile date, s-au testat 50 de
plǎci de tablǎ, media şi abaterea observate sunt x = 320, iar abaterea medie pǎtraticǎ
este s = 35.
Câte plǎci de tablǎ trebuie testate pentru ca intervalul de ı̂ncredere al ı̂ncǎrcǎturii medii
sǎ fie determinat cu o amplitudine de 10 kg la nivelul de semnificaţie α = 0, 005?
Exerciţiu 6.6. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la
9
nivelul de semnificaţie α = 0, 05
c) H0 : µ = 90 n = 25, x = 84, σ 2 = 30
Ha : µ < 90
d) H0 : µ = 90 n = 36, x = 80, σ 2 = 40
Ha : µ < 90
10
7 Verificarea ipotezelor statistice: varianta proba-
bilistǎ
Ha : µ > 10
b) H0 : µ = 105 z ∗ = −0, 85
Ha : µ < 105
c) H0 : µ = 13, 4 z ∗ = 1, 17
Ha : µ 6= 13, 4
d) H0 : µ = 8, 56 z ∗ = −2, 11
Ha : µ < 8, 56
e) H0 : µ = 110 z ∗ = −0, 93
Ha : µ 6= 110
f ) H0 : µ = 54, 2 z ∗ = 0, 46
Ha : µ > 54, 2
Exerciţiu 7.2. P-valoarea calculatǎ a unei statistici observate este P = 0, 084. Care este
decizia privind ipoteza nulǎ?
a) dacǎ nivelul de semnificaţie fixat este α = 0, 05;
b) dacǎ nivelul de semnificaţie fixat este α = 0, 10.
Exerciţiu 7.3. Un economist pretinde cǎ atunci când media Dow-Jones creşte, volumul
acţiunilor vândute la bursa din New-York tinde sǎ creascǎ. În ultimii doi ani media
volumului zilnic de acţiuni vândute este de 21, 5 milioane şi are o deviaţie standard de
2, 5 milioane.
Un eşantion aleator de 64 zile ı̂n care media Dow-Jones a crescut a fost selectat şi s-a
calculat media volumului zilnic. Media eşantionului a fost de 22 milioane. Calculaţi p−
valoarea pentru verificarea acestei ipoteze statistice.
11
8 Inferenţǎ statisticǎ privind media populaţiei
Exerciţiu 8.1. Limita legalǎ a nivelului de poluant X ı̂n deşeurile unei uzine este 5
mg/kg. Se efectueazǎ o verificare pe 10 probe de 1 kg şi se obţin urmǎtoarele valori xi
pentru nivelul de poluant:
8 9 1 3 5 10 2 6 3 9
Admitem cǎ X urmeazǎ o lege normalǎ. Verificaţi dacǎ uzina respectǎ condiţiile legale la
nivelul de ı̂ncredere de 95%.
Exerciţiu 8.2. 16 determinǎri ale procentului de apǎ dintr-o soluţie au condus la
x = 0, 822% şi s = 0, 02%. Sǎ se verifice ipoteza H0 : µ = 0, 9&, faţǎ de ipoteza
Ha := µ < 0, 9% la un prag de semnificaţie de 0, 05.
Exerciţiu 8.3. O companie are un sistem de computere care proceseazǎ 1200 de facturi
pe orǎ. S-a testat un nou sistem care ı̂n 40 de ore a procesat ı̂n medie 1260 de facturi/orǎ
cu o deviaţie standard de 215. Verificaţi dacǎ noul sistem este mai bun. ( la un prag de
semnificaţie α = 0, 01).
Exerciţiu 8.4. S-a fǎcut un studiu pentru a verifica dacǎ se poate accepta ipoteza cǎ o
scrisoare trimisǎ dintr-o localitate ı̂n alta face ı̂n medie 3 zile. Pentru un eşantion de 54
de scrisori s-au obţinut urmǎtoarele date:
zile 1 2 3 4 5 6 8 9
frecvenţe 2 6 19 15 6 4 1 1
Se poate accepta ipoteza cǎ media este 3 zile la un prag de semnificaţie α = 0, 05?
(Rezolvaţi problema folosind metoda clasicǎ şi metoda probabilistǎ)
Exerciţiu 8.5. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la
nivelul de semnificaţie α = 0, 05, calculând ı̂n fiecare caz şi p-valoarea:
a) H0 : µ = 100 n = 64, x = 105, s2 = 40
Ha : µ > 100
c) H0 : µ = 90 n = 25, x = 84, s2 = 30
Ha : µ < 90
d) H0 : µ = 90 n = 36, x = 80, s2 = 40
Ha : µ < 90
12
9 Inferenţǎ statisticǎ asupra varianţei şi estimarea
varianţei
73, 2 72, 6 74, 5 75, 0 75, 0 73, 7 , 74, 1 , 75, 1 74, 8 74, 0
Exerciţiu 9.2. Un cercetǎtor vrea sǎ studieze valoarea cheltuielilor sǎptǎmânale ale
studenţilor de la Universitatea din Geneva. La un eşantion aleator de 20 de studenţi
obţine rǎspunsurile:
120 150 180 200 130 150 170 160 190 100
125 145 175 200 120 130 135 165 150 180
Poate sǎ tragǎ concluzia cǎ abaterea standard e superioarǎ lui 25?
13
10 Generalitǎţi despre corelaţie
x y1 y2 y3
2 4 8 2
3 5 7 4
3 5 7 5
4 5 8 7
4 7 7 4
5 7 5 3
5 8 4 2
6 8 4 1
6 8 5 1
6 8 4.5 3
7 9 4 4
7 9 3 7
7 10 3 8
8 9 2 9
8 10 3 9
b) Desenaţi diagrama de ı̂mprǎştiere şi precizaţi tipurile de corelaţii existente ı̂n cele
trei cazuri prezentate la punctul a).
1) calculaţi coeficientul de regresie liniarǎ (pentru seriile x şi y1 , x şi y2 , x şi y3 ı̂n
fiecare din cele douǎ cazuri);
2) precizaţi dacǎ existǎ sau nu corelaţie liniarǎ (pentru fiecare din cazurile prezentate
anterior).
14
Cazul 1. Cazul 2.
Cx y1 y2 y3 x y1 y2 y3
2 5 5 2 2 5 5 2
3 5 5 4 3 5 5 4
3 5 7 5 3 5 7 5
4 5 5 7 4 5 5 7
4 7 7 4 4 7 7 4
5 7 7 3 5 7 7 3
5 8 4 2 5 8 4 2
6 8 6 1 6 8 6 1
6 8 9 1 6 8 9 1
6 8 8 3 6 8 8 3
7 9 7 4 7 9 7 4
7 9 9 7 7 9 9 7
7 10 10 8 7 10 10 8
8 8 8 9 8 8 8 9
8 11 9 9 8 11 9 9
8 9 9 2
9 10 7 4
10 10 10 8
10 10 9 7
9 10 8 8
15
11 Analiza de corelaţie liniarǎ
P P
Exerciţiu 11.1. Explicaţi de ce (x − x) = 0 şi (y − y) = 0.
Exerciţiu 11.2.
x 1 1 3 3 5 5 7 7 9 9
y 1 2 2 3 3 4 4 5 5 6
b) Calculaţi covarianţa.
c) Calculaţi sx şi sy .
d) Calculaţi r folosind definiţia.
e) Calculaţi r folosind formula de calcul practic.
f) Dacǎ existǎ o depedenţǎ liniarǎ ı̂ntre x şi y determinaţi ecuaţia dreptei de regresie.
Exerciţiu 11.3.
x 20 30 60 80 110 120
y 10 50 30 20 60 10
b) Calculaţi deviaţiile standard ale celor şase valori ale lui x şi ale celor şase valori ale
lui y.
c) Calculaţi coeficientul de corelaţie liniar r pentru tabelul de date
considerat.
d) Comparaţi acest rezultat cu cel gǎsit ı̂n cazul tabelului de date
considerat la ı̂nceput.
e) Dacǎ existǎ o depedenţǎ liniarǎ ı̂ntre x şi y determinaţi ecuaţia dreptei de regresie.
Exerciţiu 11.4. Se considerǎ urmǎtorul tabel de date bidimensionale:
x 0 1 1 2 3 4 5 6 6 6 7
y 6 6 7 4 5 2 3 0 1 1
16
12 Inferenţǎ privind coeficientul de corelaţie liniarǎ
Exerciţiu 12.1.
17
13 Regresie liniarǎ
Exerciţiu 13.1. Pentru doi hamali ce ı̂şi desfǎşoarǎ activitatea ı̂n Gara de Nord, se
cunosc datele de mai jos cu privire la numǎrul de bagaje transportate pe parcursul a cinci
zile de lucru:
Se cere:
Exerciţiu 13.2. Se dau datele privind pulsul şi temperatura pentru zece pacienţi:
18
14 Analiza de regresie liniarǎ
Exerciţiu 14.1.
x 1 1 3 3 5 5 7 7 9 9
y 1 2 2 3 3 4 4 5 5 6
x 0 1 1 2 3 4 5 6 6 6 7
y 6 6 7 4 5 2 3 0 1 1
Exerciţiu 14.3. Datele din tabelul urmǎtor aratǎ numǎrul orelor de studiu x pentru un
examen şi nota y primitǎ la acel examen:
x 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
y 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
19
15 Inferenţǎ referitoare la panta unei drepte de re-
gresie liniarǎ
x 1 3 5 5 7 7 8 10 10 12
y 5 10 15 20 15 25 20 25 35 35
c) Valoarea obţinutǎ pentru b1 este probǎ suficientǎ pentru a concluziona cǎ β1 > 0 la
nivelul de semnificaţie α = 0, 05.
Exerciţiu 15.2. Rata dobânzii este aleasǎ astfel ı̂ncât sǎ aibe un efect asupra şomajului.
Urmǎtorul tabel de date reprezintǎ rata dobânzii pe perioade de 3 luni pentru ı̂mprumuturi
pe termen scurt (x) şi rata şomajului (y).
x 12,27 12,34 12,31 15,81 15,67 17,75 11,56 15,71 19,91 19,99 21,11
y 5,9 5,6 5,9 5,9 6,2 7,6 7,5 7,3 7,6 7,2 8,3
b) Este acest eşantion o dovadǎ suficientǎ pentru a respinge ipoteza nulǎ (pantǎ zero)
ı̂n favoarea unei ipoteze alternative cǎ panta este pozitivǎ la nivelul de semnificaţie
0.05?
20