Documente Academic
Documente Profesional
Documente Cultură
CARMEN PINTILESCU
MIRCEA ASANDULUI DANIELA VIORICĂ
BAZELE STATISTICII
2020
1
CUPRINS
2
PARTEA 1: STATISTICA DESCRIPTIVĂ
Cuprins
Rezumat
Acest capitol prezintă cele mai importante concepte folosite în analiza statistică:
populație, eșantion, variabile statistice, unități statistice. Pentru variabilele statistice sunt
prezentate criteriile de clasificare și tipurile acestora. Metodele de analiză statistică a datelor
diferă în funcție de natura variabilelor (cantitative sau calitative) și de tipul acestora (discrete
sau continue; nominale sau ordinale).
Bibliografie
3
US1. NOŢIUNI INTRODUCTIVE
Termenul de “statistică” a evoluat din momentul în care a apărut pentru prima oară în
lucrarea lui Gottfried Achenwall, publicată în 1746, până în zilele noastre. În acea perioadă,
prin termenul de statistică se înţelegea un ansamblu de informaţii despre lucrurile remarcabile
cu privire la colectivitatea numită stat, expuse într-o anumită ordine. În prezent, prin statistică
se înţelege un ansamblu de metode folosite pentru culegerea, prezentarea şi analiza datelor
înregistrate pentru o colectivitate statistică.
Principalele concepte fundamentale din statistică sunt populaţia statistică, eşantionul,
unitatea statistică şi variabila statistică.
1.2. Eşantion
4
1.3 Unitate statistică
Aceste unităţi sunt purtătoare de informaţii care vor fi observate si înregistrate cu scopul
de a caracteriza populaţia din care provin.
DEFINIȚIE Variabilele numerice sunt acele variabile pentru care valorile sunt
exprimate numeric.
5
Exemplul 1.4. Variabile numerice
Variabile numerice sunt: vârsta persoanelor, câştigul salarial, înălţimea etc.
După modul de manifestare a variaţiei valorilor, variabilele numerice pot fi discrete sau
continue.
Variabilele discrete sunt acele variabile care nu pot lua decât valori finite din domeniul
de valori al variabilei.
Variabile continue sunt acele variabile care pot lua o infinitate de valori din domeniul
de valori al variabilei.
DEFINIȚIE Variabilele nenumerice sunt acele variabile pentru care valorile sunt
exprimate prin cuvinte.
6
Exemplul 1.8. Variabile nominale
Pentru variabila X, mediul de rezidenţă, se pot acorda codurile 1 pentru varianta Urban
şi 2 pentru varianta Rural, fără să se poată stabili o relaţie de ordine între aceste două valori.
Variabilele ordinale sunt acele variabile pentru care există o relaţie de ordine între
unităţile din categoriile variabilei. Ordinea acordării codurilor diferitelor categorii ale
variabilei X are, în acest caz, un sens.
7
US2. ANALIZA UNEI SERII STATISTICE UNIVARIATE
Cuprins
Rezumat
Bibliografie
8
Analiza statistică descriptivă a unei variabile cantitative sau calitative poate fi realizată
grafic și numeric, prin calculul indicatorilor statisticii descriptive. Graficele care pot fi folosite
pentru un set de date și indicatorii statistici care pot fi calculați depind de natura variabilelor
(cantitative sau calitative).
O prezentare sintetică a valorilor unei variabile statistice discrete poate fi realizată prin
structurarea datelor într-o serie (distribuție) statistică, prin calculul indicatorilor statisticii
descriptive și prin reprezentarea grafică a seriei.
9
2. Pentru fiecare valoare xi, se determină frecvența de apariție (se numără
num de câte ori
apare aceastăă valoare în setul de date). Rezultatul acestor numărări
numărări se trec în a doua
coloană a tabelului.
xi ni
xm nm
TOTAL
Frecvența de apariție
ție a unei valori a variabilei X se mai numește
ște frecvență
frecven absolută de
apariție (ni). Suma acestor frecvențe
frecven absolute este volumul eșantionului (n).
(n)
3 4 2 3 3 2 4
2 3 3 3 4 6 4
5 4 4 3 3 4 5
4 4 4 2 3 3 3
Rezolvare
Pentru formarea distribuției
distribu de frecvență, se parcurg următoarele
toarele etape:
1. Se ordoneazăă crescător
ător valorile variabilei X : 2, 3, 4, 5, 6.
10
2. Aceste valori se trec în prima coloană a unui tabel (Tabelul 2.2).
3. Pentru fiecare valoare a numărului de membri dintr-o familie, se numără familiile care
înregistrează acest număr de membri. De exemplu, numărul de familii care au 2
membri (x1=2) este 4 (n1=4). Aceste rezultate se trec în a doua coloană a Tabelului
2.2.
Frecvența relativă poate fi exprimată în procente și, în acest caz, aceasta se calculează
astfel :
ni n
fi = ⋅ 100 = i ⋅ 100
ni
i
n
xi fi
xm fm
TOTAL
Suma frecvențelor relative este 1 sau 100, atunci când datele se exprimă
exprim în procente.
Rezolvare
1. Distribuția
ia de frecvență
frecvenț a numărului de familii în funcție
ie de numărul
num de membri pe
familie este cea prezentată în Tabelul 2.2.
2. Se calculeazăă frecvențele
frecven relative prin împărțirea fiecărei
ărei frecvențe
frecven absolute (din
coloana a doua a Tabelului 2.4)
2.4 la suma lor. Rezultatele obținute
ținute se prezintă
prezint astfel :
Observații:
- Pentru compararea mai multor distribuții de frecvență, se recomandă folosirea
frecvențelor relative. Frecvențele relative variază între 0 și 1 (sau 100) și oferă o
măsură similară de comparație (fac datele comparabile).
- Distribuția de frecvență a unei variabile folosind frecvențe relative este similară
distribuției de frecvență folosind frecvențe absolute. Distribuția frecvențelor relative
reflectă însă mai bine structura unui eșantion pe valori ale unei variabile. În exemplul
dat, distribuția eşantionului de familii din oraşul Iaşi folosind frecvențe absolute și
relative poate fi prezentată astfel :
Tabelul 2.5. Distribuția familiilor după numărul de membri, folosind frecvențe absolute și relative
Număr membri (xi) Număr familii (ni) Ponderea familiilor (fi)
2 4 14,3
3 11 39,3
4 10 35,7
5 2 7,1
6 1 3,6
TOTAL n=28 100
Rezultatele din tabelul de mai sus arată că 4 familii, care reprezintă 14,3% din numărul
total de familii, înregistrează 2 membri. Cele 11 familii, care reprezintă 39,3% dintre familii,
au câte 3 membri ș.a.m.d.
Folosind frecvențele absolute, ni, se pot afla unitățile statistice (efectivele) care
înregistrează valori mai mici sau egale decât un anumit nivel xi al variabilei (care au valori cel
mult egale cu valoarea xi) sau care înregistrează valori mai mari sau egale decât un nivel xi al
variabilei (care au valori cel puțin egale cu valoarea xi). Aceste frecvențe sunt frecvențele
absolute cumulate crescător (Ni↓) sau descrescător (Ni↑).
13
a.3.1 Frecvențele absolute cumulate crescător (Ni↓)
Rezolvare
- prima frecvență N1↓ este reprezentată de numărul de familii care au 2 membri,
respectiv de frecvența absolută n1. Deci, N1↓=4.
- a doua frecvență cumulată presupune însumarea la cele 4 familii care au 2 membri pe
cele care au 3 membri, adică 11 familii. Obținem astfel : N2↓=4+11=15 familii.
- a treia frecvență cumulată presupune însumarea la cele 15 familii care au 2 și 3
membri pe cele care au 4 membri, respectiv : N3↓=15+10=25 familii sau
N3↓=4+11+10=25 familii.
Acest demers continuă până se cumulează toate efectivele din eșantion.
14
Rezultatele obținute pot fi centralizate într-un tabel de forma :
Interpretare: Din numărul total de familii observate, 4 familii au 2 membri, 15 familii au cel
mult 3 membri, 25 de familii au cel mult 4 membri etc.
Observație: Frecvențele absolute cumulate crescător arată efectivele care înregistrează valori
mai mici sau egale decât un anumit nivel xi al variabilei. De exemplu, 15 familii au cel mult 3
membri (inclusiv 3 membri), 25 de familii au cel mult 4 membri (inclusiv 4 membri) etc.
15
Tabelul 2.8. Distribuția familiilor după numărul de membri
Număr membri Număr familii
(xi) (ni)
2 4
3 11
4 10
5 2
6 1
TOTAL n=28
Rezolvare
În cazul frecvențelor cumulate descrescător, însumarea frecvențelor se face «de jos în
sus», adică de la ultima frecvență până la prima frecvență.
Frecvențele absolute cumulate descrescător se calculează astfel :
- ultima frecvență N5↑ este reprezentată de numărul de familii care au 6 membri. Deci,
N5↑=6.
- următoarea frecvență, N4↑, presupune însumarea la cele 6 familii, care au 1 membru,
pe cele 2 familii care au 5 membri. Obținem astfel : N4↑=1+2=3 familii.
- a treia frecvență cumulată presupune însumarea la cele 3 familii care au 5 și 6 membri
pe cele care au 4 membri, respectiv : N3↓=1+2+10=13 familii.
Acest demers continuă până se cumulează toate efectivele din eșantion.
Rezultatele obținute pot fi centralizate într-un tabel de forma :
16
Interpretare: Din numărul
rul total de familii observate, o familie are cel puțin
ărul pu 6 membri, 3
familii au cel puțin
in 5 membri, 13 de familii au cel puțin
pu 4 membri etc.
Observații:
- Frecvențele
ele absolute cumulate descrescător
descresc arată efectivele care înregistrează
înregistreaz valori
mai mari sau egale decât un anumit nivel xi al variabilei. De exemplu, 3 familii au cel
puțin
in 5 membri (inclusiv 5 membri), 13 familii au cel puțin
puțin 4 membri (inclusiv 4
membri) etc.
- Frecvențele
ele absolute cumulate descrescător
descresc pot fi calculate și scăzând
sc din numărul
total de familii pe cele care au 2 membri, apoi pe cele care au 3 membri ș.a.m.d. De
exemplu, din cele 28 de familii care au 2 membri, 24 de familii (adică
(adic 28 – 4 = 24) au
cel puțin
in 3 membri, 13 familii (adică
(adic 24-11=13) au cel puțin
țin 4 membri etc.
Folosind frecvențele
țele absolute cumulate crescător
cresc și descrescător
ător se poate forma
distribuția frecvențelor
elor cumulate.
DEFINIȚIE Distribuția frecvențelor cumulate este formată din valorile xi ale variabilei X
și frecvențele absolute cumulate crescător și descrescător asociate acestora.
xm nm Nm↓=Nm-1↓+nm=n Nm↑=nm
TOTAL
17
a.4. Distribuția frecvențelor relative cumulate
În mod similar, folosind frecvențele relative (fi), se poate afla ponderea unităților
statistice (ponderea efectivelor) care înregistrează valori mai mici sau egale decât un anumit
nivel xi al variabilei, respectiv valori mai mari sau egale decât un nivel xi al variabilei X.
Aceste frecvențe sunt frecvențele relative cumulate crescător (Fi↓) sau descrescător (Fi↑).
18
Rezolvare
Frecvențele relative cumulate crescător se află astfel:
- prima frecvență F1↓ este reprezentată de ponderea familiilor care au 2 membri,
respectiv de frecvența relativă f1. Deci, F1↓=14,3%.
- a doua frecvență relativă cumulată presupune însumarea ponderii familiilor care au 2
membri (14,3%) cu cele care au 3 membri (39,3%). Obținem astfel :
F2↓=14,3%+39,3%=53,6%.
Acest demers continuă până se cumulează toate frecvențele relative din eșantion.
Rezultatele obținute pot fi centralizate într-un tabel de forma :
Interpretare: Din numărul total de familii observate, 14,3% au 2 membri, 53,6% au cel mult
3 membri, 89,3% au cel mult 4 membri etc.
19
Tabelul 2.13. Distribuția familiilor după numărul de membri
Număr membri (xi) Ponderea familiilor (fi) Fi↑ Mod de calul
2 14,3 100 85,7+14,3 sau 3,6+7,1+35,7+39,3+14,3
3 39,3 85,7 46,4+39,3 sau 3,6+7,1+35,7+39,3
4 35,7 46,4 10,7+35,7 sau 3,6+7,1+35,7
5 7,1 10,7 3,6+7,1
6 3,6 3,6 3,6
TOTAL 100 -
Interpretare: Din numărul total de familii observate, 3,6% au cel puțin 6 membri, 10,7% au
cel puțin 5 membri, 46,4% au cel puțin 4 membri etc.
DEFINIȚIE Distribuția frecvențelor relative cumulate este formată din valorile xi ale
variabilei X și frecvențele relative cumulate crescător (Fi↓) și descrescător
(Fi↑) asociate acestora.
20
Tabelul 2.14. Distribuția frecvențelor
frecven relative cumulate crescător și descrescător
ător ale unei variabile
cantitative discrete
Valori ale Frecvența Frecven relativă
Frecvența Frecvența relativă Frecven relativă
Frecvența
variabilei absolută (fi) cumulată crescător cumulat descrescător
cumulată
(xi) (ni) (Fi↓) (Fi↑)
x1 n1 f1 F1↓ F1↑= F2↑+f1=1
x2 n2 f2 F2↓= F1↓+f2 F2↑=F3↑+f2
f
i =1
i = 1 sau 100
Observații:
- În mod similar distribuțiilor de frecvențe, pentru a înțelege repartizarea efectivelor pe
valori ale unei variabile, se recomandă folosirea frecvențelor relative. Pentru exemplul
anterior, prezentarea frecvențelor absolute și relative cumulate este realizat
realiza ă astfel :
Tabelul 2.15.
2.15 Distribuția familiilor după numărul
rul de membri
Număr membri (xi) Număr
ăr familii (ni) Ponderea familiilor (fi) Ni↓ Ni↑ Fi↓ Fi↑
2 4 14,3 4 28 14,3 100
3 11 39,3 15 24 53,6 85,7
4 10 35,7 25 13 89,3 46,4
5 2 7,1 27 3 96,4 10,7
6 1 3,6 28 1 100,0 3,6
TOTAL n=28 100 - - - -
Rezultatele din tabelul de mai sus arată că 15 familii (N2↓), care reprezintă 53,6% din
numărul total de familii (F2↓), au cel mult 3 membri. În același timp, 13 familii (N3↑), care
reprezintă 46,4% din numărul total de familii (F3↑), au cel puțin 4 membri.
21
b. Indicatori ai statististicii descriptive
Analiza unei variabile cantitative discrete poate fi realizată prin calculul unor indicatori
statistici sintetici, care pot fi grupați în indicatori ai tendinței centrale (mărimi medii),
indicatori ai dispersiei și indicatori ai formei (asimetriei și boltirii).
Mediile sunt acele valori în jurul cărora se repartizează efectivele unui eșantion. Cele
mai importante mărimi medii sunt media ( x ), modul (Mo) și mediana (Me).
b.1.1. Media
Cel mai cunoscut indicator al tendinței centrale este reprezentat de media aritmetică a
unei variabile ( x ).
10 12 15 20 15
23 28 18 19 10
Să se calculeze media.
Rezolvare
xi 10 + 12 + 15 + ... + 10
Media variabilei este x = i
= = 17 sute lei.
n 10
Interpretare: Salariul mediu lunar înregistrat de angajații firmei este de 17 sute lei.
22
În cazul unor date prezentate într-o distribuție de frecvență, media se calculează ca o
medie ponderată, după relația :
xi ⋅ ni xi ⋅ ni
x= i
= i
ni n
i
Exemplul 2.7. Media ponderată a unei variabile cantitative discrete folosind frecvenţe
absolute
Distribuția unor familii din municipiul Iaşi după numărul de membri se prezintă astfel :
Rezolvare
Pentru aflarea mediei, trebuie parcurse următoarele etape :
- se calculează produsele xi ⋅ ni . Aceste produse sunt prezentate în tabelul de mai jos :
23
- se calculează suma acestor produse: xi ⋅ ni =8+33+40+10+6=97;
i
Exemplul 2.8. Media ponderată a unei variabile cantitative discrete folosind frecvenţe
relative
Managerul unei firme înregistrează vechimea în muncă pentru angajații săi și obține
următoarele rezultate :
Rezolvare
Pentru aflarea mediei folosind frecvenţele relative, trebuie parcurse următoarele etape :
ni
- se calculează produsele xi ⋅ f i , cu f i = . Aceste produse sunt prezentate în
ni
i
24
Tabelul 2.19. Calculul produselor xi ⋅ f i
Interpretare: Vechimea medie în muncă pentru angajații firmei este de e 3,46 ~ 3 ani.
Observație: Media este sensibilă la prezența valorilor extreme (outliers). Valorile extreme
sunt valori diferite (foarte mari sau foarte mici) față de ansamblul tuturor celorlalte valori. Dat
fiind modul de calcul al mediei, aceste valori pot influența în mod semnificativ media.
25
b.1.2. Modul
A doua mărime medie prin care poate fi apreciată tendința centrală este modul (Mo).
DEFINIȚIE Modul este acea valoare a variabilei cel mai frecvent observată într-o
distribuție.
Rezolvare
Pentru aflarea modului, se parcurg următoarele etape:
- se află frecvența de apariție a fiecărei valori: valoarea xi=3 apare de 2 ori în șirul de
date, deci frecvența de apariție este ni=2. Pentru toate celelalte valori, frecvența de
apariție este egală cu unu.
- valoarea care corespunde frecvenței celei mai mari, adică xi=3, este modul. Deci,
Mo=3 zile.
Interpretare: Cei mai mulți salariați din eșantionul observat au lipsit 3 zile de la locul de
muncă.
26
Rezolvare
Se observă că valorile 3 și 4 apar fiecare de 2 ori în șirul de date, aceasta fiind frecvența
de apariție cea mai mare. Seria dată are deci 2 valori modale: x1=3 și x2=4.
Interpretare: Cele mai multe persoane din eșantionul observat alocă pentru studiu 3 și 4 ore
în fiecare zi.
Să se afle modul.
Rezolvare
Frecvența cea mai mare pentru distribuția dată este ni=11. În dreptul acestei valori, se
citește valoarea xi corespunzătoare, respectiv xi=3, iar această valoare este modul. Deci,
Mo=3 membri.
Interpretare: Cele mai multe familii din eșantionul observat au câte 3 membri.
27
Tabelul 2.21. Distribuția angajaților unei firme după vechimea în muncă
Vechime în muncă (ani) Ponderea angajaților (%)
1 15
2 10
3 29
4 16
5 20
6 10
TOTAL 100
Să se afle modul.
Rezolvare
Frecvența cea mai mare pentru distribuția dată este fi=29%. În dreptul acestei valori se
citește valoarea modului : Mo=3 ani.
b.1.3. Mediana
Cea de-a treia mărime medie prin care poate fi apreciată tendința centrală este mediana
(Me).
DEFINIȚIE Mediana este valoarea unei variabile care împarte efectivele unui eșantion
în 2 părți: 50% din efective au valori mai mici sau egale decât mediana, iar
50% au valori mai mari sau egale decât mediana. Mediana corespunde
n +1
locului unității medianei dintr-un set de date, și anume: U Me = .
2
Pentru aflarea medianei, șirul de date se ordonează în sens crescător. După aceasta, în
funcție de tipul seriei mediana se află astfel:
- dacă seria are un număr impar de termeni, mediana este termenul central al seriei;
- dacă seria are un număr par de termeni, mediana este media aritmetică a celor 2
termeni centrali ai seriei;
28
- dacă seria este prezentată sub forma unei distribuții de frecvențe, atunci mediana este
valoarea xi care se citește în dreptul primei valori N i ↓≥ U Me .
Rezolvare
Pentru aflarea medianei, se parcurg următoarele etape:
- se ordonează seria în sens crescător: 1, 2, 3, 4, 5.
- mediana este termenul central al acestei serii ordonate crescător, și anume: Me=3.
5 +1
- mediana corespunde astfel locului unității mediane, U Me = = 3 , adică este a treia
2
valoare a șirului de date ordonat crescător: 1, 2, 3, 4, 5.
Interpretare: 50% dintre salariații din eșantionul observat au lipsit cel mult 3 zile de la locul
de muncă, iar 50% au lipsit cel puțin 3 zile.
Rezolvare
Pentru aflarea medianei, se parcurg următoarele etape:
- se ordonează seria în sens crescător: 4, 5, 5, 6, 7, 8.
- mediana este media celor 2 termeni centrali al acestei serii ordonate crescător, și
5+6
anume: Me = = 5,5 euro/oră.
2
6 +1
- mediana corespunde astfel locului unității mediane, U Me = = 3,5 , adică este între
2
a treia și a patra valoare a șirului de date ordonat crescător: 4, 5, 5, 6, 7, 8.
Interpretare: 50% dintre salariații din eșantionul observat au un salariu de cel mult 5,5
euro/oră, iar 50% au cel puțin 5,5 euro/oră.
29
Exemplul 2.16. Mediana pentru o distribuție de frecvență
Distribuția unor familii după numărul de membri se prezintă astfel :
Rezolvare
Pentru aflarea medianei, trebuie parcurse următoarele etape:
28 + 1
- se calculează unitatea mediană: U Me = = 14,5 ;
2
- se calculează frecvențele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Interpretare: 50% dintre familiile din eșantionul observat au cel mult 3 membri, iar 50% au
cel puțin 3 membri.
30
Observație: Mediana este o mărime medie care nu este influențată de valorile extreme (este o
mărime medie „stabilă” față de influența unor valori extreme).
Pentru această serie de date, media este x = 1023 mii lei, iar mediana este Me=30 mii
lei. Se observă astfel că mediana nu este influențată de valoarea extremă, x5=5000. În această
situație, se recomandă folosirea medianei ca indicator al tendinței centrale, în locul mediei.
Cele 3 mărimi medii, media, modul și mediana, au de cele mai multe ori valori diferite
pentru aceeași distribuție. Analiza lor comparativă permite cunoașterea eșantionului observat
și aprecierea omogenităţii sale.
De exemplu, analiza PIB real al țărilor din Uniunea Europeană înregistrat în anul 2013
(euro/locuitor) duce la obținerea următoarelor rezultate: x = 21292 euro/loc., Me=15750
euro/loc. Diferențele mari între nivelurile mediei și medianei evidențiază disparități
importante între țările UE din punctul de vedere al PIB/loc.
În general, cu cât diferențele dintre medie, mod și mediană sunt mai mari, cu atât
diferențele dintre unitățile statistice sunt mai mari, din punctul de vedere al variabilelor
înregistrate.
b.1.5. Quantile
Quantilele sunt valori ale variabilei care împart efectivele unui eșantion în mai multe
părți egale. Cele mai importante quantile sunt quartilele și decilele.
1. Quartilele
Quartilele sunt valori ale variabilei care împart efectivele din eșantion în 4 părți egale. O
distribuție are 3 quartile:
31
- Quartila una (Q1) este valoarea pentru care 25% dintre unităţi înregistrează valori mai
mici decât Q1 și 75% înregistrează valori mai mari decât Q1. Quartila unu corespunde
n +1
locului unității quartilice unu calculate astfel: U Q1 = .
4
- Quartila doi (Q2) este mediana și arată valoarea pentru care 50% din efective
înregistrează valori mai mici decât mediana și 50% înregistrează valori mai mari decât
mediana.
- Quartila trei (Q3) este valoarea pentru care 75% dintre unităţi înregistrează valori mai
mici decât Q3 și 25% înregistrează valori mai mari decât Q3. Quartila trei corespunde
3(n + 1)
locului unității quartilice trei calculate astfel: U Q3 = .
4
Rezolvare
Quartila unu
Pentru aflarea quartilei unu, se parcurg următoarele etape:
- se ordonează seria în sens crescător: 1, 2, 3, 4, 5.
5 +1
- quartila unu corespunde locului unității quartilice unu, U Q1 = = 1,5 , adică este
4
între prima și a treia valoare a șirului de date ordonat crescător: 1, 2, 3, 4, 5. Quartila
1+ 2
unu este deci media primilor 2 termeni ai seriei : Q1 = = 1,5 .
2
Interpretare: 25% dintre salariații din eșantionul observat au lipsit cel mult 1,5~2 zile de la
locul de muncă, iar 75% au lipsit cel puțin 1,5~2 zile.
Quartila doi
2(n + 1) n + 1
Quartila doi este mediana, întrucât U Q2 = = = U Me . Quartila doi este deci
4 2
Q2=3.
Interpretare: 50% dintre salariații din eșantionul observat au lipsit cel mult 3 zile de la locul
de muncă, iar 50% au lipsit cel puțin 3 zile.
32
Quartila trei
3 ⋅ (5 + 1)
Quartila trei corespunde locului unității quartilice trei, U Q3 = = 4,5 , adică este
4
între a patra și a cincea valoare a șirului de date ordonat crescător: 1, 2, 3, 4, 5. Quartila trei
4+5
este deci media ultimilor 2 termeni ai seriei : Q3 = = 4,5 .
2
Interpretare: 75% dintre salariații din eșantionul observat au lipsit cel mult 4,5~5 zile de la
locul de muncă, iar 25% au lipsit cel puțin 4,5~5 zile.
Rezolvare
Quartila unu
Pentru aflarea quartilei unu, trebuie parcurse următoarele etape:
28 + 1
- se calculează unitatea quartilică unu: U Q1 = = 7,25 ;
4
- se calculează frecvențele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
33
Tabelul 2.25. Distribuția familiilor dintr-un bloc după numărul de membri
Număr membri (xi) Număr familii (ni) Ni↓
2 4 4
3 11 15
4 10 25
5 2 27
6 1 28
TOTAL n=28 -
Interpretare: 25% dintre familiile din eșantionul observat au cel mult 3 membri, iar 75% au
cel puțin 3 membri. În acest caz, quartila unu coincide cu mediana.
Quartila trei
Pentru aflarea quartilei trei, se calculează unitatea quartilică trei:
3(28 + 1)
U Q3 = = 21,75 . Se observă că prima valoare N i ↓≥ U Q3 este
4
( N i ↓= 25) ≥ (U Q3 = 21,75) . În dreptul acestei valori se citește quartila trei: Q3=4.
Interpretare: 75% dintre familiile din eșantionul observat au cel mult 4 membri, iar 25% au
cel puțin 4 membri.
2. Decilele
Decilele sunt valori ale variabilei care împart efectivele din eșantion în 10 părți egale. O
distribuție are 9 decile. Cele mai importante decile sunt decila unu și decila nouă.
- Decila unu (D1) este valoarea pentru care 10% dintre efective înregistrează valori mai
mici decât D1 și 90% înregistrează valori mai mari decât D1. Decila unu corespunde
n +1
locului unității decilice unu, calculate astfel: U D1 = .
10
- Decila nouă (D9) este valoarea pentru care 90% dintre efective înregistrează valori mai
mici decât D9 și 10% înregistrează valori mai mari decât D9. Decila nouă corespunde
9(n + 1)
locului unității decilice nouă, calculate astfel: U D9 = .
10
34
Exemplul 2.20. Decilele pentru o distribuție de frecvență
Distribuția unor familii după numărul de membri se prezintă astfel :
Rezolvare
Decila unu
Pentru aflarea decilei unu, trebuie parcurse următoarele etape:
28 + 1
- se calculează unitatea decilică unu: U D1 = = 2,9 ;
10
- se află prima valoare N i ↓≥ U D1 este ( Ni ↓= 4) ≥ (U D1 = 2,9) . În dreptul acestei valori
se citește decila unu: D1=2.
Interpretare: 10% dintre familiile din eșantionul observat au cel mult 2 membri, iar 90% au
cel puțin 2 membri.
Decila nouă
9(28 + 1)
Pentru aflarea decilei nouă, se calculează unitatea decilică nouă: U D9 = = 26,1 .
10
Se observă că prima valoare N i ↓≥ U Q3 este ( N i ↓= 27) ≥ (U D9 = 26,1) . În dreptul acestei
valori se citește decila nouă: D9=5.
Interpretare: 90% dintre familiile din eșantionul observat au cel mult 5 membri, iar 10% au
cel puțin 5 membri.
35
b.2. Indicatori ai dispersiei (variației)
Dispersia măsoară variația valorilor unei variabile în jurul tendinței centrale. Aprecierea
dispersiei este importantă într-o analiză statistică întrucât mai multe distribuții pot avea
aceleași mărimi medii, dar pot să difere din punctul de vedere al variației valorilor variabilei.
De exemplu, să considerăm următoarele serii de date:
Seria 1: 4, 4, 4, 4, 4
Seria 2: 2, 3, 4, 4, 7
Seria 3: 1, 2, 4, 4, 9
Toate aceste serii de date au media, mediana și modul egale cu 4, însă cele 3 serii de
date diferă din punctul de vedere al variației celor 5 valori: seria 3 se caracterizează printr-o
variație mai mare a celor 5 valori față de tendința centrală, măsurată prin medie, mod sau
mediană.
( xi − x ) 2
- Se calculează media acestor diferenţe (variații): s = 2 i
.
n
Observație: În cazul unei distribuții de frecvență, pătratele diferențelor valorilor unei variabile
față de nivelul mediu trebuie înmulțite cu frecvența de apariție (absolută sau relativă) a
fiecărei valori xi.
Relațiile de calcul ale varianței sunt:
( xi − x ) 2 ⋅ ni
- folosind frecvențe absolute: s = 2 i
n
ni
- folosind frecvențe relative: s 2 = ( xi − x ) 2 ⋅ f i , cu f i = .
i n
Se poate demonstra că varianța poate fi calculată și ca diferență între media pătratelor
valorilor xi și pătratul mediei. Relațiile de calcul în acest caz sunt:
xi2 ⋅ ni xi ⋅ ni
2
Exemplu 2.21. Măsurarea variației valorilor unei variabile față de nivelul mediu
Să considerăm seria 3 de date prezentată mai sus, compusă din valorile: 1, 2, 4, 4, 9.
1+ 2 + 4 + 4 + 9
Media acestor valori este: x = = 4.
5
37
Pentru a afla variația fiecărei valori a acestei serii de date față de media lor, se
calculează diferențele : xi − x . Pentru prima valoare, obținem astfel : ( x1 − x ) = (1 − 4) = −3 .
Aceste diferențe sunt prezentate în coloana a doua a tabelului de mai jos :
1 -3
2 -2
4 0
4 0
9 5
Pentru a măsura variația tuturor valorilor față de medie, putem calcula suma acestor
variații : ( x − x ).
i
i Această sumă este însă întotdeauna egală cu zero. Pentru a obține o
38
Tabelul 2.28. Calculul pătratelor diferenţelor valorilor seriei faţă de nivelul mediu
Valori ale variabilei (xi) Diferențe față de medie ( xi − x ) Pătrate ale diferențelor ( xi − x )
2
1 -3 9
2 -2 4
4 0 0
4 0 0
9 5 25
TOTAL 0 38
În exemplul dat, suma pătratelor diferențelor valorilor xi față de media lor este egală cu
38: ( xi − x ) = 38.
2
Pentru a calcula media acestor pătrate, se împarte această sumă la numărul de observații
( xi − x ) 2 38
și se obține indicatorul dispersiei, varianța: s = 2 i
= = 7,6 .
n 5
Această valoare arată variația pătratelor valorilor unei variabile față de media lor. Pentru
a exprima aceste variații în aceeași unitate de măsură cu a variabilei, se calculează rădăcina
( xi − x ) 2 38
acestei valori, respectiv s = i
= = 2,76 . Acest indicator este abaterea
n 5
(deviația) standard.
39
Pentru această distribuție, media a fost calculată și este egală cu 3,464.
Pentru calculul varianței, se parcurg următoarele etape:
- Se calculează diferențele valorilor xi față de nivelul mediu: xi − x . Aceste diferențe
( xi − x ) 2 ⋅ ni 147,652
- Se calculează varianța: s = 2 i
= = 5,27 .
n 28
Exemplu 2.23. Calculul varianței pentru o distribuție de frecvență, folosind frecvențe relative
40
Tabelul 2.31. Calculul varianţei folosind frecvenţele relative
Număr Ponderea Diferențe Pătrate ale diferențelor Ponderarea pătratelor
membri (xi) familiilor (fi) ( xi − x ) ( xi − x )2 diferenţelor cu
frecvențele relative
( xi − x ) 2 ⋅ fi
2 0.143 -1.464 2.143 0.306
3 0.393 -0.464 0.215 0.085
4 0.357 -3.464 11.999 4.284
5 0.071 1.536 2.359 0.168
6 0.036 -3.464 11.999 0.432
TOTAL 1 - - 5,274
Observație: Întrucât pentru aflarea varianței s-au ridicat la pătrat diferențele
−
̅ , pentru a
acorda o importanță mai mare abaterilor de la medie, varianța nu se interpretează și nu are
unitate de măsură.
2. Abaterea standard
Abaterea standard arată variația medie a valorilor unei variabile față de nivelul mediu
(arată cât de mult se „îndepărtează” valorile unei variabile de la media lor).
Interpretare: Abaterea standard arată că valorile șirului de date prezentat variază, în medie,
de la media lor cu 2,76 (în sens pozitiv și negativ).
41
Seria 1: 2, 3, 4, 4, 7
Seria 2: 1, 2, 4, 4, 9
Seria 1 Seria 2
x1 = 4 x2 = 4
s1 = 1,67 s2 = 2,76
Pentru a aprecia reprezentativitatea mediei pentru fiecare din aceste serii de date, se
compară abaterea standard față de media seriei respective. În acest sens, se poate calcula un
coeficient de variație care măsoară în procente cât de mare este dispersia valorilor xi față de
media lor.
s2 2,76
Seria 2: v2 = ⋅100 = ⋅100 = 69%
x2 4
Interpretare: Valori ridicate ale coeficientului de variație (mai mari de 50%) arată că o
distribuție se caracterizează printr-o dispersie mare a valorilor xi față de media lor. Aceasta
este deci o distribuție eterogenă, iar media nu este reprezentativă pentru seria valorilor date.
42
În exemplul dat, seria 2 se caracterizează printr-o dispersie mare a celor 5 valori față de
media lor (v2>50%), ceea ce arată că media calculată ( x = 4) nu este reprezentativă pentru
această serie.
Observație: Aprecierea variației valorilor unei variabile este importantă în analiza seriilor de
date financiare. Variabilitatea randamentelor unui activ financiar este cunoscută în finanțe sub
denumirea de volatilitate, iar studiul volatilității este important în analizele de risc financiar.
Cu cât volatilitatea unui activ financiar este mai mare, cu atât riscul investitorului este mai
mare. Măsurarea volatilității se poate realiza prin calculul abaterii standard a randamentelor
activelor financiare.
Măsurarea dispersiei valorilor xi ale unei variabile față de mediana lor se realizează prin
calculul amplitudinii intervalului interquartilic.
Amplitudinea intervalului interquartilic (IQ) măsoară dispersia celor 50% dintre valorile
centrale ale unei distribuții.
Interpretare: Amplitudinea intervalului interquartilic arată că, pentru 50% dintre familii,
diferenţa maximă de membri ai familiei între oricare două familii este de un membru.
Forma unei distribuții poate fi apreciată prin măsurarea asimetriei și boltirii distribuției.
43
b.3.1. Indicatori ai asimetriei
( xi − x ) 3
- µ3 = i
și reprezintă momentul centrat de ordinul 3 ;
n
- s3 este abaterea standard la puterea a treia.
Boltirea unei distribuții poate fi măsurată prin coeficientul de boltire Fisher (kurtosis).
Acest coeficient se calculează astfel:
µ4
k= −3
s4
unde:
( xi − x )4
- µ4 = i
și reprezintă momentul centrat de ordinul 4.
n
44
În funcție de gradul de boltire al unei distribuții, putem distinge:
- distribuții simetrice (mezocurtice), pentru care k=0;
- distribuții leptocurtice, pentru care k>0;
- distribuții platicurtice (aplatizate), pentru care k<0.
Boltirea poate fi apreciată pe cale grafică prin reprezentarea curbei frecvenţelor. Alura
curbei frecvenţelor în cazul unei distribuţii normale (mezocurtice) sau care prezintă un
accentuat fenomen de boltire este reprezentată în figura de mai jos:
Observație: Aprecierea boltirii unui distribuții este importantă în analiza seriilor de date
financiare. O distribuție leptocurtică (fat tails) este o distribuție care arată că valorile extreme
(mari sau mici) sunt mai „frecvente” față de o distribuție „normală”.
c. Reprezentare grafică
După cum am precizat, o reprezentare sintetică a unei variabile se poate realiza prin
gruparea valorilor unei variabile într-o distribuție de frecvență, prin calculul indicatorilor
statisticii descriptive sau prin reprezentarea grafică.
Reprezentarea grafică a unei distribuții după o variabilă cantitativă discretă se poate
realiza folosind poligonul frecvențelor, curba frecvențelor, histograma și diagrama box-plot.
45
c.1. Poligonul frecvenţelor
Rezolvare
Pentru construirea poligonului și curbei frecvențelor, pe axa absciselor reprezentăm
numărul de membri pe familii (variabila X), iar pe axa ordonatelor reprezentăm numărul
familiilor (ni). Reprezentarea grafică a distribuției date este realizată în figura de mai jos.
47
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7
c.3. Histograma
Rezolvare
Pentru construirea histogramei, pe axa absciselor reprezentăm numărul de membri pe
familii, iar pe axa ordonatelor reprezentăm numărul familiilor (ni), respectiv ponderea
acestora (fi). Graficele obținute sunt de forma:
Se observă că forma distribuției este aceeași folosind frecvențe absolute sau relative. Se
recomandă reprezentarea histogramei folosind frecvențele relative atunci când se compară
mai multe distribuții de frecvență.
Forma generală a unei diagrame “box-plot” este reprezentată în figura de mai jos:
49
Figura 2.7. Diagrama box-plot
Nota 1 Nota
Figura 2.8. Reprezentarea grafică a simetriei unei distribuții folosind diagrama box-plot
50
Observație: Diagrama “box-plot” permite identificarea punctelor extreme (outliers). Pentru
[ ]
aceasta, se definesc intervalele: Q1 − 1,5 ⋅ I Q ; Q3 + 1,5 ⋅ I Q . Valorile situate în afara acestui
c.4.2. Folosirea diagramei “box-plot” pentru analiza comparativă a mai multor distribuții
Figura 2.9. Distribuția regiunilor României în funcție de câștigul salarial nominal mediu net lunar
O prezentare sintetică a valorilor unei variabile statistice continue poate fi realizată prin
structurarea datelor într-o serie (distribuție) statistică pe intervale de variație, prin calculul
indicatorilor statisticii descriptive și prin reprezentarea grafică a seriei.
49, 52, 68, 38, 42, 44, 45, 48, 58, 61, 20, 49, 53, 54,
48, 22, 30, 32, 53, 41, 42, 55, 57, 45, 47, 57, 64, 32
Rezolvare
Etapele pentru construirea distribuţiei de frecvenţe în cazul grupării valorilor variabilei
pe intervale egale de variaţie sunt:
52
1. Se stabileşte numărul de intervale de variaţie dorit pentru gruparea valorilor
variabilei. În cazul nostru, vom grupa valorile în k=5 intervale de variaţie de tipul (xi-1,xi+1), cu
xi-1 limita inferioară a intervalului şi xi+1 limita superioară a intervalului.
2. Se calculează mărimea intervalelor de variație (l) în care se grupează datele.
xmax − xmin 68 − 20
l= = = 9,6 ≈ 10.
k 5
Vom grupa valorile variabilei în 5 egale de variaţie, cu o lungime de 10 unităţi.
3. Construirea distribuției de frecvență presupune numărarea observațiilor care apar în
fiecare interval de variație. Intervalele de variaţie pot fi închise, deschise sau semi-închise.
Am optat, pentru acest exemplu, pentru varianta semi-închisă a intervalului de forma [xi-
1,xi+1).
Tabelul 2.33. Distribuția firmelor după numărul de angajaţi, cu valorile grupate pe cinci intervale
egale de variaţie
Număr angajaţi Număr firme
[xi-1,xi+1) (ni)
20-30 2
30-40 4
40-50 11
50-60 8
60-70 3
TOTAL 28
Observații
- Numărul intervalelor de variație (k) trebuie să fie ales astfel încât să realizeze o
grupare sintetică a datelor, dar să evidențieze și caracteristicile datelor. În funcție de
numărul observațiilor și de obiectivul grupării, numărul intervalelor de variație poate
varia între 5 și 20 de intervale;
- O unitate statistică trebuie să aparțină unui singur interval de variație.
53
b. Indicatori ai statisticii descriptive
Rezolvare
Pentru distribuţia firmelor după numărul de angajaţi, cu valorile grupate pe cinci
intervale de variaţie, am prezentat, în Tabelul 2.34, elementele de calcul necesare pentru
aflarea mediei şi abaterii standard.
Tabelul 2.34. Calculul mediei şi a abaterii standard în cazul unei serii cu valori grupate pe intervale
egale de variaţie
Număr Număr Mijlocul Produsele Diferențele Pătratele Ponderarea
angajaţi firme intervalului xi' ⋅ ni ( xi' − x ) diferențelor pătratelor
[xi-1,xi+1) (ni) de variaţie ( xi' − x ) 2 diferenţelor cu
(x )
'
i
frecvențele
absolute
( xi' − x ) 2 ⋅ ni
20-30 2 25 50 -22,14 490,1796 980,3592
30-40 4 35 140 -12,14 147,3796 589,5184
40-50 11 45 495 -2,14 4,5796 50,3756
50-60 8 55 440 7,86 61,7796 494,2368
60-70 3 65 195 1,.86 318,9796 956,9388
TOTAL n=28 - 1320 - - 3071,429
xi' ni 1320
x= i
= = 47.14 ≈ 47 angajaţi.
ni 28
i
54
Interpretare: În medie, o firmă are 47 de angajaţi.
(xi' − x ) ni
2
3071.429
s= i
= = 10.47 ≈ 10 angajaţi.
ni 28
i
c. Reprezentare grafică
55
Rezolvare
Distribuția frecvențelor absolute presupune numărarea persoanelor pentru fiecare gen în
parte (masculin și feminin), respectiv aflarea frecvențelor de apariție a fiecărei categorii. În
tabelul de date, în prima coloană se trec cele 2 categorii (masculin și feminin), iar în a doua
coloană se trec aceste frecvențe. Tabelul de date obținut se prezintă astfel :
Interpretare: Din cele 10 persoane înregistrate, 4 persoane sunt de genul masculin, iar 6 sunt
persoane de genul feminin.
Feminin 60 f2 =
6
⋅ 100
10
TOTAL 100
Interpretare: Din cele 10 persoane înregistrate, 40% sunt persoane sunt de genul masculin, iar
60% sunt persoane de genul feminin.
56
Universitar, Universitar, Post-universitar, Liceal, Post-universitar, Post-
universitar, Post-universitar, Universitar, Universitar, Universitar, Liceal, Liceal,
Liceal, Liceal, Universitar, Universitar, Universitar, Liceal, Doctorat, Doctorat.
Rezolvare
Distribuția frecvențelor absolute presupune numărarea persoanelor pentru fiecare nivel
de studii absolvite (studii liceale, studii universitare, studii post-universitare și doctorat) și
gruparea acestor rezultate într-un tabel de forma :
Tabelul 2.38. Distribuția persoanelor după nivelul de studii absolvite, folosind frecvenţe relative
Nivel studii (xi) Pondere persoane (fi)
Studii liceale 30 f1 =
6
⋅ 100
20
Studii universitare 40 f2 =
14
⋅ 100
20
Studii post-universitare 20 f3 =
18
⋅ 100
20
Doctorat 10 f4 =
10
⋅ 100
20
TOTAL 100
57
Interpretare: Din cele 20 persoane înregistrate, 30% au absolvit studii liceale, 40% au
absolvit studii universitare, 20% au studii post-universitare și 10% au doctorat.
b. Reprezentare grafică
Rezolvare
Reprezentarea grafică a distribuției frecvențelor absolute și relative se poate realiza
folosind diagramele Pie Chart sau Bar Chart.
58
Figura 2.11. Distribuția persoanelor după nivelul de studii absolvite
Pentru o variabilă calitativă nominală se poate afla modul, iar pentru o variabilă
calitativă ordinală se pot afla modul, mediana și quartilele.
Rezolvare
Distribuția persoanelor după gen se prezintă astfel:
Aflarea modului presupune identificarea categoriei care corespunde frecvenței celei mai
mari. Frecvența absolută cea mai mare este 6, iar frecvența relativă cea mai mare este 60%.
Categoria asociată acesteia este genul « feminin ». Modul este reprezentat de această categorie
(feminin).
59
Interpretare: În eșantionul observat, cele mai multe persoane (6 persoane sau 60%) sunt de
genul feminin.
Rezolvare
Mediana
Pentru aflarea medianei, se parcurg etapele prezentate pentru o variabilă cantitativă
discretă, și anume:
20 + 1
- se calculează unitatea mediană: U Me = = 10,5 ;
2
- se calculează frecvențele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Interpretare: 50% din numărul total de persoane au cel mult studiile universitare absolvite.
Quartila 3
Pentru aflarea quartilei 3, se parcurg etapele prezentate pentru o variabilă cantitativă
discretă, și anume:
3(20 + 1)
- se calculează unitatea mediană: U Me = = 15,75 ;
4
60
- se află prima valoare N i ↓≥ U Me , și anume : ( N i ↓= 17) ≥ (U Me = 15,75) . În dreptul
acestei valori se citește mediana : Me este reprezentată de categoria Studii post-
universitare.
Interpretare: 75% din numărul total de persoane au cel mult studiile post-universitare
absolvite.
61
US 3. ANALIZA UNEI SERII STATISTICE BIVARIATE
Cuprins
Rezumat
În acest capitol sunt prezentate metodele de analiză statistică bivariată a datelor. Analiza
bivariată a datelor presupune analiza unor unități statistice după variația simultană a două
variabile. Pentru realizarea acestei analize, este necesară gruparea acestora într-un tabel cu
dubă intrare și calculul frecvențelor absolute și relative marginale, parțiale și condiționate.
Analiza statistică descriptivă a unui tabel cu dublă intrare (a unei distribuții bivariate) se poate
realiza prin calculul mediilor și varianțelor de grupă, a mediei și varianței pe total eșantion (în
cazul în care o variabilă dintre cele două este cantitativă).
Bibliografie
62
US 3. ANALIZA UNEI SERII STATISTICE BIVARIATE
Analiza bivariată presupune analiza statistică a distribuției unor efective după variația
valorilor a două variabile în mod simultan.
Tabelul de date care prezintă aceste valori poartă denumirea de tabel cu dublă intrare.
Distribuția obținută este o distribuție bivariată definită de :
- variabila X : ( xi ), cu i=1,m;
- variabila Y : ( y j ), cu j=1,p;
63
Să se formeze distribuția de frecvență.
Rezolvare
Pentru aceasta, se consideră variabilele:
X : Salariul, cu xi, i=1,6 (valorile 10, 12, 19,22,25,27);
Y : Nivelul de studii, cu yj, j=1,3 (valorile Liceale, Universitare, Post-universitare)
Formarea distribuției bivariate presupune parcurgerea următoarelor etape:
- se ordonează în sens crescător valorile variabilei X și se trec în prima coloană a unui
tabel;
- se ordonează categoriile variabilei Y;
- se numără persoanele care au un anumit nivel de studii și un anumit salariu. De
exemplu, numărul de persoane care au studii liceale și obțin un salariu lunar de 12 sute
lei este egal cu 2.
Rezultatele centralizate pentru toate valorile celor 2 variabile se prezintă astfel :
Interpretare: O persoană are studii liceale și un salariu lunar de 10 sute lei, 2 persoane cu
studii liceale au un salariu de 12 sute lei etc.
Variabilele X și Y pot fi diferite din punctul de vedere al naturii lor și putem întâlni
următoarele situații:
- o variabilă cantitativă (discretă sau continuă) și o variabilă calitativă.
- ambele variabile cantitative, discrete și/sau continue;
- ambele variabile calitative, nominale și/sau ordinale;
64
Vom prezenta în continuare modul de analiză statistică pentru o variabilă cantitativă și o
variabilă calitativă.
frecvențelor absolute nij după variația simultană a valorilor xi și yj. În cazul variabilelor
cantitative continue (grupate pe intervale de variație ( xi−1 − xi ) ) se consideră ca valori ale
xi −1 + xi
variabilei X centrul intervalelor de variabile, respectiv valorile xi' = .
2
În cele ce urmează, vom prezenta doar cazul variabilelor cantitative discrete. Pentru o
distribuție bivariată, se pot afla frecvențe absolute și relative, marginale, parțiale și
condiționate.
de unități pe valori yj ale variabilei Y. Se află adunând unitățile totale care înregistrează
valoarea yj, astfel: n• j = nij .
i
65
Tabelul 3.2. Distribuția unui eșantion de persoane după salariul lunar obținut, pe nivele de studii
Salariu/Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
Rezolvare
Frecvențele absolute marginale pentru variabila X ( ni• )
Frecvențele absolute marginale pentru variabila X: Salariu se află adunând numărul de
persoane pentru fiecare valoare a salariului, după cum urmează:
- Salariul lunar x1=10 sute lei este obținut de (1+0+0) persoane, deci n1• = 1 + 0 + 0 = 1
persoană;
- Salariul lunar x2=12 sute lei este obținut de (2+0+0) persoane, deci n2• = 2 + 0 + 0 = 2
persoane;
- ș.a.m.d.
Interpretare: Din numărul total de persoane din eșantion, o persoană are un salariu lunar de
10 sute lei, 2 persoane au 12 sute lei etc.
66
Interpretare: Din numărul total de persoane din eșantion, 3 persoane au studii liceale, 4
persoane au studii universitare și 3 persoane au studii post-universitare.
Frecvențele absolute parțiale sunt efectivele nij care înregistrează în mod simultan
valorile xi pentru variabila X și yj pentru variabila Y.
Tabelul 3.3. Distribuția unui eșantion de persoane după salariul lunar obținut, pe nivele de studii
Salariu/Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
Rezolvare
Frecvența absolută parțială n32 este reprezentată de numărul de persoane care au un
salariu lunar egal cu x3=19 sute lei și au un nivel de studii universitare (y2). Această frecvență
este n32=2.
Interpretare: Din numărul total de persoane din eșantion, 2 persoane au un salariu de 19 sute
lei și au studiile universitare absolvite.
67
c. Frecvențe absolute condiționate
Rezolvare
Frecvențele absolute condiționate de nivelul X=x2
Nivelul de salariu corespunzător valorii x2 este 12 sute lei. Pentru această valoare,
frecvențele absolute condiționate sunt: 2, 0, 0.
Interpretare: Din numărul total de persoane care au un salariu lunar de 12 sute lei, 2 persoane
au studii liceale și nicio persoană nu are studii universitare sau post-universitare.
Interpretare: Din numărul total de persoane care au studii post-universitare, nicio persoană nu
are un salariu lunar de 10, 12, 19 sau 22 sute lei, o persoană are 25 sute lei și 2 persoane au 27
sute lei.
68
3.2.2. Frecvențe relative marginale, parțiale și condiționate
a. Frecvențe relative marginale
Tabelul 3.4. Distribuția unui eșantion de persoane după salariul lunar obținut, pe nivele de studii
Salariu/Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
Rezolvare
Frecvențele relative marginale pentru variabila X ( f i• )
Frecvențele relative marginale pentru variabila X: Salariu se află împărțind frecvența
absolută marginală (ni.) la numărul total de persoane din eșantion, după cum urmează:
- Salariul lunar x1=10 sute lei este obținut de 1 persoană din cele 10 persoane din
n1• 1
eșantion, deci f1• = = = 0,10 sau 10%;
n 10
69
- Salariul lunar x2=12 sute lei este obținut de 2 persoane dintr-un total de 10, deci
n2• 2
f1• = = = 0,20 sau 20%;
n 10
- ș.a.m.d.
Interpretare: Din numărul total de persoane din eșantion, 10% au un salariu lunar de 10 sute
lei, 20% au 12 sute lei etc.
Interpretare: Din numărul total de persoane din eșantion, 30% au studii liceale, 40% au studii
universitare și 30% au studii post-universitare.
Frecvențele relative parțiale reprezintă ponderea efectivelor nij care înregistrează în mod
simultan valorile xi pentru variabila X și yj pentru variabila Y. Se calculează după relația:
nij
f ij = .
n
70
Tabelul 3.5. Distribuția unui eșantion de persoane după salariul lunar obținut, pe nivele de studii
Salariu/Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
Rezolvare
Frecvența relativă parțială f32 este reprezentată de ponderea persoanelor care au un
salariu lunar egal cu x3=19 sute lei și au un nivel de studii universitare (y2). Această frecvență
n32 2
este f 32 = = = 0,20 sau 20%.
n 10
Interpretare: Din numărul total de persoane din eșantion, 20% au un salariu de 19 sute lei și
au studiile universitare absolvite.
71
Rezolvare
Frecvențele relative condiționate de nivelul X=x2
Nivelul de salariu corespunzător valorii x2 este 12 sute lei. Pentru această valoare,
frecvențele absolute condiționate sunt: 2, 0, 0. Numărul total de persoane cu salariul de 12
sute lei ( n 2• ) este deci 2+0+0=2 persoane.
Ponderea persoanelor care au un salariu de 12 sute lei pe diferite nivele de studii
absolvite este:
n1 j 2
- Pentru nivelul de studii liceale: f j /1 = = = 1 sau 100%;
n1• 2
n2 j 0
- Pentru nivelul de studii universitare: f j / 2 = = = 0;
n2• 2
n3 j 0
- Pentru nivelul de studii post-universitare: f j / 3 = = = 0.
n3• 2
Interpretare: Din numărul total de persoane care au un salariu lunar de 12 sute lei, toate
persoanele (100%) au studii liceale (nicio persoană nu are studii universitare sau post-
universitare).
ni 3 0
- Pentru salariul de 12 sute lei: f i / 3 = = = 0;
n•3 3
M
ni 3 1
- Pentru salariul de 25 sute lei: f i / 3 = = = 0,33 ;
n•3 3
ni 3 2
- Pentru salariul de 27 sute lei: f i / 3 = = = 0,67 .
n•3 3
72
Interpretare: Din numărul total de persoane care au studii post-universitare, nicio persoană nu
are un salariu lunar de 10, 12, 19 sau 22 sute lei, 33% au 25 sute lei și 67% au 27 sute lei.
a. Distribuția marginală în X
M M M
xi ni• f i•
M M M
xm nm• f m•
TOTAL n 1
Rezolvare
Pentru formarea distribuției marginale, se calculează frecvențele absolute și relative
marginale ni• , respectiv fi• .
Aceste valori sunt prezentate în ultimele coloane ale tabelelor de mai jos :
73
Tabelul 3.7. Distribuția frecvențelor absolute marginale în X
Salariu/ Nivel de studii Liceale Universitare Post-universitare TOTAL ( ni• )
10 1 0 0 1
12 2 0 0 2
19 0 2 0 2
22 0 2 0 2
25 0 0 1 1
27 0 0 2 2
TOTAL 10
Interpretare: Din numărul total de persoane, o persoană, care reprezintă 10% din numărul
total de persoane din eșantion, are un salariu lunar de 10 sute lei; 2 persoane, care reprezintă
20% din total, au un salariu de 12 sute lei etc.
74
b. Distribuția marginală în Y
y1 n•1 f •1
y2 n• 2 f •2
M M M
yi n• j f• j
M M M
yp n• p f• p
TOTAL n 1
Rezolvare
Pentru formarea distribuției marginale, se calculează frecvențele absolute și relative
marginale n• j , respectiv f • j . Aceste valori sunt prezentate în ultimele coloane ale tabelelor
de mai jos :
Tabelul 3.11. Distribuția frecvențelor absolute marginale în Y
Salariu/ Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
TOTAL ( n• j ) 3 4 3 10
75
Tabelul 3.12. Distribuția frecvențelor relative marginale în Y
Salariu/Nivel de studii Liceale Universitare Post-universitare
10 1 0 0
12 2 0 0
19 0 2 0
22 0 2 0
25 0 0 1
27 0 0 2
TOTAL ( f• j ) 0,30 0,40 0,30 1
Interpretare: Din numărul total de persoane, 3 persoane, care reprezintă 30% din numărul
total de persoane din eșantion, au studii liceale; 4 persoane, care reprezintă 40% din total, au
studii universitare și 3 persoane, care reprezintă 30% au studii post-universitare.
76
Exemplul 3.10. Distribuții condiționate în X și Y
Pentru distribuția prezentată în tabelul 3.1, să se formeze distribuția variabilei X
condiționată de nivelul Y=y3 și distribuția variabilei Y condiționată de nivelul X=x2 .
Rezolvare
Distribuția condiționată X/ Y=y3
Nivelul de studii corespunzător valorii y3 este nivelul post-universitar. Distribuția pe
nivele de salarii pentru persoanele cu studii post-universitare, folosind frecvențe absolute și
relative condiționate, se prezintă astfel:
Interpretare: Din numărul total de persoane care au studii post-universitare, nicio persoană nu
are un salariu lunar de 10, 12, 19 sau 22 sute lei; o persoană, care reprezintă 33% din numărul
total de persoane, are 25 sute lei și 2 persoan3, care reprezintă 67% din numărul total de
persoane are 67%, au 27 sute lei.
77
Interpretare: Din numărul total de persoane care au un salariu lunar de 12 sute lei, toate
persoanele (100%) au studii liceale (nicio persoană nu are studii universitare sau post-
universitare).
Analiza statistică descriptivă a unei distribuții bivariate după o variabilă cantitativă (X)
și o variabilă calitativă (Y) presupune, ca și în cazul analizei univariate, aprecierea tendinței
centrale (mediei variabilei X) și dispersiei valorilor variabilei X față de nivelul mediu. În
acest caz, însă, analiza descriptivă (calculul mediei și varianței variabilei X) se realizează pe
grupe (categorii) ale variabilei Y.
xi ⋅ ni•
x= i
= xi ⋅ f i• .
n i
78
Exemplul 3.11. Media pe total eșantion
Se consideră distribuția marginală prezentată în tabelul de mai jos:
10 1 0,10
12 2 0,20
19 2 0,20
22 2 0,20
25 1 0,10
27 2 0,20
Total 10 1
Rezolvare
Salariul mediu pe total eșantion se calculează astfel :
- folosind frecvențe absolute marginale :
x ⋅ni i•
10 ⋅ 1 + 12 ⋅ 2 + ... + 27 ⋅ 2
x= i
= = 19 ,50 sute lei
n 10
- folosind frecvențe absolute marginale :
x = xi ⋅ f i• = 10 ⋅ 0,10 + 12 ⋅ 0,20 + ... + 27 ⋅ 0,20 = 19,50 sute lei
i
Interpretare: Salariul mediu al persoanelor din eșantionul observat este de 19,5 sute lei.
Pentru o variabilă cantitativă, X, se pot calcula medii pentru fiecare categorie (grupă) a
variabilei Y. Mediile pe categorii ale variabilei Y se calculează astfel:
x ⋅n i ij
xj = i
, cu i=1, m și j=1, p.
n• j
79
x j ⋅ n• j
x= j
.
n
Exemplul 3.12. Medii condiționate (pe grupe)
Pentru distribuția din tabelul 3.1, să se calculeze salariile medii pentru persoanele cu
studii liceale, universitare și post-universitare.
Rezolvare
Distribuțiile condiționate pentru cele 3 nivele de studii se prezintă astfel:
Interpretare: Salariul mediu al persoanelor cu studii liceale este de 11,333 sute lei, al
persoanelor cu studii universitare este de 20,5 sute lei iar al persoanelor cu studii post-
universitare este de 26,333 sute lei.
80
Exemplul 3.13. Calculul mediei pe total folosind mediile condiționate
Pentru distribuția din tabelul 3.17, să se calculeze salariul mediu pentru eșantionul
observat, știind că : x1 = 11,333 sute lei, x2 = 20,50 sute lei și x3 = 26,333 sute lei.
Rezolvare
Media pe total se calculează ca o medie ponderată astfel :
11,333 ⋅ 3 + 20,50 ⋅ 4 + 26,333 ⋅ 3
x= = 19,5 sute lei.
10
Interpretare: Salariul mediu al persoanelor din eșantionul observat este de 19,5 sute lei.
Observație: Media pe total (19,5 sute lei) este aceiași folosind distribuția marginală în X sau
mediile condiționate oe grupe ale variabilei Y.
81
a. Varianța intra-grupe
Varianța condiționată (pe grupe) măsoară variația valorilor unei variabile X pe categorii
(grupe) ale unei variabile Y. Considerând variabila cantitativă X, varianțele condiționate,
pentru fiecare grupă j a variabilei Y, se calculează astfel :
( x i − x j ) ⋅ nij
2
s =
2
j
i
.
n• j
Rezolvare
Distribuțiile condiționate pentru cele 3 nivele de studii se prezintă astfel :
82
Varianțele condiționate pe grupe se calculează astfel :
- pentru nivelul de studii liceale:
(10 − 11,333) 2 ⋅ 1 + (12 − 11,333) 2 ⋅ 2 + ... + (27 − 11,333) 2 ⋅ 0
s12 = = 0,8889 ;
3
- pentru nivelul de studii universitare:
(10 − 20,50) 2 ⋅ 0 + (12 − 20,50) 2 ⋅ 0 + (19 − 20,50) 2 ⋅ 2 + ... + (27 − 20,50) 2 ⋅ 0
s =2
2 = 2,25 ;
4
- pentru nivelul de studii post-universitare:
(10 − 26,333) 2 ⋅ 0 + ... + (25 − 26,333) 2 ⋅1 + (27 − 26,333) 2 ⋅ 2
s =
2
3 = 0,8889 .
3
Rezolvare
Pentru aprecierea omogenității fiecărei grupe, se calculează coeficientul de variație
astfel:
- pentru nivelul de studii liceale:
s1 0,8889
v1 = ⋅100 = ⋅100 = 8,32%
x1 11,333
- pentru nivelul de studii universitare:
s2 2,25
v2 = ⋅100 = ⋅100 = 7,31%
x2 20,50
- pentru nivelul de studii post-universitare:
s3 0,8889
v3 = ⋅100 = ⋅100 = 3,58%
x3 26,333
83
Interpretare: Valorile coeficienților de variație (mai mici decât 50%) evidențiază faptul că
toate cele 3 grupe de studii absolvite sunt omogene din punctul de vedere al salariului lunar,
iar mediile calculate sunt reprezentative pentru fiecare grupă.
2
a.2. Media varianțelor de grupă ( s )
sj
2
⋅ n• j
s2 =
j
.
n
Media varianțelor de grupă arată influența factorilor aleatori asupra variației salariului.
Rezolvare
Pentru aprecierea influenței factorilor aleatori asupra variației salariului se calculează
media varianțelor de grupă astfel :
0,8889 ⋅ 3 + 2,25 ⋅ 4 + 0,8889 ⋅ 3
s2 = = 1,433
10
84
2
b. Varianța inter-grupe ( s x j )
( x ), astfel:
(x j − x ) 2 ⋅ n• j
s x2j = j
.
n
Varianța mediilor de grupă față de media lor arată influența factorilor esențiali, de
grupare asupra variației salariului (variația inter-grupe).
Rezolvare
Pentru aprecierea influenței factorilor esențiali asupra variației salariului se calculează
varianța mediilor de grupă față de media lor astfel:
(11,333 − 19 ,5) 2 ⋅ 3 + ( 20 ,50 − 19 ,5) 2 ⋅ 4 + ( 26 ,333 − 19 ,5) 2 ⋅ 3
s x2j = = 3,44 .
10
c. Varianța totală ( s 2 )
Plecând de la această relație, se pot calcula 2 coeficienți, k1 și k2, după cum urmează:
85
s x2j
- Coeficientul k1 = ⋅ 100 măsoară influența factorilor esențiali asupra variației
s2
variabilei X;
s2
- Coeficientul k 2 = ⋅ 100 măsoară influența factorilor aleatori asupra variației
s2
variabilei X.
Suma acestor 2 coeficienți este 100, astfel încât se poate considera că atunci când k1>k2,
factorii esențiali au o influență mai mare asupra variației variabilei X față de factorii aleatori.
Se cere să se aprecieze care factori (esențiali sau aleatori) au o influență mai mare
asupra variației salariului.
Rezolvare
Pentru a măsura influența factorilor esențiali și aleatori asupra variației unei variabile, se
află varianța totală :
s 2 = s x2j + s 2 = 3,44 + 1,433 = 4,873 .
Coeficientul care măsoară influența factorilor esențiali asupra variației salariului este:
s x2j 3,44
k1 = 2
⋅ 100 = ⋅ 100 = 70,59 % ;
s 4,873
Coeficientul care măsoară influența factorilor aleatori asupra variației salariului este:
s2 1,433
k2 = 2
⋅ 100 = ⋅ 100 = 29,41% .
s 4,873
Interpretare: Coeficientul (k1=70,59%)>(k2=29,41%) ceea ce arată că factorii esențiali au o
influență mai mare asupra variației variabilei X față de factorii aleatori.
86
PARTEA A DOUA. STATISTICĂ INFERENŢIALĂ
Cuprins
Rezumat
În acest capitol sunt prezentate cele mai importante noțiuni folosite în inferența
statistică: populație statistică și eșantion, parametri și estimații, distribuții de selecție.
Fundamentele inferenței statistice sunt estimarea și testarea statistică. Caracterizarea unei
populații în mod indirect, prin extragerea unui eșantion din aceasta, presupune prelucrarea
datelor la nivelul eșantionului extras, respectiv calculul unor indicatori statistici (medie,
varianță, proporție), care se numesc estimații. Aceste mărimi se folosesc pentru a estima
parametrii unei populații (media populației, varianța populației, proporția unei categorii la
nivelul unei populații), care nu pot fi cunoscuți în mod direct.
Bibliografie
87
US4. NOŢIUNI ŞI NOTAŢII FOLOSITE ÎN STATISTICA
INFERENŢIALĂ
Statistica inferenţială are ca obiectiv cunoaşterea unei populaţii în mod indirect, prin
prelucrarea datelor la nivelul unui eşantion extras aleatoriu din aceasta. Inferenţa statistică
presupune estimarea parametrilor unei populaţii şi testarea ipotezelor statistice.
Parametrii reprezintă mărimi reale dar necunoscute prin care poate fi caracterizată o
populaţie. De exemplu, o populaţie poate fi caracterizată folosind un indicator al tendinţei
centrale, cum ar fi media populaţiei ( µ ) şi un indicator al dispersiei, cum ar fi abaterea medie
pătratică ( σ ).
Aceste mărimi sunt estimate prin prelucrarea datelor înregistrate la nivelul unui
eşantion, proces în urma căruia se obţin estimaţii ale parametrilor populaţiei. De exemplu,
prin înregistrarea valorilor unei variabile la nivelul unui eşantion, pot fi calculate media
eşantionului ( x ) şi abaterea medie pătratică ( s ).
Notaţiile folosite pentru definirea parametrilor şi estimaţiilor sunt prezentate în tabelul
de mai jos.
88
Estimaţii Parametri
(eşantion) (populaţie)
Media x µ
Varianţa s2 σ2
Abaterea standard s σ
Proporţia p π
Prin experiment înțelegem o acțiune al cărei rezultat nu poate fi anticipat exact, iar prin
eveniment înțelegem unul dintre rezultatele posibile ale acestui experiment.
Probabilitatea este un număr real, cuprins între 0 și 1. Valoarea p=0 corespunde
imposibilităţii realizării evenimentului sau evenimentul imposibil, iar valoarea p=1
corespunde evenimentului cert sau sigur.
Observaţie:
Probabilitatea este definită ca un caz limită al frecvenţei, adică este frecvenţa relativă de
apariţie a unui eveniment (fi).
89
Figura 4.1. Evenimentele posibile în cazul aruncării
arunc simultane a douăă zaruri
Rezolvare
a) Există 4 cazuri când suma de pe fețele celor două zaruri este egală cu 4, și anume:
Având în vedere căă în total sunt 36 de cazuri posibile, probabilitatea ca suma de pe fețele
fe celor
două zaruri să fie egală cu 4 este egală
egal cu 4/36=0.11 sau 11%.
b) Putem considera valorile posibile ale fiecăruia dintre cele două zaruri (1, 2, 3, 4, 5,
6) ca valori ale unor variabile numerice discrete. Variabila care rezultă prin însumarea
numerelor de pe cele două zaruri este tot o variabilă discretă ale cărei valori posibile sunt de la
2 la 12. Probabilitatea ca suma de pe fețele celor două zaruri să fie mai mică sau egală cu 8
este astfel frecvența absolută cumulată crescător asociată acestei valori.
În tabelul de mai jos, prezentăm frecvențele relative de apariție, simple şi cumulate
crescător, ale valorilor acestei variabile.
90
Tabelul 4.1. Distribuţia evenimentelor după suma de pe fețele celor două zaruri
Suma celor două zaruri ni fi Fi↓
2 1 0.027778 0.027778
3 2 0.055556 0.083333
4 3 0.083333 0.166667
5 4 0.111111 0.277778
6 5 0.138889 0.416667
7 6 0.166667 0.583333
8 5 0.138889 0.722222
9 4 0.111111 0.833333
10 3 0.083333 0.916667
11 2 0.055556 0.972222
12 1 0.027778 1
Total 36 1 -
Probabilitatea ca, după o aruncare a zarurilor, suma de pe fețele celor două zaruri să fie
mai mică sau egală cu 8 este 0,7222 sau 72,22%. Această probabilitate s-a obţinut prin
cumularea tuturor probabilităţilor asociate cazurilor în care suma este 2, 3, 4, 5, 6, 7 sau 8
(0,027778+0,055556+0,083333+0,111111+0,138889+0,166667+0,138889=0,722222).
Cunoscând nivelul mediu şi abaterea standard pentru o distribuţie, putem afla care este
proporţia unităţilor care înregistrează valori mai mari, de exemplu, decât ( x + s ).
Pentru aceasta, se calculează o valoare standardizată Zi, cunoscută şi sub denumirea de
xi − x
scor Zi, după relaţia: z i = .
s
Această mărime arată poziţia unei unităţi faţă de nivelul mediu ( xi − x ), folosind ca
„unitate de măsură” abaterea standard.
De exemplu, pentru o distribuţie caracterizată printr-o medie de x = 100 şi o abatere
140 − 100
standard de s = 20 , putem afla valoarea zi pentru xi=140, astfel: z i = = 2 . Aceasta
20
arată că unitatea care înregistrează valoarea xi=140 se găseşte la o distanţă faţă de nivelul
mediu egală cu de două ori abaterea standard.
91
Odată calculată valoarea z, putem afla proporţia unităţilor care înregistrează valori mai
mari decât 140, de exemplu. Aceste valori sunt calculate pentru o distribuţie normală şi sunt
tabelate într-un tabel cunoscut sub denumirea de tabelul Z (prezentat în Anexa 1).
Tabelul care prezintă aceste rezultate este de forma:
0 0.01 K 0.05 K
0
0.1
0.2
M
1 0,341
1.1 0,375
M
Pe prima coloană sunt valorile lui z, prima cifră şi prima zecimală, iar valorile din
următoarele coloane reprezintă a doua zecimală a valorii z. Valorile din interiorul tabelul arată
proporţia unităţilor care înregistrează valori cuprinse între nivelul mediu şi scorul z
corespunzător.
92
Exemplul 4.3. Calculul probabilităţilor pentru o variabilă normal distribuită
a. Pentru o distribuţie normală de medie, x , şi abatere standard, s, să se afle proporţia
unităţilor care înregistrează valori cuprinse în intervalele ( x ± s ), ( x ± 2 ⋅ s ) şi ( x ± 3 ⋅ s ).
Rezolvare
Pentru a afla proporţia unităţilor care înregistrează valori cuprinse în intervalul
( x − s; x + s ) , se calculează scorul Z, astfel:
x1 − x x − s − x
z1 = = = −1
s s
x2 − x x + s − x
z2 = = = +1 .
s s
Din tabelul Z se citeşte valoarea care corespunde valorii zi=1, şi anume 0,341.
0 0.01 K 0.05 K
0
0.1
0.2
M
1 0,341
1.1 0,375
M
Această valoare, 0,341, reprezintă aria suprafeţei cuprinse între nivelul mediu şi zi=1.
Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x − s; x + s ) este:
2 ⋅ 0 ,341 = 0 ,682 sau 68,2%.
93
În mod similar, se obţin valorile zi=±2, pentru limitele intervalului ( x ± 2 ⋅ s ).
0 K 0.05 K
0
0.1
0.2
M
2 0,477
M
94
Pentru intervalul ( x ± 3 ⋅ s ), se obţin valorile zi=±3:
0 K 0.05 K
0
0.1
0.2
M
3 0,499
Interpretare: Într-o distribuţie normală, în intervalul ( x ± s ) sunt cuprinse 68,2% din unităţi,
în intervalul ( x ± 2 ⋅ s ) sunt cuprinse 95,4% din unităţi şi în intervalul ( x ± 3 ⋅ s ) sunt cuprinse
99,8% din unităţi.
b. Distribuţia unor studenţi după nota obţinută la un test urmează o lege normală şi se
caracterizează prin următoarele rezultate: x = 7 şi s=2. Se cere să se afle proporţia studenţilor
care au luat note mai mici decât 6.
95
Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculează astfel:
xi − x 6 − 7
zi = = = −0 ,5
s 2
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=0,5, egală cu 0,191.
0 0.01 K 0.05 K
0
0.1
0.2
M
0,5 0,191
M
Proporţia studenţilor care au luat note mai mici decât 6 este p=0,5-0,191=0,309 sau
30,9%.
Observaţie: Aria suprafeţei reprezentate în figura de mai sus este egală cu unu (după cum am
precizat anterior, suma proporţiilor este egală cu 1 sau 100%). Distribuţia normală este o
distribuţie simetrică, deci proporţia unităţilor care au valori mai mari decât nivelul mediu este
de 0,5.
Rezolvare
Valorile lui Z corespunzătoare lui x1=27 şi x2=35 sunt:
96
x1 − x 27 − 30
z1 = = = −0 ,75
s 4
x 2 − x 35 − 30
z2 = = = +1,25 .
s 4
Din tabelul Z se citesc valorile corespunzătoare lui z1=-0,75 şi z2=+1,25, astfel:
0 K 0.05 K
0
0.1
0.2
M
0,7 0,273
M M
1,2 0,394
M M
Rezolvare
Această problemă poate fi prezentată grafic astfel:
97
Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior:
se cunoaşte proporţia (95%) şi trebuie să aflăm valoarea lui z care corespunde acestei
proporţii.
Pentru a afla valoarea lui z, se calculează aria suprafeţei cuprinsă între nivelul mediu şi
0 ,95
z, care este egală cu = 0 ,475 .
2
Pentru această valoare egală cu 0,475, se citeşte valoarea lui z corespunzătoare, de 1,96.
0 K 0.06 K
0
0.1
0.2
M
1,9 0,475
M M
Prin urmare, într-o distribuţie normală 95% din unităţi au valori cuprinse în intervalul
[x − 1,96 ⋅ s; x + 1,96 ⋅ s ]. Riscul asumat pentru ca o unitate să nu fie în acest interval este de
5%.
98
Observaţie: În estimarea parametrilor unei populaţii, problematică prezentată în partea a doua,
obiectivul urmărit este de a afla limitele unui interval care acoperă media unei populaţii, în
95% din cazuri, de exemplu. În acest caz, riscul asumat ca media unei populații să nu fie în
acest interval este de 5% (sau 100%-95%). Acest risc este simbolizat cu α.
Atunci când nu se cunoaște varianța populației (σ2), caz frecvent întâlnit în practică,
aceasta poate fi „înlocuită” prin varianța calculată la nivelul eșantionului (s2).
x−µ
Variabila Z „devine” astfel: . Această mărime este cunoscută sub denumirea
s/ n
de variabila t.
Întrucât pentru fiecare eșantion se pot înregistra valori diferite ale lui s, vom avea mai
multe distribuții t (cu varianțe diferite). Cum valorile variabilei t depind de volumul
eșantionului, cu cât eșantionul este de volum mai mare, cu atât varianța eșantionului va estima
mai bine varianța populației.
Precizia acestei estimări este luată în calcul în modelul matematic al distribuției t
(cunoscută sub denumirea de t Student) prin numărul gradelor de libertate, egal cu (n-1), care
crește odată cu creșterea volumului eșantionului (n).
Ca și în cazul variabilei Z, variabila t are media egală cu zero. Varianța sa însă nu mai
este egală cu 1, este întotdeauna mai mare decât 1, dar se apropie de 1 atunci când numărul
gradelor de libertate este mare (eșantionul este de volum mare). Se poate astfel considera că
atunci când n → ∞ distribuția Student tinde spre o distribuție normală standard Z.
Ca și în cazul variabilei Z, valorile variabilei t sunt calculate și tabelate în tabelul
Student (prezentat în Anexa 2). Acest tabel este de forma :
99
Grade de libertate 0.10 0.05 0.025 K
1 3.078 6.314 12.706 K
2 1.886 2.920 4.303 K
M M M M K
30 1.310 1.697 2.042 K
>30 1.282 1.645 1.960 K
În prima coloană sunt prezentate gradele de libertate (n-1), iar pe prima linie sunt date
diferite valori ale riscului asumat (α). Valorile t care sunt în interiorul tabelului sunt valorile t
Student pentru care probabilitatea P(t >tα)=α (aria suprafeței din dreapta valorii t este α).
Pentru aceeaşi probabilitate, valorile variabilei t diferă în funcţie de gradele de libertate
considerate.
De exemplu, pe prima coloană (0.10) se găsesc valorile t pentru care aria suprafeței
delimitate la dreapta de aceste valori este de 0.10 sau 10%.
Exemplul 4.4. Citirea valorii t din tabelul Student
a. Considerând 9 grade de libertate, să se afle valoarea t astfel încât P(t >t0.05)=0.05.
Rezolvare
În tabelul Student, în dreptul gradelor de libertate egale cu 9 se citește pentru coloana
0.05 valoarea t=1,833.
0.10 0.05 K
1
2
3
M
9 1,833
M
100
Rezolvare
În tabelul Student, în dreptul gradelor de libertate egale cu 9 se observă că valoarea
t=2,52 se găsește între valorile 2,262 și 2,821, care corespund probabilităților 0,025 și 0,01.
Probabilitatea ca t să fie mai mare decât 2,52 este deci cuprinsă între 0,01 și 0,025:
0,01 < P(t > 2,52) < 0,025.
Rezolvare
În tabelul Student, pentru coloana 0.05 se citesc valorile prezentate mai jos, în dreptul
gradelor de libertate egale cu 9, 25, 30, 50:
101
Grade de libertate 0.10 0.05 K
1
2
M
9 1,833
M
25 1,708
M
30 1,697
>30 1,645
102
Rezolvare
Caracterizarea acestei populaţii se poate realiza prin calculul unui indicator al tendinţei
centrale, media, de exemplu, şi a unui indicator al dispersiei, cum este abaterea standard:
Xi 14 + 15 + 17 + 18
Media populaţiei este: µ = i
= = 16 lei.
N 4
4!
Dacă n=2, K = C Nn = C42 = = 6 eşantioane.
2!⋅(4 − 2)!
Valorile variabilei pentru cele 2 unităţi din fiecare din cele 6 eşantioane sunt:
14 + 15 15 + 17
Eşantionul 1: x1 = = 14,5 Eşantionul 4: x6 = = 16
2 2
14 + 17 15 + 18
Eşantionul 2: x2 = = 15,5 Eşantionul 5: x7 = = 16,5
2 2
14 + 18 17 + 18
Eşantionul 3: x3 = = 16 Eşantionul 6: x8 = = 17,5
2 2
103
Tabelul 4.2. Distribuţia variabilei media de selecţie µ̂
xi Frecvenţa de pi
apariţie
14,5 I 1/6=0,167
15,5 I 1/6=0,167
16 II 2/6=0,332
16,5 I 1/6=0,167
17,5 I 1/6=0,167
TOTAL - 1
În cazul nostru,
- media mediei de selecţie este calculată ca o medie aritmetică folosind frecvenţe
relative:
M (µˆ ) = xi ⋅ pi =14,5 ⋅ 0.167 + 15,5 ⋅ 0.167 + ... + 17,5 ⋅ 0.167 = 16 .
i
σ µˆ = σ µ2ˆ = x
i
i
2
⋅ pi − ( xi ⋅ pi ) 2 = 0,83 = 0,911 .
i
104
Tabelul 4.3. Elemente de calcul ale mediei şi varianţei variabilei µ̂
xi pi xi ⋅ p i xi2 xi2 ⋅ pi
14,5 0,167 2,421 210,250 35,111
15,5 0,167 2,588 240,250 40,121
16 0,332 5,312 256,000 84,992
16,5 0,167 2,755 272,250 45,465
17,5 0,167 2,922 306,250 51,143
TOTAL 1,0 16 - 256,832
După cum se observă, distribuţia mediei de selecţie urmează o lege normală, iar mediile
eşantioanelor „se grupează” în jurul mediei lor, adică a mediei populaţiei.
σ2
Folosind notaţiile prezentate, putem scrie: µˆ ~ N ( µ , σ µ̂ ) sau µˆ ~ N ( µ ,
2
).
n
105
US5. ESTIMAREA PARAMETRILOR UNEI POPULAŢII
Cuprins
Rezumat
Bibliografie
106
US5. ESTIMAREA PARAMETRILOR UNEI POPULAŢII
Estimarea mediei unei populaţii se poate realiza punctual şi prin interval de încredere
(I.C.).
DEFINIȚIE Estimarea punctuală a mediei unei populaţii presupune aflarea unei valori
posibile a estimatorului parametrului µ̂ .
Luând în considerare media (μ) şi varianţa ( σ 2 ) unei populaţii, variabila Z este dată de
X −µ
relaţia Z = . Pentru variabila µ̂ , valorile variabilei Z se calculează după relaţia:
σ
xi − µ xi − µ x−µ
zi = = . Astfel, se poate determina: P( − z ≤ ≤ + z ) = 1 − α , unde:
σ µˆ σ/ n σ/ n
α este un nivel al probabilităţii cuprins între zero şi unu. Acest nivel arată riscul
asumat în estimare. De regulă, în economie se foloseşte un risc de 0,05 sau 5%.
107
Intervalul de încredere pentru media populaţiei, când se cunoaşte varianţa populaţiei,
este:
σ
x ± zα / 2 ⋅ , unde:
n
x este media calculată la nivelul eşantionului;
zα / 2 este o valoare a statisticii Z care se citeşte din Tabelul Z pentru un risc α .
σ este abaterea standard la nivelul populaţiei;
n este volumul eşantionului.
( xi − x ) 2
s' = i
;
n −1
n este volumul eşantionului.
Observații:
Precizia estimării creşte (mărimea intervalului de încredere este mai mică), atunci când:
- volumul eşantionului (n) creşte (“legea rădăcinii pătrate”: mărirea de 4 ori a
volumului eşantionului, dublează precizia estimării);
- probabilitatea cu care se garantează rezultatele este mai mică;
- varianţa eşantionului este mică (valorile aberante afectează mărimea intervalului de
încredere).
108
Exemplul 5.1. Estimarea mediei prin interval de încredere
a. La nivelul unui eşantion format din 28 de angajaţi ai unei firme, extras aleator
simplu, s-au obţinut următoarele rezultate privind vechimea în muncă (luni):
x = 62 luni, s ' = 4 luni . Să se estimeze prin interval de încredere vechimea medie la nivelul
tuturor angajaţilor firmei din care a fost extras eşantionul, considerând un risc de 0,05.
Rezolvare
Întrucât nu se cunoaşte varianâa populaţiei, în estimarea prin IC a mediei populaţiei se
s
foloseşte statistica t Student. IC este definit de: x ± tα / 2,n−1 ⋅ .
n
Din Tabelul repartiţiei Student se citeşte valoarea t0,025;28-1=2,093.
t K 0.025 K
M
27 K 2.052 K
b. La nivelul unui eşantion format din 9 angajaţi, extras aleator simplu, s-au obţinut
următoarele rezultate privind vechimea în muncă (luni): x = 62 luni, s ' = 4 luni . Să se
estimeze prin interval de încredere vechimea medie a întregii populaţii din care a fost extras
eşantionul, considerând un risc de 0,05.
Rezolvare
s'
IC este definit de: x ± tα / 2 ⋅ .
n
Din Tabelul Student se citeşte valoarea t0,025;9-1=2,306.
109
t K 0.025 K
M
8 K 2,306 K
Observaţie: Mărimea intervalului de încredere este, în acest caz, mai mare faţă de exemplul
anterior. Precizia estimării s-a micşorat datorită volumului mai redus al eşantionului.
Estimarea punctuală a proporţiei la nivelul unei populaţii presupune aflarea unei valori
posibile a estimatorului parametrului πˆ . Proporţia unei anumite categorii calculată la nivelul
eşantionului (p) este o estimaţie punctuală a proporţiei acestei categorii la nivelul populaţiei.
110
Rezolvare
Proporţia studenţilor care au fost declaraţi admişi la examen, calculată la nivelul
ni 68
eşantionului, este: p = = = 0,85 sau 85%.
n 80
Interpretare: Proporţia studenţilor admişi la examen la nivelul întregii serii poate fi estimată
punctual prin proporţia calculată la nivelul eşantionului, deci π=0,85 sau π=85%.
π (1 − π )
Variabila proporţia de selecţie ( πˆ ) se caracterizează prin: πˆ ~ N (π , ).
n
Construirea intervalului de încredere pentru proporţia calculată la nivelul unei
populaţii se realizează în mod similar mediei unei populaţii.
Intervalul de încredere pentru proporţia la nivelul unei populaţii este:
p ⋅ (1 − p)
p ± tα / 2,n−1 ⋅ , atunci când nu se cunoaşte σ πˆ .
n
Rezolvare
Proporţia studenţilor care sunt admişi la examen, la nivelul eşantionului, este:
ni 68
p= = = 0,85 sau 85%.
n 80
Limitele intervalului de încredere se calculează astfel:
p ⋅ (1 − p)
p ± tα / 2,n−1 ⋅ , unde:
n
p = 0,85 ;
tα / 2 ,n −1 este valoarea statisticii t Student care se citeşte din Tabelul Student pentru un risc
111
t K 0.025 K
M
M K K
∞ K 1,96 K
112
US6. TESTAREA IPOTEZELOR STATISTICE
Cuprins
Rezumat
În acest capitol este prezentat demersul testării statistice. Testarea statistică are ca
obiectiv testarea diferenței dintre un parametru al unei populații (medie, proporție), care este
estimat pe baza datelor înregistrate la nivelul unui eșantion, și un alt parametru al unei
populații, o valoare cunoscută, de referință. În procesul de testare statistică se formulează
două ipoteze statistice: ipoteza nulă și ipoteza alternativă. În condițiile unui risc asumat, se
adoptă decizia de a respinge sau a accepta una dintre cele două ipoteze.
Bibliografie
1. Andrei, T., Statistică şi econometrie, Ed. Economică, 2003
2. Jaba, E., Statistica, ed. a 3-a, Ed. Economică, Bucureşti, 2002
3. James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and
Economics, Pearson, Education New Jersey, 2008
4. Weiss, N, A., Elementary Statistics, Pearson, 2012
5. Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.
113
US6. TESTAREA IPOTEZELOR STATISTICE
1-α
α/2 α/2
-zα/2 zα/2 Z
H 1 H 0 H 1
a. Ipoteze statistice
115
Ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe între media unei
populaţii, µ , estimată prin media calculată la nivelul eşantion, şi o valoare de referinţă
considerată, µ 0 .
Ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se presupune
că există diferenţe între valorile comparate.
bilateral), H 1 : µ > µ 0 (test unilateral la dreapta) sau H 1 : µ < µ 0 (test unilateral la stânga).
îndepărtată, la stânga sau la dreapta, de valoarea fixă µ 0 (se încadrează printre cele 5% cele
mai puţin probabile medii ale eşantioanelor posibil de extras din populaţie).
Pragul de semnificaţie a testului, α , arată probabilitatea de a respinge ipoteza H0
atunci când aceasta este adevărată. Eroarea comisă în respingerea ipotezei H0, atunci când
aceasta este adevărată, poartă denumirea de eroare de tip I.
Eroarea de tip II se produce în momentul acceptării ipotezei H0, atunci când aceasta
este falsă.
116
c. Alegerea şi calculul statisticii test
x − µ0 x − µ0 ( xi − x ) 2
t calculat = = , unde s' = i
.
s µˆ s' / n n −1
1-α
α/2 α/2
-zα/2 zα/2 Z
H 1 H 0 H 1
Figura 6.2. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test bilateral
Regula de decizie pentru un test unilateral poate fi definită astfel:
117
Se respinge ipoteza H0 Se acceptă ipoteza H0
Folosind probabilitatea dacă Pr ob. < α dacă Pr ob. ≥ α
asociată statisticii test
Test unilateral la dreapta dacă z calculat > + zα dacă z calculat ≤ + zα
H 1 : µ > µ0
Test unilateral la stânga dacă z calculat < − zα dacă z calculat ≥ − zα
H 1 : µ < µ0
Figura 6.3. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test unilateral la
dreapta
Figura 6.4. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test unilateral la
stânga
118
Exemplul 6.3. Citirea valorilor critice şi definirea regiunilor critice
În cazul unui test bilateral, considerând un prag de semnificaţie α = 0 ,05 , valoarea
critică a statisticii test Z este z=1,96. Regiunea de respingere a ipotezei Ho este definită de:
z calculat < −1,96 , respectiv z calculat > +1,96.
În cazul unui test unilateral la dreapta, pentru care ipoteza H 1 : µ > µ 0 , considerând
un prag de semnificaţie α = 0 ,05 , valoarea critică a statisticii test Z este z=1,64. Regiunea de
respingere a ipotezei Ho este, astfel, definită de: z calculat > 1,64 .
În cazul unui test unilateral la stânga, pentru care ipoteza H 1 : µ < µ 0 , considerând
un prag de semnificaţie α = 0 ,05 , valoarea critică a statisticii test Z este z = −1,64 . Regiunea
Exemplul 6.4. Testarea diferenţei dintre o medie şi o valoare fixă, cazul unui test bilateral
La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x = 14 sute lei. Ştiind că σ = 4 sute lei , se cere să se testeze dacă există
diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras
eşantionul şi salariul mediu pe economie, de 13 sute lei. Se consideră un risc α = 0 ,05.
Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13 sute lei (nu există diferenţe semnificative între salariul mediu al întregii populaţii
din care a fost extras eşantionul şi salariul mediu pe economie)
H 1 : µ ≠ 13 sute lei (există diferenţe semnificative între salariul mediu al întregii populaţii
din care a fost extras eşantionul şi salariul mediu pe economie)
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte σ , se foloseşte
x − µ0
statistica test Z: z = .
σ/ n
119
Calculul statisticii test
14 − 13
Pe baza datelor obţinute la nivelul eşantionului, se obţine: z cakulat = = 2 ,5 .
4 / 100
Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
• dacă Pr ob. < α , atunci se respinge ipoteza H0;
• dacă Pr ob. ≥ α , atunci se acceptă ipoteza H0.
120
Interpretare: z calculat = 2 ,5 > z0 ,025 = 1,96 sau (Pr ob. = 2 ⋅ 0 ,006 = 0 ,012 ) < α = 0 ,05 , se
Exemplul 6.5. Testarea diferenţei dintre o medie şi o valoare fixă, cazul unui test unilateral
La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x = 14 sute lei. Ştiind că σ = 4 sute lei , se cere să se testeze dacă salariul
mediu al întregii populaţii din care a fost extras eşantionul este mai mare decât salariul mediu
pe economie, de 13 sute lei. Se consideră un risc α = 0 ,05.
Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13 sute lei
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte σ , se foloseşte
x − µ0
statistica test Z: z = .
σ/ n
Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
• dacă Pr ob. < α , atunci se respinge ipoteza H0;
• dacă Pr ob. ≥ α , atunci se acceptă ipoteza H0.
121
Folosind statistica test:
• dacă z calculat > + zα , atunci se respinge ipoteza H0;
Figura 6.6. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test unilateral
la dreapta
Interpretare: z calculat = 2,5 > z 0, 025 = 1,64 sau Pr ob. = 0 ,006 < α = 0 ,05 , se respinge ipoteza
Ho. Se poate garanta cu o probabilitate de 0,95 că salariul mediu al întregii populaţii din care
a fost extras eşantionul observat ( µ ) este mai mare decât salariul mediu pe economie ( µ 0 ) .
Exemplul 6.6. Testarea diferenţei dintre o medie şi o valoare fixă, cazul în care nu se
cunoaşte varianţa populaţiei
Pentru un eşantion format din 25 de persoane, se înregistrează salariul lunar obţinut şi se
obţin următoarele rezultate: x = 15 sute lei, s' = 2 sute lei. Se cere să se testeze dacă există
diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras
eşantionul şi salariul mediu de economie, de 13 sute lei. Se consideră un risc α = 0 ,05.
122
Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13
H 1 : µ ≠ 13
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
x − µ0
t= .
s' / n
Regula de decizie
• dacă t calculat < −tα / 2 sau t calculat > +tα / 2 , atunci se respinge ipoteza H0;
• dacă t calculat ≥ −tα / 2 sau t calculat ≤ +tα / 2 , atunci se acceptă ipoteza H0.
t K 0.025 K
M
24 K 2,064 K
123
Interpretare: Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în
figura de mai jos:
0,95
0,025 0,025
tcalc =5
t
-2,064 2,064
H1 H0 H1
t calculat = 5 > t 0 ,025;24 = 2 ,064 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 că există diferenţe semnificative între salariul mediu al întregii populaţii din care a fost
extras eşantionul observat ( µ ) şi salariul mediu pe economie ( µ 0 ) .
Ipoteze statistice
Ipotezele care se formulează în testarea semnificaţiei unei proporţii sunt:
H0 :π = π0
H 1 : π ≠ π 0 (test bilateral)
124
p −π0 p −π0
t calculat = = sau, în cazul folosirii procentelor,
sπˆ p(1 − p) / n
p −π0 p − π0
t calculat = = .
sπˆ p (100 − p ) / n
Rezolvare
Formularea ipotezelor statistice
H 0 : π = 51%
H 1 : π ≠ 51%
Statistica test
125
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
p −π0
t= .
p ⋅ (100 − p ) / n
Regula de decizie
• dacă t calculat < −tα / 2 sau t calculat > +tα / 2 , atunci se respinge ipoteza H0;
• dacă t calculat ≥ −tα / 2 sau t calculat ≤ +tα / 2 , atunci se acceptă ipoteza H0.
Interpretare: t calculat = 0 ,2 < t 0 ,025;24 = 2 ,064 , se acceptă ipoteza Ho. Se poate garanta cu o
Testarea ipotezelor cu privire la două valori ale aceluiaşi parametru poate viza două
medii ale unor populaţii, µ1 şi µ 2 , sau două proporţii, π 1 şi π 2 .
Ipoteze statistice
126
H 0 : µ1 − µ 2 = 0
H 1 : µ1 − µ 2 ≠ 0
s12 ( n1 − 1 ) + s 22 ( n2 − 1 )
sp = .
n1 + n2 − 2
127
Rezolvare
Ipoteze statistice:
H0: µ1 = µ 2 (nu există diferenţe semnificative între vârstele medii ale celor două populaţii din
care au fost extrase eşantioanele)
H1: µ1 ≠ µ 2 (există diferenţe semnificative între vârstele medii ale celor două populaţii din
care au fost extrase eşantioanele)
Statistica test
Când nu se cunosc varianţele populaţiilor, pentru testarea ipotezelor statistice se foloseşte
statistica t, calculată după relaţia:
x1 − x 2
t=
s12 s 22
+
n1 n 2
Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
1-α
α/2 α/2
-t α/2 tα/2 t
H 1 H 0 H 1
128
35 − 32
t= = 16 ,7
2 +4
2 2
625
Interpretare: ( t calc = 16 ,7 ) > (t0 ,025 = 1,96 ), se respinge ipoteza H0. Se poate garanta cu o
probabilitate de 0,95 că există diferenţe semnificative între vârstele medii ale populaţiilor din
care au fost extrase eşantioanele observate.
Rezolvare
Ipoteze statistice
H0: µ M = µ F
H1: µ M ≠ µ F
Statistica test
Când nu se cunosc varianţele populaţiilor, pentru testarea ipotezelor statistice se foloseşte
statistica t, calculată după relaţia:
xM − xF
t=
sM2 sF2
+
n1 n2
129
Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
1-α
α/2 α/2
-t α/2 tα/2 t
H 1 H 0 H 1
Interpretare: ( t calc = 0 ,76 ) < (t0 ,025 = 2 ,145 ), se acceptă ipoteza H0. Se poate garanta cu o
Ipoteze statistice
H 0 : π1 − π 2 = 0
H1 : π 1 − π 2 ≠ 0
130
Alegerea pragului de semnificaţie a testului α
Regula de decizie
• dacă t calc > tα / 2 ; n1 + n2 − 2 , se respinge ipoteza H0;
Rezolvare
Ipoteze statistice:
H0: π 1 = π 2 (nu există diferenţe semnificative între proporţia persoanelor care au votat pentru
candidatul A în anul 2016 şi anul 2012)
H1: π 1 ≠ π 2 (există diferenţe semnificative între proporţia persoanelor care au votat pentru
candidatul A în anul 2016 şi anul 2012)
Statistica test
Statistica t se calculează după relaţia:
131
p1 − p2
tcalculat =
p1 ⋅ (100 − p1 ) p2 ⋅ (100 − p2 )
+
n1 n2
Regula de decizie
• dacă t calc > tα / 2 ; n1 + n2 − 2 , se respinge ipoteza H0;
Interpretare: ( t calc = 0 ,71) < (t 0 ,025 = 1,96 ), se acceptă ipoteza H0. Se poate garanta cu o
Estimarea prin interval de încredere presupune construirea unui interval pentru valoarea
unui parametru, plecând de la rezultatele obţinute prin prelucrarea datelor la nivelul unui
eşantion extras din populaţie.
Testarea ipotezelor statistice presupune un demers invers: se formulează o ipoteză
asupra valorii unui parametru şi se verifică dacă această ipoteză este sau nu „contrazisă” de
observaţiile de la nivelul unui eşantion extras din populaţie.
De exemplu, să presupunem că în urma prelucrării datelor la nivelul unui eşantion, se
obţin limitele intervalului de încredere pentru media unei populaţii definite de [14; 18] . Dacă
132
în procesul testării statistice, formulăm ipotezele H 0 : µ = 10 ; H 1 : µ ≠ 10 , atunci putem
observa că se respinge ipoteza H0, deoarece media populaţiei, µ , nu poate fi egală cu 10.
133
Anexe
134
Anexa 1
Distribuţia Laplace:
z t2
1 −
Φ( z ) = e 2 dt
2π 0
0 z
0 0.000 0.004 0.008 0.012 0.016 0.020 0.024 0.028 0.032 0.036
0.1 0.040 0.044 0.048 0.052 0.056 0.060 0.064 0.067 0.071 0.075
0.2 0.079 0.083 0.087 0.091 0.095 0.099 0.103 0.106 0.110 0.114
0.3 0.118 0.122 0.126 0.129 0.133 0.137 0.141 0.144 0.148 0.152
0.4 0.155 0.159 0.163 0.166 0.170 0.174 0.177 0.181 0.184 0.188
0.5 0.191 0.195 0.198 0.202 0.205 0.209 0.212 0.216 0.219 0.222
0.6 0.226 0.229 0.232 0.236 0.239 0.242 0.245 0.249 0.252 0.255
0.7 0.258 0.261 0.264 0.267 0.270 0.273 0.276 0.279 0.282 0.285
0.8 0.288 0.291 0.294 0.297 0.300 0.302 0.305 0.308 0.311 0.313
0.9 0.316 0.319 0.321 0.324 0.326 0.329 0.331 0.334 0.336 0.339
1 0.341 0.344 0.346 0.348 0.351 0.353 0.355 0.358 0.360 0.362
1.1 0.364 0.367 0.369 0.371 0.373 0.375 0.377 0.379 0.381 0.383
1.2 0.385 0.387 0.389 0.391 0.393 0.394 0.396 0.398 0.400 0.401
1.3 0.403 0.405 0.407 0.408 0.410 0.411 0.413 0.415 0.416 0.418
1.4 0.419 0.421 0.422 0.424 0.425 0.426 0.428 0.429 0.431 0.432
1.5 0.433 0.434 0.436 0.437 0.438 0.439 0.441 0.442 0.443 0.444
1.6 0.445 0.446 0.447 0.448 0.449 0.451 0.452 0.453 0.454 0.454
1.7 0.455 0.456 0.457 0.458 0.459 0.460 0.461 0.462 0.462 0.463
1.8 0.464 0.465 0.466 0.466 0.467 0.468 0.469 0.469 0.470 0.471
1.9 0.471 0.472 0.473 0.473 0.474 0.474 0.475 0.476 0.476 0.477
2 0.477 0.478 0.478 0.479 0.479 0.480 0.480 0.481 0.481 0.482
2.1 0.482 0.483 0.483 0.483 0.484 0.484 0.485 0.485 0.485 0.486
2.2 0.486 0.486 0.487 0.487 0.487 0.488 0.488 0.488 0.489 0.489
2.3 0.489 0.490 0.490 0.490 0.490 0.491 0.491 0.491 0.491 0.492
2.4 0.492 0.492 0.492 0.492 0.493 0.493 0.493 0.493 0.493 0.494
2.5 0.494 0.494 0.494 0.494 0.494 0.495 0.495 0.495 0.495 0.495
2.6 0.495 0.495 0.496 0.496 0.496 0.496 0.496 0.496 0.496 0.496
2.7 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497
2.8 0.497 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.498
2.9 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.499 0.499 0.499
3 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499
135
Distribuţia Student: p=P(t>tα) Anexa 2
Grade de libertate 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
136
Bibliografie
137
20. Pintilescu, C., Analiză statistică multivariată, Editura Universităţii “Alexandru Ioan Cuza” Iaşi,
2007.
21. Saporta, G., Probabilités, analyse des données et statistique, Editura Technip, Paris, 1990
22. Tövissi, L.; Isaic-Maniu, Al., Statistica, A.S.E., Bucureşti, 1984.
23. Trebici, V.(coord.) - Mica enciclopedie de statistică, Editura Ştiinţifică şi Enciclopedică, Bucureşti,
1985.
24. Ţarcă, M. , Statistică, vol.I şi II, Universitatea "Al.I.Cuza" Iaşi, 1979.
25. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti, 1969.
26. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
138
lOMoARcPSD|14443567
GRILE STATISTICA
BROSURA 16
1) Pentru o variabila X- N(0,1) P(X >= -0,157)
a) 0,9418
b) 0,4418
c) 0,9772
2) Sporul absolut cu baza fixa exprima:
a)Cu cat s-a modificat in marime relativa, nivelul unei variabile, corespunzatoare momentului
current 1,comparative cu nivelul aceleasi variabile corespunzatoare momentului anterior 1-1;
b)Cu cat s-a mofificat in marime absoluta, nivelul unei variabile corespunzator momentului current 1,
comparative cu nivelul aceleasi variabile corespunzator momentului de referinta;
c) de cate ori s-a modificat nivelul unei variabile corespunzator momentului current 1,fata de nivelul
aceleasi variabile corespunzator momentului de referinta.
c) statistica H, patrat
4) Nivelul cifrei de afaceri ( mld lei) a unei firme pe trimester a inregistrat in perioada 2010-2011
urmatoarea evolutie:
2010 2011
Trim I 3 4
Trim II 4 5
Trim III 3 4
Trim IV 7 11
5) Atunci cand se cunoaste dispersia , a variabilei X, testarea ipotezelor asupra mediei unei populatii
se face cu :
a) statistica Fisher;
b) statistica t;
c) statistica Z.
6) Intr-un sondaj aleator simplu de 625 angajati, pentru variabila venitului lunar s-au obtinut
rezultatele de mai jos:
VENITUL LUNAR
Mean 1200
a) [1187,064; 1212,936]
b) [ 861,89; 1178,11]
c) [34520,1066; 36,6244]
7) Se analizeaza Rata somajului pentru un esantion n=25 tari si se obtin urmatoarele rezultate MEDIA
(X)= 5% , X^2= 4%. In testarea semnificatiei diferentei dintre rata medie a somajului la nivelul populatiei
din care a fost extras esantionul si valoarea prevazuta μ = 3% , printr-un test bilateral, ipoteza H0 nu se
respinge pentru:
a) a=0,02
b) a= 0,01
c) a= 0,005
8)Parametrul reprezinta:
9) Pentru un esantion de personae, se studiaza variata venitului annual in raport cu profesia. Aplicand
metoda ANOVA, variatia a obtinut urmatoarele rezultate:
Explicand(intergrupe) 980 6
Reziduala(intergrupe) 2500 30
b) curprinsa intre 0 si 1;
c) pozitiva.
15) Atunci cand nu se cunoaste dispersia a variabilei analizate X, testarea ipotezelor asupra mediei unei
populatii se face cu:
a) statistica Z;
b) statistica t;
c) statistica Fisher.
16) La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar mai mare decat trei este:
a) 0,33;
b) 0,5;
c) 0,66.
a) eroarea de testare de tip II reprezinta eroarea de a respinge ipoteza nula H, atunci cand In realitate
aceasta este adevarata;
c) eroarea de testare de tip II reprezinta eroarea de a accepta ipoteza nula H, atunci cand in realitate
aceasta este falsa.
18) La un examen sustinut in anul universitar current, un stundent(Mihai) a obtinut un punctaj de 500
puncte. La acest eveneiment punctajul mediu a fost de 450 de puncta iar abaterea standard de 90 de
puncta. In anul universitar precedent, un alt student(George) a obtinut 50 puncte. Pentru acel an,
punctajul mediu a fost de 40 de puncta si abaterea standard de 5 puncte. Care dintre cei doi student au
ocupatun loc mai bun in clasamentul annual?
b) Mihai;
c)George.
a) 0,3413
b) 0,1915
c) 0,5328
a) eroarea de testare de tip I reprezinta eroarea de a accepta ipoteza nula H, atunci cand in reaitate
aceasta este falsa;
b) eroarea de testare de tip I reprezinta eroarea de a respinge ipoteza nula H, atunci cand in realitate
aceasta este adevarata;
c) ptobabilitatea asociata erorii de testare de tip I este numita prag de semnificatie si se noteaa cu a.
24) Pentru un esantion de judete, s-a analizat variatia venitului pe regiuni ale Romaniei. S-a aplicat
metoda ANOVA si s-au obtinut urmatoarele rezultate:
Explicata(intergrupe) 360 6 60
Reziduala(intergrupe) 368 23 16
a) conditia de homsca…..
b) conditia de normalitate;
26. Esantionul reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta care:
b) din motive de cost, are un volum mai mic decat volumul populatiei;
BROSURA 38
1) Sporul mediu absolut arata:
a) Modificarea relativa, pe unitate de timp, inregistrata de un fenomen intr-o anumita
perioada de timp;
b) De cate ori a crescut, nivelul unui fenomen, intr-o anumita perioada;
c) Modificarea medie absoluta, pe unitate de timp, inregistrata de un fenomen, intr-o anumita
perioada de timp.
2) Pentru o variabila X- N( μ , a^2), se cere sa se calculeze probabilitatea P( μ -a< X< μ +a)
Aceasta probabilitate este:
a) 95,4%
b) 68,2%
c) 75%
3) Estimatorul nedeplasat:
a) Are media egala cu parametrul;
b) Are varianta minima;
c) Are dispersia egala cu zero.
4) Parametrul reprezinta:
d) O valoare fixa si necunoscuta la nivelul unei populatii.
5) Esantionuk reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta
care:
a) Poate fi extras aleatory, cu revenire sau fara revenire;
b) Respecta proprietatea de reprezentativitate;
c) Din motive de cost, are un volum mai mic decat volumul populatiei.
6) In vederea studierii optiunii candidatilor la dimiterea FEAA privind specializarea pe care o vor
urma, se extrage aleator, simplu repetat un esantion format din 25 candidati si se observa ca
proportia celor care prefera specializarea Alpha este de 30%. Stiind ca proportia inregistrata
in anul universtitar precedent este de π=40% , se pot afirma ca:
a) Nu exista diferente semnificative intre proportia candidatiilor care prefera
specializarea Alpha in anul current si proportia inregistrata in anul universitar
precedent, in conditiile riscului asumat de 10%;
b) Exista diferente semnificative intre proportia candidatiilor care prefera specializarea
Alpha in anul current si proportia inregistrata in anul universitar precedent, in
conditiile riscului asumat de 1%;
c) Valoarea critica a testului statistic pentru un risc a=10% , este egal cu 1,711.
7) Intr-un sondaj aleator simplu de 400 studenti privind opinia cu privier la decizia de a schimba
sistemul de evaluare, 280 au fost de accord cu aceasta optiune. Intervalul de incredere
penntru parametrul proportiei, cu o probabilitate de 0,90, este:
a) [0,663; 0,737]
b) [0,356; 0,644]
c) [0,4245; 0,8428]
8) Pentru a analiza ptobabilitatea firmelor dintr-un judet s-a extras un esantion de firme si s-a
inregistrat cifra de afaceri a acestora(mld.lei). Rezultatele obtinute in urma prelucrarii datelor
de la nivelul esantionului sunt prezentate in tabelul de mai jos:
Mean 42
Standard Error 0,793
Median 40
Mode 40
Standard Deviation 7
Sample Variance 49
Kurtosis 2,233
Skewness 1,114
Range 50
Minimum 10
Maximum 60
Sum 3507
Count 78
Confidence Level( 95%) 1,553
a) eroarea de testare de tip II reprezinta eroarea de a accepta ipoteza nula H, atunci cand in
reaitate aceasta este falsa;
b) eroarea de testare de tip II reprezinta eroarea de a respinge ipoteza nula H, atunci cand in
realitate aceasta este adevarata;
11) Se studiaza daca exista diferente semnificative intre rata somajului corespunzatoare persoanelor de
gen masculine si cea a persoanelor de gen feminin pentru 2 esantioane de volume n1=n2=9 tari din
Uniunea Europeana. Se cunosc urmatoarele date: M masculine= 8,13% ; M feminine= 8,81% ; S^2
masculin= 19,15; S^2 feminin=46,43. Stiind ca varianta celor doua populatii sunt diferite din punct de
vedere statistic, sunt adevarate afirmatiile:
a) nu exista diferente semnificative intre rata somajului a persoanelor de gen masculine si cea a
persoanelor de fen feminine, in conditiile riscului de 5%;
14) Atunci cand se cunoaste dispersia, testarea ipotezelor asupra mediei unei populatii se face cu:
a) statistica Z;
b) statistica Fisher;
c) statistica t.
15) Potrivit datelor Eurostat, in Romania, in anul 2009, PIB/locuitor a fost de 550 E, fata de 6500 E in
anul 2008. Astfel, in anul 2009, s-a inregistrat a scadere a PIB/locuitor cu 1000 E sau cu 15,38% ,
fata de anul 2008.
In afirmatiile de mai sus , s-au folosit urmatorii indicatori ai seriilot de timp.
a) rata( indicele) de variatie;
b) sporul absolut;
c) rata(ritmul) sporului.
Brosura 27
1) In urma prelucrarii datelor privind veniturile famililor inregistrate la nivelul unui
esantion de volum n=625, s-au obtinut urmatoarele reultate X(media)= 12 mii, s’= 2 mii
le. Sa se testeze daca exista diferente semnificative intre veniturile medii ale famililor la
nivelul populatiei din care a fost extras esantionul si venitul mediu pe tara 𝜇= 13 mii lei
considerand un risc de 5%. Pentru exemplul dat, sunt corecte afirmatiile:
c) se respinge ipoteza Ho.
2) Ipoteza statistica reprezinta:
b) o presupunere cu privier la legea de distributie a unei populatii.
3) Pentru o variabila X-n (10,4), P(X>11) este:
c)0,3085.
4. Sa verifica daca media unei populatii ,𝜇 , difera in mod semnificativ de o valoare fixa, 𝜇0.
In acest caz,ipptezele statistice sunt:
a) H0 : µ≠ µ0
H1 : µ= µ0
b) H0 : µ=µ0
H1 : µ > µ0
c) H0 : µ= µ0
H1 : µ≠µ0
5) Estimatorul reprezinta:
c) o variabila aleatoare.
6. Esantionul reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta care:
7) In vederea testarii ipotezei de egalitate a salariului mediu cu o valoare fixa, 𝜇0 = 46, s-a inregistrat un
esantion de volum n=10 persoane. In acest caz, se pot formula urmatoarele ipoteze statistice:
a) H0 : µ=46 ; H1 : µ ≠ 46
8) Se studiaza daca exista diferente semnificative intre speranta medie de viata a femeilor din Europa de
Est, egala cu 68 ani, si speranta medie de viata a femeilor la nivel Mondial, egala cu 70 ani. Se cunosc
urmatoarele date : n=16 , s’=1.75.
b) exista diferente semnificative intre speranta medie de viata a femeilor din Europa de Est si media la
nivel Mondial, in conditiile riscului asumat de 5%.
9) Estimatia este:
11) Intr-o Ancheta prin sondaj asupra unui esantion de angajati, s-a observant cuantumul bonusurilor
oferite cu ocazia Sarbatorilor de Paste, rezultatele fiin prezentate mai jos.
Mean 14.6
Median 14
Mode 14
Kurtosis 0.086261532
Skewness 0.685985753
Range 12
Minimum 10
Maximum 22
Sum 1460
Count 100
b) Intrevalul de incredere care acopera valoarea medie a bonusurilor la nivelul tuturor angajatiilor firmei,
pentru o incredere de 99%, este [144,021, 201,979]
13) Intr-un sondaj aleator simplu de 400 studenti, pentru variabila nota la un test, s-a obtinut o valoare
medie de 8,25 si o abatere standard sde esantion egala cu 1,8. Intervalul de incredere pentru parametrul
medie, cu o probabilitate de 0,95, este:
b) [8,0736; 8,4264]
14) Dintr-o populatie s-a extras un esantion de volum n=900 persoane. Pentru o variabila X – Consumul
saptamanal de paine(kg), s-au obtinut rezultatele: X(media) =3 kg, s’=1 kg. Considerand un risc de 5%, se
poate considera ca nivelul consumului mediu saptamanal de paine:
15) Atunci cand se cunoaste dispersia, testarea ipotezelor asupra mediei unei populatii se face cu:
16) Dint-o Ancheta de opinie asupra unui esantion de 900 persoane, extras aleator repetat, a rezultat ca,
in medie, la 100 de personae, 85 voteaza favorabil pentru un candidat la functia de primar. Intervalul de
incredere al procentului de voturi a candidatului la nivelul intregii populatii, considerand o incredere de
95%, este:
17) Pentru variabila X- N( 𝜇, 𝜎2) , se cere sa se calculeze probabilitatea P(𝜇 − 𝜎 < X < 𝜇 + 𝜎). Aceasta
probabilitate este:
b) 95%
19) Se verifica daca exista diferente semnificative intre castigul mediu salarial ( sute lei) din regiunea de
Nord-Est a Romaniei si castigul mediu salarial la nivel national, de 14 sute lei. In urma prelucrarii datelor,
s-au obtinut urmatoarele rezultate:
Mean 9.918
Median 9.000
Mode 9.000
Kurtosis 1.217
Skewness 1.161
Range 11.000
Minimum 7.000
Maximum 18.000
Sum 486.000
Count 49.000
21) Intr-un sondaj simplu de 400 angajati, pentru variabila venitului lunar s-au obtinut rezultatele de mai
jos:
Mean 1020
b) [1004,51; 1035,39]
23) In urma observarii si prelucrarii datelor la nivelul unui esantion extras aleator simplu repetat, de
volumul n=100, s-au obtinut urmatoarele valori: X(media)= 40 mii lei, s’2= 25. Considerand un risc de
0,05, limitele intervalului de incredere pentru media populatiei din care a fost extras esantionul sunt:
24) Considerand numarul gradelor de libertate, intr-un test statistic, bilateral, ipoteza nula nu se respinge
daca:
a) |t calculate|> ta/ 2, v
4) Estimatorul nedeplasat
a) are media egala cu parametrul
b) are varianta minima
c) are dispersia egala cu zero
5) Parametrul reprezinta
a) o functie a variabilelor de selectie
b) obiectul estimarii statistice
c) o statistica
d) o valoare fixa si necunoscuta la nivelul unei populatii
6) Intr-un sondaj aleatoriu simplu de 625 angajati, pentru variabila venitul lunar s-au obtinut
rezultatele de mai jos:
Venitul lunar
Mean 1200
Standard Deviation 165
Pentru o probabilitate de 0,95, intervalul de incredere pentru parametrul medie este:
a)[1187,064; 1212,936]
b)[34520,1066; 36,6244]
c)[861,89; 1178,11]
c) valoarea critica a testului statistic pentru un risc α= 0,10 este egala cu 1,711
11) La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar impar este:
a) 0,33
b) 0,5
c) 0,66
13) Nivelul cifrei de afaceri (mld. lei) a unei fiemr pe trimester a inregistrat in perioada 2010-
2011 urmatoarea evolutie:
2010 2011
Trim. I 3 4
Trim. II 4 5
Trim. III 3 4
Trim. IV 7 11
Stiind ca i=1,20, sunt corecte afirmatiile:
a) Cifra de afaceri medie a firmei a fost de 4,625 mld. Lei pe trimestru
b) Cifra de afaceri medie a firmei a fost de 5,125 mld. Lei pe trimestru
c) Cifra de afaceri medie a firmei a crescut in medie cu 20% pe trimestru
14) Intr-un sondaj aleator simplu de 900 studenti, pentru varabila nota la un test, s-a obtinut o
valoare medie de 6,8 si o abatere standatdd de esantion egala cu 1,5. Intervalul de incredere
pentru parametrul medie, cu probabilitate de 0,95 este:
a) [8,1280; 9,2020]
c) [6,702; 6,898]
a) conditia de normalitate
c) conditia de homoscedasticitate
a) H0 : π ≤ π0
H1 : π > π0
b) H0 : π = π0
H1 : π < π0
c) H0 : π = π0
H1 : π ≠ π0
17) Se studiaza daca exista diferente semnificative intre nivelul mediu al PIB-ul/locuitor in
tarile din grupul OECD si nivelul mediu al PIB-ul/locuitor in tarile Europa de Est, in conditiile
unui risc de 1%. Se stie ca varianta celor doua populatii sunt egale si se cunosc urmatoarele
rezultate:
-tcalculat = 12,56
a)exista diferente semnificative intre PIB-ul/locuitor al tarilor din OECD si cel al tarilor din
Europa de Est, in conditiile riscului asumat de 1%.
8. Stiind ca i=0,85:
-cifra de afaceri medie a unei firme a fost de 4.625 mld. Lei pe trimestru
9. Estimarea reprezinta:
-o variabila aleatoare
2. Într-un test statistic bilateral in care se foloseste statistica t, considerand V numarul gradelor de libertate,
ipoteza nula nu se respinde daca:
a. 𝑡𝛼/2,𝑐 < | 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 |
b. 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 > 𝑡𝛼/2
c. . | 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 |≤ 𝑡𝛼/2,𝑣
3. Pentru testarea diferentei dintre trei si mai multe medii ale unor populatii se folosesc:
a. statistica Fisher
b. metoda ANOVA
c. statistica t
4. Atunci când se cunoaște dispersia, in demersul testarii ipotezelor asupra mediului unei populatii se
foloseste:
a. statistica Fisher
b. statistica Z
c. statistica t
5. Se extrag aleator simplu repetat doua esantioane, primul format din 5 persoane de sex masculin, iar al
doilea din 7 persoane de sex feminin. Se inregistreaza varsta acestora și, in urma prelucrarii datelor, se
obtin urmatoarele rezultate:
Sa se testeze ipoteza potrivit careia intre varsta medii alepersoanelor de sex masculin si ale celor de sex
feminin la nivelul populatiei din care au fost extrase esantioanele observate exista rezulate semnificative. Se
cere garantarea rezultatului cu o probabilitate de 0,95.
a. Valoarea calculata a statisticii test este t=-0,65
b. Valoarea calculata a statisticii test este t= -6,5
c. Intre varstele medii ale persoanelor de sex masculin si ale celor de sex feminin la nivelul
populatiei din care au facut parte esantioaneleobservate exista diferente semnificative.
d.Intre varstele medii ale peroanelor de sex masculin si ale celor de sex feminin la nivelul populatiei
din care fac parte esantioanele obsevate nu exista diferente semnificative.
6. Rata medie a sporului cifrei de afaceri a unei firme pe o perioada de 15 ani este de 15%. Rata medie ?
7. Estimatia este:
a. o statistica
b. o valoare fixa si cunoscuta la nivelul unei populatii
9. Pentru un esantion de 400 de angajati, s-a inregistrat numarul de ani de scoala (ani) si s-a obtinut media
𝑥̅̅=13,7 ani si abaterea standard s=2,8. Sa se verifice daca numarul mediu de ani de scoala la nivelul
intregii populatii de angajati difera de 13 ani, considerand un risc de 0,05.
a. numarul mediu de ani de scaola la nivelul intregii populatii de angajati difera semnificativ de 13
ani, in condtiile unui risc de 5%.
b. statistica test utilizata este textul Z
c. valoarea calculata a statisticii test este egala cu t = 5
10. Rata (ritmul) sporului de baza in lant exprima :
a. de cate ori s-a modificat, nivelulunei variabile corespunzator curent t, comparativ cu nivelul
aceleasi variabile corespunzator momentului de timp anterior, t-1
b. cu cat s-a modificat, in marime ralativa nivelul unei variabile corespunzator momentullui curent t,
comparativ cu nivelul aceleiasi variabile corespunzator momentului anterior, t-1
c. cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator nivelului curent t,
comparativ cu nivelul aceleiasi variabile corespunzator momentului de referinta
11. Intr-un sondaj aleatoriu simplu de 625 de studenti, pentru variabila nota la un test, s-a obtinut o valoare
medie de 7,3. Cunoscand ca varianta la nivelul populatiei totale are o valoare egala cu 4, intervalul de
incredere pentru paramentrul mediei, probabilitatea de 0,95% este:
a. [7,1432 ; 7,4565]
b. [6,628 ; 8,2021]
c. [6,50 ; 9,00]
12. In vederea testarii semnificatiei diferentei intre media 𝜇 si valoarea fixa 𝜇0 , pentru un esantion de volum
n = 50, o valoare calculate a statisticii test z = 3,24. In cazul unui test bilateral, daca valoarea teoretica
este z = 2,17, atunci urmatoarele afirmatii sunt adevarate:
a. Exista diferente semnificative intre media 𝜇 si valoarea fixa 𝜇0
b. riscul asumat de respinge pe nedrept ipoteza 𝐻0 este 𝛼 = 0,05
c. media 𝜇 nu difera semnificativ statistic de valoarea fixa 𝜇0
d. riscul asumat de respinge pe nedrept ipoteza 𝐻0 este 𝛼 = 0,025
13. O banca doreste sa verifice corectitudineainformatiilor asupra clientilor sai. S-a extras un esantion
aleatoriu de 400 de persoane si s-au identificat 35 dosare de informatii gresite. Proportia dosarelor cu
greseli ale bancilor, pentru o incredere de 95% esteacoperita de intervalul:
a. [0,0605 ; 0,1145]
b. [0,0423 ; 0,1605]
c. [0,0920 ; 0,1177]
14. Din doua populatii cu variantele 𝜎12 = 𝜎22 , se extrag esantioanele de volum 𝑛𝑡 = 10 si 𝑛2 = 15. In
vedere testarii ipotezei de egalitate a mediilor celor doua populatii, pentru un prag de semnificatie 𝜎 =
0,05, valoarea teoretica si statistica test se citeste pentru:
a. 𝑣1 = 9 ; 𝑣2 =14 grade de libertate
b. v = 25 grade de libertate
c. v = 23 grade de libertate
15. La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar mai mare decat doi este>
a. 0,33
b. 0,5
c. 0,66
16. La acelasi nivel de incredere si aceeasi varianta, pentru a mari precizia rezultatelor este necesar>
a. sa lucram cu esationul nealeatoare
b. sa marim volumul esantionului
c. sa reducem eroarea de reprezentativitatea a esantionului
17. Un producator de cereale realizeaza o ancheta privind comportamentul de consum al adultilor din SUA.
S-a extins un esation de 625 de persoane si s-a identificat ca 78% dintre persoane sunt preocupate de
consumul de alimente.
Pentru 98% incredere, s-a estimate intervalul pentru proportia adultilor din SUA care acorda atentie
alimentatiei sale, afirmatiile sunt adevarate?
a. intervalul de incredere este [0,742 ; 0,818]
b. valoarea teoretica utilizata este 1,96
c. proportia de 78% este o estimatie
19. Demersurile testarii statistice cuprinde mai multe etape, din care si urmatoarele etape:
a. alegerea pragului de semnificatie
b. alegerea valorii calculate a statisticii test din tabelul repartitiei teoretice
c.formularea ipotezelor statistice
20. In vederea testarii semnificatiei diferentelor dintre media 𝜇 si valoarea 𝜇0, pentru un esantion de volum
s=50, valoarea calculate a statisticii test Z= 1,45 in cazul unui test bilateral dacavaloarea teoretica este
Z= 1,96, riscul asumat de a respinge pe nedrept ipoteza 𝐻0 este:
a. 𝜎 = 0,01
b. 𝜎 = 0,95
c, 𝜎 = 0,05
22. Pentru tesatarea diferentelor dintre mediile a trei sau mai multe populatii se poate folosi>
a. metoda ANOVA
b. statistica Fisher
c. statistica Student t
23. Pentru o variabila X – N(0,1), se cunoaste P(-𝛼 < X < 𝛼) = 0,6424. In acest caz
a. a=0,92
b. a=0,0675
c. a=0,1331
24. Intr-un sondaj de opinie, care admite situatia de maxima eterogenitate a populatiei, volumul esantionului
care este parametru proportii cu o eroare maxim admisibila de +/- 2,8% si o probabilitate de 0,95 este
a. 1067
b. 1500
c. 1225
26. Se verifica daca proportia 𝜋 a clientilor care prefera produsul A, in anul current, difera in mod
semnificativ de proportia a clientilor din anul precedent. In acest caz, ipotezele statistice sunt:
a. 𝐻0 ∶ 𝜋 = 𝜋0
𝐻0 ∶ 𝜋 ≠ 𝜋0
b. 𝐻0 ∶ 𝜋 ≤ 𝜋0 𝐻0 ∶ 𝜋 > 𝜋0
c. 𝐻0 ∶ 𝜋 = 𝜋0 𝐻0 ∶ 𝜋 < 𝜋0
27. Intr-un sondaj aleator simplu de 400 de angajati, pentru variabila venitul lunar s-au obtinut rezultatele de
mai jos:
Venitul lunar
Mean 1200
Standard Deviation 165
Pentru o probabilitate de 0,95, intervalul de incredere pentru parametrul medie este:
a. [ 1183,83 ; 1216,17 ]
b. [ 861,89 ; 1178,11 ]
c. [34520,1066 ; 36,6244 ]
a. 0,341
b. 0,889
c. 0,997
29. Un politician, la inceputul mandatului, afirma in mass-media ca va creste salariu net pe economie la
300 EUR. La sfarsitul mandatului sse face un sondaj pe n=900 de respondenti prin care se urmareste
estimarea salariului mediu net pe economie (X). Se cunosc urmatoarele rezultate: 𝑥̅ = 249 EUR ; 𝜎 = 90;
Selectati care din afirmatiile de mai jos sunt:
a. putem afirma pentru un prag de semnificatie de 3% ca politicianul s-a tinut de cuvant.
b. putem afirma pentru un prag de semnificatie de 5% ca politicianul nu s-a tinut de cuvant.
c. putem afirma pentru un prag de semnificatie de 5% ca politicianul s-a tinut de cuvant.
32. Considerand v numarul gradelor de libertate, intr-un test statistic bilateral, ipoteza nula se respinge daca:
a. 𝑡𝛼/2,𝑐 > | 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 |
b. | 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | > 𝑡𝛼/2,𝑐
c. . | 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 |≤ 𝑡𝛼/2,𝑐
34. Intr-o ancheta prin sondaj asupra unui esantion de angajati, s-a observant cuantumul bonusurilor oferite
cu ocazia Sarbatorilor de Paste, rezultatele fiind prezentate mai jos>
Mean 173
Standard Error 11,25956384
Media 180
Mode 180
Variabila numerica este Salariu, iar variabila (factorul) de grupare este Regiunea. Inaceasta situatie, se poate
afirma ca:
2014 2015
Trim. I 12 9
Trim. II 2 5
Trim. III 4 4
Trim. IV 3 3
20) Din doua populatii cu variatie 𝜎12 = 𝜎22 , se extrag esantioanele de volum n1 =10 si n2 =15. In vederea
testarii ipotezei de egalitate a mediilor celor doua populatii, pentru un prag de semnificatie α=0,05 ,
valoarea teoretica a statisticii test se citeste pentru:
a) v = 23 grade de libertate
b) v=25 grade de libertate
c) v1=9 si v2=14 grade de libertate
a) 0,383
b)0,454
c)0,962
b) u~N(u, 𝑜 2 )
𝑜
c) u~N(u, 𝑛)
√
22. Considerand v numarul gradelor de libertate, intr-un test statistic bilateral, ipoteza nula se respinge
daca
a) |tcalculat|>ta/2,v
b)|tcalculat|<=ta/2,v
c)ta/2,v>|tcalculat|
23. Potrivit datelor Eurostat, in Romania , exporturile de bunuri si serivicii (exprimate in euro/locuitor),
in perioada 2000-2010 au inregistrat urmatoarele
valori:600,700,800,800,1000,1200,1500,1700,2000,1700,2100. Sunt corecte urmatoarele afirmatii
a)Volumul exporturilor Romaniei a crescut in anul 2010 comparativ cu anul 2000 cu 1500euro/locuitor
b)volumul exporturilor Romaniei a crescut, in anul 2010 comparativ cu anul 2000 de 3,5 ori
c)Volumul mediu annual al exporturilor Romaniei , in perioada 2000-2010 a fost de 1281,81 euro/loc.
24. In vederea testarii semnificatiei diferentei dintre o medie u si o valoare fixa u0, pentru un esantion
de volum n=50, se obtine o valoare calculata a statisticii test z=1,52. In cazul unui test bilateral, daca
valoarea teoretica este z=1,645, riscul asumat de a respinge pe nedrept ipoteza H0 este:
a) a=0.10
b) a=0,01
c) a=0,95
a) Cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator momentului curent t,
comparativ cu nivelul aceleasi variabile corespunzator momentului de referinta
b) De cate ori s-a modificat nivelul unei variabile corespunzator momentului curent t, fata de nivelul
aceleasi variabile corespunzator momentului de referinta
c) cu cat s-a modificat, in marime relativa, nivelul unei variabile, corespunzator momentului curent, t
comparativ cu nivelul aceleasi variabile corespunzator momentului anterior, t-1.
a)eroarea de testare de tip I reprezinta eroarea de a respinge ipoteza nula H0, atunci cand in realitate
aceasta este adevarata
b) eroarea de testare de tip I reprezinta eroarea de a accepta ipotza nula H0, atunci cand in realitate
aceasta este falsa
c)probabilitatea asociata erorii de testare de tip I este numita prag de semnificatie si se noteaza cu a
28. Un producator de cereale realizeaza o ancheta privind comportamentul de consum al adultilor din
SUA. S-a extras un esantion de 1600 de persoane si s-a identificat ca 30% dintre persoane sunt
preopcupate de consumul de alimente sanatoase. Pentru 98% incredere, s-a estimat ca intervalul pentru
proportia adultilor din SUA care acorda atentie alimentelor sanatoase. Care sunt afirmatiile adevarate?
29. La un examen, profesorul a stabilit ca elevii care vor obtine un punctaj cuprins intre 80 si 85 vor primi
calficativ anul curent, distributia punctajelor este normala, X~N(75,25). Care este procentul elevilor care
primesc calificativ
a)13,59%
b)47,72%
c)2,28%
30. Se verifica daca exista diferente semnificative intre productivitatea medie a muncii(lei/ora) din
regiunea Romaniei si productivitatea medie a muncii la nivel national, de 45 lei/ora. In urma prelucrarii
datelor, s-au obtinut rezultatele:
Column1
Mean 39,918
Standard Error 0,2629
Median 39.000
Mode 33.000
Standard
Deviation 2.629
Sample Variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 19.000
Minimum 29.000
Maximum 48.000
Sum 3991.8
Count 100.0000
Confidence level(95.0%) 0.515
a) Exista diferente semnificative intre productivitatea medie din regiunea de Nord Est a Romaniei si
cea la nivel national, in conditiile riscului de asumat 5%
b) Valoarea calculata a statisticii test este t=-19,33
c) Nu exista diferente semnificative intre productivitatea medie din regiunea de Nord-Est a
Romaniei si cea la nivel national, in conditiile riscului asumat de 5%
d) Productivitatea medie din Regiunea de Nord-Est este acoperita de [39,403, 40,433] cu o
probabilitate de 95%
31. La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar par este:
a)0,33
b)0,5
c)0,66
32. Pentru testarea diferentei dintre trei si mai multe medii ale unor populatii se folosesc
a)Metoda Anova
b) statistica t
c) statistica Fisher
33. Esantionul reprezinta o subpopulatie sau un subansambu extras din populatia de referinta:
c) din motive de cost, are un volum mai mic decat volumul populatiei
a)conditia de homoscedasticitate
b)conditia de normalitate
c)conditia de independenta
35. Atunci cand se cunoaste dispersia 𝑜 2 , testarea ipotezelor asupra mediei unei populatii se face cu:
a) Statistica t
b) statistica Fisher
c) statistica Z
36. Pentru testarea diferentei dintre doua medii ale unor populatii se foloseste
a) Statistica Fisher
a)0,977
b)0,889
c)0,341
a) regula de decizie
40. Pentru a analiza profitabilitatea firmelor dintr-un judet, s-a extras un esantion de firme si s-a
inregistrat profitul acestora. Rezultatele obtinute in urma prelucrarii datelor de la nivelul esantionului
sunt prezentate in tabelul de mai jos:
Column1
Mean 21
Standard Error 0,793
Median 20
Mode 20
Standard
Deviation 7
Sample Variance 49
Kurtosis 2,233
Skewness 1,114
Range 30
Minimum 10
Maximum 40
Sum 1507
Count 78
Confidence level(95,0%) 1,553
a. 75%
b. 66.2%
c. 95.4%
Variabila numerica este salariul, iar factorul de grupare este regiunea. Pentru un risc de 0.05 se poate
afirma ca:
La un examen profesorul a stabilit ca elevii care vor obtine un punctaj cuprins intre 60 si 80 puncte vor
primi calificativul C. Pentru anul curent distributia punctajelor este normala, X=(75, 25). Procentul
elevilor care primesc calificativul C este de:
a. 12,5%
b. 55%
c. 63%
d. 84%
Intr-un sondaj de opinie, 𝜎 2 =0,18, volumul esantionului care estimeaza parametrul proportie cu o
eroare maxim admisibila de ±3% si o probabilitate de 0,95 este:
a. 768 persoane
b. 1200 persoane
c. 1000 persoane
Intr-un sondaj simplu de 400 produse, 250 au fost gasite expirate. Intervalul de incredere pentru
proportia produselor expirate, cu o probabilitate de 0,90, este:
a. [0,58; 0,66]
b. [0,65; 0,68]
c. [0,51; 0,75]
b. Culoarea ochilor
4. Care dintre urmatoarele forme de distributie discrimineaza cel mai bine subiectii cu rezultate foarte
bune la o examinare psihologica
c. Nominala
b. Estimatiilor
7. Cuantilul este
d. Kurtosis
9. In ce zona discrimineaza mai binele clasele standard construite prin procedeul cuantilelor
a. Seria de valori care exprima rezultatele aceluiasi individ la o anumita solicitare in diferite
momente temporal
b. Esantionului
d. a+c
e. a+b
14. Operatia prin care dintr-o scala cu m categorii obtinem o scala cu n categorii in care m>n se numeste
b. Grupare
b. 0
a. Scala nominala
17. Care din urmatoarele exigente ale constituirii unor tabele statistice este falsa:
18. Daca valoarea indicelui Kurtosis este semnificativ <3 atunci avem o distributie
c. Platicurtica
19. Intr-o distributie cu o asimetrie pozitiva, care este ierarhia valorica a indicatorilor de nivel
b. 5 intervale
21. Scorul care imparte distributia in doua parti egale sau cat mai aproape de valoare se numeste
c. Mediana
a. Nominala
b. Ordinala
c. De interval
d. De raport
e. a+b
f. c+d
24. Care este nivelul maxim de masurare pentru variabila de tipul de temperament
a. Nominal
25. Un cercetator raporteaza ca rezultatele obtinute pe esantionul studiat pot fi extrapolate la nivelul
intregii populatii. Acest rationament apartine statisticii
b. Inferentiale
b. Imprastiere
27. In cazul scorurilor aberante indicatorul statistic care isi pierde relevanta este:
b. Media
a. Media
b. I.V.C
c. Abaterea standard
d. a+b
e. b+c
3. In urma prelucrarii datelor privind venitul lunar (sute euro) realizat pentru un esantion de
persoane, s-au obtinut urmatoarele rezultate
Mean 10
Standard Error 0.730297
Median 9
Mode 9
Standard
Deviation 2.309401
Sample Variance 5.333333
Kurtosis 1.36942
Skewness 1.082532
Range 8
Minimum 7
Maximum 15
Sum 100
Count 10
Condfidence level(95.0%) 1.652046
b)Exista diferente semnificative intre venitul mediu al populatiei si venitul mediu al tarilor din UE, de 15
sute euro
5.Se testeaza diferentele dintre veniturile medii din 2 regiuni, A si B, si se obtin urmatoarele
rezultate: t calc=8,23 , numarul gradelor de libertate=25. Pentru un risc de 5%, sunt adevarate
afrimatiile
a) M(0)=0
c)Are varianta cea mai mica posibil fata de varianta oricarui alt estimator calculat pentru acelasi esantion
10. Esantionul reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta care:
a) poate fi extras aleator, cu revenire sau fara revenire
b) respecta proprietatea de reprezentativitate
c) din motive de cost, are un volum mai mic decat volumul populatiei
12. Atunci cand se cunoaste dispersia O^2 , testarea ipotezelor asupra mediei unei populatii se face cu:
a) statistica t
b) statistica Fisher
c) statistica Z
13. Pentru testare diferentei dintre doua medii ale unor populatii se foloseste :
a) statistica Fisher
b) statistica t, cand nu se cunoaste variatia populatiei
c) statistica Z, cand se cunoaste variatia populatiei
17. Pentru a analiza profitabilitatea firmelor dintr-un judet, s-a extras un esantion de firme si s-a inregistrat
profitul acestora. Rezultatele obtinute in urma prelucrarii datelor de la nivelul esantionului sunt prezentate in
tabelul de mai jos.
Profit
Mean 21
Standard Error 0.793
Median 20
Mode 20
Standard Deviation 7
Sample Variance 49
Kurtosis 2.233
Skewness 1,114
Range 30
Minimum 10
Maximum 40
Sum 1507
Count 78
Confidence Level 1.553
21. La alegerile municipale, s-a dorit identificarea alegatorilor care nu pot fi trecuti pe listele electorale. Din
lista existenta, s-a extras un esantion de 317 nume si s-a determinat ca 38 de nume nu indeplinesc conditiile
de alegator. Municipalitatea doreste sa estimeze intervalul de incredere pentru proportia alegatorilor exclusi
de pe lista electorala, pentru o probabilitate de 99%. Rezultatele corecte sunt:
a) valoarea teoretica utilizata este 1,96
b) intervalul de incredere pentru proportie este [0,073 ; 0,165]
c) intervalul de incredere pentru proportie este [0,05 ; 1,96]
22. In vederea testarii ipotezei de egalitate a salariului mediu cu o valoare fixa u0=46, s-a inregistrat un
esantion de volum n=10 persoane. In acest caz, se pot formula urmatoarele ipoteze statistice:
a) H0 : u = 10; H1: u <> 10
b) H0: u = 46; H1: u <> 46
c) H0: u = 46; H1: u0 < 46
23. Dintr-o populatie s-a extras un esantion de populatie n = 900 persoane. Pentru o variabila X – consumul
saptamanal de paine (kg), s-au obtinut rezultatele x(cu bara sus ca nu l gasesc fmmmm) = 3kg, s’=1kg.
Considerand un risc de 5%, se poate considera ca nivelul consumului mediu saptamanal de paine:
a) este egal cu u0=3,5kg
b) nu difera semnificativ de u0=3,5kg
c) difera semnificativ de u0=3,5kg
24. Se verifica daca exista diferente semnificative intre castigul mediu salariale(sute lei) din regiunea de Nord-
Est a Romaniei si castigul mediu salarial la nivel national, de 14 sute lei. In urma prelucrarii datelor s-au
obtinut urmatoarele rezultate:
Mean 9.981
Standard Error 0.376
Median 9.000
Mode 9.000
Standard Deviation 2.629
Sample Variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 11.000
Minimum 7.000
Maximum 18.000
Sum 486.000
Count 49.000
Confidence Level (95%) 0.755
34. O banca doreste sa verifice corectitudinea informatiilor asupra clientilor sai. S-a extras un esantion aleator
de 200 de dosare si s-au identificat 18 dosare cu informatii gresite. Proportia dosarelor gresite ale bancii
pentru incredere de 95% este acoperita de intervalul:
a) [0,07 ; 0,11]
b) [0,051 ; 0,129]
c) [ 0,09 ; 0,91
35. Se studiaza daca exista diferente semnificative intre speranta medie de viata a femeilor din Europa de Est,
egala cu 68 ani, si speranta medie de viata la nivelul mondial, egala cu anii. ????Se cunosc urmatoarele date:
n=16, s’=3.5 . Sunt adevarate afirmatiile:
a) cu o probabilitate de 95%, nivelul mmediu al sperantei medii de viata a femeilor din Europa de Vest este
acoperit de intervalul de incredere [66.135 ; 69.965]
b) exista diferente semnificative intre speranta medie de viata a femeilor din Europa de Est si media la nivelul
mondial, in conditiile riscului asumat de 5%
c) se garanteaza cu o probabilitate de 90% ca nu exista diferente semnificative intre speranta medie de viata
a femeilor din Europa si media la nivel mondial
77. Nivelul cifrei de afaceri (mld lei) a unei firme pe trimestre a inregistrat in perioada 2014-2015 urmatoarele:
2014 2015
Trim 1 6 10
Trim 2 2 5
Trim 3 5 4
Trim 4 3 2
Stiind ca i=0,85 sunt corecte afirmatiile
a) cifra de afaceri medie a firmei a fost de 4.625 mld lei pe trimestru
b) cifra de afaceri a inregistrat o scadere medie anuala de 15%
c) cifra de afaceri a firmei a crescut in medie cu 85% pe trimestru
d) cifra de afaceri medie a firmei a fost de 4mld lei pe an
a) F(X) = P(X>= x)
b) F(X) = P(X = x)
c) F(x)=P (X < x)
d) F(X) = P(X> x)
2014 2015
Trim. I 6 10
Trim. II 2 5
Trim. III 5 4
Trim. IV 3 2
Estimatia este:
a) O valoarea a esantionului calculata la nivelul esantionului observant
b) O valoare calculata pe baza datelor de sondaj
c) O statistica
d) o valoare fixa si cunoscuta la nivelul unei populatii
La acelasi nivel de incredere si aceeasi varianta, pentru a mari precizia rezultatelor este necesar:
a) sa marim volumul esantionului
b) Sa lucram cu esantioane nealeatoare
c) Sa reducem eroarea de reprezentativitate
Se verifica daca proportia π a clientilor care prefera produsul A in anul curent difera in mod
semnificativ de proportia a clientilor din anul precedent. In acest caz, ipotezele statistice sunt:
a) H0 : π = π0
H1 : π ≠ π0
b) H0 : π = π0
H1 : π < π0
c) H0 : π <= π0
H1 : π > π0
Atunci cand se cunoaste dispersia 𝜎 2 testarea ipotezelor asupra mediei unei populatii se face
cu:
a) Statistica Z
b) statistica t
c) statistica Fisher
Eficienta estimatorului vizeaza:
a) abaterea standard a estimatorului este minima
b) media estimatorului este egala cu 0
c) Dispersia estimatorului egala cu media estimatorului
Pentru a verifica daca femeile sunt supuse riscului de cancer mamar, doctorii au dezvoltat o
metoda noua de dectetare a cancerului. Pentru a proba aceasta metoda au alcatuit un esantion
de 140 de femei cu cancer mamar si au observat ca, in urma aplicarii noiii metode , pentru 12
femei nu s a reusit detectarea cancerului. Stiind ca metoda veche are o rata de esec de 20% ,
pentru un risc asumat de 5% care sunt afirmatiile adevarate?
a) Rata de esec a noii metode difera semnificativ de rata de esec a vechii metode
b) Metoda veche nu difera semnificativ de cea noua
c) Ipoteza alternative este µ≠ 20
La nivelul unui esantion de 306 persoane, 5% dintre acestea nu folosesc niciodata mijloace de
transport in comun. Stiind ca anul trecut ponderea era de 8% care dintre urmatoarele afirmatii
sunt adevarate?
a) H0: π= 8%
b) Pentru un risc asumat de 5% se respinge ipoteza de egalitate a proportiilor
c) Pentru un risc asumat de 1 % se accepta ipoteza de egalitate a proportiilor
d) Varianta variabilei la nivelul esantionului este de 0.0475
Pentru testarea diferentei dintre doua medii ale unor populatii se folseste
a) Statistica fisher
b) Statistica t cand nu se cunoaste varianta populatiei
c) Statistica Z cand se cunoaste varianta populatiei
Pentru o variabila X – N(0,1), P(X>= -1.22) este:
a) 0.977
b) 0.889
c) 0.341
Demersul testarii statistice cuprinde etapele:
a) Regula de decizie
b) Formularea ipotezelor statistice
c) Alegerea valorii calculate a statisticii test
In legatura cu eroarea de testare de tip I sunt adevarate informatiile:
a) Probabilitatea asociata erorii de testare de tip I este numita prag de semnificatie si se
noteaza cu a
b) Eroarea de testare de tip I reprezinta eroarea de a respinge ipoteza nula H0, atunci cand
in realitate aceasta este adevarata
c) Eroarea de tip I reprezinta eroarea de a accepta ipoteza nula H0, atunci cand in realitate
aceasta este falsa
A estima punctual inseamna
a) A calcula limitele unui interval cu o anumita probabilitate
Un politician la inceputul mandatului afirma in mass media ca va creste salariul mediu net pe
economie la… sfarsitul mandatului se face un sondaj pe n= 900 de respondenti prin care se
urmareste estimarea salariului net pe economie (X). se cunosc urmatoarele rezultate:
_
x= 294 EUR si 𝜎 = 90. Selectati care dintre afirmatiile urmatoare sunt valide:
a) putem afirma pentru un prag de semnificatie de 5% ca politicianul s-a tinut de cuvant
b) putem afirma pentru un prag de semnificatie de 3% ca politicianul s-a tinut de cuvant
c) putem afirma pentru un prag de semnificatie de 5% ca politicianul nu s-a tinut de
cuvant
Aplicand metoda ANOVA s-au obtinut urmatoarele rezultate:
Sursa variatiei Suma patratelor variatiei Grade de libertate
Explicata(intergrupe) 300 4
Reziduala(intragrupe) 28
Totala 450 32
Variabila numerica este “Salariul” iar variabila (factorul) de grupare este “Regiune”. In aceasta
situatie se poate afirma ca:
a) se garanteaza cu o probabilitate de 0.95 ca factorul de grupare are o influenta
semnificativa asupra variatiei salariului
b) ipoteza H0 este µt=µ2=µ3=µ4
c) pentru un risc asumat de 5% salariile difera semnificativ pe regiuni
Intr-o Ancheta prin sondaj asupra unui esantion de angajati, s-a observat cuantumul
bonusurilor oferite cu ocazia sarbatorilor de paste, rezultatele fiind prezentate mai jos
Cuantum bonus
Meann 173
Standard error 11.25956384
Median 180
Mode 180
Standard deviation 35.60586715
Sample variance 1267.7777778
Kurtosis 1.175597901
Skewness -0.5844736
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence level(99%) 28.9799368
Se verifica daca exista diferente semnificative intre castigul mediu salarial (sute lei) din regiunea
de nord-est a romaniei si castigul mediu salarial la nivel national, de 14 sute lei. In urma
prelucrarii datelor s-au obtinut urmatoarele date:
Column 1
Mean 9.916
Standard error 0.376
Median 9.000
Mode 5.000
Standard deviation 2.679
Sample variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 11.000
Minimum 7.000
Maximum 15.000
Sum 455.000
Count 49.000
Confidence level(95.0%) 0.755
Pentru α=0.05 sunt adevarate informatiile:
a) Nu exista diferente semnificative intre castigul mediu salarial din regiune de nord-est a
Romaniei si castigul mediu salarial la nivel national in conditiile riscului asumat de 5%
b) Valoarea calculata a statisticii test este t = -10.88
c) Exista diferente semnificative intre castigul mediu salarial din regiunea de nord-est a
Romaniei si castigul mediu salarial la nivel national, in conditiile riscului asumat de 5%
11) Atunci cand se cunoaste dispersia (sigma la a doua), testarea ipotezelor asupra mediei unei
populatii se face cu:
- Statistica Z
12) Dintr-o populatie de 10 studenti, se pot extrage aleator:
- 100 de esantioane de 2 studenti, dupa schema cu revenire;
13) La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar mai mare decat patru este:
- 0,03
14) In metoda ANOVA, variatia explicata ( VE ) masoara:
- Variatia sub influenta factorilor esentiali ( de grupare
15) A estima punctual inseamna:
-A calcula o valoare posibila a estimatorului pe baza datelor inregistrate la nivelul esantionului
observat.
16) Estimatorul nedeplasat:
- Are dispersia egala cu zero
17) La același nivel de încredere si aceeași varianță, pentru a mări precizia rezultatelor este necesar:
- Să reducem eroarea de reprezentativitate.
- Să mărim volumul eșantionului;
18) Functia de repartitie se defineste astfel: ( >= este semnul mai mare sau egal )
- F(x)=P(X)
19) Pentru o variabila X~N(20,16),P(18<X<22) este:
- 0,383
20) Precizia estimarii creste atunci cand
- Varianta esantionului este mica;
-Volumul esantionului creste;
21) La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar par este:
- 0,5
22) Intr-un sondaj aleator simplu de 400 angajati, pentru variabila venitul lunar s-au obtinut
rezultatele de mai jos: ---------------------------------------- Mean - 1200 Standard Deviation - 165 ------------------
---------------------- Pentru o probabilitate de 0.95, intervalul de incredere pentru parametrul medie este:
- [1183,83 ; 1216,17]
-Conditia de normalitate;
-Conditia de independenta;
-Conditia de homoscedasticitate
33) Pentru o variabila X~N(0,1), P(X>=-1,22) este:
- 0,889
34) Sporul absolut cu baza fixa exprima:
-Cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator momentului curent t,
comparativ cu nivelul aceleiasi variabile corespunzator momentului de referinta;
35) Pentru testarea diferentei dintre doua medii ale unor populatii se foloseste:
- Statistica t, cand nu se cunoaste varianta populatiei
- Statistica z, cand se cunoaste varianta populatiei
36) .Aplicand metoda ANOVA, s-au obținut următoarele rezultate:
Sursa variației Suma pătratelor variației Grade de libertate Explicată(intergrupe) 300 4
Reziduală(intragrupe) 26 Totală 450 32 Variabila numerică este "Salariul", iar variabila(factorul) de
grupare este "Regiunea".În această situație, se poate afirma că:
- Pentru un risc asumat de 5%, salariile diferă semnificativ pe regiuni;
- Se garantează cu o probabilitate de 0.95 că factorul de grupare are o influență semnificativă asupra
variației salariatului;
37) Intr-un test statistic bilateral în care se folosește statistica t, considerând v numărul gradelor de
libertate, ipoteza nulă se respinge dacă:
- |tcalculat|>tα/2,v
38) Pentru testarea semnificatiei mediei unei populatii se foloseste:
- Testul F
39) Esantionul reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta care
-Poate fi extras aleator, cu revenire sau fara revenire
-Din motive de cost, are un volum mai mic decat volumul populatiei
1) Pentru testarea diferentei dintre doua medii ale unor populatii se foloseste:
a) Statistica Fisher
b) Statistica t, cand nu se cunoaste varianta populatiei
c) Statistica Z, cand se cunoaste varianta populatiei
7) Pentru a verifica daca femeile sunt supuse riscului de cancer mamar, doctorii au
dezvoltat o metoda noua de detectare a cancerului. Pentru a proba aceasta
metoda au alcatuit un esantion de 140 femei cu cancer mamar si au observant
ca, in urma aplicarii noii metode, pentru 12 femei nu s-a reusit detectarea
cancerului. Stiind ca metoda veche are o rata de esec de 20%, pentru un risc
asumat de 5% care sunt afirmatiile adevarate?
a) Rata de esec a noii metode difera semnificativ de rata de esec a vechii
metode
b) Metoda veche nu difera semnificativ de cea noua
c) Ipoteza alternatica este µ≠20
1.In vederea testarii semnificatiei diferentei dintre o medie µ si o valoarea fixa µ0 pentru un esantion de
volum n=50, obtine o valoare calculate a statisticii test z= 1,52. In cazul unui test bilateral, daca valoarea
teoretica este z=1,654, asumat de a respinge pe nedrept ipoteza H0 este
a) α=0.10
b) α=0.01
c) α=0.95
2. Sporul absolut cu baza fixa exprima:
a) Cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator moementului curent
cu nivelul aceleiasi varaibile corespunzator momentului de referinte
b) De cate ori s-a modificat nivelul unei variabile corespunzatoare momentului current, t comparative
cu nivelul aceleiasi variabile corespunzator momentului anterior, t1
c) Cu cat s-a modificat in marime relativa nivelul unei variabile corespunzator momentului curent, t
comparative cu nivelu aceleiasi variabile corespunzator momentului anterior t1
7. Intr-o ancheta prin sondaj asupra unui esantion de angajati, s-a observant cuantumul bonusurilor oferite
de Paste, rezultatele fiind prezentate mai jos.
Column 1
Mean 173
Standard Error 11.25956384
Median 180
Mode 180
Standard Deviation 35.60586718
Sample Variance 1267.777778
Kurtosis 1.175597901
Skewness -0.584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence Level (99%) 28.9799368
Variabila numerica “venitul” iar variabila (factorul) de grupare este “regiunea”. In aceste situatie, se poate
afirma ca
a) Valoarea teoretica a a statisticii F, considerand un risc de 0.05 este 3.634
b) Volumul esantionului este 19
c) Se garanteaza cu o probalitate de 0.95 ca exista diferente semnificative intre veniturile medii pe regiuni
la nivelul populatiilor
12. Un politician, la inceputul mandatului afirma in mass media ca va creste salariul mediu net pe
economie la 300 EUR. La sfarsitul mandatului se face un sondaj pe n=900 de respondent prin care se
urmareste estimarea salariului mediu net pe economie (X). Se cunosc urmatoarele rezultate 𝑥̅ =294 EUR
si σ=90. Selecteaza care dintre afirmatiile de mai jos sunt valide
a) putem afirma pentru un prag de semnificatie de 5% ca politicianul nu s-a tinut de cuvant
b) putem afirma pentru un prag de semnificatie de 3% ca politicianul s-a tinut de cuvant
c) putem afirma pentru un prag de seminificatie de 5% ca politicianul s-a tinut de cuvant
13. Intr-un sondaj aleator simplu de 400 angajati, pentru o variabila venitul lunar s-au obtinut rezultatele
de mai jos
1200
165
Pentru o probalitate de 0.95, intervalul de incredere pentru parametrul medie este
a) [1183,83; 1216,17]
b) [861,89; 1178,11]
c) [345520,1066; 36,6244]
14. Estimatia este
a) o valoare a esantionului calculate la nivelul esantionului observant
b) o valoare calculate pe baza datelor de sondaj
c) o statistica
d) o valoare fixa si cunoscuta la nivelul unei populatii
15. La acelasi nivel de incredere si aceeasi variatie, pentru a mari precizie rezultatelor este necesar
a) sa marim volumul esantionului
b) sa lucram cu esantioane nealatoare
c) sa reducem eroarea de reprezentativitate
16. Se verifica daca proportia π a clientilor care preferea produsul A, in anul curent, difera in mod
semnificcativ a clientilor din anul precendent. In acest caz, ipotezele statistice sunt
a) H-0:π=πo
H1=π≠π0
b) H0:π=π0
H1:π<π0
C) H0=π<=π0 & H1:π>π0
17. Eficienta estimatorului vizeaza
24. Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimester a inregistrat in perioada 2014-2015
2014 2015
Trim I 6 10
Trim II 2 5
Trim III 5 4
Trim IV 3 2
25. Pentru testarea diferentei dintre doua medii ale unor populatii se folosesc
a) statistica fisher
b) statistica t, cand nu se cunoaste varianta populatiei
c) statistica Z, cand se cunoaste varianta populatiei
26. Pentru o variabila X – N(0,1), P(X≥-1,22) este
a) 0.977
b) 0.889
c) 0,371
27. Demersul testarii statistice cuprinde etapele
a) regula de decizie
b) formularea ipotezelor statistice
c) alegerea valorii calculate a statisticii test
28. La aruncarea unui zar, probabiliatea de aparitie a unui fete cu numar par este
a) 0.33
b) 0.55
c) 0.66
29. Variatia explicate masoara
a) variatia sub influenta factorilor esentiali (de grupare)
b) variatia sub influenta factorilor aleatorii (intamplatori)
c) variatia sub influenta factorilor esentiali si aleatorii (intamplatori)
30. Nivelul vanzarilor unei firme a inregistrat in perioada 2010-2013 urmatoarea evolutie
Sunt corecte afirmatiile
Anii 2010 2011 2012 2013
Volumul vanzarilor (mld lei) 2 8 12 12
33. In vederea testarii ipotezei de egalitate a salariului cu o valoare µ0=46 s-a inregistrat un esantion de
volum n=10 persoane. In acest caz se pot formula urmatoarele ipoteze
a) H0 :µ = 10; H1: µ≠10
b) H0 :µ = 46; H1: µ≠46
c) H0 :µ = 46; H1: µ<46
34. Intr-un sondaj aleatory simplu de 400 de stundet privind opinia la decizia de a schimba sistemul de
evaluare, 250 au fost de accord cu aceasta optiune. Intervalul de incredere pentru parametrul proportiei cu
o probabilitate de 0.90 este
a) [0,4245; 0.7428]
b)[0.5851; 0,6649]
c) [0,3560; 0,6440]
35. Aplicand metoda ANOVA s-au obtinut urmatoarele rezulatate
Sursa variatiei Suma patratelor variatiei Grade de libertate
Explicate intergrupe 300 4
Reziduala intragrupe 150 28
Totala 450 32
Variabila numerica este “salariul” iar variabila (factorul) de grupare este “regiunea”. In aceasta situatie se
poate afirma ca
a) Se garanteaza cu o probalitate de 0.95 ca factorul de grupare are o influenta semnificativa asupra
variatiei salariului
b) Ipoteza H0 este µ1=µ2=µ3=µ4
c) Valoarea calculata a statisticii F este 14
36. Potrivit datelor Eurostat, in Romania, exporturile de bunuri si servicii (exprimate in euro/locuitor), in
perioada 2000-2010 au inregistrat urmatoarele valori 600, 700, 800, 800, 1000, 1200, 1500, 1700, 2000,
1700, 2100.
a) α = 0,10
b) α = 0,01
c) α = 0,095
38. Sporul absolut cu baza fixa exprima
a) cu cat s-a modificat in marime absoluta nivelul unei variabile corespunzatoare momentului curent, t,
comparative cu nivelul aceleasi variabile corespunzatoare momentului de referinta
b) de cate ori s-a modificat nivelul unei variabile corespunzatoare momentului curent t fata de nivelul
aceleiasu variabile corespunzatoare momentului de referinta
c) cu cat s-a modificat, in marime relativa nivelul unei variabile corespunzatoare momentului curent, t
comparative cu nivelul aceleiasi variabile corespunzator momentului anterior t-1
39. Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimester a inregistrat in perioada 2014-2015
2014 2015
Trim 1 6 10
Trim 2 2 5
Trim 3 5 4
Trim 4 3 2
Stiind ca i=0,85 sunt corecte afirmatiile
a) Cifra de afaceri medie a firmei a fost de 4, 625 mld lei pe trimestru
b) Cifra de afaceri a inregistrat o scadere medie anuala de 15%
c) Cifra de afaceri a firmei a crescut in medie cu 85% pe trimestru
d) Cifra de afaceri medie a firmei a fost de 4 mld lei pe an
40. Aplicand metoda ANOVA s-au obtinut urmatoarele rezultate
Sursa variatiei Sursa patratelor Gradele de libertate Estimatori ai variatiei
variatiei
ESS 220 2 100
RSS 120 16 7.5
Variabila numerica este numita “venitul” iar variabila (factorul) de grupare este regiunea in aceasta situatie
se poate afirma ca
a) Se garanteaza cu o probabilitate de 0.95 ca exista diferente semnificative intre veniturile medii pe
regiune la nivelul populatiei
b) Valoarea teoretica a statisticii F, considerand un risc de 0.05 este 3.634
c) Valoarea esantionului este 19
2. Atunci cand se cunoaste dispersia, testarea ipotezelor asupra mediei populatiei se face cu
a) statistica fisher
b) statistica t
c) statistica z
41. In vederea studierii optiunii studentilor din anul 1 de la FEAA privind specializarea pe care o vor urma
se extrage un simplu esantion format din 36 de student si se observa ca proportia celor care prefera
specializarea Alpha. Stiind ca prorportia inregistrata in anul universitar precedent este de π=25% iar pentru
un risc de 0.01 se poate garanta ca
a) nu exista diferente semnificative intre proportia studentilor care prefer specializarea Alpha din anul
curent si proportia inregistrata in anul universitar precedent, in conditiile riscului asumat de 1%
b) exista diferente semnificative intre proportia studentilor care prefer specializarea alpfa din anul curent
si proportia inregistrata in anul universitar precedent, in conditiile riscului asumat de 1%
c) testarea diferentei dintre proportia studentilor care prefer specializarea alpha in anul curent si proportia
din anul anterior se face cu testul t
42. Eficienta estimatorului vizeaza
a) abaterea standard a estimatorului este minima
b) media estimatorului egala cu 0
c) dispersia estimatorului egala cu media estimatorului
3) Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a
obţinut o valoare medie de 8,25 şi o abatere standard de eşantion modificată egală cu 1,8.
Intervalul de încredere pentru parametrul medie, cu o probabilitate de 0,95, este
a) (7,5260 - 9,3424)
b) (8,1280 - 9,2020)
c) (8,0736 - 8,4264)
4) În urma prelucrării datelor privind venitul lunar (sute euro) realizat pentru un eşantion
de persoane, s-au obţinut următoarele rezultate:
Column1
Mean 10
Standard Error 0.730297
Median 9
Mode 9
Standard Deviation 2.309401
Sample Variance 5.333333
Kurtosis 1.36942
Skewness 1.082532
Minimum 7
Maximum 15
Sum 100
Count 10
Confidence Level(95.0%) 1.652046
6). Nivelul vânzărilor unei firme a înregistrat în perioada 2010 - 2013 următoarea
evoluţie:
Anii 2010 2011 2012 2013
Volumul vânzărilor ( mld. lei ) 2 8 10 12
7). Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada
2010-2011 următoarea evoluţie:
2010 2011
Trim. I 1 3
Trim. II 3 5
Trim. III 2 4
Trim. IV 4 7
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, considerând un risc de 0,05, se poate afirma că:
a) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influenţă
semnificativă asupra variaţiei salariului
b) ipoteza H0 este 1 2 3
c) se respinge ipoteza H0
Cumulative
Frequency Percent Valid Percent Percent
Valid Masculin 4 40.0 40.0 40.0
Feminin 6 60.0 60.0 100.0
Total 10 100.0 100.0
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
a) valoarea calculată a statisticii F este 16,33
b) ipoteza H0 este 1
2 3 4
c) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influenţă
semnificativă asupra variaţiei salariului
Variabila numerică este "Venitul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
a) există diferenţe semnificative între veniturile medii pe regiuni la nivelul populaţiilor,
pentru un risc de 5%
b) valoarea teoretică a a statisticii F, considerând un risc de 0,05, este 3,592
c) se respinge ipoteza H 0 : 1 2 3
1) 25% din salariaţii unei întreprinderi au un salariu de cel mult 1000 lei. Această valoare
reprezintă
a) quartila unu
b) mediana
c) quartila trei
5) Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2017 se prezintă astfel:
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210
Numărul studenţilor care au obţinut cel mult nota 8 la examen este:
a) 130 studenţi
b) 190 studenţi
c) 80 studenţi
6) Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2017 se prezintă astfel:
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210
Ponderea studenţilor care au obţinut peste nota 7 la examen este
a) 64,28%
b) 28,57%
c) 38,09%
7) Valoarea vânzărilor (mld. lei) înregistrate de niste firme se prezintă astfel: 10, 12, 15,
18, 10. Pentru exemplul dat, sunt corecte afirmaţiile:
a) vânzările medii sunt de 13 mld .lei
b) jumătate din firme au vânzări de până la 10 mld. lei, iar jumătate din firme au peste 10
mld. lei
c) cele mai multe firme au vânzări de 10 mld. lei
8) Distribuţia firmelor dintr-o localitate după valoarea cifrei de afaceri realizate în anul
2010 este caracterizată prin următoarele valori: x = 17 mld . lei ; Mo = 10 mld . lei ;
Me = 12 mld . lei ; s 2 = 9 . Pentru exemplul dat, sunt corecte afirmaţiile:
a) distribuţia este asimetrică la dreapta
b) media distribuţiei este reprezentativă
c) cele mai multe firme au înregistrat o cifră de afaceri de 12 mld. lei
9) Distribuţiile studenţilor din două serii (seria 1 şi seria 2) după nota obţinută la un
examen în sesiunea ianuarie 2017 se prezintă astfel:
N OTA_1
N OTA_2
3 4 5 6 7 8 9 10 11
Mean 23.57
Standard Error 0.45
Median 23.00
Mode 22.00
Standard Deviation 2.46
Sample Variance 6.05
Kurtosis -1.06
Skewness 0.33
Range 8.00
Minimum 20.00
Maximum 28.00
Sum 707.00
Count 30.00
11) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut
rezultatele din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00
12) Pentru două judeţe, A şi B, s-a înregistrat rata şomajului (%) în perioada 1990-2011.
Rezultatele sunt reprezentate in figura de mai jos.
judetul_B
judetul_A
4 6 8 10 12 14 16 18 20 22
12. Se consideră distribuţia persoanelor pe medii de rezidenţă după salariul lunar obţinut
(sute lei) prezentată astfel:
Mediul Salariu
9 12 15 20
Urban 1 5 7 15
Rural 6 4 2 1
13. Se consideră distribuţia persoanelor pe medii de rezidenţă după salariul lunar obţinut
(sute lei), prezentată astfel:
Mediul Salariu
8-10 10-12 12-14 14-16
Urban 1 5 7 15
Rural 6 4 2 1
b) o statistică
a) o estimaţie
b) un parametru
c) un estimator
a) 64,5%
b) 80%
c) 90%
a) 0,1915
b) 0,3085
c) 0,6915
6) Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a
obţinut o valoare medie de 8,25 şi o abatere standard de eşantion modificată egală
cu 1,8. Intervalul de încredere pentru parametrul medie, cu o probabilitate de 0,95,
este
a) [ 7,5260; 9,3424 ]
b) [8,1280 ;9,2020 ]
c) [8,0736 ;8,4264 ]
7) Într-un sondaj aleator simplu de 400 studenţi privind opinia cu privire la decizia de
a schimba sistemul de evaluare, 250 au fost de acord cu această opţiune. Intervalul
de încredere pentru parametrul proporţie, cu o probabilitate de 0,90, este
a) [0,5851 ;0,6649 ]
b) [0,4245 ; 0,7428]
c) [ 0,3560; 0,6440]
8) Intr-o anchetă prin sondaj asupra unui eşantion de angajaţi, s-a observat
cuantumul bonusurilor oferite cu ocazia Sărbătorilor de Paşte, rezultatele fiind
prezentate mai jos.
Column1
Mean 23.78
Standard Error 0.62
Median 24.00
Mode 26.00
Standard Deviation 1.86
Sample Variance 3.44
Kurtosis -1.57
Skewness -0.19
Range 5.00
Minimum 21.00
Maximum 26.00
Sum 214.00
Count 9.00
Confidence Level(95.0%) 1.43
9) Într-un sondaj aleator simplu de 400 angajaţi, pentru variabila venitul lunar s-au
obţinut rezultatele de mai jos:
Venitul lunar
Mean 1020
Standard Deviation 158,11
a) [ 1004,51; 1035,49]
b) [861,89 ; 1178,11]
c) [34520,1066;36,6244]
10) Se verifică dacă există diferenţe semnificative între câştigul mediu salarial (sute
lei) din regiunea de Nord-Est a României şi câştigul mediu salarial la nivel naţional,
de 14 sute lei. În urma prelucrării datelor, s-au obţinut următoarele rezultate:
Column1
Mean 9.918
Standard Error 0.376
Median 9.000
Mode 9.000
Standard Deviation 2.629
Sample Variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 11.000
Minimum 7.000
Maximum 18.000
Sum 486.000
Count 49.000
Confidence 0.755
Level(95.0%)
11) Se studiază dacă există diferenţe semnificative între speranţa medie de viaţă a
femeilor din Europa de Est, egală cu 68 ani, şi speranţa medie de viață a femeilor la
nivel mondial, egală cu 70 ani. Se cunosc următoarele date: n = 16; s' = 1,75.
Sunt adevărate afirmaţiile:
a) H o : = 10; H 1 : 10
b) H o : 0 = 46; H 1 : 0 46
H o : = 46; H1 : 46
c)
18.
Venitul lunar
Mean 1020
Standard Deviation 158,11
a) [881,89; 1178,11]
b) [1004,51; 1035,46]
c) [34520, ....]
2010 2011
Trim1 1 2
Trim2 5 4
Trim3 2 5
Trim4 4 8
Stiind ca Ī=1,34, sunt corecte afirmatiile :
a) Cifra de afacere medie a firmei a fost in medie de 2,87% mld lei pe trimestru
b) Cifra de afaceri media a firmei a fost de 4,245 mld lei pe trimestru
c) Cifra de afaceri medie a firmei a crescut in medie cu 34%
a) 0,383
b) 0,982
c) 0,454
24. Atunci cand se cunoaste dispersia α*2
a) Statistica Z
b) Statistica Fisher
c) Statistica t
a) Rata de variatie
b) Sporul absolut
c) ....sporului
28. La un examen profesorul a stabilit ca elevii care vor obtine un punctaj cuprins intre 80 si 85...
a) 13, 59%
b) 47,72%
c) 2,28%
29. Se verifica daca exista diferente semnificative intre productivitatea medie a muncii(lei/ora)
Column1
Mean 39.918
Standard error 0.2629
median 39.000
mode 33.000
Standard deviation 2.629
Sample variace 6.910
kurtosis 1.217
skewness 1.161
range 19.000
minimum 29.000
maximum 48.000
sum 3991.8
count 100.000
Confindece level(95,0%) 0.515
Pentru α=0,05, sunt adevarate afirmatiile:
30. La aruncarea unui zar , probabilitatea de apartie a unei fete cu numar par este:
a) 0,33
b) 0,5
c) 0,66
3. Intr-o ancheta prin sondaj asupra unui esantion de angajati, s-a observat cuantumul bonusurilor
oferite de Paste, rezultatele fiind prezentaete mai jos.
Cuantum bonus
Mean 173
Standard error 11,25956384
Median 180
Mode 180
Standard deviation 35,60586718
Sample Variance 1267,777778
Kurtosis 1, 175597901
Skewness -0,584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence level(99,0) 28,9799368
a) Intervalul de incredere care acopera valorea medie a bonusurilor la nivelul tuturor angajatilor
99% este [161,75; 184,25]
b) Volumul esantionului este 10
c) Eroarea maxim admisibila este 28,97
d) Riscul asumat in estimarea prin interval de incredere a mediei este de 5%
a) Cu cat s-a modificat, in marime relativa, nivelul unei variabile corespunzator momentului
aceleiasi variabile corespunzator momentului de timp anterior, t-1.
b) De cate ori s-a modificat, nivelul unei variabile corespunzator momentului curent, t,
corespunzator momentului de timp anterior, t-1
c) Cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator, aceleasi
variabile corespunzator momentului de referinta.
18. Pentru o variabila X-N(µ,θ*2) se cere sa se calculeze probabilitatea P(µ, θ*2) probabilitatea este:
a) 75%
b) 68,2%
c) 95,4
a) Conditia normalitate
b) Conditia de independenta
c) Conditia de hornoscedasticitate
23. Intr-un sondaj aleator simplu de 900 de studenti, pentru variabila nota la un test....
a) [7,5260 ; 9,3424]
b) [7,3955 ; 7,604]
c) [8,1280 ; 9,2020]
a) 0,383
b) 0,962
c) 0,454
21. O banca doreste sa verifice corectitudinea informatiilor asupra clientilor sai. S-a extras un
esantion aleator de 200 de doasare si s-au identidicat 18 dosare cu informatii gresite. Proportia
dosarelor cu greseli ale bancii, pentru o incredere de 95%, este acoperita de intervalul
a) [0,051;0,129]
b) [0,09;0,91]
c) [0,07;0,11]
22. Se studiaza daca exista diferente semnificative intre speranta medie de viata a femeilor din
Europa de Est, egala cu 63 de ani, si speranta de medie de viata a femeilor la nivel mondial, egal cu
70 de ani. Se cunosc urmatoarele date n=16; α=1,75.
a) Exista diferente semnificative intre speranta medie de viata a femeilor din Europa de Est si
media la nivel mondial, in conditiile riscului asumat de 5%
b) Cu o probabilitate de 95% nivelul mediu al sperantei medii de viata a femeilor din Europa de
est este acoperita de intervalul de incredere(65,068;68,938)
c) Se garanteaza cu o probabilitate de 90% ca nu exista diferente semnificative intre speranta
medie de viata a femeilor din Europa de est si media la nivel mondial.
23. In urma prelucrarii datelor privind veniturile famiilor, inregistrata la nivelul unui esantion de
volum n=625.
a) Se accepta ipoteza H0
b) Se respinge ipoteza H0
c) Exista diferente semnificative intre cele doua medii
25. Intr-un test statistic bilateral in care se foloseste statistica t, considerand v numarul gradelor de
libertate, ipoteza nula nu se respinge daca:
a) |t calculat|≤tα
b) t>tn
c) tα<|t calculat|
a) o estimatie
b) un estimator
c) un parametru
a) 0,6915
b) 0,3085
c) 0,3830
13. Intr-un sondaj aleator simplu de 400 studenti, pentru variabila nota la un test, s-a obtinut o
valoare medie de 8,25 si o abatere standard de esantion modificata egala cu 1.8 intervalul de
incredere pentru parametrul medie, cu o probabilitate de 0.95 este
a) [8,1280;9,2020]
b) [8,0736;8,4264]
c) [7,5260;9,3424]a
14. Esantionul reprezinta reprezinta o subpopulatie sau un subasamblu extras din populatia de
referinta care:
2. Esantionul reprezinta:
a. o variabila aleatoare
3.Considerand v numarul gradelor de libertate, intr-un test statistic bilateral, ipoteza nula se respinde
daca:
a.[Tcalc]>T6/2.v
b.T6/2.v>[Tcalc]
c. [Tcalc]≤T6/2
4. In vederea testarii ipotenuzei de egalitate a salariului cu o valoare fixa µ =46 s-a inregistrat un
esantion de volum n=10. In acest caz se pot formula urmatoarele ipoteze statistice:
a. Hₒ:µ=10;H1:µ∞10
b. . Hₒ:µ=46; H1:µ∞46
c. . Hₒ:µ=46; H1:µ<46
5. Intr-un sondaj simplu de 400 de strudenti privind opinia cu privier la decizia de a schimba sistemul de
evaluare, 250 au fost de accord cu aceasta optiune. Intrevalul de incredere pentru parametrul
populatiei, cu o probabilitate de 0,90, este:
a.[0,4245;0,7428]
b.[0,5851;0,6649]
c.[0.3560;06440]
6. Pentru o variabila X~N(µ,o²) se cere sa se calculeze probabilitatea P(µ-Ơ<x<µ+Ơ). A ceasta
probabilitate este:
A 68,2%
B 95%
C 75%
a. 0.6915
b. 0.3085
c 0.3830
A. MǾ=Ǿ
c.are variatia cea mai mica probabil fata de variatia oricaruialt estimator calculat pentru acelasi
esantion.
Variabila numerica este Salariul , iar variabila de grupare este Regiunea. In aceasta situatie, se poate
afirma ca:
b. Ipotenuza h0 este
12. La alegerile municipal s-a droit identificarea alegatorilor care nu pot fi trecuti pe lista electorala, din
lista existenta s-a extras aleatory un esantion de 317 nume si s-a detrminat ca 38 de nume nu
indeplinesc conditiile de alegator. Municipalul doreste sa estimeze intervalul de incredere pentu
proportia alegatorilor exclusive de pe lista electorala pentu o probabilitate de 99%. Rezultatele corecte
sunt:
13. La un examen profesorul a stability ca elevii care vor obtine un punctaj cuprins intre 80 si 90 de
puncte vor primi calificativul B. pentru anul current, distributia punctelor este normal. X~N(83:25). Care
este procentul elevilor care primesc calificativul B?
a.64,5%
b.80%
c. 90%
4) În urma prelucrării datelor privind venitul lunar (sute euro) realizat pentru un eşantion de persoane, s-
au obţinut următoarele rezultate:
Column1
Mean 10
Median 9
Mode 9
Skewness 1.082532
Minimum 7
Maximum 15
Sum 100
Count 10
b) există diferențe semnificative între venitul mediu al populației și venitul mediu al țărilor din UE, de
15 sute euro;
7). Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada 2010-2011
următoarea evoluţie:
2010 2011
Trim. I 1 3
Trim. II 3 5
Trim. III 2 4
Trim. IV 4 7
3)Pentru a testa diferența dintre trei și mai multe medii ale unor populatii se folosesc :
a) Statistici Fisher
b) Metoda Anova
c) Statistica t
2014 2015
Trim. 1 6 10
Trim.2 2 5
Trim.3 5 4
Trim.4 3 2
H1:µ ≠µ0
b) H 0: µ ≠ µ 0
H1:µ =µ0
c) H 0: µ = µ 0
H1:µ >µ0
b) 0,454
c)0,382
7) Intr-un sondaj de opinie, cunoscând σ la a2a π =0,15 volumul eşantionului care estimează
parametrul proportie cu o eroare maxim admisibilă de ±3% şi o probabilitate de 0,95 este
a) 640
b)1067
c) 2040
8) Distribuția de selecție (distribuția unui estimator) admite:
a) o medie
b) o lege de repartiție
c)un set de valori posibile
9) La alegerile municipale, s-a dorit identificarea alegătorilor care nu pot fi trecuți pe lista
electorală. Din lista existentā, s-a extras aleator un eşantion de 317 nume și s-a determinat că
38 de nume nu îndeplinesc condițiile de alegător. Municipalitatea doreşte să estimeze
intervalul de încredere pentru proporția alegătorilor excluşi de pe lista electorală, pentru o
probabilitate de 99%. Rezultatele corecte sunt:
a) valoarea teoretică utilizată este 1,96
b)[0.073; 0,165]
c)[0,05 :1,96]
10) Intr-un sondaj aleator simplu de 400 angajați. pentru variabila venitul lunar s-au obținut
rezultatele de mai jos:
Venitul lunar
Mean 1020
b) 75%
c)68,2%
12) Demersul testarii statistice cuprinde etapele:
a)formularea ipotezelor statistice
b)regula de decizie
14) Considerând v numarui gradelor de libertate, intr-un test statistic bilateral, ipoteza nulă se
respinge dacă:
c) |t calculat|≤ tα/2,v
15) Probabilitatea este o valoare .
a)mai mică sau cel mult egală cu unu
b)pozitiva
17) Din două populații cu varianțele Ꝺ²₁ =Ꝺ²₂ , se extrag eşantioanela de volum n₁=15 si n₂=17.
In vedere testarii ipotezei de egalitate a medilor celor două populații, valoarea teoretică a
statisticii test, pentru un prag de semnificație α = 0,05
b)testarea diferentei dintre proporția studenților care preferă specializarea Alpha în anul curent
şi proporția din anul precedent se face cu testul Z
c) nu există diferențe semnificative intre proporția studenților care prefera specializarea Alpha
în anul curent și proporția inregistrata in anul universitar precedent, In condițile riscului asumat
de 5%
a) F(x) = P(X≥x)
b) F(x) = P(X=x)
c) F(x) = P(X>x)
d) F(x) = P(X<x)
23. In legatura cu eroarea de tip II , sunt adevarate afirmatile:
H₁ : µ ≠µ₀
25) Demersul testari statistice cuprinde etapele
a) calculul valori statistice test
b) regula de decizie
c) formularea ipotezelor statisticefeaa
26) Intr-un sondaj aleator simplu de 400 student, pentru variabila nota la un test, s-a obinut o
valoare medie de 8.25 si o abatere standard de esantion modificata egala cu 1.8. Intervalul de
incredere pentru parametrul medie, cu o probabilfate de 0,95, este
a) [6,1280 ; 9.2020 ]
b) [8.0736 ; 8,4264 ]
c) [7.5260 ; 9.3424 ]
27) Estimatorul reprezinta
a) o variabila aleatoare
a) |t calculat| ≤ tα/2,v
29) In vederea testari ipotezei de egalitate a salariului mediu cu o valoare fixa, µ₀= 46 s-a
inregistrat un eşantion de volum n=10 persoane. In acest caz se pot formula umătoarele ipoteze
statistice:
a) H₀ : µ = 10; H₁ : µ≠ 10
b) H₀ : µ = 46; H₁ : µ ≠ 46
c) H₀ : µ₀ = 46; H₁ : µ₀ <46
30) Intr-un sondaj alealor simplu de 400 student privind opinia cu privire la decizia de a schimba
sistemul de evaluare, 250 au fost de acord cu aceasta optiune. Intervalul de incredere pentru
parametrul proporie, cu o probabilitate de 0,90. este
a) [0.4245 : 0.7428]
b) [0.5851 : 0.6649]
c)[0.3580, 0,8440]
31) Pentru o variabila X-N (µ,Ꝺ²)se cere sa se calculeze probabilitatea P(µ - Ꝺ < X < µ + Ꝺ)
Aceasta probabilitate este:
a) 68,2%
b) 95%
c) 75%
32) Pentru o variabila X-N (10,4) , P(X >11) este
a) 0,6915
b) 0.3085
33)Aplicand metoda ANOVA s-au obtinut urmatoarele rezultate:
Variabila numerica este "Salariul”, iar variabila (factorul) de grupare este "Regiunea". In aceasta
situatje, se poate afirma ca:
a) se garanteaza cu o probabilitate de 0,95 ca factorul de grupare are o influenta semnificativa
asupra variatiei salariului
b) ipoteza H₀ este µ₁= µ₂= µ₃= µ₄
c) Pentru un risc asumat de S%, salariile difera semnificativ pe regiuni
d) valoarea calculata a statisticii F este 14
35) La un examen, profesorul a stabilit ca elevii care vor obține un punctaj cuprins Intre 80 şi 85
vor primi calificativele din anul curent, distribuția punctajelor este normala,X=N(75,25) Care
este procentul elevilor care primesc calificative ….
a) 13,59%
b) 47,72%
c) 2,28%
36) Se verifică dacă există diferențe semnificative intre productivitatea medie a muncii (lel/ora)
din regiunea Romaniei și productivitatea medie a muncii la nivel national, de 45 lei/ora. In urma
prelucrarii datelor, s-au obtinut urmatoarele rezultate:
Column 1
Mean 39.918
Standard Error 0.2629
Median 39.000
Mode 33.000
Standard Deviation 2.629
Sample Variance 6.9101
Kurtosis 1.217
Skewness 1.161
Range 19.000
Minimum 29.000
Maximum 48.000
Sum 3991.8
Count 100.000
Confidence Level (95.0%) 0.515
c) 0,66
TIPURI DE ÎNTREBĂRI GRILĂ
pentru examenul disciplinei ”Bazele statisticii”
3) Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a
obţinut o valoare medie de 8,25 şi o abatere standard de eşantion modificată egală cu 1,8.
Intervalul de încredere pentru parametrul medie, cu o probabilitate de 0,95, este
a) (7,5260 - 9,3424)
b) (8,1280 - 9,2020)
c) (8,0736 - 8,4264)
4) În urma prelucrării datelor privind venitul lunar (sute euro) realizat pentru un eşantion
de persoane, s-au obţinut următoarele rezultate:
Column1
Mean 10
Standard Error 0.730297
Median 9
Mode 9
Standard Deviation 2.309401
Sample Variance 5.333333
Kurtosis 1.36942
Skewness 1.082532
Minimum 7
Maximum 15
Sum 100
Count 10
Confidence 1.652046
Level(95.0%)
6). Nivelul vânzărilor unei firme a înregistrat în perioada 2010 - 2013 următoarea
evoluţie:
Anii 2010 2011 2012 2013
Volumul vânzărilor ( mld. lei ) 2 8 10 12
7). Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada
2010-2011 următoarea evoluţie:
2010 2011
Trim. I 1 3
Trim. II 3 5
Trim. III 2 4
Trim. IV 4 7
8). Aplicând metoda ANOVA(se foloseste pentru mai multe madii) s-au obţinut
următoarele rezultate:
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, considerând un risc de 0,05, se poate afirma că:
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
a) valoarea calculată a statisticii F este 16,33
b) ipoteza H0 este µ1 =µ2 =µ3 =µ4
c) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influenţă
semnificativă asupra variaţiei salariului.
15. Aplicând metoda ANOVA s-au obţinut următoarele rezultate:
Variabila numerică este "Venitul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
CURS RECAPITULATIV
3.Pentru un esantion de companii se cunosc datele din tabelul de mai jos. Care
afirmatii sunt adevarate?
Profit
Mean 17.5
Standard Error 1.416176386
Median 19
Mode 20
Standard Deviation 4.478342948
Sample Variance 20.05555556
Kurtosis -1.180377683
Skewness -0.487108841
Range 13
Minimum 10
Maximum 23
Sum 175
Count 10
Confidence Level(95.0%) 3.203615996
Pentru un risc asumat de 5%, care dintre afirmatiile urmatoare sunt adevarate:
a. Ipoteza nulă este
b. Există diferenţe semnificative de performanţă între angajaţii care au urmat cursul si
cei care nu au urmat cursul
c. Cursul urmat nu are influenţă asupra vânzărilor
d. Cursul urmat are influenţă asupra vânzărilor
5. Profitul unei firme a crescut in 2012 faţă de nivelul din 2000 cu 25%. Acest
rezultat s-a obtinut folosind:
a. Indicele de variatie cu baza in lant
b. Rata medie a sporului
c. Rata sporului cu baza fixa
d. Rata sporului cu baza in lant
e. Sporul absolut cu baza fixa
a.
b. Pentru un risc asumat de 5%, se respinge ipoteza de egalitate a proporţiilor
c. Pentru un risc asumat de 1%, se acceptă ipoteza de egalitate a proporţiilor
d. Varianţa variabilei la nivelul eşantionului este 0,0475
9. La aruncarea unui zar, probabilitatea de apariţie a unei feţe cu număr mai mic
decât patru este:
a. 50%
b. 0,5
c. 0,25
10.Într-un sondaj aleator simplu de 400 produse, 250 au fost gasite expirate.
Intervalul de încredere pentru proporţia produselor expirate, cu o probabilitate de 0,90,
este:
a. [0,58 ;0,66 ]
b. [0,65 ;0,68 ]
c. [0,51 ;0,75 ]
11. La un examen, profesorul a stabilit că elevii care vor obţine un punctaj cuprins
între 60 şi 80 puncte vor primi calificativul C. Pentru anul curent, distribuţia punctajelor
este normală, . Procentul elevilor care primesc calificativul C este:
a. 12,5%
b. 55%
c. 63%
d. 84%
Trim. I 1 3
Trim. II 3 5
Trim. III 2 6
Trim. IV 5 8
14. Pentru un esantion de intreprinderi s-a inregistrat marimea firmei (mica, medie,
mare) si nivelul profitului (mld. Lei). Datele obtinute, considerand un risc de 0,05, sunt
prezentate in tabelul de mai jos:
1. Estimatorul reprezintă:
A. O valoare de forma 0=f(x1,x2,x3,...,Xn)
B. O variabila aleatoare
C. O valoare fixa si cunoscuta la nivelul unei populatii
2. In metoda ANOVA, variatia explicata ( VE ) masoara:
A. Variatia sub influenta factorilor esentiali si aleatori ( intamplatori)
B. Variatia sub influenta factorilor esentiali ( de grupare )
3. La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar par este:
A. 0.33
B. 0.5
C. 0.66
4. Atunci cand se cunoaste dispersia (sigma la a doua), testarea ipotezelor asupra
mediei unei populatii se face cu:
A. Statistica Z
B.Statistica t
C. Statistica Fisher
5. Eficienta estimatorului vizeaza:
A. Abaterea standard a estimatorului este minica
B. Media estimatorului egala cu 0
C.Dispersia estimatorului egala cu media estimatorului
D. Option4
6. Nivelul vânzărilor unei firme a înregistrat în perioada 2010 - 2013 următoarea
evoluţie: Anii 2010 2011 2012 2013 Volumul vânzărilor ( mld. lei ) 2 8 10 12
A. Vânzările firmei au crescut în 2013 faţă de 2011 cu 50%
B. Vânzările firmei au crescut în 2013 faţă de 2011 cu 150%
C. Vânzările firmei au crescut în 2012 faţă de 2011 de 1,25 ori
D. Vânzările firmei au crescut în medie cu 3,33 mld. lei pe an
7. Estimatorul este nedeplasat daca: ( acel 0 este teta din alfabetul grecesc)
A. M(0)=0
B. V(0)-->0 cand n-> N
C. Are varianţa cea mai mică posibil faţă de varianţa oricărui alt estimator calculat pentru
acelaşi eşantion
D. Option4
25. In vederea studierii opțiunii studențiior din anul I de la FEAA privind specializarea pe care o vor
urma, se extrage aleator simplu repetat un eşantion format din 16 studenti și se observa ca
proportia celor care preferă specializarea Alpha este de 35%.
Ştind ca proporția inregistrată în anul universitar precedent este π0 =33%, pentru un risc de α=0,05,
se poate afirma ca:
a) nu există diferențe semnificative între proporția studenților care preferă specializarea Alpha in
anul curent şi proportia Inregistrata in anul universitar precedent, in condițiile riscului asumat de 5%
b) valoarea teoretică a statisticii test este t=2.131
c) există diferente semnificative intre proporția studenților care preferă specializarea Alpha in anul
curent şi proportia inregistrată In anul universitar precedent, in conditiile riscului asumat de 5%
2. Pentru testarea diferenței dintre trei și mai multe medii ale unor populații se folosesc:
a)metoda ANOVA
b)statistica t
c)statistica Fisher
3.Estimatorul reprezintă
a)o valoarea de forma 0=f(x1,x2,...,xn)
b)o variabila aleatoare
c)o valoare fixa și cunoscuta la nivelul unei populații
4.Aplicand metoda ANOVA s-au obținut următoarele rezultate:
Sursa variație Suma patratelor Grade de libertate Estimatori ai variantei
variației
Explicata(Intergrupe) 81 3 27
Reziduala(intragrupe) 250 21 11.9
Variabila numerica este “Venitul”, iar variabila (factorul) de grupare este “Regiunea”. Pentru
exemplu, sunt adevărate afirmațiile:
a)se poate garanta cu o probabilitate de 0,95 ca exista diferențe semnificative
b)volumul esantionului este 22
c)valoarea teoretica a statisticii F, considerând un risc de 0,05, este 3,073.
5.Intr-o ancheta prin sondaj asupra unui eșantion de angajați, s-a observat cuantumul bonusurilor
oferite se paste, rezultatele fiind prezentate mai jos:
Mean 173
Standar error 11,25956384
Median 180
Mode 180
Standard deviation 35,60586718
Sample variance 1267,777778
Kurdistan 1,175597901
Skewness -0,584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidente level(99,0%) 28,9799368
Sunt corecte afirmațiile:
a)intervalul de încredere care acoperă valoarea medie a bonusurile la nivelul tuturor angajaților ..
99% este [161,75; 184,25]
b)volumul esantionului este 10
c)eroarea maxima admisibilă este 28,97
d)riscul asumat in estimarea prin interval de încredere este 5%
16. Estimatia este
a) o valoare a estimatorului calculata la nivelul eșantionului observat
b) o valoare calculata pe baza datelor de sondaj
c) o statistica
d) o valoare fixa și cunoscuta la nivelul unei populații
17. La același nivel de încredere și aceeași varianta, pentru a mari precizia rezultatelor este necesar:
a)sa mărim volumul esantionului
b)sa lucram cu eșantioane nealeatoare
c)sa reducem eroarea de reprezentativitate
18. Se verifica dacă proporția π a clienților care prefera produsul A, in anul curent, diferă in mod
semnificativ de proporția clienților din anul precendent. In acest caz, ipotezele statistice sunt:
a) H0: π= π0
H1: π≠π0
b) H0: π≠π0
H1: π < π0
c)H0: π <= π0
H1: π > π0
19. Atunci când se cunoaște dispersia(Ỽ patrat), testarea ipotezelor asupra mediei unei populații se
face cu:
a) statistica Z
b) statistica t
c) statistica Fisher
20. Eficienta estimatorului vizează:
a) abaterea standard a estimatorului este minima
b)media estimatorului este egala cu 0
c) dispersia estimatorului egala cu media estimatorului
21. Dintr-o populație de 10 studenti se pot extrage aleator:
a) un număr infinit de eșantioane
b) 1000 de eșantione de 2 studenti, după schema de revenire
b) 100 de eșantioane de 2 studenti, după schema de revenire
27. Un producător de cereale realizează o ancheta privind comportametul de consum al adulților din
SUA . Eșantion de 1600 de persoane, 30% din persoane sunt preocupate de consumul de alimente
sănătoase. Pentru 98% încredere, s-a estimat ca intervalul pentru proporția adulților din SUA care
acorda atenție alimentelor sănătoase. Care afirmații sunt adevărate?
a)Intervalul de încredere este [0,278;0,322]
b)proporția de 30% este o estimatie??
c)valoarea teoretica utilizată este 1,96
28. La un examen, profesorul a stabilit ca elevii care vor obține un punctaj între 80 și 85 vor primi ca..
anul curent, distribuția punctajelor este normala, X~N(75,25). Care este procentul elevilor care
primesc ca..?
a)13,59%
b)47,72%
c)2,28%
29. Se verifica dacă exista diferențe semnificative intre productivitatea medie a muncii(lei/ora) din
regiunea de Nord-Est a României și productivitatea medie a muncii la nivel național, de 45 lei/ora.
Rezultatele:
Mean 39,918
Standard error 0,2629
Median 39,000
Mode 33,000
Standard Deviation 2,629
Sample Variance 6,910
Kurtosis 1,217
Skewness 1,161
Range 19,000
Minimum 29,000
Maximum 48,000
Sum 3991,8
Count 100,000
Confidence level(95%) 0,515
Pentru α=0,05 sunt adevarate afirmatiile:
a)exista diferente semnificative intre productivitatea medie din regiunea de nord-est a Romaniei si
cea la nivel national, in conditiile de risc asumat de 5%
b)valoarea calculata a statisticii test este t=-19,33
c)nu exista diferente semificative intre productivitatea medie din regiunea de nord-est a Romaniei si
cea la nivel national, in conditiile de risc asumat de 5%
d)productivitatea medie din Regiunea de Nord-Est este acoperita de intervalul [39,403;40,41], cu o
probabilitate de 95%
6.In metoda ANOVA, varianta explicata(VE) masoara:
a)varianta sub influenta factorilor esentiali si aleatori(intamplatori)
b)varianta sub influenta factorilor esentiali(de grupare)
c) variaţia sub influenţa factorilor aleatori (întâmplători)
2) Pentru testarea diferenței dintre trei și mai multe medii ale unor populații se folosesc:
a) metoda ANOVA
b) statistica t
c) statistica Fisher ???
3) Într-o anchetă prin sondaj asupra unui eșantion de angajați, s-a observat cuantumul bonusurilor oferite de
sărbătorile de Paște, rezultatele fiind prezentate mai jos.
Cuantum bonus
Mean 173
Standard Error 11,25956384
Median 180
Mode 180
Standard Deviation 35,60586718
Sample Variance 1267,777778
Kurtosis 1,175597901
Skewness -0,584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence Level (99,0%) 28,9799368
4) Estimatorul reprezintă
a) o valoare de forma θ = f( x1, x2,...,xN )
b) o variabilă aleatoare
c) o valoare fixă și cunoscută la nivelul unei populații
6) Pentru testarea diferenței dintre două medii ale unor populații se folosește:
a) statistica Fisher
b) statistica t, când nu se cunoaște varianța populației
c) statistica Z, când se cunoaște varianța populației
10) La același nivel de încredere și aceeași varianță, pentru a mări precizia rezultatelor este necesar:
a) să reducem eroarea de reprezentativitate
b) să mărim volumul eșantionului
c) să lucrăm cu eșantioane nealeatoare
12) Un producător de cereale realizează o anchetă privind comportamentul de consum al adulților din SUA. S-a extras
un eșantion de 1600 de persoane și s-a identificat că 30% dintre persoane sunt preocupate de consumul de alimente
sănătoase. Pentru 98% încredere, s-a estimat intervalul pentru proporția adulților din SUA care acordă atenție
alimentelor sănătoase. Care afirmații sunt adevărate?
a) intervalul de încredere este [0,278; 0,322]
b) proporția de 30% este o estimație
c) valoarea teoretică utilizată este 1,96
13) La un examen, profesorul a stabilit că elevii care vor obține un punctaj cuprins între 80 și 85 vor primi calificativ. În
anul curent, distribuția punctajelor este normală, X ~ N(75,25). Care este procentul elevilor care primesc calificativ?
a) 13,59%
b) 47,72%
c) 2,28%
14) La aruncarea unui zar, probabilitatea de apariție a unei fețe cu număr par este:
a) 0,33
b) 0,5
c) 0,66
15) Se verifică dacă există diferențe semnificative între productivitatea medie a muncii (lei/ora) din regiunile României
și productivitatea medie a muncii la nivel național, de 45 lei/ora. În urma prelucrării datelor, s-au obținut următoarele
rezultate:
Mean 39,918
Standard Error 0,2629
Median 39,000
Mode 33,000
Standard Deviation 2,629
Sample Variance 6,910
Kurtosis 1,217
Skewness 1,161
Range 19,000
Minimum 29,000
Maximum 48,000
Sum 3991,8
Count 100,000
Confidence Level (95.0%) 0,515
17) Se verifică dacă proporția π a clienților care preferă produsul A în anul curent, diferă în mod semnificativ de
proporția π 0 a clienților din anul precedent. În acest caz, ipotezele statistice sunt:
a) H0 : π = π 0
H1 : π ≠ π 0
b) H0 : π ≤ π 0
H1 : π > π 0
c) H0 : π = π 0
H1 : π < π 0
18) Într-un sondaj aleator simplu de 400 angajați, pentru variabila venitul lunar s-au obținut rezultatele de mai jos:
Mean 1200
Standard Deviation 165
Pentru o probabilitate de 0,95, intervalul de încredere pentru parametrul medie este:
a) [1183,83; 1216,17]
b) [861,89; 1178,11]
c) [34520,1066; 36,6244]
23) La aruncarea unui zar, probabilitatea de apariție a unei fețe cu număr mai mare decât patru este
a) 0,33
.......
24) Considerând v numărul gradelor de libertate, într-un test statistic bilateral, ipoteza nulă se respinge dacă
a) tα/2,v > I tcalculat I
b) I tcalculat I > tα/2,v
c) I tcalculat I ≤ tα/2,v
25) Atunci când se cunoaște dispersia σ2, testarea ipotezelor asupra mediei unei populații se...
a) statistica Z
b) statistica t
c) statistica Fisher
26) Într-un sondaj aleator simplu de 400 studenți, pentru variabila nota la un test, s-a obținut .... că abaterea standard
la nivelul populației totale are valoarea egală cu 2. Intervalul de încredere pentru o probabilitate de 0,95, este
a) [7,50 ; 9,00]
b) [7,804 ; 8,196]
c) [8,128 ; 9,202]
28) Pentru o variabilă X ~ N(µ, σ2), se cere să se calculeze probabilitatea ..... este
a) 75%
b) 68,26%
c) 95,4%
30) Într-un test statistic bilateral în care se folosește statistica t, considerând v numărul gradelor de libertate, ipoteza
nulă nu se respinge dacă
a) tcalculat > tα, v
b) I tcalculat I ≤ tα/2,v
c) tα/2,v < I tcalculat I
PfW'ltrv o Pl'Obob dnl•Ou
l1 o�
• , lro'ht'W111ul de lnc�•...-irtu "8,.,.,...,.;,n--=»-- •
al (Bo1.89 . 117& 11
b)I 1183.83 1210,17j
c) (34520,I 000;:16 .0 244J
JJ /n vedtttea stud lorU op•unH studttn\l� chrl on� 1 oe la Fr .J..>. . p, 1·11rwS �,.... C.-. "''" '
9irnphJ r�tal un e$cl,nllon formai din 36 �ti.dfJl\\i t' Mt obMf'i3 c6 p,rc,o,-..,r9a � r.a,o ,pri!!�• I.C
Şttlntf ca proporţm fnrf!-Q!I�IG Jn wu., un,·,uQâ.'lt prac,,dM.t �I.J ,r• 'S¾
• 1..:1 W„ o,w,.,,.., ,.,
o) nu e.osta d 1ferenl9 semnlfi�hvo fmro pr�u 1,1u,cto,1�loc-c;a,e r,r,ri,,,:,. � ✓.1!1 oa Nc,tut 11
lnmgfSfralll rr, Mut u11ivorllta1 proc:edflnl. ln cond 1�1hs ,,�u1 u.umtA rM t•/•
b) 1es1area drrerentet dinuo proportJa 1-tudOn�br ca,, putfo,o 1pedaf ta.t� ţ.Jpn.a'" wrftff' flQ'
�'"'"'"
so toce cu tos1ul 1
G) ""'sta d,lecCf1!e•omnJVCiJlive lnlro pcopc,\W ,11><1n<1�1of cu� "'"'"'t /.l(>haln
-
rnreglsttaffl rn anul un 1!iomit01 p,ecedent. în condiţi1hs rdCUul 41•;4.JMM d.tş 1•1•
5) Se srudrazA dac.'! exista d1leren1e semnmca1s,e lmre ·.�.;<an',a moooe '1e 11.W. 11 lcm6"o
ş, 5peranfa medie de vla\3 a feme,lor la rwvel mood<�I. P.9at:; o., 75 ,-ro S,,; QJ!\t,'.e u1rn:.'
Suni adevârnle afirma�ile
a) cu o probabdrtale de 95%, mvell.li medru al spetan� mr,dl dl.! •,i'M a !'l!T',:;\,c,î ,jn f:I.,
de rncredere (66.135 ; 69,865)
b) se garantează cu o probabilil.J1e d<.: 90% ca ou e, si:, d:'ert:nV, :,emnt'e:ru-"'lrt:<> !.
Europa de Esr ş, mec1,a la nivel mondial
c) exista diferenţe semn,ficatrve rntr� spe1anta med11; rJi; 11:s\ă a 'r,me:lrJ! rt-n Eur°"" CI
cond,oile nsailu1 astfflat de 5%
I 2010 I 20i 1 I
12
Tnm. I I1
Trim. li I5 I4
Trim. III 12 15
Tnm. IV I4 I 8
.
rversltat•• •AJexandru Ioa n Cuza" Inşi
Fu„ · de Economi• şi Administrarea Afacerilor
acultataa
TEST GRILĂ
Olsclpllna. Bazele statisticii -ecZ- 16.06.2017
Sesiunea: sem. li 2016/2017
Cod brosura: 16
1) Spc,,u mediu abtOIUI arata
•1 rnod,(icarea medie �utA. pe .,,.tal• de 11mp, lnn,giSlralA de un fenomen. tntr-o enumd
b) de dlle on a c:rescu. ,.velul unuo renomen. intr-o anun-ull pe,IOada de Ump
por,oaaa do llmP
l) Un politlclan. la lnceputul mandat1'ui, afirmA ln mass-media că va aeşte salariij mediu net pe economie I
Arsdul mandatului se tace un sondaj pe n = 900 de respondenti prin care se urmAreste asumarea salariijli
to,ic)lll le (X). Se cunosc urrnatoarele rezultate: X = 294 EUR şi CT = 90 . Selectati care dintre afirmaţiile
de:
em afirma penlr\l un prag de semnificatie de 5% că polilicianw nu s-a �nut de cuvânt;
em afinna pentru un prag de sernnificatie de 3% că politicianul w ,nut de cuvânt
afirma pentru un prag de sernnificatie de 5% că politicianul s-a ,nul de cuvărt;
-un sondaj aleator simplu de 400 angajaJ, pentru vaiabila venitul tmar s-au obfru rezultatele de mal jos:
ul/unw
1200
Oeviation 165
79. llifflN) ?<ll)U1J1io dt 10 """""'" .. pol O,lf>I< ,1t,1u.'
,. "" ......, """'" li< .... ,.,...
b. 1000 <kl ..."""'"" d• >tcdtn\i. dupa W,Orn> <U , ...
n"•
:<· 100 C10<1>ntb0n• do ,tudofll� oupa .-.,.,u ,,,...,,1,,
80 ET�l,ntt.,,on1torulul ,;'""
I. Al»Wt> <!llr>d,,o• Ql.,..Lonalut,.,, ""nlN
b. M«III Ql,lllll!Ol"ulu, "� q,,_ <• O
,. o,,p,-,.i, eitltnotor,,lu, "'" q,11 <• fflltdi, ""'""'"''"'"I
,,,,,.,......,...
o Dlfor,nt1 lnt,,<1D1J1 ""'""' ,1 , ,.,i,\,<11<O-?U""'o"• • dou, 01om•••• dr
,. o;f«nn„ in,re n"'<lul "°"v.,,.l>llt. "'"'"""'''°' uou momonl do 1knp o,r<<a<O, � ,<
i
.,...,. 1<ele,nl '"'"bllt ,.,.,.,..,.,,.. unul ..-,nt d• ,.,,,1n1,
'"'""'"'ul ......,
81 1n,,.,n ,ond•J '"'"'"' oo400d• Jlwl<•< """"" ""'�" not> I• 1<>1. ,., obt<nut o ,,,....i„
do I Oi O •l>I••� .........
mod,�<i!,. do 2 I C, p<nlru <U o pr<,�blU<Mo
d• Q.95 """
,. /1.!<l: 9.00/
b. p.!l!M;B.1961
C , /8.118;9.100)
�
I
- Pn,tul unul produs fl�/J pe trimestru a
Jn�glsuat. ln P•rioada 1012·20
I
13;
{rr/m l :012 3
1
!0
•
-
13) Pw1tn,
•I -islicatest-
Fill>o,
d,t"""1tof arnrn, -
dou,1mOdl, ale�
b/ otiK/al,ca
r.
•I Slatis{;caz. � nu se cunoa,1. POpulall/ se
""-srtt
Galld „ CUnoafto vana,,ia l>OpulalfOI
•anan,a llCl)Ufa�•
f4) P..,tn, o
aJo.en Vlllf,Ulir, X�/\\'li, t),
-
P(X� -J, 22) estn:
b) 0,889
-c) 0,341
-Eslima
fS) !OtlA IIGdepjasat
a) are mec1oa egaJ/1cul)a-ame11
bJarevan"llfa a
c) are d/spe,gJ,.rninimt
8gaUj cu zaro
"'-•
--
"'--·--....... .._,_
-----
-- ______
-M-
• - ·-
•H-
•-
-,
21
0,793
20
20
7
◄9
2.233
1,11◄
30
◄1507
10
O
78
1,553
-
.. • • .
II I >
llftJ I
1), -.\IVII I •:,
,,,,,v11
•• . lA f
P,J ţJJHIW
r-
1QJ
•J JX->•fe f, oi,'LMI.., � ,r,.-atd uu ,,.,.. 'W' 4J
f,,110� ,er.
hJ :•r>«.11 fA'(IJ)fie'I.� de lfltf�IU�,C,atA.:
C) 1111 tt�·ltt �, f'".h'M ,.,. IPI 1,Ju,n I� nw,:. {W� ;,., I V'r iM'
b) 0,66
cJ 0,33
------ --�-
13) SP. venfica daca prol,Q(\la ,r a ,.f..,.�•A ,;:,rt: ?(f.!.t<;:""'/2-r.J 1,.
a cllan�tor don anul pr� fn a•-"nl ,,;;7 iVJ.�,J&� u:ir:...:,r,, 1';
/lu: 1t-1Tr,
a,,r ,C�!To
fi'> : 1t == ;co
b) fi, · ,r < lto
lfo: 1r:;;1ro
c) f/1 : r. > lto
l)rimă
14) Sporul absolut cu bază fixă e.r. ,:r..., .-,..
u- ,.
t lr m ăr im e r':\a\Jvâ nr 1� : -;;
a) cu cât s-a modifica � am.'":ri,?r. t·'•••
r mOO",effilt
aceleiaşi variabile coresrNnzâto
câ te on s- a m od rca t r, ,el u\ un s- vanaflt.: '".ff.�,_-.. ,rrz.:
b) de
res pu nz ăt o r m o m el'11u lu1 de re'er·"'·.a
co 1.,-\ ă m � .. ,r<;:ii 'li.:
m ăr i.rn e ari s.o\
- c) cu cât s-a modifi
le
ca
COl'
t.
es
in
pu nz at o• T orr en tu\ u: 61: te•� w�
aceleiaşi variabi
testa�e de tip\, sunt a.1�1:
15) in legătură cu eroarea de 2.1n tă et o � ea a � a ?I
p I repre
a) eroarea de testare de ti nta c:;roarea de ar
tip\ reprezi
cb) eroarea de testare de
¼ 4.. I �+c:, .J - ...
,,1 penl/\J o variabilă X- N/20, l6J, P(18 <. X <. 12)
•J o.383 este
bJ 0.-454
•> 0,962
20) A estima punctual tn
a) a calcula limttele unul seamn:i
b) a calcula P1'0babillta1 lllterval cu o anumilă P<Obabnil81 e
c) a calcula o valoare e a cu care se ob\Jlle o esllma�e
l>OSibilă a e stimatorului
pe baza dalelor lnr egislrate a nlvelu eşan tlonu
21) Distribu�a med ei l l lui observat
i de Selecţie se carac:tenzeazA prin·
/Jl
µ~N(µ.-)
a) "
b) µ-N(µ,u )
l
µ- N(µ,7,;) (J
c)
22) Cooslde,and v numărul gtadelor de libertale
, tntr-un test statistic bllaleral, Ipoteza nula se respinge dacii:
_ a)' .,. 1
jr ,,,,,.,J
> oll.•
b) tco1o,Jo,J � 1 12.,
J a
23) Potrivtt datelor Eurostat. ln Romania. exporturile de bunuri şi servial (exp<imale in euro/ locuilor), ln perioada 2090-201
au lnreglstrat urmatoarele valori: 600,700,800,800, 1000, 1200,
- 1500, 1700, 2000, 1700, 2100.
Suni corecte următoarele afirma,i:
a) volumul exporturilor Romaniel a aescut ln anul 2010 comparallv cu anul 2000 cu 1500 ewo/locuitor
b) volumul exporturilor RcmAnlel a crescut, ln anul 2010 comparativ cu anul 2000 de 3,5 ori
_ c) volumul mediu anual al exporturilor RornAnlel,Tn perioada 2000-2010, a fost de 1281,81 euro/loc.
24) ln vederea testării semnifica�el diferenţei dintre o medie µ şi o valOafe lixl µo . pentru un *ntion de volum n=SO, �
ob,ne o valoare calculalli a stalistlcfl tesl z = 1,51 . ln cazul unui test bilateral. dacă valoarea teoretică este :=l,645, ri
asunal d e a respinge pe neclrepl lpo!eza HO este:
81 a=0,IO
b) a= 0,01
c) a=0,95
25) Spotu absolut cu bazi lixi exprima:
a) cu cAt H modificai. ln mArime absoluti, lllvelul unei variabile corespunzAtor momenWul curent, t. comparativ cu 111vel 1
ac:elelafl variabile corespunzitor momentului de referlnjl;
b) de cb ori s-a moclfk:al nivelul unei varllbile corespunzAtor momentului annt, t, la11
de nlvelul aceleiaşi variabile
corespunzitllr momentului de raferinţl.
c) cu dit „modillcal. 1n mlllm• relallvt. nivelul unei variabile, corespunziior momentului curent. t comparativ cu nivelu
ac■lllafl variabile corBll)IIIIZilomomantuul anlalar, t-1;
21) Tn leglturl1 cu•-- de llllant de tip I, sunt ldevnte aftrmalfile:
e).,... dl, lllln de Gp I raprezlrill 8t01181 de a l9ll)illgR lpoten 'I.dl Ho. alunel dind 1n realitate ac.easta este adeo.
b) ■one ci......,. de tip I raprezlnll erona de a ICCIICJ(a lpolen "'"Ho. allllci dind 1n nialilate aceasta este lalsl
a)� aodall tl'Oltl de llltale de tip I ate 111111111 prag de sernnmc:a,e li se no!•zA eu a
l7J � melodl ANOVA. HU abfrU llllllloarlle f8Zlllllle·
f.ll Un n1lmAJor csu ocdcrlaUI .i.,ca·
1
M(fl)=/1
-
I
- ·- ....-- Grad• d• libNUtl!
- �- -
-
--
SurW \'lfl.ll-.t Suma p11r•1•tor Vat"1.-t�
1n1rrg,u�
lnvf&(Upe
- - -_._J
: )20
2
-
�- �
«o 20l
TOlaQ
-� _l
Vo1rYb1f, numt1r1d Mt, "$11,rlur', 1.u v1r1-11b1I„ 1f,c10fulJ de a,up,,, •1otP 1'Re11une1•.
INtuuJ iJlu,ţ,.. c-1dtr1nd un rac d4' O,�. se pa•te •f""" t1
,) J("pr1111r,11J cu o prob,1blh11tti dti O.� ci f,dorul dt 1rup,re are o 1nnuentl
SrNMllc,ild awpr, van•\"'i uLtriuhli
bi ipotrtik:,Ht.f µ, •}11 Jl1
q se reisp1n„ 1e,o1rr1 H1
dl numJrul gndrl0t"" lil>tfUi, ,,oc1a1, varu11e11oui. HI•203
•
Dintr-o populatie de 10 studenti se pot extrage aleator:
a)raporturile intre doua niveluri ale aceleiasi variabile corespunzatoare unor momente de timp
consecutive
b)diferente intre doua niveluri ale aceleiasi variabile corespunzatoare de timp consecutive
c)diferente intre nivelul unei variabile, corespunzator unui moment la nivelul aceleiasi variabile
corespunzator unui moment de re.....
O banca doreste sa verifice corectitudinea informatiilor asupra clientilor sai. S-a extras un esantion
aleator de 200 de dosare si s-au identificat 18 dosare cu informatii gresite. Proportia dosarelor gresite
ale bancii pentru o incredere de 95% este acoperita de intervalul:
a) [0.07;0.11]
b) [0.051;0.129]
c) [0.09;0.91]
Se studiaza daca exista diferente semnificative intre speranta medie de viata a femeilor din Europa de
Est, egala cu 68 ani, si speranta medie de viata la nivelul mondial, egala cu ani. Se cunosc urmatoarele
date: n=16, s’=3.5 . Sunt adevarate afirmatiile:
a)cu o probabilitate de 95% nivelul mediu al sperantei medii de viata a femeilor din Europa de Est este
acoperit de intervalul de incredere(66.135, 69.865)
b)exista diferente semnificative intre speranta medie de viata a femeilor din Europa si media la nivelul
mondial, in conditiile riscului asumat de 5%
c)se garanteaza cu o probabilitate de 90% ca nu exista diferente semnificative intre speranta medie de
viata a femeilor din Europa si media la nivelul mondial
Estimatia este:
b)o statistica
a)[3.612, 6.025]
b)[7.251, 9.444]
c)[8.356,8.644]
Pentru un esntion de intreprinderi s-a inregistrat marimea firmei(mica, medie, mare) si nivelul
profitului(mld. Lei). Datele obtinute , considerand un risc de 0.05, sunt prezentate in tabelul de mai jos:
Intergrupe 6 2
Intragrupe 457
Total 436 128
Intergrupe 120 2
Variabila numerica este ”Salariul”, iar variabila(factorul) de grupare este ”Regiunea”. In aceasta situatie
considerand un risc de 0,05, se poate afirma ca:
a)se garanteaza cu o probabilitate de 0,95 ca factorul de grupare are o influenta semnificativa asupra
variatiei salariului
a)F(x)=P(X≥x)
b)F(x)=P(X=x)
c)F(x)=P(X>x)
d)F(x)=P(X<x)
b)eroarea de testare de tip II reprezinta eroarea de a accepta ipoteza numa H1-β atunci cand in
realitate...
2014 2015
Trim 1 6 10
Trim 2 2 5
Trim 3 5 4
Trim 4 3 2
In vederea testarii semnificatiei diferentei dintre o medie µ si o valoare fixa µ0 , pentru un esantion de
volum n=50 obtine o valoare calculata a statisticii test z=1.45. In cazul unui test bilateral, daca valoarea
teoretica z=1.96 riscul asumat de a respinge pe nedrept ipoteza H0 este:
a)α=0.95
b)α=0.50
c)α=0.01
La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar par este:
a)0.33
b)0.5
c)0.66
Distributia de selectie(distributia unui esantion) admite:
a)0.962
b)0.454
c)0.382
Pentru testarea diferentei dintre trei si mai multe medii ale unor populatii se foloseste:
a)statistica Fisher
b)statistica ANOVA
c)statistica t
In vederea studierii optiunii studentilor din anul I privind specializarea pe care o vor urma, se extrage
aleator simplu repetat un esantion format din 16 studenti si se observa ca proportia celor care prefera
specializarea ALPHA este de 35%.
Stiind ca proportia inregistrata in anul universitar precedent este π=33%, pentru un risc α=0.05, se poate
afirma ca:
a)nu exista diferente semnificative intre proportia studentilor care prefea specializarea ALPHA in anul
curent si proportia inregistrata in anul universitar precedent, in conditiile riscului asumat de 5%
c)exista diferente semnificative intre proportia studentilor care prefea specializarea ALPHA in anul
curent si proportia inregistrata in anul universitar precedent, in conditiile riscului asumat de 5%
1) Nivelul de afaceri (mld.lei) a unei firme pe trimester a inregistrat in perioada 2014-2015 urmatoarele:
2014 2015
Trim. I 6 10
Trim. II 2 5
Trim. III 5 4
Trim. IV 3 2
2)Se verifica daca proportia pi a clientilor care prefera produsul A, in anul curent, difera in mod
semnificativ de proportia pi 0 a clientilor din anul precedent. In acest caz, ipotezele statistice sunt:
a) H0: pi=pi0
H1: pi ≠pi0
b) H0: pi=pi0
H1: pi < pi0
c) H0: pi ≤ pi0
H1: pi > pi0
a) probabilitatea asociata erorii de testare de tip I este numita prag de semnificatie si se noteaza cu …
b) eroarea de testare de tip I reprezinta eroarea de a respinge ipoteza nula H0, atunci cand in realitate
aceasta este adevarata
c) eroarea de testare de tip I reprezinta eroarea de a accepta ipoteza nula H0, atunci cand in realitate
aceasta este falsa
b) 1067
c) 2040
7) Esantionul reprezinta o subpopulatie sau un subansamblu extras din populatia de referinta care:
a) din motive de cost are un volum mai mic decat volumul populatiei
a) µ ̴ N ( µ, σ/√𝑛)
b) µ ̴ N ( µ, σ2)
c) µ ̴ N ( µ, σ2/n)
9) Un politician, la inceputul mandatului afirma in mass-media ca va creste salariul mediu net pe
economie la 3…. Sfarsitul mandatului se face un sondaj pe n=900 de respondent prin care se urmareste
estimarea salariului minim pe economie (X). Se cunosc urmatoarele rezultate x=294 EUR si σ=90.
Selectati care din urmatoarele afirmatii sunt valide:
a) putem afirma pentru un prag de semnificatie de 5% ca politicianul s-a tinut de cuvant
b) putem afirma pentru un prag de semnificatie de 3% ca politicianul s-a tinut de cuvant
Variabila numerica este “Salariul” iar variabila (factorul) de grupare este “Regiunea”. In aceasta situatie
se poate afirma ca:
a) se garanteaza cu o probabilitate de 0.95 ca factorul de grupare este o influenta semnificativa asupra
variatiei salariului
b) ipoteza H0 este µ 1= µ 2= µ 3= µ 4
11) Un producator de cereal realizeaza o ancheta privind comportamentul de consum al adultilor din
SUA. S-a extras un esantion de 1600 persoane si s-a identificat ca 30% dintre personae sunt preocupate
de consumul de alimente sanatoase. Pnetru 98% incredere. S-a estimate intervalul pentru proportia
adultilor din SUA care acorda atentie alimentelor sanatoase. Care afirmatii sunt adevarate?
12) La un examen, profesorul a stabilit ca elevii care vor obtine un punctaj cuprins intre 80 si 85 vor
primi calificativ…. anul current, distributia punctajelor este normala X ̴ N (75,25). Care este procentul
elevilor care primesc calificativ…..
a) 13,59%
b) 47,72%
c) 2,28%
13) Se verifica daca exista diferente semnificative intre productivitatea medie a muncii (lei/ora) din
regiunea … Romaniei si productivitatea media a muncii la nivel national, de 45 lei/ora. In urma
prelucrarii datelor, s-au obtinut:
Mean 39.918
Standard Error 0.2629
Median 39.000
Mode 33.000
Standard Deviation 2.629
Sample Variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 19.000
Minimum 29.000
Maximum 48.000
Sum 3991.8
Count 100.000
Confidence Level (95.0%) 0.515
Pentru α= 0,05 sunt adevarate afirmatiile
a)exista diferente semnificative intre productivitatea medie din regiunea de Nord-Est a Romaniei la nivel
national, in conditiile riscului asumat de 5%
b) valoarea calculate a statisticii teste este t=-19.33
c) nu exista diferente semnificative intre productivitatea medie din regiunea de Nord-Est a Romaniei la
nivel national, in conditiile riscului asumat de 5%
b) 0,5
c) 0,66
15) Atunci cand se cunoaste dispersia σ2, testarea ipotezelor asupra mediei unei populatii se…
a) statistica Z
b) statistica t
c) statistica Fisher
16) Intr-un sondaj aleator de 400 studenti pentru variabila nota la un test, s-a obtinut ca abaterea
standard la nivelul populatiei totale are valoarea egala cu 2, intervalul de incredere… probabilitate de
0,95 este:
a) [7,50; 9,00]
b) [7,804; 8,196]
c) [8,128; 9,202]
c) diferenta intre nivelul unei variabile, corespunzator unui moment de timp oarecare…. Corespunzator
unui moment de referinta
19) Pentru o variabila X ̴ N (µ, σ2), se cere sa se calculeze probabilitatea ……. Este:
a) 75%
b) 68,26%
c) 95,4%
Mean 173
Standard Error 11,25956384
Median 180
Mode 180
Standard Deviation 35,60586718
Sample Variance 1267,777778
Kurtosis 1,175597901
Skewness -0,584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence Level (99,0%) 28,9799368
a) intervalul de incredere care acopera valoarea medie a bonusurilor la nivelul tuturor angajatilor de
99%, este [161,75; 184,25]
b) volumul esantionului este 10
c) eroarea maxim admisibila este 28,97
b) o variabila aleatoare
c) o valoare fixa si cunoscuta la nivelul unei populatii
a) cu cat s-a modificat, in marime relativa, nivelul unei variabile corespunzator momentului…aceleiasi
variabile corespunzator momentului anterios, t-1
b) de cate ori s-a modificat, nivelul unei variabile corespunzator momentului curent, t,… corespunzator
momentului de timp anterior, t-1
c) cu cat s-a modificat, in marime absoluta, nivelul unei variabile corespunzator momentului…..aceleiasi
variabile corespunzator momentului de referinta
25) In metoda ANOVA, variatia explicate (VE) masoara:
c) ?
26) Aplicand metoda ANOVA s-au obtinut urmatoarele rezultate:
Variabila numerica este “Venitul”, iar variabila (factorul) de grupare este “Regiunea”. Pentru exemplu
afirmatiile:
a) se poate garanta cu o probabilitate de 0,95 ca exista diferente semnificative intre veniturile medii ale
populatiilor
b) volumul esantionului este 22
c) valoarea teoretica a statisticii F, cinsiderand un risc de 0,05 este 3,073
27) Pentru testarea diferentei dintre trei si mai multe medii ale unor populatii se folosesc:
a) metoda ANOVA
b) statistica t
c) statistica Fisher
10) Estimatorul reprezinta
b)o statistica
21) La alegerile municipale, s-a dorit identificarea alegatorilor care nu pot fi trecuti pe lista electorala.
Din lista existenta, s-a extras aleator un eşantion de 317 nume si s-a determinat ca 38 de nume nu
Indeplinesc conditile de alegator. Municipalitatea dorește så estimeze intervalul de Incredere pentru
proportia alegatorilor excluși de pe lista eloctorala, pontru a probabilitate de99% Rezultatele corecte
sunt:
22) in vederea testärii ipotezei de egalitate a salariului mediu cu o valoare fixa, μ0=46 s-a Inregistrat
un esantion de volum n=10 persoane. In acest caz se pot formula urmatoarele ipoteze statistice
23) Dintr-o populație s-a extras un eşantion de volum n= 900 persoane. Pentru o variabila X-
consumul saptămânal de paine(kg), s-au obținut rezultatele x(barat)=3kg, s'=1kg. Considerand un risc
de 5%, se poate considera că nivelul consumului mediu saptamanal de paine
24) Se verifica daca exista diferente semnificative intre castigul mediu salarial (sute lei) din regiunea
de Nord-Est a Româniel și câștigul mediu salarial la nivel national, de 14 sute lei. In urma prelucrarii
datelor, s-au obținut urmatoarele rezultate:
c) existà diferențe semnificative intre câştigui mediu salarial din regiunea de Nord-Est a României și
câştigul mediu salarial la nivel national, în condițile riscului asumat de 5%
a) 0,382
b) 0,962
c)0.454
24) Atunci cand se cunoaste dispersia ò² testarea ipotezelor asupra mediei unei populatii se face cu
a) statistica Z
b)statistica Fisher
c) statistica t
b) regula de decizie
H1: μ > μ0
b)H0: μ diferit de μ0
H1: μ = μ0
c)H0: μ = μ0
H1: μ Diferit de μ0
b) regula de decizie
3) intr un sondaj aleator simplu de 400 student, pentru variabila nota la un test, s-a otinut o valoare
medie de 8,25 o abatere standard de esantion modificata egala cu 1,8. Intervalul de incredere pentru
parametrul medie cu o probabilitate de 0,95 este:
a)[6,1280;9,2020]
b)[8,0736;8,4264]
c)[7,5260;9,3424]
6) In vederea testarii ipotezei de egalitate a salarului mediu cu o valoare fixa, μ=46 sa inregistrat un
esantion de volum n=10 persoane in acest caz se pot formula urmatoarele ipoteze statistice
7) Intr-un sondaj aleator simplu de 400 student privind opinia cu privire la decizia de a schimba
sistemul de evaluare, 250 au fost de acord cu aceasta cine Intervalul de incredere pentru parametrul
proporse, cu o probabilitate de 0.90 este
a)[0,4245;0,7428]
b)[0,5851;0,6649]
c)[0,,3580;0,6440]
8) Pentru o variabila X~N(μ ó²), se cere sa se calculeze probabilitatea P(μ -ó<X< μ +ó) aceasta
probabilitate este.
a) 68,2%
b) 95%
c)75%
47. Pentru testarea diferentei dintre doua medii ale unor populatii se foloseste
a) Statistica Fisher
48. La un examen sustinut in anul universitar current, un student (Mihal) a obtinut un punctaj de 700
puncte. La acest examen, punctajul mediu a fost de 550 de puncte lar abaterea standard de 100 de
puncte. In anul universitar precedent, un alt student, George, a obtinut 40 puncte. Pentru acel an,
punctajul mediu a fost de 34 puncte abaterea standard de 5 puncte. Care dintre cei doi student au
ocupat un loc mai bun in clasament?
a George
C. Mihai
a) Conditia de independenta
b. Conditia de homocedasticitate
c. Conditia de normalitate
a 0.383
b. 0.454
c. 0:962
a. 0.977
b. 0.341
c. 0.889
53)La un examen, punctajele otiute de studenti sunt distribuite normal cu media 5050si abaterea
standard 100. Un student a obtinut punctajul de 650. Ce procent din sstudeni a obtinut un punctaj
mai mare decat el
a.4,3%
b.1,5%
c.67%
a. 0,289
b.0.532
c.0,341
55. Se testeaza diferentele dintre veniturile medii din 2 regiuni si se obtin urmatoarele rezultate.
Tcalculat-8,23, numarul gradelor de libertate -25. Pentru un risc de 5% sunt adevarate afirmatile
68 un politician la inceputul mandatului, afirma in mass media ca va creste salariul mediu net
pe economie la 300 EURO. La sfarsitul mandatului se face un sondaj pe n =900 de
respondenti prin care se urmareste estimarea salariului mediu net pe economie (x). Se
cunosc urmatoarele: X(mediu)=294 euro, si ó= 90. Selectati care din afirmatile de mai jos
sunt valide:
a)putem afirma pentru un prag demnificatie de 3%ca pliticianul sa tinut de cuvant
b)putem afirma pentru un prag de demnificatie de 5%ca pliticianul s-a tinut de cuvant
c) putem afirma pentru un prag de semnificatie de 5% ca pliticianul nu s-a tinut de cuvant
69. Aplicand ANOVA s au obtinut rezultatele
10) Dintr o ancheta de opine asupra unu esantion de 900 ppersoane extras aleator repetat a
rezultat ca In medie, la 100 de persoane 85 voteaza favorabil pentru candidat la functia de
primar. Intervalul de incredere al procentului de voturi a candidatului la nivelul intregii
populatii considerand o incredere de 95% este
a. [0,146;0,567]
b.[0,567;0,614]
c.[0,5267;0,673]
1.Pentru a verifica dacă femeile sunt supuse riscului de cancer mamar,doctorii au
dezvoltat o metodă nouă de detectare a cancerului. Pentru a aproba această metodă au alcătuit
un eșantion de 140 de femei cu cancer mamar și au observat că, în urma aplicării noii metode,
pentru 12 femei nu s-a reușit detectarea cancerului. Știind că metoda veche are o rată de eșec
de 20%, pentru un risc asumat de 5% care sunt afirmațiile adevărate?
a.Rata de eșec a noii metode diferă semnificativ de rata de eșec a vechii metode
b.Metoda veche nu diferă semnificativ de cea nouă
c.Ipoteza alternativă este μ≠0
5. Pentru testarea diferenței dintre trei și mai multe medii ale unor populații se folosesc:
a.statistica Fisher
b. Metoda ANOVA
c. Statistica t
6. În vederea testării semnificației diferenței dintre o medie μ și o valoare fixă μ0, pentru
un eșantion de volum n=50, se obține o valoare calculată a statiaticii z=1,45. În cazul unui test
bilateral, dacă valoarea z=1.96, riscul asumat de a respinge pe nedrept ipoteza Ho este:
a.α=0,95
b.α=0,05
c.α=0,01
10.Estimaţia este:
a. o valoare fixă şi cunoscută la nivelul unei populaţii
b. o valoare calculată pe baza datelor de sondaj
c. o statistică
d. o valoare a estimatorului calculată la nivelul eşantionului observat
11.Se verifică dacă proporția π a clienților care preferă produsul A în anul curent, diferă
în mod semnificativ de proporția π 0 a clienților din anul precedent. În acest caz, ipotezele
statistice sunt:
a. H0 : π = π 0
H1 : π ≠ π 0
b. H0 : π = π 0
H1 : π < π 0
c. H0 : π ≤ π 0
H1 : π > π 0
12.Atunci cand se cunoaste dispersia (σ2 sigma la a doua), testarea ipotezelor asupra
mediei unei populatii se face cu:
A. Statistica Z
B.Statistica t
C. Statistica Fisher
13.Într-un sondaj aleator simplu de 400 studenți, pentru variabila nota la un test, s-a
obținut o valoare medie că abaterea standard la nivelul populației totale are valoarea egală cu
2. Intervalul de încredere pentru o probabilitate de 0,95, este
a) [7,50 ; 9,00]
b) [7,804 ; 8,196]
c) [8,128 ; 9,202]
19.Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a
obţinut o valoare medie de 8,25 şi o abatere standard de eşantion modificată egală cu 1,8.
Intervalul de încredere pentru parametrul medie, cu o probabilitate de 0,95, este
a (8,1280 - 9,2020)
b) (8,0736 - 8,4264)
c) (7,5260 - 9,3424)
20. Intr-un sondaj aleator simplu de 400 angajati, pentru variabila venitul lunar s-au
obtinut rezultatele de mai jos:
Mean - 1020
Standard Deviation – 158,11
Pentru o probabilitate de 0.95, intervalul de incredere pentru parametrul medie este:
a) [861,59;1178,11]
b) [1004,51;1035,48]
c) [545….]
22. Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada
2010-2011 următoarea evoluţie:
2010 2011
Trim. I 1 2
Trim. II 5 4
Trim. III 2 5
Trim. IV 4 8
Variabila numerica este "Venitul", iar variabila (factorul) de grupare este "Regiunea". In
această situatie, se poate afirma ca:
a) valoarea teoretică a a statisticii F, considerånd un risc de 0,05, este 3,634
b) volumul eşantionului este 19
c) se garantează cu o probabilitate de 0,95 că existā diferențe semnificative intre
veniturile medi pe regiuni la nivelul populațiilor
5.Un politician, la începutul mandatului, afirma în mass-media că va creşte salariul
mediu net pe economie la 300 EUR. La sfârsitul mandatului se face un sondaj pe n =
900 de respondenti prin care se urmăreste estimarea salariului mediu net pe economie
(X). Se cunosc următoarele rezultate: X = 294 EUR și SIGMA= 90. Selectati care dintre
afirmațile de mai jos sunt valide:
a) putem afirma pentru un prag de semnificatie de 5% că politicianul nu s-a ținut de
cuvânt;
b.putem afirma pentru un prag de semnificatie de 3% că politicianul s-a tinut de cuvânt;
c) putem afirma pentru un prag de semnificatie de 5% că politicianul s-a tinut de cuvânt;
24.într-un sondaj aleator simplu de 400 angajați, pentru variabila venitul lunar s-au
obținut rezultatele de mai jos:
Venitul lunar
Mean 1200
Standard Deviation 165
Pentru o probabilitate de 0,95, intervalul de încredere pentru parametrul medie este:
a) [ 1183,83; 1216,17]
b) [861,89 ; 1178,11]
c) [34520,1066;36,6244]
6. Intr-un sondaj aleator simplu de 900 studenți, pentru variabila nota la un test, sa
obinut o valoare medie de 7,5 şi o abatere standard de eşantion modificată ( corectată)
egală cu 1,6. Intervalul de încredere pentru parametrul medie, cu o probabilitate de
0,95, este
a) [7,5260 ; 9,3424 ]
b) [7,3955; 7,6045]
c)[8,1280 ; 9,2020 ]
7.Intr-un sondaj aleator simplu de 625 studenți privind opinia cu privire la decizia de a
schimba sistemul de evaluare, fost de acord cU această opțiune. Intervalul de încredere
pentru parametrul proporție, cu o probabilitate de 0,90, este
a) [0,6084 :0,6716]
b) [0,4245; 0,7428]
8.Aplicand metoda ANOVA sau obtinut urmatoarele rezutate
Sursa variatiel Suma patratelor Grade de libertate Estimatori ai
variatie variantei
ESS 220 2 100
RSS 120 16 7,5
variabila numerica este numita"venitul" lar variabila (factorul) de grupare este
"regiunea". In aceasta situatie se poate afirma ca
a)Se garanteaza cu o probabilitate de 0.95 ca esista diferente semnificative intre
veniturile mediipe regiune la nivelul populatiel
b. Valoarea teoretica a statisticii F, considerand un risc de 0.05 este 3,634
c.Volumul esantionului este 19
9.Atunci cand se cunoaste dispersia, testarea ipotezelor asupra mediei unei populatii se
face cu:
a. Statistica fisher
b. Statistica t
c) Statistica z
10.In vederea studieril optiuni studentilor din anul 1 de la FEAA privind specializarea pe
care o vor urma se extrage simplu un esantion format din 36 de studenti si se observa
ca proportia celor care prefera specializarea Alpha. Stiind ca proportia inregistrata in
anul universitar precedent este de PI- 25%, iar pentru un risc de 0.01 se poate garanta
ca:
a. Nu exista diferente semnificative intre proportia studentilor care prefera specializarea
Alpha din anul curent si proportia inregistrata in anul universitar precedent., in conditiile
riscului asumat de 1%.
b. exista diferente semnificative intre proportia studentilor care prefera specializarea
Alpha din anul current si proportia inregistrata in anul universitar precedent., in conditiile
riscului asumat de 1%.
c)Testarea diferente dintre proportia studentilor care prefea specializarea Alpha in anul
current si proportia din anul anterior se face cu testul t
]
12.Într-un sondaj aleator simplu de 900 studenți, pentru variabila nota la un test, s-a
obtinut o valoare medie de 7,5 și o abatere standard de eşantion modificată (corectată)
egală cu 1,6. Intervalul de încredere pentru parametrul medie, cu o probabilitatea
de0,95, este
a) [ 7,5260; 9,3424 ]
b) [7,3955; 7,6045]
c)[8,1280 ; 9,2020 ]
13.In vederea testarii ipotezei de egalitate a salariului cu o valoare fixa 𝜇0= 46 s-a
inregistrat un esantion de volum n=10 persoane. In acest caz se pot formula
urmatoarele ipotere statistice:
a.H0:𝜇=10; H1:𝜇=10
b.H0: 𝜇 = 46 H1: 𝜇 ≠46
c.H0: 𝜇 =46, H1: 𝜇 <46
14. Intr-un sondaj aleator simplu de 400 de student privind opinia cu privire la decizia de
a schimba sistemul de evaluare, 250 au fost de accord cu aceasta optiune. Intervalu de
incredere pentru parametrul proportiel, cu o probabilitate de 0.90, este:
a [0.4245; 0.7428]
b. [0.5851; 0.6649]
c. [0.3560;0.6440 ]
15.Potrivit datelor Eurostat, în România, exporturile de bunuri şi servicii (exprimate in
euro / locuitor), în perioada 2000-2010 au înregistrat următoarele valori: 600, 700, 800,
800, 1000, 1200, 1500, 1700, 2000, 1700, 2100. Sunt corecte următoarele afirmații:
a) volumul exporturilor României a crescut în anul 2010 comparativ cu anul 2000 cu
1500 euro/locuitor
b) volumul exporturilor României a crescut, în anul 2010 comparativ cu anul 2000 de
3,5 ori
c) volumul mediu anual al exporturilor României, în perioada 2000-2010, a fost de
1281,81 euro/loc.
15) În vederea testārii semnificației diferenței dintre o medie 𝜇 și o valoare fixă 𝜇0 ,
pentru un eşantion de volum n=50, se obține o valoare calculată a statisticii test =1,52.
În cazul unui test bilateral, dacă valoarea teoretică este z=1,645 asumat de a respinge
pe nedrept ipoteza H0 este:
a) ∝ = 0,10
b)∝= 0,01
C) ∝ = 0,95
24 Sporul absolut cu bază fixă exprimă:
a) cu cât s-a modificat, în mărime absolută, nivelul unei variabile corespunzător
momentului curent, t, comparativ cu nivel aceleiași variabile corespunzător momentului
de referință;
b) de câte ori s-a modificat nivelul unei variabile corespunzător momentului curent, t,
față de nivelul aceleiași variabile corespunzător momentului de referință.
c) cu cât s-a modificat, în mărime relativă, nivelul unei variabile, corespunzător
momentului curent, t comparativ cu nivelu aceleiași variabile corespunzător momentului
anterior, t-1; %8L
16. Aplicând metoda ANOVA s-au obținut următoarele rezultate
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". In această
situație, considerând un risc de 0,05, se poate afirma că:
a) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influență semnificativă
asupra variației salariului
b) ipoteza Ho este 𝜇1 = 𝜇2 = 𝜇3
c) se respinge ipoteza Ho
d) numărul gradelor de libertate asociate variației totale este 203
17.Care dintre afirmatille urmatoare sunt adevarate:
a) Valoarea teoretica a statisticii test se citeste pentru 2 si 126 greade de libertate
b) Valoarea calculatata a statisticii test este de 45
c) Se accepta Ipoteza HO
d) Marimea firmei nu influenteaza nivelul profitului
e) Volumul esantionului este de 128 de firme
18. Dintr-o populatie de 5 firme se pot extrage aleator:
a. 25 de esantioane de 2 firme; dupa schema de revenire
b.10 esantioane de 2 firme, fara schema de revenire
c. 50 de esantioane, indifferent de schema de extragere
19. La un examen profesorul a stabilit ca elevii care vor obtine un punctaj cuprins intre 60 si 80
puncte vor primi calificativul C. Pentru anul current distributia punctajelor este normala, X-
N(75, 25). Procentul elevilor care primesc calificativul C este de:
a.12,5%
b. 55%
C. 63%
d. 84%
20. Intru-un sondaj simplu de 400 produse, 250 au fost gasite expirate. Intervalul de incredere
pentru proportia produselor expirate, cu o probabilitate de 0,90, este:
a. (0,58; 0,66)
b. 10,65; 0,68)
c. (0,51; 0,75)
21. Intr-un sondaj de opinie, 𝜎 2 = 0,18, volumul esantionului care estimeaza parametrul
proportie cu o eroare maxim admisibila de +3% si o probabilitate de 0,95 este:
a. 768 persoahe
b. 1200 persoane
c. 1000 persoane
22. La aruncarea unui zar, probabilitatea de aparitie a unei fete cu numar mai mic decat 4 este de:
a. 50%
b. 0,5
a) a-0,0675
b)-0,92
c) a-0, 1331.
26) Un esantion de 36 d7e studenti au sustinut un test pe calculator, iar un esantion de 45 de student au
sustinut un test ciasic. S- au inregistrat punctajele obținute de cele doua eşantioane de studenti si s-au
obtinut = 65 puncte i = 60 puncte Stind ca abalerile standard la nivelul populatiet sunt egate cu 18.
respectiv 15. så se verifice daca punctajele medii ale celor doua grupe de studenți difera semnificativ
statistic, pentru un rise de 5%
e) Punctajele medi ale celor doua grupe de studenti difera semnificativ statistic, pentru un nisc de 5%
27) Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a Inregistrat In perioada 2014-2015
umàtoarea evolute
2014 2015
Trim. I 12 9
Trim. II 2 5
Trim. III 4 4
Trim. IV 3 3
Ştiind ca i=0.82 sunt corecte afirmațiile:
28) Un producător de cereale realizează o ancheta privind comportamentul de consum al adulților din
SUA. S-a extras aleator un santion de 625 de persoane și s-a identificat că 78% dintre persoane sunt
preocupate de consumul de alimente sanatoase Pentru 98% incredere, s-a estimat intervalul pentru
proportia adulților din SUA care acordă atenție alimentației sănatoase. Care afirmații sunt adevărate?
29) La un examen, profesorul a stabilit că elevii care vor obține un punctaj cuprins Intre 65 şi 70 vor
primi calificativul B. Pentru anul curent, distribuția punctajelor este normala, X-N(55,25) .Care este
procentul elevilor care primesc calificativul B ?
a) 12,28%
b) 47,72%
c) 2,15%
30) Atunci când se cunoaşte dispersia in demersul testårii ipotezelor asupra mediei unei populații se
foloseşte:
A)statistica Z
b) statistica Fisher
c) statisticat t
30) În vederea testării semnificației diferenței dintre media 𝜇 şi valoarea fixă 𝜇 0pentru un eşantion de
volum n=50, se obtine o valoare calculată a statisticii test z = 3,24. In cazul unui test bilateral, dacă
valoarea teoretică este z = 2,17, atunci urmātoarele afirmații sunt adevărate:
31) Intr-un sondaj de opinie, care admite situatia de maxima eterogenitate a populatiei, volumul
esartionului care entimeaza parametrul proportiei cu o eroaremaxim admisibila de ±2.8%
a)1225
b) 1007
c)1500
d) o statistica
a) o variabila aleatoare
a) 4,3%
b) 1,5%|
c) 6,7%
2. Estimatorul nedeplasat
3.Intr-un sondaj aleator simplu e 900 de student prin variabila nota la un test, s-a obtinut o
valoare medie standard de 7.5 si o abatere standard de esantion modificata (corectata) egala
cu 1.6. Intervalul de incredere pentru parametrul mediu 0.95 este:
a. [8.1280; 9.2020]
b. [7.3955; 7.6045]
c 7.5260, 9.3424]
4. In vederea testari diferentei dintre o medie µ si o valoare fixa p, pentru un esantion X se abtine o
valoare calculate a statistici z=1.52 In cazul unul test bilateral, daca valoarea teoretica. Asumat de a
respinge ipoteza H0 este:
Á=0,10
Á=0.01
Á=0,95
5.Se verifica daca media unei populatii,µ difera in mod semnificativ de o valoare fixa µ0.In acest
caz,ipotezele sintactice sunt:
a.H0:µ=µ0
H1:µ>µ0
b. H0:µ≠µ0
H1:µ=µ0
c.H0:µ=µ0
H1:µ≠µ0
b.Regula de decizie
a. (7.5260-9,3424)
b.(8,1290-9,2020)
c.(8,0736-8,4264)
8.Nivelul vanzarilor unei firme (mld lei) a inregistrat , in perioada 2007-2010 urmoatoarea evolutie:
Anul Vanzari
2007 2
2008 3
2009 5
2010 4
2011 7
Care din afirmatiile urmatoare sunt adevarate ?
a.Valoarea vanzarilor fimei in anul 2011 fata de anul 2008 a crescut cu 4 mld lei
b.Valoarea vanzarilor firmei in anul 2011 fata de anul 2008 a crescut cu 2.33 mld lei
d. Cresterea media anuala a vanzarilor in perioada 2011-2007 este de 4,2 mld lei
e. Cresterea medie anuala a vanzarilor in perioada 2011-2007 este de 1,25 mld lei
g.Valoarea vanzarilor firmei in anul 2011 fata de anul 2008 a crescut cu 233%
9.Pentru a verifica daca feimeile sunt supuse riscului de cancer mamar , doctorii au dezvoltat o
metoda noua de detectare a cancerului.Pentru a proba aceasta metoda au alcatuit un esantion de
140 de femei cu cancer mamari si au observat ca, in urma aplicarii noii metode , pentru 12 femei nu
s a reusit detectarea cancerului.Stiind ca metoda veche are o rata de esec de 20% pentru un risc
asumat de 5% care sunt afirmatiile adevarate?
a.Rata de esec a noii metode difera semnificativ de rata de esec a vechii metode
10.La nivelul unui esantion de 306 persoane, 5% dintre acestea nu folosesc niciodata mijloace de
transport in comun. Stind ca anul trécut ponderea era de 8%, care dintre urmatoarele afirmarti sunt
adevarate?
a.H0 :TT=8%
b.Pentru un risc asumat de 5% se sepinge ipoteza de egalitate a proportiilor
c.Pentru un risc asumate de 1% se accepta ipoteza de egalitate a proportiilor
11.
Mean 173
Meadian 180
Mode 180
Standard 35.60586718
Deviation
Kurtosis 1.175597901
Skewness -0.584473684
Range 130
Minimum 100
Maximum 1730
Sum 1730
Count 10
Confidence 10
b.O esimatie
c.Un estimator
13.La acelasi nivel de incredere si aceeasi variant,pentru a mari precizia rezultatelor este necesar:
13,
Skewness 1.161
Range 11,000
Minimum 7,000
Maximum 18,000
Sum 488,000
Count 49,000
Confidence Level 0,755
a.Nu exista diferente semnificative intre castigul mediu salarial din regiunea de N-E a Roamniei si
castigul mediu salarial la nivel national in conditiile riscului asumat de 5%
b. exista diferente semnificative intre castigul mediu salarial din regiunea de N-E a Romaniei si
castigul mediu salarial la nivel national in conditiile riscului asumat de 5%
c. Variant calculate a statisticii test este t=10.86( nu sunt sigur daca e 10.86 sau e cu minus)
14.Dintr-o ancheta de opinie asupra unui esantion de 500 de persoane, extras aleator repetat, a
rezultat ca in medie, din 100 de persoane , 85 voteaza favorabil pentru un candidat in funcia de
primar, intervalul de incredere al procentului de voturi la nivelul intregii populatii,este de 95%.
a.[0147;0,567]
b.[0,567:0,814]
c.[0,827;0,872]
b.O statistica
b.Exista diferente semnificative intre speranta medie de viata a femeilor din Europa si media la
nivelul mondial,in conditiile riscului asumat de 5%.
16.Intr-o ancheta prin sondaj asupra unui esantion de angajati, s a observat cuantumul bonusurilor
oferite de Paste, rezultatele fiind prezentate mai jos
Cuantum bonus
Mean 173
Standard Error 11,25956384
Median 180
Mode 180
Skewness -0,584473684
Range 130
Minumum 100
Maximum 230
Sum 1730
Count 10
17.Estimatorul reprezinta :
a. Θ=f(x1,x2,.....,xN)
b. o variabila aleatoare
a.cu cat s a modificat, in marime relativa, nivelul unei variabile corespunzatoare momentului
aceleaiasi variabile corespunzator momentul anterior t-1;
b.de cate ori s a modificat ,nivelul unei variabile corespunzator momentului curent,t co,....
corespunzator mementului de timp anterior t-1
c.cu cat s a modificat , in marime absoluta, nivelul unei variabile corespunzator momentului aceleiasi
variabile corespunzator momentului de referinta
19. In metoda ANOVA , variatia explicata (VE) masoara :
b. eroarea de testare de tip tt reprezinta eroarea de a accepta ipoteza nula H ( NU STIU SIGUR)
atunci cand in realitatea aceeasi.
20. Nivelul cifrei de afaceri (mld lei) aunei firme pe trimestre a inregistrat in perioada 2014-2015
urmatoare
2014 2015
Trim I 6 10
Trim II 2 5
TRIM III 5 4
TrIm IV 3 2
b. α=0.05
c. α=0.01
Rezolvare:
X ~ N(µ,σ2)
μ =500
σ=100
P(X>650)=?
xi
zi
650 500 150
x1=650 z1 1, 5
100 100
P(X>650)=P(Z>1,5)=0,5-φ(1,5)=0,5-0,4332=0,0668≈6,7%
12
2 4 , 2
10 12
x1=10 z1 1 a
2
13 12
x2=13 z2 0, 5
2
P(10<X<13)=P(-1<Z<0,5)=φ(0,5)-φ(-1)=φ(0,5)+φ(1)=0,1915+0,3413=0,5328 sau
53,28%
1
3) Într-un sondaj aleator simplu de 400 studenţi, pentru variabila nota la un test, s-a
obţinut o valoare medie de 8,25 şi o abatere standard de eşantion modificată egală cu 1,8.
Intervalul de încredere pentru parametrul medie, cu o probabilitate de 0,95, este
a) (7,5260 - 9,3424)
b) (8,1280 - 9,2020)
c) (8,0736 - 8,4264)
n=400
x 8, 25
s 1, 8
s
x t / 2;n1
n
1,8
8, 25 1,96
400
[8,25±0,1764]
4) În urma prelucrării datelor privind venitul lunar (sute euro) realizat pentru un eşantion
de persoane, s-au obţinut următoarele rezultate:
Column1
Mean 10
Standard Error 0.730297
Median 9
Mode 9
Standard Deviation 2.309401
Sample Variance 5.333333
Kurtosis 1.36942
Skewness 1.082532
Minimum 7
Maximum 15
Sum 100
Count 10
Confidence Level(95.0%) 1.652046
2
s
x t / 2;n1
n
10 1,65 8,35;11,65
x 0 10 15 5
tcalc 6,84
s/ n 2, 3094 / 10 0,73
3
d) ipoteza H0 este 1 2 3
6). Nivelul vânzărilor unei firme a înregistrat în perioada 2010 - 2013 următoarea
evoluţie:
Anii 2010 2011 2012 2013
Volumul vânzărilor ( mld. lei ) 2 8 10 12
Sporul mediu
e) știind că rata medie de variație este 125, se poate afirma că vânzările firmei au crescut
în medie cu 125% pe an.
- vânzările firmei au crescut în medie cu 25% pe an.
7). Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a înregistrat în perioada
2010-2011 următoarea evoluţie:
2010 2011
Trim. I 1 3
Trim. II 3 5
Trim. III 2 4
Trim. IV 4 7
4
Știind că i 2 ,98 , sunt corecte afirmațiile:
a) cifra de afaceri medie a firmei a fost de 3,625 mld. lei pe an;
y
yt 29 3, 625 mld. lei
n 8
b) cifra de afaceri a firmei a crescut în medie cu 0,85 mld. lei pe trimestru;
Sporul mediu
y y 7 1 6
n 1 0, 85 mld. lei
n 1 7 7
c) cifra de afaceri a firmei a crescut în medie cu 198% pe trimestru.
Rata medie a sporului
r i 1 =2,98-1=1,98
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situație, considerând un risc de 0,05, se poate afirma că:
a) se garantează cu o probabilitate de 0,95 că factorul de grupare are o influență
semnificativă asupra variaţiei salariului
TSS=ESS+RSS ESS=TSS-RSS
ESS=440-320=120
k-1=2 k=3 (numărul de grupe ale factorului de grupare sau de medii ale
populațiilor)
n-1=202 n=203
n-k=203-3=200
H 0 : 1 2 3
H1 : cel putin două medii diferă între ele
ESS 120
k 1 2
60
Fcalc 37 , 5
RSS 320 1, 6
n k 200
5
Deoarece Fcalc F0,05;2;200 cu un risc asumat de 0,05 se respinge ipoteza H0 și se acceptă
ipoteza alternativă. Deci, factorul de grupare are o influență semnificativă asupra variației
salariului.
b) ipoteza H0 este 1 2 3
(k-1=2, deci k=3)
c) se respinge ipoteza H0
Cumulative
Frequency Percent Valid Percent Percent
Valid Masculin 4 40.0 40.0 40.0
Feminin 6 60.0 60.0 100.0
Total 10 100.0 100.0
nA 6
p 0, 6 sau 60%
n 10
p 1 p p 1 p
p t /2,n 1 ; p t /2, n 1
n n
t /2,n 1 t0,05;9 1,833
0, 6 1 0, 6 0, 6 1 0, 6
0, 6 1,833
;0, 6 1,833
10 10
0, 48989 0, 48989
0, 6 1,833 ;0, 6 1,833
3,162277 3,162277
6
0,6 0, 28;0,6 0, 28
0,32;0,88
k=5
Variabila numerică este "Salariul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
a) valoarea calculată a statisticii F este 16,33
7
RSS=TSS-ESS=500-350=150
n-k=21
n-1=24 n=25
25-k=21 k=4
H 0 : 1 2 3 4
H1 : cel putin două medii diferă între ele
ESS 350
k 1 3
116, 66
Fcalc 16, 33
RSS 150 7 ,14
nk 21
b) ipoteza H0 este 1 2 3 4
k=4
F0 ,05;3; 21 3,073
Variabila numerică este "Venitul", iar variabila (factorul) de grupare este "Regiunea". În
această situaţie, se poate afirma că:
a) există diferenţe semnificative între veniturile medii pe regiuni la nivelul
populațiilor, pentru un risc de 5%
8
ESS
Fcalc k 1
75
19, 62
RSS 3, 823
nk
F0 ,05;2;17 3,592
c) se respinge ipoteza H 0 : 1 2 3
k-1=2
k=3
9
1.Volumul esantionului poate fi estimat daca se cunoaste:
a. F(x)=P(X≥x)
b. F(x)=P(X=x)
c. F(x)=P(X>x)
d. F(x)=P(X<x)
4.Nivelul cifrei de afaceri (mld lei) a unei firme pe trimester a inregistrat in perioada 2014-2015
urmatoarele:
2014 2015
Trim 1 6 10
Trim 2 2 5
Trim 3 5 4
Trim 4 3 2
5.In vederea testarii diferentei dintre o medie μ si o valoare fixa μ0, pentru un esantion X se obtine o
valoare calculate a statisticii z=1.45. In cazul unui test bilateral, daca valoarea teoretica ….. Asumat de a
respinde pe nedrept ipoteza H0 este:
a. à=0.95
b. [34520.1066; 36.6244]
c. [1183.83; 1216.17]
6.Intr-o ancheta prin sondaj asupra unui esantion de angajati s-a observant cuantumul bonurilor oferta
cu ocazia Sarbatorilor de Paste, rezultatele fiind prezentate mai jos.
Column 1
Mean 173
Standard Error 11.25956384
Median 180
Mode 180
Standard Deviation 35.605867180
Sample Variance 1267.777778
Kurtosis 1.175597901
Skewness -0.584473684
Range 130
Minimum 100
Maximum 230
Sum 1730
Count 10
Confidence Level (99.0%) 28.9799368
a. Intervalul de incadrare care acopera valoarea medie a bonurilor la nivelul tuturor angajatilor
firmei pentru o probabilitate de 99% este [161.75; 184.25]
b. Volumul esantionului este de 10.
c. Eroarea maxima admisibila este 28.97
d. Riscul asumat in estimarea prin interval de incredere a mediei este de 5%
a. Cu cat s-a modificat in marime relative nivelul unei variabile corespunzatoare momentului
current, aceleiasi variabile corespunzator anului anterior t-1
b. De cate ori s-a modificat, nivelul unei variabile corespunzatoare momentului current, t,
comparat corespunzator momentului de timp anterior t-1
8.Fara table
11.La un examen, profesorul a stabilit ca elevii re vor obtine un punctaj cuprins intra 80 si 90 vor primi
calificativul B. Pentru anul current, distributia puncatjelor este normal, X-N(83, 25). Care este procentul
elevilor care primesc alificativul B?
a. 80%
b. 64.5%
c. 90%
13.In urma prelucrarii privind veniturile familiilor familiilor inregistrate la nivelul unui esantion de volum
n=625, s-au obtinut urmatoarele rezultate x =12 mii lei, ś=2 mii lei. Sa se testeze daca exista diferente
semnificative intre veniturile medii ale familiilor la nivelul populatiei din care a fost extras santionul si
venitul mediu pe tara μ0=13 mii considerand un risc de 5%. Pentru exemplul dat sunt corecte afirmatiile:
a. Se accepta ipoteza H0
b. Se respinge ipoteza H0
c. Exista diferente semnificative intre cele doua medii
14.Intr-un test statistic bilateral in care se foloseste statistica t, considerand v numarul gradelor de
libertate, ipoteza nula nu se respinge daca:
a. Tα/2, v</𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡
b. 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 > 𝑡 𝛼 , v
𝑡𝛼
c. /𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡/ ≤ ⁄ ,v
2
15.Intr-o Ancheta prin sondaj asupra unui esantion de angajati, s-a observant cuantumul bonusurilor
oferite cu ocazia Sarbatorilor de Paste, rezultatele fiind prezentate mai jos.
Mean 173
Standard Error 11.25956384
Median 180
Mode 180
Standard Deviantion 35.60586718
Sample Variance 1267.777778
Kurtosis 1.175597901
Skewness -0.584473684
Range 130
Minimu 100
Maximum 230
Sum 1730
Count 10
Confidence level (99.0%) 28.9799968
16.Atunci cand se cunoaste dispersia σ2 , testarea ipotezelor asuprs mediei unei populatii se face cu:
a. Statistica Fisher
b. Statistica t
c. Statistica Z
18.Dintr-o populatie s-a extras un esantion de volum n=900 persoane. Pentru o variabila X- consumul
saptamanal de paine (kg), s-au obtinut rezultatele x = 3kg, ś= 1 kg. Considerand un risc de 5 %, se
poate considera ca nivelul consumului mediu saptamanal de paine
19.O banca doreste s a verifice corectitudinea informatiilor asupra clientilor sai. S-a extras un esantion
aleatoriu de 200 de dosare si s-a indentificat 18 dosare cu informatii gresite. Proportia dosarelor cu
greseli ale bancii, pentru incedere de 95% este acoperita de intervalul:
a. [0.051, 0.129]
b. [0.09, 0.91]
c. [0.07, 011]
21.Fara enunt
Trim 2 3 5
Trim 3 2 6
Trim 4 5 8
4. Care din urmatoarele forme de distributie discrimineaza cel mai bine subiectii cu
rezultate foarte bune la o examinare psihologica
a. Distributia cu asimetrie de dreapta
b. Cu asimetrie de stanga
c. Distributia normala
7. Cuantilul este:
a. Un interval valoric
b. O borna valorica care separa doua couantumuri procentuale complementare
c. O valoare a variabilei care se repeat
8. Care din urmatorii indicatori statistici se refera la nivelul boltirii:
a. Varianta
b. Abaterea quartila
c. Sckwenes
d. Kurtosis
e. a+b
f. c+d
9. In ce zona discrimineaza mai bine clasele standard construite prin procedeul cunatilelor:
a. In zona central a distributiei
b. In zona extrema superioara
c. In zona extrema inferioara
14. Operatia prin care dintr-o scala cu m categorii obtinem o scala cu n categorii in care m>n
se numeste:
a. ordonare
b. grupare
c. rafinare
d. cumulare
17. Care din urmatoarele exigente ale contruirii unor tabele statistice este falsa:
a. Sa cuprinda numai informatii strict necesare
b. Sa admita rubric incomplete
c. Notele explicative trebuie sa indice sursa datelor
d. Sa faciliteze perceptia rapida si exacta a informatiilor prezentate
18. Daca valoarea indicelui Kurtosis este semnificativ < 3 atunci avem o distributie:
a. Asimetrica pozitiva
b. Asimetrica negative
c. Platicurtica
d. Leptocurtica
19. Intr-o distributie cu o asimetrie pozitiva, care este ierarhia valorica a indicatorilor de
nivel:
a. 1 media, 2 valoarea mod, 3 mediana
b. 1 valoarea mod, 2 mediana, 3 media
c. 1 media, 2 mediana, 3 valoarea mod
21. Scorul care imparte distributia in doua parti egale sau cat mai aproape ca valoare se
numeste:
a. Valoare mod
b. Media aritmetica
c. Mediana
d. Decila
24. Care este nivelul maxim de masurare pentru variabila tipul de temperament:
a. nominal
b. ordinal
c. de interval
d. de raport
27. In cazul scorurilor aberante indicatorul statistic care isi pierde relevanta este:
a. Amplitudinea
b. Media
c. Mediana
d. b+c
---------------------------------------------------------------------
4) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut
rezultatele din tabelul de mai jos.
Statistics
Current S alary
N V alid 474
Mis sing 0
Mean $34,419.57
S td. E rror of Mean
$784.311
Median $28,875.00
Mode $30,750
S td. Deviation
$17,075.661
V arianc e 291578214,453
S kewnes s 2,125
S td. E rror of Skewnes s
,112
K urtos is 5,378
S td. E rror of Kurtos is
,224
Range $119,250
Minimum $15,750
Maximum $135,000
S um $16,314,875
P ercentiles 25 $24,000.00
50 $28,875.00
75 $37,162.50
---------------------------------------------------------------------
6) 25% din salariaţii unei întreprinderi au un salariu de cel mult 2500 lei. Această valoare
reprezintă
a) quartila unu
b) mediana
c) quartila trei
---------------------------------------------------------------------
7) Distribuţia a n familii dintr-un bloc, după numărul de copii (X), la un moment dat, se
prezintă astfel :
xi 0 1 2 3 4
ni 5 15 20 10 5
Ponderea familiilor care au cel mult 2 copii este :
a) 72,7%
b) 40%
c) 2%
---------------------------------------------------------------------
8) Pentru două judeţe, A şi B, s-a înregistrat rata şomajului (%) în perioada 1990-2011.
Rezultatele sunt reprezentate in figura de mai jos.
judetul_B
judetul_A
4 6 8 10 12 14 16 18 20 22
---------------------------------------------------------------------
7) Distribuţia unui eşantion de 200 de firme din judeţul Iaşi după profitul lunar, obţinut in anul
2012, este caracterizată prin următoarele valori: x = 180 milioane şi s2= 361. Abaterea medie
pătratică (abaterea standard) arată că
a) o firmă obţine un profit lunar care se abate de la profitul mediu cu 19 milioane lei
b) o firmă obţine un profit lunar care se abate, în medie, de la profitul mediu, cu 19 milioane lei,
în sens pozitiv şi negativ
c) o firmă obţine un profit lunar care se abate, în medie, de la profitul mediu, cu 361 milioane lei,
în sens pozitiv şi negativ
d) o firmă obţine un profit lunar mai mare decât profitul mediu cu 19 milioane lei
---------------------------------------------------------------------
8) Distribuţia familiilor dintr-un bloc după numărul de copii se prezintă astfel:
Număr copii 0 1 2 3 4
Număr familii 3 10 18 3 2
Pentru exemplul dat, valoarea modului este:
a) Mo = 2 copii
b) Mo = 18 copii
c) Mo = 32 copii
---------------------------------------------------------------------
9) Diagramele box-plot obţinute pentru distribuţia angajaţilor a două firme după salariul lunar
(euro) obţinut sunt prezentate mai jos:
--------------------------------------------------------------------
11) Un coeficient de boltire (k) egal cu - 4 arată:
a) o distribuţie leptocurtică
b) o distribuţie mezocurtică
c) o distribuţie platicurtică
---------------------------------------------------------------------
GRILE SESIUNE
1. Estimatia este:
a) valoare a estimatorului calculată la nivelul eșantionului observat
b) o valoare calculată pe baza datelor de sondaj
c) o statistica
d) o valoare fixa si cunoscuta la nivelul unei populatii
2. La acelasi nivel de incredere si aceeasi varianta, pentru a mari precizia
rezultatelor este necesar:
a) sa marim volumul esantionului
b) sa lucram cu esantionul nealeatoare
c) sa reducem eroarea de reprezentativitate
3. Se verifica daca proportia π a clientilor care prefera produsul A, in anul
curent, difera in mod semnificativ de proportia clientilor din anul precedent.
In acest caz, ipotezele statistice sunt:
a) H0: π=π0
H1: π≠π0
b) H0: π=π0
H1: π<π0
c) H0: π≤π0
H1: π>π0
4. Atunci cand se cunoaste dispersia б^2, testarea ipotezelor
asupra mediei unei populatii se face cu:
a. Statistica Z
b. Statistica t
c. Statistica Fisher
5. Intr-un sondaj aleator simplu de 400 studenti, pentru variabila nota la un test,
s-a obtinut cu o valoare medie de 8. Cunoscand ca abaterea standard la
nivelul populatiei totale are valoarea egala cu 2, intervalul de incredere
pentru parametru cu o probabilitatea de 0.95 este:
a. [7.50; 9.00]
b. [7.804; 8.196]
c. [8.128; 9.202]
6. Sporul absolut cu baza in lant (mobila) se calculeaza ca:
a. raport intre doua niveluri ale aceleiasi variabile corespunzatare pentru
doua momente de timp cons..
b. diferenta intre doua niveluri ale aceleiasi variabile corespunzatoare a
doua momente de timp consecutiv
c. diferenta intre nivelul unei variabile, corespunzator unui moment de timp
oarecare, t, si nivelul acelei.... corespunzator unui moment de referiinta
7. Sporul absoul cu baza fixa exprima:
a. cu cat s-a modificat, in marime absoluta, nivelul unei variabile
corespunzator momentului curent t, comparativ cu nivelul aceleiasi variabile
corespunzator momentului de referinta
b. de cate ori s-a modificat nivelul unei variabile corespunzator momentului
curent t, fata de nivelul aceleiasi variabile corespunzator momentului de
referinta.
c. cu cat s-a modificat, in marime relativa, nivelul unei variabile, corespunzator
momentului curent t, comparativ cu nivelul aceleiasi variabile corespunzator
moemntului anterior t-1
8. Eficienta estimatorului vizeaza:
a. abaterea standard a estimatorului este minima
b. media estimatorului egala cu 0
c. dispersia estimatorului egala cu media estimatorului
9. Pentru o variabila X →N(µ; б^2), se cere sa se calculeze probabilitatea P(µ-
б<X<....) este:
a. 75%
b. 68.26%
c. 95.4%
10. Dintr-o populatie de 10 studenti se pot extrage aleator:
a. un numar infinit de esantioane
b. 1.000 de esantioane de 2 studenti, dupa schema de revenire
c. 100 de esantioane de 2 studenti, dupa schema cu revenire
d. acelasi numar de esantioane, indiferent de schema de extragere
11. Parametrul reprezinta:
a. o functie a variabilelor de selectie
b. o valoare fixa si necunoscuta la nivelul unei populatii
c. o statistica
12. Pentru o variabila X -> N(20; 16). P(18<X<22) este
a. 0.383
b. 0.962
c. 0.454
13. Distributia mediei de selectie se caracterizeaza prin>
a.
2
ˆ ~ N ( , )
n
b.
ˆ ~ N (, ^2)
c. 2
ˆ ~ N ( , )
n
14. Intr-un sondaj aleator simplu de 900 de studenti, pentru variablia nota la un
test, s-a obtinut o valoare medie de 7.5 si o abatere standard de esantion
modificata (corectata) egala cu 1.5. Intervalul de incredere pentru parametru
cu o probabilitate de 0.95 este:
a. [7.5200; 9.3424]
b. [7.3955; 7.60045]
c. 6.1280; 9.2020]
15. Un politician, la inceputul mandatului afirma ca va creste salariu mediu net
pe economie la 350 euro. La sfarsitului mandatului, se face un sondaj pe n=
900 de respondenti prin care se urmareste estimarea salariului mediu net pe
economie (X). Se cunosc urmatoarele rezultate: media= 343 euro, б=90.
Care dintre afirmatiile de mai jos sunt corect:
a. putem afirma un prag de semnificatie de 5% ca politicianul nu s-a tinut
de cuvant?
b. putem afirma un prag de semnificatie de 1% ca politicianul s-a tinut de
cuvant
c. putem afirma un prag de semnificatie de 5% ca politicianul s-a tinut de
cuvant
16. Esantionul reprezinta o subpopulatie sau un subansamblu extras din
populatia de referinta:
a. poate fi extras aleator, cu revenire sau fara revenire
b. respecta proprietatea de reprezentavitate
c. din motive de cost, are un volum mai mic decat volumul populatiei
17. Pentru aplicarea metodei ANOVA trebuie indeplinite urmatoarele conditii:
a. conditia de homoscedasticitate
b. conditia de normalitate
c. conditia de independenta
18. Atunci cand se cunoaste dispersia sigma^2, testarea ipotezelor asupra mediei
unei populatii se face cu:
a. statistica t
b. statistica Fisher
c. statistica Z
19. Pentru testarea diferentei dintre doua medii ale unor populatii se foloseste:
a. statistica Fisher
b. Statistica t, cand nu se cunoaste varianta populatiei
c. Statistica Z, cand se cunoaste varianta populatiei
a. 0,977
b. 0,889
c. 0,341
t calculat = 10.732
numarul gradelor de lbertate este 33
Sunt adevarate afirmatiile:
a. suma volumelor celor doua esantioane analizate este egala cu 35.
b. exista diferente semnificative intre nivelul mediu a PIB-ului/locuitor al
tarilor din OECD si cel al tarilor din Europa de Est, in conditiile riscului
asumat de 5%
c. valoarea teoretica a statisticii Student este egala cu 1,960
52. Intr-un sondaj aleator simplu de 400 de angajati, pentru variabila venitul
lunar s-au obtinut rezultatele de mai jos:
Venitul Lunar
Mean 1020
Standard Deviation 158,11
Pentru o probabilitate de 0,95 intervalul de incredere pentru parametrul
medie este:
a. [861,89; 1178,11]
b. [1004,51; 1035,49]
c. 34520,1066; 36,6244]
53. La un examen, punctajele obtinute de tudenti sunt distribuite normal cu
media 45 si abaterea standar 10. Un student a obtinut punctajul X=60. Ce
procent din studenti au obtinut un punctaj mai mare decat el?
a. 0,477%
b. 6,68%
c. 43,32%
54. Atunci cand se cunoaste dispersia б^2, in demersul testarii ipotezelor asupra
mediei unei populatii se foloseste:
a. statistica Fisher
b. statistica Z
c. statistica t
55. Se extrag aleator simplu repetat doua esantioane, primul format din 5
persoane de sex masculin, iar la al doilea din 7 persoane de sex feminim. Se
inregistreaza Varsta acestora si, in urma prelucrarii datelor, se obtin
urmatoarele rezultate:
media masculin= 25 ani
media feminin= 26 ani
S^2 masculin= 9
s^2= feminin= 4
Sa se testeze ipoteza potrivit careia intre varstele medii ale persoanelor
semnificative. Se cere garantarea rezultatului cu o probabilitate de 0,95.
a. valoarea calculata a statisticii test est t= -0,65
b. valoarea calculata a statisticii test est t= -6,5
c. intre varstele medii ale persoanelor de sex masculin si ale celor de sex
femini la nivelul populatiei din care au fost extrase esantioanele observate
exista diferente semnificative
d. intre varstele medii ale persoanelor de sex masculin si ale celor de sex
femini la nivelul populatiei din care au fost extrase esantioanele observate
nu exista diferente semnificative
56. In metoda ANOVA, Variatia explicata VE masoara:
a. variatia sub influenta factorilor esentiali si aleatori (intamplatori)
b. variatia sub influenta factorilor esentiali (de grupare)
57. La alegerile municipale, s-a dorit identificarea alegatorilor care nu pot fi
trecuti pe lista electorara. Din lista existenta, s-a extras aleator un esantion
de 317 nume si s-a determinat ca 38 de nume nu indeplinesc conditiile de
alegator. Municipalitatea doreste sa estimeze intervalul de incredere pentru
proportia alegatorii exclusi de pe lista electorala pentru o probabilitate de
99%. Rezultatele corecte sunt :
a. valoarea teoretica utilizata este 1,96
b. intervalul de incredere pentru proportie este [0,073; 0,165]
c. intervalul de incredere pentru proportie este [0,05; 1,96]
58. In vederea testarii ipotezei de egalitate a salariului mediu cu o valoare fixa
µ0= 46 s-a inregistrat un esantion de volum n=10 persoane. In acest caz, se
pot formula urmatoarele afirmatii:
a. H0; µ=10; H1: µ≠10
b. H0 µ=46; H1: µ≠46
c. H0: µ=46; H1: µ<46
59. Dintr-o populatie s-a extras un esantion de volum n= 900 persoane. Pentru o
variabila X- conusmul saptamanal de paine (kg) s-au obtinut rezultatele:
media = 3kg, s’= 1 kg. Considerand un risc de 5% se poate considera ca
nivelul consmului mediu saptamanl de paine :
a. este egal cu µ = 3.5kg?
b. nu difera semnificativ de µ = 3,5kg
c. difera semnificativ de µ=3,5kg
60. Se verifica daca exista diferente semnificative intre castigul mediu salarial
(sute lei) din regiunea de N-E a Romaniei si castigul mediu salarial la nivel
national de 14 sute lei.
Mean 9.916
Standard Error 0.376
Median 9.000
Mode 9.000
Standard Deviation 2.629
Sample Variance 6.910
Kurtosis 1.217
Skewness 1.161
Range 11.000
Minimum 7.000
Maximum 18.000
Sum 486.000
Count 49.000
Confidence level 95,0% 0,755
Pentru alfa= 0,05, sunt adevarate afirmatiile:
a. nu exista diferente semnificative intre castigul mediu salarial din regiunea de
N-E a Romaniei si castigul mediu salarial la nivel national, in conditiile
riscului asumat de 5%
b. valoarea calculata a statisticii test est t= -10.86
c. exista diferente semnificative intre castigul mediu salarial din regiunea N-E
a Romaniei si castigul mediu la nivel national, in conditiile riscului asumat
de 5%
61. Aplicand metod anova :
Sursa variatie Suma patratelor Grade de libertate Estimatimatori ai
variantei variantei
Explicata 200 2 k=3 100
(intergrupe)
Reziduala 120 16 n=19 7,5
(intragrupa)
Variabila numerica este ,,VENITUL,, iar variabila (factorul) de grupare este
,,REGIUNEA,,
a. volumul esantionului este 19
b. se garanteaza cu o probabiilitate de 0,95 ca exista diferente semnificative
intre veniturile medii ale populatiilor
c. valoarea teoretica a statisticii F, condisrand un risc de 0,05 este 3,634
Exemple
Estimarea parametrilor unei populații
I. Estimarea statistică
- punctuală: presuspune aflarea unei valori posibile a estimatorului;
- prin interval de încredere (IC): presupune calculul limitelor (Li – Lower Bound și Ls – Upper
Bound) în care se găsește un parametru cu o anumită probabilitate.
s' s'
x t / 2 , x t / 2
n n
unde:
𝑠′
∆𝜇̂ = 𝑡𝛼/2 ∗ este eroarea maximă admisibilă sau eroarea limită (Confidence Level);
√𝑛
𝑠′
este eroarea medie de selecție sau de reprezentativitate (Standard Error of Mean);
√𝑛
IV. Aplicații
1) Pentru un eșantion format din 25 de persoane, se cunosc următoarele rezultate privind
veniturile anuale: 𝑥̅ =65 mii lei, s’2=121. Să se estimeze prin IC veniturile medii anuale
la nivelul populației din care a fost extras eșantionul, considerând o probabilitate de
garantare a rezultatelor de 95%.
2) Pentru un eșantion format din 100 de persoane, se cunosc următoarele rezultate privind
punctajele obținute la un test: 𝑥̅ = 75 puncte, s’= 10 puncte. Să se estimeze prin IC
punctajele medii obținute de ansamblul populației din care a fost extras eșantionul,
considerând:
a) o probabilitate de 95%.
b) o probabilitate de 99%.
Interpretare:
Se poate garanta cu o probabilitate de 99% că punctajul mediu obținut de ansamblul populației
din care a fost extras eșantionul este cuprins între 72,424 pct. și 77,58 pct. Ne asumăm un risc
de 0,01 sau 1% ca punctajul mediu obținut de ansamblul populației din care a fost extras
eșantionul să nu fie cuprins între 72,424 pct. și 77,58 pct.
3) În urma prelucrării datelor privind valoarea vânzărilor anuale (mil. lei) înregistrate pentru un
eșantion de firme, s-au obținut următoarele rezultate:
Column1
Mean 12.15
Median 12
Mode 10
Standard Deviation 1.8994
Sample Variance 3.6079
Kurtosis -1.31
Skewness 0.4274
Count 20
Interpretare:
Se poate garanta cu o probabilitate de 95% că vânzările medii anuale obținute de ansamblul
populației din care a fost extras eșantionul sunt cuprinse între 11,26 mil. lei și 13,04 mil. lei.
4) În urma prelucrării datelor privind vârsta (ani) înregistrate pentru un eșantion de persoane, s-
au obținut următoarele rezultate:
Column1
Mean 24.81
Standard Error 0.6722
Median 25
Mode 25
Standard Deviation 2.6887
Sample Variance 7.2292
Kurtosis -0.4875
Skewness 0.2277
Range 9
Minimum 21
Maximum 30
Sum 397
Count 16
Confidence Level(90.0%) 1.1784
Se cere:
a) să se precizeze valoarea erorii limită (erorii maxime admisibile).
Interpretare:
Se poate garanta cu o probabilitate de 90% că vârsta medie a întregii populații din care a fost
extras eșantionul este cuprinsă între 23,63 ani și 25,99 ani.
5) În urma prelucrării datelor privind nota obținută la un examen de către o serie de studenți, s-
au obținut următoarele rezultate:
Se cere
a) să se precizeze eroarea maxim admisibilă;
Interpretare:
Se poate garanta cu o probabilitate de 95% că punctajul mediu al întregii populații din care a fost
extras eșantionul este cuprins între 7.24 puncte și 7.69 puncte.
6) Pentru un eșantion format din 10000 persoane, se observă că 75% sunt de acord cu mărirea
pedepselor pentru anumite infracțiuni. Să se estimeze prin IC proporția persoanelor care
consideră că este necesară mărirea pedepselor pentru anumite infracțiuni la nivelul populației
din care a fost extras eșantionul (α=0,10).
Disciplina ”Bazele statisticii”
Exemple
Testarea statistică
I. Testarea statistică
1. Ipoteze statistice:
- ipoteza nulă (H0)
- ipoteza alternativă (H1)
2. Tipuri de teste:
- test bilateral
H0: 𝜃 = 𝜃0
H1: 𝜃 ≠ 𝜃0
H0: 𝜃 = 𝜃0
H1: 𝜃 > 𝜃0
H0: 𝜃 = 𝜃0
H1: 𝜃 < 𝜃0
- O valoare calculată a statisticii test (luată în modul) mai mare decât valoarea teoretică duce
la respingerea ipotezei H0 cu o probabilitate α.
e) Regula de decizie:
e) Regula de decizie:
- este similară cu regula definită la testarea mediei unei populații.
IV. Aplicații
1) Pentru un eșantion format din 25 de persoane, se înregistrează salariul lunar obţinut şi se obţin
următoarele rezultate: 𝑥̅ = 15 sute lei și s’= 2 sute lei. Se cere să se testeze dacă există diferenţe
semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul (𝜇) şi
salariul mediu pe economie, de 13 sute lei. Se consideră un risc de 0,05.
2) Pentru un eșantion format din 100 de persoane, se obțin următoarele rezultate privind nota
obținută la un test: media este 7 și varianța corectată (modificată) este 4. Să se testeze dacă există
diferențe semnificative între nota medie obținută de ansamblul studenților din care a fost extras
eșantionul și nota medie obținută în anul anterior, de 8. Riscul asumat este de 0,10.
Se poate garanta cu o probabilitate de 90% că există diferențe semnificative între nota medie
obținută de ansamblul studenților din care a fost extras eșantionul și nota medie obținută în anul
anterior. Ne asumăm un risc de 10% de a respinge pe nedrept ipoteza nulă.
3) În urma prelucrării datelor privind valoarea vânzărilor anuale (mil. lei) înregistrate pentru un
eșantion de firme, s-au obținut următoarele rezultate:
Column1
Mean 12.15
Median 12
Mode 10
Standard Deviation 1.8994
Sample Variance 3.6079
Kurtosis -1.31
Skewness 0.4274
Count 20
Să se testeze dacă există diferențe semnificative între valoarea vânzărilor anuale pentru
ansamblul firmelor din care a fost extras eșantionul și vânzările medii înregistrate în anul
anterior, de 14 mil. lei, considerând un risc de 5%.
4) La nivelul unui eşantion de volum n=25 de persoane, se observă că ponderea persoanelor care
votează pentru candidatul A este de 49%. Se cere să se testeze dacă există diferenţe semnificative
între proporţia persoanelor care votează pentru candidatul A la nivelul întregii populaţii şi
proporţia persoanelor care au votat pentru acest candidat la alegerile anterioare, de 51%. Se
consideră un risc de 5%.