Documente Academic
Documente Profesional
Documente Cultură
Alcătuirea eşantionului
Pentru ca un eşantion să fie reprezentativ, trebuiesc îndeplinite condiţiile:
1) populaţia de bază să fie cât mai omogenă
2) unităţile care vor forma eşantionul să fie alese la întâmplare
3) eşantionul să fie suficient de mare pentru a fi reprezentativ
4) unităţile extrase să fie independente
Alegerea unităţilor ce vor forma eşantionul se poate face pe baza unei scheme
probabilistice (prin tragere la sorţi sau loterie, prin selecţie pe baza unui tabel cu numere
aleatoare, prin alcătuire mecanică) sau în mod dirijat.
1
volumul colectivităţii originare va fi de N-n. Scăderea continuă a volumului colectivităţii
de bază face ca unităţile care participă la extragerea următoare să aibă o probabilitate din
ce în ce mai mare de a fi incluse în eşantion.
-Aceeaşi unitate nu poate fi inclusă de mai multe ori în eşantion, ceea ce conduce la erori
de reprezentativitate mai mici decât selecţia întâmplătoare repetată.
Obs. Populaţia de bază poate fi infinită: dacă se aruncă o monedă de 100 de ori şi formăm
un eşantion din numărul de feţe A ale monedei, acest eşantion se formează dintr-o
populaţie infinită.
Dimpotrivă, dacă extragem succesiv 10 bile dintr-o urnă cu 100 de bile, se formează un
eşantion dintr-o populaţie finită.
Considerăm toate eşantioanele posibile de mărime n care pot fi extrase dintr-o populaţie
dată de N indivizi. În cazul unui sondaj cu repetare, numărul total de eşantioane posibile
este de ; într-un sondaj fără repetare, se pot alcătui eşantioane. Pentru fiecare
eşantion, putem calcula caracteristicile: media, abaterea medie pătratică mediana, modul,
corelaţia etc, care variază de la unul la altul. Astfel obţinem o distribuţie a parametrilor
eşantioanelor, sau o distribuţie de sondaj. Dacă de exemplu, parametrul utilizat este
2
media, se obţine o distribuţie a mediei eşantioanelor, pentru care calculăm media
colectivităţii de selecţie, , (făcând media mediilor eşantioanelor), abaterea medie
pătratică a mediilor, ; dacă parametrul e dispersia, se calculează media dispersiei,
abaterea medie pătratică a dispersiilor etc.
Plecând de la distribuţia eşantioanelor (cu media , abaterea pătratică a mediei , şi
mărimea lor, n), putem estima cu o anumită precizie, parametrii ce caracterizează
populaţia din care s-au extras. Această estimare se bazează în principiu pe deducerea
mediei populaţiei, şi a abaterii medii pătratice a populaţiei, , în funcţie de şi ,
depinzând şi de schema probabilistică folosită.
3
cunoaşte, se estimează prin s, ( numită dispersia modificată de selecţie sau
dispersia corectată a eşantionului), calculată numai pe baza eşantionului extras:
∑ ;
în loc de s, se poate folosi S, fiind dispersia de selecţie sau de eşantion
∑ ; relaţia dintre dispersia modificată de selecţie şi dispersia de
selecţie fiind ; S pentru o caracteristică nealternativă corespunde expresiei
1 , w= fiind media eşantionului (vezi mai jos)
c) eroarea limită maximă admisă, notată cu ∆ pentru o caracteristică nealternativă
şi cu ∆ pentru o caracteristică alternativă se folosesc în estimarea intervalului
de încredere pentru media populaţiei, depinzând şi de precizia impusă cercetării;
d) intervalul de încredere sau „exactitatea”, I= ∆ , ∆ ] , în care se află
cu o anumită probabilitate
Concluzie
Aveam de a face cu trei distribuţii asociate caracteristicii studiate (media aritmetică):
-distribuţia populaţiei ( , );
-distribuţia de sondaj ( , )
-distribuţia eşantionului ( , : media în eşantion şi abaterea standard modificată a
eşantionului)
Relaţiile dintre ele: = ;
√ √ √
Obs. Fie o populaţie statistică de variabilă X repartizată normal, cu parametrii şi .
Presupunem că dintr-un eşantion de volum n, extras aleator, s-a obţinut media de eşantion
= (egală cu media de sondaj şi a populaţiei originare) şi dispersia modificată
de sondaj . Fie pragul de semnificaţie (probabilitatea sau precizia cerută). Dacă
dispersia ar fi cunoscută, intervalul de încredere pentru media populaţiei este
; Dar dispersia în general nu este cunoscută; atunci
√ √
intervalul de încredere pentru media populaţiei se consideră
; reciproc, din aceleaşi relaţii se deduc intervalele de încredere
√ √
pentru în funcţie de .
Tipuri de sondaj
Există mai mlte tipuri de sondaj, după modul de organizare a colectivităţii generale şi
după procedeul de selecţie a unităţilor în eşantion:
A. Sondaje aleatoare (probabiliste):
- sondajul simplu repetat şi nerepetat;
- sondajul tipic (stratificat);
- sondajul de serii;
- sondajul în mai multe trepte;
- sondajul secvenţional.
B. Sondaje cu extracţie nealeatoare:
- sondajul dirijat;
- sondajul sistematic (sau mecanic).
4
Fiecare tip poate fi repetat şi nerepetat, pentru caracteristici alternative sau
nealternative.
Pentru toate tipurile de sondaje: se estimează media populaţiei originare; se calculează
trei indicatori:
1. eroarea medie de sondaj (sau eroare medie de reprezentativitate), notată
2. eroarea limită admisă, notată cu ∆ pentru caracteristici nealternative şi cu ∆ pentru
caracteristici alternative
3. volumul eşantionului, n (pentru caracteristici alternative şi nealternative);
Deasemeni, se stabileşte intervalul de încredere pentru , I.
5
dacă …. , atunci …. unde este coeficientul de
variaţie pentru caracteristica i;
- volumul eşantionului necesar pentru estimarea unui parametru al caracteristicii i;
k - numărul caracteristicilor pentru care dorim să găsim estimări, incluse în sondajul
respectiv.
Eşantionul dimensionat în funcţie de caracteristica cu cel mai mare coeficient de variaţie
(caracteristica cea mai puţin omogenă) oferă estimări cu precizie şi siguranţă pentru toate
celelalte caracteristici studiate.
Pentru eşantioanele de volum mare, ∆ = , unde
√ ∆
este argumentul funcţiei Laplace corespunzător probabilităţii de (se citeşte din Anexa2).
Pentru eşantioanele de volum redus: ∆ = , ,
, unde
√ ∆
6
B.Sondajul simplu şi nerepetat
Fie o selecţie întâmplătoare nerepetată (schema hipergeometrică); să presupunem că sunt
extrase nerepetat toate eşantioanele de mărime n dintr-o colectivitate originară de mărime
N, N n. Dacă notăm media distribuţiei eşantioanelor cu şi abaterea medie pătratică (a
mediilor de selecţie de la media întregii populaţii) cu , iar parametrii întregii populaţii
(sau ai populaţiei originare) astfel: media colectivităţii originare cu şi abaterea medie
pătratică cu atunci:
= ; = · ; = , N fiind volumul populaţiei, n volumul
√
eşantionului
Se calculează aceeaşi indicatori ca şi în cazul sondajului simplu repetat, cu aceleaşi relaţii
corectate cu un coeficient k= 1 ; se obţin următorii parametri:
∆ = z ∆ ∆
=∆
∆ ∆
7
Aplicaţii
1.Estimarea intervalului de variaţie a mediei caracteristicii unui eşantion, atunci când se
cunoaşte media variabilei statistice pentru întreaga populaţie, şi abaterea medie
pătratică a populaţiei, , precum şi dimensiunea eşantionului se bazează pe teorema de
limită centrală. Se consideră că variabila are o caracteristică aproximativ normală.
a) Să se afle intervalul de încredere a mediei valorilor unui eşantion aleatoriu de volum
n=36, ştiind că:
= 117
= 14
Se doreşte o probabilitate P=0.6967;
0.6967 0.3483 ţă, 1.03 cf. Anexa2
Se ştie că ∆ ∆ , cu ∆ = 1.03 2.4
√
∆ ∆ 117 – 2.4 117 + 2.4
114.6 115 119.4 120, deci intervalul de încredere al mediei eşantionului va fi
I= (115, 120), cu o probabilitate de 0.6967
2.Se extrage aleator şi cu repetiţie, un eşantion de volum n=25 de elevi dintr-o şcoală
unde s-a aplicat un test de inteligenţă. Media QI a tuturor elevilor din şcoală este
=131, cu o abatere medie pătratică de 10. a) Care este probabilitatea ca eşantionul
extras să aibă o medie de 127 sau mai mică de atât? b) Calculaţi probabilitatea ca media
eşantionului să fie cuprinsă între 125 şi 138; c) Care e probabilitatea ca media
eşantionului să depăşească 129?
n=25; =131; =10
a) P( 127 =?; b) P 125 138 =?; c) P(129 )=?
a) eroarea medie de sondaj = =2 (abaterea pătratică a mediei de sondaj)
√
= =131
P( 127 = P( = P( 2) = P(z 2 = 1/2 – P(0 2 = 0.5 – 0.4772
= 0.0228 = 2,28% etc
8
3. Şeful unui hotel doreşte să estimeze durata medie a sejurului turiştilor cazaţi.
Selectează aleator nerepetat datele din registrul hotelului pentru un număr de 80 de turişti,
pentru care calculează durata medie a şederii de = 4,8 zile, cu o abatere medie pătratică
de =2.7 zile. Se lucrează cu o probabilitate de P = 0.95 (z=1.96). Să se afle intervalul de
încredere al duratei medii a sejurului petrecut în hotel.
= 4.8
s= 2.7
n = 80
.
0.30 zile (abaterea standard a mediei sau eroarea medie de
√ √
reprezentativitate sau de sondaj)
∆ = = 1.96·0.3 = 0.588; P( ∆ ∆ 0.95
P(4.8-0.588 4.8+0.588) = 0.95 P(4.212 5.38) = 0.95
9
c) Putem însă obţine estimări mai sigure şi mai precise, mărind volumul eşantionului, n.
Pentru ∆ = = 0.9408 = ct (eroarea limită admisă constantă, deci intervalul de
încredere constant), dacă mărim z (precizia), scade, adică = scade (pentru s
√
constant) deci n va creşte.
d) Să se dimensioneze eşantionul pentru z=2.5 şi ∆ = 0.9408 = ct
.
∆ = =6.25· 40.673; Corespunzător lui z=2.5,
√ ∆ .
precizia a crescut de la 0.95 la P=2·0.4938=0.9876 şi pentru aceasta, eşantionul a fost
mărit cu 41 – 25 = 16 indivizi.
6. Care este media în populaţie dacă media din eşantion este de 120 cu o abatere
standard de 20, pentru o probabilitate de 96%. Mărimea eşantionului de:
a. 90
b. 200
c. 500
P=0.96, P/2=0.48, z=0.1664 (cf. Anexa2).
Fie X caracteristica studiată; se cunosc = 120, s=20 dispersia modificată de
sondaj; P( )=0.96 P(120 0.1664 120
√ √ √
0.1644) = 0.96 P(120-0.35 120+0.35)=0.96, deci P(119.65 120.35)
√
= 0.96 etc
7. Într-o anchetă pe 1964 de subiecţi, întrebarea ”În medie câte ore petreceţi la
televizor?” a avut o medie de 2,8 ore şi o abatere standard de 0,5. Calculaţi un
interval de încredere de 96% pentru media orelor petrecute la televizor în populaţie.
10
8. O populaţie de bază este formată din 5 firme, fiecare cu o cifră de afaceri de 2, 3, 5, 7,
13 (sute de mii um). Considerând toate eşantioanele formate din n=2 firme, prin extragere
repetată, se cere:
a) media populaţiei de bază
b) abaterea medie pătratică a populaţiei originare
c) media distribuţiei mediei eşantioanelor de 2 firme din populaţie
d) abaterea medie pătratică a distribuţiei mediei eşantioanelor
e) să se rezolve aceleaşi subpuncte pentru o extragere nerepetată
a) = = =6
∑
b) = = 2 6 + 3 6 5 6 7 6 13 6 /5= 15.2
c) eşantioanele ce pot fi formate sunt în număr de 25: ( : 2,3,5,7,13
2,3,5,7,13 = (2,2) (2,3) (2,5) (2,7) (2,13)
(3,2) (3,3) (3,5) (3,7) (3,13)
(5,2) (5,3) (5,5) (5,7) (5,13)
(7,2) (7,3) (7,5) (7,7) (7,13)
(13,2) (13,3) (13,5) (13,7) (13,13)
∑
Media distribuţiei mediei eşantioanelor (sau media de sondaj), = = =6, ceea ce
arată că =
e) În cazul unei extrageri repetate, (a) şi (b) sunt identice, aşadar, =6, =15.2, deci
=3.9
(c) eşantioanele de n=2 firme care se pot forma prin extragere nerepetată din populaţia
!
originară de N=5 firme sunt în număr de = = =10:
! !
(2,3);(2,5);(2,7);(2,13);(3,5);(3,7);(3,13);(5,7);(5,13);(7,13); cu mediile eşantioanelor:
2.5, 3.5, 4.5, 7.5, 4.5, 8, 6, 9, 10
11
∑ ∑
Media de sondaj = = = = 6, deci se verifică faptul că =
Dispersia distribuţiei de sondaj (dispersia mediei eşantioanelor), [ 2.5 6
3,5 6 4.5 6 7.5 6 4 6 5 6 8 6 6 6
9 6 10 6 ]/10=(12.25+6.25+2.25+4+1+0+9+16)/10=5.7, = √5.7=2.387
.
Se verifică faptul că 5.7= 5.7 7.6 5.7 5.7
9. O firmă studiază produsele sale din punctul de vedere al unei variabile statistice
asimilate cu X. Pentru aceasta, efectuează un sondaj simplu aleator cu repetare:
a) ştiind dispersia întregii populaţii, =0.8 să se afle volumul eşantionului, n, pentru o
eroare limită maximă admisă, ∆ 0.15 şi o probabilitate de P=0.95=α. Cât este dispersia
distribuţiei de sondaj?
. .
z = 1.96 = 123; din ∆ = z σ σ = =0.076 (eroarea medie de
∆ . .
reprezentativitate)
b) se extrage un eşantion de volum n=100 şi se obţin valorile
x 1.2 1.8 2.4 2.6 3.5
n 15 20 35 20 10
Să se estimeze intervalul de încredere a mediei întregii populaţii cu o probabilitate de
0.95
∑ . . . . .
Media eşantionului, m = ∑ = = 2.25 x
Dispersia modificată de selecţie sau dispersia corectată a eşenationului, calculată numai
pe baza eşantionului extras:
s ∑ n x x = [15 1.2 2.25 20 1.8 2.25 35 2.4
2.25 20 2.6 2.25 10 3.5 2.25 ] = 0.4; s=√0.4= 0.632
.
Eroarea medie de reprezentativitate, σ = 0.063; eroarea limită maximă
√
admisă, ∆ = z σ = 1.96 0.063=0.12
P( ∆ ∆ 0.95 P(2.25-0.12 2.25 0.12 0.95
P(2.13 2.37)=0.95.
c) dacă estimarea variabilei s-a realizat astfel: P(2.2 2.5)=0.95, aflaţi volumul
eşantionului care a condus la acest rezultat (se consideră s=0.632);
. .
Dacă intervalul de încredere este I=(l= ∆ ,L= ∆ ), atunci ∆ = = =0.15
. .
n z = = 69
∆ .
d) se efectuează un sondaj limitat, de volum n=25, cu repetiţie. Să se estimeze valoarea
variabilei pentru următoarele date şi cu precizia de 97,5%.
1.2 1.5 2.3 2.6
5 6 9 5
12
Să calculăm dispersia modificată: s ∑ n x x = [5 1.2 1.94
6 1.5 1.94 9 2.3 1.94 5 2.6 1.94 = 2.738+1.1616+1.1664+2.178/24=
7.224/24 = 0.3 s=√0.3 = 0.547
.
Eroarea medie de reprezentativitate, σ = 0.1; eroarea limită maximă admisă,
√
∆ =z σ = 1.96 0.1=0.196
P( ∆ ∆ 0.95 P(1.948-0.196 1.948 0.196 0.95
P(1.752 2.144) = 0.95.
Obs. Deoarece volumul eşantionului e mic în acest caz, ar fi trebuit să calculăm eroarea
limită admisă, ∆ = t , σ , cu 1 α=0.95; în Anexa3, t , = t . , =2.06
∆ = 2.06·0.196=0.403, deci intervalul de încredere corespunzător lui P este P( ∆
∆ 0.95 P(1.948-0.403 1.948 0.403 0.95 P(1.545
2.351)=0.95.
(c) dacă estimarea variabilei s-a realizat astfel: P(2.2 2.5)=0.95, aflaţi volumul
eşantionului care a condus la acest rezultat (se consideră s=0.632);
. .
Dacă intervalul de încredere este I=(l= ∆ ,L= ∆ ), atunci ∆ = = =0.15
. .
n = . .
= 59
∆ .
(d) avem că n=25, =1.948, s 0.3 şi s=0.547.
Eroarea medie de reprezentativitate în cazul sondajului simplu nerepetat va fi
.
1 1 = 0.1094 0.9746=0.1066, cu eroarea limită maximă
√
admisă, ∆ = z σ = 1.96 0.1066=0.209; prin urmare, intervalul de încredere va fi
P( ∆ ∆ 0.95 P(1.948-0.209 1.948 0.209 0.95
P(1.739 2.157)=0.95.
13
10. Şase sute de firme au media cifrei de afaceri de 1.04, cu o abatere medie pătratică de
1. Care este probabilitatea ca un eşantion de100 de firme să aibă CA medie: a)cuprinsă
între 0.95 şi 1.10; b) mai mare decât 1.15. (se consideră o selecţie fără revenire)
14
12. Se efectuează un sondaj de opinie simplu repetat pe un eşantion de 5000 de indivizi,
reprezentând 5% din populaţia generală. Sondajul constă din întrebarea: „Consideraţi că
nivelul actual de trai va creşte în perioada imediat următoare?” Frecvenţa relativă a
răspunsurilor afirmative a fost de 40%. Se cere eroarea medie de reprezentativitate şi
eroarea maximă admisă, precum şi limitele între care se încadrează răspunsurile
afirmative din întreaga colectivitate, cu o probabilitate de 0.985. Să se răspundă la
aceleaşi cerinţe dacă sondajul este simplu nerepetat.
a) sondaj simplu repetat: n=5000= N=100000
w= =0.4 =0.4 m= 2000 răspunsuri afirmative în eşantion
. .
Eroarea medie de reprezentativitate a sondajului, = = 0.0069
Eroarea maximă admisă, ∆ = 2.43·0.0069=0.01676
Precizia estimării mediei întregii populaţii, P w ∆ ∆ =
P 0.4 0.01676 0.4 0.01676 = 0.985 P(0.38324 p 0.41676)=0.985;
înmulţind cu N, aflăm limitele răspunsurilor afirmative din întreaga populaţie:
P(0.38324·100000 0.41676 100000 = 0.985 P(38324 41676) = 0.985
b) sondaj simplu nerepetat: eroarea medie de reprezentativitate 1 =
15
13. Se efectuează un sondaj pe un eşantion de 45000 de cetăţeni ce reprezintă 10% din
populaţia unui oraş. Sondajul constă din întrebarea: „doriţi alegeri anticipate?”
Frecvenţa relativă a răspunsurilor afirmative a fost de 65%. Probabilitatea cu care se
garantează rezultatul: A)0.9949; B)0.999938
a) determinaţi volumul colectivităţii generale; b) determinaţi frecvenţa absolută a
răspunsurilor afirmative şi negative din eşantion; c) calculaţi media aritmetică şi dispersia
în cadrul eşantionului; d) calculaţi limitele intervalului de încredere pentru frecvenţa
absolută a răspunsurilor afirmative în colectivitatea generală, în cazutile A şi B şi
considerând sondajul: simplu repetat; nerepetat. e) aflaţi probabilitatea de a obţine aceeaşi
frecvenţă a răspunsurilor afirmative de exact 3 ori, dacă se efectuează sondaje în alte 10
oraşe.
14.Se efectuează un sondaj pe 50000 de cetăţeni care reprezintă 10% din populaţia unui
oraş. Sondajul constă din întrebarea: „românii trebuie să se implice în acţiunile NATO pe
glob?” Frecvenţa relativă a răspunsurilor afirmative în eşantion a fost de 70%. Se doreşte
garantarea rezultatului cu o eroare de 51‰ (=0.051), adică P=0.9949
a) determinaţi coeficientul de siguranţă, z, al sondajului; 0.9949:2=0.4972, cf. Anexa2,
z=2.77; b) determinaţi volumul colectivităţii generale; N=10·50000= 500000; c) calculaţi
media aritmetică şi dispersia în cadrul eşantionului; w= , media în eşantion, m - nr. de
răspunsuri afirmative din eşantion, n – volumul eşantionului; deci w=0.7;
dispersia în cadrul eşantionului, se consideră 1 = √0.7 0.3
= 0.4582; d) să se calculeze coeficientul de variaţie în cadrul eşantionului;
.
v= = = 0.6546= 65.46%; e) caracterizaţi media eşantionului: este eşantionul
.
omogen? Media este nereprezentativă. Colectivitatea nu este omogenă, ci eterogenă.
(Obs: dacă v 0.5, media este nereprezentativă; dacă v (0.35,0.5), media este
nereprezentativă în sens larg; dacă v (0.17,0.35), media este moderat reprezentativă;
dacă v (0,0.17), media este strict reprezentativă); f) precizaţi care este eroarea medie de
. .
sondaj; Eroarea medie de reprezentativitate a sondajului, = =
0.0020494; g) Care este eroarea maximă admisă? Eroarea maximă admisă, ∆
= 2.77·0.0020494=0.0056768
h) calculaţi limitele între care este cuprinsă frecvenţa absolută a răspunsurilor afirmative
în colectivitatea generală, ţinând cont de eroarea cerută;
în genere, w= = =p; în acest caz, P w ∆ ∆ = P 0.7
0.0056768 0.7 0.0056768 = 0.9949 P(0.694323 p 0.7056768)=0.9949;
înmulţim cu N şi aflăm limitele răspunsurilor afirmative din întreaga populaţie:
P(0.694323·500000 0.7056768 500000 = 0.9949 P(347161 352838)
= 0.9973
i) calculaţi probabilitatea de a obţine aceeaşi frecvenţă a răspunsurilor afirmative de exact
4 ori, dacă se efectuează sondaje în 10 judeţe; conform distribuţiei binomiale,
probabilitatea de a obţine 4 succese din 10 încercări este = 0.2508
(folosind funcţia BINOMDIST(4;10;0,4;FALSE) din Excel).
16
15. 100 de firme au cifra de afaceri între 0 şi 3, 300 de firme între 3 şi 6, 500 între 6 şi 9,
100 între 9 şi 12.
a) să se scrie sub formă de tabel distribuţia de frecvenţe; b) construiţi histograma şi
poligonul frecvenţelor; c) determinaţi frecvenţele cumulate ascedent; d) calculaţi M, ,
; e) calculaţi coeficientul de asimetrie Pearson (sau Fischer); f) calculaţi boltirea cu
momente; g) câte firme vor avea CA cuprinsă între 4 şi 10?; h) dacă probabilitatea ca o
firmă să dea faliment este de 0.0005 (5E-4), calculaţi:
-probabilitatea ca exact 5 firme să dea faliment;
-probabilitatea ca mai mult de 5 firme să dea faliment
, , , , , , ,
(0,3) 100 100 1.5 150 -4.8 23.04 2304 530.8416 53084.16
(3,6) 300 400 4.5 1350 -1.8 3.24 972 10.4976 3149.28
(6,9) 500 900 7.5 3750 1.2 1.44 720 2.0736 1036.8
(9,12) 100 1000 10.5 1050 4.2 17.64 1764 311.1696 31116.96
1000 6300 5760 88387.2
∑ ,
d) M= ∑
= 6300/1000=6.3
∑
= =500; = +d = 6+3 = 6.6
∆
= +d = 6+3· = 7; ∆ = 500-300=200; ∆ =500-100=400
∆ ∆
,
∑
= ∑
= 5.76 = 2.4
. . .
e) = = = 0.2917; = = = 0.375 (asimetrie la
. .
stânga);
∑ ,
∑ .
f) Calculăm boltirea cu formulele momentelor: ∑ ,
.
∑
17
16. S-a efectuat un sondaj privind opinia cetăţenilor cu privire la situaţia drumurilor şi a
iluminatului public.
17. Se cer limitele intervalului în care se încadrează vârsta medie a unei colectivităţi de
studenţi dintr-o facultate. Pentru aceasta se extrage simplu nerepetat un eşantion de 10%
din volumul colectivităţii generale de 1000 studenţi. Distribuţia pe grupe de vârstă a
studenţilor din eşantion e dată în tabel. Rezultatul trebuie garantat cu o probabilitate de
96%.
P=0.96; 0.96/2=0.48 cf. Anexa2, cea mai apropiată valoare este 0.4803 z=2.06
∑ ,
= = 21.9 ;s ∑ n x x = =4.23 s=2.057
∑
18
.
Eroarea medie de reprezentativitate, σ = = 0.2057
√
Eroarea limită maximă admisă, ∆ = z σ =2.06·0.2057=0.4237
Intervalul de încredere, I= ( ∆ , ∆ = (21.9-0.4237, 21.9+0.4237)= (21.4763,
22.3237); aşadar, cu o probabilitate de 0.96, vârsta medie a studenţilor se încadrează
între limitele intervalului I.
Câţi studenţi au mai mult de 24 de ani în întreaga populaţie? Dacă în eşantion, proporţia
celor care depăşesc 24 de ani este w= = =0.2, cu eroarea medie de reprezentativitate,
. .
= = 0.04 şi eroarea maximă limită admisă ∆ 2.06 =
2.06 0.04 = 0.0824, atunci în intervalul I=( w ∆ ∆ ),
adică în I=(1000 0.1176, 1000·0.2824) = (117, 283) se află numărul celor care depăşesc
24 de ani din întreaga populaţie, cu o probabilitate de 0.96.
19. În 1998 aproximativ 50% dintre români considerau că inflaţia este cea mai importantă
problemă a ţării. Dacă se aleg în mod aleator 1500 de români din totalul populaţiei, care
este şansa ca populaţia acestui eşantion să reflecte în mod adecvat proporţia întregii
populaţii, considerând un interval de 3‰ în jurul valorii medii a populaţiei?
19
20. Dintr-un lot de 3000 de piese se extrage aleator şi repetat un eşantion de 100 de piese,
pentru a-i măsura abaterea faţă de diametrul prevăzut de 8. Prelucrând datele din
eşantion, se obţine o abatere standard corectată de s = 1.5. Să se calculeze: eroarea medie
de reprezentativitate, eroarea maximă limită admisă; se cer aceleaşi date, dacă volumul
eşantionului se măreşte de 3 ori (eşantion repetat şi nerepetat).
N=3000; n=100; = 8; s= ∑ = 1.5
.
Eroarea medie de reprezentativitate (selecţie) = σ = = 0.15
√ √
σ =0.0866·0.97=0.08342 (nerepetat)
√
Obs. Eroarea medie scade odată cu mărirea elşantionului şi cu schimbarea procedurii de
selecţie.
21.a) Calculaţi volumul unui eşantion simplu aleator (cu repetiţie şi fără repetiţie) pentru
a estima nota de absolvire a unui număr N=232 de studenţi; se consideră eroarea limită
admisă ∆ = 0.2; 0.38; 0.54; 0.84; se dau σ =1.78 şi probabilitatea de 0.969; discuţie.
b) în aceleaşi condiţii, calculaţi volumele eşantioanelor (sondaje cu revenire şi fără
revenire) în cazul unei erori limită maximă admisă de 0.38, cu probabilităţile: 0.95;
0.975; 0.99.
c) stabiliţi o relaţie între volumele eşantioanelor pentru sondajul simplu aleator cu
repetiţie şi fără repetiţie, în condiţiile unei aceleiaşi erori maxime admise şi aceeaşi
încredere de garantare a rezultatelor.
d) stabiliţi relaţia dintre erorile maxim admise în cazul sondajului simplu aleator cu
repetiţie şi fără repetiţie.
20