Sunteți pe pagina 1din 20

Teoria elementară a sondajului

Sondajul constă în înregistrarea unor unităţi din populaţia originară, împreună cu


caracteristicile lor, cu scopul de a estima pe baza indicatorilor de sondaj, parametrii
populaţiei originare. Deoarece există relaţii matematice între parametrii eşantionului şi
cei ai populaţiei, datele obţinute în eşantion se extind la întreaga populaţie.
Teoria sondajului e importantă pentru că de cele mai multe ori e singura metodă de a
obţine date valabile despre o populaţie statistică.
După cum se ştie, prin populaţie statistică se înţelege orice mulţime de indivizi care au în
comun cel puţin o caracteristică. Noţiunea de caracteristică este vastă (având o
extensiune nelimitată dpdv logic), dar trebuie să fie stabilită de asemenea manieră, încât
să se evite includerea în populaţia respectivă a indivizilor care nu posedă caracteristica.
Prin eşantion se înţelege o submulţime a populaţiei de bază (sau originare) care să
întrunească condiţii de reprezentativitate.
Prin reprezentativitate se înţelege ca în eşantionul selectat să se regăsească aceleaşi
trăsături esenţiale ca în populaţia originară. Se admite ca suficient de reprezentativ
sondajul care nu conduce la erori faţă de colectivitatea de bază mai mari de 5%.
Deasemeni, eşantioanele prelevate trebuie să fie echivalente, adică să fie la fel de
reprezentative pentru populaţia din care sunt extrase.

Alcătuirea eşantionului
Pentru ca un eşantion să fie reprezentativ, trebuiesc îndeplinite condiţiile:
1) populaţia de bază să fie cât mai omogenă
2) unităţile care vor forma eşantionul să fie alese la întâmplare
3) eşantionul să fie suficient de mare pentru a fi reprezentativ
4) unităţile extrase să fie independente
Alegerea unităţilor ce vor forma eşantionul se poate face pe baza unei scheme
probabilistice (prin tragere la sorţi sau loterie, prin selecţie pe baza unui tabel cu numere
aleatoare, prin alcătuire mecanică) sau în mod dirijat.

Formarea eşantionului prin tragere la sorţi (procedeul loteriei)


Se poate realiza sub două forme:
1) cu restituirea unităţii extrase (selecţie întâmplătoare repetată, sau cu revenire, ilustrată
de schema probabilistică Bernoulli)
Caracteristici:
-Volumul colectivităţii de bază, N rămâne constant cât durează extragerea unităţilor
pentru formarea eşantionului.
-La fiecare extragere, orice unitate a colectivităţii are aceeaşi probabilitate de a fi
selecţionată (1/N)
-Aceeaşi unitate a colectivităţii poate fi selecţionată de mai multe ori, ceea ce scade
reprezentativitatea.
2) fără restituirea unităţii extrase (selecţie întâmplătoare nerepetată, sau fără revenire,
ilustrată de schema hipergeometrică)
Caracteristici:
-volumul colectivităţii de bază scade consecutiv cu câte o unitate, de la N la N-1, pe
măsură ce creşte numărul extragerilor pentru formarea eşantionului de volum n. La final,

1
volumul colectivităţii originare va fi de N-n. Scăderea continuă a volumului colectivităţii
de bază face ca unităţile care participă la extragerea următoare să aibă o probabilitate din
ce în ce mai mare de a fi incluse în eşantion.
-Aceeaşi unitate nu poate fi inclusă de mai multe ori în eşantion, ceea ce conduce la erori
de reprezentativitate mai mici decât selecţia întâmplătoare repetată.

Obs. Populaţia de bază poate fi infinită: dacă se aruncă o monedă de 100 de ori şi formăm
un eşantion din numărul de feţe A ale monedei, acest eşantion se formează dintr-o
populaţie infinită.
Dimpotrivă, dacă extragem succesiv 10 bile dintr-o urnă cu 100 de bile, se formează un
eşantion dintr-o populaţie finită.

Eşantionare aleatorie simplă


E un procedeu fundamental de eşantionare. În procesul de selecţie a elementelor
eşantionului, fiecare individ din populaţia originară are aceeaşi şansă de a fi inclus în
eşantion, iar selectarea fiecărui caz este independentă de celelalte. Se bazează pe folosirea
unor tabele de numere aleatoare (randomizate). Aceste tabele conţin numere de câte 5
cifre, de la 0 la 9. După ce se atribuie fiecărui caz din populaţie un număr unic de
identificare, se porneşte la întâmplare dintr-un loc al tabelului aleator, la dreapta sau la
stânga, în sus sau în jos, se citesc numerele, selectând din eşantion cazurile
corespunzătoare cu numerele din tabel.
Dacă vrem să alcătuim un eşantion de 50 de cazuri dintr-o populaţie de 1000 de indivizi,
procedăm astfel: numerotăm indivizii de la 0001, 0002, ..., 0100,... 0900, 1000; pentru a
forma eşantionul considerăm numai ultimele 4 cifre ale grupurilor din tabelul aleator,
ignorând numerele mai mari decât 1000. Alegem la întâmplare un rând şi o coloană de
unde pornim într-un anumit sens în tabel, până când alegem 50 de numere (ignorând sau
nu repetiţiile). Eşantionul va fi alcătuit din acei membri ai populaţiei care au aceleaşi
numere de identificare cu cele selectate aleator.

Distribuţii de selecţie (de eşantionare)


Scopul statisticilor inferenţiale este de a generaliza anumite caracteristici ale eşantionului
la întreaga populaţie din care a fost extras, prin trecerea de la distribuţia eşantionului
(caracterizată de formă, tendinţe centrale şi dispersie), cunoscută de cercetător la
distribuţia populaţiei de bază (originare) care este necunoscută. Inferenţa statistică
implică trei distribuţii asociate caracteristicii studiate. Trecerea de la distribuţia
eşantionului la distribuţia populaţiei se face pe baza distribuţiei de sondaj
(operaţiunea de formare a unui eşantion se numeşte sondaj), care este teoretică, cu
proprietăţi cunoscute. Sondajele cu cele mai mari şanse de a produce eşantioane
reprezentative sunt cele bazate pe proceduri de selecţie aleatoare.

Considerăm toate eşantioanele posibile de mărime n care pot fi extrase dintr-o populaţie
dată de N indivizi. În cazul unui sondaj cu repetare, numărul total de eşantioane posibile
este de ; într-un sondaj fără repetare, se pot alcătui eşantioane. Pentru fiecare
eşantion, putem calcula caracteristicile: media, abaterea medie pătratică mediana, modul,
corelaţia etc, care variază de la unul la altul. Astfel obţinem o distribuţie a parametrilor
eşantioanelor, sau o distribuţie de sondaj. Dacă de exemplu, parametrul utilizat este

2
media, se obţine o distribuţie a mediei eşantioanelor, pentru care calculăm media
colectivităţii de selecţie, , (făcând media mediilor eşantioanelor), abaterea medie
pătratică a mediilor, ; dacă parametrul e dispersia, se calculează media dispersiei,
abaterea medie pătratică a dispersiilor etc.
Plecând de la distribuţia eşantioanelor (cu media , abaterea pătratică a mediei , şi
mărimea lor, n), putem estima cu o anumită precizie, parametrii ce caracterizează
populaţia din care s-au extras. Această estimare se bazează în principiu pe deducerea
mediei populaţiei, şi a abaterii medii pătratice a populaţiei, , în funcţie de şi ,
depinzând şi de schema probabilistică folosită.

Teorema limitei centrale


Procedeul se bazează pe următoarea teorie: se dă o populaţie statistică din care s-au extras
mai multe eşantioane; se obţine distribuţia de sondaj: se măsoară mediile şi abaterile
medii pătratice corespunzătoare. Facem media mediilor şi abaterea medie pătratică a lor.
Se constată matematic faptul că media mediilor este egală cu cea a populaţiei originare
(de bază) şi că abaterea medie a mediilor eşantioanelor, va fi egală cu cea populaţiei
originare, împărţită la √ .
Acesta este conţinutul teoremei limită centrale: Dacă se alcătuiesc toate eşantioanele
posibile de dimensiune n dintr-o populaţie cu media aritmetică şi abaterea standard
atunci distribuţia de sondaj a mediilor aritmetice ale eşantioanelor are următoarele
propietăţi:
-media sa aritmetică este egală cu cea a populaţiei ;
- abaterea standard a mediilor aritmetice,   = (ce va fi asimilată erorii medii de

reprezentativitate)
- cu cât n este mai mare, cu atât forma distribuţiei de selecţie aproximează mai bine curba
normală, indiferent de forma distribuţiei populaţiei.
Teorema de limită centrală demonstrează că indiferent de forma distribuţiei unei
variabile, X, distribuţia de eşantionare a mediei sale, va fi o distribuţie aproximativ
normală, pentru n suficient de mare (n 30), cu media şi abaterea medie pătratică .
În cazul în care întreaga populaţie are o distribuţie normală, atunci şi distribuţia mediei
eşantioanelor va fi normală, chiar şi pentru valori ale lui n mai mici decît 30.

Or, în realitate, nu se prevalează mai multe eşantioane, ca să se calculeze media şi


abaterea medie pătratică, ci se extrage un singur eşantion, pornind de la care se
evaluează valoarea probabilă a mediei populaţiei din care s-a extras. S-a demonstrat
matematic faptul că dacă distribuţia măsurătorilor acestor parametri pe eşantion urmează
legea normală, media din eşantion va fi aproximativ egală cu cea a populaţiei din care s-a
extras, iar eroarea de eşantionare (sau eroarea medie de reprezentativitate),   , va fi
aproximată prin abaterea standard corectată a eşantionului, s, împărţită la √ .
Astfel, dacă pentru caracteristica studiată X, s-au obţinut în eşantionul de volum n,
valorile, , , … , , atunci:
 …
a) media populaţiei originare , se estimează prin ;
b) eroarea medie de reprezentativitate (sau eroarea medie de sondaj sau de
eşantionare) va fi unde abaterea medie pătratică a
√ √ √
caracteristicii X pentru întreaga populaţie; deoarece aceasta de obicei nu se

3
cunoaşte, se estimează prin s, (    numită dispersia modificată de selecţie sau
dispersia corectată a eşantionului), calculată numai pe baza eşantionului extras:
∑ ;
în loc de s, se poate folosi S, fiind dispersia de selecţie sau de eşantion
  ∑ ; relaţia dintre dispersia modificată de selecţie şi dispersia de
selecţie fiind ; S pentru o caracteristică nealternativă corespunde expresiei
1 , w= fiind media eşantionului (vezi mai jos)
c) eroarea limită maximă admisă, notată cu ∆ pentru o caracteristică nealternativă
şi cu ∆ pentru o caracteristică alternativă se folosesc în estimarea intervalului
de încredere pentru media populaţiei, depinzând şi de precizia impusă cercetării;
d) intervalul de încredere sau „exactitatea”, I= ∆ , ∆ ] , în care se află
cu o anumită probabilitate

Concluzie
Aveam de a face cu trei distribuţii asociate caracteristicii studiate (media aritmetică):
-distribuţia populaţiei ( , );
-distribuţia de sondaj ( , )
-distribuţia eşantionului (  , : media în eşantion şi abaterea standard modificată a
eşantionului)
Relaţiile dintre ele: = ;
√ √ √
Obs. Fie o populaţie statistică de variabilă X repartizată normal, cu parametrii şi .
Presupunem că dintr-un eşantion de volum n, extras aleator, s-a obţinut media de eşantion
= (egală cu media de sondaj şi a populaţiei originare) şi dispersia modificată
de sondaj . Fie pragul de semnificaţie (probabilitatea sau precizia cerută). Dacă
dispersia ar fi cunoscută, intervalul de încredere pentru media populaţiei este
; Dar dispersia în general nu este cunoscută; atunci
√ √
intervalul de încredere pentru media populaţiei se consideră
; reciproc, din aceleaşi relaţii se deduc intervalele de încredere
√ √
pentru în funcţie de .

Tipuri de sondaj
Există mai mlte tipuri de sondaj, după modul de organizare a colectivităţii generale şi
după procedeul de selecţie a unităţilor în eşantion:
A. Sondaje aleatoare (probabiliste):
- sondajul simplu repetat şi nerepetat;
- sondajul tipic (stratificat);
- sondajul de serii;
- sondajul în mai multe trepte;
- sondajul secvenţional.
B. Sondaje cu extracţie nealeatoare:
- sondajul dirijat;
- sondajul sistematic (sau mecanic).

4
Fiecare tip poate fi repetat şi nerepetat, pentru caracteristici alternative sau
nealternative.
Pentru toate tipurile de sondaje: se estimează media populaţiei originare; se calculează
trei indicatori:
1. eroarea medie de sondaj (sau eroare medie de reprezentativitate), notată
2. eroarea limită admisă, notată cu ∆ pentru caracteristici nealternative şi cu ∆ pentru
caracteristici alternative
3. volumul eşantionului, n (pentru caracteristici alternative şi nealternative);
Deasemeni, se stabileşte intervalul de încredere pentru , I.

A.Sondajul simplu şi repetat (sau cu populaţia originară infinită) (schema Bernoulli)


- Media populaţiei originare, , se estimează prin media eşantionului, = ;
Abaterea mediei populaţiei originare, , se estimează în funcţie de abaterea mediei
eşantioanelor sau Eroarea medie de sondaj, astfel:

; = √ ; sau sau cu s şi S date mai sus;
√ √ √ √
- Eroarea limită admisă, ∆ = unde z este argumentul
√ √ √
funcţiei Laplace, vezi Anexa 2 cu valorile sale în funcţie de probabilitatea cu care se
lucrează.
- Intervalul de încredere pentru media populaţiei va fi I= ∆ , ∆ ], adică
∆ ∆ cu probabilitatea P=  , deci P( ∆ ∆ unde
∆ = şi dacă se stabilieşte o anumită probabilitate, să zicem P = 0.95, atunci
0.95, se află α/2=0.475, şi corespunzător va fi . căruia îi corespunde în
Anexa2, valoarea 1.96. Se poate proceda şi invers, dându-se se caută în Anexa2
valoarea ariei de sub curba normală, α/2 şi înmulţindu-se cu 2, se găseşte probabilitatea
corespunzătoare, P = α.
Din expresiile de mai sus se poate estima
  = cu probabilitatea dorită
√ √ √
- Volumul eşantionului n se calculează mai jos, în funcţie de caracteristică: alternativă
sau nealternativă
În practica sondajului se folosesc eşantioane de volum mare (n 30, 45, 50 de unităţi),
sau de volum redus n 30, în funcţie de gradul de omogenitate al populaţiei, cu scopul de
a reduce volumul eşantioanelor, pentru economie.
În cazul eşantioanelor de volum mare, eroarea limită admisă se calculează folosind
distribuţia normală standard Laplace, (Anexa2), iar pentru cele de volum redus,
distribuţia Student (Anexa 3).
Un volum mare al eşantionului sporeşte precizia rezultatelor, conform legii numerelor
mari, dar volumul ales trebuie să fie optim.
Eşantionul trebuie să fie reprezentativ pentru întreaga populaţie, în ce priveşte
caracteristicile studiate. Un eşantion e reprezentativ pentru o caracteristică, altul pentru
două caracteristici; criteriul de alegere a caracteristicii ca reprezentativitate îl constituie
mărimea coeficientului de variaţie v= ; există o relaţie directă între coeficientul de
variaţie al caracteristicii şi volumul eşantionului:

5
dacă …. , atunci …. unde este coeficientul de
variaţie pentru caracteristica i;
- volumul eşantionului necesar pentru estimarea unui parametru al caracteristicii i;
k - numărul caracteristicilor pentru care dorim să găsim estimări, incluse în sondajul
respectiv.
Eşantionul dimensionat în funcţie de caracteristica cu cel mai mare coeficient de variaţie
(caracteristica cea mai puţin omogenă) oferă estimări cu precizie şi siguranţă pentru toate
celelalte caracteristici studiate.
Pentru eşantioanele de volum mare, ∆ =   , unde
√ ∆
este argumentul funcţiei Laplace corespunzător probabilităţii de (se citeşte din Anexa2).
Pentru eşantioanele de volum redus: ∆ = , ,
  , unde
√ ∆

, este argumentul distribuţiei Student cu n 1 grade de libertate, corespunzător


probabilităţii de 1 şi se citeşte din tabelele distribuţiei Student, Anexa 3.

Pentru o caracteristică nealternativă, sunt valabile formulele de mai sus.


Pentru o caracteristică alternativă (calitativă) la care se urmăreşte un răspuns de tipul
da sau nu (femeie sau bărbat, etc) sau 1 sau 0, prin convenţie:

Media caracteristicii alternative, = ∑ = = = = p; unde evenimentul
1 (cu probabilitatea p) şi 0 cu probabilitatea q=1 p;
aşadar, media caracteristicii binare a populaţiei este p, unde p= , M - nr. de
răspunsuri afirmative din colectivitatea generală, N – volumul colectivităţii generale;
w= , media în eşantion, m - nr. de răspunsuri afirmative din eşantion, n – volumul
eşantionului; w ;

Dispersia în populaţia totală (originară) = ∑
= = pq;

Dispersia în cadrul eşantionului, S = 1 se consideră ;



Eroarea medie de reprezentativitate (de sondaj), = ;
√ √ √

Eroarea maximă limită admisă, ∆   = ;


Intervalul de încredere obţinut în cazul sondajului simplu repetat cu caracteristică
alternativă va fi I = w ∆ , ∆ ,
Precizia estimării mediei întregii populaţii fiind P w ∆   ∆ = .
Volumul eşantionului se determină din ∆ = n=

deci pentru determinarea volumului eşantionului, este necesară mai întâi stabilirea
coeficientului de siguranţă z şi a erorii limită admisă, ∆ .
Rezultatele le putem trece într-un tabel.

6
B.Sondajul simplu şi nerepetat
Fie o selecţie întâmplătoare nerepetată (schema hipergeometrică); să presupunem că sunt
extrase nerepetat toate eşantioanele de mărime n dintr-o colectivitate originară de mărime
N, N n. Dacă notăm media distribuţiei eşantioanelor cu şi abaterea medie pătratică (a
mediilor de selecţie de la media întregii populaţii) cu  , iar parametrii întregii populaţii
(sau ai populaţiei originare) astfel: media colectivităţii originare cu şi abaterea medie
pătratică cu atunci:
 = ; = ·  ; = , N fiind volumul populaţiei, n volumul

eşantionului
Se calculează aceeaşi indicatori ca şi în cazul sondajului simplu repetat, cu aceleaşi relaţii
corectate cu un coeficient k= 1 ; se obţin următorii parametri:

Media Eroarea medie de Eroarea limită Volumul eşantionului


sondaj admisă
(reprezentativitate)
Caracteristică = ∆ =
nealternativă √ √
=
√ √ ∆


Caracteristică w= ∆ =

alternativă 1
p=
k 1

1
1

Intervalul de încredere pentru , la fel ca şi la sondajul simplu repetat,
I= ∆ , ∆ ], cu ∆ = 

Pentru a afla volumul eşantionului în cazul caracteristicii nealternative, din relaţia
∆ = ∆   ∆

∆ ; asemănător, pentru caracteristica alternativă, din


∆   = z ∆   ∆    

=∆  
∆ ∆

7
Aplicaţii
1.Estimarea intervalului de variaţie a mediei caracteristicii unui eşantion, atunci când se
cunoaşte media variabilei statistice pentru întreaga populaţie, şi abaterea medie
pătratică a populaţiei, , precum şi dimensiunea eşantionului se bazează pe teorema de
limită centrală. Se consideră că variabila are o caracteristică aproximativ normală.
a) Să se afle intervalul de încredere a mediei valorilor unui eşantion aleatoriu de volum
n=36, ştiind că:
= 117
= 14
Se doreşte o probabilitate P=0.6967;
  0.6967 0.3483     ţă, 1.03 cf. Anexa2
Se ştie că ∆ ∆ , cu ∆ =  1.03 2.4

∆ ∆ 117 – 2.4 117 + 2.4 
114.6 115 119.4 120, deci intervalul de încredere al mediei eşantionului va fi
I= (115, 120), cu o probabilitate de 0.6967

b) Invers, putem estima probabilitatea ca un eşantion aleatoriu de volum n=36, selectat


din populaţia de caracteristică aproximativ normală, să aibă media cuprinsă între 115 şi
120, ştiind că = 117, = 14, n = 36.
Avem = = 117; = = = 2.34; Valorile = 115 şi =120 reprezintă şi ele

medii aritmetice, limite ale intervalului dorit în care să se afle media aritmetică a
eşantionului. Se standardizează valorile, pentru a folosi anexele cu probabilităţi
precalculate. Standardizarea, practic translatează curba normală (simetrică faţă de
originea axelor).
Relaţia de standardizare: = = = = 0.8547; = = = =
. . . .
1.282; probabilitatea cerută va fi aria dintre = - 0.85 şi = 1.282; adică aria(0, z=0,85)
+ aria(0, z=1.28) = 0.3023 + 0.3997 = 0.70

2.Se extrage aleator şi cu repetiţie, un eşantion de volum n=25 de elevi dintr-o şcoală
unde s-a aplicat un test de inteligenţă. Media QI a tuturor elevilor din şcoală este
=131, cu o abatere medie pătratică de 10. a) Care este probabilitatea ca eşantionul
extras să aibă o medie de 127 sau mai mică de atât? b) Calculaţi probabilitatea ca media
eşantionului să fie cuprinsă între 125 şi 138; c) Care e probabilitatea ca media
eşantionului să depăşească 129?
n=25; =131; =10
a) P( 127 =?; b) P 125 138 =?; c) P(129 )=?
a) eroarea medie de sondaj = =2 (abaterea pătratică a mediei de sondaj)

= =131
P( 127 = P( = P( 2) = P(z 2 = 1/2 – P(0 2 = 0.5 – 0.4772
= 0.0228 = 2,28% etc

8
3. Şeful unui hotel doreşte să estimeze durata medie a sejurului turiştilor cazaţi.
Selectează aleator nerepetat datele din registrul hotelului pentru un număr de 80 de turişti,
pentru care calculează durata medie a şederii de = 4,8 zile, cu o abatere medie pătratică
de =2.7 zile. Se lucrează cu o probabilitate de P = 0.95 (z=1.96). Să se afle intervalul de
încredere al duratei medii a sejurului petrecut în hotel.
= 4.8
s= 2.7
n = 80
.
0.30 zile (abaterea standard a mediei sau eroarea medie de
√ √
reprezentativitate sau de sondaj)
∆ = = 1.96·0.3 = 0.588; P( ∆ ∆ 0.95 
P(4.8-0.588 4.8+0.588) = 0.95 P(4.212 5.38) = 0.95

4. Un studiu doreşte să estimeze nivelul de inteligenţă al elevilor unei şcoli. Pentru


aceasta, se extrage aleator un eşantion de 25 de elevi cărora li se aplică un test de
inteligenţă. Se obţine o valoare medie de 132 cu o abatere medie pătratică de 2.4.
a) Care este valoarea medie a QI pentru întreaga populaţie a şcolii? (se presupune că
avem un sondaj simplu repetat). Se urmăreşte o precizie minimă de 95%.
b) Să se afle parametrii sondajului.

a) Altfel spus, se cere intervalul de încredere al mediei populaţiei originare.


Pentru a-l afla, nu e nevoie să cunoaştem N, volumul populaţiei.
Mai întâi, deoarece precizia P=0.95, aria pozitivă a curbei normale va fi 0.95:2=0.475,
corespunzător căreia, în Anexa2 aflăm z=1.96
Desigur, se poate aproxima cu ...
n=25
= 132
s = 2.4 (

Să aflăm intevalul de încredere al lui . Abaterea medie pătratică a populaţiei, ,


necunoscută, se asimilează cu s, abaterea modificată de selecţie.
.
Deci eroarea medie de reprezentativitate, = = = 0.48

Eroarea limită admisă, ∆ = = 1.96·0.48=0.9408
P( ∆ ∆ 0.95 P(132-0.9408 132 0.9408 0.95
P(131 133)=0.95. Cu o precizie de 0.95, intervalul de încredere I= 131,133
Volumul eşantionului e cunoscut din ipoteză.
Obs.
a) n fiind mic (n 30), ar fi trebuit să se folosească distribuţia Student
b) Se poate mări precizia de estimare, dar intervalul de încredere va creşte, deci mărind
precizia va scade din exactitate (păstrând n, volumul eşantionului constant). Să zicem că
dorim o precizie de 99%. aria pozitivă a curbei normale va fi 0.99:2=0.495,
corespunzător căreia, în Anexa2 aflăm z=2.58. Eroarea limită admisă, ∆ = =
2.58·0.48=1.2384; P( ∆ ∆ 0.99 P(132 1.2384 132
1.2384 0.99 P(131 133)=0.99. Cu o precizie de 0.99, intervalul de
încredere I= 130,133 , deci exactitatea scade uşor.

9
c) Putem însă obţine estimări mai sigure şi mai precise, mărind volumul eşantionului, n.
Pentru ∆ = = 0.9408 = ct (eroarea limită admisă constantă, deci intervalul de
încredere constant), dacă mărim z (precizia), scade, adică = scade (pentru s

constant) deci n va creşte.
d) Să se dimensioneze eşantionul pentru z=2.5 şi ∆ = 0.9408 = ct
.
∆ =   =6.25· 40.673; Corespunzător lui z=2.5,
√ ∆ .
precizia a crescut de la 0.95 la P=2·0.4938=0.9876 şi pentru aceasta, eşantionul a fost
mărit cu 41 – 25 = 16 indivizi.

5. O populaţie de studenţi dintr-un campus are o greutate medie de 69 kg ( ) şi şi o


abatere standard de = 3.22 kg. Dacă se alege un eşantion repetat de n = 10 studenţi,
care este şansa ca media eşantionului ( ) să se plaseze în intervalul de 2 kg faţă de
media întregii populaţii?
= 69
= 3.22
n = 10
= = 69
Avem de calculat P( ∆ ∆ ); adică P(69-2 69+2); trecem la
.
variabila standardizată z; = = 1.01
√ √
= = = 1.98; = = = 1.98; P(-1.98 1.98)= 2P(0 1.98) =
. . . .
2·0.4761= 0.9522;
.
Eroarea medie de reprezentativitate este = = 1.01;
√ √
Eroarea limită admisă, ∆ =

6. Care este media în populaţie dacă media din eşantion este de 120 cu o abatere
standard de 20, pentru o probabilitate de 96%. Mărimea eşantionului de:
a. 90
b. 200
c. 500
P=0.96, P/2=0.48, z=0.1664 (cf. Anexa2).
Fie X caracteristica studiată; se cunosc = 120, s=20 dispersia modificată de
sondaj; P( )=0.96 P(120 0.1664 120
√ √ √
0.1644) = 0.96 P(120-0.35 120+0.35)=0.96, deci P(119.65 120.35)

= 0.96 etc

7. Într-o anchetă pe 1964 de subiecţi, întrebarea ”În medie câte ore petreceţi la
televizor?” a avut o medie de 2,8 ore şi o abatere standard de 0,5. Calculaţi un
interval de încredere de 96% pentru media orelor petrecute la televizor în populaţie.

10
8. O populaţie de bază este formată din 5 firme, fiecare cu o cifră de afaceri de 2, 3, 5, 7,
13 (sute de mii um). Considerând toate eşantioanele formate din n=2 firme, prin extragere
repetată, se cere:
a) media populaţiei de bază
b) abaterea medie pătratică a populaţiei originare
c) media distribuţiei mediei eşantioanelor de 2 firme din populaţie
d) abaterea medie pătratică a distribuţiei mediei eşantioanelor
e) să se rezolve aceleaşi subpuncte pentru o extragere nerepetată

a) = = =6

b) = = 2 6 + 3 6 5 6 7 6 13 6 /5= 15.2
c) eşantioanele ce pot fi formate sunt în număr de 25: ( : 2,3,5,7,13
2,3,5,7,13 = (2,2) (2,3) (2,5) (2,7) (2,13)
(3,2) (3,3) (3,5) (3,7) (3,13)
(5,2) (5,3) (5,5) (5,7) (5,13)
(7,2) (7,3) (7,5) (7,7) (7,13)
(13,2) (13,3) (13,5) (13,7) (13,13)

Calculăm media fiecărui eşantion, :


2 2.5 3.5 4.5 7.5
2.5 3 4 5 8
3.5 4 5 6 9
4.5 5 6 7 10
7.5 8 9 10 13


Media distribuţiei mediei eşantioanelor (sau media de sondaj), = = =6, ceea ce
arată că =

d)Dispersia distribuţiei mediei eşantioanelor (sau dispersia distribuţiei de sondaj)


[ 2 6 2.5 6 3,5 6 4.5 6 7.5 6 2.5 6
3 6 4 6 5 6 8 6 3.5 6 4 6 5 6
6 6 9 6 4.5 6 5 6 6 6 7 6 10 6
7.5 6 8 6 9 6 10 6 13 6 /25]= = 7.6;
.
Se observă că = ; ceea ce confirmă rezultatele teoretice ale teoremei limită
centrală. Deci = √7.6= 2.756

e) În cazul unei extrageri repetate, (a) şi (b) sunt identice, aşadar, =6, =15.2, deci
=3.9
(c) eşantioanele de n=2 firme care se pot forma prin extragere nerepetată din populaţia
!
originară de N=5 firme sunt în număr de = = =10:
! !
(2,3);(2,5);(2,7);(2,13);(3,5);(3,7);(3,13);(5,7);(5,13);(7,13); cu mediile eşantioanelor:
2.5, 3.5, 4.5, 7.5, 4.5, 8, 6, 9, 10

11
∑ ∑
Media de sondaj = = = = 6, deci se verifică faptul că = 
Dispersia distribuţiei de sondaj (dispersia mediei eşantioanelor), [ 2.5 6
3,5 6 4.5 6 7.5 6 4 6 5 6 8 6 6 6
9 6 10 6 ]/10=(12.25+6.25+2.25+4+1+0+9+16)/10=5.7, = √5.7=2.387
.
Se verifică faptul că   5.7= 5.7 7.6 5.7 5.7

9. O firmă studiază produsele sale din punctul de vedere al unei variabile statistice
asimilate cu X. Pentru aceasta, efectuează un sondaj simplu aleator cu repetare:
a) ştiind dispersia întregii populaţii, =0.8 să se afle volumul eşantionului, n, pentru o
eroare limită maximă admisă, ∆ 0.15 şi o probabilitate de P=0.95=α. Cât este dispersia
distribuţiei de sondaj?
. .
z   = 1.96 = 123; din ∆ = z σ σ = =0.076 (eroarea medie de
∆ . .
reprezentativitate)
b) se extrage un eşantion de volum n=100 şi se obţin valorile
x 1.2 1.8 2.4 2.6 3.5
n 15 20 35 20 10
Să se estimeze intervalul de încredere a mediei întregii populaţii cu o probabilitate de
0.95
∑ . . . . .
Media eşantionului, m = ∑ = = 2.25 x
Dispersia modificată de selecţie sau dispersia corectată a eşenationului, calculată numai
pe baza eşantionului extras:
s ∑ n x x = [15 1.2 2.25 20 1.8 2.25 35 2.4
2.25 20 2.6 2.25 10 3.5 2.25 ] = 0.4; s=√0.4= 0.632
.
Eroarea medie de reprezentativitate, σ = 0.063; eroarea limită maximă

admisă, ∆ = z σ = 1.96 0.063=0.12
P( ∆ ∆ 0.95 P(2.25-0.12 2.25 0.12 0.95
P(2.13 2.37)=0.95.

c) dacă estimarea variabilei s-a realizat astfel: P(2.2 2.5)=0.95, aflaţi volumul
eşantionului care a condus la acest rezultat (se consideră s=0.632);
. .
Dacă intervalul de încredere este I=(l= ∆ ,L= ∆ ), atunci ∆ = = =0.15
. .
n z   = = 69
∆ .
d) se efectuează un sondaj limitat, de volum n=25, cu repetiţie. Să se estimeze valoarea
variabilei pentru următoarele date şi cu precizia de 97,5%.
1.2 1.5 2.3 2.6
5 6 9 5

În funcţie de rezultatele din eşantion, vom estima şi


∑ . . . . .
= ∑
= =1.948

12
Să calculăm dispersia modificată: s ∑ n x x = [5 1.2 1.94
6 1.5 1.94 9 2.3 1.94 5 2.6 1.94 = 2.738+1.1616+1.1664+2.178/24=
7.224/24 = 0.3 s=√0.3 = 0.547
.
Eroarea medie de reprezentativitate, σ = 0.1; eroarea limită maximă admisă,

∆ =z σ = 1.96 0.1=0.196
P( ∆ ∆ 0.95 P(1.948-0.196 1.948 0.196 0.95
P(1.752 2.144) = 0.95.
Obs. Deoarece volumul eşantionului e mic în acest caz, ar fi trebuit să calculăm eroarea
limită admisă, ∆ = t , σ , cu 1 α=0.95; în Anexa3, t , = t . , =2.06
∆ = 2.06·0.196=0.403, deci intervalul de încredere corespunzător lui P este P( ∆
∆ 0.95 P(1.948-0.403 1.948 0.403 0.95 P(1.545
2.351)=0.95.

e) aceeaşi problemă, în cazul unui sondaj fără repetiţie


(a) se ţine cont că întreaga populaţie este de N=500
. .
= . .
= 85.81
∆ .
∑ . . . . .
(b) Media eşantionului, m = ∑
= = 2.25 x
Dispersia modificată de selecţie sau dispersia corectată a eşenationului, calculată numai
pe baza eşantionului extras:
s ∑ n x x = [15 1.2 2.25 20 1.8 2.25 35 2.4
2.25 20 2.6 2.25 10 3.5 2.25 ] = 0.4; s=√0.4= 0.632
.
Eroarea medie de reprezentativitate, σ 1 0.895= 0.056; eroarea limită

maximă admisă, ∆ = z σ = 1.96 0.056=0.11
P( ∆ ∆ 0.95 P(2.25 0.11 2.25 0.11 0.95
P(2.14 2.36)=0.95.

(c) dacă estimarea variabilei s-a realizat astfel: P(2.2 2.5)=0.95, aflaţi volumul
eşantionului care a condus la acest rezultat (se consideră s=0.632);
. .
Dacă intervalul de încredere este I=(l= ∆ ,L= ∆ ), atunci ∆ = = =0.15
. .
n = . .
= 59
∆ .
(d) avem că n=25, =1.948, s 0.3 şi s=0.547.
Eroarea medie de reprezentativitate în cazul sondajului simplu nerepetat va fi
.
  1 1 = 0.1094 0.9746=0.1066, cu eroarea limită maximă

admisă, ∆ = z σ = 1.96 0.1066=0.209; prin urmare, intervalul de încredere va fi
P( ∆ ∆ 0.95 P(1.948-0.209 1.948 0.209 0.95
P(1.739 2.157)=0.95.

13
10. Şase sute de firme au media cifrei de afaceri de 1.04, cu o abatere medie pătratică de
1. Care este probabilitatea ca un eşantion de100 de firme să aibă CA medie: a)cuprinsă
între 0.95 şi 1.10; b) mai mare decât 1.15. (se consideră o selecţie fără revenire)

N=600, = 1.04, = 1, n=100


a)P(0.95 X 1.10)=?   1 √0.84 0.091;  în  unităţi  standard, 

. . . .
P( Z )=?
. .
P( 1 Z 0.67) = P(0 1 P(0 0.67 = 0.3413+0.2486=0.5899
. .
b) P(X 1.15) P(z = 1.2) = P(z 0) – P(0 1.2 = 0.5 – 0.3849= 0.1151
.

11. Se efectuează un sondaj de opinie simplu pe un eşantion de 1000 de oameni de


afaceri (eşantion reprezentând 4% din populaţia totală). Sondajul a constat din întrebarea:
„Consideraţi că actualul sistem legislativ favorizează investitorul străin faţă de cel
român?”. Frecvenţa relativă a răspunsurilor afirmative a fost de 57%. Se lucrează cu o
probabilitate P=0.9973. Se cere:
a) eroarea medie de sondaj şi eroarea limită admisă, dacă sondajul este repetat; între ce
limite se încadrează frecvenţa răspunsurilor afirmative din întreaga populaţie?
b) aceleaşi cerinţe pentru sondaj nerepetat.
P/2= 0.4986 z=2.99
n=1000 = N=25000
  ă       ş   ă       ă  ţ
w= = = (p =  = )=
  ş   ţ
0.57
. .
Eroarea medie de sondaj, = = = 0.0156

Eroarea maximă limită admisă, ∆   = = 2.99·0.0156=0.04664


Precizia estimării mediei întregii populaţii, P w ∆   ∆ = P 0.57
0.04664  0.57 0.04664 = 0.9973 P(0.523 p 0.616)=0.9973; ţinând cont
de prima relaţie, înmulţim cu N şi aflăm limitele răspunsurilor afirmative din întreaga
populaţie: P(0.523·25000 0.616 25000 = 0.9973 P(13075 15400) =
0.9973
b) dacă sondajul este nerepetat: eroarea medie de sondaj, 1 =
0.0156·√0.96= 0.0156·0.98 = 0.015284; eroarea maximă limită admisă, ∆   =
2.99·0.015284·0.98=0.044785; P 0.57 0.044785  0.57 0.044785 = 0.9973
P(0.5252148 p 0.614785)=0.9973; I=(0.5252148·25000 M 0.614785·25000)
între 13130 şi 15370 indivizi vor răspunde „da” din întreaga populaţie, cu o
probabilitate de 0.9973

14
12. Se efectuează un sondaj de opinie simplu repetat pe un eşantion de 5000 de indivizi,
reprezentând 5% din populaţia generală. Sondajul constă din întrebarea: „Consideraţi că
nivelul actual de trai va creşte în perioada imediat următoare?” Frecvenţa relativă a
răspunsurilor afirmative a fost de 40%. Se cere eroarea medie de reprezentativitate şi
eroarea maximă admisă, precum şi limitele între care se încadrează răspunsurile
afirmative din întreaga colectivitate, cu o probabilitate de 0.985. Să se răspundă la
aceleaşi cerinţe dacă sondajul este simplu nerepetat.
a) sondaj simplu repetat: n=5000= N=100000
w= =0.4 =0.4 m= 2000 răspunsuri afirmative în eşantion
. .
Eroarea medie de reprezentativitate a sondajului, = = 0.0069
Eroarea maximă admisă, ∆   = 2.43·0.0069=0.01676
Precizia estimării mediei întregii populaţii, P w ∆   ∆ =
P 0.4 0.01676  0.4 0.01676 = 0.985 P(0.38324 p 0.41676)=0.985;
înmulţind cu N, aflăm limitele răspunsurilor afirmative din întreaga populaţie:
P(0.38324·100000 0.41676 100000 = 0.985 P(38324 41676) = 0.985
b) sondaj simplu nerepetat: eroarea medie de reprezentativitate 1 =

0.0069 1 = 0.069·0.895 = 0.006171; eroarea maximă limită admisă ∆  


= 2.43·0.006171·0.895=0.013421; precizia estimării mediei întregii populaţii,
Pw ∆   ∆ = P 0.4 0.01342  0.4 0.01342 =
0.985 P(0.38658 p 0.41342)=0.985; înmulţim cu N şi aflăm limitele răspunsurilor
afirmative din întreaga populaţie: P(0.38658·100000 0.41342 100000 = 0.985
P(38658 41342) = 0.985
Obs. Putem rezolva acest tip de problemă şi în limbajul capitolului trecut (cu „trecere de
la parte la întreg şi invers”). Astfel, din 5000 de cetăţeni, 2000 răspund „da” la un sondaj
de opinie. Să se determine cu o probabilitate de 0.985 un interval în care se încadrează
numărul celor care răspund „da” din întreaga populaţie de 100000 de cetăţeni.
n= 5000; =w= = 0.4; ştim din eşantion şi vrem să aflăm p din întreaga populaţie:
      .   .
P[p  ( – t , + t )] = P[p  (0.4 – 2.43 , 0.4+ 2.43
. .    
)]= 0.985 P[p  (0.4 – 2.43 0.0069, 0.4+ 2.43·0.0069)]=0.985
 P(0.38324 p 0.41676)=0.985; înmulţind cu N, aflăm limitele răspunsurilor afirmative
din întreaga populaţie: P(0.38324·100000 0.41676 100000 = 0.985
P(38324 41676) = 0.985

15
13. Se efectuează un sondaj pe un eşantion de 45000 de cetăţeni ce reprezintă 10% din
populaţia unui oraş. Sondajul constă din întrebarea: „doriţi alegeri anticipate?”
Frecvenţa relativă a răspunsurilor afirmative a fost de 65%. Probabilitatea cu care se
garantează rezultatul: A)0.9949; B)0.999938
a) determinaţi volumul colectivităţii generale; b) determinaţi frecvenţa absolută a
răspunsurilor afirmative şi negative din eşantion; c) calculaţi media aritmetică şi dispersia
în cadrul eşantionului; d) calculaţi limitele intervalului de încredere pentru frecvenţa
absolută a răspunsurilor afirmative în colectivitatea generală, în cazutile A şi B şi
considerând sondajul: simplu repetat; nerepetat. e) aflaţi probabilitatea de a obţine aceeaşi
frecvenţă a răspunsurilor afirmative de exact 3 ori, dacă se efectuează sondaje în alte 10
oraşe.

14.Se efectuează un sondaj pe 50000 de cetăţeni care reprezintă 10% din populaţia unui
oraş. Sondajul constă din întrebarea: „românii trebuie să se implice în acţiunile NATO pe
glob?” Frecvenţa relativă a răspunsurilor afirmative în eşantion a fost de 70%. Se doreşte
garantarea rezultatului cu o eroare de 51‰ (=0.051), adică P=0.9949
a) determinaţi coeficientul de siguranţă, z, al sondajului; 0.9949:2=0.4972, cf. Anexa2,
z=2.77; b) determinaţi volumul colectivităţii generale; N=10·50000= 500000; c) calculaţi
media aritmetică şi dispersia în cadrul eşantionului; w= , media în eşantion, m - nr. de
răspunsuri afirmative din eşantion, n – volumul eşantionului; deci w=0.7;
dispersia în cadrul eşantionului, se consideră 1 = √0.7 0.3
= 0.4582; d) să se calculeze coeficientul de variaţie în cadrul eşantionului;
.
v= = = 0.6546= 65.46%; e) caracterizaţi media eşantionului: este eşantionul
.
omogen? Media este nereprezentativă. Colectivitatea nu este omogenă, ci eterogenă.
(Obs: dacă v 0.5, media este nereprezentativă; dacă v (0.35,0.5), media este
nereprezentativă în sens larg; dacă v (0.17,0.35), media este moderat reprezentativă;
dacă v (0,0.17), media este strict reprezentativă); f) precizaţi care este eroarea medie de
. .
sondaj; Eroarea medie de reprezentativitate a sondajului, = =
0.0020494; g) Care este eroarea maximă admisă? Eroarea maximă admisă, ∆  
= 2.77·0.0020494=0.0056768
h) calculaţi limitele între care este cuprinsă frecvenţa absolută a răspunsurilor afirmative
în colectivitatea generală, ţinând cont de eroarea cerută;
în genere, w= = =p; în acest caz, P w ∆   ∆ = P 0.7
0.0056768  0.7 0.0056768 = 0.9949 P(0.694323 p 0.7056768)=0.9949;
înmulţim cu N şi aflăm limitele răspunsurilor afirmative din întreaga populaţie:
P(0.694323·500000 0.7056768 500000 = 0.9949 P(347161 352838)
= 0.9973
i) calculaţi probabilitatea de a obţine aceeaşi frecvenţă a răspunsurilor afirmative de exact
4 ori, dacă se efectuează sondaje în 10 judeţe; conform distribuţiei binomiale,
probabilitatea de a obţine 4 succese din 10 încercări este = 0.2508
(folosind funcţia BINOMDIST(4;10;0,4;FALSE) din Excel).

16
15. 100 de firme au cifra de afaceri între 0 şi 3, 300 de firme între 3 şi 6, 500 între 6 şi 9,
100 între 9 şi 12.
a) să se scrie sub formă de tabel distribuţia de frecvenţe; b) construiţi histograma şi
poligonul frecvenţelor; c) determinaţi frecvenţele cumulate ascedent; d) calculaţi M, ,
; e) calculaţi coeficientul de asimetrie Pearson (sau Fischer); f) calculaţi boltirea cu
momente; g) câte firme vor avea CA cuprinsă între 4 şi 10?; h) dacă probabilitatea ca o
firmă să dea faliment este de 0.0005 (5E-4), calculaţi:
-probabilitatea ca exact 5 firme să dea faliment;
-probabilitatea ca mai mult de 5 firme să dea faliment
, , , , , , ,

(0,3) 100 100 1.5 150 -4.8 23.04 2304 530.8416 53084.16
(3,6) 300 400 4.5 1350 -1.8 3.24 972 10.4976 3149.28
(6,9) 500 900 7.5 3750 1.2 1.44 720 2.0736 1036.8
(9,12) 100 1000 10.5 1050 4.2 17.64 1764 311.1696 31116.96
1000 6300 5760 88387.2

∑ ,
d) M= ∑
= 6300/1000=6.3

= =500; = +d = 6+3 = 6.6

= +d = 6+3· = 7; ∆ = 500-300=200; ∆ =500-100=400
∆ ∆
,

= ∑
= 5.76 = 2.4
. . .
e) = = = 0.2917; = = = 0.375 (asimetrie la
. .
stânga);
∑ ,

∑ .
f) Calculăm boltirea cu formulele momentelor: ∑ ,
.

 2.664 3, deci distribuţia este platicurtică


. .
g) 4 10 -0.9584 z 1.5417 P= 0.3313+0.4383=0.7696
. .
Aşadar, din 1000 de firme, 769 vor avea cifra de afaceri cuprinsă între 4 şi 10.
h) folosim distribuţia Poisson: P(ca x firme să dea faliment)= unde λ=np
!
. .
=1000·0.0005=0.5 P(5 firme să dea faliment)=  = 0.00015;
!
P(ca mai mult de 5 firme să dea faliment)= 1 – P(0 firme să dea falimentV1firme să dea
falimentV...2...3...4 firme să dea faliment) = 1 – P(x 5 firme să dea faliment) = 1 –
0.999958 = 0.000042
x = 4, =0.001579507; x=3, =0.0126360;x=2, =0.0758163;x=1, =0.303265;x=0,
=0.60653; Probabilitatea ca mai mult de 2 firme să dea faliment, P(X 2) = 1 – P(X 2)
= 1 – 0,9856123 = 0.14387

17
16. S-a efectuat un sondaj privind opinia cetăţenilor cu privire la situaţia drumurilor şi a
iluminatului public.

Cum apreciați?  Bună  necorespunzătoare Nu ştiu  Total% 


Starea  22  77  1  100 
drumurilor 
Starea  70  28  2  100 
iluminatului 
public 
 
a) estimaţi proporţia celor care consideră starea drumurilorca fiind slabă, printr-un
interval de încredere corespunzător unei precizii de 95%, în cazul sondajului cu repetiţie;
b) estimaţi proporţia celor care consideră iluminatul public ca fiind bun, printr-un interval
de încredere corespunzător unei precizii de 95%, în cazul sondajului cu repetiţie.
(volumul eşantionului n=2060)
a) media celor care consideră starea drumurilor necorespunzătoare, w= = = 0.77
. .
eroarea medie de reprezentativitate, = = 0.009
eroarea limită admisă, ∆  1.96 = 0.018
intervalul de încredere, I= [ ,  ]= [w ∆ , ∆ ] = [0.75,0.79], aşadar numărul
celor care consideră nesatisfăcătoare calitatea drumurilor, este cuprins în intervalul
[1545,1627] cu o probabilitate de 0.95.
b) estimatorul proporţiei celor care consideră bun iluminatul public este w= = =0.7
. .
eroarea medie de reprezentativitate, = = 0.01
eroarea limită admisă, ∆ 1.96 = 0.019
intervalul de încredere, I= [ ,  ]= [w ∆ , ∆ ] = [0.681,0.719], aşadar numărul
celor care consideră satisfăcătoare calitatea iluminatului public este cuprins în intervalul
[1403,1481] cu o probabilitate de 0.95.

17. Se cer limitele intervalului în care se încadrează vârsta medie a unei colectivităţi de
studenţi dintr-o facultate. Pentru aceasta se extrage simplu nerepetat un eşantion de 10%
din volumul colectivităţii generale de 1000 studenţi. Distribuţia pe grupe de vârstă a
studenţilor din eşantion e dată în tabel. Rezultatul trebuie garantat cu o probabilitate de
96%.
P=0.96; 0.96/2=0.48 cf. Anexa2, cea mai apropiată valoare este 0.4803 z=2.06

20 20 19 380 -2.9 8.41 168.2


20-22 35 21 735 -0.9 0.81 28.35
22-24 25 23 575 1.1 1.21 30.25
24 20 25 500 3.1 9.61 192.2
100 2190 419

∑ ,
= = 21.9 ;s ∑ n x x = =4.23 s=2.057

18
.
Eroarea medie de reprezentativitate, σ = = 0.2057

Eroarea limită maximă admisă, ∆ = z σ =2.06·0.2057=0.4237
Intervalul de încredere, I= ( ∆ , ∆ = (21.9-0.4237, 21.9+0.4237)= (21.4763,
22.3237); aşadar, cu o probabilitate de 0.96, vârsta medie a studenţilor se încadrează
între limitele intervalului I.

Câţi studenţi au mai mult de 24 de ani în întreaga populaţie? Dacă în eşantion, proporţia
celor care depăşesc 24 de ani este w= = =0.2, cu eroarea medie de reprezentativitate,
. .
= = 0.04 şi eroarea maximă limită admisă ∆ 2.06 =
2.06 0.04 = 0.0824, atunci în intervalul I=( w ∆   ∆ ),
adică în I=(1000 0.1176, 1000·0.2824) = (117, 283) se află numărul celor care depăşesc
24 de ani din întreaga populaţie, cu o probabilitate de 0.96.

Obs. Considerând aceleaşi date şi eşantionul nerepetat, ultima chestiune se rezolvă cu


schema hipergeometrică, trecere de la parte la întreg:
     
P[p  ( –t , +t )]= 0.96, deci t=2.06, n=100, N=1000,
= 0.2,
.   . .   .  
P[p  (0.2– 2.06 , 0.2+ 2.06 )]= 0.96
P[p  (0.2–2.06·0.038, 0.2+2.06·0.038)]= 0.96 P[p  (0.121789,0.27828)]= 0.96
M (121, 279), numărul studenţilor mai în vârstă de 24 de ani din întreaga populaţie
studiată.

18. Un teleferic este proiectat să suporte o greutate maximă de 10000kg. La un transport


sunt încărcate 50 de butoaie. Să presupunem că greutăţile tuturor butoaielor care trebuie
transportate cu telefericul au o medie de 190kg ( ) şi o abatere standard de 25kg ( .
Care este probabilitatea ca un eşantion aleator (simplu repetat) de 50 de butoaie să aibă o
greutate mai mare decât greutatea maximă suportată de teleferic?

Masa medie pe butoi = = 200; trebuie să calculăm P(



P( 200 cu σ = = = 3.546 şi standardizând variabila x P(z )
√ √ √
P(z ) P(z ) P(z 2.82) = 0.5 – P(0 z 2.82) = 0.5 – 0.4976 =
. .
0.0024.

19. În 1998 aproximativ 50% dintre români considerau că inflaţia este cea mai importantă
problemă a ţării. Dacă se aleg în mod aleator 1500 de români din totalul populaţiei, care
este şansa ca populaţia acestui eşantion să reflecte în mod adecvat proporţia întregii
populaţii, considerând un interval de 3‰ în jurul valorii medii a populaţiei?

19
20. Dintr-un lot de 3000 de piese se extrage aleator şi repetat un eşantion de 100 de piese,
pentru a-i măsura abaterea faţă de diametrul prevăzut de 8. Prelucrând datele din
eşantion, se obţine o abatere standard corectată de s = 1.5. Să se calculeze: eroarea medie
de reprezentativitate, eroarea maximă limită admisă; se cer aceleaşi date, dacă volumul
eşantionului se măreşte de 3 ori (eşantion repetat şi nerepetat).
N=3000; n=100; = 8; s= ∑ = 1.5
.
Eroarea medie de reprezentativitate (selecţie) = σ = = 0.15
√ √

Dacă selecţia se făcea nerepetat, σ = 0.15·0.97=0.145 (eroarea scade)



Dacă n, volumul eşantionului s-ar mări de 3 ori, eroarea medie de selecţie ar fi
.
σ = =0.0866 (repetat)
√ √

σ =0.0866·0.97=0.08342 (nerepetat)

Obs. Eroarea medie scade odată cu mărirea elşantionului şi cu schimbarea procedurii de
selecţie.

21.a) Calculaţi volumul unui eşantion simplu aleator (cu repetiţie şi fără repetiţie) pentru
a estima nota de absolvire a unui număr N=232 de studenţi; se consideră eroarea limită
admisă ∆ = 0.2; 0.38; 0.54; 0.84; se dau σ =1.78 şi probabilitatea de 0.969; discuţie.
b) în aceleaşi condiţii, calculaţi volumele eşantioanelor (sondaje cu revenire şi fără
revenire) în cazul unei erori limită maximă admisă de 0.38, cu probabilităţile: 0.95;
0.975; 0.99.
c) stabiliţi o relaţie între volumele eşantioanelor pentru sondajul simplu aleator cu
repetiţie şi fără repetiţie, în condiţiile unei aceleiaşi erori maxime admise şi aceeaşi
încredere de garantare a rezultatelor.
d) stabiliţi relaţia dintre erorile maxim admise în cazul sondajului simplu aleator cu
repetiţie şi fără repetiţie.

22. Să se calculeze volumul eşantionului în vederea estimării estimării unei proporţii de


20, 30, 50 şi 70% (ce reprezintă opţiunile unui eşantion) cu o eroare limită maximă
admisă de 3% şi o încredere de 95%.

23. a) Dintr-o populaţie cu şi se extrage aleator un eşantion de volum n=65. Cu ce


eroare maximă limită admisă se estimează , pentru următoarele valori ale lui : 5, 10,
20, 50, 100
b) se fixează un volum al eşantionului şi un anumit nivel de încredere. Ce se întâmplă cu
eroarea limită maximă admisă, ∆ , dacă creşte?

20

S-ar putea să vă placă și