Sunteți pe pagina 1din 12

Sondajul simplu aleator

Principalele noiuni pereche din colectivitatea general i din eantion utilizate n tehnica sondajelor.
Tabel 1.1

Xi xi n N X x 2 S2 p p 2 Sw2

simbol pentru o caracteristic cantitativ pe care o posed unitile din populaie simbol pentru o caracteristic cantitativ pe care o posed unitile din eantion Volumul eantionului Volumul populaiei totale Media caracteristicii cantitative n populaia totala Valoarea mediei de sondaj pentru caracteristica cantitativ Dispersia caracteristicii cantitative n populaia total Dispersia caracteristicii cantitative n eantion Media caracteristicii calitative n populaia totala Dispersia caracteristicii calitative n populaia total Dispersia caracteristicii calitative n eantion

Sumarul determinrii intervalului de ncredere n cazul utilizrii unui sondaj simplu aleator cu probabiliti egale:
Tabel 1.2

Condiiile de desfurare Populaie infinit i eantion de volum normal (n<0,05N), n>30 Populaie finit i eantion de volum normal (n>0,05N), n>30 Eantion de volum redus n<30

Sondaj cu revenire 2 2 cunoscut necunoscut


xz 2 n xz S2 n

Sondaj fr revenire 2 cunoscut


xz 2 n

2 necunoscut
xz S2 n

wz xz wz xt wt

w (1 w ) n 2 n w (1 w ) n 2 n w (1 w ) n 1 xt S2 n 1 xz S2 n

wz xz wz xt wt

w (1 w ) n 2 N n n N 1 w (1 w ) N n n N 1 2 N n n N 1 w (1 w ) N n n 1 N 1
xt S2 N n n 1 N 1
xz S2 N n n N 1

Probleme rezolvate
Problema 1 n rndul celor 2000 de salariai ai unei ntreprinderi s-a realizat un sondaj. Eantionul de 300 de persoane a fost obinut printr-o selecie aleatoare fr revenire. Rezultatele centralizate pentru dou ntrebri din chestionar sunt: Q1. Vrsta n ani mplinii este (limita inferioar inclus n interval):
20-30 20 30-40 40 40-50 160 50-60 50 50-60 20 60-70 10 Tabelul 1.3 Total 300

Q2. Ce prere avei despre activitatea desfurat de sindicat:


Foarte bun 80 bun 150 indiferent 10 proast 50 foarte proast 10 Tabelul 1.4 Total 300

Se cere: 1. S se reprezinte grafic distribuia salariailor dup vrst. 2. Caracterizai variaia i asimetria distribuiei salariailor dup vrst. 3. S se estimeze pentru o probabilitate de 0.95 vrsta medie a salariailor. 4. Dac procedeul de selecie ar fi fost simplu aleator cu revenire, care era volumul eantionului n aceleai condiii de eroare i probabilitate? 5. Dac eroarea limit se reduce cu 25%, ct de mare trebuie s fie volumul eantionului (probabilitatea cu care se garanteaz rezultatul rmne neschimbat)? 6. S se estimeze ponderea salariailor care au o prere bun i foarte bun despre activitatea desfurat de sindicat. Rezolvare: 1. Distribuia salariailor dup vrst se reprezint grafic cu ajutorul histogramei (vezi figura 1.1) Distribuia salariailor din eantion dup vrst
nr. salaria i
180 160 140 120 100 80 60 40 20 0 20-30 30-40 40-50 50-60 60-70

ani

Figura 1.1

2. Pentru caracterizarea gradului de variaie al distribuiei se va calcula coeficientul de variaie. Calculele necasate sunt sistematizate n tabelul 1.5
Tabelul 1.5 ni 20-30 30-40 40-50 50-60 60-70 Total 20 40 160 70 10 300 xi 25 35 45 55 65 xini 500 1400 7200 3850 650 13600

(x i x) 2 n i
8268.89 4271.11 17.78 6541.11 3867.78 22966.67

Calculm media caracteristicii vrsta pe baza datelor din eantion. x i n i 13600 =45.33 ani x= = 300 ni Calculm dispersia caracteristicii vrsta pe baza datelor din eantion. (x i x) 2 n i 22966.67 2 =76.56 S = = 300 ni

Coeficientul de variaie este dat de relaia: S 8.75 v = 100 = 100 =19.3% x 45.33 Valoarea coeficientului de variaie este mai mic de 35% ceea ce nseamn ca distribuia este omogen ; iar media reprezentativ.

Pentru caracterizarea asimetriei vom calcula coeficientul de asimetrie m0 x0 k valoarea modal a caracteristicii vrsta n eantion; limita inferioar a intervalului modal; mrimea intervalului; diferena dintre frecvena intervalului modal i a celui precedent

diferena dintre frecvena intervalului modal i acelui urmtor. Intervalul modal este [!40-50) deoarece are frecvena maxim. 1 120 mo = x 0 + k = 40 + 10 =45.71 1 + 2 120 + 90 ( x m 0 ) 45.33 45.71 = c as = =-0.043 S 8.75 Valoarea obinut indic o asimetrie foarte redus de stnga.
3. nainte de a estima vrsta medie n populaie trebuie stabilit dac sondajul a fost efectuat ntr-o populaie finit sau infinit. Pentru aceasta calculm ct reprezint 5% din volanul populaiei. 0.05*N=0.05*2000=100

1 2

Deoarece n (300) >100 considerm c sondajul aleator fr revenire a fost realizat ntr-o populaie finit. Dispersia caracteristicii cantitative vrsta n populaiei nu este cunoscut i va fi nlocuit cu dispersia caracteristicii n eantion. Calculul erorii de reprezentativitate (eroare standard).
x = S2 N n 76.56 2000 300 = = 0.4657 ani n N 1 300 2000 1

Calculul erorii limit x = z x =1.96*0.4657=0.9129 ani Intervalul de ncredere: x x < X < x + x 45.33 0.9129 < X < 45.33 + 0.9129 44.4171 < X < 46.2429 Vrsta medie a salariailor ntreprinderii este de cel puin 44.4171 ani i cel mult 46.2426 ani. Aceast estimaie este garantat cu o probabilitate de 0.95. 4. Dac sondajul s-ar fi efectuat dup procedeul simplu aleator cu revenire volumul eantionului este dat de relaia: z 2 2 z 2 S 2 1.96 2 76.56 = 322 persoane n SAR = 0.9129 2x 2x
5. Volumul eantionului este direct proporional cu dispersia i cu argumentul funciei de probabilitate i invers proporional cu precizia estimaiei. Dac eroarea limit se va reduce este de ateptat ca volumul eantionului s creasc. ' x = 0,75 x = 0.75 0.9129 = 0.6847 persoane

6. Ponderea salariailor din eantion care au o prere bun i foarte bun despre activitatea sindicatului se calculeaz dup relaia: m 80 + 150 w= = = 0.77 n 300 Calculul erorii de reprezentativitate (eroare standard). w (1 w ) N n 0.77(1 0.77) 2000 300 w = = = 0.000502 n N 1 300 2000 1 Calculul erorii limit w = z w =1.96*0.000502=0.000983 Intervalul de ncredere: w w < p < w + w 0.77 0.000983 < p < 0.77 + 0.000983 0.7690173 < p < 0.770983 Se garanteaz cu o probabilitate de 0.95 c cel puin 76.90176% i cel mult 77.0983% din salariaii ntreprinderii au o prere bun i foarte bun despre activitatea desfurat de organizaia de sindicat.
Problema 2

n rndul celor 4000 de studeni ai unei faculti s-a realizat un sondaj simplu aleator pe un eantion de 175 persoane. La ntrebarea Cte ore studiai n medie pe sptmn (exceptnd sesiunea)? rspunsurile centralizate se gsesc n tabelul 1.6.

Tabel 1.6 Intervale de variaie (ore)* Nr. studeni 0-2 50 2-6 55 6-12 40 12 h i peste 30 Total 175

* limita inferioar este inclus n interval Se cere: 1. S se estimeze pentru o probabilitate de 0.95 numrul mediu de ore studiate de un student din facultate. 2. S se estimeze cu aceeai probabilitate ponderea studenilor care studiaz mai puin de 6 ore pe sptmn.
Rezolvare:

1. Calculm ct reprezint 5% din volumul populaiei. 0.05*N=0.05*4000=200 Deoarece n (175) <200 considerm c sondajul aleator a fost realizat ntr-o populaie infinit. Dispersia caracteristicii cantitative numrul de ore studiate n populaiei nu este cunoscut i va fi nlocuit cu dispersia caracteristicii n eantion.
Tabel 1.7 Intervale de variaie (ore)* 0-2 2-6 6-12 12 i peste Total ni 50 55 40 30 175 xi 1 4 9 15 xini 50 220 360 450 1080

(x i x ) 2 n i
1337.18 259.33 320.03 2338.31 4254.86

*limita inferioar inclus n interval Calculm estimatorul numrului mediu de ore studiate pe sptmn. Calculele necesare sunt sistematizate n tabelul 1.7. x i n i 1080 x= = =6.17 ore 175 ni

Calculm dispersia estimatorului. (x i x) 2 n i 4254.86 2 = =24.31 S = 175 ni

Calculul erorii de reprezentativitate (eroare standard).


= x S2 24.31 = = 0.37 ore n 175

Calculul erorii limit x = z x =1.96*0.37 =0.73 ore Intervalul de ncredere: x x < X < x + x 6.17 0.73 < X < 6.17 + 0.73 5.44 < X < 6.9 ore

Numrul mediu de ore studiate de un student ntr-o sptmn este de cel puin 5,44 i cel mult 6,9. Garantm acest rezultat cu o probabilitate de 0,95. 2. Estimatorul ponderii studenilor care studiaz mai puin de 6 ore pe sptmn se calculeaz pe baza relaiei: m 50 + 55 w= = = 0.6 n 175 Calculul erorii de reprezentativitate (eroare standard). w (1 w ) 0.6(1 0.6) w = = = 0.037 n 175 Calculul erorii limit w = z w =1.96*0.037=0.072 Intervalul de ncredere: w w < p < w + w 0.6 0.072 < p < 00.6 + 0.072 0.528 < p < 0.672 Garantm cu 95% c cel puin 52.8% i cel mult 67.2% din studeni studiaz mai puin de 6 ore pe sptmn.
Problema 3

n rndul celor 110 studeni ce locuiesc ntr-un cmin s-a realizat un studiu privind nivelul de mulumire fa de condiiile existente prelevndu-se un eantion de 25 persoane. Rspunsurile la ntrebarea n ce msur suntei mulumii de urmtoarele condiii din cminul n care locuii? sunt centralizate n tabelul 1.8.
Condiiile privind Curenia Cldura apa cald apa rece Foarte mulumit 8 6 10 11 mulumit 10 7 9 10 aa i aa 5 2 4 3 nemulumit 2 10 2 1 Tabel 1.8 Total 25 25 25 25

Se cere: 1. S se stimeze pentru o probabilitate de 95% ponderea studenilor care se consider mulumii i foarte mulumii de condiiile din cmin.
Rezolvare

Eantionul prelevat este de volum redus. n acest caz distribuia mediilor eantioanelor posibile depinde de forma de distribuie a populaiei. Cum de cele mai multe ori forma de distribuie a populaiei nu este cunoscut, nici legea de distribuie a mediilor eantioanelor nu poate fi determinat. Teoria sondajului demonstreaz c n cazul seleciei de volum mic probabilitatea de apariie a mediilor de diferite mrimi se distribuie mai uniform. Cu alte cuvinte probabilitile de apariie a mediilor nu descresc n aceeai msur ca n cazul eantioanelor de volum normal n momentul n care acestea se apropie de valorile extreme, mediile eantioanelor posibile distribuindu-se dup curba lui Student i nu dup curba normal. Calculele necesare estimrii procentelor celor ce se consider n general mulumii de condiiile existente sunt sistematizate n tabelul 1.9.

Tabel 1.9 Condiiile privind curenia cldura apa cald apa rece Foarte mulumit i mulumit 18 13 19 21 Wi

wi

wi

1i

2i

0.72 0.0809 0.1670 0.5530 0.8870 0.52 0.0901 0.1859 0.3341 0.7059 0.76 0.0770 0.1589 0.6011 0.9189 0.84 0.0661 0.1364 0.7036 0.9764

Estimatorul ponderii studenilor mulumii i foarte mulumii de condiia i se calculeaz pe baza relaiei: m w i = i unde mi reprezint numrul celor mulumii i foarte mulumii de n condiia i. Calculul erorii de reprezentativitate (eroare standard). n cazul n care nu se cunoate dispersia caracteristicii n populaie aceasta este nlocuit n relaia de calcul a erorii standard cu dispersia caracteristicii n eantion care se va mpri la numrul de grade de libertate n-1. w i (1 w i ) N n wi = n 1 N 1 Calculul erorii limit n cazul sondajului de volum redu. w i = t wi unde t este valoarea corespunztoare nivelului de siguran ales i numrului de grade de libertate df=n-1. n cazul nostru df=25-1=24. Primul pas n determinarea valorii lui t este identificarea este identificarea coloanei din tabela distribuiei Student. Deoarece probabilitatea de garantare a rezultatelor este de 0,95 aria de interes este (1-0,95)/2=0,025. Pentru a construi intervalul de ncredere cutm n tabelul repartiiei Student valoarea corespunztoare pentru df=24 i nivelul de semnificaie =0,025 i obinem valoarea t=2,064. Intervalul de ncredere pentru estimarea procentelor celor ce se consider n general mulumii pentru fiecare condiie se determin calculnd limita inferioar a intervalului 1i i limita superioar 2i dup relaiile: 1i = w i w i i 2i = w i + wi n ceea ce privete curenia 72% din cei intervievai se consider n general mulumii. Garantm cu o probabilitate de 95% c 72% 16.7% din studenii ce locuiesc n cmin se consider mulumii de curenie. 52% 18.59% din totalul studenilor sunt mulumii de cldur, 76% 15.89% sunt mulumii de apa cald i 84% 13.64% de apa rece.
Problema 4

n rndul celor 4000 de studeni ai unei faculti urmeaz s se realizeze un sondaj cu privire la modul de petrecere a timpului liber, utilizndu-se un procedeu de selecie simplu aleator fr revenire. Din surse administrative se cunosc informaiile din tabelul 1.10. Din cercetri anterioare pe teme similare efectuate n mediul studenesc s-a constata c variabilele din tabelul 1.10 sunt puternic corelate cu variabilele de interes ale studiului.

Tabel 1.10 ponderea studenilor care (%): locuiesc n cmin 35 au un loc de munc 20 sunt bursieri 25

Se cere: 1. Alegei variabila pe baza creia se va calcula volumul eantionului. 2. tiind c unitile ce vor forma eantionul se vor selecta dup procedeul simplu aleator fr revenire din lista studenilor furnizat de ctre secretariatul facultii, s se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%. 3. Tot din cercetri anterioare se cunoate c proporia de nonrspunsuri n acest tip de populaii este de 5%. Pe de alt parte se apreciaz c 2% din studenii ce figureaz n baza de date urmeaz s fie exmatriculai. Acetia se consider uniti non-eligibile. S se calculeze n aceste condiii eantionul de pornire.
Rezolvare:

1. Pentru a asigura reprezentativitatea eantionului pentru toate variabilele de interes volumul eantionului se va calcula pornind de la acea variabil auxiliar pentru care coeficientul de variaie are valoarea maxim. Calculele necesare sunt sistematizate n tabelul 1.11.
Tabel 1.11 ponderea studenilor care: locuiesc n cmin au un loc de munc sunt bursieri % 35 20 25 Media 0.35 0.2 0.25 dispersia 0.2275 0.16 0.1875 coeficient de variaie (%) 73.38 50 57.73

Media unei caracteristici calitative de tip alternativ se calculeaz dup relaia: M unde M reprezint numrul celor care ndeplinesc condiia n populaie iar p= N N este volumul populaiei. Dispersia caracteristicii alternative se calculeaz astfel: 2 p = p (1 p) Valoarea coeficientului de variaie este dat de relaia: p V= 100 max(p, (1 - p)) Din datele din tabelul 1.11 se observ c dup variabila: locuiesc n cmin populaia studenilor este cel mai puin omogen. Se recomand calcularea volumului eantionului pornind de la aceast variabil. 2. Deoarece procedeul de selecie utilizat este simplu aleator fr revenire la calculul volumului eantionului se folosete relaia: z 2 p(1 p) 1.96 2 0.35 (1.0.35) n= = 781 persoane z 2 p(1 p) 1.96 2 0.35 (1.0.35 2 2 w + 0.03 + N 4000

3. Dup determinarea volumului eantionului teoretic necesar trebuie s determinm care este volumul eantionului de pornire astfel nct n final s ajungem la numrul teoretic de uniti selectate. Se pune problema s inem cont de imperfeciunea listei utilizate ca baz de sondaj. Considerm uniti non-valide acele uniti care n-ar trebui s figureze pe list dac aceasta ar corespunde perfect populaiei studiate. n practic, n ciuda eforturilor actualizrii bazelor de date utilizate ca baze de sondaj, exist n mod curent un numr de uniti nonvalide. Trebuie estimat aceast proporie astfel nct s putem determina ct mai precis volumul de pornire al eantionului. n funcie de modul de definire a populaiei supuse studiului este posibil ca unele uniti s fie considerate non-eligibile. De exemplu dac populaia de interes este format din totalitatea persoanelor cu vrsta cuprins ntre 15 i 64 ani (populaia n vrst de munc) iar unitatea de selecie este gospodria, persoanele ce nu ndeplinesc condiia de vrst sunt considerate non-eligibile. Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Din aceast cauz se recomand anticiparea ratei non-rspunsurilor nc din faza de proiectare a sondajului pentru a redimensiona eantionul. Relaia de calcul a volumului eantionului de pornire este: 1 1 1 n p = n th unde: Pr Pe Pv np= volumul eantionului de pornire; nth= volumul eantionului teoretic; Pr=proporia de rspuns; Pe=proporia de eligibilitate; Pv=proporia de validitate 1 1 1 n p = 781 = 839 persoane. 0.95 1 0.98
Problema 5

n rndul celor 640 de salariai ai unei societi din sectorul minier urmeaz s se realizeze un studiu cu privire la rolul organizaiei sindicale i msura in care aceasta reprezint n interesele salariailor. Deoarece se consider c variabila vrsta este puternic corelat cu variabilele de interes ale studiului volumul eantionului se va calcula pornind de la aceast variabil. Vrsta medie a salariailor este de 42 ani cu o dispersie de 12. Se cere: 1. S se calculeze volumul eantionului teoretic, corespunztor unei erori limit de 2% din medie, garantat cu o probabilitate de 95%, tiind c procedeul de selecie utilizat este simplu aleatoriu fr revenire. 2. S se calculeze volumul eantionului de pornire tiind c doar 85% din salariai sunt membri ai sindicatului. Proporia de rspuns ateptat este de 95% iar cea de validitate este de 100%.
Rezolvare:

1. Eroarea limit propus este: x = 0,03 X = 0,02 42 = 0,84 ani

Relaia de calcul a volumului eantionului este: z 2 2 1.96 2 12 n th = = 60 persoane z 2 2 1.96 2 12 2 2 x + 0.84 + N 640 2. Calcul volumului eantionului de pornire: 1 1 1 n p = n th unde: Pr Pe Pv nth= 60; Pr=0,95 Pe=0,85; Pv=1 1 1 1 n p = 60 = 74 persoane. 0.95 0.85 1

Probleme propuse
Problema 1

La trgul de turism s-a realizat un sondaj n rndul vizitatorilor. Eantionul de 400 de persoane a fost obinut printr-o selecie mecanic. Rezultatele centralizate pentru dou ntrebri din chestionar sunt: Q1. Vrsta n ani mplinii este (limita inferioar inclus n interval):
Sub 30 60 30-40 100 40-50 160 50-60 50 50-60 20 Peste 60 10 Tabelul 1.12 Total 400

Q2. Cum vi s-au prut condiiile de cazare la munte anul acesta?


Foarte bune 70 190 Bune 190 90 Acceptabile 50 100 Proaste 60 80 Tabelul 1.13 Nu tiu 30 40

Hoteluri Vile

Se cere: 1. S se reprezinte grafic distribuia vizitatorilor dup vrst. 2. Caracterizai variaia si asimetria distribuiei vizitatorilor dup vrst. 3. S se estimeze pentru o probabilitate de 0,95 vrsta medie a vizitatorilor. 4. Dac eroarea limit se reduce cu 25% ct de mare trebuie s fie volumul eantionului (probabilitatea cu care se garanteaz rezultatul rmne neschimbat)? 5. S se estimeze ponderea vizitatorilor care au o prere bun i foarte bun despre condiiile de cazare de anul acesta la munte.

Problema 2

n rndul celor 90 de proprietari dint-un bloc de locuine s-a realizat un studiu privind nivelul de mulumire fa de condiiile existente prelevndu-se un eantion de 23 persoane. n urma centralizrii rspunsurilor la dou din ntrebrile din chestionar s-au obinut datele urmtoarele date: Q1. n ce msur suntei mulumii de:
Condiiile privind curenia cldura apa cald apa rece Foarte mulumit 8 10 9 11 mulumit 9 7 8 10 aa i aa 4 2 4 1 nemulumit 2 4 2 1 Tabel 1.14 Total 23 23 23 23

Q2. Ct de des v vizitai vecinii?


Tabel 1.15 Zilnic 2 De 2-3 ori pe sptmn 6 De 2-3 ori pe lun De cteva ori pe an 9 5 niciodat 1

Se cere: 1. S se stimeze pentru o probabilitate de 95% ponderea celor care se consider mulumii i foarte mulumii de condiiile de locuit. 2. S se estimeze cu aceeai probabilitate ponderea celor care i viziteaz vecinii de cel puin 2-3 ori pe lun.
Problema 3

n rndul celor 3600 de ageni economici dintr-un jude urmeaz s se realizeze un sondaj. Din surse administrative se cunosc informaiile din tabelul 1.16. Din cercetri anterioare pe teme similare efectuate n rndul agenilor economici s-a constata c variabilele din tabelul 1.16 sunt puternic corelate cu variabilele de interes ale studiului.
Tabel 1.16 variabila medie dispersie Cifra de afaceri 4 mld. lei 0,45 Numr salariai 26 pers 38,4

Se cere: 1. Alegei variabila pe baza creia se va calcula volumul eantionului. 2. tiind c unitile ce vor forma eantionul se vor selecta dup procedeul simplu aleator fr revenire din lista agenilor economici, s se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3% din nivelul mediu al variabilei dup care se va calcula volumul eantionului.

3. Tot din cercetri anterioare se cunoate c proporia de nonrspunsuri n acest tip de populaii este de 10%. Pe de alt parte se apreciaz c 3% din agenii economici ce figureaz n baza de date se afl n curs de lichidare a societii. 0,4489S se calculeze n aceste condiii eantionul de pornire.