Documente Academic
Documente Profesional
Documente Cultură
Tipuri de eantioane:
Structura eantioanelor n SPSS se prezint sub forma unor fiiere tip plan:
Planul de eantionare conine specificaiile de definire a
eantionului;
Planul de analiz conine date necesare procedurilor de analiz
complex pentru a calcula dispersia eantionului. Planul include structura
eantionului, metodele de estimare pentru fiecare stadiu, referinele la
variabilele de interes.
Debutul procedurii de creare a unui eantion se face prin deschiderea
bazei de eantionare. Vom folosi, n acest scop, o baz de date pus la
dispoziie de SPSS Inc.: 1991 U.S. General Social Survey.sav, care conine un
numr de 1517 nregistrri, reprezentnd rezultatele unui sondaj efectuat n
Statele Unite.
1
1 CREAREA UNUI EANTION N SPSS
Proiectarea unui nou plan de eantionare se realizeaz prin apelarea
meniului Analyze, iar din submeniul Complex Samples se alege opiunea
Select a Sample (fig.1).
Crearea unui eantion este asistat de un program special (Wizard sau
asistent) care presupune mai muli pai.
3
Figura 6 Pasul 2: Definirea variabilelor cercetrii
4
Figura 7 Pasul 2: Alegerea metodei de eantionare
5
Simple Systematic eantion sistematizat simplu (cu pas). Unitile
sunt selectate cu un pas fix de eantionare din baza de eantionare. Se poate
folosi i n cazul eantionrii stratificate, dac s-au specificat anterior variabilele
de stratificare. Selecia se face fr introducerea bilei n urn;
Simple Sequential unitile sunt extrase secvenial cu probabilitate
egal i fr introducerea bilei n urn;
PPS eantion proporional cu mrimea n care unitile sunt extrase
aleator, cu o probabilitate proporional cu mrimea. Orice unitate se selecteaz
cu reintroducerea bilei n urn, exceptnd configurarea anterioar a unui
eantion pe clusteri;
PPS Systematic eantion proporional cu mrimea de tip sistematic.
PPS Sequential eantion proporional cu mrimea de tip secvenial;
PPS Brewer eantion proporional cu mrimea n care sunt selectate
dou clustere din fiecare strat cu o probabilitate proporional cu mrimea
clusterului, fr introducerea bilei n urn. Necesit precizarea unei variabile de
tip cluster;
PPS Murthy un eantion similar celui anterior. Difer doar metoda
statistic prin care sunt alese unitile;
PPS Sampford eantion proporional cu mrimea care selecteaz
mai mult de doi clusteri din fiecare strat cu o probabilitate proporional cu
mrimea clusterului i fr introducerea bilei n urn. Necesit, de asemenea,
specificarea unui variabile pentru cluster.
Opiunea Measure of Size (MOS) se aplic eantioanelor de tip PPS
proporionale cu mrimea i implic precizarea unei dimensiuni definitorii
pentru mrimea fiecrei uniti. Aceste valori pot fi definite n mod explicit,
extrase fiind dintr-o variabil (prin bifarea opiunii Read from variable i
introducerea variabilei din care vor fi extrase datele) sau pot fi calculate automat
selectnd Count data records. De asemenea, se poate preciza amplitudinea
acestor dimensiuni, introducnd valorile minime i maxime n casetele de text
Minimum respectiv Maximum.
Fig. 8. Ultimul pas presupune specificarea numrului sau a proporiei n
care vor fi selectate unitile de eantionare. Dimensiunea eantionului poate fi
fix sau poate varia n funcie de straturi. Pentru baza noastr de date, un
eantion cu o marj de eroare de 2% i un interval de ncredere de 95% implic
un numr de 930 de subieci, pentru a fi reprezentativ.
6
Caseta de selecie Units permite alegerea ntre un numr fix de uniti
selectate alegnd opiunea Counts i o proporie de uniti n eantion
alegnd opiunea Proportions.
9
Fig. 10. Noua etap afieaz sumarul stadiului curent. Obinem scurte
informaii despre numrul stadiului, eticheta acestuia n cazul n care am
definit una , variabila de stratificare, variabila de cluster, dimensiunea
eantionului i metoda de eantionare folosit. La acest nivel, avem posibilitatea
crerii unui nou stadiu, selectnd Add stage 2, n cazul n care ne intereseaz
o eantionare multistadial, sau posibilitatea iniierii etapelor de creare efectiv
a eantionului, alegnd Next. De asemenea, ne putem ntoarce la etapele
anterioare, apsnd butonul Back.
10
Figura 11 Pasul 5: Crearea eantionului. Opiuni de selecie
12
n aceast fereastr se mai afl dou elemente:
Fiierul n care vor fi salvate probabilitile cumulate (Joint
probabilities), n cazul n care se folosesc eantioane proporionale cu
mrimea i fr introducerea bilei n urn.
Regulile de selecie ale cazurilor (Case selection rules), n cazul n
care se genereaz un singur stadiu la un moment dat i se dorete salvarea
regulilor de selecie a cazurilor ntrun fiier separat. Opiunea este util la
construirea substadiilor. Am ales salvarea eantionului n aceeai baz de date,
pentru a putea urmri mai uor procesul de selecie. Apsarea butonului Next
permite trecerea la ultima etap a crerii eantionului.
Fig. 13. Ultima fereastr ne ntreab dac dorim s salvm designul
realizat n planul de eantionare i s crem efectiv eantionul (opiunea Save
the design to a plan and draw the sample) sau dorim s copiem ntr-un fiier
de sintax comenzile SPSS generate n urma prelucrrilor noastre (opiunea
Paste de syntax generated by the Wizard into a syntax window). Evident,
vom alege prima opiune i vom apsa apoi butonul Finish.
13
Dup cteva fraciuni de secund, SPSS procedeaz la crearea
eantionului i ne ofer o serie de informaii n fereastra de rezultate (Output).
Fig. 14. Primul tabel din fereastra de rezultate se refer la informaii
despre planul de eantionare. Observm c avem un singur stadiu, metoda de
selecie este simplu aleatorie fr reintroducerea bilei n urn, iar eantionul
conine un numr de 930 de cazuri. n acest tabel regsim informaii despre
noile variabile create n baza de date i, de asemenea, ne este furnizat fiierul
care conine planul de eantionare.
Tabelul planului de eantionare prezint i o serie de date utile n
proiectarea planului de analiz a eantionului. O variabil foarte important la
acest nivel este variabila SampleWeight_Final_, folosit n general la
proiectarea planului de analiz a eantionului ca variabil caracteristic a
reprezentativitii cazurilor n eantion.
14
Fig. 15. Urmtorul tabel generat se refer la sumarul stadiului. Pentru
fiecare stadiu al eantionrii va fi generat un asemenea tabel, n care regsim
informaii despre unitile i proporiile selectate.
15
Variabila SampleWeight este generat automat i corespunde oarecum
frecvenei cu care fiecare caz selectat n eantion este reprezentat n populaia
general. Suma acestor valori se apropie foarte mult de dimensiunea populaiei.
ntr-adevr, avem 930 de cazuri, fiecare avnd valoarea 1,63 la aceast
variabil. Prin urmare, 930 1,63 = 1515,9 valoare apropiat de mrimea
populaiei. Aceast variabil este foarte important n procesul de analiz a
eantionului.
Dup selectarea subiecilor n eantion, urmeaz etapa de analiz a
eantionului n vederea identificrii proprietilor sale statistice.
2 ANALIZA EANTIONULUI
Figura 17 Meniul
planului de analiz
16
Fig. 18. Primul pas este reprezentat de specificarea fiierului n care va
fi salvat planul de analiz. Opiunea Create a plan file ne permite alegerea
locului i stabilirea numelui sub care va fi salvat planul de analiz. Putei tasta
calea complet sau putei folosi butonul Browse, prin intermediul cruia
vei alege locaia acestui fiier. Evident, va trebui s furnizai i un nume.
n cazul nostru, fiierul plan de analiz se numete Analiza.csaplan i
a fost salvat direct n directorul C:\. Observai diferena de extensie. Dac
planurile de eantionare aveau extensia .csplan, planul de analiz are extensia
.csaplan.
17
Fig. 19. Noua fereastr conine mai multe elemente. n primul rnd va
trebui s specificm variabila caracteristic reprezentativitii eantionului.
Am accentuat deja importana variabilei Sample Weight. Dei n cazul unor
eantioane complexe aceast variabil poate lua diferite forme, n planul de
analiz vom include, de obicei, forma final a acesteia, forma n care SPSS
pondereaz de fapt toate stadiile. Este recomandabil introducerea n seciunea
Sample Weight a variabilei de tipul Final Sample Weight, variabil care,
de obicei, caracterizeaz cel mai bine eantionul. n cazul planurilor complexe,
s-ar putea include i alte variabile pariale de acest tip, dac se dorete
investigarea la nivelul stadiilor, a straturilor ori a clusterilor.
19
poate fi selectat n cazul eantioanelor cu probabilitate egal de selecie i fr
nlocuire equal WOR. Aceast metod include coreciile pentru populaii
finite i pleac de la supoziia conform creia unitile au fost selectate cu o
probabilitate egal.
Metoda unequal WOR folosete i ea coreciile de populaie finit,
dar pleac de la supoziia c selecia unitilor din populaie s-a realizat cu o
probabilitate inegal. n general, metoda se folosete n cazul unor eantioane
nealeatorii.
Eantionul nostru a fost creat fr reincluderea bilei n urn i cu o
probabilitate egal, prin urmare vom alege opiunea a doua.
Fig. 21. Apsarea butonului Next v permite s specificai
probabilitile de includere sau mrimea populaiei la nivelul stadiului curent.
Aceste dimensiuni pot fi fixe sau pot varia la nivelul straturilor. Aceast etap
este valabil doar dac anterior ai ales opiunea WOR cu probabiliti egale.
20
putem introduce n caseta de text Value cifra 1517, valoare ce reprezint
dimensiunea exact a populaiei sau 0,61, probabilitatea de includere. Am
preferat, n exemplul nostru, prima variant. Utilizarea acestei seciuni
presupune o singur valoare aplicat tuturor straturilor.
O alt variant o reprezint opiunea Unequal values for strata, care
se activeaz numai n situaia definirii anterioare a unei variabile de stratificare.
Caseta care se deschide la apsarea butonului Define permite stabilirea
valorilor pentru fiecare strat.
Ultima opiune, Read values from variable, ne permite includerea
unei variabile numerice care conine valorile pentru fiecare strat.
21
Fig. 23. Ultimul ecran ne invit s salvm planul de analiz creat sau s
copiem sintaxa ntr-o fereastr de comenzi SPSS, ntr-un mod identic cu planul
de eantionare.
22
Figura 24 Analiza eantionului
Fig. 25. Toate operaiile din aceast etap impun anumite specificaii de
analiz coninute n planul de eantionare. n seciunea Plan, caseta de text
File, vom putea tasta calea ctre planul de eantionare sau vom putea utiliza
butonul Browse n vederea navigrii ctre locaia ce conine acest fiier.
n cazul n care probabilitile de includere ale elementelor n eantion
nu sunt egale, situaie des ntlnit n cadrul eantionrii stratificate sau al
eantionrii pe clusteri, va trebui s specificm fiierul n care s-au precizat
aceste probabiliti, utiliznd seciunea Joint Probabilities. Astfel, putem
alege aceste probabiliti dintr-o variabil din baza de date, dintr-o alt baz de
date sau dintr-un alt tip de fiier.
Trecerea la analiza efectiv se face prin apsarea butonului Continue.
24
Figura 26 Stabilirea variabilelor de interes
Fig. 27. Exist destul de multe opiuni n cadrul acestei noi ferestre.
Seciunea Cells permite afiarea informaiilor legate de populaia int
din care a fost extras eantionul. Vor fi afiate date referitoare la dimensiunea
populaiei sub form de frecvene absolute, prin bifarea casetei Population
size i sub form de frecvene relative (procente), bifnd caseta Table
percent.
Seciunea Statistics permite configurarea indicatorilor statistici
asociai dimensiunii populaiei sau a procentului din populaie, astfel:
Prin bifarea casetei Standard error, vom calcula eroarea standard
a estimrii;
Caseta Confidence interval permite stabilirea intervalului de
ncredere a estimrii n baza nivelului specificat. n mod normal, intervalul de
ncredere l vom stabili la 95% (caseta de text Level%);
Caseta Coefficient of variation comunic programului calculul
coeficientului de variaie a estimrii, sub form de proporii;
Caseta Unweighted count permite afiarea numrului de elemente
26
folosit n realizarea estimrii. Cu alte cuvinte, dimensiunea eantionului extras;
Caseta Design effect permite calculul varianei estimrii.
Indicatorul exprim proporia de varian a eantionului comparat cu variana
unui eantion simplu aleator. Coeficientul nu este folosit n cazul eantioanelor
simplu aleatore n acest caz fiind ntotdeauna 1 , ci doar n cazul
eantioanelor mai complexe. Cu ct valoarea este mai deprtat de unu, cu att
efectul este mai mare i deci variana este mai mare;
Caseta Square root of design effect reprezint rdcina ptrat din
variana estimrii (un fel de abatere standard dac v mai aducei aminte), fiind
o msur standard a efectului i avnd acelai mod de interpretare;
Caseta Cumulative values calculeaz frecvena cumulat a
populaiei int, avnd aceeai semnificaie ca orice frecven cumulat.
Caseta Test of equal cell proportions permite calculul a dou teste
statistice: testul 2 i testul de probabilitate a proporiilor.
Fr a intra n amnunte, menionm c ambele teste pornesc de la
ipoteza nul c toate categoriile unei variabile au frecvene egale. Testele ne
permit s verificm dac exist diferene semnificative ntre frecvenele
categoriilor variabilei (n cazul nostru, dac frecvena brbailor este
semnificativ mai mare sau semnificativ mai mic n comparaie cu frecvena
femeilor).
Pentru exerciiul nostru am comunicat programului SPSS s afieze
frecvena absolut i relativ a populaiei int (casetele Population size i
Table percent), s calculeze eroarea standard a estimrii, intervalul de
ncredere i doar demonstrativ mrimea efectului i s afieze mrimea
eantionului (casetele Standard error, Confidence interval la un nivel de
95%, Unweighted count i Design effect).
Apsnd butonul Continue, revenim la fereastra iniial.
Un alt buton prezent este butonul Missing Values, prin apsarea
cruia vom putea stabili modul de tratare a cazurilor lips.
27
Figura 28 Tratarea cazurilor lips
31
Figura 32 Rezultatele analizei eantionului
32