Sunteți pe pagina 1din 32

MCSP 4.

SONDAJUL CU AJUTORUL SPSS

SPSS prezint un instrument foarte puternic de creare a eantioanelor n


condiiile n care avei la dispoziie baza de eantionare.

Tipuri de eantioane:

- Eantioane simple aleatorii,


cu sau fr nlocuire;
- Eantioane stratificate
- Eantioane pe serii (clusteri);
- Eantioane multistadiale;
- Eantioane probabilistice
proporional cu mrimea
- Tipuri de eantioane nealeatorii.

Figura 1 Meniul de creare


i analiz a eantioanelor

Structura eantioanelor n SPSS se prezint sub forma unor fiiere tip plan:
Planul de eantionare conine specificaiile de definire a
eantionului;
Planul de analiz conine date necesare procedurilor de analiz
complex pentru a calcula dispersia eantionului. Planul include structura
eantionului, metodele de estimare pentru fiecare stadiu, referinele la
variabilele de interes.
Debutul procedurii de creare a unui eantion se face prin deschiderea
bazei de eantionare. Vom folosi, n acest scop, o baz de date pus la
dispoziie de SPSS Inc.: 1991 U.S. General Social Survey.sav, care conine un
numr de 1517 nregistrri, reprezentnd rezultatele unui sondaj efectuat n
Statele Unite.
1
1 CREAREA UNUI EANTION N SPSS
Proiectarea unui nou plan de eantionare se realizeaz prin apelarea
meniului Analyze, iar din submeniul Complex Samples se alege opiunea
Select a Sample (fig.1).
Crearea unui eantion este asistat de un program special (Wizard sau
asistent) care presupune mai muli pai.

Figura 5 Primul pas al crerii unui eantion. Salvarea fiierului plan

Fig.5. Prima fereastr afiat ne solicit alegerea unui fiier n care va fi


stocat planul de eantionare. Opiunea implicit este Design a sample, pe
care o vom folosi pentru a specifica locaia i numele planului de eantionare.
Vom putea introduce direct calea ctre fiierul ce urmeaz a fi salvat sau vom
putea apsa butonul Browse pentru a alege locul pe harddisc unde va fi
salvat planul de eantionare. Evident, va trebui s furnizm i un nume pentru
acest fiier. n cazul nostru, am denumit fiierul Test.csplan i a fost salvat
direct pe discul C:\. Observai c extensia fiierelor de tip plan de eantionare
2
este .csplan.
Pentru a modifica un plan de eantionare existent, avei la dispoziie
opiunea Edit a sample design. Cu ajutorul acesteia, vei putea reconfigura
sau elimina stadii din cadrul unui plan de eantionare multistadial creat anterior.
Evident, acest plan de eantionare va trebui iniial deschis prin tastarea cii ctre
fiierul de tip .csplan sau folosind butonul Browse.
Dac avei deja un plan de eantionare fcut i dorii s creai un
eantion n baza acestuia, putei folosi opiunea Draw a sample, dup care
alegei fiierul plan dorit, la fel ca mai sus. Trecerea la urmtoarea etap se face
prin intermediul butonului Next. Putei oricnd abandona operaia apsnd pe
butonul Cancel sau putei parcurge sistemul de asisten contextual prin
accesarea butonului Help.
Fig.6. A doua fereastr presupune definirea planului de eantionare. n
partea stng, avnd o structur arborescent, sunt afiate opiunile acestui
stadiu.
Prima opiune implic precizarea variabilelor de eantionare n cazul
unor eantioane care presupun acest lucru (opiunea Design variables). Avem
prezentate, n seciunea central, toate variabilele din baza de eantionare.
Folosind butoanele de transfer (butoanele sgeat), vom putea include aceste
variabile n seciunea Stratify By, dac dorim un eantion stratificat dup
acea variabil. Se vor putea preciza astfel straturile sau subpopulaiile. n urma
acestei selecii se obin eantioane separate pentru fiecare strat. Pentru a se putea
mbunti precizia estimrilor, unitile din fiecare strat vor fi ct mai omogene
din punctul de vedere al caracteristicii estimate.
O variabil introdus n seciunea Clusters permite crearea unui
eantion pe serii n care se definesc grupuri de uniti de observaie. Pentru a se
evita pierderea preciziei i a compensa dezavantajele eantionrii pe serii, ntre
clusteri trebuie s existe o eterogenitate ct mai mare sub aspectul variabilei de
interes.
Dac planul de eantionare este parte dintr-un plan de eantionare mai
complex, putei introduce o variabil numeric n seciunea Input Sample
Weight, variabil ce reprezint dimensiunea unui eantion construit ntr-un
stadiu anterior.

3
Figura 6 Pasul 2: Definirea variabilelor cercetrii

Pentru claritate, se poate introduce un scurt text care va descrie stadiul n


curs, folosind caseta de text Stage Label.
n acest exemplu, vom construi un eantion simplu aleator.
Urmtoarea seciune, Method, permite stabilirea tehnicii de
eantionare pe care o folosim.
Fig. 7. SPSS permite selectarea, n funcie de variabilele precizate n
etapa anterioar, a mai multor tipuri de eantioane. Deoarece nu am inclus nici o
variabil n etapa anterioar optnd pentru un eantion simplu aleator , n
caseta de selecie Type din cadrul seciunii Method, vor fi disponibile doar
anumite opiuni: eantioane de tip aleator simplu, sistematic (mecanic),
precum i de tip secvenial (n trepte) i de tip proporional cu mrimea PPS
simplu, sistematic i secvenial. Din aceast list vom alege eantionul simplu
aleator (opiunea Simple Random Sample).

4
Figura 7 Pasul 2: Alegerea metodei de eantionare

La nivelul acestei etape, exist posibilitatea de a efectua selecia


nerepetat (fr reintroducerea bilei n urn) opiunea Without
replacement (WOR) sau repetata (cu reintroducerea bilei n urn)
opiunea With replacement (WR). Cu alte cuvinte, o unitate selectat n
eantion va fi eliminat de la urmtoarele posibile selecii n cazul WOR sau
nu va fi eliminat, existnd posibilitatea unei noi selecii n cazul WR. n acest
din urm caz, bifnd caseta Use WR estimation for analysis, comunicai
programului SPSS s estimeze aceast probabilitate de reincludere a unui
element n eantion. Implicit, metoda de estimare este specificat n fiierul plan
i este consistent cu tipul de eantion selectat. Opiunea permite, de asemenea,
forarea metodei cu introducerea bilei n urn, chiar dac metoda de eantionare
presupune o selecie fr introducerea bilei n urn.
Pe scurt, tipurile de metode ce pot fi alese n aceast etap sunt:
Simple Random Sampling eantion selectat aleator simplu, n care
unitile sunt selectate cu o probabilitate egal. Metoda poate fi folosit cu sau
fr reintroducerea bilei n urn;

5
Simple Systematic eantion sistematizat simplu (cu pas). Unitile
sunt selectate cu un pas fix de eantionare din baza de eantionare. Se poate
folosi i n cazul eantionrii stratificate, dac s-au specificat anterior variabilele
de stratificare. Selecia se face fr introducerea bilei n urn;
Simple Sequential unitile sunt extrase secvenial cu probabilitate
egal i fr introducerea bilei n urn;
PPS eantion proporional cu mrimea n care unitile sunt extrase
aleator, cu o probabilitate proporional cu mrimea. Orice unitate se selecteaz
cu reintroducerea bilei n urn, exceptnd configurarea anterioar a unui
eantion pe clusteri;
PPS Systematic eantion proporional cu mrimea de tip sistematic.
PPS Sequential eantion proporional cu mrimea de tip secvenial;
PPS Brewer eantion proporional cu mrimea n care sunt selectate
dou clustere din fiecare strat cu o probabilitate proporional cu mrimea
clusterului, fr introducerea bilei n urn. Necesit precizarea unei variabile de
tip cluster;
PPS Murthy un eantion similar celui anterior. Difer doar metoda
statistic prin care sunt alese unitile;
PPS Sampford eantion proporional cu mrimea care selecteaz
mai mult de doi clusteri din fiecare strat cu o probabilitate proporional cu
mrimea clusterului i fr introducerea bilei n urn. Necesit, de asemenea,
specificarea unui variabile pentru cluster.
Opiunea Measure of Size (MOS) se aplic eantioanelor de tip PPS
proporionale cu mrimea i implic precizarea unei dimensiuni definitorii
pentru mrimea fiecrei uniti. Aceste valori pot fi definite n mod explicit,
extrase fiind dintr-o variabil (prin bifarea opiunii Read from variable i
introducerea variabilei din care vor fi extrase datele) sau pot fi calculate automat
selectnd Count data records. De asemenea, se poate preciza amplitudinea
acestor dimensiuni, introducnd valorile minime i maxime n casetele de text
Minimum respectiv Maximum.
Fig. 8. Ultimul pas presupune specificarea numrului sau a proporiei n
care vor fi selectate unitile de eantionare. Dimensiunea eantionului poate fi
fix sau poate varia n funcie de straturi. Pentru baza noastr de date, un
eantion cu o marj de eroare de 2% i un interval de ncredere de 95% implic
un numr de 930 de subieci, pentru a fi reprezentativ.
6
Caseta de selecie Units permite alegerea ntre un numr fix de uniti
selectate alegnd opiunea Counts i o proporie de uniti n eantion
alegnd opiunea Proportions.

Figura 8 Pasul 2: Stabilirea dimensiunii eantionului

Opiunea Value permite aplicarea unei valori unice pentru toate


straturile. n modul numrului fix, va trebui s introducei valoarea dimensiunii
eantionului (n cazul nostru, 930). Dac optm pentru proporii, vom include
proporia din populaie pe care o regsim n eantion (de exemplu 0,10 pentru
10% din populaie).
Opiunea Unequal values for strata permite introducerea valorilor
eantionului pentru fiecare strat definit, n condiiile n care dimensiunile
straturilor nu sunt egale.
Read values from variable permite selectarea unei variabile
numerice, n care sunt stocate dimensiunile fiecrui strat.
La alegerea eantionului bazat pe proporii, putem, de asemenea,
7
specifica limitele inferioare i superioare ale numrului de uniti care vor fi
selectate (de exemplu, nu mai puin de 50 Minimul i nu mai mult de 200
Maximum).
Apsarea butonului Next determin afiarea ferestrei variabilelor care
urmeaz a fi calculate.

Figura 9 Pasul 3: Alegerea variabilelor eantionului

Fig. 9. Pe parcursul acestei etape putem preciza ce variabile vor fi


salvate n baza de date n urma crerii eantionului, astfel:
Bifnd caseta Population size, vom comunica aplicaiei crearea
unei variabile care va stoca numrul estimat de uniti din populaie la un
anumit stadiu. n baza de date, aceast variabil va ncepe cu
PopulationSize_;
Bifnd caseta Sample size, vom putea salva o variabil care s
conin numrul de uniti selectate la un anumit stadiu. n baza de date, aceast
variabil va ncepe cu SampleSize_;
8
Bifnd caseta Sample proportion, se va crea o variabil ce va
conine proporia eantionului selectat din populaie. Variabila va ncepe cu
SamplingRate_;
Bifnd caseta Sample weight, comunicm programului SPSS s
creeze o variabil ce va stoca inversul probabilitilor de includere a unui
element n eantion. Numele variabilei va ncepe n baza de date cu
SampleWeightCumulative_, iar variante ale acestei variabile au un rol
important n procesul de analiz a eantionului.
Alturi de aceste variabile, n baza de date va fi creat automat o serie de
noi variabile, dup cum urmeaz:
Probabilitatea de includere proporia unitilor selectate la nivelul
unui anumit stadiu, variabil identificat prin InclusionProbability_;
Mrimea cumulat mrimea cumulat a eantionului de la un stadiu
la altul, variabil identificat prin SampleWeightCumulative_;
Indexul permite specificarea unitilor selectate de mai multe ori la
nivelul unui stadiu, variabil identificat prin Index_. Variabila este salvat
doar n condiiile n care se folosete opiunea cu introducerea bilei n urn.
Ca regul general, n baza de date, fiecare variabil nou creat va fi
urmat, dup linia de subliniere, de o cifr care indic stadiul. De exemplu,
probabilitatea de includere a unei uniti n eantion, pentru primul stadiu, va
aprea n baza de date sub forma InclusionProbability_1_.
n exemplul nostru, am bifat salvarea tuturor variabilelor n baza de date.
Apsarea butonului Next permite trecerea la urmtorul pas al crerii
eantionului. Am observat c, la un moment dat, s-a activat i butonul Finish.
Acest lucru nseamn c SPSS are deja suficiente informaii pentru a crea
eantionul i putem sri peste paii rmai. Noi vom parcurge, totui, ntregul
proces pentru a putea analiza etapele acestui instrument.

9
Fig. 10. Noua etap afieaz sumarul stadiului curent. Obinem scurte
informaii despre numrul stadiului, eticheta acestuia n cazul n care am
definit una , variabila de stratificare, variabila de cluster, dimensiunea
eantionului i metoda de eantionare folosit. La acest nivel, avem posibilitatea
crerii unui nou stadiu, selectnd Add stage 2, n cazul n care ne intereseaz
o eantionare multistadial, sau posibilitatea iniierii etapelor de creare efectiv
a eantionului, alegnd Next. De asemenea, ne putem ntoarce la etapele
anterioare, apsnd butonul Back.

Figura 10 Pasul 4: Sumarul stadiului

Pentru moment, nu suntem interesai dect de crearea unui eantion


simplu aleatoriu, fr alte stadii suplimentare, astfel nct vom apsa butonul
Next.

10
Figura 11 Pasul 5: Crearea eantionului. Opiuni de selecie

Fig. 11. Noua fereastr prezint o serie de opiuni care iniiaz


modalitatea de creare efectiv a eantionului. Sistemul ne ntreab dac dorim s
crem acum eantionul (Do you want to draw a sample?). Putem alege
crearea eantionului, selectnd Yes, situaie n care vom avea posibilitatea de
generare a tuturor stadiilor, alegnd All din lista derulant sau crearea
eantionului doar pentru un anumit stadiu, prin selectarea numrului acestuia.
Stadiile pot fi generate doar n ordine. Prin urmare, nu putem crea stadiul 3 n
condiiile n care nu au fost executate stadiile 1 i 2.
Seciunea What type of seed value do you want to use? permite
stabilirea valorii de iniializare pentru generatorul de numere aleatoare. Putem
alege ntre un numr oarecare, generat automat de computer (selectnd A
randomly chosen number) sau putem include o valoare n caseta de text
Custom value, n situaia n care se dorete reproducerea caracteristicilor
eantionului.
Cele dou casete de bifare permit tratarea cazurilor n care lipsesc
informaii la nivelul unor elemente i accelerarea procesului de generare a
eantionului. Bifarea primei casete are ca efect includerea ntr-o categorie
11
separat a unitilor cu date lips, iar debifarea acesteia ignor unitile care au
date lips.
Bifarea celei de a doua casete are ca efect accelerarea procesului de
generare a eantionului, n condiiile n care datele sunt deja sortate dup
valorile unei variabile de stratificare. Altminteri, SPSS va proceda la o nou
resortare, operaiune consumatoare de timp.
Fig. 12. Urmtoarea etap permite precizarea locului n care va fi salvat
eantionul i variabilele pe care acesta le genereaz. Putem opta ntre baza de
date curent (Active dataset), caz n care SPSS va selecta din baza de
eantionare unitile incluse n eantion i va calcula variabilele necesare doar
pentru acestea, putem alege o nou baz de date (New dataset), caz n care
SPSS va crea o nou baz de date, nesalvat, n care va include doar unitile
selectate n eantion sau putem crea o nou baz de date cu salvare (External
file), caz similar celui anterior, singura deosebire fiind aceea c SPSS va crea
un nou fiier pe disc i va salva eantionul. n cele dou situaii, va trebui s
precizm numele bazei de date, respectiv numele i calea ctre fiierul de date.

Figura 12 Pasul 5: Crearea eantionului. Opiuni de salvare

12
n aceast fereastr se mai afl dou elemente:
Fiierul n care vor fi salvate probabilitile cumulate (Joint
probabilities), n cazul n care se folosesc eantioane proporionale cu
mrimea i fr introducerea bilei n urn.
Regulile de selecie ale cazurilor (Case selection rules), n cazul n
care se genereaz un singur stadiu la un moment dat i se dorete salvarea
regulilor de selecie a cazurilor ntrun fiier separat. Opiunea este util la
construirea substadiilor. Am ales salvarea eantionului n aceeai baz de date,
pentru a putea urmri mai uor procesul de selecie. Apsarea butonului Next
permite trecerea la ultima etap a crerii eantionului.
Fig. 13. Ultima fereastr ne ntreab dac dorim s salvm designul
realizat n planul de eantionare i s crem efectiv eantionul (opiunea Save
the design to a plan and draw the sample) sau dorim s copiem ntr-un fiier
de sintax comenzile SPSS generate n urma prelucrrilor noastre (opiunea
Paste de syntax generated by the Wizard into a syntax window). Evident,
vom alege prima opiune i vom apsa apoi butonul Finish.

Figura 13 Pasul 6: Crearea eantionului

13
Dup cteva fraciuni de secund, SPSS procedeaz la crearea
eantionului i ne ofer o serie de informaii n fereastra de rezultate (Output).
Fig. 14. Primul tabel din fereastra de rezultate se refer la informaii
despre planul de eantionare. Observm c avem un singur stadiu, metoda de
selecie este simplu aleatorie fr reintroducerea bilei n urn, iar eantionul
conine un numr de 930 de cazuri. n acest tabel regsim informaii despre
noile variabile create n baza de date i, de asemenea, ne este furnizat fiierul
care conine planul de eantionare.
Tabelul planului de eantionare prezint i o serie de date utile n
proiectarea planului de analiz a eantionului. O variabil foarte important la
acest nivel este variabila SampleWeight_Final_, folosit n general la
proiectarea planului de analiz a eantionului ca variabil caracteristic a
reprezentativitii cazurilor n eantion.

Figura 14 Planul de eantionare

14
Fig. 15. Urmtorul tabel generat se refer la sumarul stadiului. Pentru
fiecare stadiu al eantionrii va fi generat un asemenea tabel, n care regsim
informaii despre unitile i proporiile selectate.

Figura 15 Sumarul stadiului

Observm din nou numele i calea fiierului de tip plan de eantionare.


n cazul nostru, am solicitat includerea unui numr de 930 de cazuri n eantion
(Requested), iar SPSS a reuit selectarea tuturor subiecilor (Actual). Procentul
solicitat a fost de 61,3%, procent atins n final de ctre SPSS.
Fig. 16. Trecnd la baza de date, observm la sfritul acesteia
variabilele nou create. Vom constata i selecia eantionului fcut de SPSS:
doar unitile incluse n eantion au valori pe ultimele 7 coloane din baza de
date (coloanele corespunztoare variabilelor noi).

Figura 16 Noile variabile incluse n baza de date

Lund fiecare subiect n parte, observm o probabilitate de includere


egal de 0,61, dintr-o populaie de 1517 la mrimea unui eantion de 930.

15
Variabila SampleWeight este generat automat i corespunde oarecum
frecvenei cu care fiecare caz selectat n eantion este reprezentat n populaia
general. Suma acestor valori se apropie foarte mult de dimensiunea populaiei.
ntr-adevr, avem 930 de cazuri, fiecare avnd valoarea 1,63 la aceast
variabil. Prin urmare, 930 1,63 = 1515,9 valoare apropiat de mrimea
populaiei. Aceast variabil este foarte important n procesul de analiz a
eantionului.
Dup selectarea subiecilor n eantion, urmeaz etapa de analiz a
eantionului n vederea identificrii proprietilor sale statistice.

2 ANALIZA EANTIONULUI

Crearea unui plan de analiz


reprezint prima etap n studiul
proprietilor unui eantion. Vom folosi din
nou meniul Analyze, apoi submeniul
Complex Samples i n final dm click pe
opiunea Prepare for Analysis

Figura 17 Meniul
planului de analiz

Accesarea acestei comenzi determin lansarea n execuie a unui nou


asistent (Wizard), specializat n proiectarea planului de analiz, al doilea plan ca
importan n studiul eantionului.
Planul de analiz, similar planului de eantionare, reprezint o
succesiune de pai, prin intermediul crora se creeaz premisele studiului
proprietilor unui eantion. Dup crearea unui eantion, este important analiza
acestuia n vederea determinrii caracteristicilor sale.

16
Fig. 18. Primul pas este reprezentat de specificarea fiierului n care va
fi salvat planul de analiz. Opiunea Create a plan file ne permite alegerea
locului i stabilirea numelui sub care va fi salvat planul de analiz. Putei tasta
calea complet sau putei folosi butonul Browse, prin intermediul cruia
vei alege locaia acestui fiier. Evident, va trebui s furnizai i un nume.
n cazul nostru, fiierul plan de analiz se numete Analiza.csaplan i
a fost salvat direct n directorul C:\. Observai diferena de extensie. Dac
planurile de eantionare aveau extensia .csplan, planul de analiz are extensia
.csaplan.

Figura 18 Pasul 1. Salvarea planului de analiz

Opiunea Edit a plan file v permite modificarea configuraiei unui


plan de analiz salvat anterior. Apsarea butonului Next determin trecerea la
urmtoarea etap.

17
Fig. 19. Noua fereastr conine mai multe elemente. n primul rnd va
trebui s specificm variabila caracteristic reprezentativitii eantionului.
Am accentuat deja importana variabilei Sample Weight. Dei n cazul unor
eantioane complexe aceast variabil poate lua diferite forme, n planul de
analiz vom include, de obicei, forma final a acesteia, forma n care SPSS
pondereaz de fapt toate stadiile. Este recomandabil introducerea n seciunea
Sample Weight a variabilei de tipul Final Sample Weight, variabil care,
de obicei, caracterizeaz cel mai bine eantionul. n cazul planurilor complexe,
s-ar putea include i alte variabile pariale de acest tip, dac se dorete
investigarea la nivelul stadiilor, a straturilor ori a clusterilor.

Figura 19 Pasul 2. Stabilirea variabilelor

Alte posibiliti cuprinse la acest nivel pot fi reprezentate de:


Variabilele de stratificare (Strata) va fi inclus variabila de
stratificare n condiiile unui eantion stratificat. Eantionul total va fi
18
reprezentat din ponderile pe care le au cazurile particulare din fiecare strat;
Variabilele cluster (Clusters) se include variabila care definete
clusterii, grupuri de uniti de observaie n cazul n care se analizeaz un
eantion pe clusteri;
Stage Label permite definirea unei etichete a stadiului de analiz,
similar procesului de creare a planului de eantionare.
Apsarea butonului Next determin trecerea la alegerea metodei de
estimare.

Figura 20 Pasul 2. Alegerea metodei de estimare

Fig. 20. Alegerea metodei de estimare permite specificarea doar a tipului


de selecie utilizat. n funcie de modul de proiectare a eantionului, putei opta
pentru metoda seleciei repetate -cu introducerea bilei n urn (WR), n care
nu vor fi incluse corecii pentru eantioane provenite din populaii finite la
estimarea varianei. Forarea includerii acestor corecii se realizeaz prin bifarea
casetei FPC care se activeaz la alegerea acestei opiuni.
Metoda seleciei nerepetate - fr reintroducerea bilei n urn (WOR)

19
poate fi selectat n cazul eantioanelor cu probabilitate egal de selecie i fr
nlocuire equal WOR. Aceast metod include coreciile pentru populaii
finite i pleac de la supoziia conform creia unitile au fost selectate cu o
probabilitate egal.
Metoda unequal WOR folosete i ea coreciile de populaie finit,
dar pleac de la supoziia c selecia unitilor din populaie s-a realizat cu o
probabilitate inegal. n general, metoda se folosete n cazul unor eantioane
nealeatorii.
Eantionul nostru a fost creat fr reincluderea bilei n urn i cu o
probabilitate egal, prin urmare vom alege opiunea a doua.
Fig. 21. Apsarea butonului Next v permite s specificai
probabilitile de includere sau mrimea populaiei la nivelul stadiului curent.
Aceste dimensiuni pot fi fixe sau pot varia la nivelul straturilor. Aceast etap
este valabil doar dac anterior ai ales opiunea WOR cu probabiliti egale.

Figura 21 Pasul 2. Alegerea dimensiunii


Folosind caseta de derulare Units putei preciza dimensiunea exact a
populaiei sau probabilitatea cu care elementele au fost extrase. n primul caz,

20
putem introduce n caseta de text Value cifra 1517, valoare ce reprezint
dimensiunea exact a populaiei sau 0,61, probabilitatea de includere. Am
preferat, n exemplul nostru, prima variant. Utilizarea acestei seciuni
presupune o singur valoare aplicat tuturor straturilor.
O alt variant o reprezint opiunea Unequal values for strata, care
se activeaz numai n situaia definirii anterioare a unei variabile de stratificare.
Caseta care se deschide la apsarea butonului Define permite stabilirea
valorilor pentru fiecare strat.
Ultima opiune, Read values from variable, ne permite includerea
unei variabile numerice care conine valorile pentru fiecare strat.

Figura 22 Pasul 2. Sumarul planului

Fig. 22. Similar planului de eantionare, urmtoarea fereastr prezint


un sumar al planului de analiz i ne permite construirea unor noi stadii.

21
Fig. 23. Ultimul ecran ne invit s salvm planul de analiz creat sau s
copiem sintaxa ntr-o fereastr de comenzi SPSS, ntr-un mod identic cu planul
de eantionare.

Figura 23 Pasul 3. Salvarea planului de analiz

Un plan de analiz salvat va putea fi utilizat n vederea investigrii


proprietilor eantionului. La apsarea butonului Finish, planul de analiz va
fi salvat, iar n fereastra de rezultate va fi redat structura acestuia.

3 INVESTIGAREA PROPRIETILOR EANTIONULUI

SPSS pune la dispoziie mai multe metode de investigare a unui


eantion. Vom ncepe cu dou proceduri ce implic statistici univariate:
Meniul Frequencies determin constituirea tabelelor de
frecvene pentru variabilele selectate i afiarea statisticilor de tip univariat.
Procedura estimeaz frecvenele eantionului i erorile standard, intervalele de
ncredere, coeficienii de variaie i alte statistici utile studiului unui eantion;
Meniul Descriptives produce de asemenea statistici univariate de
tipul celor menionate, existnd i posibilitatea analizei dup subgrupuri.

22
Figura 24 Analiza eantionului

Accesarea primului meniu, Frequencies (fig. 24), determin


afiarea primului ecran necesar analizei prin care urmeaz s alegem planul de
eantionare dorit.
23
Figura 25 Alegerea planului de eantionare

Fig. 25. Toate operaiile din aceast etap impun anumite specificaii de
analiz coninute n planul de eantionare. n seciunea Plan, caseta de text
File, vom putea tasta calea ctre planul de eantionare sau vom putea utiliza
butonul Browse n vederea navigrii ctre locaia ce conine acest fiier.
n cazul n care probabilitile de includere ale elementelor n eantion
nu sunt egale, situaie des ntlnit n cadrul eantionrii stratificate sau al
eantionrii pe clusteri, va trebui s specificm fiierul n care s-au precizat
aceste probabiliti, utiliznd seciunea Joint Probabilities. Astfel, putem
alege aceste probabiliti dintr-o variabil din baza de date, dintr-o alt baz de
date sau dintr-un alt tip de fiier.
Trecerea la analiza efectiv se face prin apsarea butonului Continue.

24
Figura 26 Stabilirea variabilelor de interes

Fig. 26. Va aprea o fereastr care permite stabilirea variabilei pe care


dorim s o analizm. Variabilele folosite pot fi doar variabile categoriale, situate
la un nivel de msur nominal sau ordinal.
n partea stng a ferestrei se afl seciunea Variables, o list care
conine toate variabilele din baza de date. Lista Frequency Tables permite
includerea variabilelor pentru care dorim s calculm tabele de frecven.
n exemplul nostru, vom dori analiza eantionului sub aspectul genului.
Vom transfera, aadar, aceast variabil n lista Frequency Tables, prin
utilizarea butonului de transfer.
Lista Subpopulations permite includerea unei alte variabile
categoriale, n condiiile n care am realizat, spre exemplu, un eantion
stratificat. Nu este cazul nostru, ns, dac am fi dorit s analizm
reprezentativitatea genului n funcie de mediul de provenien (rural vs. urban),
am fi inclus aceast ultim variabil n lista Subpopulations. n aceast
situaie, SPSS ar fi analizat separat brbaii i femeile, n funcie de mediul lor
25
de provenien.
Un buton deosebit de important este butonul Statistics.... Apsarea
acestuia determin posibilitatea stabilirii indicatorilor statistici ce vor fi
calculai.

Figura 27 Stabilirea indicatorilor statistici

Fig. 27. Exist destul de multe opiuni n cadrul acestei noi ferestre.
Seciunea Cells permite afiarea informaiilor legate de populaia int
din care a fost extras eantionul. Vor fi afiate date referitoare la dimensiunea
populaiei sub form de frecvene absolute, prin bifarea casetei Population
size i sub form de frecvene relative (procente), bifnd caseta Table
percent.
Seciunea Statistics permite configurarea indicatorilor statistici
asociai dimensiunii populaiei sau a procentului din populaie, astfel:
Prin bifarea casetei Standard error, vom calcula eroarea standard
a estimrii;
Caseta Confidence interval permite stabilirea intervalului de
ncredere a estimrii n baza nivelului specificat. n mod normal, intervalul de
ncredere l vom stabili la 95% (caseta de text Level%);
Caseta Coefficient of variation comunic programului calculul
coeficientului de variaie a estimrii, sub form de proporii;
Caseta Unweighted count permite afiarea numrului de elemente
26
folosit n realizarea estimrii. Cu alte cuvinte, dimensiunea eantionului extras;
Caseta Design effect permite calculul varianei estimrii.
Indicatorul exprim proporia de varian a eantionului comparat cu variana
unui eantion simplu aleator. Coeficientul nu este folosit n cazul eantioanelor
simplu aleatore n acest caz fiind ntotdeauna 1 , ci doar n cazul
eantioanelor mai complexe. Cu ct valoarea este mai deprtat de unu, cu att
efectul este mai mare i deci variana este mai mare;
Caseta Square root of design effect reprezint rdcina ptrat din
variana estimrii (un fel de abatere standard dac v mai aducei aminte), fiind
o msur standard a efectului i avnd acelai mod de interpretare;
Caseta Cumulative values calculeaz frecvena cumulat a
populaiei int, avnd aceeai semnificaie ca orice frecven cumulat.
Caseta Test of equal cell proportions permite calculul a dou teste
statistice: testul 2 i testul de probabilitate a proporiilor.
Fr a intra n amnunte, menionm c ambele teste pornesc de la
ipoteza nul c toate categoriile unei variabile au frecvene egale. Testele ne
permit s verificm dac exist diferene semnificative ntre frecvenele
categoriilor variabilei (n cazul nostru, dac frecvena brbailor este
semnificativ mai mare sau semnificativ mai mic n comparaie cu frecvena
femeilor).
Pentru exerciiul nostru am comunicat programului SPSS s afieze
frecvena absolut i relativ a populaiei int (casetele Population size i
Table percent), s calculeze eroarea standard a estimrii, intervalul de
ncredere i doar demonstrativ mrimea efectului i s afieze mrimea
eantionului (casetele Standard error, Confidence interval la un nivel de
95%, Unweighted count i Design effect).
Apsnd butonul Continue, revenim la fereastra iniial.
Un alt buton prezent este butonul Missing Values, prin apsarea
cruia vom putea stabili modul de tratare a cazurilor lips.

27
Figura 28 Tratarea cazurilor lips

Fig. 28. n seciunea Tables, putem stabili ce cazuri vor fi incluse n


analiz. Opiunea implicit este Use all variable data n care vor fi analizate
doar valorile valide la nivelul fiecrei variabile. Spre exemplu, dac analizm
variabila gen biologic, SPSS va urmri s existe valori valide doar la nivelul
acestei variabile, fr a fi preocupat dac exist valori valide la alte variabile.
Opiunea Use consistent case base este ns mult mai restrictiv.
Trebuie s existe valori la nivelul tuturor variabilelor analizate pentru ca
subiectul respectiv s fie luat n considerare. De exemplu, dac analizm
variabilele gen biologic i mediu de provenien, un subiect trebuie s aib
scoruri valide la ambele variabile, chiar dac este analizat doar variabila gen
biologic. Un subiect care are un scor valid la gen biologic, dar nu are date la
mediul de provenien, va fi exclus din analiz.
Seciunea Categorical design variables determin, n cazul
variabilelor categoriale, dac valorile lips vor fi tratate ca fiind sau ca nefiind
valide.
Practic, nu este nevoie s intervenim n aceast fereastr dect extrem de
rar i n cazul unor planuri de eantionare complexe. Apsarea butonului
Continue va determina, i n acest caz, ntoarcerea la fereastra iniial.
Lansarea efectiv a analizei datelor se face prin apsarea butonului
OK. n cteva fraciuni de secund, va fi afiat un tabel n fereastra de
rezultate, tabel care va conine exact datele solicitate.
28
Figura 29 Rezultatele analizei eantionului

Fig. 29. Capul de tabel conine numele variabilei de interes i denumirea


indicatorilor calculai. Primul rnd se refer la frecvenele absolute ale
populaiei int, iar al doilea rnd la frecvenele relative. Observm c datele
noastre au fost mprite pe cele dou categorii ale variabilei de interes brbai
i femei.
A doua coloan (Estimate) exprim frecvenele absolute i relative ale
populaiei int, estimat n baza eantionului. Aceste elemente nu reprezint
date reale, ci date estimate din eantion. Nu putem avea un numr de 662,26
brbai i 854,74 femei. Observm ns c dimensiunea total a populaiei int
estimate (1517 subieci) este egal cu populaia int real. Exprimat procentual,
eantionul nostru estimeaz o populaie compus din 43,7% brbai i 56,3%
femei.
Urmtoarea coloan (Standard Error) se refer la eroarea standard a
estimrii, exprimat att n form brut, ct i n form procentual. Eantionul
nostru estimeaz populaia int cu o eroare standard de 15,35 brbai i 15,35
femei (aproximativ 15 subieci pentru fiecare categorie, cifrele reprezentnd din
nou o abstraciune). Acest indicator devine mai clar dac urmrim forma
procentual. Iat c eroarea estimrii este de 1% att n cazul brbailor, ct i n
cazul femeilor, care, la un nivel de ncredere de 95%, ne poate determina s
afirmm c avem un eantion reprezentativ sub aspectul sexului.
Urmeaz dou coloane ale intervalului de ncredere. n baza erorii
standard, eantionul estimeaz practic o populaie int format dintrun numr
de 632,12 pn la 692,39 brbai i de la 824,60 pn la 884,87 femei. Cu alte
cuvinte, compoziia populaiei int estimat de eantion este format din 41,7%
29
pn la 45,7% brbai i 54,3% pn la 58,3% femei. Undeva ntre aceste limite
putem gsi populaia int real estimat de eantion.
Coloana Design Effect are evident valoarea 1, deoarece am lucrat cu un
eantion simplu aleator.
Ultima coloan indic dimensiunea i compoziia eantionului
(Unweighted Count). Dup cum tiam deja, eantionul are un numr de 930 de
cazuri, iar din punctul de vedere al sexului avem 406 brbai i 524 femei. Acest
eantion estimeaz reprezentativ populaia int la o eroare de doar 1% i la un
nivel de ncredere de 95%. Suntem n faa unui eantion reprezentativ, acest
lucru fiind demonstrat prin analiza efectuat.
Am analizat o variabil de interes situat la nivel nominal (sexul). Cum
procedm ns, dac avem o variabil de interes la un nivel scalar, de exemplu
vrsta? Analiza frecvenelor nu ne ajut prea mult. Abordm a doua metod
propus i anume analiza descriptiv. Paii sunt identici, exist ns o serie de
metode statistice uor diferite.

Figura 30 Analiza variabilei de interes de tip scalar


30
Dup lansarea procedeului de analiz (Analyze Complex sample
Descriptives) i alegerea planului de eantionare prin apelarea meniului
Descriptives, includem, similar procesului anterior, variabila de interes. n
cazul nostru, am ales o variabil scalar, vrsta subiecilor (fig. 30). Apsarea
butonului Statistics determin apariia unui ecran uor diferit n comparaie
cu analiza frecvenelor (fig. 31).

Figura 31 Stabilirea indicatorilor statistici

Diferena rezid n seciunea Summaries prin intermediul creia


putem estima mediile i sumele variabilelor int. n cazul n care media
populaiei este cunoscut (uneori se folosete media teoretic), putem folosi
testele t Student de comparaie ntre media populaiei i media unui eantion
pentru verificarea existenei unei diferene semnificative ntre medii.
Celelalte opiuni ale acestei ferestre au fost discutate anterior.
Executarea procedurii de analiz determin afiarea n fereastra de
rezultate a unui alt tabel:

31
Figura 32 Rezultatele analizei eantionului

n acest caz, nu mai avem de a face cu estimri ale frecvenelor, ci cu


estimri ale mediilor, variabila analizat fiind o variabil continu. Iat c
eantionul nostru estimeaz o medie a populaiei de 46,33 de ani cu o eroare
standard de 0,36 ani. Media real a populaiei se gsete undeva ntre 45,60 i
47,05 ani. Eantionul este foarte omogen sub aspectul vrstei, dup cum rezult
din coeficientul de variaie de 0,008, eterogenitatea fiind n jurul valorii de
0,8%. ntr-adevr, eantionul de 930 de persoane estimeaz populaia int de
1517 persoane, ns. cu o eroare standard mare. nsui intervalul de ncredere
de 1,45 ani (47,05 45,60) este edificator n acest sens. Este greu s vorbim
despre o reprezentativitate a acestui eantion sub aspectul vrstei subiecilor.

32

S-ar putea să vă placă și