SPSS Iii

X.
OPERAIUNI EXECUTATE ASUPRA VARIABILELOR I BAZELOR DE DATE

Complexitatea i varietatea calculelor statistice din programu SPSS sunt amplificate de numeroasele faciliti de lucru n cadrul bazelor de date. O parte din ele sunt ntlnite i n diverse programe, altele sunt specifice. Pentru a trece n revist aceste faciliti ni s-a prut mai simplu de a prezenta meniuri ntregi de comenzi cu precizarea c nu vom detalia toate utilitile specifice; vom detalia doar acele aspecte pe care le considerm fundamentale sau oricum sunt mai des ntlnite. Vom ncepe cu meniul Data care este compus din urmtoarele submeniuri:
5. Insert Cases - ajut la inserarea unor noi cazuri (linii orizontale). Dac celula activ este plasat pe un anumit rnd atunci va apare un nou rnd imediat deasupra acestuia. Se poate apela i la plasarea mausului pe rndul respectiv i clic dreapta sau direct de pa bara su instrumente acionnd butonul . 6. Go to Case - se poate indica un anumit caz din baz pentru a se ajunge imediat la acesta. 7. Sort Cases - ajut la sortarea (ordonarea) valorilor seriei dup valorile dintr-una sau mai multe variabile. Aici un exemplu de reordonare a bazei dup valorile cresctoare din variabila age:
1. Define Variable Properties - ajut la schimbri de nume sau atribute ale variabilelor din Data Editor. Dup ce am trecut o variabil din coloana din stnga n dreapta se va deschide fereastra care poart chiar numele submeniului, fereastr n care avem o descriere amnunit a variabilei. Aici putem face i schimbrile pe care le considerm necesare. Dac Data Editor nu conine o baz de date submeniul nu poate fi activ. 2. Copy Data Properties - ajut la transferul datelor ntre diverse baze de date 3. Define Dates - ajut la definirea datelor calendaristice mai ales pentru lucrul cu serii de timp 4. Insert Variable - ajut la inserarea unei noi variabile n baza de date. S presupunem c celula activ dintr-o baz de date este poziionalt pe o coloan (variabil): ca n situaia de mai jos. Dup activarea comenzii n partea dreapt va apare o nou variabil care trebuie definit (aceeai operaie putea fi setat dac ne opream cu mausul pe numele variabilei maritalclic dreapta i alegeam Insert Variable sau direct de pe bara de instrumente cu butonul ):
8. Transpose - ajut la inversarea coloanelor cu liniile din baza de date. Variabilele neselectate vor fi pierdute! 9. Restructure - ajut la transformri complexe n interiorul bazelor de date. Sunt trei opiuni: restructurarea anumitor variabile n cazuri, restructurarea unor cazuri n variabile sau inversarea ntrecazuri i variabile tuturor datelor. 10. Merge files - ajut la unirea mai multor date din baze diferite. S presupunem c am aplicat un chestionar n oraul X i apoi acelai chestionar n oraul Z. Datele respective sunt n baze diferite dei au acelai numr de variabile. Reunirea ntr-o singur baz se face plecnd de la una dintre ele (baza1) la care se adaug cea de a doua baz. S presupunem c am construit o baz cu doar zece cazuri la care vom aduga alte 10 cazuri din cealalt baz : Vom aciona comenzile Data Merge Files Add Cases iar dup ce vom selecta noua baz se va deschide urmtoarea fereastr. S presupunem c n noua baz variabila religie a fost scris greit relig.
157
158
n aceast fereastr variabilele cu semnul (*) fac parte din baza iniial iar cele cu semnul (+) din baza adugat. Numele celei de-a doua variabile poate fi schimbat din butonul Rename sau pot fi selectate ambele i trecute n partea dreapt cu butonul Pair. Butonul Paste este consevarea lucrului n limbaj sintax. Dup OK rezult:
Noua baz (baza2) cuprinde acum toate cele 20 de cazuri iar numele acesteia este cel al primei baze de la care s-a plecat. O putem salva n aceast form FileSave as...
Dup ce am salvat noua baz (sortat!) am formulat comenzile DataMerge FileAdd Variables i dup OK observm c noua variabil a intrat n prima baz. S presupunem c n cea de a doua baz aveam numai cinci observaii dup cum urmeaz: Comanda Merge Files ajut i la conectarea cu alte baze de date care au variabile diferite. S presupunem c avem prima baz cu cele 10 cazuri i n alt baz de date avem situaia respectivilor subieci privind numrul de copii. Se observ c subiecii au aceleai numere de identificare dar nu sunt n ordine. Aplnd la Sort Cases dup variabila id rezult:
Aceast nou baz va trebui s fie sortat ascendent dup variabila id deoarece cazurile nu sunt n ordine. Dup sortare, salvm fiierul. Baza de date de la care se va pleca este baza1 din exemplul precedent. Dup ce am deschis aceast baz vom parcurge DataMerge FilesAdd Variable i va apare urmtoarea fereastr:
159
160
Iniial variabila id se afla n coloana din stnga (Excluded Variables) dar a fost desemnat drept key variable dup setarea opiunii Match Case....Both files provide cases. Se observ c valorile din baza extern s-au ataat n baza de plecare pentru cazurile corespunztoare.
Practic au aprut n final toate varibilele dar acolo unde au fost mai puine observaii s-au salvat doar acele date. Obs. 1. Dup ce au fost luate toate setrile nainte de OK se poate da comanda Paste care salveaz n limbaj sintax comenzile de pn acum ntr-un fiier separat care poate fi salvat i folosit alt dat.
Se observ c n baza iniil a aprut o nou variabil care atribuie fiecrei categorii valoarea taxelor respective. Practic apar toate variabilele din cele dou fiiere iar criteriul de alipire rmne alocare unor valori-perechi. Obs. 3. Opiunea Working Data File is keyed table o vom alege dac drumul parcurs este invers: de la ultima baz cu cele trei cazuri la baza mare: deci baza de plecare (Working Data File) va da criteriul de alipire a bazelor. Obs. 4. Operaiile de alipire a bazelor de date trebuie s respecte condiiile: trebuie s existe n ambele baze o variabil comun dup care se face alipirea; trebuie o atenie sporit la variabilele care au acelai nume i care nu sunt criterii de alipire; variabilele trebui8e sortate ambele n acelai sens nainte de a fi alipite.
Obs. 2. Exist i alte dou opiuni n fereastra de mai nainte: External file is keyed table i Working Data File is keyed table. S presupunem c n localitatea X n funcie de religie cetenii trebuie s plteasc o tax anual exprimat n sute de mii de lei astfel: Se cere ca n baza2 unde sunt nregistrai 20 de subieci s se ataeze fiecruia dup religia proprie taxa pe care o va plti. Practic trebuie s reunim baza2 cu aceasta din urm. Pentru nceput ambele baze vor fi sortate ascendent dup variabila religie i vor fi salvate n aceast form. Apoi vom deschide baza2 i vom urma comenzile Data Merge File Add Variable dup care vom seta opiunea External file is keyed table, iar variabila cheie este religia:
IX.1. Agregarea datelor

Uneori este nevoie de a sintetiza anumite informaii despre valorile dintr-o baz de date grupndu-le dup o serie de categorii care sunt specifice unei variabile alese. S lum de exemplu baza de date Cars.sav:
161
162
n aceast baz de date sunt diverse informaii despre autoturisme: cilindree (variabila engine), puterea motorului (horse), greutate (weight), acceleraie (accel), an de fabricaie (year). Plecnd de la aceast baz de date dorim s obinem pentru toate aceste caracteristici mrimi medii sau alte mrimi, grupate dup anii de fabricaie. Pentru aceasta vom apela comenzile DataAggregate dup care va apare fereastra urmtoare:
Dup ce vom da OK trebuie s cutm i s deschidem noul fiier creat de ctre program i care se afl de obicei n Program filesSPSS. Noua baz de date este urmtoarea: Se observ categoriile generate de ctre variabila year i pentru fiecare categorie (an de fabricaie) sunt calculate mediile respective. Pentru accel sunt specificate doar valorile maxime. Ultima variabil conine numrul de cazuri din fiecare categorie. Se pot apoi face analize plecnd de la aceste date.
Se impun unele precizri privind aceast fereastr: - variabila n funcie de care se vor face calcule separate o trecem n rubrica Break Variable - variabilele asupra crora se vor face calculele se trec n cea de a doua rubric iar operaiile n sine sunt opionale i se pot alege din butonul Function: Dup cum se vede pot fi alese diverse modaliti de calcul de la principalele valori statistice la specificarea anumitor valori statistice (prima, ultima etc.), la numrul de cazuri, la precizarea procentajelor mai mari/mai mici fa de o anumit valoare sau cele dintr-un interval sau dinafara acestuia, la precizare unui fragment din date ntre anumite limite precizate. - opiunea Save number of cases...va introduce o nou variabil care contorizeaz numrul de cazuri din fiecare categorie - opiunea Create new data file va indica o nou baz de date care va fi salvat de program i n care vom avea rezultatele agregrii. Din butonul File putem s denumim baza respectiv! Pentru acest caz vom lsa denumirea aggr.sav - opiunea Replace Working data file va elimina datele din baza curent!
9. Split File - comand des utilizat care permite analizarea diverselor valori statistice pentru grupuri ntregi de subieci generate tocmai de categoriile din variabile. S presupunem c n baza GSS93 subset.sav dorim s cunoatem n care dintre regiunile americane respondenii au n medie, un nivel de educaie mai mare. Conform variabilei region4 subiecii din anchet sunt divizai n 4 regiuni iar variabila educ reprezint anii de studiu pentru o coal ncheiat. Vom apela la comanda DataSplit file pentru a produce filtrarea bazei conform unui criteriu impus: Variabila dup care vom mpri subiecii n grupuri distincte region4 este trecut n dreapta iar ca variant de vizualizare a rezultatelor am ales opiunea Compare Groups. Dup OK n Data Editor va apare n colul din dreapta jos meniunea Split File On care ne avertizeaz c baza este filtrat i orice rezultat viitor va fi definit de filtrarea respectiv:
Urmeaz s calculm media anilor de studiu cu comenzile Analyze Descriptive StatisticsFrequencies iar din meniul Statistics vom alege doar media (mean). Rezultatul n Output este urmtorul:
163
164
Statistics Highest Year of School Completed . N Valid Missing Mean Northeast N Valid Missing Mean Midwest N Valid Missing Mean South N Valid Missing Mean West N Valid Missing Mean 741 2 13.07 136 0 13.39 221 0 13.18 248 0 12.30 150 2 13.56
Dup cum se observ din tabelul alturat cei ce nu au declarat regiunea au n medie 13.07 ani de coal. Media cea mai mare se ntlnete printre cei din vestul SUA. Restul comparaiilor sunt evidente. Obs. Dac trebuie s facem alte analize statistice care nu privesc mprirea populaiei pe categorii atunci trebuie s eliminm comenzile anterioare astfel: DataSplit FileResetOK sau prin alegerea opiunii Analyze all cases...
Din acest moment orice calcule statistice efectuate vor ine cont de selectarea efectuat. La final respectiva setare trebuie anulat dac se intenioneaz alte calcule. Rezultatul final este urmtorul:
Statistics Credei c n ara noastr lucrurile merg ntr-o direcie bun sau ntr-o direcie greit? N Valid 970 Missing 0
Numrul de cazuri valide sunt doar respondenii de sex masculin dintr-un eantion de 2100 de persoane. Rezultatele finale sunt urmtoarele:
Obs: rezultatele pot fi afiate i separat dac setam opiunea Organize output by groups. 10. Select Cases - dintr-o baz de date se pot analiza anumite cazuri selectate dup un criteriu necesar cercetrii statistice. Procedura urmeaz comenzile DataSelect Cases. S presupunem c n baza de date BOP_mai/2003_Gallup.sav dorim s vedem care sunt opiunile persoanelor de sex masculine privind direcia n care se ndreapt Romnia: este vorba de variabilele sex0 (genul respondenilor) i a1 (direcia n care se ndreapt ara noastr). Prima variabil este variabila criteriu cu valorile: 1. masculin, 2.feminin. Vom selecta doar respondenii de sex masculin prin If condition is satisfiedIf:
Credei c n ara noastr lucrurile merg ntr-o direcie bun sau ntr-o direcie greit? Frequency 383 511 69 7 970 Percent 39.5 52.7 7.1 .7 100.0 Valid Percent 39.5 52.7 7.1 .7 100.0 Cumulative Percent 39.5 92.2 99.3 100.0
Valid
direcia este bun direcia este greit NS NR Total
Obs: Metodele de selecie sunt foarte diverse: selectarea unui eantion din baz putndu-se indica n mod precis ct la sut din cazuri vor fi selectate (Random sample of cases), selecie n funcie de o variabil temporal sau dup anumite ranguri care se pot preciza (Based on time or case range), selecie n funcie de o variabil filtru care dac ia valoarea nul atunci cazul respectiv se elimin (Use filtre variable). Exist i posibilitatea ca liniile neselectate s fie terse din baz ns aceast operaie trebuie fcut cu precauie. n cadrul ferestrei Select Cases If se pot folosi butoanele cu cifre sau semne matematice pentru condiiile impuse i chiar o serie de funcii care sunt listate n tabelul din dreapta ferestrei. Acestea pot fi: funcii aritmetice (ABS[modul], LN[log. natural], SQRT [radical], etc,) funcii statistice (MEAN, SUM, VARIANCE etc.) funcii de lucru cu variabile nominale, funcii pentru date temporale, funcii logice, funcii referitoare la valorile lips etc. O parte din aceste funcii le regsim si n programul Excel. 11. Weight Cases - ajut la ponderarea observaiilor adic la repetarea unei observaii de un anumit numr de ori. Aceast operaie este necesar n cazurile n care anumite subgrupuri din populaie nu sunt bine reprezentate n eantion. De exemplu proporia de tineri ntre 18-25 de ani este de 30% n eantion iar n populaia mare este de 25%. Eantionarea poate introduce distorsiuni i de aceea se cere ponderarea acelor cazuri care sunt supra/sub-evaluate. Se definete o variabil de ponderare conform creia se vor aplica respectivele ponderri. Procedura impus de ctre program pleac de la o
Se va deschide o nou fereastr n care am pus condiia de selecie: sex0=1. Dup Continue se va reveni n baza de date care are acum, n dreapta jos precizarea Filter On. n baza de date vor apare n partea dreapt o serie de tieturi semn c liniile ce cpurind sexul feminin au fost - pentru moment - eliminate.
165
166
ponderare egal a fiecrui caz ca i cum ansele de intra n eantion sunt egale (eantionare simpl aleatoare). Aceste anse sunt ns inegale atunci cnd eantionul ine cont de o anumit stratificare. Folosirea comenzii Weight Cases se dovedete foarte util n ancheta prin chestionar atunci cnd ponderm subgrupuri dintr-un eantion deoarece acestea nu reflect proporiile dintr-o populaie extins. De exemplu T. Rotariu i P. Ilu (1997; 191-192) propun dou strategii: eliminarea aleatorie a unor chestionare din grupul supra-reprezentat n eantion sau duplicare unui anumit numr de chestionare n grupul mai puin reprezentat n eantion. Evident, autorii atrag atenia asupra riscului ca aceste operaiuni s introduc n mod nepermis alte erori pe lng cele provenite din neconcordanele dintre statisticile oficiale i populaia real. Prudena n acest caz trebuie combinat cu verificri suplimentare din perspectiva altor variabile. O alt surs de eroare pe care au constatat-o cei doi autori se refer la modalitile de alegere a unei persoane din cadrul unei gospodrii n cazul unei anchete prin chestionar (op. cit., 147148). ntr-adevr ansele de a fi ales n eantion pentru un adult de exemplu scad odat cu mrimea familiei: dac familia e format dintr-o singur persoan ansa de a fi aleas este 100% iar dac sunt dou persoane ansa scade la 50% etc. Se recomand n acest caz ca familia cu dou persoane s aib o ans dubl de a fi extras, apoi familia cu trei persoane s aib o ans tripl etc. Autorii recomad n acest caz ca la final s se fac o ponderare dup mrimea familiei din care provine respondentul. Iat un exemplu a unei astfel de ponderri dat de ctre M. Rteiu et al. (2003, vol. 2; 132-134). Analiza autorilor se oprete la baza de date gss98.sav i care se poate gsi pe Internet. n respectiva baz de date se poate identifica variabila adults (care reprezint numrul de persoane cu vrsta de peste 18 ani din familie). Simpla analiz statistic a acestei variabile d urmtoarea configuraie:
HOUSEHOLD MEMBERS 18 YRS AND OLDER Cumulative Percent 34.2 87.5 97.2 99.5 99.9 100.0 100.0
Ca de obicei noua variabil se va gsi n baz pe ultima poziie:
Abia acum poate fi apelat procedura weight cases cu variabila wadults drept criteriu: Odat activat butonul OK se va observa c pe bara de jos va apare specificarea de rigoare:
La final distribuia persoanelor cu vrste de peste 18 ani va fi urmtoarea:

HOUSEHOLD MEMBERS 18 YRS AND OLDER Cumulative Percent 18.8 77.5 93.5 98.5 99.7 99.9 100.0
Frequency Valid 1 2 3 4 5 6 7 Total Missing Total NA 967 1510 275 64 13 1 1 2831 1 2832
Percent 34.1 53.3 9.7 2.3 .5 .0 .0 100.0 .0 100.0
Valid Percent 34.2 53.3 9.7 2.3 .5 .0 .0 100.0
HOUSEHOLD MEMBERS 18 YRS AND OLDER
Valid
1 967 967 2 1510 3020 3 275 825 4 64 256 5 13 65 6 1 6 7 1 7 Total 2831 5146 1.81773225 1 Missing NA 2832 Total
n acest context se pune problema acordrii unor anse mai mari de apariie a persoanelor din familii mai mari. Pentru aceasta se calculeaz un anumit coeficient de multiplicare i a crui valoare este n acest caz egal cu 1,818. Aceast valoare s-a obinut conform algoritmului din tabelul de mai jos. Se observ c se caut un eantion n care se cumuleaz produsele de genul 1x967, 2x1510, 3x275 etc., care justific ansele acordate dup aprecierile de mai nainte. La final suma de 5146 a fost mprit la 2831 i a rezultat coeficientul de 1,818 (rotunjit). n continuare autorii introduc o nou variabil numit wadults creat cu ajutorul sub-meniului Compute prin ponderarea variabilei adults cu acest coeficient:
Frequency Valid 1 2 3 4 5 6 7 Total 532 1661 454 141 36 3 4 2831
Percent 18.8 58.7 16.0 5.0 1.3 .1 .1 100.0
Valid Percent 18.8 58.7 16.0 5.0 1.3 .1 .1 100.0
Obs. Se poate reveni la situaia iniial a bazei de date alegndu-se opiunea Do not weight cases. Obs. Am folosit pentru afiarea n Output un alt model pentru tabele. Acest model se poate seta urmnd meniul EditOptionPivot Tables:
167
168
Vom face acum referiri la meniul Transform care cuprinde urmtoarele submeniuri : O prim comand foarte des utilizat este Compute care permite crearea de noi variabile prin impunerea unor calcule diverse. S presupunem de exemplu c n baza2 de mai nainte (vezi nceputul capitolului) dorim s crem o nou variabil venit care sa fie n fapt suma veniturilor din cele dou variabile venit1 si venit2. Pentru aceasta vom deschide fereastra urmtoare :
Ws3 (Avei relaii / cunotine pe care v putei baza la primarie?) Ws4 (Avei relaii / cunotine pe care v putei baza la poliie?). Aceste variabile sunt dihotomice (valori 1=da ; 0=nu) i pe baza lor s=ar putea construi un indice al reelei de sprijin care reprezint de fapt nsumarea valorilor 1 din toate variabilele considerate (vom considera missing valorile 9=nu tiu/nu rspund). Apelm apoi fereastra dup TransformCount : n aceast fereastr am definit variabila int reea (reea de sprijin) ca o combinaie de cele patru variabile amintite mai nainte. Din butonul Define Values putem indica valoarea care este cuantificat (n cazul nostru 1=da). Noua varibil va fi inclus n baz i putem s obinem tabelul frecvenelor:
Se observ c am definit variabila int venit ca suma venit1+venit2. n baza de date va apare o noua variabil :
retea de sprijin
Pot fi folosite funciile pentru diverse calcule. De exemplu suma de mai nainte putea fi calculat i cu Sum (v1,v2). Pot fi puse i anumite condiii din butonul If. Obs. 1: Se pot folosi direct semnele unor operaii din butoanele aflate n fereastra Compute variables. Astfel observm prezena unor operatori logici precum &, | , ~ (care semnific simbolurile i, sau, nu logice) ; semnele matematice < > (mai mic, mai mare), < = => (mai mic sau egal, mai mare sau egal), ~= (diferit de) i ** (ridicarea la putere) ; semnele uzuale pentru diferite operaii matematice etc. Obs. 2: dac n variabila venit1 sau venit2 exist o valoare lips atunci i n variabila final va apare o valoare lips ! Obs. 3: funcia ANY seamn cu comanda Select Cases. De exemplu dac formulm expresia ANY (vrsta, 21,23) atunci ntr-o variabil separat vor apare valorile 1 pentru cazurile care respect condiia pus i 0 pentru cele care nu respect condiia. Comanda Count ajut la cuantificri diverse. De exemplu s folosim baza de date Bop 2003 Gallup. Am ales din aceast baz urmtoarele variabile: Ws1 (Avei relaii / cunotine pe care v putei baza n caz de boal pentru consultaie, tratament, intervenie chirurgical?) Ws2 (Avei relaii / cunotine pe care v putei baza la tribunal, notar, avocat?)
Valid ,00 1,00 2,00 3,00 4,00 Total
Frequency 1143 531 188 134 104 2100
Cumulative Percent Valid Percent Percent 54,4 54,4 54,4 25,3 25,3 79,7 9,0 9,0 88,7 6,4 6,4 95,0 5,0 5,0 100,0 100,0 100,0
Dintr-un total de 2100 de subieci mai bine de jumtate (1143) nu au nici o persoan n reeaua de sprijin. 531 dintre respondeni gsesc un sprijin doar ntr-un nod al reelei i numai 104 (adic 5%) se pot baza pe reele complete de sprijin.
O alt opiune din meniul Transform se refer la recodificarea variabilelor. Aceast opiune are dou variante : recodificarea n variabila de lucru sau recodificarea ntr-o alt variabil. Vom detalia n cele ce urmeaz doar opiunea Into Different Variables S presupunem c n aceeai baz de mai sus dorim s aflm situaia rspunsurilor privind direcia n care se ndreapt Romnia dar n funcie de urmtoarele segmente de vrst : 18-25 ani; 26-40 ani ; 41-60 ; 61 i peste. n baz exist deja variabila vrsta0 n care sunt consemnate vrstele respondenilor dar acestea trebuie regrupate n cele patru categorii de mai sus:
169
170
n aceast fereastr am trecut variabila vrsta0 n dreapta i pentru c vrem s obinem o alt variabil numit virsta1 vom da clic pe Change pentru a se consemna noul nume. Recodificarea efectiv se face din butonul Old and New Values Se va deschide o nou fereastr : Aceast fereastr se compune din dou coloane distincte : una referitoare la vechile valori (Old Values) i cealalt la noile valori (New Values). Prima indicaie se refer la faptul c vechile valori cuprinse ntre 18 i 25 vor primi n noua variabil valoarea 1. Vom da apoi Add pentru a fi consemnat schimbarea. Se
Evident subiecii etichetai cu 1 sunt cei cu vrste cuprinse ntre 18 i 25 de ani etc . Revenind la ntrebarea de start putem analiza rspunsurile la ntrebarea privind direcia spre care se ndreapt Romnia dup ce vom filtra baza dup aceast nou variabil cu comenzile cunoscute DataSplit fileCompare groups variabila de filtrare fiind virsta1. Rezultatele finale sunt urmtoarele:
Credei c n ara noastr lucrurile merg ntr-o direcie bun sau ntr-o direcie greit? VIRSTA1 1,00 Frequency 140 202 36 1 379 155 240 31 6 432 269 404 57 3 733 186 272 91 7 556 Percent 36,9 53,3 9,5 ,3 100,0 35,9 55,6 7,2 1,4 100,0 36,7 55,1 7,8 ,4 100,0 33,5 48,9 16,4 1,3 100,0
Valid
2,00
Valid
3,00
Valid
4,00
Valid
direcia direcia NS NR Total direcia direcia NS NR Total direcia direcia NS NR Total direcia direcia NS NR Total
este bun este greit
este bun este greit
este bun este greit
Se observ o constan a procentelor celor care cred c direcia este greit : 53,3% dintre cei cu vrste ntre 18-25 ani apoi 55,6% dintre cei cu vrste ntre 26 i 40 de ani
este bun este greit
continu la fel cu celelalte cazuri. La ultima indicaie fereastra arat astfel :

Pentru ultima opiune se selecteaz varianta 61 through highest. Se observ c n aceast fereastr sunt multe alte opiuni de transformare de exemplu cnd sunt valori lips sau cnd variabilele sunt nominale. Dup Continue i OK va apare n baz la sfritul acesteia noua variabil pe care o putem eticheta i defini ca i o variabil ordinal.
Obs. 1: spre deosebire de comanda Recode into different variable cealalt opiune Recode into same variable produce transformri n variabila nsi fr a creea o nou variabil. Tocmai de aceea odat salvate respectivele transformri, se pot pierde definitiv valorile din baz. Obs. 2: o operaie asemntoare se poate realiza cu comanda Transform Categorize Variables. Se poate alege numrul de categorii (n cazul nostru am ales tot 4) dar programul va selecta cazurile dup cuartile : distribuia a 25%, 50%,75% din cazuri. Rezultatele sunt urmtoarele :
NTILES of VARSTA0 Frequency 518 530 518 534 2100 Percent 24,7 25,2 24,7 25,4 100,0 Valid Percent 24,7 25,2 24,7 25,4 100,0 Cumulative Percent 24,7 49,9 74,6 100,0
Valid
1 2 3 4 Total
De data aceasta programul a stabilit alte categorii de vrste : 1=18-31 ani ; 2=32-46 ani ; 3=47-61 ; 4= peste 61.
Obs. 3: uneori se poate utiliza recodarea automat a datelor (Transform Automatic recode). Se recomand mai ales cnd categoriile nu sunt numeroase iar dac sunt alfanumerice trebuie inut cont de ordinea lor alfabetic. Se nelege de aici c foarte util poate fi recodarea automat a unor variabile calitative cu valori alfanumerice. S presupunem c am fcut o cercetare n mai multe firme, din diverse domenii de activitate din marile orae ale rii :
171
172
n aceast baz variabila oras este alfanumeric i putem hotr s o recodificm n sensul c fiecare localitate va primi un cod numeric, n ordine cresctoare sau descresctoare prin apelarea comenzilor TransformAutomatic recode. Se va obine astfel o nou variabil numit oras1 iar ordinea codurilor va fi ascendent:
Se observ c ordinea de acordare a rangurilor este cresctoare (se ncepe cu smallest value) iar opiunea Display summary table dac este activat vor apare n output precizri privind operaiunea efectuat. Se obine dup OK situaia din stnga dup care putem aplica o dubl sortare dup sex i venit:
Obs. 4 : meniul Transform mai conine proceduri legate de nlocuirea valorilor lips (Replace Missing Values) proceduri legate de generarea numerelor aleatoare (Random number seed) care ne ajut atunci cnd selectm aleator cazuri pentru sub-eantioane. Aceste proceduri sunt legate de condiiile pe care le impunem i n submeniul DataSelect casesRandom sample of cases. O alt comand util este i Rank cases prin intermediul creia putem ordona valorile dintr-o variabil eventual dup valori din alte variabile. S presupunem c ntr-o firm oarecare situaia veniturilor este urmtoarea: Observm c avem un numr de 10 angajai cu sexul 1. masculin i 2. feminin iar n coloana a treia este specificat venitul fiecruia n RON. Se cere atribuirea unui nivel anumit (rank) fiecrui angajat i eventual ordonarea acestora dup variabilele sex i venit. Vom alege comenzile TransformRank Cases iar ca i criteriu de categorizare variabila sex dup cum urmeaz:
Se observ ordonarea veniturilor n noua variabil rvenit dndu-se rangurile specifice. Doi subieci cu valori identice au rangul obinut ca medie aritmetic din dou poziii consecutive. Un alt meniu este Utilities i a crui principal sarcin este aceea de a da informaii privind variabilele din baza de date. Astfel prin comenzile Utilities Variables sau Utilities File Info putem afla o caracterizare complet a variabilelor. Alte dou submeniuri Define Sets i Use sets pot fi de ajutor pentru a alege doar un numr restrns de variabile pentru analiz. Acest lucru este util mai ales cnd bayele de date conin un numr foarte mare de variabile. De exemplu baza de date gss98.sav conine peste 3000 de variabile! Iat un exemplu de lucru plecnd de la baza de date bd.bop2004.sav pe care o gsim pe site-ul www.osf.ro:
173
174
n acest exemplu variabilele id reprezint codul chestionarului a1 se refer la direcia n care se ndreapt Romnia, a12 se refer la aprecierea vieii de ctre respondeni fa de acum un an, a13 se refer la aprecierea de ctre respondeni a modului cum vor trai peste un an iar a9 se refer la gradul de mulumire fa de propria sntate. Ne propunem s lucrm ntr-o baz separat numai cu aceste variabile. Dup comennzile UtilitiesDefine sets vom numi noua baz format din respectivele variabile cu numele APRECIERI dup care e necesar comanda Add set. Pentru utilizarea noii baze este nevoie de comenzile Utilities Use sets prilej cu care se trece n partea dreapt noua baz i precizarea c vor fi folosite numai noile variabile:
X. APLICAII PRACTICE
Toate aceste operaiuni nu duc la apariia unei noi baze ci doar la selectarea anumitor variabile. Dac dorim s facem analize statistice diverse, de exemplu, meniul AnalyzeFrequencies va reine doar respectivele variabile: Pentru a se reveni la situaia iniial este necesar sa trecem n partea dreapt specificarea ALLVARIABLES din fereastra de mai nainte.
1. Introducei diverse date n programul Excel, salvai aplicaia i ncercai s o deschidei n cadrul programului SPSS (EXIST i programe care ajut la transferul bazelor de date, cum ar fi Statransfer). Observai diferenele. 2. Creai o baz de date n care s introducei la alegere diverse variabile: cantitative, ordinale, nominale. 3. Calculai principalele valori statistice pentru variabila cantitativ introdus. Deprindei itemii din fereastra Statistics. 4. Reprezentai grafic variabilele cantitativ i ordinal pe care le-ai definit. Cu ajutorul opiunilor din fereastra Chart1 modificai graficele respective dup diverse caracteristici. 5. Calculai cotele z pentru o variabil cantitativ. Comentai valorile obinute. 6. Formulai diverse ipoteze statistice. Analizai posibilitile de eroare. Analizai posibilitatea interveniei altor variabile. 7. Alegei din bazele programului diverse variabile cantitative.Testai normalitatea distribuiei acestor variabile. 8. Calculai corelaia dintre diverse variabile cantitative. Verificai dac toate condiiile impuse sunt ndeplinite. Interpretai rezultatele. 9. Calculai corelaia non-parametric pentru variabile liber alese din diverse baze. Verificai i interpretai rezultatele. 10. Deschidei baza de date World 95. Calculai diverse corelaii pariale pentru variabile din aceast baz. Comentai rezultatele. 11. Deschidei baza de date GSS 93 subset. Identificai variabile nominale i calculai asocierea acestora. Interpretai rezultatele. 12. Deschidei baza de date GSS93 subset. Selectai doar cazurile respondenilor cstorii . Pentru acetia calculai media anilor de studiu. 13. Folosii n diverse aplicaii comenzile Select Cases i Split File. 14. Formai dou baze de date i apoi ncercai s le alipii ntr-o singur baz. 15. Folosii comanda Aggregate n diverse aplicaii. 16. Folosii comanda TransformCompute pentru a genera noi variabile. 17. Transformai diverse variabile prin cele dou opiuni : Into Different Variables, Into same variable. Sesizai diferenele dintre cele dou proceduri. 18. Selectai n diverse baze de date eantioane de cazuri dup dimensiunile dorite. Calculai pentru aceste eantioane principalele valori statistice i comparai aceste valori cu cele din eantioanele de plecare. 19. Cercetai i alte baze de date pe care le gsii pe Internet. Analizai modul lor de construcie i eventuale analize statistice. Facei aplicaiile de mai sus i pentru aceste baze. 20. Analizai principalele baze de date rezultate din cercetrile din Romnia (de exemplu pe site-ul www.osf.ro). Facei un raport de cercetare plecnd de la una din aceste baze.
175
176
21. Urmrii site-urile marilor institute de sondaj Insomar, Metro Media Transilvania, CURS, IMAS, Gallup etc. Cutai baze de date, rapoarte de cercetare etc. pentru aprofundarea cunotinelor din volumul de fa.
BIBLIOGRAFIE GENERALA
Partea I. Elemente de informatic W. Wang, R.C. Parker, Microsoft Office 2000 pentru Windows, Ed. Tehnic, Bucureti, 2001 R. Holmes, E. Nelson, Word 6 pentru Windows, Ed. Teora, Bucureti, 1995 D. Gookin, Word 2000 pentru Windows, Ed. Tehnic, 2000 T. Reisner, 10 minute Excel pentru Windows 95, Ed. Teora, Bucureti, 1997 G. Courtner, A. Marquis, Iniiere n Microsoft Office 2000, Ed. All, 1999 S. Kovacs, Excel 97. Ghid de utilizare, Ed. Albatros, Cluj-Napoca, ed. IV, 2000 H. D. Guy, Word 7 sub Windows 95, Ed. Teora, 1998 D. M. Balan, G. Balan, Cristina Turcu, Cornel Turcu, Microsoft Excel pentru Windows 95, Ed. Promedia Plus, Cluj-Napoca, 1996 N. Gherghel, Cum s scriem un articol tiinific, Ed. tiinific, Bucureti, 1996 S. C. Andronescu, Tehnica scrierii academice, Ed. Fundaiei Romnia de mine, Bucureti, 1997 H. Maissonneuve, Redactarea tiinific, Edit Dan, Iai, 1999 S. Chelcea, Metodologia elaborrii unei lucrri tiinifice, Comunicare.ro, Bucureti, 2003 A. erbnescu, Cum se scrie un text, Ed. Polirom, Iai, 2001 G. Ferreol, N. Flageul, Metode i tehnici de exprimare scris i oral, Ed. Polirom, Iai, 1998 U. Eco, Cum se face o tez de licen, Ed. Pontica, Constana, 2000. C. Coman, Informatic aplicat, Ed. Infomarket, Braov, 2003 Partea II. Analiza datelor V. Trebici (coord.), Mic enciclopedie de statistic, Ed. tiinific i Enciclopedic, bucureti 1985 Al. Brbat, Statistic social, Ed. Didactic i Pedagogic, Bucureti, 1972 P. Ardilly, Les techniques de sondage, d. Technip, Paris, 1994 T. Rotariu (coord.), Metode statistice aplicate n tiinele sociale, Ed. Polirom, Iai, 1999 D. Porojan, Statistica i teoria sondajului, Ed. ansa SRL, Bucureti, 1993 M. Colin et alii, Initiation aux mthodes quantitatives en sciences humaines, Ed. Gatan Morin, Montreal, 1995 A. Novak, Statistic social aplicat, Ed. Hyperion XXI, Bucureti, 1995 A. Novak, Sondajul de opinie, Ed. Oscar Print, Bucureti, 1998 T. Andrei, S. Stancu, Statistic, Ed. All, Bucureti, 1995 H. Zetterberg , On Theory and Verification In Sociology, The Bedminster Press, 1965
177
178
I. Moineagu, I. Negur, V. Urseanu, Statistica, Ed. tiinific i enciclopedic, Bucureti, 1976 *** O. Lungu, Ghid introductiv pentru SPSS 10.0, Ed. SC Erota SRL, Iai, 2001 C. Coman, N. Medianu, Statistic social. Aplicaii SPSS, Ed. Infomarket, Braov, 2002 C. Coman, N. Medianu, Statistic social, Teorie i aplicaii, Ed. Infomarket, Ed. Infomarket, Braov, 2003 N. Petcu, Statistic. Teorie i aplicaii n SPSS, Ed. Infomarket, Braov, 2003 E. Jaba, A. Grama, Analiza statistic cu SPSS sub Windows, Polirom, Iai, 2004 E. Babbie, F. Halley, Data Analysis Using SPSS for Windows, Pine Forge Press, 1995 D. Cramer, Fundamental Statistics for Social Research: Step-By-Step Calculations and Computer Techniques Using Spss for Windows, Routledge, 1998 C. Dancey, J. Reidy, Statistics without Maths for Psychology, Prentice Hall, 2001 A. Field, Discovering Statistics Using SPSS for Windows : Advanced Techniques for Beginners, Sage Publications,2000 M. Norusis, SPSSx Advanced Statistics Guide, McGraw Hill, 1995 M. Rteiu, L. Marina, V. Millea, C. Filipescu, Informatic aplicat n tiinele sociale, 2 vol., Alba Iulia, 2003. M. Popa, Statistic psihologic cu aplicaii SPSS, Ed. Univesitii Bucureti, 2004 www.spss.ro www.osf.ro www.mmt.ro ***, SPSS Base 9.0 Application guide.
179

SPSS Iii

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

SPSS Iii

Încărcat de

Drepturi de autor:

Formate disponibile

X.

OPERAIUNI EXECUTATE ASUPRA VARIABILELOR I BAZELOR DE DATE

IX.1. Agregarea datelor

direcia este bun direcia este greit NS NR Total

Ca de obicei noua variabil se va gsi n baz pe ultima poziie:

La final distribuia persoanelor cu vrste de peste 18 ani va fi urmtoarea:

Percent 34.1 53.3 9.7 2.3 .5 .0 .0 100.0 .0 100.0

Valid Percent 34.2 53.3 9.7 2.3 .5 .0 .0 100.0

HOUSEHOLD MEMBERS 18 YRS AND OLDER

Frequency Valid 1 2 3 4 5 6 7 Total 532 1661 454 141 36 3 4 2831

Percent 18.8 58.7 16.0 5.0 1.3 .1 .1 100.0

Valid Percent 18.8 58.7 16.0 5.0 1.3 .1 .1 100.0

Valid ,00 1,00 2,00 3,00 4,00 Total

Frequency 1143 531 188 134 104 2100

este bun este greit

este bun este greit

este bun este greit

este bun este greit

continu la fel cu celelalte cazuri. La ultima indicaie fereastra arat astfel :

S-ar putea să vă placă și