Introducerea datelor se face ntr-o fereastr asemntoare cu cea din Excel.
Practic avem de a face cu un tabel n care pe fiecare linie vom introduce valorile observaiilor pentru fiecare individ din populaie, pe fiecare coloan avnd cte o variabil. Primul pas va fi s ne definim variabilele. n SPSS variantele anterioare lui .! vom selecta din meniu Data->Define Variable, sau dac ne po"iionm pe rndul "ero #unde scrie var$ %i apsm butonul din dreapta a mousului vom obine Define Variable. &om obine o fereastr n care vom da un nume variabilei #unul care s ne permit recunoa%terea acesteia cu ct mai mici probleme, de preferin unul ct mai caracteristic sau unul le'at de modul de obinere a datelor, cum ar fi () * rspunsul la prima ntrebare dintr-un c+estionar sau a) * rspunsul la prima ntrebare din prima seciune a c+estionarului$. Type se refer la tipul variabilei %i de lun'imea sa. ,ele mai importante sunt de tip numeric sau cele de tip strin' sau text #%ir de caractere$. n ca"ul folosirii unor instrumente cu un 'rad mare de structurare #cum ar fi un c+estionar cu ntrebri nc+ise$ %i ca urmare a unei codificri numerice a rspunsurilor vom avea rspunsuri de tip numeric. -e exemplu, pentru variabila sex vom avea ) .feminin/ %i 0 .masculin/. 1un'imea trebuie specificat n numr de caractere pentru cele de tip strin' sau lun'ime %i numr de "ecimale pentru cele numerice2 Missing Values se folose%te pentru a %ti ce valori lipsesc %i vor fi excluse din prelucrri2 Column Format se refer la dimensiunea coloanei %i la alinierea valorilor din fiecare celul a coloanei. -imensiunea coloanei poate fi modificat %i cu a3utorul mouseului2 Labels ne permite introducerea unei descrieri sumare a variabilei #Label - etic+et$ %i a variabilelor de rspuns posibile. Se introduce valoarea, apoi denumirea variantei de rspuns %i se apas butonul Add #n ca"ul nostru am introdus valoarea ), label feminin, apoi am trecut la varianta 0$. -ac se dore%te modificarea unei valori de3a introduse avem la dispo"iie butonul Change. -up ce am nc+eiat de adu'at toate variantele, prin apsarea butonului Continue vom reveni n fereastra de definire a variabilei. Introducerea datelor se face foarte simplu4 vom introduce fie valoarea existent #dac avem de a face cu o variabil numeric * de exemplu pentru vrst vom introduce numrul de ani, n ca"ul n care nu am definit variabila n alt mod$ sau cea definit #n ca"ul nostru ) pentru un respondent de sex feminin$. Pentru variabilele n ca"ul crora avem mai multe variante de rspuns ne a3ut la introducere s avem n fa codificarea rspunsurilor #)- sex feminin$, dar %i s avem din meniu View->Value Labels selectat. n acest ca" introducem ) pentru variabila sex %i ne va aprea feminin, posibilitatea erorilor la introducere reducndu-se simitor. -up ce am introdus date vom obine pe ecran ceva asemntor cu ce avem mai sus. -ac se ntmpl s uitm s introducem o variabil sau un subiect #un ca"$ tot din meniul Data vom avea opiunile nsert Variable care va introduce o coloan nou naintea celei curente sau nsert Case, care va insera un rnd nou naintea celui pe care ne aflm. n SPSS .! sau )!.! avem dou ferestre, cea de date %i cea de variabile, care ne permite s ne definim variabilele, cu acelea%i opiuni de completat ca mai sus. n plus apare Measurement, n care vom specifica la ce nivel se msoar variabila #nominal, interval, sau s!ale, care se aplic variabilelor numerice, continui$. -up ce am introdus toate datele s-ar putea s fim interesai s obinem o nou codificare a variabilelor. n exemplul de mai sus am introdus variabila studii sub forma numrului de ani petrecui n %coal, mai acceptabil pentru prelucrri statistice mai .tari/. Pentru un tabel de asociere vom avea nevoie ns de o reducere a numrului de valori posibile, de preferin n cate'orii cunoscute, cum ar fi primare, 'imna"iale, liceu, facultate. Pentru aceasta nu trebuie neaprat s lum din nou toate observaiile %i s le introducem ntr-o nou variabil ci putem s construim automat o nou variabil. -in Transform->"e!ode->nto Different Variables ale'em variabila care trebuie recodificat #n ca"ul nostru studii$ %i vom da un nume %i o etic+et variabilei. ,u a3utorul butonului f putem pune %i anumite condiii. 5utonul #ld and $ew Values ne permite s construim al'oritmul de transformare. n partea din stn'a definim valoarea vec+ii variabile, ori ca valoare discret, ori n ca"ul n care nu a fost introdus ori a fost definit ca valoare lips #cum ar fi pentru cei crora nu li se aplic ntrebarea$, ori pentru un interval de valori sau toate valorile mai mici sau mai mari dect o valoare care se introduce. n dreapta se stabile%te valoarea corespun"toare %i se apas butonul Add. n ca"ul nostru am ales ca ) din variabila nou, s!oala, s repre"inte ntre ) %i 6 ani de %coal. Procedura se repet de cte ori este nevoie. -ac se dore%te modificarea unei valori de3a introduse avem la dispo"iie butonul Change. 6.7.0. Proceduri de prelucrare statistic &om pre"enta n continuare cteva proceduri simple de prelucrare statistic. Pentru cei care vor s cunoasc mai multe metode sau mai mult despre anumite metode #inclusiv teoria$ exist o serie de cri de statistic care pot fi folosite. 8 recomandare este 9raian :otariu #coordonator$, ;abriel 5descu, Irina ,ulic, Elemer <e"ei, ,ornelia <ure%an, Metode Statistice Aplicate n tiinele Sociale, Polirom, 0!!!. 8 noiune fundamental a statisticii este cea de fre!ven%&. =ceasta ne spune ci indivi"i din populaie au o anumit caracteristic. Pe ln' frecvenele absolute mai avem %i frecvene relative, calculate prin raportarea frecvenelor absolute la numrul total al indivi"ilor din populaie. <ai exist %i frecvene cumulate, care se calculea" pentru variabile ordinale, de interval %i de rapoarte. Ele ne arat ci indivi"i #ce proporie dintre ei$ se 'sesc pn la o anumit valoare. Pentru a calcula frecvena variabilei birt+>r #rata natalitii$ din fi%ierul ?orld@ vom ale'e din meniu 'tatisti!s->'ummari(e->Fre)uen!ies. -in fereastra obinuta vom selecta prin dublu-clicA sau cu a3utorul butonului din mi3loc #cel cu un triun'+i$ variabilele care ne interesea". 5utonul 'tatisti!s ne permite s selectm ce alte prelucrri statistice vom face asupra datelor. Exist mai multe tipuri de prelucrri care ne pot arta cum sunt distribuite valorile n populaia noastr. *er!entile Values ne arat cum sunt distribuite valorile pe 'rupuri4 ori pe cuartile #care este valoarea maxim pentru fiecare sfert din populaie$, pentru un numr stabilit de 'rupuri e'ale sau pentru anumite procente din populaie. Dispersion se refer la dispersie #sau mpr%tiere$. Se pot calcula abaterea standard, variana, intervalul n care se situea" valorile, valoarea minim %i maxim, media erorii standard. Central Tenden!y4 Indicatori de po"iie cum ar fi media aritmetic, mediana #valoarea caracteristic individului cu ran'ul mediu$, modul #valoarea cel mai des ntlnit$, suma. Distribution calculea" indicatorii de form, oblicitatea sau boltirea. 5utonul Charts ne permite s adu'm %i un 'rafic. -espre 'rafice vom discuta mai amnunit mai ncolo. :e"ultatul prelucrrii statistice va aprea ntr-o nou fereastr #ca %i n ca"ul lansrii unui nou pro'ram$, #utput navigator. =vem n aceast fereastr dou panouri4 n cel din stn'a ne sunt afi%ate prelucrrile solicitate, pe subcapitole, iar n cel din dreapta re"ultatele propriu-"ise. Bavi'area se poate face folosind panoul din dreapta, selectnd procedura dorit #ntr-un output putem 'rupa foarte multe prelucrri, care pot fi %i %terse cu tot cu re"ultate$ vom mer'e la re"ultate. 8utputul poate fi salvat pentru folosin ulterioar. &om avea pentru frecvenele noastre mai nti o parte de 'tatisti!s referitoare la prelucrrile dorite #vom avea media %i valorile celor trei pra'uri dintre sferturile din populaie$. 9ot de aici aflm c avem )! indivi"i #de fapt ri$ n populaie %i c nu avem valori lips. n continuare vom avea frecvenele4 att absolute #pe coloana Fre)uen!y$, ct %i relative #*er!ent dac includem %i valorile lips sau Valid *er!ent, dac le omitem$ sau cumulative. Procedura Des!riptives afi%ea" cteva dintre indicatorii de mai sus pentru mai multe variabile n acela%i tabel. n plus poate calcula %i valorile standardi"ate pentru acestea. Procedura +,plore ne poate afi%a statistici %i 'rafice fie pentru toate datele sau separat pentru anumite 'rupuri de ca"uri, tabele de frecven, teste de normalitate, varian %.a. Procedura Crosstabs produce tabele de asociere #recomandabil pentru variabilele de tip nominal %i ordinal$ %i ne furni"ea" 00 de teste %i de msuri pentru asociere. Structura tabelelor %i dac avem cate'oriile ordonate determin tipul de teste. n celule vom avea numrul de indivi"i care ndeplinesc combinaia de valori cerut. Se poate cere %i obinerea unor procenta3e pe rnduri sau pe coloane. <ai exist %i posibilitatea introducerii unor variabile de control. -e exemplu, pe datele din fi%ierul +mployee Data vom ncerca s vedem care este asocierea ntre sexul unei persoane %i tipul de funcie pe care-l ocup, verificnd dac nu cumva rasa influenea". Statisticile vor fi alese n funcie de tipul variabilei. -in tabel vom putea avea anumite indicaii despre posibilele relaii. -e exemplu putem vedea c fr s facem o clasificare dup ras, C!.)D dintre funcionari sunt femei %i E.D brbai %i, mai important, c 7.ED dintre femei sunt funcionare respectiv @C.6D dintre brbai. Se poate tra'e conclu"ia c o femeie este foarte posibil s fie funcionar dar n 'eneral nu exist o relaie semnificativ din punct de vedere statistic ntre postul ocupat %i sex. Pentru selectarea celei mai potrivite proceduri de anali" statistic, de un mare a3utor ne este 'tatisti!s Coa!h, care pe ba"a opiunilor noastre ne duce la procedura statistic cea mai potrivit. 1a nceput suntem ntrebai de scopul pe care dorim s-l atin'em. 8piunile sunt4 Sumarul, descrierea sau pre"entarea datelor2 &ariana %i distribuia datelor2 ,rearea rapoartelor 81=P #8nline =nalFtical Processin'$ care calculea" totaluri, medii %i alte statistici univariate pentru variabile continui pe una sau mai multe variabile de 'rupare2 ,ompararea mediilor2 Identificarea relaiilor semnificative ntre variabile2 Identificarea 'rupurilor de ca"uri similare2 Identificarea variabilelor similare2 &om pre"enta opiunile urmtoare pentru ca"ul n care am ales Identificarea relaiilor semnificative ntre variabile. Grmtorul pas este s specificm la ce nivel au fost msurate datele. n ca"ul n care am selectat date pe cate'orii #nominal sau ordinal$ vom fi du%i la procedura de asociere #!rosstabs$. -ac vom selecta #rdinal- ran.-order- or non-normal !ontinuous data vom a3un'e la procedura de corelaie bivariat. -ac selectm date continui, numerice #nivel de interval sau raport$ suntem ntrebai de numrul de variabile. Pentru dou variabile a3un'em la o corelaie bivariat, cnd avem tot dou, dar dorim s controlm efectul altor variabile, a3un'em la corelaii pariale, pentru trei variabile a3un'em la un 'rafic scatter tri-dimensional, iar pentru o variabil dependent %i dou sau mai multe variabile independente a3un'em la re'resie liniar. 6.7.E. ;rafice ;raficele pot fi 'site n meniul /raphs. ,teva dintre ele sunt clare4 0ar, Line, Area, *ie, 1igh-Low- 1istogram. -ac vrem s aflm din fi%ierul +mployee Data care este distribuia an'a3ailor dup sex %i ras vom ale'e /raphs->0ar, cu opiunea Clustered #ca s obinem o 'rupare$ %i vom ale'e variabila gender %i ca %i criteriu de 'rupare variabila minority. :e"ultatul va fi4 ,u ro%u vom avea procenta3ul de femeiHbrbai n rndul celor care nu aparin unei minoriti %i cu verde n ca"ul celor care aparin. Se poate observa c exist mai muli brbai n rndul minoritarilor. Gn tip interesant de 'rafic este '!atter, care ne permite repre"entarea unor variabile #de tip continuu$ ntr-un spaiu bi sau tri-dimensional. &arianta 'imple ne repre"int 'rafic dou variabile, Matri, la fel, dar ncercnd s surprind perec+ile de variabile, #verlay permite repre"entarea mai multor variabile, diferenierea fcndu-se prin culori, iar 2-D se folose%te pentru repre"entarea tridimensional a trei variabile. -ac dorim s repre"entm salariul n funcie de experien pentru cele trei tipuri de posturi putem folosi un 'imple '!atterplot cu opiunile de mai sus. :e"ultatul va fi un 'rafic n care este repre"entat fiecare dintre ca"urile existente, cu culori diferite, n funcie de tipul de munc depus4 <ana'er, ,ustodial #pa"$ %i ,lerical #funcionar$. Se observ c mana'erii c%ti' cel mai mult #ceea ce era %i de a%teptat$. Exist ns o relaie ntre c%ti'uri %i experienI &om putea observa ceva dac ncercm s editm 'raficul. =ceasta se face cu un dublu-clicA pe el %i vom obine o nou fereastr. n aceasta, selectnd Chart->#ptions %i selectnd Fit line- 'ubgroups vom obine o linie care ne va indica cum evoluea" c%ti'ul salarial n funcie de vec+ime pentru fiecare 'rup. Se poate observa c pentru mana'eri exist o relaie slab po"itiv, pentru pa"nici aproape c nu exist nici o relaie, iar pentru funcionari relaia este slab ne'ativ. -ac ncercam s facem acela%i lucru cu salariul fa de anii de educaie vom observa c obinem o relaie po"itiv destul de bun. :s( #adic : 0 $J!.7ECE ne indic faptul c 7E.CED din variaia salariului este explicat de nivelul de educaie #dac era ).!!, relaia era perfect$. Educational level (years) 22 20 18 16 14 12 10 8 6 C u r r e n t
s a l a r y 140000 120000 100000 80000 60000 40000 20000 0 Rsq = 0.4363 6.7.7 ,um putem folosi re"ultatele SPSS n alte aplicaii ,um spuneam, putem salva outputurile pentru folosire ulterioar. =vem posibilitatea s listm ori ntre' outputul, ori doar partea pe care am selectat-o sau s o trimitem prin e-mail. -atele n sine ar putea fi salvate n format EK,E1 sau -5L #ba" de date$ pentru alte prelucrri. 8rice element din output poate fi selectat cu a3utorul unui simplu clicA, copiat n clipboard #Copy sau Copy #b3e!ts$ %i inserat n o alt aplicaie #cum ar fi <icrosoft ?ord$ cu a3utorul comen"ii *aste. <ai avem posibilitatea exportrii n format M9<1 sau text. Gn 'rafic poate fi exportat n alt format. Pentru aceasta, dup un dublu-clicA intrm n fereastra '*'' Chart +ditor #unde putem modifica 'raficul$ de unde opiunea File->+,port Chart ne permite s-l salvm n formate cum ar fi 4indows Metafile #recunoscut de aplicaii 'en <icrosoft 8ffice$, sau n alte formate, cum ar fi 0itmap- Tagged mage File sau 5*/. 5utonul #ptions ne permite s setm modul de afi%are a ima'inii #dimensiune, numr de culori$ %i n anumite ca"uri dac ima'inea va fi comprimat. Chi-Square Tests 21.484 b 1 .000 1.61! 1 .000 22."81 1 .000 .000 .000 21.26 1 .000 100 #earson C$i%&quare Continuity Correction a 'i(eli$ood Ratio )is$er*s E+act ,est 'inear%by%'inear -ssociation . o/ 0alid Cases 0alue d/ -sy12. &i3. (2%sided) E+act &i3. (2%sided) E+act &i3. (1%sided) Co12uted only /or a 2+2 table a. 0 cells (.04) $ave e+2ected count less t$an !. ,$e 1ini1u1 e+2ected count is 18.24. b. 9estul ,+i-s(uare testea" asocierea dintre variabile fr s indice tria sau direcia relaiei. Be interesea" n principal Pearson c+i-s(uare, celelalte rnduri fiind alte msuri ale asocierii mai puin folosite6 "e(ultatul se tradu!e7 e,ist& o aso!iere 8ntre reu9ita la e,amen 9i 8nv&%at #cel dou variabile folosite$. Symmetric Measures ."3 .02 !.23 .000 100 5a11a 6rdinal by 6rdinal . o/ 0alid Cases 0alue -sy12. &td. Error a -22ro+. , b -22ro+. &i3. .ot assu1in3 t$e null $y2ot$esis. a. 7sin3 t$e asy12totic standard error assu1in3 t$e null $y2ot$esis. b. Pentru variabile ordinale putem folosi diferii coeficieni4 ;amma, Nendall 9au 5 %i ,, d al lui Somers. n exemplul de mai sus folosim ;amma, care poate lua valori ntre -) %i ). &alorile mai apropiate de "ero indic o relaie foarte slab sau inexisten, cel apropiate de ) n valoare absolut o relaie puternic, po"itiv sau ne'ativ. n exemplul de mai sus avem o relaie semnificativ, puternic po"itiv. =cest coeficient #ar trebui s fie mai mic dect !.!@$ ne arat c avem o asociere semnificativ invata * a promovat examenul Crosstabulation Count 41 " 48 21 31 !2 62 38 100 8- .7 invata ,otal 8- .7 a 2ro1ovat e+a1enul ,otal Pentru variabile nominale vom folosi 1ambda #care poate lua valori ntre ! %i )$. Test ore invatat 12 10 8 6 4 2 0 %2 n o t a
l a
e + a 1 e n 12 10 8 6 4 2 0 Rsq = 0."82" -ac ncercm s testm ipo"te"a conform creia reu%ita la examen #nota obinut$ este influenat de invat #numr de ore n care am nvat$ * pentru datele repre"entate n 'raficul de mai sus #de tip '!atter$ putem apela la :e'resia liniar. 8binem4 Model Summary .88! a ."83 .""2 1.0"0 9odel 1 R R &quare -d:usted R &quare &td. Error o/ t$e Esti1ate #redictors; (Constant)< ore invatat a. Ad3usted " ')uare ne arat ct din variaia variabilei dependente este datorat variaiei celei independente. ,u alte cuvinte, 66.0D din not este dat de numrul de ore de nvat. Goodness-of-fit measure of a linear model, sometimes called the coefficient of determination. It is the proportion of variation in the dependent variable explained by the regression model. It ranges in value from 0 to 1. Small values indicate that the model does not fit the data well. ANOVA b 88.060 1 88.060 "!.642 .000 a 24.448 21 1.164 112.!08 22 Re3ression Residual ,otal 9odel 1 &u1 o/ &quares d/ 9ean &quare ) &i3. #redictors; (Constant)< ore invatat a. 8e2endent 0ariable; nota la e+a1en b. Anova ne spune da!& relaia noastr este semnificativ #coloana 'ig6 trebuie s fie O!.!@$ his table summari!es the results of an analysis of variance. he " statistic is the regression mean s#uare $%S&' divided by the residual mean s#uare $%S('. )hen the " value is large and the significance level is small $typically smaller than 0.0* or 0.01' the null hypothesis can be re+ected. In other words, a small significance level indicates that the results probably are not due to random chance. Coeicients a 2.!" .406 6.402 .000 .6"" .0"8 .88! 8.6" .000 (Constant) ore invatat 9odel 1 = &td. Error 7nstandardi>ed Coe//icients =eta &tandardi >ed Coe//icien ts t &i3. 8e2endent 0ariable; nota la e+a1en a. 9abelul cu coeficieni ne spune care sunt coeficienii #5$ ai ecuaiei dreptei de re'resie. =stfel Bota la examen J 0.@6 P !.C66 x ore invatat. ,oeficienii standardi"ai ne spun #dac am avea mai multe variabile independente$, care are o mai mare influen asupra variabilei dependente. ,u ct 5eta este mai mare n valoare absolut, va avea o influen mai mare asupra variabilei dependente. -ac valoarea lui 5eta este ne'ativ, influena este ne'ativ. he unstandardi!ed coefficients are the coefficients of the estimated regression model. ,ften the independent variables are measures in different units. he standardi!ed coefficients or betas are an attempt to ma-e the regression coefficients more comparable. he t statistics can help you determine the relative importance of each variable in the model. he t statistics can help you determine the relative importance of each variable in the model. .s a guide regarding useful predictors, loo- for t values well below -/ or above 0/.