Sunteți pe pagina 1din 17

Introducerea datelor

Introducerea datelor se face ntr-o fereastr asemntoare cu cea din Excel.


Practic avem de a face cu un tabel n care pe fiecare linie vom introduce valorile
observaiilor pentru fiecare individ din populaie, pe fiecare coloan avnd cte o
variabil.
Primul pas va fi s ne definim variabilele. n SPSS variantele anterioare lui .!
vom selecta din meniu Data->Define Variable, sau dac ne po"iionm pe rndul "ero
#unde scrie var$ %i apsm butonul din dreapta a mousului vom obine Define Variable.
&om obine o fereastr n care vom da un nume variabilei #unul care s ne permit
recunoa%terea acesteia cu ct mai mici probleme, de preferin unul ct mai caracteristic
sau unul le'at de modul de obinere a datelor, cum ar fi () * rspunsul la prima ntrebare
dintr-un c+estionar sau a) * rspunsul la prima ntrebare din prima seciune a
c+estionarului$.
Type se refer la tipul variabilei %i de lun'imea sa. ,ele mai importante sunt de
tip numeric sau cele de tip strin' sau text #%ir de caractere$. n ca"ul folosirii unor
instrumente cu un 'rad mare de structurare #cum ar fi un c+estionar cu ntrebri nc+ise$
%i ca urmare a unei codificri numerice a rspunsurilor vom avea rspunsuri de tip
numeric. -e exemplu, pentru variabila sex vom avea ) .feminin/ %i 0 .masculin/.
1un'imea trebuie specificat n numr de caractere pentru cele de tip strin' sau lun'ime
%i numr de "ecimale pentru cele numerice2
Missing Values se folose%te pentru a %ti ce valori lipsesc %i vor fi excluse din
prelucrri2
Column Format se refer la dimensiunea coloanei %i la alinierea valorilor din
fiecare celul a coloanei. -imensiunea coloanei poate fi modificat %i cu a3utorul
mouseului2
Labels ne permite introducerea unei descrieri sumare a variabilei #Label -
etic+et$ %i a variabilelor de rspuns posibile. Se introduce valoarea, apoi denumirea
variantei de rspuns %i se apas butonul Add #n ca"ul nostru am introdus valoarea ),
label feminin, apoi am trecut la varianta 0$. -ac se dore%te modificarea unei valori de3a
introduse avem la dispo"iie butonul Change. -up ce am nc+eiat de adu'at toate
variantele, prin apsarea butonului Continue vom reveni n fereastra de definire a
variabilei.
Introducerea datelor se face foarte simplu4 vom introduce fie valoarea existent
#dac avem de a face cu o variabil numeric * de exemplu pentru vrst vom introduce
numrul de ani, n ca"ul n care nu am definit variabila n alt mod$ sau cea definit #n
ca"ul nostru ) pentru un respondent de sex feminin$.
Pentru variabilele n ca"ul crora avem mai multe variante de rspuns ne a3ut la
introducere s avem n fa codificarea rspunsurilor #)- sex feminin$, dar %i s avem din
meniu View->Value Labels selectat. n acest ca" introducem ) pentru variabila sex %i
ne va aprea feminin, posibilitatea erorilor la introducere reducndu-se simitor.
-up ce am introdus date vom obine pe ecran ceva asemntor cu ce avem mai
sus.
-ac se ntmpl s uitm s introducem o variabil sau un subiect #un ca"$ tot
din meniul Data vom avea opiunile nsert Variable care va introduce o coloan nou
naintea celei curente sau nsert Case, care va insera un rnd nou naintea celui pe care
ne aflm.
n SPSS .! sau )!.! avem dou ferestre, cea de date %i cea de variabile, care ne
permite s ne definim variabilele, cu acelea%i opiuni de completat ca mai sus. n plus
apare Measurement, n care vom specifica la ce nivel se msoar variabila #nominal,
interval, sau s!ale, care se aplic variabilelor numerice, continui$.
-up ce am introdus toate datele s-ar putea s fim interesai s obinem o nou
codificare a variabilelor. n exemplul de mai sus am introdus variabila studii sub forma
numrului de ani petrecui n %coal, mai acceptabil pentru prelucrri statistice mai
.tari/. Pentru un tabel de asociere vom avea nevoie ns de o reducere a numrului de
valori posibile, de preferin n cate'orii cunoscute, cum ar fi primare, 'imna"iale, liceu,
facultate. Pentru aceasta nu trebuie neaprat s lum din nou toate observaiile %i s le
introducem ntr-o nou variabil ci putem s construim automat o nou variabil.
-in Transform->"e!ode->nto Different Variables ale'em variabila care
trebuie recodificat #n ca"ul nostru studii$ %i vom da un nume %i o etic+et variabilei. ,u
a3utorul butonului f putem pune %i anumite condiii.
5utonul #ld and $ew Values ne permite s construim al'oritmul de
transformare.
n partea din stn'a definim valoarea vec+ii variabile, ori ca valoare discret, ori
n ca"ul n care nu a fost introdus ori a fost definit ca valoare lips #cum ar fi pentru cei
crora nu li se aplic ntrebarea$, ori pentru un interval de valori sau toate valorile mai
mici sau mai mari dect o valoare care se introduce. n dreapta se stabile%te valoarea
corespun"toare %i se apas butonul Add. n ca"ul nostru am ales ca ) din variabila nou,
s!oala, s repre"inte ntre ) %i 6 ani de %coal. Procedura se repet de cte ori este nevoie.
-ac se dore%te modificarea unei valori de3a introduse avem la dispo"iie butonul
Change.
6.7.0. Proceduri de prelucrare statistic
&om pre"enta n continuare cteva proceduri simple de prelucrare statistic.
Pentru cei care vor s cunoasc mai multe metode sau mai mult despre anumite
metode #inclusiv teoria$ exist o serie de cri de statistic care pot fi folosite. 8
recomandare este 9raian :otariu #coordonator$, ;abriel 5descu, Irina ,ulic, Elemer
<e"ei, ,ornelia <ure%an, Metode Statistice Aplicate n tiinele Sociale, Polirom, 0!!!.
8 noiune fundamental a statisticii este cea de fre!ven%&. =ceasta ne spune ci
indivi"i din populaie au o anumit caracteristic. Pe ln' frecvenele absolute mai avem
%i frecvene relative, calculate prin raportarea frecvenelor absolute la numrul total al
indivi"ilor din populaie. <ai exist %i frecvene cumulate, care se calculea" pentru
variabile ordinale, de interval %i de rapoarte. Ele ne arat ci indivi"i #ce proporie dintre
ei$ se 'sesc pn la o anumit valoare.
Pentru a calcula frecvena variabilei birt+>r #rata natalitii$ din fi%ierul ?orld@
vom ale'e din meniu 'tatisti!s->'ummari(e->Fre)uen!ies. -in fereastra obinuta vom
selecta prin dublu-clicA sau cu a3utorul butonului din mi3loc #cel cu un triun'+i$
variabilele care ne interesea".
5utonul 'tatisti!s ne permite s selectm ce alte prelucrri statistice vom face
asupra datelor.
Exist mai multe tipuri de prelucrri care ne pot arta cum sunt distribuite valorile
n populaia noastr.
*er!entile Values ne arat cum sunt distribuite valorile pe 'rupuri4 ori pe cuartile
#care este valoarea maxim pentru fiecare sfert din populaie$, pentru un numr stabilit de
'rupuri e'ale sau pentru anumite procente din populaie.
Dispersion se refer la dispersie #sau mpr%tiere$. Se pot calcula abaterea
standard, variana, intervalul n care se situea" valorile, valoarea minim %i maxim,
media erorii standard.
Central Tenden!y4 Indicatori de po"iie cum ar fi media aritmetic, mediana
#valoarea caracteristic individului cu ran'ul mediu$, modul #valoarea cel mai des
ntlnit$, suma.
Distribution calculea" indicatorii de form, oblicitatea sau boltirea.
5utonul Charts ne permite s adu'm %i un 'rafic. -espre 'rafice vom discuta
mai amnunit mai ncolo.
:e"ultatul prelucrrii statistice va aprea ntr-o nou fereastr #ca %i n ca"ul
lansrii unui nou pro'ram$, #utput navigator.
=vem n aceast fereastr dou panouri4 n cel din stn'a ne sunt afi%ate
prelucrrile solicitate, pe subcapitole, iar n cel din dreapta re"ultatele propriu-"ise.
Bavi'area se poate face folosind panoul din dreapta, selectnd procedura dorit #ntr-un
output putem 'rupa foarte multe prelucrri, care pot fi %i %terse cu tot cu re"ultate$ vom
mer'e la re"ultate. 8utputul poate fi salvat pentru folosin ulterioar.
&om avea pentru frecvenele noastre mai nti o parte de 'tatisti!s referitoare la
prelucrrile dorite #vom avea media %i valorile celor trei pra'uri dintre sferturile din
populaie$. 9ot de aici aflm c avem )! indivi"i #de fapt ri$ n populaie %i c nu avem
valori lips.
n continuare vom avea frecvenele4 att absolute #pe coloana Fre)uen!y$, ct %i
relative #*er!ent dac includem %i valorile lips sau Valid *er!ent, dac le omitem$ sau
cumulative.
Procedura Des!riptives afi%ea" cteva dintre indicatorii de mai sus pentru mai
multe variabile n acela%i tabel. n plus poate calcula %i valorile standardi"ate pentru
acestea.
Procedura +,plore ne poate afi%a statistici %i 'rafice fie pentru toate datele sau
separat pentru anumite 'rupuri de ca"uri, tabele de frecven, teste de normalitate,
varian %.a.
Procedura Crosstabs produce tabele de asociere #recomandabil pentru variabilele
de tip nominal %i ordinal$ %i ne furni"ea" 00 de teste %i de msuri pentru asociere.
Structura tabelelor %i dac avem cate'oriile ordonate determin tipul de teste. n celule
vom avea numrul de indivi"i care ndeplinesc combinaia de valori cerut. Se poate cere
%i obinerea unor procenta3e pe rnduri sau pe coloane. <ai exist %i posibilitatea
introducerii unor variabile de control.
-e exemplu, pe datele din fi%ierul +mployee Data vom ncerca s vedem care
este asocierea ntre sexul unei persoane %i tipul de funcie pe care-l ocup, verificnd dac
nu cumva rasa influenea".
Statisticile vor fi alese n funcie de tipul variabilei.
-in tabel vom putea avea anumite indicaii despre posibilele relaii. -e exemplu
putem vedea c fr s facem o clasificare dup ras, C!.)D dintre funcionari sunt femei
%i E.D brbai %i, mai important, c 7.ED dintre femei sunt funcionare respectiv
@C.6D dintre brbai. Se poate tra'e conclu"ia c o femeie este foarte posibil s fie
funcionar dar n 'eneral nu exist o relaie semnificativ din punct de vedere statistic
ntre postul ocupat %i sex.
Pentru selectarea celei mai potrivite proceduri de anali" statistic, de un mare
a3utor ne este 'tatisti!s Coa!h, care pe ba"a opiunilor noastre ne duce la procedura
statistic cea mai potrivit. 1a nceput suntem ntrebai de scopul pe care dorim s-l
atin'em. 8piunile sunt4
Sumarul, descrierea sau pre"entarea datelor2
&ariana %i distribuia datelor2
,rearea rapoartelor 81=P #8nline =nalFtical Processin'$ care calculea"
totaluri, medii %i alte statistici univariate pentru variabile continui pe una sau
mai multe variabile de 'rupare2
,ompararea mediilor2
Identificarea relaiilor semnificative ntre variabile2
Identificarea 'rupurilor de ca"uri similare2
Identificarea variabilelor similare2
&om pre"enta opiunile urmtoare pentru ca"ul n care am ales Identificarea
relaiilor semnificative ntre variabile.
Grmtorul pas este s specificm la ce nivel au fost msurate datele. n ca"ul n
care am selectat date pe cate'orii #nominal sau ordinal$ vom fi du%i la procedura de
asociere #!rosstabs$. -ac vom selecta #rdinal- ran.-order- or non-normal
!ontinuous data vom a3un'e la procedura de corelaie bivariat. -ac selectm date
continui, numerice #nivel de interval sau raport$ suntem ntrebai de numrul de variabile.
Pentru dou variabile a3un'em la o corelaie bivariat, cnd avem tot dou, dar dorim s
controlm efectul altor variabile, a3un'em la corelaii pariale, pentru trei variabile
a3un'em la un 'rafic scatter tri-dimensional, iar pentru o variabil dependent %i dou sau
mai multe variabile independente a3un'em la re'resie liniar.
6.7.E. ;rafice
;raficele pot fi 'site n meniul /raphs. ,teva dintre ele sunt clare4 0ar, Line,
Area, *ie, 1igh-Low- 1istogram.
-ac vrem s aflm din fi%ierul +mployee Data care este distribuia an'a3ailor
dup sex %i ras vom ale'e /raphs->0ar, cu opiunea Clustered #ca s obinem o
'rupare$ %i vom ale'e variabila gender %i ca %i criteriu de 'rupare variabila minority.
:e"ultatul va fi4
,u ro%u vom avea procenta3ul de femeiHbrbai n rndul celor care nu aparin
unei minoriti %i cu verde n ca"ul celor care aparin. Se poate observa c exist mai
muli brbai n rndul minoritarilor.
Gn tip interesant de 'rafic este '!atter, care ne permite repre"entarea unor
variabile #de tip continuu$ ntr-un spaiu bi sau tri-dimensional.
&arianta 'imple ne repre"int 'rafic dou variabile, Matri, la fel, dar ncercnd
s surprind perec+ile de variabile, #verlay permite repre"entarea mai multor variabile,
diferenierea fcndu-se prin culori, iar 2-D se folose%te pentru repre"entarea
tridimensional a trei variabile.
-ac dorim s repre"entm salariul n funcie de experien pentru cele trei tipuri
de posturi putem folosi un 'imple '!atterplot cu opiunile de mai sus.
:e"ultatul va fi un 'rafic n care este repre"entat fiecare dintre ca"urile existente,
cu culori diferite, n funcie de tipul de munc depus4 <ana'er, ,ustodial #pa"$ %i
,lerical #funcionar$.
Se observ c mana'erii c%ti' cel mai mult #ceea ce era %i de a%teptat$. Exist
ns o relaie ntre c%ti'uri %i experienI &om putea observa ceva dac ncercm s
editm 'raficul. =ceasta se face cu un dublu-clicA pe el %i vom obine o nou fereastr. n
aceasta, selectnd Chart->#ptions %i selectnd Fit line- 'ubgroups vom obine o linie
care ne va indica cum evoluea" c%ti'ul salarial n funcie de vec+ime pentru fiecare
'rup.
Se poate observa c pentru mana'eri exist o relaie slab po"itiv, pentru pa"nici
aproape c nu exist nici o relaie, iar pentru funcionari relaia este slab ne'ativ.
-ac ncercam s facem acela%i lucru cu salariul fa de anii de educaie vom
observa c obinem o relaie po"itiv destul de bun. :s( #adic :
0
$J!.7ECE ne indic
faptul c 7E.CED din variaia salariului este explicat de nivelul de educaie #dac era
).!!, relaia era perfect$.
Educational level (years)
22 20 18 16 14 12 10 8 6
C
u
r
r
e
n
t

s
a
l
a
r
y
140000
120000
100000
80000
60000
40000
20000
0 Rsq = 0.4363
6.7.7 ,um putem folosi re"ultatele SPSS n alte aplicaii
,um spuneam, putem salva outputurile pentru folosire ulterioar. =vem
posibilitatea s listm ori ntre' outputul, ori doar partea pe care am selectat-o sau s o
trimitem prin e-mail. -atele n sine ar putea fi salvate n format EK,E1 sau -5L #ba"
de date$ pentru alte prelucrri.
8rice element din output poate fi selectat cu a3utorul unui simplu clicA, copiat n
clipboard #Copy sau Copy #b3e!ts$ %i inserat n o alt aplicaie #cum ar fi <icrosoft
?ord$ cu a3utorul comen"ii *aste. <ai avem posibilitatea exportrii n format M9<1
sau text.
Gn 'rafic poate fi exportat n alt format. Pentru aceasta, dup un dublu-clicA
intrm n fereastra '*'' Chart +ditor #unde putem modifica 'raficul$ de unde opiunea
File->+,port Chart ne permite s-l salvm n formate cum ar fi 4indows Metafile
#recunoscut de aplicaii 'en <icrosoft 8ffice$, sau n alte formate, cum ar fi 0itmap-
Tagged mage File sau 5*/. 5utonul #ptions ne permite s setm modul de afi%are a
ima'inii #dimensiune, numr de culori$ %i n anumite ca"uri dac ima'inea va fi
comprimat.
Chi-Square Tests
21.484
b
1 .000
1.61! 1 .000
22."81 1 .000
.000 .000
21.26 1 .000
100
#earson C$i%&quare
Continuity Correction
a
'i(eli$ood Ratio
)is$er*s E+act ,est
'inear%by%'inear
-ssociation
. o/ 0alid Cases
0alue d/
-sy12. &i3.
(2%sided)
E+act &i3.
(2%sided)
E+act &i3.
(1%sided)
Co12uted only /or a 2+2 table
a.
0 cells (.04) $ave e+2ected count less t$an !. ,$e 1ini1u1 e+2ected count is
18.24.
b.
9estul ,+i-s(uare testea" asocierea dintre variabile fr s indice tria sau direcia
relaiei. Be interesea" n principal Pearson c+i-s(uare, celelalte rnduri fiind alte msuri
ale asocierii mai puin folosite6 "e(ultatul se tradu!e7 e,ist& o aso!iere 8ntre reu9ita la
e,amen 9i 8nv&%at #cel dou variabile folosite$.
Symmetric Measures
."3 .02 !.23 .000
100
5a11a 6rdinal by 6rdinal
. o/ 0alid Cases
0alue
-sy12.
&td. Error
a
-22ro+. ,
b
-22ro+. &i3.
.ot assu1in3 t$e null $y2ot$esis.
a.
7sin3 t$e asy12totic standard error assu1in3 t$e null $y2ot$esis.
b.
Pentru variabile ordinale putem folosi diferii coeficieni4 ;amma, Nendall 9au 5 %i ,, d
al lui Somers. n exemplul de mai sus folosim ;amma, care poate lua valori ntre -) %i ).
&alorile mai apropiate de "ero indic o relaie foarte slab sau inexisten, cel apropiate
de ) n valoare absolut o relaie puternic, po"itiv sau ne'ativ. n exemplul de mai sus
avem o relaie semnificativ, puternic po"itiv.
=cest coeficient #ar
trebui s fie mai mic
dect !.!@$ ne arat c
avem o asociere
semnificativ
invata * a promovat examenul Crosstabulation
Count
41 " 48
21 31 !2
62 38 100
8-
.7
invata
,otal
8- .7
a 2ro1ovat e+a1enul
,otal
Pentru variabile nominale vom folosi 1ambda #care poate lua valori ntre ! %i )$.
Test
ore invatat
12 10 8 6 4 2 0 %2
n
o
t
a

l
a

e
+
a
1
e
n
12
10
8
6
4
2
0 Rsq = 0."82"
-ac ncercm s testm ipo"te"a conform creia reu%ita la examen #nota
obinut$ este influenat de invat #numr de ore n care am nvat$ * pentru datele
repre"entate n 'raficul de mai sus #de tip '!atter$ putem apela la :e'resia liniar.
8binem4
Model Summary
.88!
a
."83 .""2 1.0"0
9odel
1
R R &quare
-d:usted
R &quare
&td. Error o/
t$e Esti1ate
#redictors; (Constant)< ore invatat
a.
Ad3usted " ')uare ne arat ct din variaia variabilei dependente este datorat variaiei
celei independente. ,u alte cuvinte, 66.0D din not este dat de numrul de ore de
nvat.
Goodness-of-fit measure of a linear model, sometimes called the coefficient of determination. It is
the proportion of variation in the dependent variable explained by the regression model. It ranges
in value from 0 to 1. Small values indicate that the model does not fit the data well.
ANOVA
b
88.060 1 88.060 "!.642 .000
a
24.448 21 1.164
112.!08 22
Re3ression
Residual
,otal
9odel
1
&u1 o/
&quares d/ 9ean &quare ) &i3.
#redictors; (Constant)< ore invatat
a.
8e2endent 0ariable; nota la e+a1en
b.
Anova ne spune da!& relaia noastr este semnificativ #coloana 'ig6 trebuie s fie O!.!@$
his table summari!es the results of an analysis of variance.
he " statistic is the regression mean s#uare $%S&' divided by the residual mean s#uare $%S('.
)hen the " value is large and the significance level is small $typically smaller than 0.0* or 0.01'
the null hypothesis can be re+ected. In other words, a small significance level indicates that the
results probably are not due to random chance.
Coeicients
a
2.!" .406 6.402 .000
.6"" .0"8 .88! 8.6" .000
(Constant)
ore invatat
9odel
1
= &td. Error
7nstandardi>ed
Coe//icients
=eta
&tandardi
>ed
Coe//icien
ts
t &i3.
8e2endent 0ariable; nota la e+a1en
a.
9abelul cu coeficieni ne spune care sunt coeficienii #5$ ai ecuaiei dreptei de re'resie.
=stfel Bota la examen J 0.@6 P !.C66 x ore invatat. ,oeficienii standardi"ai ne spun
#dac am avea mai multe variabile independente$, care are o mai mare influen asupra
variabilei dependente. ,u ct 5eta este mai mare n valoare absolut, va avea o influen
mai mare asupra variabilei dependente. -ac valoarea lui 5eta este ne'ativ, influena
este ne'ativ.
he unstandardi!ed coefficients are the coefficients of the estimated regression model.
,ften the independent variables are measures in different units. he standardi!ed coefficients or
betas are an attempt to ma-e the regression coefficients more comparable.
he t statistics can help you determine the relative importance of each variable in the model.
he t statistics can help you determine the relative importance of each variable in the model. .s a
guide regarding useful predictors, loo- for t values well below -/ or above 0/.

S-ar putea să vă placă și