Documente Academic
Documente Profesional
Documente Cultură
INTRODUCERE
_________________________________________________________________________________________________________________
1
Introducere n SPSS 2011 Mihaela Naidin
Curs 1.
I. Noiuni de baz despre introducerea
i analiza statistic folosind SPSS
_________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________
Pasul 1:
Se d dublu clic pe imagine
dac imaginea nu apare pe
ecran atunci accesai Start
ProgrameSPSS.
Pasul 2:
2
Introducere n SPSS 2011 Mihaela Naidin
Pasul 4:
Pasul 5:
3
Introducere n SPSS 2011 Mihaela Naidin
Pasul 6:
Pasul 7:
Selectnd File Save As
datele se vor salva sub forma
unui fiier. Fiierul salvat va
primi automat de la SPSS
extensia .sav.
* Se recomand folosirea unor nume
de fiiere distincte (ex. date1) pentru
a face coninutul lor ct mai clar. Salvarea datelor este recomandat sa se fac ntr-un fiier
diferit de cel
al SPSS-ului.
Pasul 8:
Pentru a alege locaia unde
va fi salvat fiierul de date,
se alege calea n mediul
Save In (se folosete
sgeata pentru a ajunge
la locaia dorit).
Salvarea unui fiier se realizeaz prin
pictograma Save din bara de instrumente Standard sau cu ajutorul comenzilor Save sau Save
As i meniul File. Aceste comenzi deschid fereastra Save Data As n care se pot stabili:
numele fiierului (File name); tipul fiierului (Save as type); locaia n care s aib loc
salvarea (Save In).
4
Introducere n SPSS 2011 Mihaela Naidin
5
Introducere n SPSS 2011 Mihaela Naidin
Pasul 10:
Acesta este spaiul de lucru Variable View. n acest caz, o variabil este
deja nscris fiind introdus la pasul 8. Variabila poate fi redenumit i pot fi
adugate alte variabile destul de uor selectnd celula corespunztoare i tastnd
numele variabilei.
Aici
se
Pasul 11:
La versiunea SPSS 12-16 (fa de
cele anterioare unde se permit
maxim 8 caractere) nu exist
limit pentru lungimea numrului
unei variabile.
Se selecteaz o celul din coloana
Name i se scrie un nume diferit
de variabil. Celelalte variabile
vor primi valori care vor fi
implicit schimbate ulterior.
Acesta este numrul de zecimale
care va aprea pe ecran.
*La editarea unei variabile trebuie s se in cont de urmtoarele restricii: numele variabilei
s fie unic, primul caracter s fie o liter, sa nu conin simboluri speciale folosite n SPSS
sau spaii.
Pasul 12:
Apare acest buton: se d
clic pe el.
6
Introducere n SPSS 2011 Mihaela Naidin
Pasul 13:
Pasul 14:
Se scrie 1 n dreptul
cmpului value
i masculin n dreptul
cmpului value Label.
Pasul 15:
Fereastra Pivot Table (Pivot Table Editor) ofer multiple posibiliti de modificare a
tabelelor pivot: editare text, schimbarea datelor din rnduri i coloane, adugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afiarea selectiv a rezultatelor.
Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagram, legend etc.)
I.5. Exemplu de calcul statistic.
Pasul 16:
Pentru a calcula media de vrst
se urmresc urmtoarele etape:
- se d clic pe Analyze;
-Se selecteaz Descriptive
statistics;
- Se selecteaz Descriptive
Pasul 17:
Se selecteaz vrsta.
Se apas butonul pentru a
muta vrsta n csua
Variable(s).
Se d clic pe OK.
Pasul 18:
Fereastra Data Editor este nlocuit de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizat anterior.
8
Introducere n SPSS 2011 Mihaela Naidin
9
Introducere n SPSS 2011 Mihaela Naidin
I.7. Exerciii
Se cere:
1. s se calculeze media de
vrst a participanilor la
studiu;
2. s se calculeze i s se
interpreteze media
obinut.
3. s se salveze fiierul
creat n My
documentscu
denumirea cercetare.
10
Introducere n SPSS 2011 Mihaela Naidin
12
Introducere n SPSS 2011 Mihaela Naidin
13
Introducere n SPSS 2011 Mihaela Naidin
Curs 2
II. Descrierea variabilelor.
Tabele i diagrame.
________________________________________________________
Pasul 1:
Se definete variabila.
Pasul 2:
Se selecteaz:
Analize,
Descriptive Statistics
Frequencies
14
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Se apas OK
Pasul 4:
15
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Se selecteaz:
Graphs
Pie.
Pasul 2:
Se selecteaz Define.
Pasul 3:
Se selecteaz Ocupaia
prin apsarea butonului ().
Se apas OK.
Pasul 4:
16
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Se selecteaz:
Elements
Show Data Labels.
Pasul 2:
Se selecteaz Count i
X-ul rou pentru a nu afia.
17
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Diagrama circular cu
sectoarele
denumite i frecvena
procentual afiat.
Pasul 1:
Se selecteaz:
Graphs
Bar.
Pasul 2:
Selectai Define.
Simple este preselectat.
18
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Se selecteaz % of cases.
Se apas OK
Diagrama cu bare.
* Diagrama cu bare este folosit pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru
aceeai colectivitate (Summaries of separate variables).
Diagrama Bar este folosit pentru a ilustra categoriile unei distribuii n form convenabil.
Diagrama prezint attea bare cte categorii are o variabil. Barele au aceeai baz, egal cu
unitatea, iar nlimea proporional cu frecvena categoriei astfel nct aria fiecrei bare
reprezint numrul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie s conin urmtoarele elementele:
- titlul graficului ofer informaii asupra fenomenului reprezentat (Titlul
graficului coincide cu titlul tabelului de date);
- axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscis se
nscrie variabila de distribuie, iar pe ordonat frecvena.
- legenda este folosit pentru a explica elementele din diagram;
- sursa precizeaz originea datelor reprezentate.
II.5. Histograme.
19
Introducere n SPSS 2011 Mihaela Naidin
Pentru a ilustra procesul de realizare a unei histograme vom folosi datele
obinute din rspunsurile subiecilor la ntrebarea V place statistica?.
(rspunsuri: a. foarte mult; b. mult; c. Puin d. foarte puin; e. deloc).
Pasul 1:
Se selecteaz:
Graphs
Hitogram
Pasul 2:
20
Introducere n SPSS 2011 Mihaela Naidin
II.6. Exerciii
Se cere:
4. s se realizeze un tabel
de frecvene pentru
variabila subieci;
5. s se realizeze tabel de
frecvene pentru
variabila vrst;
6. s se realizeze diagrama
de structur pentru
variabila subieci;
21
Introducere n SPSS 2011 Mihaela Naidin
22
Introducere n SPSS 2011 Mihaela Naidin
23
Introducere n SPSS 2011 Mihaela Naidin
24
Introducere n SPSS 2011 Mihaela Naidin
Curs 2
III. Descrierea numeric a variabilelor
- Medie, variaie i dispersie
_________________________________________________________________________________________________________________
Pasul 2: Pasul 3:
Pasul 4:
25
Introducere n SPSS 2011 Mihaela Naidin
Se selecteaz vrsta
i butonul pentru a
introduce n lista de
variabile.
Se deselecteaz
butonul Display frequencys
tables i se ignor mesajul
de avertizare.
Se d clic pe Statistics
Pasul 5:
Se selecteaz
Mean;
Median;
Mode.
Se d clic pe Continue.
III.2. Interpretarea
output-ului.
26
Introducere n SPSS 2011 Mihaela Naidin
aflate la mijlocul liniei de vrste de la cea
mai mic la cea mai mare) este de 21.5 ani.
Valoarea mod de vrst este 17.
27
Introducere n SPSS 2011 Mihaela Naidin
11. Eroarea standard (ES medie) valoarea medie cu care mediile
eantioanelor extrase dintr-o populaie, difer fa de media populaiei.
28
Introducere n SPSS 2011 Mihaela Naidin
6. Kurtosis, ca indicator al formei distribuiei, indic:
a. ct de ascuit sau turtit este distribuia scorurilor pentru o variabil,
comparativ cu distribuia normal;
b. simetria sau asimetria unei distribuii de frecvene fa de medie;
c. distribuia scorurilor pentru 2 variabile comparative;
30
Introducere n SPSS 2011 Mihaela Naidin
Curs 3
IV. Forme ale distribuiei scorurilor
_________________________________________________________________________________________________________________
31
Introducere n SPSS 2011 Mihaela Naidin
n exemplul urmtor este elaborat un tabel de frecven i o histogram cu
scorurile obinute la evaluarea coeficientului de inteligen pentru 20 de juriti.
32
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Pasul 2:
n Data View
din Data Editor
se introduc
scorurile obinute
la Atenie n
prima coloan.
Pasul 3:
Se selecteaz
Analyze,
Descriptives
Statistics i
Frequencies
Pasul 4:
Se selecteaz
atenie i apoi
se apas butonul
pentru a
introduce n lista de variabile. Se apas OK.
33
Introducere n SPSS 2011 Mihaela Naidin
A treia coloan
exprim aceste frecvene ca
un procent al numrului total A patra coloan A cincea coloan
incluznd i datele care exprim aceste frecvene cumuleaz aceste
lipsesc. ca un procent al numrului procentaje n josul
Exemplu: Din totalul cazurilor, total excluznd datele lips. tabelului.
5% au obinut scorul 55.
IV.3. Histograme.
Histograma este un grafic, folosit n statistica descriptiv i arat o distribuie de
frecven. Distribuia de frecven se refer la numrul de evenimente statistice pe clase
(grupe) de evenimente. Pentru o serie de date statistice cu o distribuie de frecven dup o
variabil numeric continu (sau continu pe poriuni), reprezentrile grafice care ne permit s
vizualizm distribuia de frecvene sunt histograma i poligonul frecvenelor.
Pasul 1:
Se seleteaz:
Graphs,
Histogram
Pasul 2:
Se selecteaz
Ateniei
apoi se apas
butonul
pentru a o
introduce n
34
Introducere n SPSS 2011 Mihaela Naidin
butonul butonul pentru a o introduce n
caseta de
n caseta de variabile Se
apas OK.
Variabile.
Se apas OK
35
Introducere n SPSS 2011 Mihaela Naidin
IV.5. Modalitatea.
O distribuie normal (figura 1)
este o distribuie unimodal, adic exist
Frecvena de apariie
Figura nr. 1.
nlimea subiecilor.
O
di
stribuie similar distribuiei din
figura 1, este o distribuie bimodal
(figura 2), deoarece observm
existena a dou categorii cu frecvena
egal i maxim.
36
Introducere n SPSS 2011 Mihaela Naidin
Figura nr. 2.
IV.6. Simetria.
O distribuie este
simetric, dac valorile sunt
egal (simetric) rspndite n
jurul tendinei centrale. Atunci
cnd rezultatele tind ctre valori
mici, sunt aglomerate n partea
stng a distribuiei, avem de a
spre dreapta (sau distribuie skewness pozitiv). Cnd rezultatele tind ctre valori
mari, se aglomereaz n partea dreapt a distribuiei, vorbim despre o distribuie
asimetric la stnga (skewness negativ). Iat c, asimetria este dat de panta
distribuiei i nu de vrful acesteia, aa cum trateaz i consider unii.
37
Introducere n SPSS 2011 Mihaela Naidin
Nu ne putem limita la o apreciere pur vizual a simetriei; acest lucru necesit
demonstrarea statistic a simetriei sau asimetriei distribuiei. n acest scop, exist mai muli
coeficieni care pot fi calculai.
mai mici dect media este perfect simetric cu grupa subiecilor cu scoruri mai
mari dect media. Acest aspect este menionat din raiuni teoretice. n practic
nu vom ntlni o distribuie perfect normal, ci o distribuie care poate fi
acceptat ca fiind normal.
iar dac n distribuie predomin scorurile mici, atunci scorurile mari sunt
considerate ca scoruri extreme. tim de la analiza preciziei indicatorilor
38
Introducere n SPSS 2011 Mihaela Naidin
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mari,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo<Me<m.
Aceast relaie este relaia caracteristic a unei distribuii asimetrice pozitiv.
iar dac n distribuie predomin scorurile mari, atunci scorurile mici sunt
considerate ca scoruri extreme. tim, de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mici,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo>Me>m.
Aceast relaie este relaia caracteristic a unei distribuii asimetrice negativ.
39
Introducere n SPSS 2011 Mihaela Naidin
normal, distribuie mezocurtic. O distribuie normal este ntotdeauna o
distribuie mezocurtic.
n figura alturat,
distribuia C este o distribuie
leptocurtic, ascuit. Distribuia
B este o distribuie platicurtic,
turtit, iar distribuia A este o
distribuie normal sub aspectul
boltirii, sau mezocurtic.
Figura nr. 7
40
Introducere n SPSS 2011 Mihaela Naidin
De exemplu, dac ntr-o clas de 30 de elevi, 27 obin medii anuale ntre
7,9 i 8,1. Iat c, doar dou zecimi difereniaz ntre aproape ntreg efectivul de
elevi. Nu avem nici o problem cu repartizarea celorlali trei elevi. Pe aceia i
vom considera ori foarte buni, ori foarte slabi, n funcie de media obinut sub
7,9 sau peste 8,1. Ce ne facem ns cu cei 27 de subieci? Suntem, iat, n
imposibilitatea de ai-i ierarhiza n vreun fel. Dac presupunem c cei trei
subieci au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi,
premiul I, cine va lua premiul II i cine va lua premiul III. Decizia ar fi, dup
cum se poate vedea, extrem de dificil, dac nu chiar imposibil. Singura
variant n acest caz, ar putea fi creterea preciziei. Nu calculm media cu o
singur zecimal, ci cu 2, 3 sau 4 zecimale. Totui, sunt situaii n care un
asemenea nivel de precizie este ridicol. O evaluare n care distribuia rezultatelor
este leptocurtic, este o evaluare ce nu poate diferenia ntre subiecii de nivel
mediu, iar o curb leptokurtic nu este o distribuie normal;
Analiza unei distribuii sub aspectul normalitii este primul pas pe care l
facem n orice prelucrare de date. Deoarece, n funcie de rezultatul acestei
analize, vom putea alege tehnicile i procedeele statistice pe care le putem
folosi, aceast etap o ntlnim, de obicei, la nceputul oricrui raport de
cercetare, imediat dup descrierea eantionului.
41
Introducere n SPSS 2011 Mihaela Naidin
1. Histograma:
a. este un grafic folosit n statistica descriptiv;
b. arat o distribuie de frecven;
c. se folosete pentru date calitative.
2. Valid procent:
a. exprim aceste frecvene ca un procent al numrului total excluznd
datele lips.
b. frecvene ca un procent al numrului total lipsesc incluznd i datele care
lipsesc.
c. frecvena valorilor.
42
Introducere n SPSS 2011 Mihaela Naidin
a. modul <mediana<media;
b. modul>mediana>modul;
c. modul=mediana=modul.
43
Introducere n SPSS 2011 Mihaela Naidin
44
Introducere n SPSS 2011 Mihaela Naidin
Curs 4
V. Abaterea standard.
________________________________________________________________________________________________________________
Vrst 20 22 25 26 35 38 28 24 23 24
Pasul 1:
Pasul 2:
n Data View din Data Editor
se introduc vrstele n prima
45
Introducere n SPSS 2011 Mihaela Naidin
coloan.
Pasul 3:
Se selecteaz:
Analyze
Descriptive Statistics
Descriptives
Pasul 4:
Se selecteaz vrsta i apoi se
apas butonul pentru a o
introduce n lista de variabile.
Se selecteaz Options
Pasul 5:
Se deselecteaz Mean,
Minimum, Maximum.
Se selecteaz Continue.
Se selecteaz OK din
ecranul precedent care
reapare.
V. 2. Interpretarea output-ului.
V.3. Scorurile Z
Pasul 1:
46
Introducere n SPSS 2011 Mihaela Naidin
La pasul 4 selectai Save standardized values as variables.
Se apas OK.
Pasul 2:
47
Introducere n SPSS 2011 Mihaela Naidin
constant din fiecare scor particular. Deoarece din formul rezult aceast
diferen (se scade fiecare scor particular din medie), n final media va
ajunge la valoarea zero
V.6. Alegei
48
rspunsul corect
Introducere n SPSS 2011 Mihaela Naidin
1. Abaterea standard:
a. este un indice care arat ct de mult deviaz (difer) unele scoruri n
medie fa de media setului de scoruri din care acestea fac parte.
b. este un indice care arat ct de simetric sau asimetric este o
distribuie;
c. este un indice care arat ct de turtit sau boltit este o distribuie.
49
Introducere n SPSS 2011 Mihaela Naidin
50
Introducere n SPSS 2011 Mihaela Naidin
Curs4
VI. Relaiile dintre dou sau mai multe variabile.
Diagrame i tabele.
________________________________________________________________________________________________________________
n foarte multe cercetri se studiaz relaiile dintre dou sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabil) care au fost
descrise pn acum pot fi utilizate pentru analiza oricror date. Dar, cercetarea
poate necesita ca relaiile i corelaiile dintre diferitele variabile s fie studiate.
La fel ca statistica univariat, statistica bivariat a datelor necesit
studierea tendinelor fundamentale ale datelor utiliznd tabele i diagrame.
Modelele de prezentare a relaiilor bivariate includ crearea tabelelor scatter.
O condiie esenial o constituie etichetarea tabelelor i diagramelor i
denumirea acestora.
n continuare se va ilustra elaborarea unui tabel de asociere i a unei
diagrame cu bare.
Pasul 1:
n Variable View din Data Editor se denumete:
- prima coloan Instituionalizare
- a doua coloan Genul biologic;
- A treia coloan Frecvena.
51
Introducere n SPSS 2011 Mihaela Naidin
Pasul 2:
Se eticheteaz cele dou valori
ale instituionalizrii:
1 - instituionalizat;
2 - neinstituionalizat.
i genul biologic:
1. Feminin;
2. Masculin
*Paii acestei proceduri au fost explicai
n capitolul 1.
Pasul 3:
Se introduc aceste numere n Data
View din Data Editor.
Primul rnd se refer la fetele care
au fost instituionalizate: sunt n numr
de 5.
Al doilea rnd se refer la bieii
care au fost instituionalizai:
sunt n numr de 6.
Al treilea rnd se refer la fetele
neinstituionalizate: sunt n numr de 4.
Al patrulea rnd se refer la bieii
neinstituionalizai: sunt n numr de 5.
Pasul 4:
Pasul 5:
Se selecteaz Frecvena,
Weight cases by i apoi se
apas butonul pentru
transfer n csua
variabileiFrequency
Variable.
52
Introducere n SPSS 2011 Mihaela Naidin
Se apas OK
Pasul 6:
Se selecteaz:
Analize
Descriptivesc statistics
Crosstabs.
Pasul 7:
Pentru a pune instituionalizare pe
rndurile tabelului, se selecteaz i
apoi se apas butonul de lng
eticheta Row(s).
Se apas OK.
Pasul 8:
n tabel sunt
prezentate valorile
celor dou variabile.
Se observ c sunt 5
fete i 6 biei
instituionalizai (n total 11) i 4 fete i 5 biei neinstituionalizai (n total 9).
(N=20).
Tabelul de asociere este folosit pentru prezentarea relaiilor dintre dou variabile categoriale.
n fiecare celul a tabelului este prezentat frecvena parial (adic efectivul care poart
simultan o valoare a fiecrei variabile).
Observaie:
1. Dac ntr-un crosstabs numrul categoriilor unei variabile este mai mare dect al
alteia, atunci categoriile acelei variabile se plaseaz pe rnduri.
2. O celul din crosstabs ofer informaia despre intersecia celor dou variabile. Pentru
aceasta alegem din fereastra Crosstabs butonul de comand Cell ce are ca efect
afiarea ferestrei Crosstabs Cell Display.
53
Introducere n SPSS 2011 Mihaela Naidin
Curs 5
VII. Coeficieni de corelaie.
Coeficieni de corelaie Pearson i Spearman.
_________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________
Pasul 1:
n Variable View din Data
Editor se denumete primul
rnd muzic
i al doilea rnd matematic. * Se nltur cele dou zecimale.
Pasul 2:
Pasul 1:
Se selecteaz:
Analyze,
Corelate,
Bivariate
Pasul 2:
55
Introducere n SPSS 2011 Mihaela Naidin
Se selecteaz Muzic i Matematic i apoi se apas butonul pentru a le
introduce n lista de variabile aa cum este artat n figura din dreapta.
Se apas OK.
VII.3. Interpretarea
output-ului.
Corelaia dintre
matematic i muzic
este - 0,845 La un test de
semnificaie, two-tailed la
nivelul de probabilitate 0,01
sau mai mic, corelaia este
statistic semnificativ.
Numrul cazurilor pe care este bazat corelaia este 10. Informaia apare i n
aceast celul.
*One tailed dac distribuia este unidirecional.
Two-tailed dac distribuia este bidirecional.
56
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Identic corelaiei Pearson se
selecteaz Analyze, Correlate,
Bivariate i variabilele care se
doresc pentru corelaie.
Se selecteaz Spearman i se
deselecteaz Pearson (dac nu se
dorete ca i corelaie).
Se apas OK.
57
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Se selecteaz:
Graphs
Scatter/Dot
Pasul 2:
Pasul 3:
Se apas OK.
58
Introducere n SPSS 2011 Mihaela Naidin
n diagrama scatter, rspndirea
punctelor este relativ ngust,
ceea ce indic o corelaie mare.
59
VII.11. Alegei rspunsul corect
Introducere n SPSS 2011 Mihaela Naidin
1. Corelaia:
a. msoar variaia concomitent a doi factori
b. msoar parametria distribuiei ntre dou eantioane
c. msoar rangul unei distribuii trihotomice
2. Corelaia Pearson(r):
a. evalueaz gradul de asociere dintre dou variabile msurate pe scal de
interval/raport.
b. evalueaz gradul de asociere dintre dou variabile msurate pe scal
nominal;
c. evalueaz gradul de asociere dintre dou variabile msurate pe scal
ordinal.
60
Introducere n SPSS 2011 Mihaela Naidin
7. O corelaie pozitiv semnific faptul c:
d. n timp ce scorurile unei variabile cresc, scorurile pentru cealalt variabil
descresc;
e. c scorurile unei variabile se mresc odat cu creterea scorurilor
celeilalte variabile).
f. nu exist nicio legtur ntre variabile.
61
Introducere n SPSS 2011 Mihaela Naidin
62
Introducere n SPSS 2011 Mihaela Naidin
VIII. Regresia.
Predicia cu precizie.
_________________________________________________________________________________________________________________
Dac exist o relaie ntre dou variabile atunci sunt posibile estimarea
sau predicia scorului unei persoane la o variabil pornind de la scorul obinut la
cealalt variabil. Cu ct este mai puternic corelaia cu att este mai bun
predicia. Variabila independent este variabila folosit pentru a realiza
predicia, aceasta fiind cunoscut i ca variabil predictor sau variabila X.
*Este foarte important a nu se confunda variabila independent cu cea dependent. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relaiei dintre cele dou variabile. Axa orizontal X este variabila independent i axa
verticala Y este variabila dependent. Se poate investiga i punctul de tiere, acesta fiind
punctul n care panta se intersecteaz cu axa vertical.
Regresia devine o tehnic mult mai important atunci cnd sunt folosite
mai multe variabile pentru predicia valorilor unei alte variabile.
n continuare este ilustrat procesarea unei regresii simple i a unei
diagrame de regresie folosind datele din tabelul urmtor.
Scor muzica 3 7 8 9 9 6 4 3 4 7
Scor 7 5 4 4 5 8 9 9 7 6
matematic
Unul din principalele capitole ale statisticii are n vedere posibilitatea de a face
predictii. Desi nu se gasesc relatii perfecte n lumea reala, prin intermediul regresiei se pot
face predictii ale unei variabile, n functie de valoarea alteia. Predictia este procesul de
estimare a valorii unei variabile cunoscnd valoarea unei alte variabile.
Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica ntre
doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca
am avea o corelatie perfecta (+1 sau 1) estimarea ar fi extrem de precisa
VIII.1. Introducerea datelor.
Pasul 1:
n Variable View din Data
Editor se denumete primul
rnd muzic
63
Introducere n SPSS 2011 Mihaela Naidin
i al doilea rnd matematic. * Se nltur cele dou zecimale.
Pasul 2:
Pasul 1:
Se selecteaz:
Analyze
Regression
Linear
Pasul 2:
Pasul 3:
Se selecteaz Confidence
Intervals.
Se selecteaz Continue.
Se apas OK din ecranul
precedent care reapare.
64
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Se selecteaz:
Graphs
Scatter/Dot
Pasul 2:
65
Introducere n SPSS 2011 Mihaela Naidin
Se selecteaz define; simple este deja selectat.
Pasul 3:
Pasul 4:
Se selecteaz Elements i
Fit Line at Total.
66
Introducere n SPSS 2011 Mihaela Naidin
n regresie axa orizontal este variabila predictor sau independent (n
cazul nostru matematic).
67
Introducere n SPSS 2011 Mihaela Naidin
* Linia de regresie oblic, de la stnga sus spre dreapta jos, indic o relaie negativ ntre cele
dou variabile.
68
Introducere n SPSS 2011 Mihaela Naidin
Stima de sine 5 7 3 6 4 5
Pasul 1:
Se introduc datele n Data Editor.
Se eticheteaz variabila Stima.
Pasul 1:
Se selecteaz:
Analyze
Descriptive Statistics
Descriptive
Pasul 2:
69
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Se selecteaz continue.
X. Testul t.
Compararea a dou eantioane
de scopuri corelate/relaionate.
_________________________________________________________________________________________________________________
70
Introducere n SPSS 2011 Mihaela Naidin
* Testul t pentru eantioane perechi este optim dac distribuia diferenelor dintre
cele dou seturi de valori se prezint (aproximativ) sub form de clopot (atunci cnd
distribuia este normal). Dac distribuia este foarte diferit de forma de clopot ar trebui luat
n considerare utilizarea unei tehnici statistice relaionate nonparametric pentru eantioane
perechi, cum ar fi testul de perechi Wilcoxon.
Procesarea unui Test t este ilustrat cu datele din tabelul urmtor unde
sunt prezentate numrul de cuvinte pe care aceeai copii le-au verbalizat cu
mamele lor la 18 luni i la 24 luni.
Numrul de cuvinte verbalizate ntr-un minut la vrste diferite.
71
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
n Variable View din Data
Editor se eticheteaz primul rnd cu
optsprezece i al doilea rnd cu
douzeci i patru.
* Se nltur cele dou zecimale.
Pasul 2:
Pasul 1:
Se selecteaz:
Analyze
Compare Means
Paired-Samples T Test
Pasul 2:
Se selecteaz optsprezece
i se pune aceast variabil
lng eticheta Variable1 sub
Curent Selections.
Se selecteaz douzeci i
patru i se pune aceast
variabil lng eticheta
Variable2 sub Curent
Selections.
Se apas butonul pentru a
pune aceste dou variabile n
lista variabilelor relaionale.
Se apas OK.
72
Introducere n SPSS 2011 Mihaela Naidin
Al doilea tabel arat gradul n care cele dou seturi de valori sunt corelate.
Corelaia dintre ele 0,94. Aceasta este o corelaie mare, nivelul de semnificaie
fiind de 0,00.
Primele trei coloane care conin cifre sunt componentele fundamentale ale
calcului unui Test t relaionat. Media de -2,000 este de fapt diferena dintre
mediile pe 18 i 24 luni, deci n realitate este media diferenei. Valoarea lui t
este bazat pe aceast medie a diferenei (-2,00), divizat cu eroarea standard a
mediei (0,267). Calculul ofer valoarea lui t (-7,483).
73
Introducere n SPSS 2011 Mihaela Naidin
XI. Testul t.
Compararea a dou eantioane de
scoruri necorelate/nerelaionate.
_________________________________________________________________________________________________________________
74
Introducere n SPSS 2011 Mihaela Naidin
copii care provin din familii biparentale i 10 copii care provin din familii
monoparentale. Scopul analizei este de a aprecia dac valorile emotivitii sunt
diferite la copii care provin din familii cu doi prini fa de copii care provin
din familii monoparentale.
Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9
Pasul 1:
n Variable View din Data Editor, se eticheteaz pe rnd Familii.
Aceasta va defini cele dou tipuri de familii.
Pasul 2:
75
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
Se selecteaz:
Analyze
Compare Means
Independent Samples T test
Pasul 2:
Se selecteaz
Emotivitate i apoi se
apas butonul pentru
a introduce aceast
variabil n lista
variabilelor de test.
Se selecteaz Familie
i apoi se apas butonul
pentru a introduce
aceast variabil n
csua Grouping
Variable.
Pasul 3:
Se introduce:
- valoarea 1 (codul pentru familiile
biparentale) lturi de eticheta Group 1
- valoarea 2 (codul pentru familiile
monoparentale) alturi de eticheta Group
2.
Se selecteaz Continue
76
Introducere n SPSS 2011 Mihaela Naidin
Primul tabel arat , pentru fiecare grup n parte, numrul de cazuri, media
i abaterea standard. Media pentru familiile biparentale este 13,00. Dup cum se
observ exist o diferen ntre cele dou tipuri de familii, dar, ntrebarea este
dac mediile difer semnificativ.
Valoarea lui t este media diferenei (3,500) divizat cu eroarea standard a
diferenei (1,493), diviziune ce produce valoarea 2,345.
77
Introducere n SPSS 2011 Mihaela Naidin
Dac se prefer folosirea intervalelor de ncredere , se poate scrie:
Diferena dintre valorile testelor de emotivitate ale copiilor ce provin din
familii cu doi prini (M=13,00, SD=3,55) i cei provenii din familii cu un
singur printe (M=9,50, SD=3,10) este de 3,50. Intervalul de ncredere de 95%
pentru aceast diferen este de la 0,36 la 6,63.Deoarece intervalul nu conine
punctul 0,00 diferena este statistic semnificativ la nivelul de semnificaie two-
tailed de 5%.
78
Introducere n SPSS 2011 Mihaela Naidin
79
Introducere n SPSS 2011 Mihaela Naidin
8. Testul t:
a. este folosit pentru evaluarea semnificaiei statistice a diferenei dintre
mediile pentru dou seturi de scoruri;
b. este potrivit atunci cnd variabila dependent este msurat pe scal
cantitativ (interval-raport).
c. este utilizat pentru a calcula dac mediile pentru dou seturi de variabile
sunt diferite semnificativ una fa de cealalt.
80
Introducere n SPSS 2011 Mihaela Naidin
1. b. eantioanelor independente;
2. a. dac mediile a dou grupe sunt egale;
3. a. compararea a dou seturi de date pentru identificarea diferenelor;
4. c. se testeaz dac media unei variabile este egal cu o constant
specificat;
5. c. compar mediile pentru un singur grup observat n momente
diferite
6. c. cele dou seturi de variabile provin din dou eantioane diferite de
oameni.
7. a. cele dou seturi de scoruri ce trebuie comparate provin dintr-un
singur eantion
b. coeficientul de corelaie ntre cele dou seturi este mare
8. a. este folosit pentru evaluarea semnificaiei statistice a diferenei
dintre mediile pentru dou seturi de scoruri;
b. este potrivit atunci cnd variabila dependent este msurat pe
scal cantitativ (interval-raport).
c. este utilizat pentru a calcula dac mediile pentru dou seturi de
variabile sunt diferite semnificativ una fa de cealalt.
81
Introducere n SPSS 2011 Mihaela Naidin
82
Introducere n SPSS 2011 Mihaela Naidin
Pasul 2:
Se introduc valorile adecvate n meniul
Data View din meniul Data Editor.
Fiecare rnd reprezint una dintre cele ase
celule din tabelul prezentat anterior.
Paul 3:
Pasul 4:
Se selecteaz
Frecvena, Weight
cases by i apoi se
apas butonul .
Se apas OK.
Se selecteaz:
Analyze
descriptives statistics
Crosstabs(tabele de asociere)
83
Introducere n SPSS 2011 Mihaela Naidin
Pasul 2:
Se selecteaz Gen i se
apas butonul pentru
Row(s): pentru a-l
introduce n caseta
respectiv.
Se selecteaz Site i se
apas butonul pentru
Column(s): pentru a-l
introduce n caseta
respectiv.
Ser selecteaz
Statistics
Pasul 3:
Se selecteaz Chi-square.
Se seleteaz Continue.
Pasul 4:
Se selecteaz Cells..
Pasul 5:
84
Introducere n SPSS 2011 Mihaela Naidin
n seciunea Counts se selecteaz Expected. Se selecteaz Unstandardized
n seciunea Residuals. Se selecteaze Continue, apoi se apas OK n
ecranul anterior care reapare.
* Termenul rezidual se refer la diferene.
85
Introducere n SPSS 2011 Mihaela Naidin
86
Introducere n SPSS 2011 Mihaela Naidin
Coloana final din tabel etichetat Total conine numrul de cazuri din
respectivul rnd, urmat de numrul ateptat de cazuri din tabel.
Astfel primul rnd are 60 de cazuri, urmat de numrul ateptat de cazuri
din tabel. Astfel, primul rnd are 60 de cazuri, numr care va fi identic
numrului de cazuri ateptate (adic 60).
n mod similar, rndul final din acest tabel (etichetat Total) prezint mai
nti numrul de cazuri din respectiva coloan urmat de numrul ateptat de
cazuri din tabel pentru coloana respectiv. Astfel, prima coloan are 44 de
cazuri, numr care ca fi ntotdeauna egal cu numrul ateptat de cazuri (adic
44,0).
Valoarea chi-square, gradul su de liberate i nivelul su de semnificaie sunt
afiate n al treilea tabel care ncepe cu Pearson (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjit la un numr cu dou
zecimale, devine 13,52. Gradul su de libertate este 2, iar probabilitatea two-
tailed exact este 0,001.
Sub acest tabel se mai poate vedea i mrimea minimum expected count a
oricrei celule din tabel, care este 13,88 pentru ultima celul (fetele care prefer
site-urile cu muzic). Dac diferena minim ateptat este mai mic dect 5.0,
atunci trebuie s se acorde foarte mult atenie Testului chi-square.
* Dac se folosete un tabel 2x2 de tip chi-square i apar frecvene anticipate reduse, este
recomandat s se foloseasc testul Fisher, pe care aplicaia SPSS l include n output n astfel
de situaii.
87
Introducere n SPSS 2011 Mihaela Naidin
88
Introducere n SPSS 2011 Mihaela Naidin
Pasul 1:
89
Introducere n SPSS 2011 Mihaela Naidin
Pasul 2:
Se selecteaz Transform,
recode
i Into Different Variables
Pasul 3:
Se selectea Vrst i se
apas butonul pentru a
introduce Vrsta n
caseta Numeric Variable
Output variable.
Se introduce numele noii
variabile.
Se selecteaz Change
pentru a aduga acest nume Se selecteaz Old and New values.
nou n caseta Numeric variable
Output Variable.
Pasul 4:
Se selecteaz Lowest
through i se scrie 9 n
caseta alturat.
Se selecteaz Value
din meniul new value
i se scrie 1 n csua
alturat.
Se selecteaz Add i
se introduce lowest
throught 91 n caseta
OldNew.
90
Introducere n SPSS 2011 Mihaela Naidin
Pasul 5:
Se selecteaz
Range: through
highest i se scrie
10 n caseta de
lng el.
Se selecteaz
value i se scrie
2 n caseta
alturat.
Se selecteaz
Add i se
introduce 10
through
Highest2 n
caseta OldNew. Se apas OK n ecranul care va reaprea.
Pasul 6:
Noua variabil i valorile sale sunt
afiate n meniul Data View.
91
Introducere n SPSS 2011 Mihaela Naidin
Prin clic pe butonul de comand Continue se revine n fereastra Record into Different
Variables n care acionm OK pentru recodificarea variabilei.
3. Chi Square
a. testeaz egalitatea a dou sau mai multe proporii
b. testeaz egalitatea unei proporii cu o valoare specificat
c. testeaz egalitatea mediilor a dou eantioane independente
d. testeaz egalitatea mediilor a dou eantioane perechi
92
Introducere n SPSS 2011 Mihaela Naidin
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variant de mai sus.
93
Introducere n SPSS 2011 Mihaela Naidin
94
Introducere n SPSS 2011 Mihaela Naidin
Aceti itemi se pot folosi pentru a determina nivelul de satisfacie
profesional a angajailor, prin adunarea rspunsurilor date tuturor celor patru
afirmaii.
ntru totul De acord dezacord Total dezacord
de acord
Respondent 1
Respondent 2
Respondent 3
Deoarece este nevoie de scoruri mari pentru a indica satisfacia
profesional, se va inversa evaluarea, astfel:
4. total de acord; 3. de acord;
2. dezacord; 1. total dezacord.
Pasul 4:
Pentru a salva aceast
procedur sub form de fiier
de sintax, se selecteaz
Paste n caseta principal.
95
Introducere n SPSS 2011 Mihaela Naidin
Aceast comand de sintax va aprea n fereastra Syntax.
96
Introducere n SPSS 2011 Mihaela Naidin
capitolul X i care indic numrul de cuvinte pe care aceeai copii le-au
verbalizat cu mamele lor la 18 luni i la 24 luni.
Pasul 1:
Pasul 2:
Se selecteaz:
Analyze
Nonparametric Tests
2 Related Samples
Pasul 3:
Se selecteaz
Optsprezece i
douzecisipatru i se
apas butonul pentru
a introduce aceste dou
variabile n caseta Test
Pair(s) List.
97
Introducere n SPSS 2011 Mihaela Naidin
Se deselecteaz Wilcoxon.
Se selecteaz Sign.
Se apas OK.
98
Introducere n SPSS 2011 Mihaela Naidin
Se poate ignora primul dintre cele dou tabele de output. Acestea indic
numrul de diferene negative (0), pozitive (8) i inexistente (0) n ceea ce
privete datele ordonate dup cele dou vrste, i media i suma catalogate
negative i pozitive. Valorile pentru dou zeci i patru de luni sunt mai mari
dect cele pentru optsprezece luni.
Al doilea tabel indic nivelul de
semnificaie al acestui test. n loc s
foloseasc tabelul valorilor critice,
computerul utilizeaz o formul care
stabilete o conexiune cu distribuia Z.
Scorul Z este de 2,558, care are o
probabilitate two-tailed de 0,011. Aceasta nseamn c diferenele dintre cele
dou variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.
99
Introducere n SPSS 2011 Mihaela Naidin
10 copii care provin din familii biparentale i 10 copii care provin din familii
monoparentale.
Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9
Pasul 1:
- este acelai ca i cel prezenta la capitolul XI.
Pasul 2:
Se selecteaz:
Analyze
Nonparametric tests
2 Independent Samples
Pasul 3:
Se selecteaz
Emotivitate i se
apas butonul
pentru a introduce
parametrul
Emotivitate n
caseta Test Variable
List.
Se selecteaz
Familie i se apas
butonul pentru a
introduce Familie n
caseta Grouping
Variables.
100
Introducere n SPSS 2011 Mihaela Naidin
Pasul 4:
Se poate ignora primul dintre cele dou tabele de output. Acest tabel
indic faptul c rangul mediu dat parametrului Emotivitate pentru primul grup
(adic valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adic
valoarea 1) este de 7,85. Aceasta nseamn c valorile din grupul 2 (biparentale)
au tendina s fie mai mari dect cele din grupul 1 (monoparentale).
102
Introducere n SPSS 2011 Mihaela Naidin
ANOVA simpla permite compararea simultana a trei sau mai multe
grupe meninnd nivelul la valoarea dorita, de maxim 0,05.
Procesarea analizei one-way de varian cu scoruri nerelaionate este
exemplificat folosind datele din tabelul urmtor, care indic rezultatele obinute
de ctre diferii participani n condiii diferite. Este vorba despre un studiu
asupra efectului unor tratamente hormonale i placebo asupra depresiei.
Astfel, medicamentul este variabila independent i depresia este
variabila dependent.
Date studiu
Grup 1 Grup 2 Grup 3
Tratament hormonal Tratament hormonal Placebo
8 4 4
11 2 6
8 4 4
Pasul 1:
Se introduc datele.
Se codific cele trei
condiii cu valorile 1, 2, 3.
Se eticheteaz Hormon 1,
Hormon 2 i Placebo.
Pasul 2:
Se selecteaz:
Analyze
103
Introducere n SPSS 2011 Mihaela Naidin
Comparea Means
One-Way ANOVA.
Pasul 3:
Se selecteaz depresie i se
apas butonul de lng
caseta Dependent List
pentru a introduce
parametrul n caset.
Se selecteaz Condiie i
se apas butonul de lng
caseta Factor pentru a
introduce parametrul acolo.
Se selecteaz Options
Pasul 4:
Se selecteaz metodele statistice
descriptive i Momogenity of variance
test.
Se selecteaz Continue.
Se apas OK din ecranul anterior, care
va reaprea.
104
Introducere n SPSS 2011 Mihaela Naidin
105
Introducere n SPSS 2011 Mihaela Naidin
106
Introducere n SPSS 2011 Mihaela Naidin
privare de somn
3 ore 6 ore 9 ore
Consum alcool 14 16 20
10 14 22
15 23 30
Fr alcool 9 11 10
9 8 14
12 11 12
Pasul 1:
Se introduc datele. Cele ou coduri pentru
Alcool (1=alcool; 2= fr alcool) n prima
coloan.
Pasul 2:
Se selecteaz:
Analyze
General Linear Model
Univariate
107
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Se selecteaz Erori i
se apas butonul de
lng caseta Dependent
Variablepentru a
introduce parametrul
acolo.
Se selecteaz Alcool
i Privare de somn fie
mpreun, fie separat, i
se apas butonul Fixed
factor(s) pentru a le
introduce n caset.
Se selecteaz
Options
Pasul 4:
Se selecteaz
Descriptives
statistics i
Homogeneity test.
Se selecteaz
Continue.
n ecranul anterior,
care va reaprea, se
selecteaz Plots.
Pasul 5:
Se selecteaz Alcool
i se apas butonul
de lng caseta
Horizontal axis
pentru a introduce
parametrul acolo.
Se selecteaz Privare
de somn i se apas
108
Introducere n SPSS 2011 Mihaela Naidin
butonul de lng caseta Separate Lines - pentru a introduce opiunea n
caset.
Se selecteaz Add
.
Se selecteaz Continue. Se apas OK din ecranul anterior
care va reaprea.
Al patrulea
tabel indic
nivelele de
semnificaie
109
Introducere n SPSS 2011 Mihaela Naidin
pentru cele dou variabile Alcool i Privare de somn, i interaciunea dintre
acestea.
Pentru prima variabil, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai dou condiii pentru ca acest
efect s se produc, se poate conhide c scorul mediu al uneia dintre condiii
este mult mai mare dect pentru cealalt.
Pentru a doua variabil a privrii de somn, aceasta este egal cu 5,797,
valoare care are un nivel exact de semnificaie de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce nseamn
c mediile celor trei condiii legate de somn nu sunt similare.
Mediile care difer de celelalte pot fi determinate ulterior prin folosirea
testelor de comparaii multiple, cum este Testul t pentru eantioane
independente.
raportul F pentru interaciunile dintre cele dou variabile (Alcool i Privare
de somn) este de 2,708 nivelul de semnificaie al acestui raport este de
0,107 nu este nicio interaciune semnificativ.
Acest grafic este realizat pentru mediile celor ase condiii. El a fost editat
cu ajutorul comenzii Chart Editor.
privare de somn
3 ore
22,50 6 ore
9 ore
Estimated Marginal Means
20,00
17,50
15,00
12,50
10,00
alcool
110
Introducere n SPSS 2011 Mihaela Naidin
111
Introducere n SPSS 2011 Mihaela Naidin
Date studiu
Grup 1 Grup 2 Grup 3
Tratament hormonal Tratament hormonal Placebo
8 4 4
11 2 6
8 4 4
Pasul 1:
Se introduc datele.
Se codific cele trei
condiii cu valorile 1, 2, 3.
Se eticheteaz Hormon 1,
Hormon 2 i Placebo.
Pasul 2:
Se selecteaz:
Analyze
Comparea Means
One-Way ANOVA.
112
Introducere n SPSS 2011 Mihaela Naidin
Pasul 3:
Se selecteaz depresie i se
apas butonul de lng
caseta Dependent List
pentru a introduce
parametrul n caset.
Se selecteaz Condiie i
se apas butonul de lng
caseta Factor pentru a
introduce parametrul acolo.
Pasul 4:
Se selecteaz:
Tukey
Duncan
Scheffe.
Se apas
Continue.
Se selecteaz OK
n ecranul care va
aprea din nou.
113
Introducere n SPSS 2011 Mihaela Naidin
Subgrupele omogene.
Grupul hormonului 2 i al
controlului Placebo
aparin aceleiai
subgrupe, ceea ce
nseamn c nu sunt
semnificativ diferite.
114
Introducere n SPSS 2011 Mihaela Naidin
grupe.
* Sunt reprezentate mediile grupelor din subgrupele omogene.
a. Folosete Media armonic a dimensiunilor eantioanelor
=3,000.
115
Introducere n SPSS 2011 Mihaela Naidin
116
Introducere n SPSS 2011 Mihaela Naidin
117
Introducere n SPSS 2011 Mihaela Naidin
118