Documente Academic
Documente Profesional
Documente Cultură
ÎNREGISTRAREA,
PRELUCRAREA ŞI ANALIZA
STATISTICĂ A DATELOR
SPSS
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Data este un model de reprezentare a informaţiei, accesibil unui anumit procesor (om, program calculator). Cu
acest model se operează pentru a se obţine noi informaţii despre anumite fenomene şi procese.
Colecţia de date este o mulţime relativ omogenă de date care priveşte un anumit domeniu, proces, activitate
sau obiect şi este organizată şi dispusă sistematizat pe un suport de memorie.
Dacă este definit un mecanism de selectare a elementelor colecţia de date se numeşte structură de date.
Organizarea datelor reprezintă procesul de identificare, definire, evaluare, structurare şi memorare a
informaţiilor, în cadrul unui sistem informaţional în general, sau în activitatea de elaborare a unui program, în
particular.
Organizarea datelor presupune:
Pagina 1
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
I Open Data
ETALONARE
Pagina 2
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
59 AM_es.sav
M AVRRUls •*]
Calculais
Recent
Batanare
AC.doc MQ
Manual AC.doc
Desktop
4] MVR .doc
iiS] MVR.xls 4]
RC1 xls ra
TD_TR.xls
Doc
ume
nts
Open
Paste
Cancel
MinjHfze string widths based on
în SPSS, la deschiderea ferestrei Open Data, este selectat implicit SPSS (*.sav) la Files of type, ceea ce înseamnă
că nu veţi vedea decât fişierele cu extensia .sav (SPSS). Pentru a putea vizualiza toate tipurile de fişiere
selectaţi AII Files (*.*) din lista cu tipurile de fişiere.
Pentru fişirele create în Excel (.xls, .xlsx), apare fereastra Opening Excel Data Source, în cadrul căreia selectaţi
foaia de calcul (worksheet) cu datele pe care doriţi să le deschideţi (1), precizaţi dacă primul rând poate fi citit
ca nume de variabile (2).
::\User§talexgaianuî>ocuments\(B]
Teste Psihologice
jß Read variaare names from\e first
CWETALONAREWVRRI.xls
row^fdata]Worksheet |M !
Ra
AVJRI1 _marO!l[A1:AQ44]
ng
Maximum »j width for
e:
string columns:
i32767
Versiunile mai vechi ale SPSS alocă pentru denumirea variabilelor 8 caractere, iar dacă în fişierul de bază
acestea sunt compuse din mai mult de 8 caractere, SPSS va micşora denumirea şi va face modificări astfel încât
să fie un nume de variabilă unic. După confirmarea specificaţiilor prin comanda Continue, SPSS deschide
datele şi afişează un raport în SPSS Viever (Output)'.
Pentru fişiere de tip tabelar, puteţi să precizaţi celulele pe care doriţi să le dechideţi la Range, sub forma
A1:M15, spre exemplu. Veţi deschide astfel doar datele care vă interesează, dacă foaia de calcul este foarte
mare.
Tipurile de fişiere de date tratate mai jos sunt cele utilizate de noi pe parcursul cursului şi sunt şi cele mai uzual
utilizate în ştiinţele sociale.
Un fişier de date este rectangular. Dimensiunile fişierului de date sunt determinate de numărul de
cazuri/situaţii (pe linii) şi variabile (pe coloane). în interiorul fişierului de date nu sunt căsuţe goale. Toate
căsuţele conţin o valoare, chiar dacă acea valoare nu se vede (lipseşte).
• Pentru variabilele string, valorile care depăşesc lungimea definită sunt micşorate.
• Dacă nu citiţi numele variabilelor din fişier, programul desemnează nume din oficiu: VI, V2, V3 şi aşa mai
departe.
Prin variabilă se înţelege măsurarea/cuantificarea unui indice, indicator sau dimensiune a realităţii.
Tipuri de măsurare:
nominală (categorială);
- ordinală;
- de tip interval;
- de raport.
Primele două tipuri sunt calitative, ultimele două cantitative (numerice).
Măsurarea nominală presupune o categorizare a variabilei fără a indica o anumită ordine ori cantitate
(exemplu: sex, stare civilă). Dacă sunt notate cu cifre (1 - feminin, 2 - masculin) nu trebuie procesate în termeni
de cantitate sau ordine.
Măsurarea ordinală presupune o ierarhie şi exprimă locul sau ordinea într-un şir de date. Un exemplu banal
este locul ocupat de cineva la o competiţie (primul, al doilea, ultimul). In acest caz, numerele pot fi comparate
între ele în termeni de "mai mult", "mai puţin" sau "egal". Trebuie însa subliniată valoarea ordinală a
numerelor. Dacă o persoană ocupă locul doi, nu putem spune că ea este la egală distanţă între locul unu şi
locul trei. Să luam exemplul unui student care a obţinut media 9,80 la examenul de admitere şi a ocupat locul
al doilea. Locul unu ar fi ocupat de un alt student care a avut media de 9,85, în timp ce pe locul trei s-a situat
un student cu media 9,30. în cazul măsurărilor ordinale, diferenţa numerică în clasament nu este necesar egală
cu diferenţa numerică exprimată în unitatea de măsură utilizată în acel caz (cinci sutimi, respectiv cincizeci de
sutimi).
Cele două tipuri de măsurători amintite pâna acum presupun întotdeauna utilizarea unor teste statistice
neparametrice.
Măsurarea de interval permite compararea dintre date. Diferenţa dintre două rezultate 4 şi 2 este egală cu
diferenţa dintre 6 şi 4. In cazul unui test de inteligenţă diferenţa dintre 100 IQ şi 50 IQ este egală cu diferenţa
dintre 100 IQ şi 150 IQ. Deficienţa majoră a acestei măsurători este că valorile respective nu pot fi multiplicate
Pagina 3
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
sau divizate. Astfel noi nu putem concluziona că un subiect care a obţinut 150 IQ este de 1,5 ori mai inteligent
decât un altul care a obţinut 100 IQ şi nici de 3 ori mai inteligent decât unul care a obţinut 50 IQ.
Cele mai multe instrumente psihometrice sau educaţionale implicate în măsurarea variabilelor cognitive sau
comportamentale se găsesc la aceste trei nivele (nominale, ordinale, de interval).
Măsurarea de raport posedă toate calităţile unei măsurări de interval şi are în plus două noi. Permite
multiplicarea sau divizarea datelor (2 kg sunt jumătate din 4 kg şi dublul unui kg). Acest tip de măsurare indică
de asemenea valoarea zero absolut, ce arată lipsa totală a cantităţii măsurate. Cele mai multe caracteristici
fizice (greutate, înălţime, timp de reacţie, nivelul adrenalinei) pot fi măsurate astfel.
Ultimele două tipuri de măsurători (de interval, respectiv de raport) sunt expresii cantitative ale variabilelor
care pot fi supuse analizei statistice parametrice, cu mici excepţii.
în SPSS măsurarea de interval şi de raport poartă denumirea de Scale.
(C) SPSS - TIPURI DE FIŞIERE, FERESTRE ŞI MENIURI
în SPSS se lucrează cu trei tipuri de ferestre, al căror conţinut necesită salvarea. Fereastra Data Editor (1),
prima fereastră pe care o întâlniţi, este folosită pentru a defini şi pentru a introduce datele, precum şi pentru a
efectua proceduri statistice. Rezultatele testelor statistice apar in fereastra Viewer (2).
Fereastra Syntax Editor (3) poate fi folosită pentru a ţine o evidenţă a operaţiilor pe care le efectuaţi asupra
datelor. Această fereastră se va deschide automat atunci cand daţi click pe o funcţie Paste. Atunci când
selectaţi anumite cazuri în vederea analizei, când transformaţi datele sau când calculaţi o corelaţie, accesarea
funcţiei Paste va stoca o înregistrare a ceea ce s-a operat (în limbai de comandă).
;3v SPSS Data
[DataSetl]- Editor
"Se 6*
|w Data Transform
Analyze
Graphs Utiliti Add-
es ons
yyinctow ţjelp
Pagina 3
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
HB Edit |ew Data Transform [nsert Format Analyze Graphs ytrnties Add-ons VWidow Help
Statistics
I SPSS
Processor
is ready
ft "S.-'taxK -
] £j§ Edit few Data Transform Analyze
SfSS Syntax Run Add-onsWindow Hefp:
GraphsUtilities i
Active:
Editor DataSetl ! ;h -HbSuENCIES VARIABLES=
exam
/STATISTICS=STDDEV MINIMUM MAXIMUM
MEAN /QRDER=ANALYSIS.SPSS Processor is
readyIn 5 Col 1
Fereastra Script Editor permite personalizarea SPSS prin intermediul unui limbaj de scriptare, Sax Basic
(compatibil Visual Basic for Applications). Nu ne vom referi la această fereastră.
Fiecare fereastră salvează câte un tip de fişier, recunoscut după icon şi extensie.
Pagina 6
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
.sav
Pentru a defini, introduce, şi edita datele şi pentru a rula teste statistice
Data Editor
Conţine rezultatele procedurilor statistice
Viewer
.spo Această fereastră se activează atunci când daţi click pe funcţia Paste şi
salvează o înregistrare a operaţiilor care sunt "lipite".
Prncentrul
SPSSN rie nrnmnvarpla RïameniI
Valid100,00Missing
Deviation21,32Minimum15,00
,00Mean58,10IIStd.-
Pagina 6
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Pe lângă cele trei ferestre de bază (Data Editor, Viewer şi Syntax Editor), mai există ferestre pentru editarea
tabelelor (Pivot Tabel Editor), editarea diagramelor (Chart Editor), editarea textului (Text Output Editor),
care se deschid la dublu-click pe obiectul respectiv, sau click dreapta şi open ... Editor.
Meniurile ferestrelor
Data
File Edit
Editor
View Data Transform Analyze Graphs Utilities Add-ons Window Help
I T W t? «a *. „L „ \a
File Edit View Data Transform Insert Format Analyze Graphs Utilities Add-ons Window He!
Viewer
ft y-,
Syntax Editor
File Edit View Data Transform Analyze Graphs Utilities Run Add-ons Window Hel
File - este utilizat pentru creare, deschidere, export de fişiere diverse (de date, rezultate, comenzi etc),
imprimarea datelor şi deschiderea fişierelor în care s-a lucrat recent;
Edit - permite editări uzuale pentru date numerice, text sau obiecte grafice (copieri, alipiri etc.) în aceeaşi
aplicaţie sau în alta (Excel, spre exemplu);
View - controlează modul de afişare a uneltelor, a liniaturii, a identificatorilor de valori (valorile pot avea
ataşate denumiri explicite);
Data - gestionarea datelor (variabilelor şi cazurilor);
Transform - transformarea datelor (variabilelor şi cazurilor) şi obţinerea unor noi variabile calculate pe baza
celor existente;^^;^^" Jo.^)^^OQ/^ /CCJ-^-&' O/* <yc*/t>)
Insert - pentru fereastra Viewer, care ajută la inserarea de heading, title, page title, text şi text file;
Format - pentru fereastra Viewer, care ajută la alinierea obiectelor din fereastră; Analyze -
prelucrări statistice; Graphs - creare de diagrame;
Utilities - permite afişarea informaţiilor despre variabile, definirea unor mulţimi de variabile etc;
Run - pentru fereastra Syntax, care ajută la rularea comenzilor salvate; Add-ons -
pentru a solicita extensii ale programului; Window - gestionarea ferestrelor; Help -
opţiunea Help.
Majoritatea meniului este comun celor trei ferestre de bază, excepţie făcând Insert şi Format (specifice doar
ferestrei Viewer) şi Run (specific ferestrei Syntax).
Fiecare fereastră SPSS are propria bară de instrumente (toolbar), care perniţe rapid şi uşor accesul la aplicaţii
obişnuite. La indicarea cu mousse-ul a unuia din instrumentele din bară, se afişează explicaţie pentru acel
instrument/opţiune (ToolTips).
8 A 55 gèl
5 : scopul_e
Puteţi personaliza bara de instrumente astfel încât să conţină opţiunile pe care le utilizaţi mai des.
í'
24 26 Feminin A 26 cirmin? Numeric 11
25 20 Feminin
CD
07 À
* LH II
Definirea variabilelor se face în pagina Variabile View. Pentru fiecare variabilă este alocată o linie.
Pagina 6
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
.yê « ìli OB
Name Typ Wid Decim Label Values Missi Columns Meas
e th als ng Align ure
L i varsta I 11 0 Vârsta None None 8 M Right # Scale
Numeri
c
sex String 8 0 Sexul None None 8 Left Nominal
rO
M 0
a c siruri_ada
ptre
Numele variabilei este introdus prin tastarea numelui. Numele variabilei trebuie limitat la un număr mai mic
de caractere (variantele mai vechi ale SPSS acceptă maxim 8 carctere). Numele trebuie neapărat să înceapă cu
o literă. Variabilele trebuie să aibă nume unic. Nu se pot folosi spaţii sau caractere speciale (de exemplu !,?,' si
*).
Tipul variabilei se stabileşte în fereastra Variabile Type, care se deschide după ce faceţi clic pe butonul din
celula de pe rândul variabilei respective şi de pe coloana Type (marcat cu ...).
Pagina 6
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Toate variabilele noi se presupun a fi numerice. Conţinutul cutiei de dialog Variable Type depinde de tipul
datei selectate. Pentru anumite tipuri de date există ferestre de text pentru lungimea şi numărul lor de
zecimale (1), pentru altele se poate selecta pur şi simplu un format din lista de exemple (2).
Pagina 9
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
j Variable
Numeric$*Co
Variabl Type
mmaiWfr«
e^MmDot
Type Numeric
i Scientific
notatiolîn,ntn Comma
y Unit t£—Date Dot
'Custom Scientifi
currencyString c
Decimal P Widt notation
Date
Dollar
Ca Custom
nc currency
el
Help ©SSI
Help
Pentru formatul numeric, virgulă şi punct, pot fi introduse valori cu orice număr de zecimale (până la 16) şi
întreaga valoare este memorată în interior. Data View afişează doar numărul definit de zecimale şi rotunjeşte
valorile cu mai multe zecimale. Cu toate acestea valoarea completă este folosită în prelucrări/calcule.
Pentru variabilele string, numărul de caractere acceptat rămâne cel definit în Variabile Type (1), iar dacă se
importă valoarea respectivă dintr-o altă aplicaţie şi este mai mare decât cea definită, vor fi afişate doar primele
caractere, celelalte nefiind păstrate în memorie.
Pentru formatele tip data se pot folosi liniuţe (slash-uri), liniuţe de dialog (dashes), spaţii, virgule sau perioade
ca numere, abrevieri de 3 litere sau nume complete pentru valorile lunilor. Datele de format general dd-mm-
yy sunt afişate cu liniuţe de dialog pentru delimitare şi abrevierele de 3 litere pentru lună. Datele de format
general dd/yy/mm şi mm/dd/yy sunt afişate cu slash-uri pentru delimitare şi numere pentru lună. în interior
sunt numerotate ca şi număr de secunde. Liniuţa secolului pentru datele care conţin anii formaţi din 2 cifre
este determinată din opţiunile setate (din meniul Options, pagina Data).
Definirea etichetelor furnizează variabile descriptive şi etichete valorice. Deşi numele variabilei are lungime
limitată, etichetele pot conţine până la 256 caractere. Acestea sunt afişate în fereastra Viewer.
Prin definirea de valori, se pot aloca etichete pentru anumite valori ale variabilei. Acest lucru este folosit în
special dacă fişierul de date foloseşte coduri numerice pentru a reprezenta categoriile numerice (de exemplu
codul 1 şi 2 pentru masculin şi feminin). Valorile etichetelor pot avea o lungime de maximum 60 de caractere.
In Value Labels se pot modifica sau şterge variabile si valori ale etichetelor.
Value Label;
Value
labels Spelling.-
Value: ji
Label:
Feminin
1 = Temon"
2 = "Masculin"
Help
Pe coloana de definirea valorilor lipsă (Missing) se poate defini de utilizator ce sa apară în celulă în cazul în
care lipsesc valori. Această opţiune este folosită mai mult pentru a putea şti de ce lipsesc valori. De exemplu,
poate doriţi să faceţi diferenţa între informaţiile lipsă pentru că un subiect a refuzat să răspundă sau pentru că
întrebarea nu i se potrivea acelui subiect. Valorile datelor specificate ca valori lipsă pentru variabilele definite
de utilizator sunt transmise pentru un tratament special şi sunt excluse din majoritatea calculelor. Se pot
introduce până la 3 valori individuale lipsă, o limită a valorilor lipsă sau o limită plus o valoare discretă. Limitele
pot fi specificate doar pentru variabilele numerice.
Nu pot fi definite valori lipsă pentru variabilele string lungi (variabilele string mai lungi de 8 caractere).
Missing Values
value
OK Cancel || Help
Măsurarea variabilei (Measure) se poate face scalar (la variabilele de interval sau de raport), ordinal sau
nominal. Variabilele cu măsurare nominală şi ordinală pot fi de tip string (alfanumerice) sau numeric.
Atât variabilele nominale cât şi cele ordinale sunt tratate ca variabile categoriale.
Pentru fişierele de date în format SPSS create în versiuni mai vechi, sau pentru datele importate din foile de
calcul Excel, se aplică următoarele reguli:
- variabilele numerice fără valorile etichetelor definite, dar cu un număr mai mic de valori unice sunt
stabilite ordinale;
- variabilele numerice fără valorile etichetelor definite, dar cu un număr mai mare de valori unice, sunt
stabilite scalare.
înregistrarea datelor
Pentru aceasta trebuie să aveţi deschisă fereastra Data Editor, în pagina Data View. Datele se introduc numai
după definirea variabilelor (excepţie fac valorile numerice simple). Pe parcurs, se mai pot face modificări de
atribute ale variabilelor.
Datele se introduc în orice ordine (după caz sau după variabilă), pentru arii selectate sau pentru celule
individuale. Celula activă este marcată în albastru, cu chenarul îngroşat (1). Numele variabilei şi numărul
rândului celulei active (pe care se află celula activă) sunt afişate în colţul din stânga sus al meniului Data Editor
(2). Când selectaţi o celulă şi introduceţi valoarea unei variabile, acea valoarea este afişată în interiorul celulei şi
în fereastra de sub Toolbar (3). Valorile variabilei nu sunt înregistrate până ce nu apăsaţi enter sau selectaţi o
altă celulă.
¡¿i H iStiXpT #% i
i 1%
^a
1 : varş I T' " §—
l 1
Dacă introduceţi o valoare într-o coloană goală, fereastra Data Editor crează automat o variabilă nouă şi îi
atribuie un nume variabilei. Dacă aveţi o variabilă cu valori definite, în celula respectivă apare o săgeată care
deschide lista cu etichete pentru a o alege pe cea dorită (asta dacă instrumentul Value Labels este activ în
Toolbar [4]).
■ Definirea tipului variabilei şi dimensiunea (lăţimea) variabilei determină tipul valorii care poate fi introdusă
în celulă.
■ Daca tastaţi un caracter care nu este permis de definirea tipului de variabilă, Data Editor sună (face beep)
şi nu introduce caracterul.
■ Pentru variabilele string, caracterele în plus faţă de lungimea definită nu sunt permise.
■ Pentru variabilele numerice, valorile introduse care depăşesc lungimea (dimensiunea definită) pot fi
introduse, dar meniul Data Editor afişează notaţii ştiinţifice sau asterixuri în celulă, pentru a indica dacă
valoarea esta mai mare (lată) decât lăţimea definită. Pentru a afişa valoarea în interiorul celulei schimbaţi
dimensiunea definită a variabilelor (dimensiunea coloanei nu are de a face cu dimensiunea variabilei).
Alexandru Găianu
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA SI ANALIZA STATISTICĂ A DATELOR
Ordonarea cazurilor
Datele înregistrate în Data Editor pot fi ordonate (sortate) după o variabilă, în ordine crescătoare sau
descrescătoare (Ascendending/Descendending), utilizând comanda Data/Sort Cases (1) şi introducând
variabila după care dorim să realizăm ordonarea în fereastra Sort Cases (2).
Această ordonare ajută în anumite situaţii în care dorim, spre exemplu, să avem cazurile aranjate în ordine
alfabetică înaintea unei operaţii de selectare a cazurilor cu pas statistic.
H Define Dates... t
[Asc
m
23
IdentiiVDyplicate Cases...
B endi
ng j
i .:. SortcJLs .. B
I
Reset
Desc
4 endi
Canee
I B
ng
J
5
pjf
CD
Sort vyiabjes ..
? Tj^fpose .
I 8
CO
I
CD
ni Restructure
Ordonarea variabilelor
Variabilele înregistrate în Data Editor pot fi ordonate (sortate) după un anumit criteriu, utilizând comanda
Data/Sort Variabiles (3) indicând criteriul după care dorim să realizăm ordonarea în fereastra Sort Variabile
View (4).
Putem grupa variabilele după tip sau după nume într-o anumită zonă în setul de date.
Namart 1
Typ ^T J
gj *Ur!ţ ;tied2 [DataSet23 - SPSS Data Editor Width /
File Edit View Data Transform Analyie G_rapns Utilities Add-ons Window
' Define Variable Properties...
ii 'jfiecirnals jf
i LaFlH ■ 11 ^
1 : Vârsta
*ig Copy Data Properties...
Values
Scopul evaluării
gi Define Dates. .
Missing
B
TfNtentify Duplicate Cases...
Align
iMeasure
^3 Sort lases...
Sort Order-----------------------
□R
3|I ^Ariafejes..
1 CD
Sort ■ AscencJng
CD
Tranwcse... Descending
6V
^ SronCture...
7 V
CD
Define O
gtjj
ze all cases, do not create groups
Dates.. I by
$ Varsta [Varsta] Scopul
_proba1
Sets.. 0misiuni
gi
[Om
a . . . . „ . II
Reacţii eronate_prob...
siruri/minut_prob... ţ
i*J Sort the fie by grouping gr Nr.
BBBBBBBB
B sport
B
B
Selectarea cazurilor
Foarte importantă în
eşantionare.
B "Untrtted2
[DataSet2
$ Varsta [Varata]___________."'j
g>>Sex(1 F,2M])[Sex (1 F... 0
Reacţii corecte_adaptar.. gţ-
] - SPSS Omiswni_odaptare [Oml. 0
Reacţii eronote_adaptar 0 r*
a U
Reacţii corecte_pfoba2 ... $
Define Variable Properties... OrrisiUTi _proba2 [Omisi.. 0
% Copy Data Properties... Reseti et oriate jirotoa2 .. 0 Nr
Ì1 : Varsta srurUninut_proba2 [.. $ Rar* ot
Varsta [RVarsta] $ Rar* of Varsta
W Define Dates...
[RAN001] # Rar* ot varsta
[RAN002]
1 [T JI
T Define Multiple Response Sets...
______
Identity Duplicate Cases
2
3
4 ~'x.: Sort Cases... IP" Sort Variables..
5
Transpose...
6
7 -q^s Restructure...
Merge Files
e
9 \M Aggn>|ate...
ScopyD_atalet
10
j
11 SpMFile. 1
I
12
*~ Select Giles
13
'■>: AS cases
) If condition is satisfied
■ • : [_________________
j
Se realizează prin Data/Select Cases (8), după care se stabileşte procedura de selecţie (9), care poate fi o
condiţie de satisfăcut (variabila să aibă o anumită valoare, spre exemplu), o selecţie întâmplătoare
(ponderată sau precizată exact), o selecţie de la ... la ... sau până la ... şi în fine, folosind o variabilă drept
filtru. Setul de date rezultat poate înlocui setul de date existent sau se poate deschide într-o fereastră Data
Editor nouă, iar cazurile neselectate pot fi şterse sau nu.
De multe ori sunteţi puşi în situaţia de a modifica modul în care sunt înregistrate valorile unor variabile
(transformarea variabilei vârstă în grupe de varsă, spre exemplu) sau de a uni mai multe variabile în una
singură (medii, spre exemplu). Deoarece acest lucru se realizează foarte uşor în SPSS, este bine să introducem
în setul de date cât mai multe date în forma lor originală, iar variabilele noi create să nu le înlocuiască pe cele
vechi. Astfel, vom păstra în permanenţă datele originale pe care altfel le-am pierde.
Majoritatea procedurilor de transformare şi de generare de noi variabile le realizăm în submeniul Transform.
Submeniul este împărţit în mai multe sectoare, care au următoarele roluri:
■ crearea de variabile (Compute Variabile) şi numărarea cazurilor (Count Occurrences of Values within
Cases); recodificări de variabile; ierarhizarea scorurilor (Rank Cases);
crearea, generarea, transformarea datelor de forma data şi timp; înlocuirea
valorilor lipsă; generarea de numere aleatoare.
I bd_21.sav
[DataSeil]
File Edit - SPSS
13:q3_11
Data Editor
Compute Variable... X? Court
View ^8
2345678 Functions
Values within Cases
:% C* de 96
Data Ce va nemBumeste c
1
3
Recode into Same Variables x~y Recode
y| and
1
Satisfacţia fata de pr
into Different Variables ii~y Automatic | Satisfacţia tata de c. yj
Recode... Satisfacţia fata de mi \£%
Satisfacţia tata de c 1%
1 ■** *-* Spedai
Visual Binning...
i \^ Variables:
J
1
U Rank Cases...
0
Values..
Satisfacţia fata de s. , |
Satisfacţia fata de re yj
Satisfacţia relaţiile fu. ■% I
Satisfacţia fata de e im
Satisfacţia fata de c !;£§
Satisfacţia tata de im Ml
Care din
armatoarele.
Ce salariu vi s-ar cu..
Data angajării [qS] \$
Vârsta in ani impNnrti W:
Sexul
8 I» Function
group.
> 7 \\ i 9
a este d... urneşte cel ... ia
4J J!6J
fala de progr... isfactia fata de
5
condi... Satisfacţia fata de
jAII T*j
mijloa... Satisfacţia J i 2 Ji 3 J
— :fata1 de
Arithmetic
CDF & Noncentral CDF
ij ; oj|"j
conţi... Satisfacţia fata de salari...
Conversion
Satisfacţia fata de relaţii. .
( ) functi...
Delete Current Date/Time
Satisfacţia relaţiile
Date Arithmetic »\
Satisfacţia fata de evalu...
Satisfacţia tata de condi
Satisfacţia fata de imagi Care din Functions
următoarele im Ce salariu vi s-ar
cuveni Data angajării |q6] Vârsta
ir am imchniti [q7] Sexul |qB)
Ultima scoală absolvita [. Starea
crvia |qlO]
Uzual, această procedură ajută la calcularea unor valori noi pe baza celor existente în alte variabile (calcularea
unei note standardizate, spre exemplu) sau la stabilirea unui raţionament logic de afişare a valorilor unei
variabile existente (să afişeze numai salariul mai mare sau egal cu 750$, spre exemplu).
Un dezavantaj la SPSS este faptul că nu păstrează algoritmul logic utilizat pentru crearea variabilelor noi, iar
atunci când nu ne mai amintim cum am creat variabila poate fi neplăcut. Va trebui deci să notăm algoritmii
care au stat la baza creării noilor variabile sau să salvăm comanda în fişiere .sps (Syntax Editor).
Transformarea variabilelor
Pentru a nu pierde datele originale, cel mai frecvent se transformă variabilele în variabile noi, pe care SPSS le
adaugă setului nostru de date. Pentru asta deschidem fereastra Recode into Different Variabiles din submeniul
Transforme (17), selectăm variabila pe care dorim să o transformăm şi atribuim noii varibile nume şi etichetă
(18).
Transformarea variabilelor se poate face dintr-o multitudine de motive, printre care şi următoarele:
■ gruparea în câteva categorii a unei variabile nominale, care altfel ar avea foarte puţine cazuri;
■ gruparea variabilelor numerice în intervale de scoruri;
■ recodificarea itemilor care trebuiesc inversaţi.
String Variable
q4~>q21
:de Label:
"bó j
Fie Edi View -:: :
21-sav
lip birj
^
en**Ncunt Vaiues within L [f... : (optionalcases flection condition)
Atunci când este cazul, putem adăuga un algoritm logic (comanda If...) printr-o formulă proprie sau o funcţie
predefinită (14). Specificaţiile privind valorile vechi şi cele noi vor fi stabilite în fereastra Old and New Values
(19).
Ne putem confrunta cu următoarele cazuri:
■ Transformarea valoare cu valoare - activăm Value în secţiunea Old Value (20), introducem prima valoare
(acestea trebuie sa le avem deja notate undeva), iar la New Value (21) înregistrăm valoarea transformată
(setăm strings sau numeric mai jos - 22), apoi a doua valoare veche şi tot aşa până epuizăm valorile vechi).
Dacă în variabila pe care o transformăm avem valori lipsă putem să le atribuim o valoare în variabila
nouă, bifând System- or user-missing (23), iar dacă avem şi alte valori în variabila veche, pe care nu
dorim să le codificăm, le putem stabili o valoare comună (etichetă) - (24).
Dacă în variabila veche vom avea valori cărora nu le atribuim valori şi în variabila nouă, ;estea vor lipsi
din variabila nouă.
J Recede inte Different Variables: Oíd and New Values
Now Value
Variables:
; - Value.
care sa
interflptjuriejLJ
% Cancel
valué
permită munca
indrviduate j'C
is) —> 'birou
resursa
informaţionala' 22 \
; |'D' --> i-*; Output variaţi* are strings Width, f sq
Pagina 38
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Recode inte
Different Variables;
Old and New
Value;
Transformarea valorilor în felul următor - stabilirea unei valori din variabila veche, de la care în jos putem
stabili o valoare nouă şi/sau a unei valori din variabila veche, de la care în sus putem stabili o altă valoare
nouă (28).
Fereastra Viewer afişează rezultatele prelucrării detelor (Output-uri cu tabele, explicaţii, diagrame şi comenzi).
Informaţiile colectate în fereastra Viewer pot fi formatate, organizate şi modificate de către utilizator. Ele sunt
salvate în fişiere cu extensia .spo.
Deşi fereastra Viewer se deschide şi pentru unele operaţii realizate în fereastra Data Editor (salvări şi modificări
asupra setului de date), ea este explorată de utilizator atunci când face prelucrări statistice asupra variabilelor din
setul de date cu comenzi din submeniul Analyze.
Descrierea submeniului Analyze
Reports - generează în Output mai multe tipuri de rapoarte referitoare la variabile sau asocieri de variabile, care
includ toate cazurile, pe coloană, rand sau tridimensional.
Descriptive Statistics - generează statistici descriptive (medie, mod, mediană etc.) şi tabele de frecvenţe. Tot aici
se poate face o explorare generală a datelor, se pot realiza asocieri de variabile în tabele cu două intrări
(crosstabs) şi se pot realiza teste de verificare a normalităţii.
Compare Means - pentru calcularea mediilor, compararea acestora (testul t pentru eşantioane perechi sau
independente) şi pentru analiza variantei - ANOVA pe o cale (one-way independent ANOVA).
General Linear Model - pentru analiza variantei - ANOVA pe două căi (two-way) pentru eşantioane perechi,
independente sau mixte, ANOVA pe o cale (one-way) pentru repetarea măsutătorilor şi analiza de variantă
multivariată (MANOVA).
Correlate - permite verificarea legăturilor dintre evoluţia variabilelor, cum ar fi calcularea coeficienţilor de
corelaţie Pearson, Spearman şi Kendall.
Regession - permite analiza de regresie (regresia simplă, regresia multiplă).
Dimension Reduction - pentru analiza factorială.
Scale - pentru anliza de item (aprecierea validităţii şi fidelităţii - coeficienţii Apha, Guttman etc).
Nonparametric Tests - SPSS oferă o varietate de statistici neparametrice cum ar fi testul x2, testul semnului,
testul Wilcoxon, testul U Mann-Whintney etc.
Fereastra Viewer
Datele prelucrate şi afişate în fereastra Viewer sunt aşezate în ordinea prelucrării. Fişierul salvat temporar în
memoria de lucru poartă denumirea de Output, denumire atribuită de aplicaţie.
Fereastra este împărţită în două:
■ Partea stângă - structura sau cuprinsul Output-ului (1);
■ Partea dreaptă - conţinutul Output-ului (2).
Este ca şi cum am avea în partea stângă un catalog care indică volumele aflate într-o bibliotecă, iar în partea
dreaptă conţinutul volumelor. Structura de bază a unei prelucrări conţine în mod obligatoriu denumirea
prelucrării (comanda din meniu) cu titlul (Title), notiţe asupra prelucrării (Notes) şi datele active prelucrate. Toate
aceste elemente sunt editabile, utilizatorul putând folosi nume care îl ajută să înţeleagă mai bine conţinutul
prelucrărilor.
Elementele de structură ale Output-ului pot fi ascunse/afişate prin dublu-clic pe (-) sau (+), aflate la ramificaţiile
structurii (3), pot fi mutate în ansamblul structurii existente sau în alt Output. Unele din ele sunt ascunse de la
prima apariţie, cum este Notes (4). Conţinutul acestui element poate fi vizualizat prin dublu-clic pe iconul aflat
înaintea cuvântului "Notes" sau clic pe iconul Show Selected Items din Toolbar (5).
Toate modificările în structură (1) ale Output-ului reflectă modificări şi în conţinut (2).
Meniul ferestrei Viewer este, aşa cum am mai spus în conţinutul cursului 1, aproximativ acelaşi cu cel al ferestre
Data Editor, asfel că rularea comenzilor asupra setului de date sau prelucrările statistice pot fi comandate şi din
această fereastră.
Conţinutul Output-ului (2) poate fi editabil şi el. Pentru acesta, se acţionează dublu-clic pe elemntul care se
doreşte a fi editat. Pentru a uşura editarea, SPSS afişează fie o Toolbar nouă, fie o modifică pe cea existentă.
Pentru elemente mai complexe, cum sunt diagramele, este deschisă o fereastră nouă (Chart Editor). La finalizarea
editării, fie se închide fereastra, fie se face clic în afara acesteia şi astfel se revine în zona de conţinut, cu
modificările realizate.
Dacă, din anumite motive, nu se doreşte a se salva modificările făcute, se poate reface prelucrarea utilizând
aceleaşi comenzi, iar strutura veche din Output se poate şterge.
Statistici
Există două tipuri principale de statistici: statistici descriptive şi inferenţiale.
Statisticile descriptive drescriu caracteristicile principale ale variabilelor individuale (calculul vârstei medii pentru
un număr de cazuri, numărarea persoanelor cu acelaşi salariu, calcularea împrăştierii răspunsurilor la o întrabare
de opinie etc). Sunt bivariate atunci când relaţia dintre variabile este deschisă, când poate exista cauzalitate.
Statisticile inferenţiale reprezintă un aspect cu totul diferit al statisticii. Se aplică pentru a răspunde la întrebarea
dacă ne putem baza pe rezultatele obţinute pe un eşantion de cazuri. Folosirea eşantioanelor este caracteristică
majorităţii studiilor moderne.
Fiecărei statistici descriptive îi corespunde o statistică inferenţială. Coeficientul de corelaţie dintre două variabile
este un indicator statistic descriptiv, care indică direcţia şi intensitatea legăturii dintre cele două variabile. Când
vorbim de semnificaţia acestui coeficient de corelaţie, ne referim însă la statistica inferenţială. Statistica descriptivă
este importantă pentru înţelegerea tendinţelor datelor, iar cea inferenţială pentru încrederea pe care o putem
avea în rezultatele obţinute, pentru a şti dacă putem sau nu generaliza aceste rezultate la nivelul unei populaţii.
Se impun două observaţii în legătură cu prelucrarea statistică a datelor:
1) Distincţia între măsurătorile relaţionale şi măsurătorile nerelaţionale (corelate vs. necorelate, dependente vs.
independente). Această dualitate surprinde tipuri diferite de modele de cercetare, cu statistici distincte.
Cercetătorul este răspunzător de statisticile care se pretează analizei datelor, nu aplicaţia SPSS.
2) Distincţia între statisticile parametrice şi cele neparametrice atunci când se compară două seturi de date.
Statisticile parametrice sunt utilizate asupra variabilelor cu distribuţie normală, acolo mediile şi analiza lor
jucând spre exemplu un rol important. Cele neparametrice se pretează comparării variabilelor distribuite
anormal, ele nu ia in calcul analiza mediilor, ele folosesc scoruri transformate în ranguri. Din nou, cercetătorul
este răspunzător de statisticile care se pretează asupra variabilelor.
O greşeală fundamentală a cercetătorilor începători este aceea de a presupune că analiza datelor este condusă
înainte de toate de statistică. Este mult mai corect însă să privim statistica drept un instrument care aduce fineţe
cercetării, cercetătorul este cel care ştie ce doreşte să obţină prin studiul său. Dacă el nu ştie ce doreşte să obţină
prin studiul său, statistica nu-l poate ajuta cu nimic.
Câteva sugestii:
■ Multe din aspectele importante ale analizei datelor nu necesită altceva decât înţelegerea valorilor medii şi a
frecvenţelor.
■ în demersul său, cercetătorul utilizează mai multe analize statistice alternative, iar pe unele din ele nu le
prezintă în raportul cercetării, statistica fiind instrumentul de lucru a sucesiunilor de sarcini pe care
cercetătorul şi le atribuie, plecând de la înşiruirea de întrebări pe care şi le pune în analiză.
■ Experienţa cercetătorului este foarte importantă pentru un demers, aceleaşi procedee statistice sunt folosite
în studii diferite, nu originalitatea procedeelor statistice sunt importante pentru un studiu, ci scopul,
obiectivele şi ipotezele studiului.
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Pagina 43
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Procesarea rapoartelor
în SPSS pot fi procesate câteva rapoarte simple: pentru o singură variabilă (Codebook) cu indicatori ai
tendinţei centrale, ai distribuţiei, intervalele quartilice etc., pentru mai multe variabile (Case Summaries,
Summaries in Rows şi Summaries in Columns) şi tridimensional, cu drop-down (OLAP Cubes). Vom prezenta
şi procesa numai două.
■ Rapoarte în care sunt prezentate asocieri de cazuri (Case Summaries) - unde puteţi organiza şi rezuma
valorile de la una sau mai multe variabile.
- Ci
Reports
jS Codebook. " J
OLAP Cubes../
Descriptive Statistics \Ì
____I
a
1Compare Means General 1
2Linear Model
2 i
Q J>
►
,>■•■ CaseSummaffcs...
6_
Correlate
5y Report SummaWs in Rows...
6_ 6
7 7j
B j
Regression
8► \ i;: Report
9 9
Summar ^^h £olumnş^
Classify ►
3 3 4
Dimension Reduction ►
4 2 5
Scale ►
4 3 3
yonparametric Tests ►
3 4 4
Forecasting ►
5 5 3
2
I
Myfcpte Response
n
3. Selectaţi Ultima scoală absolvita şi Sexul şi le introduceţi în câmpul cu variabile supuse raportării (7).
I Summarize Cases
Număr
Variables: |¿| Ultima scoalMÍBsolvita
[... \&\ Sexul IqBjT
de
ordine
Jnr]
Cat de
importa
nta
est... e
va
nemltu
meste
c...
jvi Display
Satisfac
ţia tata
cases S
de pr...
Limit
Satisfac
cases to
ţia fata
de co...100
flrst
Satisfac
Show only
ţia
valid fata
de cases
mij...
[...; Show
Satisfac
case
ţia fata
numbers
de co...
Satisfac
ţia fata
de sa .
Satisfac
ţia fata
de rel. .
Satisfac
ţia
relaţiile
tu
OK
Easte
4. 5. Selectaţi Starea civila şi o introduceţi în câmpul după care să fie grupată raportarea
variabilelor Ultima scoală absolvita şi Sexul (8)
Selectaţi Statistics şi ce tip de statistici să afişeze raportul (9) (lăsaţi ce este implicit). Clic pe
Continue.
Statistics:
Median Cell
Grouped Median Stati
Std. Error of Mean stics
Sum
:
Minimum
jNu
Maximum
mbe
Range
First
r of
Last
Standard Deviation
Variance
Kurtosis.......................
< ......... ►
Continue
6. Selectaţi Options si modificaţi numele raportului (10) (Scoală absolvita si sexul lotului de subiecţi, in
funcţie de starea civila). Clic pe Continue şi apoi Ok.
§3 Options
isexul lotului de
Caption:
Ultima scoală
absolvita sexul
•BâEi Starea civila Căsătorit 1 Liceu Feminin
tt Liceu Masculin
-og
Summarize g] Title | 3 Liceu Feminin
o
c
lotului
4 Facultate Feminin
5 Scoală Feminin
profesionala
Total N
5 5
Total N 10 10
a. Limited to first 100 cases.
Pagina 6
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
■ Rapoarte în care datele sunt prezentate pe rânduri (Summaries in Rows) - unde enumeraţi valorile unei
variabile într-o coloană şi valorile pentru o variabilă pe care o asociaţi cu aceasta pe rând.
Ce este Break Variabiles?
Dacă dorim listarea în raport a conţinutului unei variabile şi a totalului în funcţie de variabila sex, atunci
această variabilă este "break variabile", adică variabila care rupe datele în funcţie de valorile sale.
1
I
Correlate ►
Report Summaies in r wj^. |
2 2
Regression ►
Report SummaiVs in Columns...
3 3 7
4 4 Classify ►
3 3^*""""^ 4
5 5 Dimension Reduction ► 4 2 54
________B__________
6 Scale ► 3 3
7 7 Nonparametric Tests ► 3 4 4
8 8 Forecasting ► 5 5 3
Multiple Response ►
Q
Q ~> C
T
3. Selectaţi Ce salariu vi s-ar cuveni? şi Vârsta in ani impliniti în câmpul cu variabilele prezentate pe
coloană (13) (Data Column Variabiles) şi Sexul în câmpul cu Break Variabiles (14).
Pagina 7
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
4. Selectaţi Summary din fereastra principală şi marcaţi: media valorilor, minimul, maximul şi numărul
de cazuri (15). Clic pe Continue.
5. Selectaţi Summary din secţiunea Break Columns (clic pe variabilă) şi marcaţi: minim, maxim şi
număr de cazuri (16). Clic pe Continue.
Sum of Alues^ j— \ B . Standard deviation Ì
5j Number of cases
M Percentage above
\ fj Percentage below
Percentage inside
I Report: Summary
Lines for q8
Standard
Sum of values] Mean of values
Kurtosis Variance
Maximum v W
kewness
Number of
Percentage
above" I Percentage
below ] Percentage
inside
Hel
Continue
Cance
l
6. Selectaţi Titles şi introduceţi titlul "Salariul si vârsta" (Line 1), apoi Next (17) şi "in funcţie de sex" (Line
2). Clic pe Continue.
| Report: Titfes
.^g Ce va nemltumeste c.
IA
a f Satisfacţia fata de p... s
fata de r...
£J 1
da
i Satisfacţia relaţiile fu..
1
^
cu... ;i ^ Data angajării [q6]
,> [IJgŞl_
i Special Vartabtes:
Cancel Help
Edit View
V Graphs Utilities Add-ons Help
Ö ft Cà
cuveni?
@ împliniţi
Sum
mari
ze Q $780.00 2
Title 52,400. 9
—B Notes 00 6 S
I—QJ Active
Dataset O
[..g Case
Processing $530.00 2
Summary $1,300. S
'—Q§ Case 00 4 4
Summaries H Log
HH Summarize Q 6
Title 8 Notes —
CH Active
Dataset $1,152. 4
a Case Processing 00 0
Summarj 1—Ljj|
Scoală absolvita si $530.00 2
sexul lot ¡¡8 Log S $2,400. 6
Report MI] Title — 00 10 6
Q Notes
0 Active Dataset
' *u2 Text Output
1 File
Insert Format Analyze
Data Transform
1 [""^
Utput
¡8
Log
Masculi
n
Minim
um
Maxim
Grand
Total
Mean
Minimum
Maximum
H
Pagina 8
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
m
1 : Varsta Descriptive Statistics > 123 Friquenr^esy J
22,0
fc|e:
j.... Varsta Compare Means ►\ Qjj Descriptives... /{
"1 22 ~ General Linear Model ►j % ExplX,^^
---------_-------------1
2 42 Correlate ► H Crosstabs...
3 27 Regression ► .—,
11 Ratio...
4 26 Classify ► m p-p wots...
5 18 Dimension Reduction ► 1 Q-Q Plots...
6 27 Scale ►
20 Forecasting ►
co
1Q
Q Multiple Response ►
3. Selectaţi variabila Reacţii corecte_probal şi o introduceţi în lista cu variabilele supuse prelucrării (20).
Frequencies
Pagina 9
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Variabl
Statistics...
varsta [vârsta) ^ Sexf.1 $ Reacţii
F,2M)[Sex] ! tgfa Scopul cordele_prob"9 Charts...
evaluării [Sc... 0- Reacţii
Format...
corecte_ada... ¿5
Omisiuni_adaptare [... !
20
Reacţii eronate_ada... |
~ (j?> Nr.
siruri/minut_adap... Js ^
Omisiuni_proba1 [O... < .-*
Reacţii eronate Drob... '
1
4. Selectaţi Statistics şi marcaţi: Mean, Std. Deviation, Minimum şi Maximum. Clic pe Continue (21).
Frequencies: Statistics
Ji Percentile Values L
QuartilesJ D
. Cut points S
for: :
Percentile(
I Minimum
H
iel
p
Maximum ,
S.E. mean
Continue
; Chart
Type.........
None
Bar charts
Pie charts
6. Clic pe Ok.
în Output sunt afişate următoarele informaţii: indicatorii statistici, tabelul de frecvenţă şi histograma (23).
File ErJt View Data Transform Insert Format Analyze Graphs Utilities Add-ons Window Help
a- m a s
Reports ► sfcc
y<>*
)1 :nr 1,0 Descriptive Statistics * 123 Frequencies.. ble: 20 of
2(
nr qi Compare Means ►
Ljd s^
\q3_3
Descript^
5 5 Dimension Reduction ►
?j Q-Q
Plots.
6 6 Scale ►
4 3
7 7 Nonparametric Tests ► ■ 3
4
8 Forecasting ►
5 5
:
CD
Selectaţi variabila Satisfacţia fata de program şi o introduceţi în câmpul Row(s) şi Satisfacţia fata de
condiţiile de munca în câmpul Column(s).
Crosstabs
Pagina 10
INTRODUCERE IN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Row(s)
Număr de ordine jnr]_
Cat de importanta
¿1 Satisfacţia fata de
Ai este .. Ceva
■i nemltumeste cel .
: i ... i ISatisfacţia fata de Columnfs):____I i— —)
»mijlo. Satisfacţia fata
de conţi Satisfacţia aH| Satisfacţia faka de
Help
4. Select Statistics. Aici putem stabili să realizăm anumite teste statistice pentru cele două variabile
(26). Vom vorbi despre asta mai târziu. Clic pe Continue.
Crosstab;: Statistics
LJ jChj-squary
26 i Correlations
fcrdinal
itmsmtm\
......■
Contingency
coefficie
nts
I Gamma
PN and Cramer's V
j Şorners'd
LJ Lambda LJ Kendall's tau-
bi
Uncertainty coefficient
fj Kendall's tau-
c
Help
5. Selectaţi Cells. Putem marca mai multe opţiuni de afişare a datelor (27). Clic pe Continue.
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Counts
Observed ;
Expected
i Percentages
Fl Row ]
Residuals Q
Column Total
Unstandardized
Standardized i [_]
Adjusted standardized
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Noninteger Weights
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
J3 6
°g
îrosstabs Title Notes _0
Active Dataset 0 Case Processing
Crosstabs
Summary .0 Satisfacţia fata de
28
programul de
[DataSet5] C:\Users\alexgaianu\Documents\ de
[A] TRAINING\Training 5PSS\[4] date>2\bd
21.sav
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
Case
Cases
Processin
ValidM
NPeicen!ii. SiriaTotal
g
NPercentNPercentSatisfacţia
de programul dedelucru* fata
Satisfacţia fata
Summary condiţiile de
munca10100.0%0,0%10100,0%
SatisTactia fata de programul de lucru '
Satisfacţia fata de .'i.:- r r- i.- j
2
Satisfacţia fata de Foarte nemulţumit 0 1 : 1
Asa si asa 0 1 1 0 2
Mulţumit 2 2 0 0 4
JUL
Foarte mulţumit 0 0 0 1 1
Total 2 4 1 3 10
Pagina 12
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICA A DATELOR
SPSS H:
Statistics Processor 142,W
ready
is S6S pt.
Pagina 12
INTRODUCERE IN
ÎNREGISTRAREA,
PRELUCRAREA ŞI
ANALIZA STATISTICĂ A
DATELOR
Alexandru Găianu
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
Versiunile mai vechi ale SPSS permiteau crearea de tabele din submeniul Analyze, cu timpul însă SPSS a
dezvoltat o aplicaţie paralelă, SPSS Tables, iar SPSS Base nu mai poate crea tabele. Cu SPSS Tables controlaţi
structura tabelului, însumaţi şi comunicaţi rezultatele în orice formă tabelară. Puteţi grupa variabilele pe
niveluri şi dimensiuni (şiruri, coloane, straturi). SPSS Tables permite modificarea conţinutului rapoartelor create.
Se pot include statistici centralizatoare pentru şiruri sau coloane.
în SPSS Base putem însă edita tabelele generate în Output (fereastra Viewer). Tipul tabelului, în ceea ce
priveşte aspectul său, poate fi stabilit în Edit - Options - Pivot Tables (1). Tot acolo se poate ajusta lăţimea
coloanelor (2), modul de editare (3) şi de ajustare a lăţimii tabelului în funcţie de conţinut (4).
I Coti;
General Viewer Data Currency Output Labels Charts Pivot Tables j File Locations I Scripts Syntax Editor
TableLoo
k None
<System DefauB>
rSa
mpi
e- .ayerlaveillbbbb
bbbblbbbb2
Academic ; AvarrtGarde \
BlueYellowContrast ; Boxed
aaaaIUI
Compact 3 3 3 3 13 3 3
CompactAcademic ;
Compart Ac 3'23333133332 ddddl
ademicTimesRoman ;
CompactBoxed ; Contrast
ccccl0abcd212.43t C
Table
Ccccc288.6abcd83.65abcdg
Caption roup dddd2
cccd105abcd58.53abcdcccc
a.
211.42abcd205abcddddd3
Text for
cccd89.45abcd30.0abcd
footnote
a.
b.
Text for
footnote
b.
B_rowse.
.. Ş_et
TableLoo Defauft Editing Mode:
k /"3Edit ay but very large
Adjust for labels only Directory table! in Viiwir I
Adjust for labels and data for w
Copying wide tables
to the clipnjflrd in rpäDo
notAadjustHwidth
p e
pl l
y p
Tabelele generate în Output se editează prin dublu-clic pe spaţiul tabelului. Dacă se realizează editarea în
fereastra Viewer, meniul acesteia se va schimba, dispar Data şi Transform, apare Pivot, iar meniul Format se
îmbogăţeşte. Vom alege să prezentăm o fereastră separată pentru editarea tabelelor (din Edit - Options -
Pivot Tables setaţi Open all tables in a separate window). Astfel, la dublu-clic pe spaţiul tabelului se va
deschide o fereastră nouă (5).
' r— 1
5
j File Edit View Insert Pivot Format Help
Un interes deosebit îl reprezintă submeniurile Pivot şi Format. Pivot ajută la transformarea coloanelor în
rânduri şi a rândurilor în coloane, precum şi la afişarea ferestrei Pivoting Trays, care permite permutarea ordinii
variabilelor pe rânduri sau coloane.
jjTj Pi vet
Tableù$t^iatlofà\^File Edrt
fJiew^Jnsert
' ' 1 oPisbt Format Help
1
pJ> rTranspose Rows and
* ot Table \ v Pivoting
Columns
Correlations j File Edit|-Cat
Trays
View
ele Insert estePearson
importanta Pivot \
Fo/mat Help
Correlation 1
Cell
Prope
rtie:
J_abl
e
Prope
rti'
Tatal
eLoo
ks
gi Pivot
P
N
eä Set Data CeJVWIths
Si Autofit
satisfacţia fata de condiţiile de gi
Renumber
munca
8
qnificant at;
Rotate Inner Column
Labels Rotate Outer Row
Variables - Labels
•. Statistics
Remove Keep
Together Remove
Break Here
Submeniul Format permite o multitudine de setări (font, culoare celulă, culoare font, tipul tabelului etc), care
ajută la particularizarea prezentării datelor.
■ Categoriale (câteva tipuri de 3D-bar, bar, line, area, pie, boxplot şi error bar charts);
■ Quality control charts (Pareto, X-Bar şi Sigma charts);
■ Scatterplots (simple, grouped, scatterplot matrix şi 3-D); Density charts
(piramide ale populaţiei, dot charts şi histograme);
■ Ploturi de diagnostic şi exploratorii (caseplots şi time-series plots);
■ Ploturi de probabilitate (ploturi ale valorilor observate şi aşteptate);
■ Ploturi de autocorelaţie şi autocorelaţie parţială (inclusiv natural log transformations şi
seasonal/nonseasonal differencing);
■ Ploturi de cross-correlation (inclusiv natural log transformations şi seasonal/nonseasonal differencing);
■ Grafice de uz multiplu: grafice linie 2-D, grafice pentru seturi de răspunsuri multiple;
■ Grafice personalizate, realizate cu suport GPL (Graphic Production Language).
De-a lungul anilor SPSS şi-a îmbunătăţit afişarea grafică a datelor. Acum se poate opta pentru o modalitate
simplă (comună versiunilor mai vechi), sau pentru o modalitate asistată în crearea graficelor. Capacitatea de
editare a fost şi ea îmbunătăţită şi astfel acum se pot face o multitudine de setări, de modificare de aspecte.
Cu Chart Builder, SPSS foloseşte un ecran grafic pentru a ghida utilizatorul prin etapele de construire a
graficelor. Aceasta verifică ce face utilizatorul şi nu permite să utilizeze aspecte care nu vor funcţiona.
Sunt utile, spre exemplu, pentru reprezentarea grafică a evoluţiei valorilor unei variabile în ordine cronologică.
Sunt uşor de citit şi urmărit.
Să presupunem că dorim să reprezentăm grafic valorile trebuinţei de putere (variabila conducere) din setul de
date Dominante motivationale.sav.
Chart Builder... 1
9 )
Is : 'iS Graphboard ate Chooser...
Tetrtf
/
} Define
j Variable
V Propertie
I s. .
Nume Conducer Legacy Dialogs ..........►
ar Dont show this dialog again
1
n1
^------------53D~------ ■i
»,
nn r
Dialogul ne specifică să definim variabilele ordinale înaintea construirii graficelor. 3. Alegeţi Line din listă
(11) şi dublu-clic sau trageţi Single Line din câmpul cu imagini de diagrame în secţiunea de Preview din
dreapta sus.
Category 1
Category 2
[More...)
! ^
Numele»
prenumele
M Category 2
Elements i
Gallery : Basic Elements GroupsPo-nt C Titles.foot notes
Properties
GroupsJPoint D
Checked items add titles and tootncres to the chart Ed* the text wthin Properties
Elem
Titles/Footnotes ent, j
Cj Tltel . Prope
Choose from: TBe2
rties..
Subtitle L J
Epotnote1
Footnote. 2
... ţ Ni ^» # Qî|íi
y 4« #
i8§|
output Log '{§ Graph
|....£rj Title
;.fp Notes GGraph
j.
1 03 Active Dataset
- lyj)
[DataSetl] C:NUser3\aJ.exgaianu\Documents\[A]
Line of
Reprezentarea grafii;
JH
Log GGraph
I ii] Title TRAINING\Training SPSS\[4] Baae de
j {¡3] Notes
Q
JB IS Log
Active Dataset Graph
GGraph date\4\dominante motivationale.
I....Title
jg .QNotes Active Dataset
[S
,„ Graph © Log GGraph O
B
Title Q Notes Active
Dataset - Graph
1 n13
nl'9 I n17
1 n32 ! n21
I n-36 [ n25
I n4 j n43\i
|n9n47
n11 1 n50 I nS4 I n5S
n27 n3Q n15n34 n2
n38 n23n41
n7n.45 n4S n52 n5G
Numele si prenumele
Orice diagramă este editabilă. Mai jos este prezentată o diagramă tip linie, cu două variabile reprezentate
(două linii).
Numele si prenumele
Sunt reprezentări în perechi de date (X,Y), fără a marca o legătură între ele (linii). Fiind o reprezentare grafică a
dispersiei, se urmăreşte interpolarea, gruparea punctelor astfel încât să exprime o tendinţă. Sunt utile pentru a
înţelege şi interpreta corelaţia dintre două variabile.
Vom exemplifica plecând de la asocierea a două variabile într-o diagramă de dispersie din setul de date
Dominante motivationale.sav, Expertiza şi Relationare.
]
Numele
Char Chart
si
tprenume
le [N... $ preview
Conduce
9u.! uses
re
(trebuinţ
de' example
a d... &
Expertiz data
a
(trebuinţ
a de ...
Relatio
nare
(trebuinţ
a d. ^
Subziste
nta
(trebuinţ
a
OK j Paste
Reset Cancel
Metp
1. Din lista de variabile, selectaţi Relationarea şi trageţi-o pe axa X şi Expertiza pe axa Y (16).
2. Clic Ok. în Output este afişată diagrama (17).
Pagina 110
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
o o o o o
o o o
o o o
o
o oo
o
oo o
o o o
o o o oo
o
—I— T—
5,50 6,00
Pot fi realizate diagrame de dispersie (Scatterplot-uri) cu două variabile, în care punctele sunt reprezentate
grafic distinct. De asemenea, pot fi realizate Scattermatrix, în cadrul cărora se pot vizualiza toate combinările
posibile dintre variabile, atunci când sunt introduse mai multe variabile în reprezentare. Mai jos este
reprezentată o diagramă Scattermatrix cu toate cele patru variabile din setul de date Dominante
motivationale.sav.
Alături de diagramele tip linie, cele cu bare sunt cele mai comune reprezentări grafice. Ele permit comparaţii
între frecvenţele, mediile, medianele, ponderile sau ponderile cumulate ale variabilelor.
Vom exemplifica prin reprezentarea grafică a frecvenţei de selecţie a imaginilor de birouri (A, B, C, D, E),
variabila q4 din setul de date bd_41.sav.
Pagina 114
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA Şi ANALIZA STATISTICĂ A DATELOR
[ Chart Buiide
Variables" $ Număr de
ordine [nr] ni Cat de
importanta e.. 0a Ce va
nemlturneşte .. j£J|
Satisfacţia fata de p jj
Satisfacţia fata de c. ¿1
Satisfacţia fata de ... jjj
Satisfacţia fata de c *
Satisfacţia fata de s. ¡¿1
Satisfacţia fata de r.
Satisfacţia relaţiile f. .£§
Satisfacţia fata de e
Tot în grupul diagramelor tip bară sunt şi Clustered bar chart (diagramele bară grupate) şi Stacked bar chart
(diagramă de tip bară în stivă), care pot demonstra relaţii sau comparaţii între grupuri de date, grupurile fiind
definite de o variabilă din setul de date. Mai jos este reprezentată o diagramă Clustered bar chart (22) şi una
Stacked bar chart (23), în care este prezentată satisfacţia faţă de programul de lucru (q3_l din bd_41.sav),
separat pentru femei şi bărbaţi (q8).
Sunt unele din diagramele cele mai utilizate în psihologie. Diagramele Boxplot ajută la a vizualiza valorile
situate cu mult în afara intervalului de valori normale. Ele reliefează simultan indicatorii de nivel (medie,
mediană), dar pe cei de distribuţie a valorilor unei variabile (spre exemplu scorul brut obţinut la un test
psihologic).
Pagina 115
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA ŞI ANALIZA STATISTICĂ A DATELOR
(1) - linia îngroşată din interiorul cutiei reprezintă mediana, deci tendinţa centrală. Dacă ea este mai
apropiată de marginea de jos, atunci distribuţia este înclinată spre stânga (predomină valorile mici si sunt
puţine cazuri cu valori mari, dar extreme), dacă e mai apropiată de marginea superioară, atunci distribuţia este
înclinată spre dreapta.
(2) - cutia propriu-zisă reprezintă distribuţia a 50% dintre cazuri (quartila 2 şi 3). Astfel, marginea de jos a
cutiei arată valoarea percentilului 25, iar marginea superioară - pe cea a percentilului 75. Cu cât cutia este mai
mare, cu atât variabilitatea rezultatelor este mai mare.
(3) - limitele exterioare ale diagramei, acele linii orizontale deasupra şi dedesubtul cutiei (numite în engleză
whiskers, adică „mustăţi ca la pisică") sunt trasate de la cea mai mică la cea mai mare valoare situate în limitele
a 1,5 lungimi de cutie. Şi ele reprezintă măsuri a variabilităţii rezultatelor.
(4) - cazurile extreme situate în intervalul 1,5-3 lungimi de cutie, sunt reprezentate prin mici cercuri (o), care
au trecute în dreptul lor numărul cazului.
(5) - cazurile extreme situate la distanţe mai mari de 3 lungimi de cutie sunt reprezentate prin mici *
(asteriscuri), care au trecute în dreptul lor numărul cazului.
Vom exemplifica prin reprezentarea grafică a frecvenţei de selecţie a imaginilor de borouri (A, B, C, D, E),
variabila q4 din setul de date bd_41.sav.
Pagina 116
INTRODUCERE ÎN ÎNREGISTRAREA, PRELUCRAREA SI ANALIZA STATISTICĂ A DATELOR
Chart Builder
No vaiiabie s seiected
Groupsfoint D TitlesjFootnotes
:
Elem
ent.
Options...
4. Din lista de variabile selectaţi q5 (Ce salariu vi s-ar
cuveni?) şi glisaţi-o pe axa Y (26).
5. Clic Ok. în Output este afişată diagrama (27).
27
$500.00"
Diagramele Boxplot se pot construi după mai multe valori ale unei variabile ordinale -Boxplots (28)
sau după mai multe valori ale unei variabile ordinale în funcţie de o altă variabilă ordinală - Clustered
boxplots (29).
Diagrame tip plăcintă (Pie Charts) - care arată cum este împărţit un întreg în mai multe
părţi. Fiecare felie reprezintă procentul său din întreg. Sunt utilizate în mai mare măsură la
prezentări şi mai puţin în lucrări şi rapoarte scrise, datorită dimensiunilor acestora.
■ Histograma (Histogram Chart) - este un grafic tip bare, dar la care barele sunt lipite una de
alta şi nu pot fi aşezate decât în ordinea firească (crescătoate). Se reprezintă grafic prin
histogramă doar variabilele de interval sau de raport. Histogramele pot fi construite cu sau
fără curba de normalitate.
■ Piramida vârstelor (Population pyramid) - oferă o comparare a numărului de elemente,
împărţite în două categorii.