Sunteți pe pagina 1din 12

Suport Curs 2 – Prezentarea generală a programului SPSS

Lect. univ. dr. Adrian Gorbănescu

Când aveam 5 ani, eu și părinții ne-am mutat într-o altă localitate. Odată ajuns în noul
loc am realizat că nu mă mai pot juca alături de copiii cu care mă jucasem aproape trei ani.
Noua locuință mi se părea foarte înfricoșătoare, iar singurul loc în care îmi găseam refugiul
era balconul. Acolo stăteam toată ziua și mă jucam cu mașinile, iar măsuța pliantă unde mama
își bea cafeaua era cea mai bună poartă de fotbal. Tot de acolo urmăream cu atenție și plin de
fascinație cum se construia un bloc din apropiere. Mama insista mereu să ies afară, să mă joc
cu ceilalți copii din bloc, iar eu refuzam categoric. Îmi era foarte greu să mă adaptez la noul
mediu și îmi era frică de acei copii pe care nu îi cunoșteam. Într-o zi mi-am făcut curaj și am
ieșit să mă joc în fața blocului, în nisipul de pe șantierul blocului aflat în construcție. În timp
ce mă jucam, periodic aruncam o privire către balconul locuinței mele pentru a mă asigura că
nu mi-am pierdut cel mai sigur „punct de sprijin”. În următoarea zi, când am ieșit din nou
afară, s-a apropiat de mine un băiat, Răzvan Munteanu. El avea șase ani și se mutase cu
aproximativ 2 săptămâni înaintea mea în bloc. Mi-a făcut cunoștință și cu ceilalți copii și m-a
ajutat să mă adaptez la noul mediu și să îmi fac noi prieteni. Chiar și acum, când îmi vizitez
părinții, mă uit către locul unde jucam fotbal cu prietenii, la locurile în care ne ascundeam
când jucam de-a v-ați ascunselea și când trec pe lângă ușile vecinilor le spun în gând numele.
Uneori, teama de necunoscut ne poate face să percepem un mediu ca fiind mult mai înfricoșător
decât este el în realitate.
Acest capitol vă va introduce într-un nou mediu necunoscut: softul statistic SPSS. Mediul
de lucru al SPSS, în general, este un loc mai puțin plăcut în care să îți petreci timpul comparativ
cu celelalte medii pe care le cunoașteți. Totuși, va trebui să ne obișnuim cu acest mediu atunci
când dorim să analizăm un set de date. Astfel, obiectivul acestui curs este acela de a te scoate
la joacă, iar eu voi lua locul lui Răzvan și te voi ajuta să te adaptezi la condițiile de „joacă” și
totul va fi în regulă. Cursul va prezenta ferestrele principale ale programului SPSS (data editor
și output), vă va arăta cum se introduc variabilele și datele, cum se salvează baza de date și un
exemplu practic de realizare a unei baze de date.

2.1. Domeniile de lucru în SPSS

2.1.1.Domeniul de editare a datelor (Data Editor)

Această carte se bazează în principal pe versiunea SPSS 22. Totuși, numărul versiunii nu
trebuie să constituie o problemă, deoarece versiunile de SPSS se actualizează cu regularitate,
diferențele nefiind majore de la o versiune la altă. În general, meniul și procedurile cele mai
importante sunt similare în oricare din versiunile recente ale SPSS.

1
Atunci când se lansează programul SPSS se va deschide fereastra care permite editarea
datelor (SPSS Data Editor). Această fereastră cuprinde două domenii – Data View și Variable
View.

Secțiunea Data View este asemănătoare unei ferestre din Microsoft Excel. Pe coloane
sunt declarate variabilele (în cazul nostru gen, vârstă, an_studiu, deschidere, extraversiune,
conștiinciozitate), iar pe linii sunt declarate cazurile (în exemplul de mai jos avem 12
participanți). Această secțiune ne permite editarea bazei de date.

Celulele conțin valori. Fiecare celulă conține valoarea unei variabile pentru un anumit
caz. Celula este dată de intersecția dintre un caz și o variabilă. De exemplu, la intersecția dintre
variabila vârstă și cazul 12 avem celula cu valoarea 20. Astfel înțelegem că participantul cu
numărul 12 are 20 de ani. La intersecția variabilei deschidere cu cazul 7 avem celula cu
valoarea 68.
Trebuie cunoscut faptul că baza de date este dreptunghiulară, dimensiunile ei fiind date
de numărul de cazuri de numărul de variabile definite. Dacă se va introduce o valoare într-o
celulă care este în fața variabilelor definite, SPSS-ul va genera automat o variabilă. Noua
variabilă creată are un nume generat automat de SPSS (de exemplu, VAR0001, VAR0002).
Numărul depinde ce celelalte operațiuni realizate anterior în introducerea variabilelor. În cazul
variabilelor numerice (numeric), celulele fără valori sunt considerate ca fiind valori lipsă, iar
ele vor avea un „.”. În cazul variabilelor de tip șir de caractere (string) celule necompletate
sunt considerate valori valide, iar SPSS-ul vă lăsa spațiul liber, fără a mai pune „.”
Secțiunea Variable View este destinată pentru crearea și editarea variabilelor. Pentru a
trece în această fereastră se va acționa butonul corespunzător din partea stânga-jos a ferestrei
SPSS.

2
În secțiunea variable view sunt prezentate următoarele caracteristici ale variabilelor:
• Numărul – reprezintă poziția variabilei în baza de date.
• Name – numele variabilei.
• Type – tipul variabilei. Având în vedere că majoritatea procedurilor de calcul statistic
operează cu numere, recomandăm ca de cele mai multe ori să se utilizeze tipul Numeric.
• Width – numărul total de caractere.
• Decimals – numărul de zecimale.
• Label – eticheta variabilelor, descrierea explicită a acestora.
• Values – valorile pe care le poate lua variabila (utilizată numai în cazul variabilelor
categoriale).
• Missing – valori lipsă (valori existente, care vor fi ignorate de SPSS).
• Columns – lățimea coloanei din Data Editor (poate fi reglată și cu mouse-ul).
• Align – tipul de aliniere a valorilor din coloană (stânga, central, dreapta).
• Measure – scala pe care este măsurată variabila (pentru a utiliza procedurile statistice,
scala de măsurare trebuie declarată corect).

Meniurile din SPSS sunt asemănătoare cu cele ale altor programe pe care le utilizăm în
mod frecvent. În domeniul de lucru Data Editor avem următoarele meniuri:
• File – permite deschiderea și salvarea bazelor de date.
• Edit – permite utilizarea operațiilor Cut, Copy, Paste, Find, Replace. Options permite
setarea caracteristicilor programului SPSS.
• View – se stabilesc setările pentru modul de afișare.
• Data – permite utilizarea funcțiilor de operare cu variabilele: selectare, adăugarea de
noi baze de date, inserarea variabilelor, sortare, etc.
• Transform – funcții care permit modificarea datelor prin recodificare sau calcul.
• Analyze – conține procedurile statistice de calcul (testele statistice, procedurile pentru
statistica descriptivă). Este cel mai important și utilizat meniu.
• Graph – conține procedurile de reprezentare grafică.
• Window – ne prezintă lista ferestrelor deschise și avem posibilitatea de a selecta
fereastra pe care dorim să o utilizăm.
3
• Help – cuprinde informații ajutătoare, inclusiv un tutorial pentru operarea cu SPSS.

Majoritatea meniurilor prin lansarea operațiilor deschid casete de dialog. Aceste casete
sunt utilizate pentru selecția variabilelor și setarea opțiunilor în vederea analizei.

Source variable list conține lista variabilelor pentru care este posibilă procedura statistică
pe care noi dorim să o lansăm. În target variable list vom trimite variabila pe care dorim să o
analizăm.

Uneori, utilizarea unei casete de dialog necesită deschiderea unei casete secundare. Caseta
secundară, odată ce a fost deschisă, permite revenirea la caseta principală doar prin închiderea
ei.

Există cinci butoane standard în cadrul casetelor de dialog:


OK – permite lansarea procedurilor și închiderea casetei de dialog.
Paste – permite copierea și editarea procedurilor în Syntax.
Reset – resetează caseta de dialog, aceasta revenind la setările implicite ale programului.
Cancel – permite anularea operațiilor efectuate după deschiderea casetei.
Options – deschide o fereastră secundară de unde se pot stabili anumite setări în afișarea
rezultatelor.
Help – oferă informații despre operațiile care pot fi efectuate în cadrul casetei de dialog.

Fișierele rezultate în urma salvării au extensia .sav și nu pot fi deschise decât cu


programul SPSS. Versiunile noi pot deschide fișierele salvate în versiunile vechi. Sunt situații
în care versiuni mai vechi nu pot deschide fișierele create cu versiunile noi.

2.1.2 Domeniul de afișare a rezultatelor (Viewer)

Toate rezultatele statistice, tabelele și graficele vor fi afișate în Viewer (Output). Această
fereastră cuprinde două secțiuni: de navigare (în partea stângă) și de afișare a rezultatelor (în
partea dreaptă).

4
Zona de navigarea oferă informații despre titlul procedurilor utilizate și diferitelor
componente ale rezultatelor. Ori de câte ori dorim să vizualizăm un anumit rezultat putem
ajunge la acesta mergând în secțiunea de navigate și dând click pe titlul procedurii utilizate.
Aceasta își dovedește utilitatea în cazul în care am realizat mai multe analize și apoi putem fi
interesați să vizualizăm rezultatele unei analize făcute cu câteva analize mai devreme.
Conținutul zonei de afișare a rezultatelor depinde de specificul fiecărei proceduri. Lansarea unei
noi proceduri va afișa rezultatele sub cele prezentate cu ocazia utilizării procedurilor anterioare.
Fișierul rezultat prin salvarea Output-ului are extensia „.spo” (pentru versinile mai vechi)
sau „.spv” (începând cu versiunea SPSS 20) și nu poate fi deschis decât cu programul SPSS.

2.2. Definirea variabilelor

Pentru a crea noi variabile sau pentru a le edita pe cele deja introduse se va lucra în
secțiunea Variable View.
Name – presupune setarea numelui variabilei. Atunci când declarăm variabilele în SPSS
trebuie să ținem cont de o serie de aspecte:
• Fiecare variabilă trebuie să aibă un nume unic. Nu este permisă utilizarea a două
variabile cu același nume.
• Trebuie să conțină minimum un caracter, iar primul caracter trebuie să fie o literă. Dacă
nu este respectată această condiție va fi afișat mesajul „Variable name contains an
illegal first character”
• Nu sunt suportate caractere precum SPAȚIUL și SEMNELE DE PUNCTAȚIE. Poate
fi utilizat caracterul „_” în loc de SPAȚIU. Atunci când nu este respectată această
condiție se va afișa mesajul „Variable name contains an illegal character”.
• Trebuie evitată finalizarea unui nume de variabilă cu caracterul „_”, deoarece există
riscul apariției unui conflict cu variabilele predefinite ale SPSS care au această
terminație.
• Caractere precum „_”, „$”, „#”, „@”, „2”, pot fi utilizate în interiorul numelui variabilei.
De exemplu, anxietate_#3 este un nume de variabilă valid.
• Numele variabilei ar trebui să se refere la conținutul variabilei.
• Atunci când dorim să utilizăm un nume de variabilă de două ori putem apela la strategii
de codare. De exemplu, dacă evaluăm anxietatea participanților înainte de aplicarea unui
tratament și la finalizarea lui putem denumi două variabile astfel: anxietate_1 și
anxietate_2.

5
• Există o serie de denumiri rezervate care nu pot fi utilizate: EQ, ALL, AND, BY, GE,
GT, LE, LT, NE, NOT, OR, TO și WITH.

Type – presupune definirea tipului variabilei, ce fel de informație va cuprinde variabila


respectivă. SPSS este setat implicit cu opțiunea Numeric (caracteristic pentru variabilele ale
cărori valori sunt numere). Pentru a edita tipul variabilei vom merge pe celula corespunzătoare
lui Type și se va deschide o casetă precum cea de mai jos.

Comma – este caracteristic unei variabile ale cărora valori sunt numere, acestea având „,”
pentru a delimita fiecare trei cifre și „.” pentru a delimita zecimalele.
Dot – este caracteristic unei variabile ale cărora valori sunt numere, acestea având „.”
pentru a delimita fiecare trei cifre și „,” pentru a delimita zecimalele.
Scientific notation – se referă la variabile numerice ale căror valori sunt afișate cu un E
încorporat și un număr la puterea a 10.
Date – primește variabile numerice ale căror valori sunt afișate ca date calendaristice sau
ca format de tip orar (ceas). Atunci când sunt introduse date calendaristice pot fi utilizate „/”,
„.” sau „-” pentru a delimita ziua, luna, respectiv anul. Formatul de introducere a datelor este
ales de utilizator. De exemplu, dd-mm-yyyy se referă la introducerea unei valori precum 25-
03-2014.
Dollar – o variabilă de tip numeric este afișată având în față semnul „$”, folosindu-se „,”
pentru a delimita fiecare trei cifre și „.” Pentru a delimita zecimalele.
String se referă la variabile de tip text sau șir de caractere și, ca urmare, nu pot fi utilizate
pentru a face operații matematice (de exemplu, nume și prenume). Numărul setat automat este
de 8 caractere, dar acesta poate fi modificat. Majusculele și literele mici sunt considerate
caractere distincte. Acest tip de variabile sunt cunoscute și sub denumirea de variabile
alfanumerice.
Trebuie să amintim că există o varietate foarte mare a modalităților în care pot fi declarate
aceste variabile.

Label - presupune etichetarea variabilelor. Etichetarea este o modalitate de a descrie pe


larg conținutul variabilei, ceea ce dorim să exprimăm prin denumire pe care o dăm unei
variabile. De exemplu, să presupunem că introducem o variabilă cu numele distanța. Prin
etichetarea ei putem specifica faptul că ne referim la distanța parcursă până la facultate sau la
distanța alergată de un sportiv. În Label putem introduce până la 256 de caractere. Atunci când
dorim să etichetăm o variabilă plasăm cursorul în căsuța respectivă și apoi introducem eticheta
dorită. Atunci când etichetăm variabilele avem voie să folosim spații sau alte semne de
punctuație.

Values – permite etichetarea valorilor variabilelor. Se dovedește a fi foarte util în cazul


variabilelor categoriale (nominale sau ordinale). De exemplu, dacă avem variabila gen cu

6
valorile 1 și 2, valoarea 1 poate primi eticheta „masculin”, iar valoarea 2 va primi eticheta
„feminin”. Pentru a eticheta valorile procedăm astfel:
• Apăsăm butonul de pe coloana values
• În caseta Value Labels valoarea variabilei o vom plasa în zona Value, iar eticheta
corespunzătoare valorii introduse este trecută în zona Label.
• Acționăm butonul Add și operațiunea se reia pentru toate valorile pe care dorim să le
etichetăm.
• Apăsarea butonului OK înainte de a finaliza etichetarea prin apăsarea butonului Add
vom primi un mesaj de avertizare.

Deși nu este obligatorie etichetarea valorilor variabilelor categoriale, această operațiune


este foarte utilă. Etichetele ne pot ajuta la interpretarea mai ușoară a rezultatelor și sunt asociate
prelucrărilor grafice.

Missing – permite declararea valorilor lipsă, pe care nu le-am putut obține fie din cauza
faptului că persoana chestionată nu a vrut să răspundă, fie noi nu am cerut informația respectivă.
Datele declarate lipsă sunt marcate pentru a fi tratate diferit și de cele mai multe ori sunt excluse
din prelucrările statistice. SPSS ne permite să introducem trei valori individuale care să
reprezinte valorile lipsă. În imaginea de mai jos este setat programul SPSS să marcheze valoarea
999 ca valoare lipsă.

Alignment – reprezintă modalitatea de aliniere a valorilor în Data View. Opțiunea


implicită este de aliniere la dreapta (Righ) pentru variabilele de tip numeric și de aliniere la
stânga (left) pentru variabilele de tip string.

Measure – se referă la declararea scalei de măsurare. Opțiunile sunt:


• Nominal – pentru variabile nominale.
• Ordinal – pentru variabile ordinale.
• Scale – pentru variabile cantitative (interval/raport).

7
Role – ne permite să stabilim rolul pe care îl joacă variabila în baza de date.
• Input – variabila este utilizată ca variabilă independentă.
• Output – variabila joacă rol de variabilă dependentă.
• Both – variabila poate fi utilizată atât cu rol de variabilă independentă, cât și de variabilă
dependentă.
• None – variabilei nu i se atribuie nici un rol.

2.3. Introducerea unei noi variabile în baza de date (Insert variable)

Atunci când începem să construim o bază de date cunoaștem variabilele pe care le vom
introduce în SPSS pentru a fi supuse analizei. Însă, pot exista situații în care fie uităm să
introducem o variabilă sau sărim peste ea, fie în momentul în care am construit baza de date nu
am avut în vedere o variabilă și apoi dorim să o introducem în baza de date printre celelalte
variabile. De asemenea, ne putem afla și în situația în care am introdus o variabilă în baza de
date pe o anumită poziție și, nefiind mulțumiți de plasamentul ei, dorim să o mutăm în alt loc
al bazei de date. Pentru fiecare dintre aceste situații avem nevoie de procedura Insert variable.
Există două modalități de introducere a unei noi variabile printre celelalte deja existente
în baza de date. În imaginea de mai jos este prezentată o bază de date în vederea analizei
răspunsurilor la un chestionar.

După cum puteți observa, primele variabile introduse sunt de ordin socio-demografic
(nume, gen și vârstă), după care urmează variabilele referitoare la itemii chestionarului. Să
presupunem că suntem interesați să introducem variabila nivel studii, între variabilele vârstă
și cma 1. Pentru a introduce o nouă variabilă, vom merge în Variable View și vom da click pe
numărul (cel care indică poziția variabilei în baza de date) variabilei deasupra căreia vom
introduce noua variabilă. În cazul nostru, vom apăsa pe numărul 4, moment în care întreaga
linie va fi marcată prin culoarea galben. Apoi dăm click dreapta pe numărul respectiv și
acționăm opțiunea Insert variable, moment în care în baza de data va apărea noua variabilă.
Aceasta va primi un nume pe care îl generează programul SPSS (VAR00001, de exemplu).
Utilizatorul are libertatea de a redenumi variabila așa cum își dorește.

8
O altă posibilitate de a introduce o nouă variabilă este aceea ca după ce am selectat
variabila deasupra căreia vom introduce noua variabilă, din meniul Edit, să selectăm opțiunea
Insert Variable.

2.4 Cum salvez baza de date?

Pentru a salva baza de date vom folosi meniul File → Save sau vom apăsa click pe

butonul care indică o dischetă în taskbar (se găsește sub meniul Edit).

Caseta de dialog care se va deschide ne solicită să specificăm numele sub care vom salva
baza de date (câmpul File name). Baza de date salvată va avea implicit extensia .sav, motiv
pentru care nu vom selecta nimic în câmpul Save as type. Secțiunea Look in ne solicită să

9
precizăm locul unde dorim să salvăm baza de date. În imaginea de mai jos, putem observa că
am salvat baza de date sub numele prima mea bază de date și va putea fi accesată Documents.

2.5 Exemplu practic

Profesorul de statistică dorește să pregătească o bază de date în care să înregistreze situația


studenților pentru a putea calcula punctajul de seminar. Astfel, baza de date va cuprinde
următoarele variabile:
• Nume și Prenume – de tip șir de caractere.
• Forma de finanțare - de tip numeric (1 = buget; 2 - taxă).
• Punctaj prezențe – de tip numeric (cu două zecimale).
• Punctaj teme – de tip numeric (cu două zecimale).
• Nota parțial – de tip numeric (fără zecimale).
În SPSS pentru variabila Nume și Prenume vom introduce următoarele caracteristici:
➢ Name – nume_prenume
➢ Type – String
➢ Width - 50
➢ Label – Nume și Prenume
➢ Measure – Nominal

Pentru variabila forma de finanțare vom stabili următoarele proprietăți:


➢ Name – finanțare
➢ Type – Numeric
➢ Width – 8
➢ Decimals - 0
➢ Label – Forma de finanțare
➢ Values – 1 = buget; 2 = taxă
➢ Measure – Nominal

10
Variabila punctaj prezențe va avea următoarele caracteristici:
➢ Name – prezențe
➢ Type – Numeric
➢ Width – 8
➢ Decimals - 2
➢ Label – Punctaj prezențe
➢ Measure – Scale

Variabila punctaj teme va avea următoarele caracteristici:


➢ Name – teme
➢ Type – Numeric
➢ Width – 8
➢ Decimals - 2
➢ Label – Punctaj teme
➢ Measure – Scale

Variabila nota parțial va avea următoarele caracteristici:


➢ Name – parțial
➢ Type – Numeric
➢ Width – 8
➢ Decimals - 0
➢ Label – Nota parțial
➢ Measure – Scale

După ce am definit variabilele, vom merge în Data View pentru a introduce valorile.
Pentru a avea o imagine completă a acestui exercițiu, vom introduce 10 valori fictive.

11
Tema 2

Studenții seriei 1 vor trimite tema pe adresa v.d.cruceanu@gmail.com, iar studenții


seriei 2 vor trimite tema la adresa adrian.gorbanescu@gmail.com.

Tema va fi trimisă la adresele de e-mail menționate până luni, 15 octombrie, ora


20.00.

Baza de date va fi salvată sub denumirea Nume Prenume_grupa (de exemplu,


Popescu Bogdan_grupa 1) și va fi trimisă prin e-mail la adresa menționată mai sus.

1. Realizați o bază de date care să conțină următoarele variabile. Pentru fiecare dintre
variabile precizați eticheta și scala de măsurare.
• CNP (numeric, fără zecimale).
• Gen (numeric, fără zecimale, 1 = Masculin, 2 = Feminin).
• Data nașterii (date, zz.ll.aaaa).
• Categoria de vârstă (numeric, fără zecimale, 1 = 15 – 19 ani, 2 = 20 – 24 ani, 3 = 25 –
29 ani și 4 = 30 – 34 ani).
• Țara (numeric, fără zecimale, 1 = Germania; 2 = USA; 3 = România).
• Nota admitere (numeric, două zecimale).
• Introduceți valori fictive pentru 15 cazuri.

2. În baza de date realizată, la exercițiul anterior, introduceți variabila punctaj statististică


între variabilele țara și nota admitere. Valorile pentru noua variabilă sunt cele de mai
jos:

3,45; 2,48; 3,08; 4,00; 3,56; 2,78; 2,75; 3,50; 2,84; 4,00; 3,45; 2,71; 3,56; 3,27; 3,45.

12

S-ar putea să vă placă și