Documente Academic
Documente Profesional
Documente Cultură
şi practice ale
programului SPSS
MIHAELA SANDU
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
CUPRINS
INTRODUCERE ........................................................................................................................ 4
I. Noţiuni de bază despre introducerea şi analiza statistică folosind SPSS .............................. 6
I.1. Accesarea SPSS-ului. ....................................................................................................... 7
I.2. Introducerea datelor.......................................................................................................... 8
I.3. Salvarea datelor. ............................................................................................................... 9
I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea variabilelor.......................... 10
I.5. Exemplu de calcul statistic. ............................................................................................ 12
II. Descrierea variabilelor. Tabele şi diagrame. ........................................................................ 17
II.1. Frecvenţa procentuală. .................................................................................................. 17
II.2. Diagrama circulară pentru date categoriale. ................................................................. 18
II.3. Adăugarea etichetelor unei diagrame circulare............................................................. 20
II.4. Diagrama cu bare pentru date categoriale..................................................................... 21
II.5. Histograme. ................................................................................................................... 23
III. Descrierea numerică a variabilelor. Medie, mod, mediană, variaţie şi dispersie .............. 25
III.1. Introducerea datelor şi efectuarea analizei .................................................................. 25
III.2. Interpretarea output-ului. ............................................................................................. 26
III.3. Alte caracteristici. ........................................................................................................ 28
IV. Forme ale distribuţiei scorurilor ......................................................................................... 30
IV.1. Introducerea datelor..................................................................................................... 31
IV.2. Interpretarea Output-ului ............................................................................................. 32
IV.3. Histograme. ................................................................................................................. 32
IV.4. Interpretarea output-ului .............................................................................................. 33
IV.5. Modalitatea. ................................................................................................................. 33
IV.6. Simetria. ...................................................................................................................... 34
IV.7. Boltirea (excesul). ....................................................................................................... 36
V. Abaterea standard. ............................................................................................................... 38
V.1. Introducerea datelor. ..................................................................................................... 38
V. 2. Interpretarea output-ului. ............................................................................................. 40
V.3. Scorurile Z .................................................................................................................... 40
V.4. Raportarea output-ului. ................................................................................................. 41
V.5. Alte caracteristici. ......................................................................................................... 42
VI. Relaţiile dintre două sau mai multe variabile.Diagrame şi tabele. ..................................... 43
VI.1. Introducerea datelor..................................................................................................... 43
VI.2. Ponderea datelor .......................................................................................................... 44
VII. Coeficienţi de corelaţie. Coeficienţi de corelaţie Pearson şi Spearman. ........................... 46
VII.1. Introducerea datelor. .................................................................................................. 47
VII.2. Corelaţia Pearson. ...................................................................................................... 48
VII.3. Interpretarea output-ului. ........................................................................................... 48
VII.4. Raportarea output-ului. .............................................................................................. 49
VII.5. Coeficientul de corelaţie Spearman. .......................................................................... 50
VII.6. Interpretarea output-ului. ........................................................................................... 51
VII.7. Raportarea output-ului. .............................................................................................. 51
VII.8. Diagrama scatter. ....................................................................................................... 51
VII.9. Interpretarea output-ului. ........................................................................................... 52
VII.10. Raportarea output-ului. ............................................................................................ 52
VIII. Regresia. Predicţia cu precizie. ........................................................................................ 54
VIII.1. Introducerea datelor. ................................................................................................. 54
VIII.2. Regresia simplă......................................................................................................... 55
VIII.3. Interpretarea output-ului. .......................................................................................... 56
2
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
VIII.4. Scatterplot-ul de regresie. ......................................................................................... 56
VIII.5. Interpretarea output-ului. .......................................................................................... 57
VIIII.6. Raportarea output-ului............................................................................................. 58
IX. Eroarea standard ................................................................................................................. 59
IX. 1. Introducerea datelor.................................................................................................... 59
IX. 2. Eroarea standard estimată a mediei. ........................................................................... 59
IX. 3. Interpretarea output-ului. ............................................................................................ 60
X. Testul t. Compararea a două eşantioane de scopuri corelate/relaţionate. ............................ 61
X.1. Introducerea datelor. ..................................................................................................... 62
X.2. Testul t pentru eşantioane perechi ................................................................................ 62
X.3. Interpretarea output-ului. .............................................................................................. 63
X.4. Raportarea output-ului. ................................................................................................. 63
XI. Testul t. Compararea a două eşantioane de scoruri necorelate/nerelaţionate. .................... 64
XI.1. Introducerea datelor..................................................................................................... 65
XI.2. Efectuarea Testului t pentru eşantioane independente. ............................................... 66
XI.3. Interpretarea output-ului. ............................................................................................. 67
XI.4. Raportarea output-ului................................................................................................. 68
XII. Testul Chi-Square. Diferenţe între frecvenţele eşantioanelor. .......................................... 69
XII.1. Introducerea datelor folosind procedura „Weighing cases”. ...................................... 69
XII.2. Introducerea datelor din tabelul 1 caz cu caz. ............................................................ 70
XII.3. Efectuarea Testului chi-square pe baza tabelului 1.................................................... 70
XII.4. Interpretarea output-ului pentru Testul chi-square..................................................... 72
XII.5. Raportarea output-ului pentru Testul chi-square. ...................................................... 73
XIII. Recodificarea variabilelor................................................................................................ 75
XIII.1. Recodificarea rezultatelor. ........................................................................................ 75
XIV. Calculul variabilelor noi. ................................................................................................. 78
XIV.1. Procedura unei variabile noi. .................................................................................... 79
XV. Testele rangurilor. Statistici nonparametrice. ................................................................... 80
XV.1. Scoruri relaţionate: testul semnului. .......................................................................... 81
XV.2. Interpretarea output-ului pentru testul semnului........................................................ 81
XV.3. Raportarea output-ului pentru testul semnului........................................................... 82
XV.4. Scoruri relaţionate: testul Wilcoxon. ......................................................................... 82
XV.6. Raportarea output-ului pentru Testul Wilcoxon. ....................................................... 83
XV.7. Scoruri nerelaţionate: Testul U Mann-Whitney......................................................... 84
XV.8. Interpretarea output-ului pentru testul U Mann-Whitney. ......................................... 85
XV.9 Raportarea output-ului pentru Testul U Mann-Whitney............................................. 86
XVI. Analiza de varianţă (ANOVA). Introducere în metoda one-way ANOVA cu scoruri
nerelaţionate sau necorelate. .................................................................................................... 87
XVI.1. Metoda one-way ANOVA pentru eşantioane independente. ................................... 88
XVI.2. Interpretarea output-ului. .......................................................................................... 89
XVI.3. Raportarea ouput-ului. .............................................................................................. 90
XVII. Analiza de varianţă bifactorială pentru scoruri nerelaţionate/necorelate. ..................... 91
XVII.1. Metoda two-way ANOVA pentru scoruri nerelaţionate. ........................................ 92
XVII.2. Interpretarea output-ului.......................................................................................... 93
XVII.3. Raportarea output-ului. ........................................................................................... 95
XVIII. Comparaţii multiple cu ANOVA. ................................................................................. 96
XVIII.1. Interpretarea output-ului. ....................................................................................... 97
XVIII.2. Raportarea output-ului. .......................................................................................... 99
ALEGEŢI RĂSPUNSUL CORECT ...................................................................................... 100
RĂSPUNSURI CORECTE .................................................................................................... 111
BIBLIOGRAFIE .................................................................................................................... 115
3
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
INTRODUCERE
_________________________________________________________________________________________________________________
4
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
5
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
6
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se dă dublu clic pe imagine
– dacă imaginea nu apare pe
ecran atunci accesaţi „Start”
→Programe→IBM SPSS Statistic 19.
Pasul 2:
7
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Aceasta este fereastra Data Editor a SPSS-ului şi este un spaţiu de lucru
cu linii şi coloane în care pot fi introduse datele.
Pasul 4:
Pasul 5:
8
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 6:
Pasul 7:
Selectând „File”→ „Save As” datele se vor
salva sub forma unui fişier. Fişierul salvat
va primi automat de la SPSS extensia „.sav”.
* Se recomandă folosirea unor nume
de fişiere distincte (ex. date1) pentru
a face conţinutul lor cât mai clar. Salvarea
datelor este recomandat să se facă într-un fişier
diferit de cel al SPSS-ului.
Pasul 8:
Pentru a alege locaţia unde va fi salvat
fişierul de date, se alege calea în mediul
„Save In” (se foloseşte săgeata pentru a
ajunge la locaţia dorită).
9
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 10:
Acesta este spaţiul de lucru „Variable View”. În acest caz, o variabilă este
deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită şi pot fi
adăugate alte variabile selectând celula corespunzătoare şi tastând numele
variabilei.
Pasul 11:
La versiunea SPSS 19 nu există
limită pentru lungimea numărului
unei variabile.
Se selectează o celulă din coloana
„Name” şi se scrie un nume diferit
de variabilă. Celelalte variabile vor
primi valori care vor fi implicit
schimbate ulterior.
Acesta este numărul de zecimale care va apărea pe ecran.
10
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
*La editarea unei variabile trebuie să se ţină cont de următoarele restricţii: numele variabilei
să fie unic, primul caracter să fie o literă, sa nu conţină simboluri speciale folosite în SPSS sau
spaţii.
Semnificaţia coloanelor din figura de la Pasul 10.
Numărul cazlui – identifică poziţia cazului în baza de date;
Name – numele variabilelor;
Type – tipul variabilelor;
Width – numărul total de digiţi;
Decimals – numărul de digiţi pentur partea zecimală;
Label – etichetarea variabilelor;
Values – valorile pe care le poate lua variabila;
Missing – valorile lipsă;
Columns – lăţimea coloanei din Data editor;
Align – alinierea valorilor în coloană.
Pasul 12:
Apare acest buton:
se dă clic pe el.
Pasul 13:
Pasul 14:
11
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 15:
* Cele mai frecvent utilizate ferestre in SPSS sunt „data Editor”, „Syntax Editor” şi „Output
Viewer”, „Pivot Table (Pivot Table Editor)”, “Chart Editor”.
Fereastra de sintaxă (Syntax Editor) este folosită pentru a genera programe de comenzi
pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opţiunile
selectate în casetele de dialog sunt afişate în fereastra de sintaxă sub formă de comenzi.
Aceste ferestre îi sunt specifice fişierele de tip .sps.
Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost
efectuată o comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele
statistice, tabele şi grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor
(Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în
tabele pivot.
* Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o
comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele statistice, tabele şi
grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output
Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în tabele pivot.
Toate rezultatele obţinute din analizele statistice sunt afişate în fereastra Output Viewer.
Această fereastră se aseamănă cu fereastra Windows Explorer şi se deschide doar dacă s-au
lansat comenzi din meniurile Statistics sau Graphs.
Fereastra Output Wiewer este structurată în două cadre/zone. Cadrul din stânga
(cuprinsul/structura) prezintă, sub forma unei schiţe, obiectele conţinute în fereastră.
Elementele din schiţă se referă la titlu, note şi denumirea rezultatelor statistice propriu-zise.
Fereastra Pivot Table (Pivot Table Editor) oferă multiple posibilităţi de modificare a
tabelelor pivot: editare text, schimbarea datelor din rânduri şi coloane, adăugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afişarea selectivă a rezultatelor.
Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagramă, legendă etc.)
12
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 17:
Se selectează „atenţie”.
Se apasă butonul ► pentru a
muta „atentie” în căsuţa
„Variable(s)” cu ajutorul săgeţii.
Se dă clic pe „OK”.
Pasul 18:
Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizată anterior.
13
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Fiecare dintre criteriile de diferenţiere este o variabilă, adică o entitate
care ia valori diferite pentru componenţii colectivităţii şi este comună tuturor
elementelor colectivităţii.
Exemplul 1. „mediul de provenienţă” este o variabilă care poate lua trei
valori: „urban”, „rural” – variabilă categorială;
Exemplul 2. Variabila „gen biologic” poate lua 2 valori: „feminin” şi
„masculin”. – variabilă categorială;
Exemplul 3: „Vârsta” poate lua valori de la 0 ani la peste 100 de ani. –
variabilă numerică;
Variabila „Vârsta” poate fi şi variabilă categorială şi lua diferite valori
in funcţie de categoriile stabilite. (se stabilesc categorii de vârste).
Exemplu: 1. 10-20 ani
2. 21-30 ani
3. 31-40 ani.
O variabilă, reprezintă un concept cheie în statistică şi nu este altceva
decât un nume pentru un element a cărui proprietate principală este aceea
că variază, îşi modifică parametrii. (Opariuc, 2009) Mulţimea valorilor
înregistrate pentru o caracteristică particulară constituie distribuţia variabilei
respective.
a. Variabile discrete.
Variabilele discrete sunt cele care sunt exprimate prin numere întregi
(număr finit de valori pe care le poate lua). (Popa, 2008).
Exemplu:
numărul de copii pe care îi are o familie;
numărul de oraşe dintr-un judeţ;
genul biologic;
Gradul didactic;
În cazul variabilelor discrete, mulţimea de definiţie a valorilor sale este o
mulţime discontinuă iar între două valori nu poate fi interpusă o valoare
intermediară.
Variabilele discrete pot fi categoriale sau de rang.
b. Variabile continue
Sunt variabile „de tip numeric (cantitativ, de tip interval/raport) care au
un număr teoretic infinit de niveluri de măsurare...poate lua orice valoarea
(exprimabilă şi prin numere fracţionate), permiţând utilizarea zecimalelor”.
(Popa, 2008, p. 25).
Exemplu:
greutatea → între un subiect de 72 kg şi un subiect de 76 kg putem găsi
oricând un subiect de 74,5 kg;
cifra de afaceri a unei firme;
înălţimea subiecţilor.
În cazul acestor variabile, mulţimea de definiţie a valorilor sale este una
continuă, ne-numărabilă. Aceste variabile se mai numesc şi variabile scalare
(de interval sau de raport).
15
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
*Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este
variabilă nominală (categorială) sau variabilă cantitativă.
Definirea atributelor unei variabile este prima operaţie din procesul de pregătire a
setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei,
tipul, lungimea (numărul de caractere), numărul de zecimale (pentru cele numerice), eticheta,
valorile etichetei, valorile lipsă, alinierea şi modalităţile de măsurare a variabilei. Variabilele
se definesc în coloanele foii Variabile View din fereastra Data Editor.
Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot,
Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.
*O sesiune de lucru în SPSS presupune, obligatoriu, existenţa unei baze de date
(începând cu versiunea 14, SPSS poate deschide simultan mai multe baze de date).
16
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se defineşte variabila.
Pasul 2:
Se selectează:
„Analize”,
„Descriptive Statistics”
„Frequencies…”
17
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Se selectează specializare şi se mută
în partea dreaptă a tabelului
(procedeul a fost descris la pasul 17
din capitolul I).
Se apasă „OK”
Pasul 4:
1. Prima coloană a tabelului conţine eticheta celor 4 categorii de specializări.
Pasul 1:
Se selectează:
„Graphs”
„Legacy dialogs”
„Pie”.
18
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Se selectează „Define”.
Pasul 3:
Se selectează „specializarea”
şi se transferă prin apăsarea
butonului ►(◄) în rubrica
„define slices by”.
Se apasă „OK”.
Pasul 4:
19
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se selectează:
„Elements”
„Show Data Labels”.
Pasul 2:
Se selectează „Count” şi
„X”-ul roşu pentru a nu afişa.
20
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Pasul 1:
Se selectează:
„Graphs”
„Legacy dialogs”
„Bar…”.
21
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Selectaţi „Define”.
„Simple” este preselectat.
Pasul 3:
Se selectează „% of cases”.
Se apasă „OK”
Diagrama cu bare.
22
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
* Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru
aceeaşi colectivitate (Summaries of separate variables).
Diagrama Bar este folosită pentru a ilustra categoriile unei distribuţii în formă convenabilă.
Diagrama prezintă atâtea bare câte categorii are o variabilă. Barele au aceeaşi bază, egală cu
unitatea, iar înălţimea proporţională cu frecvenţa categoriei astfel încât aria fiecărei bare
reprezintă numărul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie să conţină următoarele elementele:
- titlul graficului – oferă informaţii asupra fenomenului reprezentat (Titlul graficului
coincide cu titlul tabelului de date);
- axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscisă se înscrie
variabila de distribuţie, iar pe ordonată frecvenţa.
- legenda – este folosită pentru a explica elementele din diagramă;
- sursa – precizează originea datelor reprezentate.
II.5. Histograme.
Se selectează:
„Graphs”
„Legacy Dialog”
„Hitogram”
Pasul 2:
Se selectează întrebarea „Vă place
statistica?” şi se apasă butonul ►de
lângă „Variable” pentru a duce întrebarea
în căsuţa din dreapta.
Se apasă „OK”.
Histograma
23
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
24
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2: Pasul 3:
25
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 4:
Se selectează „vârsta”
şi butonul ► pentru a
introduce în lista de
variabile.
Se deselectează
butonul „Display frequencys tables”
şi se ignoră mesajul de avertizare.
Se dă clic pe „Statistics…”
Pasul 5:
Se selectează
„Mean”;
„Median”;
„Mode”.
Se dă clic pe „Continue”.
Statistics
varsta Există 10 cazuri cu date valide pe care se
N Valid 10 bazează analiza.
Missing 0
Nu sunt date lipsă (0).
Mean 26,90
Media de vârstă, media aritmetică
Median 28,50
=26,9 ani.
Mediana de vârstă (vârsta persoanei
Mode 34
aflate la mijlocul liniei de vârste de la cea
mai mică la cea mai mare) este de 28.5 ani, ceea ce înseamnă că, jumătate
dintre subiecți au vârste mai mici decât valoarea medianei iar cealaltă jumătate
au vârste mai mari decât valoarea medianei.
Valoarea mod de vârstă este 34, ceea ce semnifică faptul că cei mai mulți
subiecți au vârsta de 34 de ani.
26
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Definiţie: Indicatorul statistic reprezintă expresia numerică a unor fenomene şi
procese social-economice, definite în timp, spaţiu şi structură organizatorică. (Benţea, M,
Munteanu, G , 2007, p. 59)
Media reprezintă suma aunui număr de scoruri împărţită la numărul de scoruri.
(Howitt, Cramer, 2010, p. 74).
Modul este categoria cu frecvenţa cea mai mare, el reprezintă valoarea cel mai des
întâlnită într-o serie statistică sau cea care are cea mai mare frecvenţă de apariţie. Modul se
mai numeşte şi dominanta seriei sau valoarea modală şi este singura măsură a mediei care
poate fi folosită pntru date nominale.
Grafic, într-o histogramă ori poligon al frecvenţelor el reprezintă valoarea de pe
abscisă corespunzătoare vârfului reprezentării.
O serie de date statistice poate să aibă una sau mai multe valori modale. O distribuţie
cu un singur mod se numeşte unimodală, dacă are două valori dominante se numeşte
bimodală, iar dacă are mai mult de două moduri se numeşte multimodală.
Mediana este o altă măsură a tendinţei centrale şi reprezintă valoarea care împarte
şirul de măsurători în două părţi egale; jumătate din şirul de date vor avea valori mai mici
decât mediana în timp ce cealaltă jumătate vor avea valori mai mari decât mediana (Opariuc,
2009, p. 79).
Mediana prezintă valoarea/varianta din mijlocul unei serii de date, serie în care
observaţiile au fost ordonate crescător (sau descrescător). Mediana este situată în centrul
(mijlocul) seriei.
Mediana poate fi folosită în caracterizarea tendinţei centrale pentru o serie de date
măsurate pe o scală ordinală. Mediana ia în considerare doar poziţia observaţiilor în serie, nu
şi magnitudinea lor efectivă.
Pentru a determina mediana introducem noţiunea de ranguri, adică, numere de
ordine asociate observaţiilor (cea mai mică – rang 1; cea mai mare – rang n).
Mediana, prezintă, mai intuitiv decât abaterea standard, gradul de împrăştiere al
rezultatelor în jurul mediei, deoarece este o expresie procentuală a împărţirii abaterii standard
la medie. (Opariuc, 2009, p. 130).
Se calculează ca raport între abaterea medie pătratică şi nivelul mediu al seriei,
deoarece abaterea standard se foloseşte frecvent pentru măsurarea abaterii medii.
Valoarea coeficientului de variaţie exprimă un raport procentual dintre abaterea standard şi
medie. Cu cât este mai mare, cu atât se poate spune că media este mai puţin reprezentativă
pentru distribuţia respectivă. (Popa, 2008).
După Popa (2006), sunt propuse anumite limite de interpretare a coeficientului de variaţie:
- dacă v x ˂ 15%, împrăştierea este mică, deci media este reprezentativă;
- dacă v x este cuprins între 15 şi 30%, împrăştierea este mijlocie şi media este sufucient
de reprezentativă;
- dacă v x ˃ 30%, împrăştierea este mare, iar media are o reprezentativitate redusă.
Cu cât nivelul lui vx este mai apropiat de zero cu atât variaţia este mai redusă,
colectivitatea este mai omogenă, media având un grad mai ridicat de reprezentativitate; cu cât
valoarea sa este mai departe de zero, cu atât variaţia este mai intensă, colectivitatea mai
eterogenă, iar media are un nivel de semnificaţie mai scăzut.
27
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
8. Rang – diferenţa dintre cel mai mare şi cel mai mic scor obţinut pentru o
variabilă.
9. Minim (scor) – valoarea celui mai mic scor al datelor pentru o variabilă
particulară.
28
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
10. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o variabilă
particulară.
11. Eroarea standard (ES medie) – valoarea medie cu care mediile
eşantioanelor extrase dintr-o populaţie, diferă faţă de media populaţiei.
Poate fi utilizată asemănător cu baterea standard şi varianţa, ca indice al
variabilităţii scorurilor pentru o anumită variabilă.
12. Amplitudinea – reprezintă diferenţa numerică dintre scorul maxim şi
scorul minim al unei variabile.
29
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
30
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Pasul 2:
În „Data View”
din „Data Editor”
se introduc
scorurile obţinute
la „Atenţie” în
prima coloană.
Pasul 3:
Se selectează
„Analyze”,
„Descriptives
Statistics” şi
Frequencies…”
Pasul 4:
Se selectează
„atenţie” şi apoi
se apasă butonul
►pentru a
introduce în lista
de variabile.
Se apasă „OK”.
31
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
IV.3. Histograme.
32
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
IV.5. Modalitatea.
Figura nr. 1.
O distribuţie similară distribuţiei din
figura 1, este o distribuţie bimodală
(figura 2), deoarece observăm existenţa a
două categorii cu frecvenţa egală şi
maximă.
Figura nr. 2.
33
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Normalitatea distribuţiei, sub aspectul modalităţi, se verifică prin
calcularea valorii modul. Dacă există o singură valoare cu frecvenţa maximă,
atunci distribuţia poate fi considerată normală sub acest aspect. În condiţiile în
care sunt două sau mai multe valori cu frecvenţa maximă şi, evident, egală,
distribuţia este polimodală (multimodală) şi nu poate fi considerată ca fiind
normală.
IV.6. Simetria.
O distribuţie este
simetrică, dacă valorile sunt
egal (simetric) răspândite în
jurul tendinţei centrale. Atunci
când rezultatele tind către valori
mici, sunt aglomerate în partea
stângă a distribuţiei, avem de a
spre dreapta (sau distribuţie skewness pozitiv). Când rezultatele tind către valori
mari, se aglomerează în partea dreaptă a distribuţiei, vorbim despre o distribuţie
asimetrică la stânga (skewness negativ). Cu alte cuvinte putem spune că,
asimetria este dată de panta distribuţiei şi nu de vârful acesteia.
34
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Atunci când discutăm de asimetrie, trebuie să precizăm o serie de relaţii
care apar între indicatorii tendinţei centrale, media, mediana şi modul.
35
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Ştim, de la analiza preciziei indicatorilor tendinţei centrale, că într-o serie
de date în care întâlnim scoruri extreme
mici, media tinde să le pună în valoare.
Iată că acest fapt este ilustrat grafic în
figura de mai sus în care se observă relaţia
existentă.
36
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
37
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
V. Abaterea standard.
________________________________________________________________________________________________________________
Abaterea standard este un indice care arată cât de mult deviază (diferă)
unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac
parte. (Howitt, Cramer, 2010, p. 90).
Abaterea standard poate fi folosită şi pentru a transforma scoruri pentru
variabile foarte diferite în scoruri Z (sau standard), care sunt uşor de comparat şi
însumat.
Abaterea patratică medie este radacina patrată din media aritmetică a
Vârstă 20 22 25 26 35 38 28 24 23 24
Pasul 1:
22
Petruş, Al., 2005 – Introducere în statstica socială, Editura Paralela 45, Piteşti, p. 52
38
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
În „Data View” din „Data Editor”
se introduc vârstele în prima
coloană.
Pasul 3:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptives…”
Pasul 4:
Se selectează „vârsta” şi apoi se
apasănbutonul ► pentru a o i
ntroduce în lista de variabile.
Se selectează „Options…”
Pasul 5:
Se deselectează „Mean”,
„Minimum”, „Maximum”.
Se selectează „Continue”.
39
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
V. 2. Interpretarea output-ului.
Descriptive Statistics
N Std. Deviation
Numărul 10 reprezintă numărul de cazuri. varsta 10 5,740
Abaterea standard pentru vârstă este de Valid N (listwise) 10
5,740.
Abaterile mici, indică faptul că valorile sunt uşor distanţate de medie, în timp ce abaterile
mari, arată că datele sunt distanţate, împrăştiate în jurul mediei, care, nu mai este
reprezentativă. Abaterea standard se exprimă în aceleaşi unităţi de măsură ca şi media
Proprietăţile abaterii standard (Popa, 2008, p. 70):
- dacă se adaugă /scade o constntă la fiecare valoare a unei distribuţii, abaterea standard
nu este afectată;
- dacă se multiplică/divide fiecare valoarea a unei distribuţii cu o constantă, abaterea
stabdard se multiplică/divide cu acea constantă.
Abaterea standard nu poate fi calculată decât atunci când sunt date numerice. Ea nu se
calculează dacă sunt folosite variabile nominale (categoriale).
V.3. Scorurile Z
Pasul 1:
La pasul 4 selectaţi „Save
standardized values as variables”.
Se apasă „OK”.
Pasul 2:
40
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
• Media unei distribuţii „z” este egală cu zero, afirmaţie ce rezultă din
proprietatea acestui indicator de a se diminua atunci când scădem o
constantă din fiecare scor particular. Deoarece din formulă rezultă această
diferenţă (se scade fiecare scor particular din medie), în final media va
ajunge la valoarea zero
41
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
42
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
În foarte multe cercetări se studiază relaţiile dintre două sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost
descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea
poate necesita ca relaţiile şi corelaţiile dintre diferitele variabile să fie studiate.
La fel ca statistica univariată, statistica bivariată a datelor necesită
studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame.
Modelele de prezentare a relaţiilor bivariate includ crearea tabelelor scatter.
O condiţie esenţială o constituie etichetarea tabelelor şi diagramelor şi
denumirea acestora.
În continuare se va ilustra elaborarea unui tabel de asociere şi a unei
diagrame cu bare.
Pasul 1:
În „Variable View” din „Data Editor” se denumeşte:
- prima coloană „Instituţionalizare”
- a doua coloană „Genul biologic”;
- A treia coloană „Frecvenţa”.
43
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Pasul 3:
Se introduc aceste numere în „Data
View” din „Data Editor”.
Primul rând se referă la fetele care
au fost instituţionalizate: sunt în număr
de 5.
Al doilea rând se referă la băieţii
care au fost instituţionalizaţi:
sunt în număr de 6.
Al treilea rând se referă la fetele neinstituţionalizate: sunt în număr de 4.
Al patrulea rând se referă la băieţii
neinstituţionalizaţi: sunt în număr de 5.
Pasul 4:
Pasul 5:
Se selectează „Frecvenţa”,
„Weight cases by” şi apoi se
apasă butonul ►pentru
transfer în căsuţa
variabilei„Frequency
Variable”.Se apasă „OK”
44
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 6:
Se selectează:
„Analize”
„Descriptivesc statistics”
„Crosstabs…”.
Pasul 7:
Pentru a pune „instituţionalizare”
pe rândurile tabelului, se selectează
şi apoi se apasă butonul ►de lângă
eticheta „Row(s)”.
Se apasă „OK”.
Pasul 8:
În tabel sunt
prezentate valorile
celor două variabile.
Se observă că sunt 5
fete şi 6 băieţi
instituţionalizaţi (în total 11) şi 4 fete şi 5 băieţi neinstituţionalizaţi (în total 9).
(N=20).
*Tabelul de asociere este folosit pentru prezentarea relaţiilor dintre două variabile
categoriale. În fiecare celulă a tabelului este prezentată frecvenţa parţială (adică efectivul care
poartă simultan o valoare a fiecărei variabile).
Observaţie:
1. Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al
alteia, atunci categoriile acelei variabile se plasează pe rânduri.
2. O celulă din crosstabs oferă informaţia despre intersecţia celor două variabile. Pentru
aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect
afişarea ferestrei Crosstabs Cell Display.
45
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
46
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte
desenate pe această diagramă a datelor sau sunt aranjate într-o manieră
curbilinie. (Howitt, Cramer, 2010, p. 111).
Coeficienţii de corelaţie neparametrici
- Se utilizează atunci când una dintre variabilele folosite nu îndeplineşte
condiţiile unei distribuţii normale. După Opariuc (2011), datele care se
află la un nivel de interval sau de raport, pot fi convertite uşor în ranguri
sau în frecvenţe (la nivel ordinal sau nominal) dar această situaţie nu este
posibilă şi în sens invers.
În cazul corelaţiei există trei elemente esenţiale în interpretarea unui
coeficient de corelaţie: sensul, valoarea şi semnificaţia. (Opariuc, 2011, p. 102).
O corelaţie pozitivă semnifică faptul că, cele două variabile evoluează în aceaşi
direcţie în timp ce o corelaţie negativă indică faptul că, în timp ce o variabilă
creşte, cealaltă variabilă scade.
Pasul 1:
În „Variable „View” din „Data
Editor” se denumeşte primul
rând „muzică”
şi al doilea rând „matematică”.
* Se înlătură cele două zecimale.
47
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Pasul 1:
Se selectează:
„Analyze”,
„Corelate”,
„Bivariate…”
Pasul 2:
Se selectează „Muzică” şi
„Matematică” şi apoi se apasă
butonul ►pentru a le introduce
în lista de variabile aşa cum este
arătat în figura din dreapta.
Se apasă „OK”.
48
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Un coeficient de corelație poate fi calculat corect numai când datele ambelor variabile
se referă la eșantioane și fiecare este ales independent.
Coeficientul de corelaţie Pearson evaluează asocierea dintre două variabile cantitative
iar domeniul de variaţie al acestuia este cuprins între -1 (corelaţie puternic negativă) şi +1
(corelaţie puternic pozitivă).
Un coeficient de corelatie poate fi apropiat de 1, deci ne va indica o corelație puternică,
dar ea poate fi nesemnificativă din cauza volumului mic a eșantionului studiat.
Eșantionul reprezintă un subset de elemente selectate dintr-o colectivitate statistică.
Eşantionul reprezintă „unităţile de informaţie selecţionate pentru a fi efectiv studiate” (Popa,
2008, p. 38). „Calitatea unui eşantion de a permite extinderea concluziilor la întreaga
populaţie din care a fost extras se numeste reprezentativitate” (Popa, 2008, p. 39).
După Rotariu (2006), reprezentativitatea este „capacitatea eşantionului de a reproduce cât
mai fidel structurile şi caracteristicile populaţiei din care a fost extras”.
Gradul de reprezentativitate al unui esantion depinde de:
- caracteristicile populaţiei;
- mărimea eşantionului;
- procedura de eşantionare folosită.
Corelația nu trebuie identificată cu cauzalitatea, în sensul că, observațiile a 2 variabile
se pot corela foarte bine fără să avem motive logice și știintifice că una dintre variabile poate
fi cauza celeilalte.
Semnul (+/-) indică sesnul asocierii dintre cele două variabile. O valoarea pozitivă
arată că, pe măsură ce valorile unei variabile cresc, valorile celeilalte variabile cresc şi ele. O
valorea negativă arată că, pe măsură ce valorile unei variabile cred, valorile ceilalte variabile
scad (Popa, 2008, p. 309).
Testul de corelaţie Pearson implică două măsuri pentru aceeaşi subiecţi. Acest model
se întâlneşte şi atunci când se aplică Testul t pentru eşantioane perechi, iar utilizarea uneia
dintre cele două teste este dată de problema cercetării:
- Dacă se testează diferenţa dintre mediile variabilelor, măsurate în două moment
diferite, se utlizează testul t;
- Dacă se testează asocierea dintre variabile diferite, măsurate pe aceeaşi subiecţi, atunci
se foloseşte testul de corelaţie.
49
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Identic corelaţiei Pearson se
selectează „Analyze”, „Correlate”,
„Bivariate” şi variabilele care se
doresc pentru corelaţie.
Se selectează „Spearman” şi se
deselectează Pearson (dacă nu se
doreşte ca şi corelaţie).
Se apasă „OK”.
*Testul de corelaţie a rangurilor, Spearman, este echivalentul pentru date ordinale al testului
de corelaţie Pearson.
50
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se selectează:
„Graphs”
„Legacy Dialogs”
„Scatter Dot”
Pasul 2:
Se selectează „define”
din moment ce „simple”
este deja selectat.
51
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Se apasă „OK”.
*Dacă relaţia este curbilinie atunci corelaţiile Pearson şi Spearman pot fi înşelătoare.
52
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Coeficientul de corelaţie pentru date ordinale (Spearman) se utiliuzează atunci când
(Popa, 2008):
- ambele variabile sunt de tip ordinal;
- una dintre variabile este de tip ordinal şi cealaltă este de tip interval/raport;
- Ambele variabile sunt de tip interval/raport, dar una sau ambele prezintă valori
extreme.
- variabilele sunt măsurate pe scale de interval sau de raport, dar distribuţia uneia sau a
ambelor se îndepărtează grav de la forma normală.
Spearman este un coeficient care se bazează pe ranguri şi reprezentativitatea mediei nu
are influenţă asupra lui. Coeficientul se utilizează de regulă atunci când lotul de cercetare este
sub 30 de cazuri. Acest coeficient transformă scorurile originale în ranguri şi analizează
relaţia dintre acestea.
Coeficientul de corelaţie a rangurilor Spearman este „un coeficient de corelaţie
direcţional şi poate avea valori cuprinse între -1 şi -1” (Opariuc, 2011, p. 24-25).
Dacă se obţin valori apropiate de +1 atunci înseamnă că există o asociere pozitivă între
cele două variabile. Dacă se obţin valori apropiate de -1 atunci există o asociere negativă. În
situaţiile în care valoarea coeficientului de corelaţie se apropie mai mult de zero, varibilele nu
se corelează, adică, nu au nicio legătură între ele.
53
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
VIII. Regresia.
Predicţia cu precizie.
_________________________________________________________________________________________________________________
Dacă există o relaţie între două variabile atunci sunt posibile estimarea
sau predicţia scorului unei persoane la o variabilă pornind de la scorul obţinut la
cealaltă variabilă. Cu cât este mai puternică corelaţia cu atât este mai bună
predicţia. Variabila independentă este variabila folosită pentru a realiza
predicţia, aceasta fiind cunoscută şi ca variabilă predictor sau variabila X.
*Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relaţiei dintre cele două variabile. Axa orizontală X este variabila independentă şi axa
verticala Y este variabila dependentă. Se poate investiga şi punctul de tăiere, acesta fiind
punctul în care panta se intersectează cu axa verticală.
Regresia devine o tehnică mult mai importantă atunci când sunt folosite
mai multe variabile pentru predicţia valorilor unei alte variabile.
În continuare este ilustrată procesarea unei regresii simple şi a unei
diagrame de regresie folosind datele din tabelul următor.
Scor muzica 3 7 8 9 9 6 4 3 4 7
Scor 7 5 4 4 5 8 9 9 7 6
matematică
Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face
predicții. Deși nu se găsesc relații perfecte în lumea reală, prin intermediul regresiei se pot
face predicții ale unei variabile, în funcție de valoarea alteia. Predicția este procesul de
estimare a valorii unei variabile cunoscând valoarea unei alte variabile.
Regresia se leagă foarte mult de conceptul de corelație. O asociere puternică între
două elemente conduce la creșterea preciziei predicției unei variabile pe seama alteia. Dacă
am avea o corelație perfectă (+1 sau –1) estimarea ar fi extrem de precisă.
54
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Pasul 1:
Se selectează:
„Analyze”
„Regression”
„Linear…”
Pasul 2:
Se selectează „matematica”
şi apoi se apasă butonul ◄ de
lângă eticheta „Independent(s)
pentru a introduce această
variabilă în căsuţa variabilei
(lor) independente.
Se selectează „Statistics…”
Pasul 3:
Se selectează „Continue”.
Se apasă „OK” din ecranul precedent
care reapare.
55
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se selectează:
„Graphs”
„Legacy Dialog”
„Scatter/Dot”
Pasul 2:
56
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Pasul 4:
Se selectează „Elements” şi
„Fit Line at Total”.
57
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
În regresie axa orizontală este variabila predictor sau independentă (în
cazul nostru „matematică”).
* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relaţie negativă între cele
două variabile.
58
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Stima de sine 5 7 3 6 4 5
Pasul 1:
Se introduc datele în „Data Editor”.
Se etichetează variabila „Stima”.
Pasul 1:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptive…”
59
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Pasul 3:
Se selectează „continue”.
60
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
X. Testul t.
Compararea a două eşantioane
de scopuri corelate/relaţionate.
_________________________________________________________________________________________________________________
61
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
În „Variable View” din „Data
Editor” se etichetează primul rând cu
„optsprezece” şi al doilea rând cu
„douăzeci şi patru”.
* Se înlătură cele două zecimale.
Pasul 2:
Pasul 1:
Se selectează:
„Analyze”
„Compare Means”
„Paired-Samples T Test…”
Pasul 2:
Se selectează „optsprezece”
şi se pune această variabilă
lângă eticheta „Variable1”
sub „Curent Selections”.
Se selectează „douăzeci şi
patru” şi se pune această
variabilă lângă eticheta
„Variable2” sub „Curent
Selections”.
Se apasă butonul ►pentru a
pune aceste două variabile
în lista variabilelor relaţionale.
Se apasă „OK”.
62
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate.
Corelaţia dintre ele 0,94. Aceasta este o corelaţie mare, nivelul de semnificaţie
fiind de 0,00.
Primele trei coloane care conţin cifre sunt componentele fundamentale ale
calcului unui Test t relaţionat. Media de -2,000 este de fapt diferenţa dintre
mediile pe 18 şi 24 luni, deci în realitate este media diferenţei. Valoarea lui t
este bazată pe această medie a diferenţei (-2,00), divizată cu eroarea standard a
mediei (0,267). Calculul oferă valoarea lui t (-7,483).
63
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
XI. Testul t.
Compararea a două eşantioane de
scoruri necorelate/nerelaţionate.
_________________________________________________________________________________________________________________
64
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Testul t pentru eşantioane independente este utilizat atunci când cele
două seturi de variabile provin din două eşantioane diferite de oameni.
Procesarea unui Test t pentru eşantioane independente este ilustrată cu
datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10
copii care provin din familii biparentale şi 10 copii care provin din familii
monoparentale. Scopul analizei este de a aprecia dacă valorile emotivităţii sunt
diferite la copii care provin din familii cu doi părinţi faţă de copii care provin
din familii monoparentale.
Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9
Pasul 1:
În „Variable View” din „Data Editor”, se etichetează pe rând „Familii”.
Aceasta va defini cele două tipuri de familii.
Pasul 2:
65
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
(familia). Cu alte cuvinte, fiecare rând în parte reprezintă un anumit copil şi variabilele sale
dependente şi independente sunt introduse separat în „Data Editor”.
Pasul 1:
Se selectează:
„Analyze”
„Compare Means”
„Independent Samples T test…”
Pasul 2:
Se selectează „Emotivitate” şi
apoi se apasă butonul ► pentru
a introduce această variabilă în
lista variabilelor de test.
Pasul 3:
Se introduce:
- valoarea 1 (codul pentru familiile
- biparentale) lături de eticheta
- „Group 1”
- valoarea 2 (codul pentru familiile
- monoparentale) alături de eticheta
- „Group 2”.
Se selectează „Continue”
66
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Primul tabel arată , pentru fiecare grup în parte, numărul de cazuri, media
şi abaterea standard. Media pentru familiile biparentale este 13,00. După cum se
observă există o diferenţă între cele două tipuri de familii, dar, întrebarea este
dacă mediile diferă semnificativ.
Valoarea lui t este media diferenţei (3,500) divizată cu eroarea standard a
diferenţei (1,493), diviziune ce produce valoarea 2,345.
67
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
68
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
69
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Se introduc valorile adecvate în meniul
„Data View” din meniul „Data Editor”.
Fiecare rând reprezintă una dintre cele şase
celule din tabelul prezentat anterior.
Paul 3:
Pasul 4:
Se apasă „OK”.
Se selectează:
„Analyze”
„descriptives statistics”
„Crosstabs…”(tabele de asociere)
70
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Se selectează „Gen” şi se
apasă butonul ► pentru
„Row(s)”: pentru a-l
introduce în caseta respectivă.
Se selectează „Statistics…”
Pasul 3:
Se selectează „Chi-square”.
Se selectează „Continue”.
Pasul 4:
Se selectează „Cells..”
Pasul 5:
În secţiunea „Counts” se selectează
„Expected”. Se selectează
„Unstandardized” în secţiunea
„Residuals”. Se selecteaze „Continue”,
apoi se apasă „OK în ecranul anterior
care reapare.
* Termenul „rezidual” se referă la diferenţe.
71
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
72
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Coloana finală din tabel etichetată „Total” conţine numărul de cazuri din
respectivul rând, urmat de numărul aşteptat de cazuri din tabel. Astfel primul
rând are 60 de cazuri, urmat de numărul aşteptat de cazuri din tabel. Astfel,
primul rând are 60 de cazuri, număr care va fi identic numărului de cazuri
aşteptate (adică 60).
În mod similar, rândul final din acest tabel (etichetat „Total) prezintă mai
întâi numărul de cazuri din respectiva coloană urmat de numărul aşteptat de
cazuri din tabel pentru coloana respectivă. Astfel, prima coloană are 44 de
cazuri, număr care ca fi întotdeauna egal cu numărul aşteptat de cazuri (adică
44,0).
Valoarea chi-square, gradul său de liberate şi nivelul său de semnificaţie sunt
afişate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjită la un număr cu două
zecimale, devine 13,52. Gradul său de libertate este 2, iar probabilitatea two-
tailed exactă este 0,001.
Sub acest tabel se mai poate vedea şi mărimea „minimum expected count” a
oricărei celule din tabel, care este 13,88 pentru ultima celulă (fetele care preferă
site-urile cu muzică). Dacă diferenţa minimă aşteptată este mai mică decât 5.0,
atunci trebuie să se acorde foarte multă atenţie Testului chi-square.
* Dacă se foloseşte un tabel 2x2 de tip chi-square şi apar frecvenţe anticipate reduse, este
recomandat să se folosească testul Fisher, pe care aplicaţia SPSS îl include în output în astfel
de situaţii.
73
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
*În general, testul chi-square este folosit pentru evaluarea existenţei unei diferenţe
semnificative între două sau mai multe eşantioane care sunt formate din date de frecvenţă
(date nominale). Altfel spus, este testul statistic uzual care analizează tabelele de asociere sau
contingenţă pe baza a două variabile categoriale nominale.
74
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
75
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:
Se selectează „Transform”,
„recode”
Şi „Into Different Variables”
Pasul 3:
Se selecteaă „Vârstă” şi se
apasă butonul ◄ pentru a
introduce „Vârsta” în
caseta „Numeric Variable
– Output variable”.
Se introduce numele noii
variabile.
Se selectează „Change”
pentru a adăuga acest nume Se selectează „Old and New values”.
nou în caseta „Numeric variable
– Output Variable”.
Pasul 4:
Se selectează „Lowest
through” şi se scrie 9 în
caseta alăturată.
Se selectează „Value”
din meniul „new value”
şi se scrie 1 în căsuţa
alăturată.
Se selectează „Add” şi
se introduce „lowest
throught 9→1 „ în caseta
„Old→New”.
76
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 5:
Se selectează
„Range: through
highest” şi se scrie
10 în caseta de
lângă el.
Se selectează
„value” şi se scrie
2 în caseta
alăturată.
Se selectează
„Add” şi se
introduce „10
through
Highest→2” în
caseta „Old→New”. Se apasă „OK” în ecranul care va reapărea.
Pasul 6:
Noua variabilă şi valorile sale sunt
afişate în meniul „Data View”.
77
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
78
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 4:
Pentru a salva această
procedură sub formă de fişier
de sintaxă, se selectează
„Paste” în caseta principală.
Această comandă de sintaxă
va apărea în fereastra
„Syntax”.
79
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
80
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Pasul 2:
Se selectează:
„Analyze”
„Nonparametric Tests”
„Legacy dialog”
„2 Related Samples…”
Pasul 3:
Se selectează „Optsprezece”
şi „douăzecisipatru” şi se
apasă butonul ◄ pentru a
introduce aceste două
variabile în caseta „Test Pair
(s) List”.
Se deselectează „Wilcoxon”.
Se selectează „Sign”.
Se apasă „OK”.
81
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
82
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Se poate ignora primul dintre cele două tabele de output. Acestea indică
numărul de diferenţe negative (0), pozitive (8) şi inexistente (0) în ceea ce
priveşte datele ordonate după cele două vârste, şi media şi suma catalogate
negative şi pozitive. Valorile pentru „două zeci şi patru „ de luni sunt mai mari
decât cele pentru „optsprezece” luni.
Al doilea tabel indică nivelul de
semnificaţie al acestui test. În loc să
folosească tabelul valorilor critice,
computerul utilizează o formulă care
stabileşte o conexiune cu distribuţia Z.
Scorul Z este de – 2,558, care are o
probabilitate two-tailed de 0,011. Aceasta înseamnă că diferenţele dintre cele
două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.
83
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9
Pasul 1:
- este acelaşi ca şi cel prezenta la capitolul XI.
Pasul 2:
Se selectează:
„Analyze”
„Nonparametric tests”
„Legacy dialog”
„2 Independent Samples…
Pasul 3:
Se selectează „Emotivitate” şi
se apasă butonul
►pentru a introduce parametrul
„Emotivitate” în caseta „Test
Variable List”.
Se selectează „Familie” şi se
apasă butonul ◄pentru a
introduce „Familie” în caseta
„Grouping Variables”.
84
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 4:
*Testul Mann-Whitney este utilizat pentru testarea diferenţelor dintre grupuri independente
pentru care variabila dependentă este exprimată în valori ordinale (de rang) sau atunci când nu
suportă un test parametric (testul t). (Popa, 2008, p. 333).
Se poate ignora primul dintre cele două tabele de output. Acest tabel
indică faptul că rangul mediu dat parametrului „Emotivitate” pentru primul grup
(adică valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adică
valoarea 1) este de 7,85. Aceasta înseamnă că valorile din grupul 2 (biparentale)
au tendinţa să fie mai mari decât cele din grupul 1 (monoparentale).
85
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
vedea, aceasta a modificat nivelul de semnificaţie doar marginal, de la 0,44 la
0,44.
86
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
87
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se introduc datele.
Se codifică cele trei
condiţii cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” şi „Placebo”.
Pasul 2:
Se selectează:
„Analyze”
„Comparea Means”
„One-Way ANOVA”.
Pasul 3:
Se selectează „depresie” şi se
apasă butonul ►de lângă caseta
„Dependent List” – pentru a
introduce parametrul în casetă.
Se selectează „Condiţie” şi se
apasă butonul ◄ de lângă caseta
„Factor” – pentru a introduce
parametrul acolo.
Se selectează „Options…
Pasul 4:
Se selectează metodele statistice „descriptive”
şi „Homogenity of variance test”.
Se selectează „Continue…”.
Se apasă „OK” din ecranul anterior, care va
reapărea.
88
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
89
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
90
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
privare de somn
3 ore 6 ore 9 ore
Consum alcool 14 16 20
10 14 22
15 23 30
Fără alcool 9 11 10
9 8 14
12 11 12
91
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 1:
Se introduc datele. Cele ouă coduri pentru
„Alcool” (1=alcool; 2= fără alcool) – în prima
coloană.
Pasul 2:
Se selectează:
„Analyze”
„General Linear Model”
„Univariate…”
Pasul 3:
92
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 4:
Se selectează „Descriptives
statistics” şi „Homogeneity test”.
Se selectează „Continue”.
Se selectează „Add”
.
Se selectează „Continue”. Se apasă „OK” din ecranul anterior
care va reapărea-
93
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Al patrulea
tabel indică
nivelele de
semnificaţie
pentru cele două
variabile
„Alcool” şi
„Privare de
somn”, şi
interacţiunea
dintre acestea.
Pentru prima variabilă, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai două condiţii pentru ca acest
efect să se producă, se poate conhide că scorul mediu al uneia dintre condiţii
este mult mai mare decât pentru cealaltă.
Pentru a doua variabilă a privării de somn, aceasta este egală cu 5,797,
valoare care are un nivel exact de semnificaţie de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce înseamnă
că mediile celor trei condiţii legate de somn nu sunt similare.
Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea
testelor de comparaţii multiple, cum este Testul t pentru eşantioane
independente.
94
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
raportul F pentru interacţiunile dintre cele două variabile (Alcool şi Privare de
somn) este de 2,708 → nivelul de semnificaţie al acestui raport este de 0,107→
nu este nicio interacţiune semnificativă.
Acest grafic este realizat pentru mediile celor şase condiţii. El a fost editat
cu ajutorul comenzii “Chart Editor”.
privare de somn
3 ore
22,50 6 ore
9 ore
Estimated Marginal Means
20,00
17,50
15,00
12,50
10,00
95
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Date studiu
Grup 1 Grup 2 Grup 3
Tratament hormonal Tratament hormonal Placebo
8 4 4
11 2 6
8 4 4
Pasul 1:
Se introduc datele.
Se codifică cele trei
condiţii cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” şi „Placebo”.
Pasul 2:
Se selectează:
„Analyze”
„Comparea Means”
„One-Way ANOVA”.
96
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Se selectează „depresie” şi se
apasă butonul ►de lângă caseta
„Dependent List” – pentru a
introduce parametrul în casetă.
Se selectează „Condiţie” şi se
apasă butonul ◄ de lângă caseta
„Factor” – pentru a introduce
parametrul acolo.
Pasul 4:
Se selectează:
„Tukey”
„Duncan”
„Scheffe”.
Se apasă
„Continue”.
Se selectează „OK” în
ecranul care va apărea
din nou.
97
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Al doilea tabel şi ultimul oferă rezultatele celor trei teste de comparaţii
multiple.
Subgrupele omogene.
Grupul hormonului 2 şi al
controlului Placebo
aparţin aceleiaşi
subgrupe, ceea ce
înseamnă că nu sunt
semnificativ diferite.
98
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Tabelul final, numit „Subgrupele omogene”, enumeră grupurile de medii care
nu sunt semnificativ diferite între ele.
Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD,
în acest caz există două subgrupe de medii. Subgrupa 1 indică faptul că mediile
grupelor hormonului 2 şi ale controlului placebo cu valorile 3,33 şi 4,67 nu
diferă semnificativ. Subgrupa 2 conţine doar media grupei hormonului 1, în
valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferită
atât de media grupei hormonului 2, cât şi de cea a gupelor de control placebo .
Toate cele trei teste prin comparaţii multiple sugerează acelaşi lucru: faptul că
există diferenţe semnificative între grupele hormonului 1 şi hormonului 2 şi între
grupele hormonului 1 şi cele ale controlului placebo. Alte diferenţe nu mai
există.
99
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
100
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
101
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
13. Diagrama de bare este folosită pentru:
a. a reprezenta valori medii;
b. a reprezenta frecvenţe absolute (numere) şi/sau relative (procente);
c. a reprezenta relaţiile dintre variabile;
d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
102
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
20. Indicatorii tendinţei centrale sunt:
a. modul, mediana, abaterea standard
b. medie, mod, mediană
c. dispersie, abaterea standard
30. Histograma:
a. este un grafic folosit în statistica descriptivă;
b. arată o distribuţie de frecvenţă;
c. se foloseşte pentru date calitative.
31.Valid procent:
a. exprimă aceste frecvenţe ca un procent al numărului total excluzând
datele lipsă.
b. frecvenţe ca un procent al numărului total lipsesc incluzând şi datele
care lipsesc.
c. frecvenţa valorilor.
41.Abaterea standard:
a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în
medie” faţă de media setului de scoruri din care acestea fac parte.
b. este un indice care arată cât de simetrică sau asimetrică este o
distribuţie;
c. este un indice care arată cât de turtită sau boltită este o distribuţie.
105
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
45. Corelaţia:
a. măsoară variaţia concomitentă a doi factori
b. măsoară parametria distribuţiei între două eşantioane
c. măsoară rangul unei distribuţii trihotomice
107
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
108
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
62. Testul t:
a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre
mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependentă este măsurată pe scală
cantitativă (interval-raport).
c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile
sunt diferite semnificativ una faţă de cealaltă.
110
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
RĂSPUNSURI CORECTE
111
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
19. b. graphs/ pie;
20. b. medie, mod, mediană
112
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
40. b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un
grad mare de eterogenitate;
41. a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în
medie” faţă de media setului de scoruri din care acestea fac parte.
42. a) suma seriei rămâne aceeaşi
43. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar
fi omogenă
44. b. se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la
numărul lor;
45. a. măsoară variaţia concomitentă a doi factori
46. a. evaluează gradul de asociere dintre două variabile măsurate pe scală de
interval/raport.
47. a. o asociere perfectă între cele două variabile;
48. b. neparametric;
49. b. neparametric;
50. a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă
variabilă descresc;
51. e. că scorurile unei variabile se măresc odată cu creşterea scorurilor
celeilalte variabile).
52. a. a reprezenta relaţia dintre variabile;
53. a. Analyze/Descrisptiv statistics/crosstabs;
54. b. prezentarea relaţiilor dintre două variante categoriale
55. b. eşantioanelor independente;
56. a. dacă mediile a două grupe sunt egale;
57. a. compararea a două seturi de date pentru identificarea diferenţelor;
58. c. se testează dacă media unei variabile este egală cu o constantă
specificată;
59. c. compară mediile pentru un singur grup observat în momente diferit
60. c. cele două seturi de variabile provin din două eşantioane diferite de
oameni.
113
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
61. a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eşantion
b. coeficientul de corelaţie între cele două seturi este mare
62. a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre
mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependentă este măsurată pe scală
cantitativă (interval-raport).
c. este utilizat pentru a calcula dacă mediile pentru două seturi de
variabile sunt diferite semnificativ una faţă de cealaltă.
63. a. recodificarea într-o variabilă diferită sau în aceeaşi variabilă;
64. c. ambele variante de mai sus.
65. a. testează egalitatea a două sau mai multe proporţii
66. b. transform/recode/into same variables;
66. a. transform/recode/into different variables;
67. c. ambele variante de mai sus.
68. a. indică măsura în care două sau mai multe grupuri au medii foarte
diferite;
69. b. testa diferenţa între cel puţin 3 grupuri;
70. c. compararea mediilor unei variabile dependente atunci când există
două variabile independente.
71. a. explică modul în care se decise care perechi de medii sunt diferite în
mod semnificativ între ele;
72. a. se foloseşte atunci când sunt mai mult de două medii;
114
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
BIBLIOGRAFIE
115
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
116