Documente Academic
Documente Profesional
Documente Cultură
1. Introducerea datelor
Datele pot fi introduse direct în SPSS/PSPP sau într-un editor de tip tabelar (de
exemplu Microsoft Office Excel) și importate ulterior. Fereastra principală are două opțiuni:
[Data View] și [Variable View].
În prima fereastră se introduc valorile variabilelor. În cazul în care datele au fost
introduse într-un editor tabelar se vor selecta, mai puțin capul de tabel, și se vor copia cu
opțiunea [Copy]. În fereastra [Data View] din SPSS/PSPP se va da <click buton stânga
mouse> în căsuța din stânga sus, după care datele copiate se vor lipi cu opțiunea [Paste].
O altă opțiune este să importăm baza de date, creată în alt editor, cu opțiunea [File]
[Open Database] [New Query ...].
__________________________
1
Vasiliu, D.. Memento de cercetare în psihologie. Un ghid prietenos pentru studenți
și nu numai ..., București: E.D.P., 2018, 152 p., ISBN 978-606-31-0501-2
1
Dan VASILIU
Pentru variabilele nominale și de tip scală sunt necesare câmpurile [Name] [Type]
[Width] [Label] [Columns] [Align] [Measure].
Variabilele categoriale vor necesita în plus utilizarea casetei care se deschide în
câmpul [Value] din fereastra [Variable View]. Câmpul [Value] din caseta de dialog se va
completa cu valoarea operaționalizată a variabilei categoriale (de ex.: 1 pentru masculin și 2
pentru feminin). Câmpul [Label] se va completa cu valoarea tip caracter a variabilei, așa
cum apare în cercetare (în exemplul nostru, masculin și feminin). După operaționalizare se
da <click buton stânga mouse> pe butonul [Add] și se trece la valoarea următoare. La
final se închide caseta de dialog cu butonul [OK]. Se va proceda asemănător și pentru
variabilele cu mai mult de două categorii.
2
Dan VASILIU
Pentru variabilele numerice, definite astfel în caseta [Type], se va introduce mai întâi
numărul de zecimale [Decimals] după care se va introduce valoarea [Width] ținând cont și
de punctul zecimal.
3
Dan VASILIU
[Analyze]
[Descriptive Statistics] [Frequencies...]
4
Dan VASILIU
Primul tabel ne oferă date privind numărul de participanți, datele valide introduse,
tendința centrală, împrăștierea și alte caracteristici ale distribuției.
Statistics
Scor la testare
Valid 12
N
Missing 0
Mean 2.50
Median 2.50
a
Mode 2
Std. Deviation 1.000
Variance 1.000
Skewness .000
Std. Error of Skewness .637
Kurtosis -.764
Std. Error of Kurtosis 1.232
Range 3
Minimum 1
Maximum 4
a. Multiple modes exist. The smallest
value is shown
Observăm că avem N=12 participanți, iar în baza de date nu există valori lipsă pentru
variabila studiată (Missing=0). Indicatorii tendinței centrale sunt: m=2.50; Me=2.50; Mo=2.
Tabelul ne indică că avem o distribuție multimodală. Indicatorii de împrăștiere sunt s=1.0 și
V=1.0. Amplitudinea (Range) = 3 având valorile minime=1 și maxime=4. Este o distribuție
perfect simetrică (Skewness=0.00) și platicurtică (Kurtosis=-0.764).
Al doiea tabel ne indică frecvențele cu care apar scorurile variabilelor.
Scor la testare
Frequency Percent Valid Percent Cumulative
Percent
1 2 16.7 16.7 16.7
2 4 33.3 33.3 50.0
Valid 3 4 33.3 33.3 83.3
4 2 16.7 16.7 100.0
Total 12 100.0 100.0
5
Dan VASILIU
În prima coloană sunt valorile pe care le ia variabila Scor la testare din distribuția
analizată. În coloana a doua apar procentele absolute ale scorurilor. Urmează procentele
valide și procentele cumulate. Rezultatele sunt reprezentate grafic sub forma unei
histograme în care este indicată, pentru comparație, forma curbei normale.
[Analyze]
[Descriptive Statistics] [Descriptives...]
6
Dan VASILIU
[Analyze]
[Descriptive Statistics] [Explore...]
7
Dan VASILIU
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
*
Scor la testare ,142 12 ,200 ,962 12 ,808
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
2,00 7 . 57
3,00 8 . 459
3,00 9 . 399
2,00 10 . 02
1,00 11 . 2
1,00 12 . 2
În engleză stem înseamnă tijă (trunchi) și leaf înseamnă frunze. În tabel stem este
asociat cu cifra zecilor iar leaf cu cea a unităților. Nu sunt luate în considerare zecimalele.
8
Dan VASILIU
9
Dan VASILIU
Cutia din grafic are baza în dreptul primei cuartile (Q1) și partea superioară în dreptul
quartilei a treia (Q3). Linia din mijloc este mediana (Me) cu aceeași valoare precum cuartila
a doua (Q2). Distanța dintre Q3 și Q1 se notează cu H. Mustățile care pornesc din cutie au o
lungime de 1.5H. Între limitele Q1 și Q3 se regăsesc valorile normale. Mustățile delimitează
scorurile adiacente. Valorile care depășesc mustățile sunt valori aberante și vor fi tratate
separat.
Dăm spre exemplu un grafic Box-Plot cu scoruri aberante.
10
Dan VASILIU
Valorile indicate prin cerculeț sau steluță sunt valori aberante. Cifrele din dreptul lor
reprezintă poziția participantului în baza de date, în cazul de față participantul cu numărul 16
și 88. În acest caz ne uităm în fereastra principală [Data View] și identificăm participanții de
la pozițiile respective. Prima dată comparăm scorurile din baza de date cu cele colectate în
timpul cercetării. Dacă sunt greșit introduse, le corectăm și reluăm analiza de la început.
Dacă sunt corect introduse, putem lua decizia de a le păstra, admițând că acestea sunt
importante pentru cercetare. În acest caz, ne asumăm faptul de a utiliza mai departe teste
neparametrice. Altă decizie este să eliminăm aceste scoruri din cercetare, admițând că sunt
erori datorate designului cercetării sau participantului în cauză. Dacă totuși nu le considerăm
erori și luăm decizia eliminării lor din cercetare, ele vor fi tratate separat într-un capitol
special sau într-o cercetare ulterioară.
Atenție! În cazul eliminării scorurilor aberante, operațiunea se va efectua începând
cu poziția cea mai înaltă. În cazul prezentat eliminăm întâi linia corespunzătoare poziției 88,
după care cea corespunzătoare poziției 16. Eliminarea se face dând <click buton stânga
mouse> pe cifra care indică poziția, urmat de <click buton dreapta mouse> și selectăm
opțiunea <Cut...>.
Este posibil ca în urma eliminării acestor valori să se verifice testul de normalitate
pentru distribuția rămasă.
11
Dan VASILIU
Analizele cele mai utilizate, care ne pot ajuta să inferăm rezultatele obținute pe
eșantionul reprezentativ asupra populației din care acesta a fost extras, sunt:
- corelații sau asocieri între variabile;
- diferențe între grupuri.
Pentru a fi riguroși din punct de vedere științific vom folosi termenul corelații (între
scoruri) pentru relația dintre variabile parametrice și asocieri (între ranguri) pentru relația
dintre variabile neparametrice.
Înainte da a aplica testul recomandăm analiza graficului privind relația între variabile.
În fereastra de dialog se selectează prima variabilă și se transferă în câmpul
[Graphs]
[Legacy Dialogs] [Scatter/Dot] [Simple Scatter] [Define]
<Y_Axix>, iar a doua variabilă în câmpul <X_Axix>, după care se accesează butonul [OK].
Putem întâlni diverse situații, ce vor tratate în mod diferit.
12
Dan VASILIU
Corelație pozitivă până la un punct după care Lipsa corelației liniare dar totuși există un alt tip
negativă. Se analizeaza corelațiile parțiale. de corelație. Se analizează curba de corelație
sau aproximează prin corelații parțiale
13
Dan VASILIU
În situația de mai jos observăm că mai toate cazurile sugerează o corelație puternică,
mai puțin cele două cazuri semnalate cu literele A și B.
Decizia privind testul statistic ce va fi utilizat se va lua conform tabelului de mai jos,
funcție de caracteristicile distribuțiilor analizate:
14
Dan VASILIU
15