Sunteți pe pagina 1din 3

Verificarea datelor

1. Verificarea datelor analiza de .


Calea în SPSS: Analyze Descriptive Statistics Frequencies,
trecem variabilele care ne în partea clic OK.
2. Verificarea unor cazuri extreme (outlieri).
datelor problematice Un caz extrem este un caz cu o asemenea valoare pentru o
(un scor foarte diferit de restul datelor) (outlier univariat) sau o asemenea
de scoruri în sau mai multe variabile (outlier
Lect. Univ. dr. Adrian-Vicen multivariat) încât rezultatele la testele statistice.
Transformarea variabilelor în scoruri standardizate z.
Calea în SPSS: Analyze Descriptive Statistics Descriptives,
apoi Save as standardized variables
Scorurile z peste 3.29 în valoare sunt outlieri
(Tabachnick, & Fidell, 2013).
1
Pe foarte mari, z > 4. 2

Metode de corectare a datelor problematice, a


valorilor extreme
1. Calcularea de asimetrie (Skewness) de boltire Field, A. (2013) propune patru în cazul în care
(Kurtosis). Într-o , indicatori sunt zero. cazuri extreme în variabilele analizate sau unele sunt
Lomax & Hahs-Vaughn (2012) valorile skewness kurtosis :
sunt mai mici decât 2 în valoare atunci variabila este normal 1. Decuparea datelor aceasta presupune un
, un criteriu mai liberal mergând la valori mai mici decât procent din scorurile extreme;
3 în valoare .
2. Înlocuirea outlierilor cu valoarea cea mai mare care nu e
2. Aplicarea testelor Kolmogorov-Smirnov Shapiro-Wilk un outlier;
Calea în SPSS: Analyze Descriptive Statistics Explore, trecem
3. Analiza a datelor folosind metode mai robuste
variabilele în câmpul Dependent List, butonul Plots
Normality plots with tests, clic Continue, clic Ok.
aceasta folosirea testelor neparametrice sau a tehnicii
bootstrap.
rezultatele la aceste teste sunt nesemnificative statistic putem afirma
variabilei analizate nu semnificativ de o 4. Transformarea datelor aceasta presupune aplicarea unor
. matematice variabilelor cantitative pentru a încerca
Pe mari tind fie semnificative chiar nu problemele existente.
3 4
semnificativ de una .
Metode de corectare a datelor problematice, a Metode de corectare a datelor problematice, a
valorilor extreme valorilor extreme
1. Decuparea datelor. 3. Analiza a datelor folosind metode mai robuste.
Presupune unor scoruri din extreme ia mai multe forme: Procedura cea mai în unor date
datelor persoanei care contribuie ca outlier. problematice este folosirea unor metode statistice robuste la
violarea outlieri, care nu sunt afectate de
decuparea prin eliminarea a 5 %, 10% sau 20 % din scorurile cele acestea.
mai ridicate cele mai ( dintre cele mai
dintre cele mai ridicate). Acest lucru va conduce la Testele neparametrice, de exemplu, nu au nevoie de
datelor ( devenind mai ), deoarece de normalitate a datelor.
impactul outlierilor asupra datelor scade. O mai mai nou în programele
2. Înlocuirea. statistice (inclusiv SPSS) este bootstrap.
înlocuirea outlierilor cu cel mai apropiat scor care nu este
un outlier.
se înlocuirea scorurilor extreme cu scorul aflat la 3 (sau
3.29) standard de medie (Field, 2013). 5 6

Metode de corectare a datelor problematice Metode de corectare a datelor problematice


3. Analiza a datelor folosind metode mai robuste 3. Analiza a datelor folosind metode mai robuste
aplicarea procedurii bootstrap. aplicarea procedurii bootstrap. Exemplu.
În bootstrapping, nostru este considerat o din care se presupunem am un coeficient de Pearson r=
extrag mai multe mai mici (numite bootstrap), iar .50, semnificativ statistic la un p < .001.
pe fiecare dintre acestea se parametrii statistici care ne Aplicând procedura bootstrap, am un interval de încredere
(de ex., media, de medii, coeficientul de , bootstrapping [.415, .600].
coeficientul de regresie etc.). am ales extragem 1000 bootstrap, acest interval de
D alegem procedura bootstrap pe 1000 de , vom încredere ne spune în 95 % dintre cazuri, de
1000 de ale acestor parametric statistici, câte unul pentru pe fiecare dintre aceste bootstrap iau valori între .415
fiecare . Ulterior, parametri sunt de-a lungul unui .600. Cum valoarea zero nu este în acest interval, r=
interval (de la minim la maxim) cei între limitele de 95 %. Se .50 este semnificativ statistic.
astfel un interval de încredere bootstrap. Ce s-ar întâmpla valoarea zero ar fi în interval? Acest
În cazul testelor statistice, acest interval bootstrap nu lucru ar însemna , la o probabilitate de 95 %, ar exista ca r fie
valoarea zero, atunci rezultatul la testul statistic respectiv este atât negativ, cât zero sau pozitiv. Altfel spus, ipoteza H0 care
semnificativ statistic. r este zero nu ar putea fi prin urmare ipoteza de
7 cercetare H1 nu ar putea fi . 8
Metode de corectare a datelor problematice Metode de corectare a datelor problematice
3. Analiza a datelor folosind metode mai robuste 3. Analiza a datelor folosind metode mai robuste
aplicarea procedurii bootstrap. aplicarea procedurii bootstrap.
Procedura bootstrap poate fi în SPSS în cazul În cazul testului t pentru un , intervalul bootstrapping
de bivariate sau , a testelor t, a este calculat pentru dinte media pe valoarea
testelor de contrast sau post hoc din tehnicile ANOVA, în standard . intervalul ar valoarea zero, atunci ar fi
regresie . posibil ca între media pe valoarea standard nu
În cazul testului t pentru independente, existe nici o .
intervalul bootstrapping este calculat pentru dintre În cazul testului t pentru perechi, sunt construite
medii: intervalul de încredere ar valoarea zero, intervale bootstrap atât pentru coeficientul de r Pearson,
asta ar însemna dintre medii în ar cât pentru dintre medii.
putea fi , sau chiar zero. Astfel, ar fi posibil În regresia , sunt construite intervale bootstrap pentru
ca dintre medii fie zero, nu de regresie . valoarea zero ar fi
existe nici o între medii în . într-un astfel de interval, atunci nu am putea afirma cu o
este valabil în cazul testelor de contrast sau probabilitate de 95 % acest coeficient de regresie este diferit de
post hoc din ANOVA. 9 zero. 10

Metode de corectare a datelor problematice


3. Analiza a datelor folosind metode mai robuste
aplicarea procedurii bootstrap.
Aplicarea procedurii bootstrapping în SPSS, pentru fiecare test
statistic amintit, se face dând clic pe butonul Bootstrap,
Perform bootstrapping (aici putem modifica de
bootstrap care ar trebui fie extrase;
este 1000 ), iar în câmpul intervalelor de încredere
alegem Bias corrected accelerated (BCa), aceasta oferind
rezultate mai bune decât Percentile.
De obicei, rezultatul la bootstrap este congruent cu pragul de
p. rezultatul la bootstrap nu este congruent
cu pragul de p, atunci ne vom raporta la bootstrap,
deoarece procedura bootstrapping este mai , nefiind
de de normalitate a
variabilelor sau de outlieri. 11

S-ar putea să vă placă și