Calea în SPSS: Analyze Descriptive Statistics Frequencies, trecem variabilele care ne în partea clic OK. 2. Verificarea unor cazuri extreme (outlieri). datelor problematice Un caz extrem este un caz cu o asemenea valoare pentru o (un scor foarte diferit de restul datelor) (outlier univariat) sau o asemenea de scoruri în sau mai multe variabile (outlier Lect. Univ. dr. Adrian-Vicen multivariat) încât rezultatele la testele statistice. Transformarea variabilelor în scoruri standardizate z. Calea în SPSS: Analyze Descriptive Statistics Descriptives, apoi Save as standardized variables Scorurile z peste 3.29 în valoare sunt outlieri (Tabachnick, & Fidell, 2013). 1 Pe foarte mari, z > 4. 2
Metode de corectare a datelor problematice, a
valorilor extreme 1. Calcularea de asimetrie (Skewness) de boltire Field, A. (2013) propune patru în cazul în care (Kurtosis). Într-o , indicatori sunt zero. cazuri extreme în variabilele analizate sau unele sunt Lomax & Hahs-Vaughn (2012) valorile skewness kurtosis : sunt mai mici decât 2 în valoare atunci variabila este normal 1. Decuparea datelor aceasta presupune un , un criteriu mai liberal mergând la valori mai mici decât procent din scorurile extreme; 3 în valoare . 2. Înlocuirea outlierilor cu valoarea cea mai mare care nu e 2. Aplicarea testelor Kolmogorov-Smirnov Shapiro-Wilk un outlier; Calea în SPSS: Analyze Descriptive Statistics Explore, trecem 3. Analiza a datelor folosind metode mai robuste variabilele în câmpul Dependent List, butonul Plots Normality plots with tests, clic Continue, clic Ok. aceasta folosirea testelor neparametrice sau a tehnicii bootstrap. rezultatele la aceste teste sunt nesemnificative statistic putem afirma variabilei analizate nu semnificativ de o 4. Transformarea datelor aceasta presupune aplicarea unor . matematice variabilelor cantitative pentru a încerca Pe mari tind fie semnificative chiar nu problemele existente. 3 4 semnificativ de una . Metode de corectare a datelor problematice, a Metode de corectare a datelor problematice, a valorilor extreme valorilor extreme 1. Decuparea datelor. 3. Analiza a datelor folosind metode mai robuste. Presupune unor scoruri din extreme ia mai multe forme: Procedura cea mai în unor date datelor persoanei care contribuie ca outlier. problematice este folosirea unor metode statistice robuste la violarea outlieri, care nu sunt afectate de decuparea prin eliminarea a 5 %, 10% sau 20 % din scorurile cele acestea. mai ridicate cele mai ( dintre cele mai dintre cele mai ridicate). Acest lucru va conduce la Testele neparametrice, de exemplu, nu au nevoie de datelor ( devenind mai ), deoarece de normalitate a datelor. impactul outlierilor asupra datelor scade. O mai mai nou în programele 2. Înlocuirea. statistice (inclusiv SPSS) este bootstrap. înlocuirea outlierilor cu cel mai apropiat scor care nu este un outlier. se înlocuirea scorurilor extreme cu scorul aflat la 3 (sau 3.29) standard de medie (Field, 2013). 5 6
Metode de corectare a datelor problematice Metode de corectare a datelor problematice
3. Analiza a datelor folosind metode mai robuste 3. Analiza a datelor folosind metode mai robuste aplicarea procedurii bootstrap. aplicarea procedurii bootstrap. Exemplu. În bootstrapping, nostru este considerat o din care se presupunem am un coeficient de Pearson r= extrag mai multe mai mici (numite bootstrap), iar .50, semnificativ statistic la un p < .001. pe fiecare dintre acestea se parametrii statistici care ne Aplicând procedura bootstrap, am un interval de încredere (de ex., media, de medii, coeficientul de , bootstrapping [.415, .600]. coeficientul de regresie etc.). am ales extragem 1000 bootstrap, acest interval de D alegem procedura bootstrap pe 1000 de , vom încredere ne spune în 95 % dintre cazuri, de 1000 de ale acestor parametric statistici, câte unul pentru pe fiecare dintre aceste bootstrap iau valori între .415 fiecare . Ulterior, parametri sunt de-a lungul unui .600. Cum valoarea zero nu este în acest interval, r= interval (de la minim la maxim) cei între limitele de 95 %. Se .50 este semnificativ statistic. astfel un interval de încredere bootstrap. Ce s-ar întâmpla valoarea zero ar fi în interval? Acest În cazul testelor statistice, acest interval bootstrap nu lucru ar însemna , la o probabilitate de 95 %, ar exista ca r fie valoarea zero, atunci rezultatul la testul statistic respectiv este atât negativ, cât zero sau pozitiv. Altfel spus, ipoteza H0 care semnificativ statistic. r este zero nu ar putea fi prin urmare ipoteza de 7 cercetare H1 nu ar putea fi . 8 Metode de corectare a datelor problematice Metode de corectare a datelor problematice 3. Analiza a datelor folosind metode mai robuste 3. Analiza a datelor folosind metode mai robuste aplicarea procedurii bootstrap. aplicarea procedurii bootstrap. Procedura bootstrap poate fi în SPSS în cazul În cazul testului t pentru un , intervalul bootstrapping de bivariate sau , a testelor t, a este calculat pentru dinte media pe valoarea testelor de contrast sau post hoc din tehnicile ANOVA, în standard . intervalul ar valoarea zero, atunci ar fi regresie . posibil ca între media pe valoarea standard nu În cazul testului t pentru independente, existe nici o . intervalul bootstrapping este calculat pentru dintre În cazul testului t pentru perechi, sunt construite medii: intervalul de încredere ar valoarea zero, intervale bootstrap atât pentru coeficientul de r Pearson, asta ar însemna dintre medii în ar cât pentru dintre medii. putea fi , sau chiar zero. Astfel, ar fi posibil În regresia , sunt construite intervale bootstrap pentru ca dintre medii fie zero, nu de regresie . valoarea zero ar fi existe nici o între medii în . într-un astfel de interval, atunci nu am putea afirma cu o este valabil în cazul testelor de contrast sau probabilitate de 95 % acest coeficient de regresie este diferit de post hoc din ANOVA. 9 zero. 10
Metode de corectare a datelor problematice
3. Analiza a datelor folosind metode mai robuste aplicarea procedurii bootstrap. Aplicarea procedurii bootstrapping în SPSS, pentru fiecare test statistic amintit, se face dând clic pe butonul Bootstrap, Perform bootstrapping (aici putem modifica de bootstrap care ar trebui fie extrase; este 1000 ), iar în câmpul intervalelor de încredere alegem Bias corrected accelerated (BCa), aceasta oferind rezultate mai bune decât Percentile. De obicei, rezultatul la bootstrap este congruent cu pragul de p. rezultatul la bootstrap nu este congruent cu pragul de p, atunci ne vom raporta la bootstrap, deoarece procedura bootstrapping este mai , nefiind de de normalitate a variabilelor sau de outlieri. 11