Sunteți pe pagina 1din 14

M.

Popa Strategia analizei statistice a datelor

Strategia analizei statistice a datelor


Marian Popa
Adesea, chiar i cineva care s-a aplecat cu mult contiinciozitate i interes asupra studiului statisticii, se afl, la finalul efortului su academic, n faa unor ntrebri aparent simple: cum aleg testul statistic potrivit datelor cercetrii? cum inserez analiza statistic ntr-o lucrare de cercetare? O sintez a rspunsurilor posibile la aceste ntrebri ne propunem s facem n cele ce urmeaz, cu scopul de a da o orientare strategic privind abordarea analizei statistice a datelor n cercetrile psihologice.

A. Alegerea testului statistic


n statistic, cel mai simplu lucru este s aplici formula i s calculezi rezultatul. Dificultatea const n a alege formula (a se citi: procedura statistic adecvat scopului propus i datelor disponibile) i a interpreta rezultatul. Alegerea testului statistic potrivit este adesea una dintre ncercrile cele mai mari prin care trece un tnr cercettor. Nu de puine ori, aceasta este chiar prima problem pe care i-o pune, fr s i dea seama c face, de fapt, prima mare greeal. Alegerea testului statistic nu este prima, ci ultima problema pe care trebuie s o rezolve! Este adevrat c, pentru a rezolva aceast problem sunt necesare cunotine de psihologie experimental, dar i o experien destul de ndelungat n prelucrarea datelor. Totui, situaia poate fi mult uurat dac se urmeaz o serie de raionamente i reguli de baz, pe care le vom prezenta n continuare. 1. Punctul de pornire este formularea ipotezei. Aceasta deriv din problema cercetrii i se exprim sub form rspunsului pe care, n mod legitim, cercettorul se ateapt s l confirme cu ajutorul datelor statistice. Exemplu: - Problema cercetrii: ntr-un centru de dializ se observ c pacienii sufer de tulburri anxioase severe. - Modelul cercetrii: Un program de reducere a anxietii bazat pe exerciii de relaxare, prezentate pe casete video este realizat pe un grup de pacieni. Se aplic un chestionar de evaluare a anxietii grupului studiat i unui grup de control, care nu a urmat programul de relaxare. - Ipoteza cercetrii: Exerciiile de relaxare reduc nivelul anxietii 2. Se identific variabilele cercetrii. Pentru exemplul de mai sus: - Variabila independent este apartenena la grupurile cercetrii. Aceasta poate primi dou valori convenionale: 1 pentru subiecii care au urmat edine de relaxare; 2pentru subiecii din grupul de control. - Variabila dependent este nivelul anxietii, msurat pe o scal de interval/raport 3. Se recolteaz datele cercetrii, avnd grij s fie respectate toate condiiile i criteriile care s asigure corectitudinea acestora. Orice eroare n aceast faz (n special cu privire la constituirea eantionului, dar i legat de motivarea subiecilor, corectitudinea nregistrrilor etc.) se vor traduce n dificulti insurmontabile n faza de prelucrare i analiz a datelor. n cazul nostru, se va acorda constituirii grupurilor de studiu, avnd grija ca acestea s nu difere sub aspectul unor aspecte care pot influena efectul relaxrii (vrst, nivel de instruire, sex, severitate a bolii etc.).
1 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

4. Se sintetizeaz datele cercetrii i se trece la prelucrarea acestora. Fazele obligatorii ale acestor prelucrri sunt urmtoarele: - analiza preliminar a variabilelor, cu ajutorul procedurilor statistice descriptive, avnd drept principale scopuri verificarea corectitudinii datelor, evidenierea caracteristicilor distribuiei fiecrei variabile, n vederea alegerii ulterioare a testului statistic adecvat;
corectarea eventualelor erori de nregistrare, rezolvarea situaiilor n care exist date lips, transformarea variabilelor, dac acest lucru se impune (de reinut faptul c nu este recomandabil s se transforme o variabil de interval/raport, a crei distribuii nu se abate de la forma normal, ntr-o variabil categorial, deoarece se pierde din puterea statistic a testelor).

Dup parcurgerea acestor etape, n succesiunea lor fireasc, alegerea testului statistic devine o problema relativ simpl. De fapt, pentru a fi i mai explicii, fr parcurgerea acestor etape identificarea testului statistic potrivit nici nu este posibil. Principalele componente ale algoritmului de selectare sunt urmtoarele: 1) Se identific variabila independent 2) Se identific variabila dependent a. daca este de tip nominal/ordinal, se aplic un test neparametric; b. dac este de tip interval/raport i: i) dac respect condiiile i dac, mai ales, eantionul este mare, se recomand alegerea unui test parametric ii) dac nu respect condiiile i, mai ales, dac eantionul este foarte mic, se recomand alegerea unui test neparametric (n acest caz valorile vor fi transformate pe o scal ordinal sau nominal, n funcie de caracteristicile lor i opiunea cercettorului) 3) Se precizeaz obiectivul cercetrii, care poate fi, cel mai adesea: a. diferena dintre grupuri dependente sau independente (ca n exemplul nostru). Acest model este mai potrivit n urmtoarele situaii: i) atunci cnd variabila independent, prin natura ei, se exprim n categorii naturale (de ex., categorii de vrst, familii divorate/nedivorate, sexul etc.) ii) atunci cnd variabila independent exprim valori care nu evolueaz ntr-o manier liniar (de ex., prezen/absen, diagnostice psihiatrice, tipuri temperamentale) iii) atunci cnd variabila independent este manipulat b. Gradul de asociere. Acest model de cercetare este recomandabil atunci cnd avem de a face cu variabile msurate simultan sau succesiv pe aceiai subieci (modele de tip nainte-dup, intrasubiect), sau pe subieci aparinnd unor eantioane perechi. n acest sens se vor lua n considerare urmtoarele dou recomandri: atunci cnd, att v. independent ct i v. dependent sunt de acelai tip (cantitative sau calitative), obiectivul obinuit este gradul de asociere atunci cnd v. independent este de tip categorial (nominal sau ordinal), iar v. dependent este de tip cantitativ, obiectivul obinuit este diferena dintre grupuri (categorii) 4) Se alege testul statistic adecvat, dar, nainte de aceasta, s dm rspuns unei ntrebri preliminare: ce este de preferat, test parametric sau neparametric?

2 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

a. Dac variabila dependent este msurat pe scal nominal sau ordinal, problema alegerii nu se pune, singurele teste aplicabile fiind cele neparametrice. Atunci cnd variabila dependent este exprimat pe o scal cantitativ (interval/raport), dac ntrunete condiiile impuse de statistica parametric, este recomandabil s se utilizeze teste parametrice. n acest caz ns trebuie avute n vedere dou aspecte: i. Situaia n care variabila dependent cantitativ nu respect condiiile testelor parametrice, n raport cu care exist dou soluii: se vor efectua verificri pentru eventuala corecie de valori, tratarea valorilor lips, transformri parametrice, urmate de utilizarea testelor parametrice se transform variabila dependent pe o scal de tip nominal sau ordinal, urmat de aplicarea unor teste neparametrice adecvate b. Luarea n considerare a mrimii eantionului. Teorema limitei centrale ne asigur cu privire la normalitatea distribuiei de eantionare pentru eantioane care depesc N=30. Pentru eantioane de volum mediu (apropiat de 30 de valori), testele parametrice sunt mai sensibile la respectarea condiiilor impuse i, de aceea, utilizarea testelor neparametrice pare a fi o soluie mai bun. n practic, se va avea n vedere faptul c testele statistice, att cele parametrice ct i cele neparametrice, efectuate pe eantioane reduse, sub N=20, nu ofer rezultate robuste iar credibilitatea lor este ndoielnic. Eantioanele mici nu conin suficient informaie care s permit fundamentarea unei inferene statistice suficient de sigure i cu putere de generalizare. Studiile pe eantioane de acest gen pot avea o valoare de studii pilot n vederea deciziei de a lansa sau nu studii de amploare pe o anumit tem. n legtur cu mrimea eantioanelor de cercetare se vor revedea recomandrile discutate n legtur cu puterea testelor statistice.

Algoritmul de alegere a procedurii statistice


n principiu, orice analiz statistic dintr-un proiect de cercetare cuprinde dou categorii de proceduri statistice, efectuate n etape succesive: (1) analiza statistic descriptiv i (2) analiza de semnificaie, prin aplicarea unui test statistic.

1. Analiza statistic descriptiv


Tabelul urmtor prezint n mod sintetic algoritmul de alegere a procedurii descriptive adecvate, n funcie de obiectivul analizei i de tipul de variabil: Obiectivul descrierii Scala de msurare nominal reprezentarea ntregii distribuii ordinal I/R Msura tendinei centrale nominal
3 Actualizat la: 5/22/2006-1:59:19 PM

Condiie -

Soluie tabela de frecvene graficul de tip bar distribuia de frecvene graficul de tip bar distribuia de frecvene histograma poligonul de frecvene modul

M. Popa Strategia analizei statistice a datelor

ordinal I/R nominal ordinal I/R

Msura variabilitii

simetric asimetric simetric asimetric

mediana media mediana numr categorii amplitudinea abaterea standard amplitudinea

2. Testarea ipotezelor
n faza urmtoare analizei statistice descriptive se va proceda la iniierea testrii ipotezelor cu ajutorul unui test statistic adecvat. Pentru a uura alegerea testului statistic, exist diverse modele ajuttoare, de tip algoritmic sub form tabelar sau grafic. n acest sens exist numeroase posibiliti de informare. Dintre acestea, sugerm utilizarea opiunii Statistic Coach, pus la dispoziie de programul SPSS (din meniul Help). De asemenea, se poate apela la pagina de internet Selecting Satistics a Universitii Cornell (http://trochim.human.cornell.edu/selstat/ssstart.htm). Mai jos prezentm mai jos un algoritm sintetic care vizeaz alegerea testului statistic pentru cercetri care pun n relaie doar o singur variabil independent i o singur variabil dependent. Am cuprins n tabel, cu o singur excepie (*), testele statistice care fac obiectul cursurilor de introducere n statistica inferenial. Desigur, numrul testelor statistice este mult mai mare, fapt care poate face necesar dezvoltarea algoritmului de alegere a testelor.

Obiectivul cercetrii

Variabila independent
una -

Variabila dependent
I/R Nominal I/R

independente

Diferena dintre grupuri

Categorial (nr. categ.)

dou dependente independente trei+ dependente

Nominal Ordinal I/R Nominal Ordinal I/R Ordinal I/R Ordinal I/R Ordinal Categorial (N/O)

Asocierea variabilelor

Interaval/Raport Ordinal Categorial (Nominal sau Ordinal)

Testul statistic aplicabil z/t pentru un eantion z pentru o proporie t pt. eant. independente z pentru dou proporii Mann-Whitney U t pt. eant. dependente testul semnului Wilcoxon ANOVA unifactorial Kruskal-Wallis ANOVA pt. msurri repetate (*) Friedman r Pearson rs Spearman Chi-ptrat Testul exact Fischer

4 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Redm mai jos i un tabel orientativ pentru alegerea testului statistic care cuprinde, pe lng situaii de cercetare cu dou variabile, situaii n care sunt analizate simultan mai mult de dou variabile. O parte dintre testele evocate fac obiectul cursurilor avansate de statistic, dar unele dintre ele se regsesc i n programa cursurilor de baz.
Variabila(e) dependente Categoriale Interval raport 2 categorii 2+categorii 1 VD 2+ VD MANOVA Testul t One-way ANOVA One-way ANCOVA MANCOVA one-way one-way Regresia ANOVA MANOVA logistic two-way two-way ANCOVA MANCOVA one-way two-way Corelaia bivariat Regresia liniar simpl Regresia multipl Analiza Path Analiza Path

Nominale-categoriale

2 categorii 1 VI 2+ categorii cu covariant fr covariant cu covariant

Variabila(e) independente

2+ VI

Interval-raport

O singur VI

Mai multe VI

Not explicativ: VI = variabil independent; VD = variabil dependent; Variabil covariant = variabil care variaz concomitent cu variabilele testate i al crei efect este eliminat statistic

Integrarea analizei statistice n documentul de cercetare


n cele ce urmeaz, vom trece n revist principalele capitole ale unui raport de cercetare (studiu, articol) i modul n care elementele analizei statistice trebuie s fie abordate n cadrul fiecreia dintre ele. Respectarea aceste recomandri, uzuale n mediul tiinific, are rolul de a asigura un anumit nivel de standardizare a redactrii, pe de o parte, iar pe de alt parte, acela de a facilita controlul calitii cercetrii i comparabilitatea rezultatelor obinute de cercettori diferii (Wilkinson, 1999). Aa cum a reieit pe parcursul tematicii abordate, metodologia statistic este subordonat unui anumit demers tiinific. Materializarea sa ntr-un document de analiz i concluzii (care poate fi un raport de cercetare, un articol tiinific sau o comunicare etc.) se face dup un model care are, n linii generale, o anumit structur. n cele ce urmeaz, vom trece n revist o serie de recomandri generale cu privire la modul n care trebuie abordat analiza statistic n cuprinsul unui material de cercetare, pentru fiecare seciune n parte:

5 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Prezentarea cadrului general al cercetrii


Ipotezele. Se va urmri exprimarea cu claritate a tipului de studiu statistic care a fost efectuat, i a scopurilor care au fost urmrite. n cazul n care acestea sunt mai multe, vor trebui prezentate toate, de la bun nceput, inclusiv ordinea de prioritate a fiecruia. Prezentarea paralel a ipotezelor de nul, dei pare logic, ngreuiaz lectura i produce confuzie. Ca urmare, se va emite numai ipoteza cercetrii, ipoteza de nul fiind considerat, implicit, opusul ei, fr a mai fi necesar enunarea acesteia. Se face referire explicit la ipoteza de nul n momentul deciziei statistice, cnd se afirm acceptarea sau respingerea acesteia. Testarea ipotezelor nu este ns obligatorie n toate situaiile de cercetare. Dac o anumit cercetare abordeaz un subiect nou, neinvestigat anterior, metodele statistice exploratorii sunt mai potrivite dect cele de testare a ipotezelor. Dac tema respectiv a fost intens studiat anterior, atunci este mai recomandabil un studiu de meta-analiz dect o nou testare a ipotezei.

Uneori, autorii se limiteaz la prezentarea explicit a obiectivelor renunnd la enunarea specific a unor ipoteze. Acest lucru este justificat fie prin faptul c nu au un fundament solid pentru emiterea ipotezelor, fie pentru c apreciaz c emiterea ipotezelor nainte de colectarea datelor poate introduce un element de orientare a acestui proces n direcia rezultatului ateptat (bias).
Populaia. Interpretarea rezultatelor unui studiu depinde de caracteristicile populaiei pentru care se intenioneaz analiza. Populaia trebuie definit cu claritate, n sensul elementelor care o compun. Nu trebuie uitat sensul statistic al conceptului de populaie, care se refer nu att la indivizi umani, ct la totalitatea valorilor unei caracteristici care i definete i care face obiectul analizei. Cu alte cuvinte, populaia nu trebuie privit ca o clas de obiecte ci ca o colecie de date care descriu o anumit caracteristic a respectivelor obiecte. Desigur, n cele din urm rezultatele statistice se vor extrapola la nivelul unei populaii constituit din indivizii pentru care respectiva caracteristic a fost msurat. Eantionul. Se va descrie modul de constituire a eantionului, insistndu-se pe criteriile de includere i, eventual, de excludere a unor indivizi (sau valori). Dac eantionul este stratificat (dup provenien, sex etc.), se vor descrie criteriile de stratificare i volumul de subieci pentru fiecare subgrup.

Prezentarea metodei i a condiiilor investigaiei, precum i a lotului de subieci


Variabilele. Variabilele analizate vor fi descrise n mod explicit, indicndu-se denumirea i semnificaia fiecreia, modul n care au fost msurate i unitatea de msur. Atunci cnd declarm o variabil, precizm implicit i domeniul valorilor valide. Dac, de exemplu, definim o variabil care poate lua valori pe o scal de la 1 la 7 (pe o scal cu rspunsuri predefinite), orice valoare dincolo de domeniul respectiv va fi eronat. Modul de denumire al variabilelor este important. Astfel, n loc de inteligen este de preferat denumirea de rezultat la testul de inteligen. Aceasta, pentru c inteligena este o realitate oricum mai complex dect ceea ce msurm printr-o anumit variabil. Cu alte cuvinte, excesiva generalizare a variabilelor trebuie evitat. Instrumentele de msurare. Este recomandabil s fie prezentate cu o descriere (cel puin) sumar, inclusiv cu caracteristicile lor psihometrice (validitate, consisten intern). Dac este vorba de un aparat sau de un program de calculator, se vor indica tipul si, eventual, sursa, pentru a putea fi cutate i de ali cercettori care vor dori s efectueze o replicare a respectivului studiu.

6 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Procedura. Prezentarea modului n care a decurs procedura de investigare, descrierea condiiilor, a duratei, locului, i a personalului care a contribuit la aceasta. Se va acorda atenie modalitilor de control al surselor de eroare (limitarea efectului variabilelor covariante, eliminarea erorilor de msurare).

Prelucrarea datelor
Se va ncepe cu eventualele complicaii care au survenit pe parcursul studiului. Aici se includ datele lipsa (care nu au putut fi recoltate, din diverse motive), modul de rezolvare a valorilor excesive din cadrul distribuiilor, dificultile de organizare care au putut influena calitatea informaiilor recoltate etc. n general, orice aspect relevant care se refer la abaterea de la condiiile prevzute pentru desfurarea studiului trebuie prezentate. Analiza primar. Analiza statistic va ncepe ntotdeauna cu o inspecie a valorilor obinute. Aceasta nseamn analiza distribuiilor sub aspectul formei, indicatorilor tendinei centrale, valorilor excesive etc. Ignorarea acestui aspect poate conduce la grave erori de interpretare, sau la un volum mai mare de munc, ulterior, dac se constat prea trziu imperfeciuni care trebuiau fi eliminate de la bun nceput. Reprezentarea grafic a datelor (histograma) poate fi o metod foarte eficient de identificare a distribuiilor anormale sau valori improprii. Scopul acestei analizei primare a variabilelor este dublu: - obinerea unei imagini de ansamblu a variabilelor de interes (frecvene, tendina central, mprtierea, grafice); - fundamentarea alegerii testelor statistice adecvate datelor pe care le analizm; Desigur, n documentul de cercetare nu se vor include toate rezultate analizei primare, ci numai acelea strict necesare pentru descrierea variabilelor analizate. De exemplu, nu este necesar ca raportul s fie mpnat cu histogramele fiecrei variabile cantitative, fapt care ncarc nejustificat textul cu imagini puin relevante pentru cititor. De asemenea, nu se va descrie i nu se va justifica alegerea testului statistic, n funcie de natura variabilelor. Acest lucru se consider implicit. Verificarea ipotezelor statistice. Acesta este momentul cel mai important al unei cercetri, acela n care se concretizeaz ntregul efort depus. Primul lucru care trebuie neles este acela c rezultatele care se vor obine depind n mod decisiv de calitatea i minuiozitatea cu care au fost parcurse etapele anterior descrise. Un studiu bine fundamentat teoretic, bazat pe ipoteze consistente, utiliznd instrumente adecvate i beneficiind de o procedur sigur de recoltare a datelor, va conduce ntotdeauna la rezultate utile. Aceasta nu nseamn neaprat c ele trebuie s confirme ipotezele. Uneori, chiar i infirmarea unei ipoteze poate fi semnificativ. Un aspect important aici este alegerea aparatului statistic (teste de semnificaie). Apariia numeroaselor programe de prelucrare statistic computerizat a condus la orientarea multor cercettori, mai ales tineri sau nceptori, spre proceduri sofisticate i complicate. Cea mai bun soluie este alegerea procedurilor statistice minim necesare pentru evidenierea ideilor urmrite. Abundena de calcule i de teste statistice nu contribuie la o mai bun nelegere ci arat, mai degrab, nesigurana cercettorului. Una dintre prejudecile rspndite, mai ales printre studeni, este aceea c exist teste statistice importante (de ex., analiza factorial, analiza de clusteri etc., despre care nu a fost vorba n acest manual introductiv n statistic) i altele mai puin importante (testul diferenelor ntre medii etc.). Complet fals! Alegerea unei proceduri statistice mai sofisticate putea face o anumit impresie n epoca de dinaintea programelor de calcul statistic. n prezent, orice procedur, orict de complicat, nu mai reprezint o problem sub aspectul calculelor, pentru nimeni. Singurul lucru care conteaz cu adevrat este alegerea
7 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

procedurii potrivite cu natura datelor i cu obiectivele cercetrii, precum i interpretarea ei corect. Dac o procedur simpl servete exact ideea care trebuie scoas n eviden, aceasta trebuie folosit i nu alta, cu un nume mai sonor. S ne gndim i la faptul c avem mai multe anse ca procedurile simple, uzuale, s fie nelese mai uor, i de ctre mai muli cititori. n ceea ce privete testarea ipotezelor, nu este suficient expresia acceptm sau respingem ipoteza. ntotdeauna se va indica i valoarea exact obinut pentru nivelul de semnificaie (de ex., "p=0.037", i nu doar decizia de acceptare sau respingere, de ex., "p < .05" or "p > .05"). De reinut c, inclusiv atunci cnd rezultatul obinut nu ndreptete respingerea ipotezei de nul, ipoteza cercetrii va fi considerat doar neconfirmat i nu respins. Aceast atitudine este mai potrivit, pe de o parte, cu modelul probabilistic de testare statistic a ipotezelor i, pe de alt parte, cu faptul c nimic nu ne mpiedic s pstrm ipoteza i s ncercm confirmarea ei ntr-un alt studiu. Problema variabilelor multiple. Dac n exemplele din manualele de statistic sunt luate n discuie, de regul, situaii simple, cu minimum de variabile posibile, cel mai adesea, dou. n realitate, cel mai adesea, studiile de psihologie trebuie s fac fa unei avalane de variabile a cror relaie trebuie testat nu doar una cte una ci i n interdependena lor. Acest fapt ridic, pe de o parte, probleme de procedur statistic i, pe de alt parte, probleme de prezentare a rezultatelor. Alegerea procedurii astfel nct s surprind exact relaiile care intereseaz, cu excluderea influenelor colaterale, este, din pcate, greu de explicitat la nivelul unui manual introductiv. n legtur cu forma de prezentare, trebuie avut n vedere necesitatea de a fi, n egal msur, sintetici i explicii. Sintetici, pentru a nu ngreuna textul cu o abunden excesiv de tabele de date, explicii, pentru c nu pot fi eludate informaiile eseniale care sunt necesare pentru interpretarea rezultatelor. Reinere fa de declararea relaiei cauzale. Aprecierea pe baza unui test de semnificaie statistic a unei relaii de cauzalitate ntre variabile este cel puin hazardat. Acest lucru poate fi susinut numai dac se respect anumite condiii experimentale, care s ne asigure c ntre cele dou variabile este o relaie cauz-efect. Nu se vor emite concluzii de tip cauzal n afara situaiilor n care recoltarea datelor decurge dintr-un demers de tip experimental. Chiar i procedurile statistice care sunt destinate determinrii relaiilor cauzale (ecuaiile de modelare structural, analiza de cale) nu sunt pe deplin sigure n detectarea relaiei cauz/efect (Huck, 2004). Tabele i figuri. Tabelele sunt cel mai des utilizate pentru includerea n textul rapoartelor de cercetare a rezultatelor obinute. Ele prezint avantajul indicrii cu exactitate a valorilor i susinerii cu precizie a concluziilor. Figurile au ns avantajul de a prezenta informaia ntr-o form intuitiv i accesibil, atrgnd atenia cititorului. Nu se poate face o recomandare de preferin pentru una sau alta dintre cele dou forme. Oricum, este de reinut c figurile ocup mult spaiu tipografic i sunt mai pretenioase din punctul de vedere al editrii i al tehnoredactrii textelor. n orice caz, se vor evita figurile prea complexe. Este recomandabil ca fiecare grafic s prezinte o singur idee, pe care s o susin ct mai simplu i mai explicit. Atunci cnd se utilizeaz tehnici de ilustrare grafic se vor prefera formele mai noi (box-plot, stem and leaf). Graficele si tabelele vor fi numerotate distinct si vor avea un titlul explicit.

Discutarea i interpretarea rezultatelor


Adevrata ncercare ntr-un demers de cercetare nu este, aa cum s-ar putea crede, prelucrarea efectiv a datelor. Dac sunt corect recoltate i nregistrate, prelucrarea lor se face destul de uor cu ajutorul programelor computerizate existente astzi. Interpretarea, ns, este o prob pentru oricine se afl n faza de finalizare a unei cercetri.

8 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Premisa fundamental a unei interpretri consistente este suportul teoretic, claritatea i consistena ipotezei sau ipotezelor cercetrii. Este imposibil s tragi concluzii dac nu eti contient de obiectivele urmrite. Adesea se cade prad iluziei c, indiferent de ce date dispunem, se poate susine un demers de cercetare doar cu ajutorul unui program de calcul statistic sofisticat i a unui set de date oarecare. Din pcate, se ntmpl destul de des ca un student s vin i s spun: am aceste date, ce teste statistice pot face cu ele?. Obiectivul cercetrii trebuie s fie clar precizat de la bun nceput, n timp ce alegerea procedurii statistice ine de natura scalei de msurare, caracteristicile variabilelor i ipotezei pe care trebuie s o testm. Dac fiecare dintre aceste aspecte sunt clare n mintea cercettorului, atunci rspunsul la ntrebarea de mai sus este foarte uor de dat. Se va urmri, pe de o parte, coerena dintre concluzii i datele pe care se sprijin, iar pe de alt parte, dintre concluzii i condiiile specifice cercetrii (eantion, model de investigare). Cu alte cuvinte, fiecare aspect al concluziilor trebuie s aib un suport robust n datele i rezultatele obinute prin prelucrarea lor. Se va evita generalizarea necritic. Transpunerea anumitor rezultate dincolo de limitele populaiei cercetrii este adesea hazardat. Rezultatele obinute nu sunt mai puin importante dac pstrm pruden n generalizarea lor. Studii ulterioare pot confirma sau nu datele obinute i, pe aceast baz, se poate extinde generalizarea semnificaiilor. n alt ordine de idei, relevana rezultatelor nu depinde doar de atingerea nivelului de semnificaie statistic ci i de mrimea eantionului. n principiu, aceste dou mrimi contribuie mpreun la fundamentarea concluziilor, astfel: rezultat semnificativ statistic? Da Da Nu Nu eantion mic mare mic mare concluzia cercetrii rezultat important importana practic posibil, dar incert rezultat neconcludent ipoteza cercetrii este, probabil, fals

Un alt aspect important este interpretarea semnificaiei statistice. Obiectivul legitim al testelor statistice este atingerea pragului de semnificaie. De aceea, valoarea lui p este prima care trebuie s ne atrag atenia la captul prelucrrilor, simindu-ne rspltii pentru eforturile fcute, dac se afl sub pragul de 0.05. Cu toate acestea, nu trebuie s uitm nici un moment c statistic semnificativ nu este echivalent cu tiinific important. Dincolo de valoarea lui p se impune luarea n considerare i mrimea n sine a diferenei sau legturii puse n eviden de respectivul test statistic. Desigur, o valoare ridicat a testului, fr atingerea pragului de semnificaie, nu este relevant. Dar nici valoare prea mic, chiar dac este semnificativ statistic. Ct de mic sau ct de mare trebuie s fie valoarea testului, pentru a o considera important sau relevant? Din pcate, pentru aceast ntrebare nu exist un rspuns riguros. Se recomand apelul la spiritul tiinific i la simul comun, concomitent cu raportarea la natura specific a fiecrei situaii n parte. Cu alte cuvinte, rspunsul depinde de contextul fiecrei cercetri n parte. Din acest motiv, raportarea mrimii efectului este una dintre soluiile recomandate cu insisten n ultimii ani. O alt problem de discutat este n legtur cu valoarea n sine a lui p. Dup cum tim, nivelul minim pentru acceptarea semnificaiei statistice este 0.05, corespunztor valorii convenionale minim acceptabile pentru pragul alfa. Vorbind n sens strict, un p=0.049 este considerat semnificativ, n timp ce un p=0.051 trebuie sa fie considerat nesemnificativ. Avnd n vedere c pragul alfa=0.05 este unul arbitrar, nu se poate evita un astfel de raionament rigid. Cu toate acestea, exist cercettori care raporteaz rezultate ale lui p uor mai mari dect 0.05 ca fiind marginal semnificative sau aproape semnificative. S menionm, totui, c o astfel de atitudine este destul de rar ntlnit i poate determina reacii negative, justificate, din partea cercettorilor mai riguroi, aflai n majoritate.

9 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

n mod intuitiv, suntem tentai s interpretm nivelul de semnificaie n funcie de valoarea calculat a lui p. Astfel, un p=0.001 ni se pare mai semnificativ dect un p=0.05, de exemplu. Dac utilizm definiia strict a termenului de semnificaie din raionamentul deciziei statistice, o astfel de atitudine nu este justificat. O dat ce a fost fixat un anumit nivel al lui alfa, orice p mai mic sau egal cu acesta este semnificativ, iar orice p mai mare este nesemnificativ. Cei mai muli statisticieni mprtesc aceast opinie. Cu toate acestea, exist i cercettori mai puin rigizi care sunt dispui s asocieze valorii lui p anumite calificative, astfel:

>0.05 0.01 0.05 0.001 0.01 <0.001

nesemnificativ semnificativ foarte semnificativ extrem de semnificativ

Fr a fi greite, astfel de formulri nu aduc, totui, o interpretare relevant pentru decizia statistic. Este util sa adugm c programele de prelucrri statistice afieaz 0.000 pentru valori ale lui p mai mici de 0.0005, Acest fapt nu va fi interpretat n nici un caz ca exprimnd probabilitate zero, ci doar n sensul c valoarea lui p este mai mic de 0.0005. De altfel, la raportarea semnificaiei se poate opta, fie pentru nscrierea valorii exacte a lui p, aa cum este calculat de program, fie doar pentru menionarea plasrii valorii testului sub nivelul alfa stabilit.

Formularea concluziilor
Studiul trebuie s se ncheie cu concluzii adecvate cu rezultatele obinute, formulate sintetic i explicit. Nu se vor evita aspectele mai puin reuite ale cercetrii, eventualele nereuite, chiar. Rostul acestora este acela de a ajuta la evitarea repetarea unor greeli de ctre cei care vor dori s reia acelai tip de investigaie, mai trziu. Se pot face chiar recomandri explicite n acest sens. Orict de semnificative ar fi rezultatele unui anumit studiu, ele nu vor schimba modul de a gndi o anumit realitate psihologic. Acest efect nu l pot avea dect rezultate obinute de mai multe studii concordante pe aceeai tem. Nu se va uita niciodat faptul c semnificaia statistic nu ine loc i de semnificaie teoretic, cu sensul de consisten a unui anumit model teoretic explicativ. Procedurile statistice nu sunt altceva dect instrumente de evaluare probabilist ipotezelor. Profunzimea teoretic a unui studiu nu poate rezulta dect din calitatea modelului de investigaie (ipoteze, proceduri de evaluare, subtilitatea analizei rezultatelor etc.) i nu din datele statistice ca atare. Statistica trebuie s fie o modalitate de organizare i disciplinare a gndirii tiinifice, n nici un caz, ns, nu se poate substitui acesteia. Dar nu se poate ajunge la aceast performan dect dac statistica este neleas att sub aspecte ei tari ct i cu limitele ei. n trecut, la nceputurile utilizrii statisticii n psihologie, prezena acesteia ntr-o lucrare avea un caracter de prestigiu, cu att mai mare cu ct era mai bogat reprezentat. n prezent, omniprezena calculatoarelor i a programelor specializate au fcut ca prelucrrile statistice s devin o operaiune relativ facil. Tocmai din acest motiv, apare riscul abuzului de statistic, a utilizrii necritice i superficiale a acesteia n elaborarea lucrrilor de cercetare. n fine, ca o concluzie a celor spuse, se cuvine s insistm pe respectarea exigenelor procedurale impuse de metoda statistic. Simpla populare a unei lucrri cu date statistice, tabele, grafice, sau cu valori ale unor teste de semnificaie, nu asigur n mod necesar acelui document valoarea tiinific la care aspir. Asigurarea calitii datelor supuse prelucrrii, respectarea condiiilor de alegere a testelor de semnificaie, interpretarea lor adecvat i publicarea rezultatelor n formatul adecvat, sunt condiii indispensabile pentru calitatea tiinific a unui studiu bazat pe metoda statistic.
10 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Greeli frecvente n redactarea analizelor statistice


Lectura celor mai multe dintre lucrrile efectuate de studeni scoate n eviden nerespectarea recomandrilor prezentate mai sus. Efectul const n consemnarea unor greeli, dintre care cele mai frecvente i mai suprtoare ni se par a fi urmtoarele:

Formulare improprie a ipotezelor sau concluziilor cercetrilor, prin utilizarea unor termeni care sugereaz relaia de cauzalitate (influeneaz, determin). Se ignor faptul c testele statistice nu susin existena unei relaii de cauzalitate dect dac datele sunt recoltate n condiii de experiment psihologic. Includerea n lucrare a ipotezelor de nul, n paralel cu cele ale cercetrii. Acestea din urm sunt singurele necesare i suficiente. Exces de ostentaie n prezentarea rezultatelor prelucrrilor statistice. Cifrele tind s fie mai multe dect explicaiile i analizele. Aceast manier creeaz impresia neplcut de parad de statistic. Statistica trebuie sa rmn o prezen discret, al crui rost este doar acela de a susine concluziile cercetrii. Intrarea n detalii de analiz a datelor, inclusiv n descrierea didacticist a respectrii condiiilor pentru aplicarea diverselor teste statistice. Este corect ns, s fie evocate eventualele aspecte deosebite, cum ar fi valori excesive legitime sau operaii de transformare a unor variabile, cu scopul normalizrii distribuiei. Includerea integral a rezultatelor calculate de programe pentru diverse proceduri. Unele dintre acestea conduc la un mare volum de rezultate numerice. Nu toate trebuie reproduse ci numai acelea care susin n mod direct i explicit concluziile cercetrii. Raportarea incompleta sau absenta a rezultatelor la testele statistice (enunarea deciziei statistice i a concluziei cercetrii nu este suficient, ea va fi nsoit ntotdeauna de valorile testului i de valorile adiacente acestuia). Exces de zecimale n prezentarea rezultatelor la prelucrri. De regul, valoarea testelor statistice se raporteaz cu dou zecimale iar probabilitile aferente ipotezei de nul, cu trei zecimale. Reproducerea rezultatelor din programele statistice cu pstrarea elementelor de text n limba englez (atunci cnd lucrarea este scris n limba romn). Explicaii inconsistente la tabele i grafice. Orict de explicite ar fi acestea, cititorul nu va fi lsat s i le explice singur. Grafice sau tabele fr titlu. Absena coeficienilor de consisten intern pentru testele care nu fac parte din metodologia profesional general, sau, nc i mai grav, pentru cele create de autor, i pe care se bazeaz respectiva cercetare. Instrumente de lucru (teste) prezentate integral n textul lucrrii. Acestea se descriu la modul general, fiind prezentate integral, eventual, doar la sfritul lucrrii, n caz c se dorete difuzarea lor. Transformarea valorilor primare (brute) ale datelor de cercetare, obinute prin aplicarea unor teste, n valori etalonate. n acest caz se ignor un adevr elementar: etalonarea este o modalitate de interpretare a rezultatului la un test cu scopul diagnosticului individual. Altfel spus, etalonarea este necesar n practica psihologic. n ce privete cazul cercetrii statistice, scorurile (primare) brute sunt perfect utilizabile pentru testarea ipotezelor, deoarece obiectivul oricrei cercetri este, de regul, relaia dintre variabile. De asemenea, este neproductiv s transformm valori de tip cantitativ, exprimate pe scal de interval sau de raport, n variabile calitative, exprimate pe scale ordinale, cum este cazul etaloanelor n percentile, decile, stanine etc. n fine, prin transformare n valori etalon

11 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

variabilitatea valorilor se reduce, ceea ce conduce, alturi de diminuarea nivelului de msurare, la reducerea puterii statistice a testului. Anexa 1

12 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Anexa 2

13 Actualizat la: 5/22/2006-1:59:19 PM

M. Popa Strategia analizei statistice a datelor

Anexa 3 EXERCIII DE APLICARE A ALGORITMULUI DE ALEGERE A PROCEDURII STATISTICE:


Citii contextul experimental i alegei procedura adecvat pentru atingerea obiectivului propus. Atenie, pentru rezolvarea exerciiilor variabilele vor fi luate n considerare sub forma prezentat, fr a fi transformate pe o alt scal de msurare! 1. Un eantion de elevi piloi este testat sub aspectul capacitii de rezolvare a unei sarcini de reprezentare spaial (exprimat prin numrul rspunsurilor corecte i viteza de rezolvare), cu scopul de a vedea n ce msur aceasta este influenat de numrul orelor de zbor acumulate n carier (exprimate ca atare). 2. Un eantion de dreptaci, unul de stngaci i unul de ambidextri au fost testai sub aspectul capacitii de recunoatere tactil. fiecare subiect este testat pentru ambele mini, ca urmare, se pot face diferenele de performan obinute cu cele dou mini. Cercettorul msoar numrul obiectelor corect identificate cu fiecare mn. 3. Un profesor ine sub observaie copii din trei categorii de familii: cu un singur printe, care lucreaz; cu doi prini, ambii prini avnd serviciu, cu doi prini, din care numai unul are serviciu. Pentru fiecare copil este msurat numrul de intervenii fr a fi ntrebat. Pe ansamblu, rezultatele arat c cei mai muli copii care obin scorul 0, un numr mare obin 1 sau doi, i civa obin scoruri mari. 4. ntr-un studiu privind relaia dintre fumat i vrst, se iau n considerare numrul de igri fumate zilnic, grupate pe categorii (sub 5, 6-10, 11-15, 16-20, peste 20) i vrsta exprimat n clase de cinci ani.

14 Actualizat la: 5/22/2006-1:59:19 PM

S-ar putea să vă placă și