Sunteți pe pagina 1din 47

Marius Druga Metode de cercetare n psihologia educaiei

1. Introducere. La ce bun analiza statistic?


Primele aplicaii ale gndirii statistice s-au legat de necesitile statului de a construi politici monetare i economice eficiente (de unde probabil i rdcina stat-). Statistica era o unealt extrem de util, deoarece pentru a crete taxele sau a declana rzboaie costisitoare conductorii trebuiau s tie numrul cetenilor statului i situaia lor financiar. La fel de important era pentru marii negustori, care trebuiau s calculeze costurile i beneficiile unor investiii sau cltorii. Lungu (2001) trece n revist cteva surse inedite ale statisticii: teoria modern a corelaiei provine din biologie (analiza similaritilor dintre prini i copii); teoria analizei de varian i are originea n fbricuele de bere din secolul al XVIII-lea i pe cmpurile de orz (gustul berii era dat de soiul de orz i timpul de fermentare); teoria msurrii i are originea n studiul inteligenei etc. Analiza datelor este ns doar o parte a procesului de cercetare. SPSS i alte programe de calcul statistic computerizat nu sunt altceva dect unelte, iar utilizarea corect a acestora depinde de desfurarea cu succes a unor pai premergtori ai cercetrii: design, eantionare, alegerea instrumentelor etc. n sine, rezultatele pe care programele le ofer nu sunt nici bune nici rele. Bune sau rele (sau mai degrab corecte sau eronate) sunt n schimb strategiile de operaionalizare a variabilelor i culegere a datelor, opiunile pe care le bifm n SPSS, modul n care prezentm rezultatele. De aceea afirmm c de calitatea datelor introduse n SPSS depinde calitatea rspunsului statistic oferit de acesta, iar calitatea datelor la rndul ei depinde de respectarea pailor cercetrii tiinifice. Ca i alte programe computerizate de calcul statistic, SPSS ofer un sprijin cantitativ pentru a susine o idee; el nu trebuie s devin un scop n sine, ci o unealt care s serveasc scopurilor cercetrii. Chiar i cunoaterea aprofundat a unor astfel de programe nu trebuie s duc la prezentarea unor cercetri sufocate de statistic: dac tot ce avem este un ciocan, atunci nu trebuie ca toate obiectele din jur s ni se par cuie! O cercetare evaluat ca fiind bun depinde n mare parte de construirea scenariului experimental i de modul n care l punem n aplicare. Fiecare decizie pe care o lum pe parcurs, pn a ajunge s introducem date n SPSS, afecteaz modul n care vom fi capabili s rspundem ntrebrilor cercetrii noastre. De aceea, pentru a nu consuma inutil efort i timp, este bine s zbovim asupra acestor pai preliminari, chiar dac uneori ni se pare c totul este limpede sau c pierdem vremea. Dup ce s-a ncheiat culegerea datelor, este trziu s mai introducem variabile suplimentare. n aceeai ordine de idei, Pallant (2005) enumer cteva sugestii de care ar fi bine s inem cont nainte de a culege datele. gndii-v ce fel de cercetare rspunde cel mai bine obiectivului dvs. ( observare, experiment, anchet pe baz de chestionar etc.) Fiecare dintre acestea are avantaje i dezavantaje, iar citirea unor studii similare realizate pe aceeai tem poate s v ajute n luarea deciziei (uneori citirea abstractului este suficient, pentru articolele publicate n reviste de specialitate); dac alegei un experiment, decidei dac este mai potrivit un design intergrup (grupuri diferite de participani n fiecare eantion) sau unul intragrup (aceiai participani msurai de mai multe ori). Fiecare tip de design are avantajele i dezavantajele lui; n studiile experimentale asigurai-v c variabila pe care o manipulai are suficiente modaliti. Dac are doar dou (asta nsemnnd practic dou eantioane), concluziile nu vor fi prea limitate sau simpliste? Ar fi necesar sau de dorit un grup de control? Inexistena acestuia va scdea valoarea cercetrii?

- pentru uz didactic n studiile experimentale, asigurai-v c avei suficieni participani n fiecare grup i ncercai s construii grupe egale ca numr. Utilizarea unor grupe prea mici sau dezechilibrate va face dificil detectarea diferenelor semnificative statistic; de cte ori este posibil, repartizai aleator subiecii n fiecare grup, evitnd utilizarea grupurilor constituite deja. Aceast strategie reduce problemele legate de existena grupelor neechivalente n design-urile intergrup. De asemenea, dac avei resurse materiale i timp, este bine s realizai i alte msurri ale grupurilor pentru a v asigura c ele nu difer substanial. Dac astfel de diferene exist i le-ai identificat, ele pot fi controlate statistic mai trziu; alegei variabile dependente valide. O idee bun ar fi utilizarea mai multor variabile dependente unele sunt mai sensibile dect altele la modificrile variabilei independente; ncercai s anticipai posibilele influene ale unor variabile externe designului, iniial neluate n calcul. Acestea se mai numesc variabile confundate i pot s ofere o explicaie alternativ rezultatelor obinute, chiar dac uneori sunt greu de identificat cnd suntei preocupai doar de cercetarea voastr n sine. De aceea este util s prezentai ideea i designul studiului unei alt e persoane, nainte de a ncepe; dac alegei metoda chestionarului, ar fi bine s completai i dvs. chestionarul i s desfurai un studiu pilot pe un eantion similar celui int. V putei asigura astfel c instruciunile sunt clare, c itemii sunt corect formulai etc.; dac alegei un experiment ar fi bine s realizai de asemenea un studiu pilot. Dac avei nevoie de echipamente, asigurai-v c ele funcioneaz; dac avei colaboratori, acetia trebuie bine instruii, iar dac folosii mai muli observatori, punei de acord modul n care vor coda diverse comportamente. Studiile pilot v vor ajuta s depistai o parte din erori sau variabile confundate. Va fi greu s stpnii toate variabilele ascunse, dar cu siguran studiul pilot poate s elimine din ele; una peste alta, acordai atenie tuturor detaliilor care ar putea s afecteze calitatea cercetrii, de la design i culegerea datelor la modul n care vindei rezultatele acesteia n cadrul unor conferine sau articole.

1.1. De ce este nevoie de statistic?


Dac vrem un rspuns simplu, putem afirma c statistica este necesar deoarece ofer o abordare cantitativ unui domeniu puin palpabil, cum este psihologia. Metodele statistice au devenit n timp eseniale pentru tiinele sociale, pentru psihologie n spe, deoarece le -au conferit legitimitate. Ele includ o gam larg de tehnici sau proceduri folosite pentru a descrie, explora, nelege, dovedi i prezice, pornind de la date culese de la grupuri de persoane (eantioane). Statistica servete i unui motiv practic, acela de a reduce cantitatea prea mare de date. De exemplu, dac dorim s investigm efectul jocurilor video asupra comportamentului copiilor, va trebui s msurm comportamentul acestora n situaii diverse, n interaciunile sociale etc. Vom apela poate i la msurarea unor variabile precum tipul de personalitate sau indicatori fiziologici. Vom ajunge astfel s avem mii de date condensate n zeci sau sute de pagini de grile de observaie, chestionare i altele. Introducerea acestor informaii ntr-o baz de date nu rezolv dect n parte problema. Oricine a vzut o baz de date stocat ntr-un program computerizat i d seama de nevoia de a condensa datele ntr-o form comprehensibil. Mintea uman nu este obinuit s lucreze cu mari cantiti de informaie, ci mai degrab cu informaia relevant, pe care statistica o poate oferi n forma unor simple valori numerice. Datele sunt astfel organizate i sumarizate nct cercettorul s poat vedea uor rezultatele studiului su i s le poat comunica i altora.

Marius Druga Metode de cercetare n psihologia educaiei


n al doilea rnd statistica ajut cercettorii s gseasc rspunsuri la ntrebrile care au generat demersul de cercetare, determinnd n ce msur concluziile sunt justificate de rezultatele obinute. Pentru a avea ncredere n rezultatele sale i pentru a le prezenta comunitii tiinifice, cercettorul va apela aadar nu doar la analiza statistic, ci i la limbajul statistic. n termeni pompoi, am putea s afirmm c statistica aduce ordine n haos, folosind un set de tehnici standardizate recunoscute i nelese de comunitatea tiinific. Statistica este deci un instrument indispensabil pentru cercetare, dar utilitatea ei nu se rezum la aceasta. n multe domenii, este aproape imposibil nelegerea unor articole de cercetare fr deinerea unor noiuni fundamentale de statistic. Alteori, efectele parcurgerii unor cursuri de statistic sunt vizibile n modul de a gndi sau de a scrie al unor persoane. Nu de puine ori ne-au frapat n tirile TV sau discuii caracterul de lege absolut al unor afirmaii: Toi oamenii sunt sau Romnii sunt nemulumii de Care dintre oameni sau dintre romni? Este suficient un contraexemplu pentru ca afirmaia s nu mai fie adevrat. Statistica nu va permite niciodat realizarea unor astfel de afirmaii.

1.2. Statistica i simul comun


Dincolo de glumele clasice la adresa statisticii (Enumerai trei tipuri de minciun!), statistica rmne greu accesibil simului comun. Motulsky (2010) atrgea atenia asupra faptului c interpretrile rezultatelor statistice nu sunt att de intuitive pe ct am crede la prima vedere i rea liza cteva observaii pertinente. (1). Oamenii tind s sar la concluzii Un exemplu amuzant oferit de autor era acela n care o feti de trei ani i spunea prietenului ei Tu nu poi deveni medic, doar fetele pot face asta. Pentru ea, era perfect valabil, deoarece toi medicii pe care i cunotea (eantionul de medici, am spune noi) erau femei. Autorul sublinia c abilitatea de a generaliza de la nivelul eantionului la acela al populaiei este adnc nrdcinat n mintea uman. Pe de alt parte, cercettorii au nevoie de rigoarea statistic pentru a evita formularea unor concluzii excesiv de generale pe baza unor date limitate. (2). Oamenii tind s fie prea ncreztori Uneori sintagma sunt 90% sigur de asta nu este rezultatul unui calcul statistic, ci al cuantificrii unui sentiment subiectiv de siguran. Pentru a ilustra faptul c oamenii se ncred prea mult n propriul raionament, Motulsky cita un studiu realizat de Russo i Schomaker n 1989. Autorii respectivi cereau unui eantion de peste 1,000 de participani s rspund unor ntrebri de cultur general. Dac rspunsul corect nu era cunoscut, sarcina participanilor era de a stabili singuri un interval n care s fie 90% siguri c se afl rspunsul corect (ntrebrile erau de genul: Care este anul naterii lui Mozart?; Care este distana de la Pmnt la Lun? etc.) Rezultatele artau c persoanele erau prea ncreztoare n cunotinele lor. n urma analizei rspunsurilor, se dovedea c intervalul oferit ca rspuns era prea ngust, incluznd doar ntre 30 i 60% din rspunsurile corecte, dei cercettorii nu restricionaser mrimea intervalului. Motulsky demonstra astfel c trebuie s distingem ntre limitele de ncredere calculate cu ajutorul metodelor statistice i estimrile informale. (3). Oamenii tind s vad tipare chiar i n datele aleatoare Pentru a-i argumenta ideea, Motulsky aducea n discuie eroarea juctorului [aceasta se refer la convingerea c un eveniment aleator poate fi prezis de un eveniment anterior independent. Este un rezultat al combinrii eronate a probabilitilor independente (Miclea, 1999]. De exemplu, fanii baschetului pot crede c, dac un juctor a nscris dintr-o aruncare, ansele de a nscrie i din urmtoarea sunt mai mari dect acelea de a rata. n mod normal, ansele sunt ns de 50%, ca i n cazul aruncrii unei monede de mai multe ori. Faptul c a ieit anterior ban nu crete ansele ca la 3

- pentru uz didactic urmtoarea aruncare s ias tot ban; de fapt, ansele sunt de 50% la fiecare aruncare. Mintea uman a evoluat astfel nct s gseasc tipare cu uurin, dar este nevoie de rigoare statistic pentru a nu fi pclit de tipare aparente n rndul datelor aleatoare. (4). Oamenii intuiesc incorect probabilitile Gndii-v c avei la dispoziie dou bomboniere. Cea mai mare conine 93 de bomboane albe i 7 roii, iar cea mic 9 albe i una roie. Bomboanele sunt amestecate n fiecare vas i nu putei s vedei culoarea lor. Sarcina dvs. este de a alege o bomboan roie din oricare bombonier. Dac ai alege din bomboniera mic, ansele de a gsi o bomboan roie sunt de 10%. Dac alegei din vasul mare, ansele sunt de doar 7%. Evident, ansele sunt mai mari n cazul bombonierei mici. Totui, dou treimi dintre persoanele care au participat la un astfel de experiment au ales vasul mare, deoarece coninea mai multe bomboane roii (Denes-Raj i Epstein, 1994, apud Motulsky, 2010). (5). Oamenii evit s se gndeasc la situaii ambigue Imaginai-v din nou c avei la dispoziie dou bomboniere. tim c prima conine 50 de bomboane roii i 50 de bomboane negre, amestecate. A doua conine tot 100 de bomboane, unele roii i altele albe, dar nu tim proporia acestora. Dac dorim s alegem o bomboan, indiferent de recipient, nu vom ti culoarea acesteia dect dup ce o extragem. Vei ctiga un premiu dac putei selecta o bomboan roie i suntei liber s extragei din care recipient dorii. Pentru care vei opta? n foarte multe cazuri oamenii aleg prima bombonier (Ellsberg, 1961, apud Motulsky, 2010), caz n care ansele de a reui sunt de 50%. Extragerea unei bomboane roii din a doua urn este mai complicat deoarece este ambigu i ne face s ne simim inconfortabil. (6). Oamenilor le este greu s combine probabilitile De data aceasta gndii-v la concursurile televizate n care concurentul trebuie s aleag una dintre cele trei ui nchise, tiind c n spatele uneia se afl un premiu valoros, iar n spatele celorlalte dou ceva nesemnificativ. S spunem c ai ales o u, de exemplu numrul 2. ntr -o astfel de emisiune, pentru a crete suspansul i audiena emisiunii, prezentatorul va apela la un artificiu. Nu v va arta ce se afl n spatele uii numrul 2, ci va deschide una dintre uile rmase (numrul 1 sau numrul 3), o u despre care tie cu siguran c nu ascunde premiul cel mare. Acum va urma momentul culminant: vi se ofer ocazia de a schimba opiunea original sau de a rmne la aceeai opiune. Nu este vorba despre nici un truc. Uile sunt identice, faa prezentatorului nu ar trebui s spun nimic, iar ua pe care o deschide cu siguran nu va ascunde premiul (el tie n spatele crei ui se afl acesta). Totul depinde aadar de probabiliti. n prima faz, cnd aveai de ales ntre trei ui nchise, ansele de a gsi ua ctigtoare erau egale (33%). Ce se ntmpl n faza a doua, cnd prezentatorul v permite s schimbai opiunea? Dac n faza 1 ai ales ua ctigtoare, (bineneles, fr s tii i fr s vi se arate), n faza a doua prezentatorul va deschide oricum una dintre cele dou ui nectigtoare (s zicem el deschide ua 3). Avei aadar ocazia de a schimba opiunea de la ua ctigtoare la una nectigtoare (despre niciuna dintre ui dvs. nu tii ns deocamdat nimic). Schimbarea va duce la pierderea premiului (ansele irosite au fost de 33%). Dimpotriv, dac n prima faz ai ales o u nectigtoare (s zicem tot ua numrul 2), prezentatorul va avea de ntors una dintre uile rmase (1 sau 3), iar el cu siguran va deschide o u nectigtoare pentru a crete tensiunea. Cu alte cuvinte, dei nu tii acest lucru, ansele de a ctiga sunt de partea dvs., deoarece ambele ui nectigtoare au fost alese (una de ctre dvs., una de ctre prezentator total 66% anse). Schimbarea deciziei va duce cu siguran la ctigarea premiului cel mare.

Marius Druga Metode de cercetare n psihologia educaiei


Dac jocul s-ar repeta de mai multe ori (ncercai acas cu trei bucele de hrtie), vei ctiga de dou ori mai des dac n faza a doua schimbai opiunea dect dac nu ai face -o. Aproape toat lumea ajunge intuitiv la o concluzie greit, creznd c schimbarea alegerii iniiale nu este de ajutor (ibidem). (7). Oamenii tind s ignore explicaiile alternative S presupunem c formm un eantion de persoane care sufer des din cauza migrenelor i acestora li se aplic un tratament experimental. Sarcina lor este de a evalua frecvena durerilor nainte i dup administrarea tratamentului. S zicem c n cele mai multe cazuri se constat o descretere a frecvenei migrenelor, calculele statistice artnd c este puin probabil ca acest lucru s se datoreze ntmplrii. Prin urmare, am putea s concluzionm c tratamentul a avut efect i putem s facem bani din asta. Din pcate, nu este neaprat aa. Iat cteva explicaii alternative (ibidem): efectul placebo a redus frecvena migrenelor: ncrederea n tratament i/sau medic ar fi putut duce la apariia acestui efect; pacienii au fost politicoi i nu au dorit s-l supere pe cercettor, de aceea i-au spus ceea ce el a vrut s aud; nainte, n timpul sau dup tratament pacienii au vorbit cu un medic care le-a sugerat creterea dozei unui alt medicament folosit anterior sau modificarea stilului de via. Scderea frecvenei migrenelor se poate datora respectrii acestor sfaturi i nu tratamentului experimental; cercettorul a exclus din baza de date rezultatele ctorva participani care raportau migrene extrem de frecvente, pentru c depuseser efort fizic intens n sptmna aplicrii tratamentului. Dei poate bine intenionate, astfel de manipulri ale datelor pot explica frecvena mai redus a migrenelor la nivelul grupului; pacienii au luat un calmant puternic naintea instalrii migrenei, de aceea nici nu o mai raporteaz cnd sunt intervievai.

1.3. Analiza statistic i gtitul


Pallant (2001) ncadra ntr-o form interesant coninutul unei cri de analiz statistic, punnd cititorii s-i imagineze c datele pe care le au la dispoziie sunt de fapt ingrediente ale unei reete. Ingredientele respective pot fi gtite n moduri variate, ca mic dejun, prnz, cin sau gustare. n funcie de materia prim pe care o avem la ndemn, anumite opiuni pot fi potrivite sau nu. Aadar, planificarea i pregtirea sunt etape importante ale procesului, att n gtit, ct i n analiza datelor. n acest sens, trebuie s fim pregtii s rspundem la cteva ntrebri: (1). Avem ingredientele necesare n cantitile potrivite? (2). Cum trebuie s pregtim ingredientele pentru a putea fi gtite? (3). Cum vom gti ingredientele? (4). Avem n minte o imagine a felului n care produsul trebuie s arate la sfrit? (5). Cum vom ti c mncarea este gata? (6). Dup ce este gtit, cum o servim pentru a arta apetisant? Aceleai ntrebri se aplic i procesului de analiz a datelor. Este nevoie de planificarea cercetrii pentru ca studiul s ne ofere informaiile de care avem nevoie. Baza de date trebuie construit cu atenie, avnd clare n minte ipotezele de la care pornim. Trebuie s tim ce proceduri statistice avem la dispoziie pentru datele noastre, trebuie s tim s le rulm i s interpretm corect output-ul. n fine, trebuie s tim s prezentm rezultatele cercetrii.

- pentru uz didactic -

2. Concepte de baz: cercetare, variabile, design


2.1. Cercetare fundamental i cercetare aplicat
Cercetrile tiinifice sunt desfurate de obicei pentru a rspunde unor ntrebri generale despre grupuri de persoane, fenomene sau obiecte. De exemplu, un cercettor ar putea fi interesat d e efectul plecrii prinilor la munc n strintate asupra copiilor rmai acas n grija bunicilor sau frailor mai mari. n acest exemplu nu este vizat doar un fenomen cu o amploare crescnd, ci i anumite grupuri de persoane: prinii, copiii acestora, persoanele care au grij de ei n Romnia. Dac interesul cercettorului se va ndrepta spre studierea efectelor asupra copiilor rmai acas, asupra motivelor prinilor etc., nseamn c studiul su se va integra n sfera larg a cercetrii fundamentale. Aceasta are ca scop satisfacerea nevoii de cunoatere, a curiozitii, oferind astfel rspunsuri tiinifice la ntrebri tiinifice. Dac pe de alt parte scopul cercettorului este de a implementa programe de sprijin pentru copiii lsai acas, atunci studiul su se va integra n sfera cercetrii aplicate. Aceasta are ca obiective rezolvarea unor probleme practice ale vieii de zi cu zi, i nu cunoaterea n sine. n sens larg, cercetarea aplicat urmrete mbuntirea condiiilor de via. Cei mai muli savani consider c progresul omenirii are de fapt la baz cercetarea fundamental, care asigur temelia pe care se va desfura cercetarea aplicat. Dac fundamentele sunt clare, atunci probabil c vom reui s gsim aplicaii pe baza acestora. George Smoot, deintor al premiului Nobel pentru fizic, afirma c oamenii nu pot prezice viitorul suficient de bine pentru a anticipa direciile n care se vor dezvolta aceste aplicaii, pornind de la cercetarea fundamental. n schimb, dac am desfura doar cercetare aplicat, omenirea probabil ar fi tot n stadiul n care ar confeciona sulie din ce n ce mai bune (www.lbl.gov).

2.2. Variabilele: definiie, tipuri, operaionalizare


Adesea cercetrile sunt construite pentru a investiga anumite caracteristici ale unor persoane, fenomene sau evenimente, ori caracteristici ale factorilor externi care le pot influena. De exemplu, un studiu ar putea s vizeze relaia dintre tipul activitii prestate i gradul de oboseal. n acest caz ne intereseaz o caracteristic a activitii (ce fel de munc presteaz persoanele investigate?) i o caracteristic a persoanelor (ct de obosite sunt acestea?) Probabil c ntr-un astfel de studiu ne propunem s urmrim dac schimbarea tipului de activitate este nsoit de modificri ale gradului de oboseal. Cnd obosesc persoanele mai repede, cnd depun efort fizic sau intelectual? Ct de profund este sentimentul de oboseal? n studiul oferit ca exemplu avem dou lucruri care se modific (sau iau alte valori, am zice noi n statistic): tipul activitii i gradul de oboseal. Acestea se vor numi variabile, deoarece sunt proprieti msurabile ale unei persoane, respectiv fenomen. Variabilele pot s ia valori foarte diferite. De exemplu, greutatea ca variabil poate s ia valori de la foarte mici (desemnnd cantiti infime, abia detectabile chiar i cu ajutorul instrumentelor specializate) la foarte mari (teoretic tinznd ctre infinit). Nu toate variabilele pot s ia o gam att de larg de valori. De exemplu, pentru variabila apartenen de gen valorile clasice sunt masculin i feminin). Totalitatea valorilor pe care poate s le

Marius Druga Metode de cercetare n psihologia educaiei


ia o variabil formeaz plaja de valori a variabilei respective. De exemplu, n nvmntul romnesc plaja de valori a notelor colare este de la 1 la 10. Trebuie s facem distincie ntre variabil i scor. Cnd vorbim despre un scor ne referim la acea valoare pe care un element al eantionului o obine dup ce o anumit variabil a fost msurat n cazul su. De exemplu, dac alegem s lucrm cu un grup de fotomodele crora s le msurm greutatea, scorul va fi greutatea unei anumite persoane din acest grup, obinut probabil prin cntrire (s zicem 50 kg). Aadar, n acest exemplu greutatea este variabila, iar 57 kg este scorul nregistrat de un subiect n urma msurrii variabilei. Variabila poate s ia mai multe valori, dar scorul obinut de un subiect este reprezentat de o singur valoare. Un alt termen care trebuie definit este acela de constant; aceasta este o valoare care nu se modific (de exemplu ) Pentru a nelege i mai bine problema variabilelor, v invitm la un exerciiu de imaginaie. S spunem c avem un psiholog, fan al filmelor de groaz ( horror). El nu poate nelege de ce unii dintre apropiaii si refuz s priveasc astfel de filme, de aceea i propune s realizeze un studiu pe aceast tem. El pornete de la ipoteza conform creia vizionarea filmele horror crete reactivitatea emoional a privitorilor, acesta fiind motivul pentru care unii se simt inconfortabil cnd urmresc astfel de filme. Pentru a-i testa ipoteza, cercettorul nostru va trebui s delimiteze foarte clar variabilele cu care dorete s lucreze: Tipul filmului horror este o variabil utilizabil n acest studiu, de vreme ce aceasta ndeplinete condiia de a lua anumite valori. De exemplu, un grup de participani va viziona un film horror n care domin scenele violente, un alt grup un film horror bazat n primul rnd pe efecte care duc la sperierea telespectatorului etc. Practic, vom avea attea valori ale variabilei cte categorii de filme horror dorim s proiectm. Aceste categorii ale variabilei se numesc modaliti. n cazul nostru putem s numim modalitile variabilei tipul filmului horror astfel: horror violen, horror sperietur etc. ntrebarea este cte grupuri de subieci vom avea? Putem s lucrm cu grupuri diferite, astfel nct fiecare grup s vizioneze un anumit tip de film. n acest caz vom avea attea grupuri cte modaliti are variabila noastr. O strategie alternativ este de a utiliza un singur grup, care va fi expus pe rnd tuturor modalitilor variabilei. Fiecare modalitate de lucru are avantajele i dezavantajele ei, de care trebuie s inem cont cnd construim scenariul studiului nostru. Numrul de scene horror vizionate este o alt variabil utilizabil, ct vreme ia valori diferite: 5 scene, 15 scene etc. Participanii pot fi mprii n subgrupe care vor viziona fragmente de film care conin numere diferite de scene horror: pn la 5 scene, ntre 6 i 10 scene, peste 10 scene. Vom avea astfel o variabil cu trei modaliti. Cercettorul ar putea fi interesat de o alt variabil: apartenena de gen (cu modalitile masculin i feminin), pentru a identifica dac exist diferene ntre brbai i femei n ceea ce privete reactivitatea la stimuli n urma vizionrii filmelor horror; Probabil cea mai spinoas parte a studiului va fi cea legat de o alt variabil, i anume reactivitatea emoional. Cum va msura cercettorul aceast variabil? De rspunsul la aceast ntrebare va depinde n mare parte demersul experimental, deoarece subiecii vor fi comparai pe aceast variabil n funcie de grupul din care fac parte (masculin sau feminin, horror violen sau horror sperietur, pn la 5 scene horror, ntre 6 i 10 scene horror, peste 10 scene horror etc.) Studiul va trebui s-i permit cercettorului s vad dac tipul filmului horror, numrul de

- pentru uz didactic scene horror vizionate sau apartenena de gen (care n ipoteza formulat de noi au statutul de cauze) determin o reactivitate emoional mai crescut (care are statutul de efect). Cercettorul va trebui aadar s aleag un mod n care s msoare reactivitatea emoional, cu alte cuvinte s operaionalizeze aceast variabil. n acest scop el va trebui s decid care anume dintre posibilele moduri de a msura reactivitatea emoional se potrivete cel mai bine studiului su i s o utilizeze apoi pe tot parcursul desfurrii acestuia. Dintre posibilele operaionalizri ale reactivitii emoionale, el poate alege de exemplu: frecvena comarurilor consecutive vizionrii filmelor horror; performana la o sarcin de inhibiie gen Stroop; scorul obinut la un chestionar care cuprinde itemi de genul Ct de team v este s umblai noaptea pe strad dup ce urmrii un film horror? (deloc, foarte puin, puin etc.) Uneori lucrurile sunt relativ simple, neexistnd prea multe operaionalizri pentru o variabil (vezi naionalitatea). Alteori devin mai complicate, deoarece trebuie s alegem din multiplele operaionalizri posibile doar pe cele la care avem acces. De exemplu, cum operaionalizm performana n munc? Operaionalizarea pe care o vom alege depinde printre altele de tipul muncii vizate, de accesul la documentele interne ale organizaiei, de accesul la muncitor sau superiorul acestuia, de resursele de care dispunem etc. Operaionalizarea se poate realiza apelnd la scorul obinut de subieci la un chestionar care investigheaz variabila respectiv. Cu alte cuvinte, cercettorul utilizeaz chestionare deja construite i validate, pentru a-i operaionaliza variabilele. De exemplu, satisfacia n via poate fi operaionalizat prin scorul obinut de subieci la deja celebrul Satisfaction with Life Scale (Diener et al, 1985). Este posibil ca itemii unor astfel de chestionare s fie publicai n anexele unui articol, dar unele scale sunt protejate de drepturi de autor i trebuie cumprat dreptul de utilizare. n alte cazuri scalele sunt considerate a fi de domeniu public, de aceea este nevoie cel mult de un acord scris i de obligativitatea citrii bibliografice. Alegerile sunt aadar multiple i depinde doar de noi, cei care construim cercetarea, cum dorim s realizm operaionalizarea. 2.2.1. Variabile independente i variabile dependente Variabilele care sunt controlate n totalitate de cercettor se numesc variabile independente. Ele nu depind de ceea ce fac participanii, ci de modul n care le manipuleaz experimentatorul. Dintre variabilele studiului descris anterior, tipul filmului horror, numrul de scene horror vizionate i apartenena de gen sunt variabile independente, deoarece nu depind de participani i se afl n totalitate sub controlul cercettorului (acesta decide ce fel de film va proiecta, cte scene horror etc.). n studiile experimentale (n care cercettorul intervine ntr -un anume fel, modific ceva n mod intenionat) variabilele independente au statutul de cauze. Cercettorul le poate modifica sau manipula pentru a identifica efectul acelor modificri asupra altor variabile. De exemplu, n studiul nostru cercettorul poate s manipuleze numrul scenelor horror pe care le proiecteaz. n studiile nonexperimentale interpretarea cauzal trebuie realizat cu precauie. n astfel de studii cercettorul nu manipuleaz variabilele independente, ci doar folosete modalitile acestora, aa cum sunt date ele n mod natural. Exemplul clasic este acela al apartenenei de gen, pe care cercettorul nu o manipuleaz, ci doar compar modalitile acestora (sau mai corect spus scorurile obinute de brbai i femei). Astfel de variabile precum apartenena de gen exprim ce sunt

Marius Druga Metode de cercetare n psihologia educaiei


participanii i nu ceea ce fac, permindu-i cercettorului s compare grupurile de subieci formate de modalitile variabilei (de exemplu masculin i feminin). n aceeai situaie se afl variabile precum starea civil, naionalitatea, religia etc., numite generic variabile categoriale, deoarece mpart subiecii n clase sau categorii care vor putea fi comparate. Variabilele dependente in direct de participani, fiind adesea o expresie a comportamentului sau alegerilor acestora. ntr-un experiment, ele reprezint efectul formulat n ipotez. n studiul descris, variabila dependent este sensibilitatea la stimuli. Probabil c deja ai intuit faptul c unul dintre marile avantaje ale experimentului este acela c permite cercettorului s exercite un control precis asupra uneia sau mai multor variabile. Chiar i n exemplul nostru este evident libertatea de care dispune cercettorul n alegerea i manipularea diverselor variabile. Este posibil ns ca uneori pe parcursul desfurrii cercetrii s ne dm seama c exist factori pe care nu i-am anticipat i care pot s acioneze ntr-o manier similar variabilei independente, respectiv vor crea diferene ntre grupuri. n exemplul nostru ne ateptm ca reactivitatea emoional s fie mai mare pentru persoanele care au vizionat mai multe scene horror. O posibil variabil confundat n acest caz este rapiditatea cu care se succed scenele res pective. Fragmentul vizionat poate s fie de 10 minute, timp n care apar doar dou scene horror, sau de 5 minute, n care apar 10 scene horror. O situaie special apare cnd cercettorul dorete s utilizeze o situaie sau condiie de control. De exemplu, ar putea s compare reactivitatea emoional nu doar ntre grupurile care au vizionat pn la 5 scene, 6-10 scene i peste 10 scene horror, ci s introduc n comparaie un aanumit grup de control, care nu a vzut nicio scen horror pe parcursul desfurrii experimentului (aceti participani fie nu s-au uitat la niciun film, fie au vzut o alt categorie de film). Cu alte cuvinte, pentru grupul de control variabila independent ia valoarea 0. Grupurile care au urmrit pn la 5 scene, 6-10 scene i peste 10 scene horror se numesc grupuri experimentale. n general grupurile de control servesc ca standard cu care pot fi comparate grupurile experimentale (Smith et al, 2005).

2.3. Designuri experimentale i cvasiexperimentale


Pentru a se asigura c studiul su va reui s rspund ntrebrii care l-a iniiat, cercettorul va trebui s construiasc un adevrat scenariu al demersului su. Acest scenariu va trebui s clarifice n primul rnd posibilele combinaii ale variabilelor incluse n cercetare. De exemplu, n studiul cu filmele horror cercettorul va trebui s delimiteze care sunt variabilele cu care va lucra (att cele independente, ct i cele dependente), care sunt cele mai potrivite operaionalizri ale acestora (cum vor fi msurate), care sunt modalitile lor i cum va repartiza subiecii. Atragem atenia asupra unui fapt deosebit de important. n construirea designurilor experimentale cercettorul se va baza pe ipotezele pe care le -a formulat, deoarece fiecare ipotez vizeaz un anumit tip de relaie ntre variabile. Aceasta nseamn c pentru fiecare ipotez vom avea cte un design: cte ipoteze, attea designuri. Adesea se prefer o prezentare tabelar a designurilor experimentale, astfel nct combinaiile variabilelor s fie ct mai vizibile. De exemplu, n studiul cu filmele horror cercettorul ar putea s formuleze ipoteza urmtoare: Tipul filmului horror i numrul scenelor horror determin modificri la nivelul reactivitii emoionale.

- pentru uz didactic Pentru aceast ipotez, variabilele independente sunt VI1: tipul filmului horror (cu modalitile horror sperietur i horror violen) i VI2: numrul scenelor horror (cu modalitile pn la 5 scene, ntre 6 i 10 scene i peste 10 scene). Variabila dependent este reactivitatea emoional (RE), operaionalizat prin scorul la un chestionar. Reprezentarea tabelar a designului va arta astfel:
VI1 VI2 Horror sperietur Horror violen modalitile variabilei independente 1 Grup de subieci care a urmrit pn la 5 scene horror dintr-un film n care domin violena. Acestora le msurm reactivitatea emoional. pn la 5 scene ntre 6 i 10 scene peste 10 scene

modalitile variabilei independente 2 Grup de subieci care a urmrit pn la 5 scene horror dintr-un film bazat pe sperierea privitorului. i acestora le msurm reactivitatea emoional.

n reprezentarea tabelar a designului apar urmtoarele elemente: cele dou modaliti ale variabilei independente 1; cele dou modaliti ale variabilei independente 2; numrul grupelor care vor fi comparate (6). Este vorba despre cele ase csue ale tabelului, fiecare dintre acestea reprezentnd cte un grup de subieci. De exemplu, csua din stnga sus (din interiorul tabelului) reprezint scorul obinut la chestionarul prin care am msurat RE de ctre subiecii care au vizionat maxim 5 scene horror dintr -un film de groaz bazat pe sperierea privitorului. Csua din dreapta jos (din interiorul tabelului) reprezint scorul obinut la chestionarul prin care am msurat RE de ctre subiecii care au urmrit peste 10 scene horror dintr-un film de groaz bazat pe violen. O prim concluzie important pe care o extragem din aceast prezentare este c alegerea unui numr mare de variabile sau modaliti ale acestora nu este o soluie potrivit, deoarece vor fi greu de controlat mai trziu din punct de vedere statistic. A doua concluzie vizeaz numrul participanilor necesari pentru testarea ipotezei formulate. innd cont c ar fi bine ca ntr -un grup s fie mcar 10-15 subieci, un design precum cel din exemplu presupune utilizarea unui numr de 6*15 participani, adic 90. Adugarea unor variabile sau modaliti suplimentare va impune utilizarea unui numr i mai mare de participani. Doi termeni ntre care trebuie s facem distincie sunt design experimental i design cvasiexperimental. Termenul design experimental, neles n sensul su strict, vizeaz studiile n care grupurile comparate au fost formate prin selecie aleatoare. De exemplu, prin tragere la sori am putea s selectm din populaia de elevi ai unei coli pe aceia care vor participa la o cercetare, iar mprirea celor selecionai n grupuri mai mici se va face tot aleator. Pe de alt parte, n designurile cvasiexperimentale mprirea subiecilor n grupurile care vor fi comparate nu se face aleator. O mprire deja existent poate fi utilizat pentru a compara grupurile. De exemplu, putem compara prezena la ore a grupei I a anului I Psihologie cu cea a grupei II i a

10

Marius Druga Metode de cercetare n psihologia educaiei


grupei III. Repartizarea studenilor n cele trei grupe nu o facem noi aleator, ci ne folosim de o mprire deja existent. De ce se realizeaz aceast distincie? Motivul se leag mai ales de principalul avantaj al mpririi aleatoare: ne asigur c ntre grupurile comparate nu exist diferene sistematice nainte de aciunea variabilei independente. Ne intereseaz acest lucru deoarece n mod ideal, n cercetrile bazate pe experiment, dorim s atribuim manipulrii variabilei independente orice efect observat la nivelul variabilei dependente. Dac ar exista diferene ntre grupuri nainte de aciunea variabilei independente, atunci este posibil ca modificrile variabilei dependente s nu se datoreze acestor diferene i nu interveniei noastre. (pentru mai multe detalii cu privire la eantionarea aleatoare, v recomandm s citii 4.4.2. - Eantionarea, pag. 48 i urm.) Dac n designurile experimentale i cvasiexperimentale sunt vizate diferenele dintre grupurile comparate, n designurile corelaionale ne intereseaz modul n care variabilele se asociaz. n aceste designuri, variabilele nu se mai numesc independente i dependente, deoarece cauzalitatea este complet exclus. Vom vorbi n schimb despre variabile implicate ntr-o corelaie sau asociere (vezi capitolul 12, pag. 216 i urm.) 2.3.1. Tipuri de design Dou criterii sunt de interes pentru clasificarea designurilor, indiferent c sunt experimentale sau cvasiexperimentale: numrul de variabile independente utilizate i modul de utilizare a grupurilor. Deosebirile dintre ele sunt eseniale n alegerea testelor statistice potrivite. n funcie de numrul variabilelor independente utilizate, designurile sunt: (1). unifactoriale (o singur variabil independent, una sau mai multe variabile dependente). De exemplu, o ipotez ar putea s vizeze posibilele diferene ntre brbai i femei n ceea ce privete capacitatea de orientare spaial. Variabila independent este apartenena de gen (cu modalitile masculin i feminin), iar cea dependent capacitatea de orientare spaial; (2). bifactoriale (dou variabile independente, una sau mai multe variabile dependente). De exemplu, o ipotez ar putea s vizeze posibilele diferene n ceea ce privete suma cheltuit anual pe mbrcminte n funcie de apartenena de gen i nivelul veniturilor. Variabilele independente sunt apartenena de gen i nivelul veniturilor, iar variabila dependent este suma cheltuit anual pe mbrcminte;. (3). multifactoriale (trei sau mai multe variabile independente, una sau mai multe variabile dependente). La exemplul anterior adugai variabila tipul slujbei ocupate i obinei un design multifactorial. n funcie de modul de utilizare a grupurilor, designurile sunt: (1). intergrup avem grupuri diferite pe care le comparm: brbai cu femei, cstorii cu necstorii, clasa a II-a cu clasa a III-a etc. Astfel de grupuri se numesc eantioane independente. (2). intragrup Exist trei situaii n care vorbim despre astfel de designuri: (a). avem un singur grup, pe care l msurm de cel puin dou ori, comparnd apoi rezultatele. De exemplu, putem compara frecvena migrenelor nainte i dup administrarea unui nou tratament; (b). avem dou grupuri de participani, iar noi formm ntre ele perechi artificiale sau naturale, astfel nct fiecrei persoane dintr-un grup s-i corespund o alt persoan din alt grup, conform unor criterii stricte (gen, vrst, performan colar etc.) Unul dintre grupurile astfel 11

- pentru uz didactic formate este supus unui tip de intervenie, iar cellalt altui tip, urmnd ca scorurile s fie apoi comparate; (c). msurm rspunsurile aceleiai persoane la ntrebri diferite. De exemplu, putem cere unui lot de participani s evalueze printr-o ntr-o singur cifr de la 1 la 10 satisfacia fa de condiiile fizice ale muncii i satisfacia fa de atmosfera de la locul de munc. Condiia esenial este ca ambele evaluri s se realizeze pe aceeai scal n cazul nostru, note de la 1 la 10, unde 1 ar putea fi complet nemulumit, iar 10 complet mulumit. Astfel de grupuri se numesc eantioane perechi sau relaionate. (3). mixte o combinaie a celorlalte dou variante, n care cel puin dou grupuri diferite sunt msurate de cel puin dou ori, iar apoi comparm rezultatele. De exemplu, am putea avea un grup de femei i unul de brbai, crora le msurm rata pulsului nainte i dup susinerea unu i interviu de angajare. Definiii Eantioanele independente sunt reprezentate de grupuri diferite de subieci. Grupurile respective pot fi extrase din populaii diferite sau din aceeai populaie. Eantioanele perechi se refer la situaiile n care acelai grup este msurat de cel puin dou ori sau cercettorul formeaz perechi naturale sau artificiale.

Din pcate ns experiena ne arat c frecvent cercetrile sunt creionate neglijnd complet analizele statistice necesare mai trziu pentru testarea ipotezelor. Ca urmare, designurile sunt construite abia dup ce datele au fost culese, devenind simple formaliti. Singura lor raiune de a fi este c trebuie s apar n raportul de cercetare. Designurile sau mai precis spus retuarea lor devine astfel un panaceu post-hoc al unor cercetri prost conduse (Holmes i Friston, 2003).

3. Ingredientele analizei statistice. Tipuri de date


Exist moduri diferite de a colecta datele, n funcie de tipul cercetrii pe care o desfurm. Unul dintre criteriile importante n decizia de a utiliza un test statistic sau altul este legat de modul n care am realizat msurarea variabilelor din cercetarea noastr: categorial sau numeric.

3.1. Msurarea categorial


Se refer la variabilele care pot s ia doar un numr limitat de posibile valori sau categorii (de exemplu apartenena religioas, cu valorile reformat, catolic, ortodox etc. sau apartenena de gen, cu valorile masculin i feminin). Datele categoriale pot fi obinute cu ajutorul scalelor nominale i ordinale. 3.1.1. Scalele nominale Msurarea pe o scal nominal este cel mai simplu nivel de msurare i presupune clasificarea indivizilor n categorii care au nume diferite, dar care nu sunt relaionate una cu alta ntr-o manier sistematic (Gravetter i Wallnau, 2009). Cu alte cuvinte, ntre categoriile acestor scale nu exist o

12

Marius Druga Metode de cercetare n psihologia educaiei


relaie de ordine dat de un criteriu obiectiv, iar distana dintre categorii nu poate fi calculat. Indivizii sunt etichetai i ncadrai n anumite categorii, dar fr nicio distincie cantitativ ntre ei. Nu putem afirma c o categorie este mai bun dect altele. De exemplu, se consider c cele patru tipuri temperamentale clasice sunt categorii ale unei scale nominale. Folosind un criteriu obiectiv, nu putem afirma despre unul dintre temperamente c este mai bun dect altul. n scalele nominale (ca i n restul scalelor de altfel) categoriile sunt reciproc exclusive. Cu alte cuvinte, un element poate face parte dintr-o singur clas i nu din mai multe. Acel element va semna mai mult cu restul elementelor aflate n categoria sa dect cu celelalte. De exemplu, culoarea prului este o variabil msurat cu ajutorul unei scale nominale. O persoan cu prul blond va fi inclus ntr-o singur clas, i nu n mai multe, i va semna mai tare din punct de vedere al culorii prului cu restul persoanelor din aceeai categorie, i mai puin cu persoanele cu prul rocat. n SPSS, categoriile unei scale nominale sunt codate de obicei prin cifre. Acestea nu vor avea ns dect rolul de a distinge o categorie de alta, orice alt operaie matematic fiind lipsit de sens. De exemplu, categoria masculin poate primi codul 1 sau 1024, iar categoria feminin codul 3 sau 87. Asta nu nseamn c brbaii sunt de 1024 de ori mai buni dect femeile, numrul respectiv este doar un cod. La fel de absurd ar fi s facem o medie ntre aceste coduri. Singurul scop al codurilor numerice este aadar de a permite identificarea categoriilor, astfel nct nicio operaie aritmetic nu are sens. n psihologie exist o sumedenie de exemple de scale nominale: cele patru tipuri temperamentale clasice, cele patru caliti de baz ale gustului, categoriile de psihoze, cele dou categorii mari de teorii ale motivaiei etc. Variabilele msurate cu scalele nominale au modaliti care nu permit aadar dect numrarea indivizilor/obiectelor care fac parte din fiecare categorie (cu alte cuvinte frecvena absolut), raportarea procentajelor i a valorii mod (vezi 5.5. Calculul indicilor statistici descriptivi i realizarea graficelor, pag. 62 i urm.) De exemplu, variabila apartenen religioas este msurat cu ajutorul unei scale nominale, de vreme ce modalitile acesteia sunt ortodox, catolic, grecocatolic, reformat etc. Nu exist o relaie de ordine ntre modalitile variabilei, nu se poate spune c o anumit religie este mai bun dect alta. Datele pot fi raportate tabelar astfel:
religia frecvena procent ortodox 242 36,77% catolic 192 29,17% greco-catolic 59 8,96% reformat 75 11,39% alii 90 13,67%

Sunt puine alte modaliti de a raporta sub form tabelar aceste date, cu excepia unor detalii de prezentare: aranjarea n ordine alfabetic a rndurilor sau coloanelor, n ordinea frecvenelor sau dup orice alt criteriu arbitrar. Prezentarea acestor date se poate realiza i prin reducerea informaiilor, dac o anumit variabil ne intereseaz mai mult n comparaie cu celelalte, precum n tabelul urmtor:
religia frecvena procent ortodox 242 36,77% alii 416 63,22%

3.1.2. Scalele ordinale Se refer la variabilele categoriale pentru care exist o relaie clar de ordine ntre modalitile variabilei. Ordinea respectiv nu poate fi modificat arbitrar, deoarece corespunde unor intensiti sau 13

- pentru uz didactic mrimi diferite ale categoriilor. n psihologie, exemplele cele mai frecvente de scale ordinale se refer la msurarea unor atitudini, preferine etc. (Ct de mult suntei de acord cu afirmaia?; Ce prere avei despre). Nnu putem spune ct de mare este distana dintre dou categorii ale scalei, ci doar c o categorie este inferioar sau superioar uneia alturate (altfel spus, dei ordinea punctelor scalei este fix, diferenele dintre acestea sunt variabile). De exemplu, dac o persoan este de acord cu o afirmaie, iar alta n perfect dezacord, asta nseamn c prima persoan este de trei ori mai de acord cu afirmaia dect a doua persoan? n niciun caz! Ca i n cazul scalelor nominale, este vorba despre simple etichete. De aceea, codarea n SPSS se realizeaz n acelai mod, iar operaiile ari tmetice sunt din nou lipsite de sens n cazul lor. Ca i la scalele nominale, se pot numra ns indivizii/obiectele care fac parte din fiecare categorie, se pot raporta procentajele i valorile mod. Datele pot fi prezentate tabelar ntr -o form similar scalelor nominale. De exemplu, s presupunem c lucrm cu variabila gustul noului iaurt al firmei X, cu modalitile foarte plcut, plcut, nici prea plcut, nici prea neplcut, neplcut, foarte neplcut i nu tiu. Exist o ordine clar i fix ntre categoriile variabilei, dar distana dintre ele nu poate fi calculat.
gustul iaurtului frecvena procent foarte plcut 28 14,5% plcut 44 22,79% nici prea plcut, nici prea neplcut 52 26,94% neplcut 15 7,77% foarte neplcut 24 12,43% nu tiu 30 15,54%

Este permis ns aglutinarea unor modaliti apropiate, dac din punct de vedere logic i semantic este posibil. De exemplu, categoriile foarte plcut i plcut pot fi combinate pentru a da categoria plcut, la fel neplcut i foarte neplcut pentru a da categoria neplcut. Am obine astfel tabelul urmtor:
gustul iaurtului frecvena procent plcut 72 37,3% nici prea plcut, nici prea neplcut 52 26,94% neplcut 39 20,20% nu tiu 30 15,54%

3.2. Msurarea numeric


Scalele numerice includ serii de categorii ordonate (la fel ca scalele ordinale), dar de data aceasta diferenele dintre dou categorii consecutive este egal (de exemplu viteza: distana dintre 3 km/h i 4 km/h este identic cu aceea dintre 16 km/h i 17 km/h). Msurarea numeric presupune aadar apelul la variabile care pot s ia teoretic orice valoare (de exemplu timpul, greutatea, nlimea etc.) n plus, valorile unei astfel de variabile indic att ordinea valorilor, ct i distana dintre ele. Variabilele care apeleaz la scale numerice pentru msurare se mai numesc variabile cantitative. Ele pot fi discrete sau continue. O variabil este discret dac plaja de valori pe care le poate lua este format dintr-un numr finit de valori (de exemplu mrimea familiei). n schimb, plaja de valori a variabilelor continue este virtual infinit (de exemplu temperatura).

14

Marius Druga Metode de cercetare n psihologia educaiei


Facem o scurt parantez pentru a face trimitere la unele lucrri care ating subiectul scalelor de msurare, lucrri care fac o distincie mai fin n interiorul scalelor numerice. Astfel, Radu (1993) difereniaz ntre scalele de interval (scale numerice, avnd ca proprieti relaia de ordine dintre valorile variabilelor i distana egal dintre valori) i raioscale (scale numerice, similare celor de interval, dar care au n plus existena unui punct zero real). Acest punct zero al raioscalelor corespunde absenei obiectului msurat. De exemplu, temperatura este o variabil msurat cu ajutorul unei scale de interval (relaie de ordine ntre grade, distane egale ntre acestea). Dei are teoretic un punct 0, aceasta nu nseamn c fenomenul msurat nu exist; temperatura exist, dar s-a convenit ca respectivul 0 s reprezinte, pentru unitatea de msur grade Celsius, punctul de topire al gheii. Alte variabile aflate n aceeai situaie sunt altitudinea, care se msoar de la nivelul mrii, sau timpul, care se msoar de la anul naterii lui Christos. n ceea ce privete raioscalele, sunt ncadrate de obicei n aceast categorie variabilele care msoar proprieti fizice. De exemplu, dac am spune despre un obiect c are volum 0, acesta de fapt nu exist. Pentru majoritatea testelor statistice, distincia dintre scalele de interval i raioscale nu este important, deoarece ambele produc valori numerice, permind calculul diferenelor dintre scoruri. n schimb, foarte important este distincia dintre cele dou mari tipuri de msurare (categorial i numeric), din cel puin dou motive: putem s identificm limitele unor msurri pe care le-am realizat; exist proceduri statistice potrivite pentru anumite tipuri de date, dar nu i pentru altele. De exemplu, dac ne intereseaz vrsta unui eantion, am putea s o msurm folosind o scal categorial, clasificnd subiecii n adolesceni, tineri, aduli i btrni sau alegnd o clasificare consacrat n domeniu (de la 14 la 18 ani adolescena timpurie, de la 18 la 24 de ani adolescena etc.) O astfel de msurare nu ne va spune ns foarte multe despre vrsta real a membrilor eantionului i va limita utilizarea unor teste statistice mai puternice. De aceea, de cte ori este posibil, ar fi bine s apelm la scale numerice pentru msurare. Acestea vor permite n exemplul nostru aflarea vrstei exacte, utilizarea unei game largi de indici statistici descriptivi i a unor proceduri statistice mai puternice. n plus, cele mai multe proceduri statistice sunt destinate scorurilor numerice, obinute cu ajutorul scalelor de interval sau raioscalelor.

3.3. Operaii asupra datelor n SPSS


Uneori introducerea datelor brute n SPSS nu este suficient pentru a ne i apuca de calculul indicilor statistici. Dou exemple oferim n acest sens: (1). variabila care ne intereseaz este de fapt o sum de variabile. De exemplu, dac aplicm un chestionar care msoar optimismul, scorul total obinut de subiect la aceast variabil este obinut prin nsumarea tuturor itemilor din chestionar care msoar optimismul. n SPSS, fiecare item va fi de fapt o variabil, iar ceea ce avem nevoie este ca programul s ne calculeze suma acestor variabile. Nu v recomandm s facei suma manual i apoi s introducei direct valoarea obinut, din cel puin dou motive: ansele s greii dvs. sunt semnificativ mai ridicate dect s greeasc programul; n unele situaii, cum este analiza consistenei interne, va fi nevoie s operai cu itemii chestionarelor (care sunt variabile n SPSS).

15

- pentru uz didactic (2). n scorul total al unei variabile intr i itemi cotai invers. De exemplu, un item care vizeaz optimismul ar putea fi formulat astfel: Cred c ziua de mine nu va aduce nimic bun. Variantele de rspuns sunt (1) deloc de acord; (2) dezacord; (3) nici de acord, nici mpotriv; (4) de acord; (5) total de acord. Dac n instruciunile chestionarului folosit se spune c un scor ridicat obinut la chestionar semnific un nivel ridicat al optimismului, este clar c itemul din exemplu trebuie recodificat, deoarece dac subiectul nostru ar rspunde cu varianta (5) n niciun caz nu va arta mult optimism. De aceea, 5 va deveni 1, 4 va deveni 2, 3 rmne neschimbat, 2 devine 4, iar 1 devine 5. SPSS ne ofer posibilitatea de a recoda automat toi itemii a cror modaliti de rspuns sunt identice (vezi 3.3.2 - Recodarea valorilor unei variabile, pag. 42).

4. Populaie i eantion. Eantionarea aleatoare


4.1. Populaie i eantion: delimitri conceptuale
Cnd ne propunem s realizm o cercetare, sursele de inspiraie sunt de obicei observarea i documentarea anterioar pe tema respectiv. S presupunem c auzim din ce n ce mai multe tiri despre faptul c foarte multe persoane pleac n strintate la munc, lsndu-i copiii n ar, n grija bunicilor sau a frailor mai mari. Auzim apoi interviuri cu diveri specialiti care atrag atenia asupra riscurilor la care sunt expui aceti copii: tulburri emoionale, vagabondaj etc. Dac am avea resursele necesare, am putea derula o cercetare care s reliefeze ct mai exact care sunt riscurile reale la care sunt expui precolarii i colarii mici, soluiile viabile etc. Bineneles, orict de solide ar fi resursele de care dispunem, ne va fi imposibil s investigm toate cazurile din Romnia. Soluia la ndemn este s selectm din totalul cazurilor un numr mai redus, la care avem acces, i apoi s ncercm s generalizm rezultatele obinute, cu un risc de a grei ct mai mic, iar statistica ne poate ajuta n acest sens. Care este populaia i care este eantionul n exemplul descris? Populaia este reprezentat de totalitatea persoanelor care mprtesc caracteristicile cerute de studiul nostru: (1) copii (2) precolari i colari mici (3) lsai n grija bunicilor sau frailor mai mari (4) de ctre prinii plecai la munc n strintate. Eantionul ar fi constituit din grupul de copii extras din populaia mam conform anumitor criterii (vrst, gen, mediu de provenien etc.) i pe care l vom studia propriu-zis. Dup cum probabil v dai seama, populaia poate s includ un numr foarte mare de indivizi: n cazul nostru, toi copiii din Romnia care ndeplinesc cerinele (precolari sau colari mici, lsai n grija bunicilor sau frailor mai mari, prini plecai la munc n strintate). Populaiile pot s fie ns mai puin numeroase, dac adugm criterii suplimentare n definirea acestora: de exemplu, s locuiasc ntr-o anumit arie geografic, s zicem Maramure, sau ntr-o anumit localitate, s zicem Certeze. Populaia poate s aib natur concret sau conceptual, finit sau infinit. De exemplu, populaia de persoane nscrise n cartea de telefoane este una concret i finit: avnd suficient timp la dispoziie, cercettorul ar putea contacta fiecare persoan din cartea de telefon. Pentru o populaie conceptual i infinit, gndii-v c pentru eternitate aruncai o moned n aer i numrai poziiile n

16

Marius Druga Metode de cercetare n psihologia educaiei


care aceasta cade. Populaia va fi reprezentat de aceast mulime de poziii. n acest caz, populaia exist doar ca idee i nu ca ntruchipare material.

4.2. Eantionarea
Pentru a studia o anumit caracteristic a populaiei, avem la dispoziie dou ci (Carnet et al, 2000): metoda exhaustiv i metoda sondajelor. (1). metoda exhaustiv const n contactarea i investigarea tuturor indivizilor care fac parte din acea populaie. Metoda presupune costuri care de regul depesc posibilitile unui cercettor obinuit, i n plus este mare consumatoare de timp. n plus, este posibil ca investigaiile s nu se opreasc niciodat, deoarece noi i noi indivizi se altur populaiei iniiale pe msur ce culegem datele. n cercetarea oferit ca exemplu la nceputul capitolului, ne va fi foarte greu s culegem date de la ntreaga populaie de copii lsai acas de prinii plecai la munc n strintate, chiar dac numrul acestora ar fi relativ sczut. Motivele sunt dou: mereu se vor aduga cazuri noi, iar pn cnd terminm culegerea datelor este posibil ca unii dintre copii s nu se mai ncad reze n criterii (prinii s-au ntors ori i-au luat cu ei). (2). metoda sondajelor presupune extragerea unui eantion din populaia mam i, pe baza rezultatelor obinute la acest nivel, generalizarea ulterioar la ntreaga populaie. Dificultatea este reprezentat de obinerea unui eantion reprezentativ pentru populaie. n exemplul nostru, ct putem fi de siguri c eantionul de copii pe care i-am extras din populaia larg o reprezint cu adevrat? Ct de mare este eroarea pe care o comitem investignd acest eantion i nu populaia n sine? Ct de bine am realizat eantionarea, la urma urmei? Aadar, dei de obicei ntrebarea la care dorim s rspundem prin cercetarea noastr vizeaz ntreaga populaie, de obicei unui cercettor i este imposibil s investigheze fiecare persoan din populaia care l intereseaz. De aceea el va selecta un grup mai mic (eantion) din acea populaie i se va limita la studiul acestuia. Eantioanele sunt adesea structurate sau stratificate astfel nct s reprezinte un anumit segment al populaiei int. Pentru a se asigura c eantionul su seamn ct mai mult cu populaia din care a fost extras, cercettorul va face apel la eantionarea aleatoare. Utiliznd aceast procedur, fiecare element al populaiei are anse egale cu ale celorlalte de a fi inclus n eantion. Dac nu se realizeaz o repartizare aleatoare a subiecilor n grupurile studiate, cercettorul nu poate fi sigur c nu exist un factor, altul dect variabila independent, care s fi produs rezultatele. Eantionarea aleatoare a participanilor crete aadar ansele ca variabilele irelevante pentru cercettor n studiul su s aib o reprezentare egal n situaiile experimentale i astfel s influeneze mai puin rezultatele. n exemplul nostru, repartizarea aleatoare ar putea s evite formarea unor eantioane formate din copii care au participat deja la anumite programe de sprijin sau au beneficiat de alte avantaje. Acesta este motivul pentru care cercettorul nu ar trebui s permit participanilor s aleag grupul din care s fac parte, mai ales cnd scopul studiului este cunoscut. Lungu (2001) ofer un exemplu pentru a ilustra consecinele unei eantionri care nu este aleatoare. n anul 1948, trei dintre cele mai mari institute de sondare a opiniei din SUA (Gallup, Crossley i Roper) au prezis victoria n alegerile prezideniale a republicanului Dewey, n faa democratului Truman. Truman a ctigat ns alegerile, punnd sub semnul ntrebrii modalitatea de eantionare folosit. Ce se ntmplase? Operatorilor care culegeau date li se repartizase un numr fix de interviuri pe care trebuiau s le realizeze, acordndu-li-se libertatea de a alege persoanele intervievate, cu condiia s respecte cteva criterii legate de vrst, gen, ras etc. Problema a fost c rep ublicanii 17

- pentru uz didactic erau mai uor de gsit: aveau telefon, locuiau n case mai bune, aveau slujbe cu mai puine ore suplimentare etc. Aceste variabile au influenat rezultatele sondajelor. Sondajele derulate tiinific astzi se bazeaz pe eantionarea aleatoare: fiecare membru al populaiei are anse egale de a fi selectat pentru interviu (n cazul sondajelor electorale, fiecare cetean cu drept de vot ar avea anse egale de a fi intervievat). Contrar a ceea ce susin emisiunile de scandal, manipularea datelor nu se face neaprat la nivelul rezultatelor, dup ce ele au fost obinute. Soluia elegant este pur i simplu eantionarea preferenial, care este mai puin verificabil. Oamenilor le este virtual imposibil s produc singuri eantioane aleatoare. Kirk (20 08) descrie n acest sens un experiment n care participanilor li se cerea s propun aleator patru numere din intervalul 1-20. Potrivit definiiei eantionrii aleatoare, ar fi trebuit ca eantioanele de forma 1,2,3,4 sau 14, 16, 18, 20 s apar la fel de des ca i altele. Astfel de eantioane au fost ns produse foarte rar, oamenii evitnd s formeze eantioane cu elemente consecutive sau distane egale ntre ele, prefernd n schimb s utilizeze ntreaga lungime a intervalului. i c tot veni vorba, cte persoane ai vzut care la Loto 6 din 49 ar alege numerele 1, 2, 3, 4, 5 i 6? Pentru a obine eantioane aleatoare, putem apela la cteva tehnici consacrate. Una dintre ele este metoda loteriei, prin care fiecrui membru al populaiei i se atribuie un numr unic. Numerele sunt introduse ntr-un recipient i amestecate, apoi sunt extrase cteva numere. Membrii populaiei care au numerele respective vor constitui eantionul. n cazul populaiilor largi, v recomandm utilizarea unui generator automat de numere aleatoare. Un astfel de generator este disponibil gratuit la http://stattrek.com/Lesson3/SamplingTheory.aspx. 4.2.1. Alte tehnici de eantionare aleatoare i nonaleatoare n afara eantionrii aleatoare simple (bazat pe metoda loteriei), exist alte cteva proceduri care produc tot eantioane aleatoare (Kirk, 2008): eantionarea aleatoare sistematic (se mai numete cvasialeatoare) necesit cunoaterea volumului populaiei (notat cu N) i al eantionului dorit s fie investigat (notat cu n). N este mprit la n, obinndu-se un numr oarecare (notat cu X). Apoi se selecteaz aleator (prin metoda loteriei sau una similar computerizat) un numr ntre 1 i X. Pornind de la acest numr, fiecare al X-lea element al populaiei va fi selectat pentru a face parte din eantion. De exemplu, avem 300 de elevi (N) i avem nevoie de un eantion de 30 (n). 300/30=10, deci X=10. Selectm aleator un numr ntre 1 i 10, s zicem 9. Elevul numrul 9 va fi primul membru al eantionului, apoi elevul 19 (9+10), 19 (119+10) .a.m.d. eantionarea aleatorie stratificat populaia este divizat n grupe, n funcie de anumite caracteristici (apartenen de gen, categorii de vrst etc.) Din fiecare grup astfel format sunt selectate eantioane aleatoare, care sunt apoi combinate pentru a obine un singur eantion care s reprezinte populaia. eantionarea multistadial este utilizat n cercetrile ample. Primul pas este formarea mai multor eantioane mari, din care se alege aleator unul. n etapa a doua sunt formate mai multe eantioane aleatoare n interiorul eantionului ales, din care este ales unul singur, tot aleator. Procedura continu pn cnd scopurile sunt atinse sau pn cnd divizarea suplimentar nu mai are sens. Cercetrile fac apel uneori i la tehnici de eantionare nonaleatoare, chiar dac prin acestea reprezentativitatea eantioanelor nu mai este asigurat (ibidem):

18

Marius Druga Metode de cercetare n psihologia educaiei


eantionarea pe cote populaia este mprit n grupuri reciproc exclusive (pn aici, ca i n eantionarea stratificat). Apoi cercettorul alege dup bunul plac un anumit numr de persoane din fiecare grup, ct vreme acestea ndeplinesc criteriile necesare (se pierde astfel caracterul aleator al eantionrii). De exemplu, unor operatori de teren li se poate cere s intervieveze 100 de persoane de gen masculin cu vrsta cuprins ntre 50 i 65 de ani. Alegerea persoanelor respective este la latitudinea operatorului de teren, fiind condiionat doar de respectarea criteriilor de gen i vrst. Erorile pot s apar din cauza atractivitii mai ridicate a anumitor subieci, a comoditii operatorului etc. Este tipul de eantionare utilizat n exemplul oferit de Lungu (2001) i pe care l-am prezentat anterior. eantionarea tip bulgre de zpad sunt identificate cteva persoane care ndeplinesc criteriile necesare pentru a fi incluse n studiu, apoi li se cere s recomande alte persoane pe care le cunosc i care satisfac de asemenea criteriile; eantionarea accidental sunt investigate persoane alese dup bunul plac al cercettorului; este adesea cazul interviurilor luate pe strad trectorilor; eantionarea pe baz de voluntariat eantionul se autoselecteaz, n urma unui anun al cercettorului; este format adesea din persoane cu preri foarte puternice pro sau contra unei idei formulate n studiu. 4.2.2. Mrimea eantioanelor La fel ca populaiile, eantioanele pot s difere n ceea ce privete numrul indivizilor care le compun. De exemplu, putem desfura un studiu utiliznd un grup de 20 de precolari pentru a evalua eficiena unei noi metode de predare, sau putem utiliza un eantion foarte larg, de peste 500 de persoane adulte, pentru a evalua eficiena unor programe de nvare continu. O ntrebare important pe care trebuie s i-o adreseze cercettorul se refer deci la mrimea eantionului cu care dorete s lucreze. Pentru a rspunde acestei ntrebri, el trebuie s anticipeze ct de mic este diferena dintre grupuri pe care dorete s o detecteze prin studiul su. Utilizarea unor eantioane prea mici va face dificil detectarea diferenelor dintre grupuri, chiar dac ele exist. Ca urmare, rezultatele vor fi adesea neconcludente. Dimpotriv, utilizarea unor eantioane prea mari va permite detectarea chiar i a celor mai mici diferene, dar acest lucru nu va avea neaprat i o semnificaie practic (coeficienii statistici vor fi prea mici pentru a avea o nsemntate aplicativ). n plus, eantioanele mari sunt consumatoare de resurse. n afara acestui criteriu legat de mrimea diferenelor, cercettorul se mai poate baza n decizia sa pe tipul variabilelor pe care le studiaz (categoriale sau numerice), pe caracteristicile populaiei (dac impune foarte multe criterii n definirea acesteia, selectarea unui eantion aleator va fi extrem de dificil), pe rezultatele unor studii anterioare etc. Volumul eantionului trebuie stabilit deci apriori, i nu n funcie de posibilitile de moment sau de constrngerile de timp i spaiu.

4.3. Populaiile i eantioanele ca seturi de date


Sensul original al cuvntului statistic sugereaz c ar fi vorba despre studiul populaiilor de oameni care triesc ntr-o form de organizare politic. Metodele care s-au dezvoltat n statistic nu mai au ns nimic n comun cu unitatea politic a grupului: populaiile au devenit nite abstractizri. Dac am nregistra nlimea a 10,000 de soldai, populaia de staturi va fi obiectul studiului i nu populaia de recrui (Fisher, 1925). Situaia nu s-a schimbat o sut de ani mai trziu. De exemplu,

19

- pentru uz didactic adeseori gsim n asumpiile unor teste statistice exprimarea datele s fie extrase dintr -o populaie normal sau diferenele dintre perechi s fie extrase dintr-o populaie normal. Astfel, cnd vorbim n statistic despre un eantion nelegem deseori setul de date pe care l obinem prin investigarea unui grup relativ restrns de persoane, extras dintr -o populaie n scopul cercetrii. Din acelai punct de vedere, populaia desemneaz setul complet de date, obinut pri n investigarea tuturor persoanelor care ndeplinesc criteriile cerute de cercetare. n exemplul folosit pe parcursul acestui capitol, am nelege prin eantion datele pe care le obinem de la grupul sau grupurile de copii pe care le studiem propriu-zis, iar prin populaie setul complet de date pe care am fi putut s-l obinem prin investigarea tuturor copiilor care ndeplinesc cerinele studiului. Nu trebuie s ne surprind aadar utilizarea termenului eantion de date n locul celui de eantion de persoane. Ambele formulri sunt corecte i acceptate de comunitatea tiinific.

4.4. Estimarea caracteristicilor populaiei pe baza datelor obinute de la eantioane


Indicii statistici descriu numeric datele unui eantion, pe cnd parametrii descriu datele ntregii populaii. Aceasta implic automat faptul c utilizarea indicilor statistici aduce cu sine un anumit grad de eroare cnd se ncearc generalizarea rezultatelor de la nivelul eantionului la cel al populaiei. Dac am avea acces la datele populaiei, am ti bineneles mai multe despre aceasta dect ar putea s ne ofere orice eantion selectat din acea populaie. n cazul n care populaia vizat de un studiu are un volum relativ redus (s zicem toi studenii specializrii Psihologie din Oradea), un cercettor perseverent ar putea s msoare toi membrii populaiei respective. El nu va mai trebui s utilizeze indicii statistici, lucrnd n schimb doar cu parametrii populaiei. Asemenea cazuri sunt ns relativ rare. n cele mai multe cazuri investigarea direct a ntregii populaii este imposibil, chiar dac volumul ei este relativ redus. Acesta este motivul pentru care vom apela de obicei la eantionare pentru a face apoi generalizri la nivelul populaiei. Dup ce datele au fost culese de la eantion i apoi prelucrate, scopul cercettorului este de a generaliza rezultatele la nivelul ntregii populaii din care a fost extras eantionul respectiv, altfel spus de a realiza inferene statistice (vezi 6.2.1 - Logica testrii ipotezelor, pag. 82, i 8.1 - Inferena statistic, pag. 106). Estimarea caracteristicilor unei populaii de interes pe baza unui eantion este unul dintre scopurile fundamentale ale statisticii infereniale, indiferent dac cercetarea aleas are la baz observaia, experimentul sau ancheta pe baz de chestionar. Pentru a realiza estimri, statisticienii au dezvoltat metode care se bazeaz pe cteva idei simple: (1) se presupune c datele sunt obinute pe baza analizei unui eantion extras aleator din cadrul unei populaii; (2) analiza acestui eantion va permite realizarea de inferene cu privire la populaie. O prim problem este ns c rareori putem obine cu adevrat n psihologie un eantion aleator. A doua problem este c n general am dori s extragem concluzii care s fie valabile i pentru alte populaii, nu doar pentru populaia din care am extras eantionul, dar statistica inferenial se aplic doar populaiei din care am extras eantionul studiat.

5. Statistica descriptiv

20

Marius Druga Metode de cercetare n psihologia educaiei


Cnd vorbim despre statistic, trebuie s facem delimitarea ntre statistica descriptiv (care cuprinde indici sumativi ai eantioanelor, a ceea ce s-a nregistrat sub form de date) i statistica inferenial (care face generalizarea de la eantioane la populaie pentru mai multe detalii, vezi capitolul Inferena statistic, 8.1 - Clarificri conceptuale, pag. 106-107). n text, distincia dintre statistica descriptiv i cea inferenial este uor de realizat. Cu alte cuvinte, statistica descriptiv prezint caracteristici ale eantionului, sub forma unor indici statistici diveri. De exemplu, putem s aflm media vrstei, vrsta minim i cea maxim, proporia brbailor i a femeilor, numrul celor cu studii superioare etc. Statistica inferenial n schimb, dei pornete tot de la date obinute la nivelul eantioanelor, urmrete generalizarea rezultatelor la populaiile din care au fost extrase eantioanele, folosind n acest scop logica probabilitilor. De exemplu, comparnd dou eantioane, putem demonstra c ele difer semnificativ. Statistica inferenial ne ajut s transpunem aceast concluzie la nivelul populaiilor i s afirmm, cu un anumit risc de a grei, c la rndul lor acestea sunt diferite. Pallant (2005) delimita cteva posibile utilizri ale statisticii descriptive: (1). descrierea caracteristicilor eantioanelor, n seciunea de Metodologie a raportului de cercetare (numrul participanilor, vrsta minim i maxim, media i abaterea standard a vrstei, procentul de brbai i femei, nivelul de colarizare sau orice alte informaii de interes); (2). verificarea variabilelor pentru a vedea dac ncalc asumpiile unor tehnici statistice pe care dorim s le utilizm (de obicei se calculeaz indici descriptivi ai unor variabile: media, abaterea standard, amplitudinea scorurilor, indicatorii de boltire i oblicitate); (3). oferirea unor rspunsuri generale la ntrebrile pe care le ridic cercetarea. Sumarizarea datelor obinute de la eantion se realizeaz n funcie de tipul variabilelor care au fost msurate: pentru variabilele numerice ne intereseaz s identificm: n jurul cror valori se aglomereaz datele. Acest lucru ne va arta dac avem multe msurri similare ale variabilei de interes. Indicatorii folosii n acest scop sunt reunii sub numele de indicatori ai tendinei centrale. Scopul lor este de a aproxima ct mai bine, printr-un singur numr, ntreaga distribuie a datelor. Cei mai utilizai indicatori ai tendinei centrale sunt media aritmetic i mediana. gradul de mprtiere (varian) a datelor sau ct de mult difer acestea ntre ele. Indicatorii folosii n acest scop sunt reunii sub numele de indicatori ai dispersiei. Cel mai utilizat este abaterea standard. pentru variabilele categoriale ne intereseaz s tim care este frecvena elementelor fiecrei modaliti a variabilei i proporia acestora, raportat la total. De exemplu, pentru variabila gustul iaurtului, ne intereseaz ci rspund cu foarte plcut, ci cu plcut etc., precum i ct la sut reprezint fiecare categorie, raportat la totalul subiecilor.

5.1. Indicatorii tendinei centrale


Sunt utilizai n cazul variabilelor numerice, pentru a arta unde se aglomereaz datele obinute de la eantion. Cei mai utilizai indicatori sunt media aritmetic, mediana i valoarea mod. 5.1.1. Media aritmetic Se calculeaz nsumnd toate valorile obinute i mprind suma obinut la numrul de cazuri. Se noteaz de obicei cu m. De exemplu, pentru un eantion cruia i calculm coeficientul d e 21

- pentru uz didactic inteligen putem obine valorile 110, 125, 98, 90 i 115. Media aritmetic se calculeaz nsumnd valorile (110+125+98+90+115 = 538) i mprind suma obinut la numrul de cazuri (538/5 = 107,6). Este unul dintre indicatorii cei mai utilizai, nu doar n rapoartele de cercetare, ci i n calculele mai complexe ale altor coeficieni. De exemplu, media intr n formula de calcul ai unor indicatori ai dispersiei. Un avantaj i n acelai timp dezavantaj al mediei este c poate fi uor manipulat algebric. Cu alte cuvinte, este puternic influenat de valorile extreme ale distribuiei. Relund exemplul de mai sus, ce s-ar ntmpla dac pe lng coeficienii pe care i-am prezentat am avea nc dou, foarte sczute s zicem 67 i 55. Media ar deveni (67+55+110+125+98+90+115)/7 = 94,28, o valoare mult mai mic dect cea anterioar. La fel, gndii-v c avei un lot de 7 elevi care merg la olimpiad, dintre care 6 iau nota 10 la faza judeean. Ct de mult ar scdea media notelor grupului dac unul ar lua doar nota 5? 5.1.2. Mediana Este valoarea central a unui ir de date ordonate sau acea valoare care mparte irul de date n dou: jumtate deasupra medianei, jumtate sub median. Se noteaz de obicei cu med. Presupunnd c avem la dispoziie notele obinute de 31 de elevi la un test de cunotine, pentru calculul manual al medianei ar fi nevoie n primul rnd de ordonarea datelor, ascendent sau descendent (de la 4 la 10 sau de la 10 la 4). S zicem c obinem urmtoarele date pentru variabila note colare: 4,7,8,10,9,8,10,4,7,7,8,8,9,10,6,7,5,4,4,8,8,10,5,8,7,10,4,5,8,8,6 Primul pas este s le ordonm, s zicem ascendent: 4,4,4,4,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,10,10,10,10,10 Al doilea pas este s gsim locul medianei. Locul medianei se identific dup formula (N+1)/2, unde N este numrul valorilor din ir. Avem 31 de valori, deci locul medianei este (31+1)/2 = 16. Cutm n irul de date ordonate valoarea care se afl pe locul 16; aceea va fi mediana: n cazul nostru, 8. Dac numrul valorilor din ir ar fi fost par, s zicem 30, locul medianei ar fi fost calculat dup aceeai formul: (30+1)/2 = 15,5. Cutm n irul de date valorile 15 i 16, iar apoi facem media aritmetic a acestora. n cazul nostru, valoarea de pe locul 15 este 7, iar de pe locul 6 este 8. Media lor aritmetic este 7,5, deci med = 7,5. Din fericire pentru noi, SPSS va calcula mediana mult mai repede dect v-a luat s citii acest fragment. Singurul lucru care va lua timp va fi introducerea datelor, n rest cteva click-uri cu mouseul dureaz maxim cteva secunde. Am oferit totui exemplele, att pentru medie, ct i pentru median, pentru a nelege logica aflat n spatele calcului acestora. Utilizarea mediei sau a medianei? Exist trei situaii cnd utilizarea medianei este mai avantajoas dect a mediei: (1). avem multe scoruri extreme sau distribuii asimetrice; n aceste situaii media nu este un indicator eficace, deoarece nu este reprezentativ pentru majoritatea distribuiei. Valoarea mediei este puternic afectat chiar i de o singur valoare mult mai mic sau mai mare dect restul (vezi exemplele anterioare). Mediana pe de alt parte este mai

22

Marius Druga Metode de cercetare n psihologia educaiei


puin influenat de valorile extreme, fiind astfel o msur mai robust a tendinei centrale. Adugarea unor valori extreme nu va afecta att de grav mediana ca media aritmetic. Pentru exemplificare, relum exemplul privind coeficienii de inteligen. Prin adugarea a dou valori extreme, media cobora de la 107,6 la 94,28. n schimb, mediana ar fi 110 n primul caz (fr valori extreme) i 98 n al doilea (cu valori extreme). Media scade cu 13,32 puncte, iar mediana cu 12. Pentru un eantion att de mic, poate diferena nu este spectaculoas, dar gndii-v ct de mare ar deveni aceasta n cazul unui eantion de cteva sute de subieci. (2). avem o variabil la care pentru un subiect sau mai muli nu avem nicio valoare, deoarece nu a terminat testul sau nu a rspuns la unii itemi; (3). avem date obinute cu ajutorul unor scale ordinale. Scalele ordinale permit stabilirea direciei relaiei dintre categoriile unei variabile (X este mai mare dect Y, Y este mai mare dect Z), dar nu i determinarea distanei dintre acestea. Mediana este compatibil cu acest tip de msurare deoarece este definit de direcie: jumtate dintre scoruri sunt mai mici dect mediana, iar cealalt jumtate mai mari. Concluzionnd, avantajul principal al medianei este c estimeaz rezonabil ceea ce multe persoane neleg cnd vorbesc despre centrul unei distribuii, fiind puin influenat de scorurile extreme. Ca dezavantaje majore ale medianei menionm c are proprieti statistice mai puin dezirabile dect ale mediei i c nu ntotdeauna este bine s ignorm valorile extreme. De exemplu, n situaia n care la un extemporal cei mai muli elevi iau note ntre 8 i 10, iar trei dintre ei iau 4, asta trebuie s ne spun ceva despre cei trei elevi. 5.1.3. Valoarea mod Este valoarea care apare cu cea mai mare frecven ntr-un ir de date, identificnd astfel punctele maxime ale unei distribuii. Se noteaz de obicei cu mod. Pentru exemplificare s lum acelai ir de date utilizat la calculul medianei: 4,4,4,4,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,10,10,10,10,10 Valoarea mod este 8, deoarece apare de cele mai multe ori. n termeni statistici, am spune c are frecvena cea mai mare. Sunt cazuri n care avem mai multe valori mod. Aceasta nseamn c mcar dou valori au aceeai frecven (este cazul distribuiilor bimodale vezi 7.1 - Indicatori ai formei distribuiei, pag. 90-93). n astfel de situaii, cercettorul poate s aleag acea valoare mod care descrie cel mai bine tendina central a datelor (unde se adun datele), sau poate raporta toate valorile mod. O strategie posibil este raportarea acelei valori mod care este cea mai apropiat de medie. De exemplu, dac n irul de mai sus am fi avut trei valori mod, respectiv 7,8 i 10, pe care am fi raportat -o? Media aritmetic este 7,16, iar mediana 8. Ca valoare mod, am putea raporta valoarea 7, sau pe toate trei: 7, 8 i 10. Avantajul raportrii valorii mod este c permite reliefarea scorului cel mai des ntlnit i c nu este influenat de scorurile extreme. De aceea se recomand utilizarea acestui indicator pentru datele obinute cu ajutorul scalelor nominale, care nu msoar nici direcia i nici distana dintre categoriile variabilei. Valoarea mod mai este raportat uneori cnd dorim s oferim mai multe informaii despre o distribuie, deoarece identific vrfurile acesteia. Dezavantajul major al operrii cu valoarea mod este c ignor complet valorile extreme i astfel este posibil s nu reprezinte foarte bine o proporie destul de mare a scorurilor. Acesta este i motivul pentru care este rar raportat n articolele de specialitate. 23

- pentru uz didactic 5.2. Indicatorii dispersiei


Sunt acei indicatori care arat ct de mprtiate sunt datele n jurul mediei. Cei mai utilizai sunt variana, abaterea standard, amplitudinea, valoarea minim, valoarea maxim, intervalul intercvarticilic i eroarea standard a mediei. Gravetter i Wallnau (2009) afirmau c o bun msurare a dispersiei ndeplinete urmtoarele scopuri: (1). descrierea distribuiei; Indicatorii dispersiei ne arat dac datele se aglomereaz ntr-un interval mai limitat sau se mprtie ntr-un interval mai larg. Astfel putem ti ct de mare este distana de la un scor la altul, de la un scor la medie sau de la scorul cel mai mic la scorul cel mai mare. De exemplu, tim c pentru populaia general distribuia nlimii adulilor se aglomereaz pe un interval de +/- 20 de cm n jurul mediei. (2). realizarea estimrilor. Anumii indicatori ai dispersiei ne ajut s calculm ct de mare este eroarea pe care o realizm utiliznd datele unui eantion pentru a reprezenta populaia. 5.2.1. Variana Este un indicator al mprtierii, artnd ct de mult se abat datele de la valoarea central. Se noteaz cu 2. Cu ct variana este mai mare, cu att scorurile sunt mai mprtiate. Se msoar n uniti care sunt ptratele celor n care se msoar variabila. Principalul dezavantaj al varianei este c arat ct de mult se mprtie scorurile i nu cu ct. Nu insistm asupra modului de calcul, deoarece n puine cazuri vom realiza manual calculul varianei. 5.2.2. Abaterea standard Este indicatorul cel mai utilizat al mprtierii i arat cu ct se mprtie datele n jurul valorii centrale. Se noteaz cu . Ca mod de calcul, se obine extrgnd radicalul din varian. Unul dintre avantajele ei este c se msoar n aceeai unitate ca i media. Pentru o variabil cu distribuie normal, 68,27% dintre valori se afl n intervalul medie +/ - o abatere standard (m +/), iar 95,44% din cazuri se afl n intervalul medie +/- dou abateri standard (m +/- 2) (v recomandm s citii cu atenie 7.2 - Proprietile distribuiei normale. Scorurile standardizate z, pag. 93). De exemplu, s presupunem c variabila note colare utilizat pentru calculul medianei are distribuie normal. n acest caz, n intervalul m+/- se gsesc 68,27% din cazuri. Media fiind 7,16, iar abaterea standard 2,00 (credei-ne pe cuvnt deocamdat), nseamn c majoritatea notelor sunt ntre 5 i 9. 5.2.3. Valoarea minim i valoarea maxim Sunt valorile cele mai mici, respectiv cele mai mari dintr-un ir de date. Se noteaz cu min, respectiv max. n exemplul nostru, min = 4, iar max = 10. 5.2.4. Amplitudinea Reflect distana dintre cea mai mare i cea mic valoare din irul de date i este utilizat dac msurarea s-a realizat cu scale numerice sau ordinale. Este evident influenat complet de valorile extreme, ignornd celelalte valori ale distribuiei. Astfel, o distribuie n care avem un singur scor foarte mare sau foarte mic va avea o amplitudine mare, chiar dac restul valorilor sunt de fapt

24

Marius Druga Metode de cercetare n psihologia educaiei


aglomerate ntr-un interval ngust. n exemplul notelor colare, folosit pn acum, amplitudinea este de 6 (max min = 10 4 = 6). Chiar dac am fi avut 30 de note de 10 i doar una de 4, amplitudinea ar fi fost tot 6, deci sunt ignorate complet valorile din interiorul distribuiei. 5.2.5. Intervalul intercvartilic Este un indicator care evit influena masiv a valorilor extreme. Se obine eliminnd 25% dintre scorurile cele mai mici i 25% din scorurile cele mai mari: practic rmnem cu 50% din distribuie. Dezavantajul su este c e prea puin influenat de valorile extreme. 5.2.6. Eroarea standard a mediei S presupunem c pentru a studia o anumit variabil (s zicem greutatea) extragem dintr -o populaie mai multe eantioane. Msurnd greutatea persoanelor care le compun, vom constata c media eantioanelor difer: s zicem pentru eantionul 1 obinem o medie de 87,25, pentru al doilea 95,4 .a.m.d. Vom avea astfel attea valori ale mediei greutii cte eantioane avem. Aceste valori pot la rndul lor s formeze un eantion eantionul mediilor greutilor, cruia putem s-i calculm o nou medie. Eroarea standard a mediei este abaterea standard a acestui eantion nou forma t, exprimnd eroarea pe care o comitem utiliznd media eantioanelor pentru a estima media populaiei (vezi Capitolul 8 - Inferena statistic, pag. 106 i urm). Uneori se face confuzie ntre abaterea standard i eroarea standard a mediei. Eroarea standard a mediei arat precizia cu care estimm adevrata medie a populaiei i descrete pe msur ce eantionul crete. Explicaia este simpl: pur i simplu este mai probabil ca media unui eantion mare s fie mai apropiat de media populaiei dect media unui eantion mic. Abaterea standard pe de alt parte arat ct de mare este variana unei variabile i are mai puin legtur cu volumul eantionului. Definiii Variana este un indicator al mprtierii care arat ct de mult se abat datele de la valoarea central. Abaterea standard este cel mai utilizat indicator al mprtierii, artnd cu ct se mprtie datele n jurul valorii centrale. Valoarea minim este valoarea cea mai mic dintr-un ir de date. Valoarea maxim este valoarea cea mai mare dintr-un ir de date. Amplitudinea reflect distana dintre cea mai mare i cea mai mic valoare din irul de date. Intervalul intercvartilic se obine eliminnd 25% din scorurile cele mai mari i 25% din scorurile cele mai mici, rmnnd cu 50% din distribuie. Eroarea standard a mediei este abaterea standard a unui eantion de medii, exprimnd eroarea pe care o comitem utiliznd media eantioanelor pentru a estima media populaiei.

n concluzie, indicii descriptivi sunt utilizai pentru a descrie un set de date i din acest punct de vedere pot oferi o perspectiv general asupra acestora. Cercetarea nu se poate opri ns la raportarea acestor indici, deoarece putem ajunge la formularea unor generalizri forate. De exemplu, dac media notelor colare a unui eantion este 7,16, iar a altuia este 7,50, ce putem spune despre diferena respectiv? A aprut din ntmplare sau reflect diferene reale? Statistica inferenial ne poate ajuta s rspundem acestei ntrebri. 25

- pentru uz didactic 5.3. Frecvenele


Pentru variabilele categoriale de obicei se utilizeaz raportarea frecvenelor (notate cu f). Astfel putem s aflm cte persoane au rspuns, precum i procentul persoanelor din diferite grupe (ci brbai i cte femei, ci cstorii etc.) Nu are sens s calculm indicatori ai tendinei centrale i ai mprtierii n aceste cazuri. Relum un exemplu prezentat ntr-un capitol anterior (Capitolul 3 - Ingredientele analizei statistice. Tipuri de date, pag. 29). Presupunnd c unui eantion de subieci i se cere s evalueze gustul iaurtului, am putea obine distribuia frecvenelor prezentat n tabelul urmtor:
gustul iaurtului f % foarte plcut 28 14,5% plcut 44 22,79% nici prea plcut, nici prea neplcut 52 26,94% neplcut 15 7,77% foarte neplcut 24 12,43% nu tiu 30 15,54%

Pe baza acestui tabel, putem s afirmm c din totalul subiecilor (193), 28 de persoane (14,5%) au evaluat gustul iaurtului ca fiind foarte plcut. Definiie Distribuia frecvenelor este o distribuie n care valorile variabilei sunt ncadrate n grafice sau tabele n funcie de frecvena lor de apariie.

Ce s-ar ntmpla ns dac am complica lucrurile, respectiv am raporta rspunsurile subiecilor n funcie de apartenena de gen? O astfel de procedur ar oferi date suplimentare despre adresabilitatea iaurtului respectiv, sub forma unui tabel de contingen. Definiie Tabelele de contingen evideniaz sub forma unei matrici relaia dintre dou sau mai multe variabile categoriale. Csuele unui astfel de tabel sunt mutual exclusive: o valoare poate fi ncadrat unei singure csue.

n exemplul nostru, tabelul de contingen ar putea arta astfel:


Gustul iaurtului nici prea plcut, neplcut nici prea neplcut 26 6 13,47% 3,10% 26 9 13,47% 4,67%

f % f F % M

foarte plcut 20 10,35% 8 4,15%

plcut 35 18,12% 9 4,67%

foarte neplcut 10 5,17% 14 7,26%

nu tiu 15 7,77% 15 7,77%

Totalul frecvenelor f dintr-un tabel de contingen reprezint numrul persoanelor care au participat la cercetare (193 n cazul nostru). Fiecare csu reprezint o intersecie a dou variabile; de exemplu, csua din dreapta jos cuprinde femeile care au rspuns nu tiu cnd au evaluat gustul iaurtului. Kirk (2008) distingea cinci situaii cnd se utilizeaz tabelele de contingen:

Gen

26

Marius Druga Metode de cercetare n psihologia educaiei


(1). studii transversale. Un grup de participani este clasificat n funcie de dou criterii (cele dou criterii vor deveni coloanele, respectiv rndurile tabelului - precum n exemplul anterior); (2). studii prospective. Sunt utilizate dou grupuri de participani, dintre care unul este expus unor condiii extreme, iar cellalt nu (aceasta este prima variabil). Se poate identifica incidena mai crescut a mbolnvirilor (a doua variabil); (3). studii retrospective. Sunt utilizate dou grupuri de participani, n funcie de prezena sau nu a unei boli (prima variabil). Apoi se evalueaz dac grupele au fost sau nu expuse unor factori de risc (a doua variabil). Diferenele fa de categoria anterioar sunt la nivelul abordrii teoretice; (4). experimente. Se utilizeaz un singur grup de participani. Jumtate primet e un tip de tratament, iar cealalt jumtate alt tip sau deloc (prima variabil). Dup o perioad de timp, se stabilete cine a dobndit sau nu o anumit boal (a doua variabil). (5). evaluarea acurateei unui test de diagnosticare. Se utilizeaz dou grupuri de participani. Unul dintre grupuri are boala care ne intereseaz, cellalt nu (prima variabil). Se face un test pentru toat lumea i se trec n tabel rezultatele testului (pozitiv/negativ) (a doua variabil).

5.4. Alegerea indicilor descriptivi potrivii pentru datele noastre


Un prim criteriu important este tipul variabilelor utilizate (numerice sau categoriale). Pentru variabilele numerice, se raporteaz indicatorii tendinei centrale i ai mprtierii, iar pentru variabilele categoriale frecvenele. Pentru acelai set de date numerice pot fi calculai ns mai muli indici ai tendinei centrale. Este posibil ca ei s nregistreze valori foarte apropiate (n cazul distribuiilor normale), dar exist i situaii n care valorile difer foarte mult (n cazul distribuiilor nongaussiene, bimodale etc.) Care dintre ei vor fi calculai? Decizia se bazeaz n principal pe forma distribuiei variabilelor respective: media i abaterea standard pentru variabile cu distribuie normal, mediana pentru var iabile cu distribuie nongaussian.

6. Testarea ipotezelor
Smith et al (2005) evideniau doi pai eseniali ai cercetrii tiinifice: generarea unei ipoteze tiinifice i testarea acesteia.

6.1. Generarea ipotezelor tiinifice


Conform autorilor citai, ipoteza este o afirmaie care poate fi testat n legtur cu un domeniu de interes. De exemplu, am putea construi ipoteza c vizionarea filmelor horror crete pe termen scurt (cteva ore dup vizionare) reactivitatea emoional (efectele sunt vizibile cnd trosnete parchetul, pornete brusc frigiderul etc.) Cel mai probabil cile prin care am ajuns la aceast ipotez sunt diverse: observarea natural a unor astfel de situaii, experiena personal, citirea unor articole de specialitate despre acest subiect etc. Dei observaia natural este mai la ndemn, sursa cea mai important de ipoteze tiinifice rmne teoria tiinific, definit pe scurt ca set de concepte abstracte dezvoltate n legtur cu fapte sau evenimente diverse, n scopul explicrii acestora (Engler, 1999) sau set de ipoteze interconectate 27

- pentru uz didactic despre un anumit fenomen (Smith et al, 2005). Utilizarea repetat a termenului tiinific subliniaz faptul c metodele de cercetare utilizate n culegerea datelor sunt neutre (nu favorizeaz niciuna dintre ipoteze) i sigure (alte persoane calificate pot repeta studiul pentru a obine rezultate similare) . Dincolo de ineditul fiecreia, utilitatea teoriilor depinde de satisfacerea ctorva cerine eseniale: s fie testabile; s stimuleze cercetarea prin postulatele lor; s permit organizarea contraexperimentelor; s clarifice i s explice datele obinute pe baza cercetrii, organizndu -le ntr-un cadru coerent; s ajute la nelegerea i predicia comportamentelor, la modificarea compor tamentelor i emoiilor. Din acest punct de vedere, Clocotici i Stan (2001, p. 105) subliniau c din punct de vedere metodologic calitatea esenial a unei teorii tiinifice este aceea c poate fi, direct sau indirect, confirmat de datele empirice. Teoria trebuie s fie capabil aadar s genereze ipoteze care vor fi apoi testate, devenind tiinific n msura n care poate face proba respingerii sale. De exemplu, Sokolov explica funcionarea ateniei involuntare prin legturile funcionale dintre cortex i formaiunea reticulat (apud Cioar, 2006). Informaia sosete la cortex pe dou ci, una direct, iar cealalt prin intermediul formaiunii reticulate. Mesajul este analizat n zonele specifice de proiecie, iar dac la acest nivel exist un model acceptor al stimulului receptat, cortexul inhib circuitul secundar, blocnd activarea formaiunii reticulate. Invers, cnd cortexul nu recunoate inputul proaspt sosit, el nu va mai bloca mesajul venit prin intermediul formaiunii reticulate, ceea ce va suplimenta activarea cortical deja existent. n acest fel, stimulul receptat va beneficia de resurse suplimentare de procesare, impunndu-se prioritar n cmpul contiinei (atenie involuntar). O astfel de teorie ar putea sta la baza formulrii unei ipoteze precum cea care afirm c vizionarea filmelor horror duce la creterea reactivitii emoionale.

6.2. Testarea ipotezelor tiinifice


Experimentul este considerat una dintre cele mai utile metode de testare a ipotezelor. Cercettorii ncearc s controleze ct mai bine condiiile desfurrii experimentelor, pentru a msura ct mai exact variabilele i a descoperi relaiile dintre acestea. Cercetarea va lucra n paralel cu o pereche de ipoteze, reciproc exclusive: specific i nul. Ipoteza specific afirm c exist o asociere, o modificare sau o diferen la nivelul variabilelor studiate. Se mai numete ipotez alternativ. Poate s ia mai multe forme, n funcie de cerinele de publicare, de specificul cercetrii etc. De exemplu: Exist diferene semnificative ntre brbai i femei n ceea ce privete capacitatea de orientare spaial. Exist o asociere direct ntre temperatura exterioar i rata criminalitii. Tratamentul experimental duce la scderea frecvenei migrenelor. Ipoteza nul este ceea ce calculele statistice testeaz de fapt. Ea afirm c populaiile / eantioanele pe care le comparm sunt similare, sau cu alte cuvinte orice diferen dintre ele se datoreaz ntmplrii i nu unui anumit factor. n designurile care presupun comparaia ntre eantioane, ipoteza nul este c mediile populaiilor sunt de fapt egale (n rarele ocazii cnd este exprimat n text, formularea obinuit este diferenele dintre i se datoreaz ntmplrii). Calculele statistice testeaz aceast ipotez (la nivelul eantioanelor extrase), iar dac se dovedete fals nseamn c de fapt putem susine existena diferenelor dintre populaii, cu un anumit risc de a grei (vezi mai departe Logica testrii ipotezelor, pag. 82). Pentru ipotezele specifice enunate anterior, ipotezele nule se pot formula astfel:

28

Marius Druga Metode de cercetare n psihologia educaiei


Diferenele dintre brbai i femei n ceea ce privete capacitatea de orientare spaial se datoreaz ntmplrii. Asocierea dintre temperatura exterioar i rata criminalitii se datoreaz ntmplrii. Modificarea ratei migrenelor n urma tratamentului experimental se datoreaz ntmplrii. Din punct de vedere statistic, n primul caz se testeaz de fapt dac populaiile din care au fost extrase eantioanele de brbai i femei au medii egale n ceea ce privete capacitatea de orientare spaial. n cazul al treilea se testeaz dac rata migrenelor nainte de tratament este egal cu rata migrenelor de dup tratament. De vreme ce ipoteza nul i ipoteza specific se exclud reciproc, dac putem dovedi c ipoteza nul este fals atunci putem s acceptm ipoteza nul, cu un anumit risc de a grei. De obicei, n lucrrile tiinifice publicate apare doar ipoteza specific, fiind de la sine neles c se testeaz ipoteza nul. 6.2.1. Logica testrii ipotezelor Procedurile statistice testeaz de fapt ipoteza nul, cuantificnd ansele de a obine rezultatele respective dac ipoteza nul ar fi adevrat. Pentru muli pare ciudat atenia excesiv acordat ipotezei nule. La urma urmei, scopul celor mai multe studii este de a arta c exist diferene ntre eantioane, c variabila independent a avut efect etc. Motivul pentru care ne concentrm asupra ipotezei nule este o urmare a limitelor logicii infereniale. Argumentarea pe care o prezentm mai departe pare complicat, dar n fapt nu este. Trebuie doar citit cu mare atenie. Din punct de vedere logic, este mult mai uor de demonstrat c o ipotez general este fals dect c este adevrat. Acest principiu este uor de demonstrat cu ajutorul urmtorului exemplu. S presupunem c formulm ipoteza specific Toi cinii au patru picioare i intenionm s o testm, utiliznd un eantion de 10 cini. Dac toi cinii care fac parte din eantion au patru picioare, nseamn c toi cinii din lume au patru picioare? Va fi nevoie de alte i alte eantioane, pn la epuizarea populaiei, pentru a demonstra c ipoteza este adevrat. Dac ns n eantionul nostru un singur cine are trei picioare, am demonstrat deja c ipoteza este fals. Deci este mult mai uor s demonstrm c o ipotez este fals dect c este adevrat (Gravetter i Wallnau, 2009). Testarea ipotezelor folosete acest principiu logic pentru a-i atinge scopul. Formulm ipoteza nul (Diferena dintre eantioane se datoreaz ntmplrii) i ncercm apoi s demonstrm c este fals. De vreme ce ipoteza specific i ipoteza nul se exclud reciproc, nseamn c dac ipoteza nul este fals, cealalt trebuie s aib anse mari s fie adevrat. Pentru a fi coreci din punct de vedere statistic, niciodat nu vom spune c ipoteza nul este adevrat. Pentru clarificarea suplimentar a motivului pentru care n cercetare testm ipoteza nul i nu afirmm niciodat c este adevrat, oferim nc un exemplu, adaptat dup Lungu (2010). Urmrii urmtorul ir de raionamente: A B: A B Berea tradiional (A) are () gust amrui (B). Silva este o bere tradiional. De aceea, Silva are gust amrui.

29

- pentru uz didactic Raionamentul este corect pn aici. Ce se ntmpl ns dac inversm consecina (B) cu premisa (A)? Raionamentul ar arta astfel: A B: Berea tradiional (A) are () gust amrui (B). B Iat ceva ce are gust amrui. A? De aceea, acel ceva este o bere tradiional. Raionamentul este evident greit, acel ceva poate fi ciocolat amruie sau Paracetamol. Eroarea pe care am realizat-o se numete afirmarea consecinei. Transpunerea acestui raionament greit n termenii ipotezelor statistice ar arta astfel: A B: B A? Dac ipoteza nul este adevrat, atunci pragul de semnificaie este mai mare de 0,05. Pragul este mai mare de 0,05. De aceea, ipoteza nul este adevrat.

n exemplul cu berea, n cazul raionamentului greit nu aveam voie s spunem Acel ceva este bere, deoarece era greit. La fel, n exemplul anterior nu avem voie s spunem Ipoteza nul este adevrat, pentru c este tot greit. Logica vine ns n sprijinul statisticii, printr-un alt tip de regul, pe care o prezentm sub form de exemplu: A B: nonB nonA Berea tradiional (A) are () gust amrui (B). Iat ceva ce nu are gust amrui. De aceea, acel ceva nu este bere Silva.

n termenii ipotezelor statistice, regula ar fi transpus astfel: A B: nonB nonA Dac ipoteza nul este adevrat, atunci pragul de semnificaie este mai mare de 0,05. Pragul de semnificaie nu este mai mare de 0,05 (este mai mic). De aceea, ipoteza nul este fals.

Dac ipoteza nul este fals, nseamn c ipoteza specific trebuie s fie adevrat. Aceasta este logica testrii ipotezelor n cercetarea tiinific. Gravetter i Wallnau (2009) asemnau aceast procedur cu aceea a unui proces cu jurai:
Logica testrii ipotezelor ncepe cu formularea ipotezei nule, care susine c relaia dintre variabile se datoreaz hazardului; Procesul cu jurai ncepe cu ipoteza nul care susine c acuzatul este nevinovat (pn la proba contrarie) prezumia de nevinovie;

cercetarea tiinific i propune s caute Poliia caut dovezi pentru a arta c dovezi pentru a arta c exist diferene acuzatul este vinovat; ntre grupe, c variabila independent are efect, c variabilele se asociaz etc.; n ambele cazuri, scopul este respingerea ipotezei nule.

30

Marius Druga Metode de cercetare n psihologia educaiei


dac exist suficiente dovezi, cercettorul respinge ipoteza nul i concluzioneaz c exist diferene, c variabila independent are efect, c variabilele se asociaz etc. Dac exist suficiente dovezi, juriul respinge ipoteza nul i concluzioneaz c acuzatul este vinovat.

Sava (2004) sumarizeaz cinci caracteristici ale testrii ipotezelor: (1). se pornete de la premisa c ipoteza nul este adevrat; (2). ipoteza nul nu poate fi adeverit, ci doar respins; (3). decizia de a respinge ipoteza nul se ia pe baza unui prag de semnificaie (vezi 6.3 - Pragurile de semnificaie, pag. 85); (4). ipoteza nul nu nseamn neaprat ipoteza absenei Foarte muli cercettori neleg prin ipoteza nul absena corelaiei sau a diferenei dintre medii. Sava subliniaz ns c ipoteza nul nu se formuleaz negnd ipoteza specific, deoarece se ncalc logica inferenei. De exemplu, dac ipoteza specific se formuleaz astfel: Exist diferene ntre i ntre, ipoteza specific nu se formuleaz prin negare (Nu exist diferene ntre i ntre). Exprimarea corect este Diferenele dintre i se datoreaz ntmplrii. (5). testarea ipotezelor privete populaiile din care au fost extrase eantioanele studiate. 6.2.2. Ipoteze bilaterale i unilaterale n unele situaii este bine ca ipoteza s specifice direcia relaiei dintre va riabile, indiferent dac relaia este una cauzal sau de asociere, ori este vorba despre diferene ntre eantioane. Dac se precizeaz sensul relaiei dintre variabile, vorbim despre ipoteze unidirecionale sau unilaterale. De exemplu: Brbaii fumeaz mai mult dect femeile (pentru diferene ntre grupuri); Nivelul angajamentului organizaional crete dup intervenia specialistului (pentru studii experimentale); Exist o relaie de asociere pozitiv ntre numrul de goluri nscrise pe meci i numru l meciurilor ctigate (pentru studii corelaionale). O ipotez unilateral se formuleaz dac datele anterioare, limitrile fizice sau simul comun ne spun c dac ar exista o diferen ntre grupuri, aceasta nu se poate manifesta dect ntr -o direcie. Alegerea unei ipoteze unilaterale este util printre altele i pentru c exist anse mai mari ca ipoteza s fie sprijinit (Sava, 2004), deoarece un test unilateral njumtete gradul de semnificaie De exemplu, riscul de a grei de 3% n cazul unui test bilateral se transform ntr-unul de 1,5% n cazul unui test unilateral. Alegerea unei ipoteze unilaterale ridic ns o problem: ce se ntmpl dac observm o diferen mare ntre medii, dar nu n direcia ateptat, ci invers? Pentru a fi riguroi, ar trebui s concluzionm c diferenele se datoreaz hazardului, indiferent ct de mare este diferena nregistrat. Acesta este unul dintre motivele pentru care sunt preferate ipotezele bilaterale. Dac direcia relaiei nu este precizat, vorbim despre ipoteze bidirecionale sau bilaterale. De exemplu:

31

- pentru uz didactic Exist diferene ntre brbaii fumtori i femeile fumtoare n ceea ce privete numrul igrilor fumate pe zi (pentru diferene ntre grupuri); Exist diferene ntre pretest (naintea inerveniei) i posttest (dup intervenie) n ceea ce privete nivelul angajamentului organizaional (pentru studii experimentale); Exist o relaie de asociere ntre numrul de goluri nscrise pe meci i numrul meciurilor ctigate (pentru studii corelaionale).

6.3. Pragurile de semnificaie


Scopul principal al testrii semnificaiei este de a stabili dac un rezultat ateptat este plauzibil. Cutarea unui prag de semnificaie ct mai sczut nu trebuie ns s devin un scop n sine, deoarece indici statistici foarte mici pot fi semnificativi dac eantionul este foarte mare. Un indice statistic trebuie aadar s nregistreze o valoare suficient de mare pentru a avea i importan practic, i nu s fie doar semnificativ n accepiunea strict statistic. Prin convenie, pragurile de semnificaie utilizate de obicei n statistic sunt de 0,05 i 0,01, care reprezint 5%, respectiv 1% anse de a obine rezultatele respective n condiiile n care ipoteza nul ar fi adevrat. Cele dou valori corespund unor scoruri z de 1,96, respectiv 2,58 (vezi 7.2 Proprietile distribuiei normale. Scorurile standardizate z, pag. 93, precum i Capitolul 8 Inferena statistic, pag. 106 i urm.) Pragul alpha ofer un criteriu important pentru interpretarea unui test statistic. Rigorile cercetrii tiinifice solicit ca rezultatele testului s fie semnificativ mai mari dect cele obinute din ntmplare. De aceea rezultatele testelor statistice sunt ntotdeauna nsoite de pragurile de semnificaie corespunztoare, de exemplu [F (4,200) = 2,45 , p < 0,05]. Pragul alpha mai mic de 0,05 indic faptul c este puin probabil (anse mai mici de 5%) ca rezultatele s se datoreze ntmplrii. Astfel, un rezultat semnificativ i permite cercettorului s afirme, cu un risc de a grei mai mic de 5%, c diferenele sunt reale. Pe de alt parte, un rezultat cu un prag de semnificaie de peste 0,05 nu arat neaprat c efectul investigat este inexistent. Situaia se poate datora eantionului redus sau varianei (mprtierii) ridicate a datelor. n oricare dintre cazuri efectul ar putea fi de fapt prezent, dar datele nu reuesc s ofere dovezi statistice ale existenei sale. De exemplu, testele neparametrice au o putere mai redus dect cele parametrice de a detecta diferenele mici dintre eantioane, mai ales dac volumul acestora este redus. 6.3.1. Semnificativ i foarte semnificativ statistic n unele studii obiectivul cercetrii corespunde ipotezei specifice. Alteori ns testarea ipotezelor este doar o parte preliminar a analizei statistice, rezultatele i pragurile lor de semnificaie fiind doar fundamentul pe care se va cldi explicaia fenomenului investigat. Cnd se interpreteaz un coeficient statistic i pragul su de semnificaie, exist un termen care a intrat deja n limbajul comun al statisticii: semnificativ statistic. Sintagma este seductoare i uor de interpretat greit. Se spune despre un rezultat c este semnificativ statisticdac o tendin a datelor poate fi acceptat ca suficient de substanial pentru a ne baza pe ea (Howitt i Cramer, 2006). ntr-o definiie paralel, putem spune despre un rezultat c este semnificativ statistic dac este puin probabil s fi aprut din ntmplare.

32

Marius Druga Metode de cercetare n psihologia educaiei


Intuitiv, am putea crede c un prag de semnificaie de 0,0001 este mai semnificativ statistic dect unul de 0,03. Utiliznd definiia strict a pragurilor de semnificaie, acest lucru nu este corect. Odat ce am ales s lucrm cu un anumit prag de semnificaie, s zicem 0.05, orice rezultat este fie semnificativ, fie nesemnificativ statistic. Unii autori nu sunt ns att de rigizi, fcnd referire la rezultate ca fiind foarte semnificative sau extrem de semnificative cnd valoarea pragului de semnificaie este foarte mic. n aceeai idee, un prag de semnificaie de 0,06 nu ar trebui interpretat ca o tendin ca diferenele s fie semnificative statistic.

6.4. Tipuri de erori


Atta vreme ct ne bazm pe inferena statistic, mereu va exista riscul de a ajunge la concluzii greite, chiar dac aparent lucrurile stau bine (pragul de semnificaie obinut este mai mic de 0,05). Dou sunt erorile pe care le putem comite, uor de reinut dup numele lor: eroarea de tip I i eroarea de tip II. 6.4.1. Eroarea de tip I Se refer la respingerea ipotezei nule cnd de fapt aceasta este adevrat (ceea ce se numete fals pozitiv). Cu alte cuvinte, este posibil s obinem praguri de semnificaie mai mici de 0,05, dar acest lucru s se datoreze ntmplrii. Care este explicaia? Prin derularea mai multor teste statistice utiliznd aceleai date, exist o probabilitate ridicat ca mcar pentru una dintre comparaii s obinem un prag de semnificaie mai mic de 0,05 (de exemplu, pentru 10 teste probabilitatea este de 40%). O soluie posibil este scderea pragului alpha la care dorim s raportm rezultatele la o valoare mai mic de 0,05, astfel nct s micorm ansele de a comite eroarea de tip I. n acest sens, putem apela la corecia Bonferroni. Pentru a o aplica, trebuie s tim cte comparaii sau corelaii am realizat folosind acelai set de date. De exemplu, dac msurm variabila greutate pentru un eantion, apoi datele respective le comparm cu acelea obinute de la alte patru eantioane, este important de tiut de cte ori folosim acelai set de date pentru comparaie (n cazul nostru, de patru ori). Cu ct avem mai multe comparaii, cu att cresc ansele de a obine rezultate semnificative din ntmplare. Corecia Bonferroni se aplic mprind pragul alpha de 0,05 la numrul de comparaii realizate. n exemplul nostru, noul prag alpha ar fi de 0,05/4 = 0,0125. Vom considera ca fiind semnificative doar acele rezultate care au un prag de semnificaie mai mic dect noul prag alpha. Cercettorul are astfel posibilitatea s minimizeze statistic riscul apariiei erorii de tip I, deoarece corecia Bonferroni l poate ajuta s selecteze o nou valoare a pragului de semnificaie. Cel puin dou implicaii practice reies de aici: n compararea a trei sau mai multe grupuri, nu se apeleaz la o serie de teste t, ci la One-Way ANOVA, urmat de postteste (care iau n calcul toate comparaiile ntre grupe); dac desfurm mai multe analize statistice folosind aceleai seturi de date vom obine probabil cteva valori p mai mici de 0,05. Acestea se pot datora ns ntmplrii. Chiar dac rezultat ele par a duce la ipoteze interesante, este nevoie de un alt studiu, cu alte date, care s testeze aceste ipoteze. 6.4.2. Eroarea de tip II Apare cnd ipoteza nul nu este respins de cercettor, dei ar fi trebuit, ea fiind de fapt fals (ceea ce se numete fals negativ). Cu alte cuvinte, este posibil s obinem praguri de semnificaie de peste 0,05, dar de fapt mediile grupurilor comparate s difere substanial. 33

- pentru uz didactic Cnd o cercetare ajunge la concluzia c nu exist diferene semnificative statistic, nu trebuie s credem neaprat c tratamentul sau intervenia nu a avut efect. Este posibil ca un efect minim s existe, dar nu a fost detectat de testul statistic din cauza eantionului mic sau a varianei prea mari a datelor. Afirmnd c nu exist diferene ntre grupurile comparate, cnd de fapt acestea exist, comitem ceea ce se numete eroarea de tip II. n interpretarea unor astfel de rezultate, trebuie s ne ntrebm ct de mare este puterea cercetrii n a identifica diferenele menionate n ipotez, dac acestea exist. Puterea cercetrii depinde de mrimea eantionului i de variana intragrup, cuantificat de abaterea standard. n mod ideal, ceea ce dorim este ca procedura statistic pe care o utilizm s ne spun ct mai corect dac exist de fapt diferene ntre eantioane. Este ceea ce se numete puterea unui test. Procedurile statistice difer n ceea ce privete aceast calitate. Testele parametrice sunt mai puternice dect echivalentele lor neparametrice, dar exist i ali factori de care trebuie s inem seama, cum ar fi de exemplu mrimea eantionului. Dup Stevens (1996), cnd eantionul este suficient de mare (mai mult de 100 de participani), puterea testului nu este o problem (apud Pallant, 2005). n studiile cu eantioane mici ns crete riscul de a obine rezultate nesemnificative, datorit puterii sczute a testelor. Exist autori care propun chiar creterea pragului alpha la 0,10 sau 0,15 pentru a compensa acest lucru. n concluzie, cele dou tipuri de erori reprezint oarecum capete ale unei axe. ncercnd s controlm eroarea de tip I (s scdem valoarea pragului alpha cu care dorim s lucrm, astfel nct s eliminm diferenele care apar din ntmplare), cresc ansele de a comite eroarea de tip II (de a afirma c diferenele sunt datorate ntmplrii, cnd de fapt ele sunt reale). Raportul dintre eroarea de tip I, eroarea de tip II i variantele corecte poate fi ilustrat prin acelai exemplu al procesului judiciar:
Decizia de acceptare a ipotezei nule consecina: eliberm acuzatul Ipoteza nul este adevrat, deci acuzatul este nevinovat Ipoteza nul este fals, deci acuzatul este vinovat decizie corect acuzatul este nevinovat i este eliberat eroarea de tip II acceptm ipoteza nul, dei nu ar fi trebuit eliberm acuzatul, chiar dac este vinovat Decizia de respingere a ipotezei nule consecina: condamnm acuzatul eroarea de tip I respingem ipoteza nul, dei nu ar fi trebuit acuzatul este condamnat pe nedrept

decizie corect acuzatul este vinovat i este condamnat

(1). n csua din stnga sus, avem situaia n care acceptm ipoteza nul, aceea c acuzatul este nevinovat, i el chiar este nevinovat. Decizia de a-l elibera este deci corect. (2). n csua din dreapta jos, avem situaia n care respingem ipoteza nul (aceeai, conform creia acuzatul este nevinovat), iar el chiar este vinovat. Decizia de a-l condamna este din nou corect. (3). n csua din dreapta sus este ilustrat eroarea de tip I: respingem incorect ipoteza nul, acuzatul fiind de fapt nevinovat, i l condamnm. n statistic, am spune c exist diferene ntre eantioane, cnd de fapt acestea se datoreaz ntmplrii. (4). n csua din stnga jos este ilustrat eroarea de tip II: acceptm incorect ipoteza nul, acuzatul fiind de fapt vinovat, i l eliberm. n statistic, am spune c diferenele dintre eantioane se datoreaz ntmplrii, cnd de fapt sunt reale.

34

Marius Druga Metode de cercetare n psihologia educaiei 6.5. Mrimea efectului


Utilizarea procedurilor statistice ne permite s aflm care sunt ansele ca rezultatele noastre s fie obinute din ntmplare. Identificarea unui prag semnificativ statistic este un moment de bucurie n special pentru cercettorii aflai la nceput de drum. Acesta nu este ns finalul cercetrii: trebuie s aflm dac rezultatele noastre au i o semnificaie practic, dincolo de cea statistic. De exemplu, pentru eantioanele mari, chiar i coeficienii cu valori relativ sczute nregistreaz praguri de semnificaie sub 0,05, dar asta nu nseamn mare lucru, deoarece valoarea lor practic va fi redus. O serie de cercettori sau statisticieni consacrai i-au exprimat dezacordul cu privire la procedura clasic de testare a ipotezelor (Gravetter i Wallnau, 2009; Sava, 2004). Una dintre criticile cele mai aprige se leag de faptul c demonstrarea existenei unor diferene, asocieri sau efecte semnificative nu indic neaprat magnitudinea acestora, ci doar c este foarte puin probabil s fi fost obinute din ntmplare. O metod la care putem apela pentru a afla dac rezultatele noastre au i semnificaie practic este calcularea mrimii efectului, un indicator care arat magnitudinea diferenelor dintre medii. Altfel spus, indicatorii mrimii efectului rspund la ntrebarea tiind c exist diferene semnificative statistic ntre grupuri, ct de mari sunt de fapt aceste diferene? Printre indicatorii cei mai utilizai ai mrimii efectului se numr d al lui Cohen, r 2, 2 (eta ptrat). Tabelul urmtor cuprinde valorile reper ale acestor coeficieni.
Mrimea efectului efect sczut efect mediu efet puternic d al lui Cohen 0,20 0,50 0,80 r2 ,01 ,06 ,14 2 0,01-0,05 0,06-0,13 0,14 -

7. Tipuri de distribuii ale datelor


Datele pe care le obinem prin msurarea variabilelor pot fi reprezentate grafic sub forma unor distribuii ale frecvenelor. n aceste distribuii, ne intereseaz valorile pe care le poate lua variabila (de la minim la maxim) i frecvena cu care apare fiecare valoare. De exemplu, s presupunem c la un extemporal elevii iau urmtoarele note: 4,4,4,4,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,10,10,10,10,10 Practic avem toate valorile pe care le ia variabila noastr ( note colare) i frecvena cu care apare fiecare: 4 de cinci ori, 5 de trei ori, 6 de dou ori etc. Reprezentarea grafic a acestei distribuii arat astfel:

35

- pentru uz didactic m = 7,16 = 2,00 N = 31

n acest grafic, pe axa Ox apar valorile variabilei note colare, de la cea minim (4) la cea maxim (10). Pe axa Oy sunt trecute frecvenele pentru fiecare valoare, de la cea mai mic (2) la cea maxim (9). Fiecare dreptunghi din grafic ilustreaz astfel ci membri ai eantionului au obinut scorul respectiv. n cazul nostru, 5 elevi au luat nota 4, 3 elevi au luat nota 5, 2 elevi au luat nota 6 etc. Linia erpuit care unete mijloacele superioare ale dreptunghiurilor din grafic poart numele de curba distribuiei. Inspectarea vizual a acesteia poate s ofere un prim indiciu despre forma distribuiei, dei de obicei este puin concludent.

7.1. Indicatori ai formei distribuiei


Trei caracteristici sunt eseniale cnd este vorba despre descrierea formei unei distribuii n statistic: modalitatea, oblicitatea i boltirea. (1). Modalitatea reprezint numrul de vrfuri semnificative dintr-o distribuie. Vrfurile ilustreaz practic valorile din distribuie n jurul crora se aglomereaz scorurile foarte multor subieci. n funcie de numrul vrfurilor, putem s avem distribuii unimodale (un singur vrf), bimodale (dou vrfuri) sau multimodale (trei sau mai multe vrfuri). Un indicator bun al modalitii este valoarea mod (valoarea care se repet de cele mai multe ori ntr-o distribuie). Dac avem mai multe valori mod, este evident c distribuia noastr va fi bimodal sau multimodal.

distribuie unimodal

distribuie bimodal

distribuie multimodal

Distribuiile bimodale pot fi un indicator al faptului c exist o variabil neluat n calcul de cercettor i care afecteaz distribuia. De exemplu, pentru variabila lungimea prului vom nregistra probabil dou vrfuri, unul indicnd aglomerarea scorurilor pentru femei, iar cellalt pentru brbai. Distribuiile multimodale ilustreaz de obicei fenomene ciclice; de exemplu, variabila numr de nari ar putea s aib o astfel de distribuie. (2). Oblicitatea arat dac scorurile obinute de subieci au tendina de a fi mai mari sau mai mici. ntr-o distribuie nclinat spre dreapta, scorurile mari sunt mai multe dect cele mici (situaia se mai numete asimetrie negativ). Exemplul clasic este cel al unui test foarte uor, la care foarte

36

Marius Druga Metode de cercetare n psihologia educaiei


muli elevi obin note mari. Un alt exemplu pentru aceeai situaie este al variabilei evoluia n timp a preciziei msurrii timpului (pe msura evoluiei, precizia a devenit din ce n ce mai mare). ntr-o distribuie nclinat spre stnga, scorurile mici sunt mai multe dect cele mari (situaia se numete asimetrie negativ). Exemplul clasic este cel al unui test foarte dificil, la care foarte muli elevi note mici. Un alt exemplu pentru aceeai situaie este veniturile lunare ale angajailor din sectorul bugetar (foarte multe venituri mici, i doar cteva foarte mari).

asimetrie pozitiv

asimetrie negativ

distribuie simetric

distribuie simetric

distribuie simetric

Distribuia n care cele dou jumti ale curbei distribuiei (din stnga i din dreapta centrului) au aceeai form se numete simetric. Definiie ntr-o distribuie simetric, trasarea unei linii verticale prin mijlocul graficului creeaz forme similare pe cele dou pri, ca ntr-o oglind.

Evaluarea statistic a simetriei se realizeaz cu ajutorul indicatorului de oblicitate ( skewness). Dac valoarea acestuia este 0, atunci distribuia noastr este perfect simetric. O valoare pozitiv a coeficientului arat aglomerarea valorilor n partea stng a graficului (asimetrie pozitiv), iar o valoare negativ indic aglomerarea n partea dreapt (asimetrie negativ).Din punct de vedere statistic vom spune ns c o distribuie este asimetric pozitiv sau negativ doar dac valorile indicatorului de oblicitate sunt n afara intervalului [-,80; +,80]. O valoare aflat n acest interval poate fi nc tratat ca un semn al unei distribuii simetrice (Lewis-Beck, 1995, apud Sava, 2004).
dac skewness este atunci distribuia este i este posibil s arate cam aa:

-,80 asimetric negativ

ntre -,80 i ,80 aproximativ simetric

,80 asimetric pozitiv

(3). Boltirea arat ct de mprtiate sunt scorurile n jurul valorii centrale sau altfel spus ct de mare este variana acestora. Dac variana este mare distribuia va fi aplatizat, turtit, iar dac variana este mic distribuia va fi ascuit. Evaluarea boltirii se poate realiza cu ajutorul indicatorului de boltire (kurtosis). Dac valoarea coeficientului este 0, atunci distribuia este 37

- pentru uz didactic perfect mezocurtic (nici prea aplatizat, nici prea ascuit). Cnd coeficientul este pozitiv, distribuia este ascuit sau leptocurtic (valorile se aglomereaz n jurul mediei). Cnd coeficientul este negativ, distribuia este aplatizat sau platicurtic (valorile se mprtie spre extreme). O serie de autori accept ca aproximativ mezocurtic o distribuie cu un coeficient de boltire cuprins ntre -1,00 i 1,00 (Kirk, 2008).
dac kurtosis este atunci distribuia este i este posibil s arate aa

-1,00 platicurtic

ntre -1,00 i 1,00 mezocurtic

1,00 leptocurtic

7.2. Proprietile distribuiei normale. Scorurile standardizate z


Cnd muli factori independeni aleatori acioneaz aditiv pentru a crea variabilitatea unui eantion, datele vor forma adesea o distribuie sub form de clopot, numit distribuie gaussian (dup numele inventatorului ei, Carl Gauss). Termenul normal mai este folosit uneori ca sinonim. Din perspectiva celor trei indicatori ai distribuiilor prezentai anterior, distribuia normal este unimodal, simetric i mezocurtic. Acest tip de distribuie are cteva caracteristici matematice care stau la baza multor teste statistice: poate s ia valori de la infinit la +infinit; este perfect simetric, cu frecvenele cele mai mari n centru; dei variana este teoretic nelimitat, frecvenele devin din ce n ce mai mici pe msur ce ne ndeprtm de centrul distribuiei; mprtierea total a datelor este de aproximativ 6 abateri standard. Proprietile distribuiei normale sunt importante deoarece dei nu toate tehnicile statistice infereniale se bazeaz pe proprietile unei distribuii normale, o logic similar este utilizat i n cazul altor distribuii (Sava, 2004, p. 11). Dintre aceste proprieti enumerm urmtoarele: media mparte distribuia n jumtate: 50% din scoruri mai mici dect media, 50% mai mari; n intervalul dintre medie i +/- o abatere standard se afl 68,27% din scoruri; n intervalul dintre medie i +/- dou abateri standard se afl 95,44% din scoruri; n intervalul dintre medie i +/- trei abateri standard se afl 99,72% din scoruri; i mai ales foarte important n intervalul dintre medie i +/- 1,96 abateri standard se gsesc 95% din elementele eantionului. Restul de 5% se gsesc n afar, cte 2,5% n stnga i dreapta distribuiei, spre extremiti; n intervalul dintre medie i +/- 2,58 abateri standard se gsesc 99% din elementele eantionului. Restul de 1% se gsesc n afar, cte 0,5% n stnga i dreapta distribuiei, spre extremiti.

38

Marius Druga Metode de cercetare n psihologia educaiei

S lum un exemplu pentru a nelege aplicaiile acestor proprieti i de unde provin acel e cifre. Imaginai-v c avei un autoturism care, conform crii tehnice, consum n medie 5,5l/100km. Statisticile productorului afirm c abaterea standard a consumului este de 0,7l/100km. S spunem c ntr-o cltorie computerul de bord ne indic faptul c am consumat n medie 4,8l/100km i dorim s tim unde se ncadreaz acest consum. Cunoscnd media i abaterea standard, i presupunnd c distribuia este normal, putem stabili procentajul de cazuri n care am consumat o anumit cantitate de combustibil. n exemplul nostru, n 34,13% din cazuri am realizat un consum ntre 4,8 i 5,5l/100km. Cnd afirmm acest lucru ne bazm pe o proprietate a distribuiei normale (vezi figura anterioar), anume c ntre medie i minus o abatere standard se gsesc 34,13% din cazuri (m = 5,5; = 0,7; m- = 4,8). Putem s mergem mai departe i s afirmm, pe baza aceleiai proprieti, c n 68,27% din cazuri consumm ntre 4,8 i 6,2l/100km. Ce se ntmpl ns dac valorile crora dorim s le identificm poziiile n distribuie nu coincid cu valorile obinute prin adunarea mediei i a abaterii standard? Soluia este transformarea acestora n scoruri standardizate. Dintre acestea, cele mai utilizate sunt scorurile z, a cror medie este 0 i abaterea standard 1. Distribuia z fiind una normal, ntre z = -1 i z = 1 se gsesc 68,27% din cazuri, ntre z = -2 i z = 2 se gsesc 95,44% din cazuri. Scorurile z la care se face de obicei raportarea sunt ns 1,96 i 2,58. ntre z = --1,96 i z = 1,96 se gsesc 95% din cazuri, iar ntre z = -2,58 i z = 2,58 se gsesc 99% din cazuri. Acestea sunt valorile pe care ar fi bine s le reinei. n cazul n care trebuie s calculai procentul cazurilor aflate ntre alte valori z putei consulta un tabel special ntocmit de statisticieni pentru a v ajuta. La adresa http://www.intmath.com/Counting-probability/z-table.php gsii gratuit un astfel de tabel, care arat procentajul cazurilor cuprinse ntre medie i scorul z. Prezentm mai jos doar o parte, pentru a ilustra procedura de lucru.
z ,0 ,1 ,2 0,00 0,0000 0,0398 0,0793 0,01 0,0040 0,0438 0,0832 0,02 0,0080 0,0478 0,0871 0,03 0,0120 0,0517 0,0910 0,04 0,0160 0,0557 0,0948 0,05 0,0199 0,0596 0,0987 0,06 0,0239 0,0636 0,1026 0,07 0,0279 0,0675 0,1064 0,08 0,0319 0,0714 0,1103 0,09 0,0359 0,0753 0,1141

1,9

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,4750

0,4756

0,4761

0,4767

39

- pentru uz didactic 0,4938 2,5 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

n prima coloan trebuie cutat cifra ntreag i prima cifr de dup virgul a lui z. Pe primul rnd trebuie cutat a doua cifr de dup virgul a lui z. De exemplu, pentru un z = 0,23, procentul cazurilor aflate ntre medie i z este de 9,1% (n csu apare 0,0910). Cutnd z = 1,96, vedem c ntre medie i z se afl 47,50% din cazuri. Aceasta nseamn c n intervalul [m-z; m+z] se gsesc de dou ori mai multe: 95% din cazuri. 5% se vor afla n afara acestui interval, repartizate cte 2,5% n cele dou extremiti ale distribuiei. Similar, pentru z = 2,58 vedem c ntre medie i z se gsesc 49,51% din cazuri, deci n intervalul [m-z; m+z] se gsesc de dou ori mai multe: aproximativ 99%. 1% din cazuri se gsesc n afara acestui interval, repartizate cte 0,5% n cele dou extremiti ale distribuiei. Pentru a ilustra grafic ceea ce reprezint tabelul, urmrii figura urmtoare:

Partea haurat este ceea ce ne indic cifrele din tabel. Astfel, n intervalul cuprins ntre medie i z = 1,96 gsim un procentaj de 47,50% din cazuri. De aceea, n intervalul m+/ - z = 1,96 procentajul va fi dublu: 95%. Revenind la exemplul nostru cu consumul de carburani, pentru a afla procentajul cazurilor n care consumm ntre 6,5 i 7l/100km, vom transforma cele dou valori n cote z. Formula de transformare este

n care x este valoarea variabilei pe care dorim s o transformm, m este media populaiei, iar este abaterea standard a populaiei. Pentru x = 6,5 z este (6,5-5,5)/0,7 = 1,42, iar pentru x = 7 z este (7-5,5)/0,7 = 2,14. Cutnd n tabel, pentru z = 1,42 procentul cazurilor dintre medie i z este de 42,28%, iar pentru z = 2,14 procentul este de 48,38%. Acesta nseamn c ntre cele dou valori z avem un procent de 48,38-42,28 = 6,16. Aadar, n 6,16% din cazuri am consumat ntre 6,5 i 7l/100km. Atenie, pentru z gsii mai multe tipuri de tabele: unele arat procentul cazurilor aflate ntre medie i scorul z respectiv, altele arat procentajul cazurilor aflate n intervalul [m -z; m+z], iar altele arat procentajul cazurilor aflate n afara acestor intervale. Procedura de lucru este identic, ns trebuie s fii ateni la ce indic tabelul respectiv.

40

Marius Druga Metode de cercetare n psihologia educaiei


Concluzie n sensul ei strict, distribuia normal este mai degrab un ideal matematic, iar distribuiile cu care lucrm doar o aproximeaz. De exemplu, datele biologice sau o serie de date din domeniul psihologiei nu vor putea respecta perfect o distribuie gaussian, deoarece aceasta se ntinde la infinit n ambele direcii, incluznd att valorile negative, ct i cele pozitive. Totui, aceste date din biologie sau psihologie pot s formeze o distribuie n form de clopot, aproximativ gaussian. Testele t, ANOVA i alte teste funcioneaz suficient de bine chiar dac distribuia este doar aproximativ normal, de aceea sunt larg utilizate n multe domenii, nu doar n psihologie.

7.3. Testarea normalitii distribuiei


Este important de tiut dac variabilele cu care lucrm au distribuie normal sau nu, deoarece tipul distribuiei este unul dintre criteriile pe care le utilizm n alegerea testului statistic potrivit datelor noastre. Exist mai multe modaliti de a stabili dac variabilele au distribuie normal: inspectarea vizual a graficului, utilizarea indicatorilor de oblicitate i boltire, utilizarea coeficientului Kolmogorov-Smirnov. (1). Inspectarea vizual a reprezentrilor grafice are cel mai ridicat grad de eroare. Exist multe situaii n care aparent curba distribuiei noastre nu seamn aproape deloc cu distribuia normal. Totui, statistic vorbind, este posibil ca distribuia noastr s aproximeze totui una gaussian. De aceea, criteriul vizual nu este cel mai potrivit pentru testarea normalitii distribuiei (vezi 7.3.1, pag. 97, pentru exerciiu). (2). n locul analizei vizuale, putem s apelm la indicatori statistici. De exemplu, indicatorul de oblicitate i indicatorul de boltire pot fi utilizai n pereche pentru a evalua normalitatea distribuiei (vezi 7.3.2., pag. 97, pentru exerciiu): coeficientul de oblicitate (skewness) trebuie s se ncadreze ntre -,80 i ,80 (fiind astfel ndeplinit criteriul simetriei); coeficientul de boltire (kurtosis) trebuie s se ncadreze ntre -1,00 i 1,00 (astfel distribuia nu va fi nici prea ascuit, nici prea aplatizat). De ce se utilizeaz mai puin cei doi indicatori pentru evaluarea normalitii? Motivul principal este c ei trebuie folosii n pereche, deci ambii trebuie s respecte criteriile menionate anterior. Prin urmare, o distribuie care este simetric, dar prea aplatizat, nu va fi normal, la fel una simetric, dar ascuit. Simetria i normalitatea unei distribuii nu sunt sinonime. Identificarea asimetriei n schimb este suficient pentru a afirma c distribuia este nongaussian. (3). Testul Kolmogorov-Smirnov (KS) este unul dintre cele mai utilizate teste de normalitate a distribuiei, cuantificnd discrepana dintre distribuia datelor noastre i o distribuie gaussian ideal (vezi 7.3.3., pag. 100, pentru exerciiu). Cu ct valoarea testului este mai mare, cu att discrepana este mai mare. n practic vom lucra ns rareori cu valoarea testului KS n sine, ci cu valoarea pragului de semnificaie al acestui indicator statistic. Spre deosebire de majoritatea situaiilor din statistic, obinerea unui prag de semnificaie mai mic de 0,05 este o veste proast, nsemnnd c distribuia este asimetric. Ca urmare, nu putem folosi testele statistice parametrice dect dac aplicm proceduri de normalizare a acesteia (vezi 7.4.1., pag. 103, pentru exerciiu). n cazul testului KS, valoarea pragului de semnificaie rspunde ntrebrii: Dac am extrage aleator un eantion dintr-o populaie normal, care este probabilitatea de a obine un eantion care deviaz att de mult sau chiar mai mult de la distribuia normal precum o face eantionul pe care deja l-am investigat? (pentru detalii despre ce este i ce nseamn pragul de semnificaie, v 41

- pentru uz didactic recomandm s citii 6.3 - Pragurile de semnificaie, pag. 85, i 8.3 - Inferena statistic i pragurile de semnificaie (alpha), pag. 109. Interpretarea testului KS depinde nu doar de valoarea pragului de semnificaie, ci i de mrimea eantionului.
valoarea pragului de semnificaie mic (<0,05) mare (>0,05) volumul eantionului oricare mare concluzie Este puin probabil ca datele s aib distribuie gaussian. Datele au trecut testul normalitii. Probabil populaia are distribuie normal. Putem fi tentai s afirmm c distribuia populaiei este normal. Nu putem exclude posibilitatea ca din cauza volumului mic eantionul s nu ofere suficiente date pentru a discrimina ntre distribuia normal i cea nongaussian.

mare (>0,05)

mic

Atragem atenia asupra faptului c verificarea formei distribuiei se realizeaz doar pentru variabile continue; nu se efectueaz o astfel de verificare pentru variabile categoriale.

7.4. Transformarea scorurilor pentru a obine distribuii gaussiene


Dac datele pe care le avem la dispoziie nu respect proprietile distribuiei normale, acestea pot fi transformate pentru a crea o distribuie gaussian. Facem acest lucru pentru c variabilele cu distribuie normal permit utilizarea testelor parametrice, care au o putere mai mare de a detecta diferenele dintre grupele comparate. Tabelul urmtor cuprinde cteva recomandri cu privire la normalizarea datelor.
Tipuri de distribuii i transformrile sugerate pentru normalizare (Tabachnik i Fidell, 1996, apud Pallant, 2005) dac distribuia voastr este nongaussian i arat cam aa atunci v sugerm: extragerea radicalului, deoarece se elimin astfel asimetria pozitiv moderat. Formula de introdus n SPSS este: noua variabil = sqrt(vechea variabil) logaritmarea, deoarece se elimin astfel asimetria pozitiv puternic Formula de introdus n SPSS este: noua variabil= lg10(vechea variabil) inversarea Formula de introdus n SPSS este: noua variabil = 1/vechea variabil

42

Marius Druga Metode de cercetare n psihologia educaiei


aplicarea formulei urmtoare n SPSS: noua variabil = sqrt(k-vechea variabil) unde k este cea mai mare valoare posibil pe care o poate lua variabila + 1 aplicarea formulei urmtoare n SPSS: noua variabil = lg10(k-vechea variabil) unde k este cea mai mare valoare posibil pe care o poate lua variabila + 1 aplicarea formulei urmtoare n SPSS: noua variabil = 1/(k-vechea variabil) unde k este cea mai mare valoare posibil pe care o poate lua variabila + 1

8. Inferena statistic
8.1. Clarificri conceptuale
Inferena statistic are sensuri diferite, n funcie de modul de abordare (Rozeboom, 1960). Pentru matematicieni, este un sistem complicat de calcule avansate, poate cu mai puin semnificaie empiric. Pentru filosofi, este un mister care nc mai necesit clarificare conceptual. Pentru cercettorul din tiinele socioumane, din psihologie n special, ea este un instrument subordonat cercetrii, un mecanism prin care date teoretic nelimitate pot fi rafinate pentru a obine un produs asimilabil de lumea tiinei. Pentru a fi siguri c pornim de la lucruri cunoscute, dorim n primul rnd s amintim ce nelegem prin termenii a infera i inferen statistic (vezi i 4.4 - Estimarea caracteristicilor populaiei pe baza datelor obinute de la eantioane, pag. 51-52). Procedurile de inferen statistic sunt utilizate pentru a formula generalizri de la nivelul eantionului la nivelul populaiei; altfel spus, prin inferen dorim s stabilim dac rezultatele obinute n cercetarea noastr pe eantionul nostru sunt obinute din ntmplare sau dac, pstrnd o anumit marj de eroare, putem spune c ele reflect caracteristicile reale ale populaiei. Deja n 1925 Fisher afirma c una dintre ideile de baz ale statisticii este aceea a unei populaii infinite de date, repartizate ntr-o distribuie a frecvenelor pentru o variabil dat. Dar, de vreme ce nu putem investiga toat populaia, va trebui s ne mulumim cu msurarea limitat a unui eantion. Astfel ne putem face o idee despre populaia din care datele noastre sunt extrase i totodat despre alte posibile eantioane pe care le vom extrage n viitor din acea populaie. Este evident c luarea deciziilor cu privire la populaii, pe baza unor date restrnse culese de la eantioane, este supus unui anumit grad de eroare. Statistica inferenial a fost dezvoltat pentru a mbunti acest proces de luare a deciziei, deoarece observaiile succesive ale eantioanelor evideniau un anumit grad de variabilitate, dei se realizau n condiii aparent identice. Variabilitatea poate fi una inerent fenomenului investigat sau participanilor, se poate datora erorilor de msurare, modificrilor nedetectabile ale condiiilor de observare sau unei combinaii a acestor factori (Kirk, 2008).

43

- pentru uz didactic Pentru a ilustra relaia dintre populaie i eantion, precum i logica inferenei statistice, Lungu (2001) oferea un exemplu inspirat. Presupunnd c fierbem o oal de fasole, cum ne dm seama c fasolea este fiart? Ar fi absurd s gustm toate boabele (s msurm toat populaia). Procedura cea mai simpl este de a amesteca i de a scoate cteva boabe, pe care le gustm. Dac acesta sunt fierte, decibidem c i restul boabelor sunt fierte. Metodele statistice au exact acest rol, de a estima cu un anumit grad de precizie dac populaia reflect caracteristicile eantionului. n cazul nostru, echivalentul ar fi s decibidem dac toate boabele de fasole (populaia) sunt fierte, pornind de la gustarea (msurarea) ctorva boabe (eantion).

8.2. Limite de ncredere i intervale de ncredere


Una dintre problemele asociate utilizrii eantioanelor n locul populaiilor este c eantioanele ofer doar informaii limitate despre eantioane (Gravetter i Wallnau, 2009). De obicei exist o discrepan ntre indicele statistic obinut la nivelul eantionului i parametrul corespunztor al populaiei. Aceast discrepan este cuantificat de eroarea de eantionare. n cazul nostru, cum ar putea s apar discrepanele dintre boabele gustate i populaia de boabe sau eroarea de eantionare? Probabil am selectat din ntmplare exact acele boabe care erau cele mai fierte. Ca s ne asigurm ntradevr c toate boabele sunt fierte, ar trebui s mai amestecm, apoi s selectm din nou cteva boabe, apoi din nou i din nou. Am crete astfel precizia estimrii. Din pcate, n statistic nu ne permitem att de uor s extragem i s msurm foarte des eantioanele, pentru a crete precizia estimrii. Costurile de timp i materiale sunt mult mai mari dect n cazul ciorbei de fasole! De exemplu, la posturile TV apar frecvent tiri de genul: Dac mine ar fi alegeri, partidul X ar obine 31% din voturi, partidul Y 26%, iar partidul Z 20%. Restul voturilor s-ar mpri ntre partidele . , fiecruia revenindu-i sub 5% din opiunile electoratului. Datele sunt obinute pe baza unui eantion reprezentativ de 1,000 de respondeni, iar marja de eroare este de +/- 3%. Aceast marj de eroare la care face apel comunicatul este de fapt eroarea de eantionare. n exemplul nostru, procentajele care au fost raportate au fost obinute pe baza investigrii unui eantion de 1,000 de participani, iar apoi generalizate la nivelul populaiei. Acel 3% reprezint eroarea pe care studiul o comite cnd realizeaz generalizarea. Pornind de aici, putem calcula probabilitatea de apariie a unui eveniment (inei minte c logica inferenei statistice este una a probabilitilor; motivul este c se bazeaz pe proprietile distribuiei normale). Probabilitatea ca un eveniment s apar ntre dou puncte distincte ale unei distribuii normale poate fi gsit prin calcularea pe grafic a ariei dintre cele dou puncte (vezi din nou capitolul 7, subpunctul 2 Proprietile distribuiei normale. Scorurile standardizate z). S lum din nou un exemplu. S presupunem c suntei angajat de ctre managerul unui hypermarket nou deschis pentru a afla cam ct cheltuiesc clienii unui hypermarket concurent. Procedura legal cea mai simpl la care putei apela este s selectai aleator clienii la ieirea din magazinul concurent i s-i rugai s v comunice suma cheltuit. Facei media rspunsurilor i obinei o anumit sum (s zicem 98 lei). Pentru a crete precizia estimrii, va mai trebui s repetai paii de cteva ori (o nou eantionare, noi interviuri, noi calcule). Vei obine astfel mai multe medii, ale mai multor eantioane. Mediile respective pot forma la rndul lor un alt eantion, acela al mediilor sumelor cheltuite la hypermarket, cruia putem s-i calculm o nou medie (s zicem c obinem media mediilor 91 de lei). Indicatorul care ne ajut s realizm generalizarea de la eantioane la populaie este eroarea

44

Marius Druga Metode de cercetare n psihologia educaiei


standard a mediei (E). Aceasta este de fapt abaterea standard a eantionului nou format i exprim eroarea pe care o comitem utiliznd media eantioanelor pentru a estima media populaiei. S presupunem c n exemplul nostru E = 7 [inem s menionm c SPSS poate s calculeze eroarea standard pentru foarte muli indicatori statistici]. Amintim c una dintre proprietile distribuiei normale este c n intervalul [m -1,96; m+1,96] se gsete un procent de 95% din cazuri, iar n intervalul [m-1,2,58; m+2,58] se gsete un procent de 99% din cazuri. n exemplul nostru, tiind c media populaiei este 91 (am aproximat-o prin media eantioanelor), iar eroarea standard a mediei este 12, nseamn c n inter valul [m-1,96E; m+1,96E] se gsete, cu un risc de a grei de 5%, adevrata medie a populaiei. nlocuind, gsim c media sumelor cheltuite de populaia de clieni a hypermarketului concurent se situeaz ntre 77,28 i 104,72 lei. Afirmm acest lucru cu un risc de a grei de 5% (altfel spus exist 5% anse ca media adevrat a populaiei s se afle n afara acestui interval). Dac vrem ca riscul asumat de a grei s fie mai mic, va trebui s extindem limitele acestui interval. Astfel, cu un risc de a grei de 1% putem afirma c media sumelor cheltuite de populaia de clieni a hypermarketului concurent se situeaz ntre 72,94 i 109,06 lei (observai c intervalul este mai larg). Acest interval n care este foarte probabil (95 sau 99% anse) s se gseasc adevraii parametri ai populaiei se numete interval de ncredere. Cu ct acest interval este mai ngust, cu att mai mare este precizia estimrii. Capetele intervalului se numesc limite de ncredere. Ce semnific aadar o afirmaie de tipul Sunt anse de 5% ca adevrata medie a populaiei s se afle n afara intervalului? Dac am repeta aceeai strategie de eantionare, pentru a obine un nou eantion, sunt anse de 5% ca intervalul de ncredere calculat folosind datele acestuia s nu includ media primului eantion. NU nseamn c 95% din eantion sau din populaie se afl n acest interval! Exist i alte situaii cnd se pot genera intervale de ncredere, nu doar n cazul mediilor. De exemplu, n cazul comparrii grupurilor, este posibil calculul unui interval de ncredere pentru diferena dintre mediile populaiilor din care au fost extrase grupurile. n acest caz, respectnd aceeai condiie a normalitii distribuiei datelor, exist 95% sau 99% anse ca n intervalul calculat s se afle adevrata diferen dintre mediile populaiilor.

8.3. Inferena statistic i pragurile de semnificaie (alpha)


S presupunem c am cules date de la dou eantioane i c mediile sunt diferite. Simpla inspectare a faptului c mediile sunt diferite la nivelul eantionului nu ne permite ns s afirmm c populaiile au medii diferite. Este posibil ca populaiile s aib aceeai medie, iar diferena pe care am obinut-o noi s fie o simpl coinciden. Nu putem fi vreodat siguri de acest lucru (dect binenele s n cazul n care am avea la dispoziie resurse infinite de timp i materiale pentru a investiga ambele populaii). n schimb, ne putem baza pe legile probabilitii. Pragurile de semnificaie rspund ntrebrii Dac populaiile ar avea aceeai medie, care este probabilitatea ca noi s obinem diferene ntre medii la nivelul eantioanelor? Din punctul de vedere al logicii probabilitii, pragurile de semnificaie indic probabilitatea de a obine rezultatele respective n condiiile n care ipoteza nul ar fi adevrat. Pragurile de semnificaie iau valori ntre 0 i 1. Dac valoarea pragului este mai mic de 0,05, concluzionm c este puin probabil (sub 5% anse) ca diferena s apar din ntmplare i c ntr adevr populaiile au medii diferite. Facem aceast afirmaie bazndu-ne pe proprietile distribuiei normale (vezi 7.2 Proprietile distribuiei normale. Scorurile standardizate z, pag. 93). 45

- pentru uz didactic Dac valoarea pragului este mai mic de 0,01, ansele de a obine rezultatele respective din ntmplare este chiar mai mic, de 1%. Dac valoarea pragului este de peste 0,05, atunci afirmm c datele nu ofer dovezi pentru a susine existena diferenelor dintre medii. Nu nseamn c mediile sunt egale, ci doar c nu avem dovezi pentru a susine existena diferenelor dintre ele. Cercettorul este ns cel care decide la care valoare a pragului de semnificaie va face raportarea rezultatelor. Exist situaii n care poate decide scderea valorii pragului, pentru a evita comiterea erorii de tip I, sau situaii n care poate decide creterea valorii acestuia, pentru a evita comiterea erorii de tip II (vezi 6.4 Tipuri de erori, pag. 86-89).

8.4. Gradele de libertate


Definite n mod grosier, acestea reprezint buci de informaie. De exemplu, o variabil msurat n cazul unui eantion de 75 de persoane ofer 75 de buci de informaie. Numrul gradelor de libertate este numrul bucilor de informaie (sau al valorilor) care pot s varieze n calculul unui indice statistic. n limba englez, gradele de libertate sunt notate df (degrees of freedom), iar n limba romn gl. Raportarea complet a unui rezultat statistic include simbolul testului, numrul de grade de libertate, valoarea exact a testului i valoarea pragului de semnificaie. De exemplu, c omparnd un eantion de brbai i unul de femei pentru a vedea dac sunt diferene n ceea ce privete suma anual cheltuit pe mbrcminte, obinem urmtorul rezultat: t(98) = 4,42; p<0,01. t este simbolul testului statistic utilizat (testul t), 98 sunt gradele de libertate, 4,42 este valoarea exact a testului, iar p<0,01 arat c pragul de semnificaie asociat testului este mai mic de 0,01. Alternativ, am fi putut alege raportarea pragului exact. Ambele variante sunt acceptate n comunitatea tiinific. Modul de calcul al gradelor de libertate este diferit pentru testele statistice, i n plus este oferit automat de SPSS, de aceea nu vom descrie modul lor de calcul.

Bibliografie
Carnec, H., Dagoury, J.M., Seroux, R., Thomas, M. (2000). Itineraires en Statistiques et Probabilits. Paris: Ellipse Marketing. Cioar, M. (2006). Atenia. n E. Bonchi (coord.), Psihologie general (pp. 217-249). Oradea: Editura Universitii din Oradea. Clocotici, V., & Stan, A. (2001). Statistic aplicat n psihologie. Iai: Editura Polirom. Diener, E., Emmons, R.A., Larsen, R.J., Griffin, S. (1985). The Satisfaction with Life Scale. Journal of Personality Assessment, 49, 71-75. Fisher, R.A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver and Boyd. Disponibil online la http://psychclassics.yorku.ca/Fisher/Methods/; data consultrii: 30.08.2010. Gravetter, F.J., Wallnau, L.B. (2009). Statistics for the Behavioral Sciences. Belmont, USA: Wadsworth, Cengage Learning. Holmes, A.P., Friston, K.J. (1997). Statistical Models and Experimental Design. In R.S.J. et al (eds), Human Brain Function (pp. 94-141). USA: Academic Press. Howitt, D., Cramer, D. (2006). Introducere n SPSS pentru psihologie. Iai: Editura Polirom. Kirk, R.E. (2008). Statistics: An Introduction. Belmont: Thomson Wadsworth.

46

Marius Druga Metode de cercetare n psihologia educaiei


Lungu, O. (2001). Ghid introductiv pentru SPSS 10.0. Iai: Seria Psihologie Experimental i Aplicat. Miclea, M. (1999). Psihologie cognitiv. Modele teoretico-experimentale. Iai: Editura Polirom. Motulsky, H.J. (2010). Intuitive Biostatistics. New-York: Oxford University Press. Pallant, J. (2001). SPSS Survival Manual. A Step by Step Guide to Data Analysis Using SPSS for Windows (Version 10). Philadelphia: Open University Press. Radu, I. (coord.) (1993). Metodologie psihologic i analiza datelor. Cluj-Napoca: Editura Sincron. Roseboom, W.W. (1960). The fallacy of the null-hypothesis significance test. Psychological Bulletin, 57, 416-428. Disponibil online la http://psychclassics.yorku.ca/Rozeboom/; data consultrii: 01.09.2010. Smith, E.E., Nolen-Hoeksema, S., Fredrickson, B.L., & Loftus, G.R. (2005). Introducere n psihologie. Bucureti: Editura Tehnic. GraphPad Software (1998). InStat guide to choosing and interpreting statistical tests. San Diego, California: GraphPad Software, Inc., www.graphpad.com. Consultat n august 2010. Doron, R., Parot, F. (coord.)(2006). Dicionar de psihologie. Bucureti: Editura Humanitas. ***Marele dicionar al psihologiei (2006). Bucureti: Editura Trei ***SPSS Base 16.0 Users Guide (2007). Chicago, IL: SPSS, Inc. http://www.intmath.com/Counting-probability/z-table.php; data consultrii 20.10.2010. http://www.lbl.gov/Education/ELSI/research-main.html; data consultrii: 14.10.2010. http://stattrek.com/Tables/Random.aspx; data consultrii: 18.10.2010. http://www.uwsp.edu/psych/stat/F.htm; data consultrii: 25.10.2010.

47

S-ar putea să vă placă și