Documente Academic
Documente Profesional
Documente Cultură
Metode de Cercetare
Metode de Cercetare
- pentru uz didactic n studiile experimentale, asigurai-v c avei suficieni participani n fiecare grup i ncercai s construii grupe egale ca numr. Utilizarea unor grupe prea mici sau dezechilibrate va face dificil detectarea diferenelor semnificative statistic; de cte ori este posibil, repartizai aleator subiecii n fiecare grup, evitnd utilizarea grupurilor constituite deja. Aceast strategie reduce problemele legate de existena grupelor neechivalente n design-urile intergrup. De asemenea, dac avei resurse materiale i timp, este bine s realizai i alte msurri ale grupurilor pentru a v asigura c ele nu difer substanial. Dac astfel de diferene exist i le-ai identificat, ele pot fi controlate statistic mai trziu; alegei variabile dependente valide. O idee bun ar fi utilizarea mai multor variabile dependente unele sunt mai sensibile dect altele la modificrile variabilei independente; ncercai s anticipai posibilele influene ale unor variabile externe designului, iniial neluate n calcul. Acestea se mai numesc variabile confundate i pot s ofere o explicaie alternativ rezultatelor obinute, chiar dac uneori sunt greu de identificat cnd suntei preocupai doar de cercetarea voastr n sine. De aceea este util s prezentai ideea i designul studiului unei alt e persoane, nainte de a ncepe; dac alegei metoda chestionarului, ar fi bine s completai i dvs. chestionarul i s desfurai un studiu pilot pe un eantion similar celui int. V putei asigura astfel c instruciunile sunt clare, c itemii sunt corect formulai etc.; dac alegei un experiment ar fi bine s realizai de asemenea un studiu pilot. Dac avei nevoie de echipamente, asigurai-v c ele funcioneaz; dac avei colaboratori, acetia trebuie bine instruii, iar dac folosii mai muli observatori, punei de acord modul n care vor coda diverse comportamente. Studiile pilot v vor ajuta s depistai o parte din erori sau variabile confundate. Va fi greu s stpnii toate variabilele ascunse, dar cu siguran studiul pilot poate s elimine din ele; una peste alta, acordai atenie tuturor detaliilor care ar putea s afecteze calitatea cercetrii, de la design i culegerea datelor la modul n care vindei rezultatele acesteia n cadrul unor conferine sau articole.
- pentru uz didactic urmtoarea aruncare s ias tot ban; de fapt, ansele sunt de 50% la fiecare aruncare. Mintea uman a evoluat astfel nct s gseasc tipare cu uurin, dar este nevoie de rigoare statistic pentru a nu fi pclit de tipare aparente n rndul datelor aleatoare. (4). Oamenii intuiesc incorect probabilitile Gndii-v c avei la dispoziie dou bomboniere. Cea mai mare conine 93 de bomboane albe i 7 roii, iar cea mic 9 albe i una roie. Bomboanele sunt amestecate n fiecare vas i nu putei s vedei culoarea lor. Sarcina dvs. este de a alege o bomboan roie din oricare bombonier. Dac ai alege din bomboniera mic, ansele de a gsi o bomboan roie sunt de 10%. Dac alegei din vasul mare, ansele sunt de doar 7%. Evident, ansele sunt mai mari n cazul bombonierei mici. Totui, dou treimi dintre persoanele care au participat la un astfel de experiment au ales vasul mare, deoarece coninea mai multe bomboane roii (Denes-Raj i Epstein, 1994, apud Motulsky, 2010). (5). Oamenii evit s se gndeasc la situaii ambigue Imaginai-v din nou c avei la dispoziie dou bomboniere. tim c prima conine 50 de bomboane roii i 50 de bomboane negre, amestecate. A doua conine tot 100 de bomboane, unele roii i altele albe, dar nu tim proporia acestora. Dac dorim s alegem o bomboan, indiferent de recipient, nu vom ti culoarea acesteia dect dup ce o extragem. Vei ctiga un premiu dac putei selecta o bomboan roie i suntei liber s extragei din care recipient dorii. Pentru care vei opta? n foarte multe cazuri oamenii aleg prima bombonier (Ellsberg, 1961, apud Motulsky, 2010), caz n care ansele de a reui sunt de 50%. Extragerea unei bomboane roii din a doua urn este mai complicat deoarece este ambigu i ne face s ne simim inconfortabil. (6). Oamenilor le este greu s combine probabilitile De data aceasta gndii-v la concursurile televizate n care concurentul trebuie s aleag una dintre cele trei ui nchise, tiind c n spatele uneia se afl un premiu valoros, iar n spatele celorlalte dou ceva nesemnificativ. S spunem c ai ales o u, de exemplu numrul 2. ntr -o astfel de emisiune, pentru a crete suspansul i audiena emisiunii, prezentatorul va apela la un artificiu. Nu v va arta ce se afl n spatele uii numrul 2, ci va deschide una dintre uile rmase (numrul 1 sau numrul 3), o u despre care tie cu siguran c nu ascunde premiul cel mare. Acum va urma momentul culminant: vi se ofer ocazia de a schimba opiunea original sau de a rmne la aceeai opiune. Nu este vorba despre nici un truc. Uile sunt identice, faa prezentatorului nu ar trebui s spun nimic, iar ua pe care o deschide cu siguran nu va ascunde premiul (el tie n spatele crei ui se afl acesta). Totul depinde aadar de probabiliti. n prima faz, cnd aveai de ales ntre trei ui nchise, ansele de a gsi ua ctigtoare erau egale (33%). Ce se ntmpl n faza a doua, cnd prezentatorul v permite s schimbai opiunea? Dac n faza 1 ai ales ua ctigtoare, (bineneles, fr s tii i fr s vi se arate), n faza a doua prezentatorul va deschide oricum una dintre cele dou ui nectigtoare (s zicem el deschide ua 3). Avei aadar ocazia de a schimba opiunea de la ua ctigtoare la una nectigtoare (despre niciuna dintre ui dvs. nu tii ns deocamdat nimic). Schimbarea va duce la pierderea premiului (ansele irosite au fost de 33%). Dimpotriv, dac n prima faz ai ales o u nectigtoare (s zicem tot ua numrul 2), prezentatorul va avea de ntors una dintre uile rmase (1 sau 3), iar el cu siguran va deschide o u nectigtoare pentru a crete tensiunea. Cu alte cuvinte, dei nu tii acest lucru, ansele de a ctiga sunt de partea dvs., deoarece ambele ui nectigtoare au fost alese (una de ctre dvs., una de ctre prezentator total 66% anse). Schimbarea deciziei va duce cu siguran la ctigarea premiului cel mare.
- pentru uz didactic -
- pentru uz didactic scene horror vizionate sau apartenena de gen (care n ipoteza formulat de noi au statutul de cauze) determin o reactivitate emoional mai crescut (care are statutul de efect). Cercettorul va trebui aadar s aleag un mod n care s msoare reactivitatea emoional, cu alte cuvinte s operaionalizeze aceast variabil. n acest scop el va trebui s decid care anume dintre posibilele moduri de a msura reactivitatea emoional se potrivete cel mai bine studiului su i s o utilizeze apoi pe tot parcursul desfurrii acestuia. Dintre posibilele operaionalizri ale reactivitii emoionale, el poate alege de exemplu: frecvena comarurilor consecutive vizionrii filmelor horror; performana la o sarcin de inhibiie gen Stroop; scorul obinut la un chestionar care cuprinde itemi de genul Ct de team v este s umblai noaptea pe strad dup ce urmrii un film horror? (deloc, foarte puin, puin etc.) Uneori lucrurile sunt relativ simple, neexistnd prea multe operaionalizri pentru o variabil (vezi naionalitatea). Alteori devin mai complicate, deoarece trebuie s alegem din multiplele operaionalizri posibile doar pe cele la care avem acces. De exemplu, cum operaionalizm performana n munc? Operaionalizarea pe care o vom alege depinde printre altele de tipul muncii vizate, de accesul la documentele interne ale organizaiei, de accesul la muncitor sau superiorul acestuia, de resursele de care dispunem etc. Operaionalizarea se poate realiza apelnd la scorul obinut de subieci la un chestionar care investigheaz variabila respectiv. Cu alte cuvinte, cercettorul utilizeaz chestionare deja construite i validate, pentru a-i operaionaliza variabilele. De exemplu, satisfacia n via poate fi operaionalizat prin scorul obinut de subieci la deja celebrul Satisfaction with Life Scale (Diener et al, 1985). Este posibil ca itemii unor astfel de chestionare s fie publicai n anexele unui articol, dar unele scale sunt protejate de drepturi de autor i trebuie cumprat dreptul de utilizare. n alte cazuri scalele sunt considerate a fi de domeniu public, de aceea este nevoie cel mult de un acord scris i de obligativitatea citrii bibliografice. Alegerile sunt aadar multiple i depinde doar de noi, cei care construim cercetarea, cum dorim s realizm operaionalizarea. 2.2.1. Variabile independente i variabile dependente Variabilele care sunt controlate n totalitate de cercettor se numesc variabile independente. Ele nu depind de ceea ce fac participanii, ci de modul n care le manipuleaz experimentatorul. Dintre variabilele studiului descris anterior, tipul filmului horror, numrul de scene horror vizionate i apartenena de gen sunt variabile independente, deoarece nu depind de participani i se afl n totalitate sub controlul cercettorului (acesta decide ce fel de film va proiecta, cte scene horror etc.). n studiile experimentale (n care cercettorul intervine ntr -un anume fel, modific ceva n mod intenionat) variabilele independente au statutul de cauze. Cercettorul le poate modifica sau manipula pentru a identifica efectul acelor modificri asupra altor variabile. De exemplu, n studiul nostru cercettorul poate s manipuleze numrul scenelor horror pe care le proiecteaz. n studiile nonexperimentale interpretarea cauzal trebuie realizat cu precauie. n astfel de studii cercettorul nu manipuleaz variabilele independente, ci doar folosete modalitile acestora, aa cum sunt date ele n mod natural. Exemplul clasic este acela al apartenenei de gen, pe care cercettorul nu o manipuleaz, ci doar compar modalitile acestora (sau mai corect spus scorurile obinute de brbai i femei). Astfel de variabile precum apartenena de gen exprim ce sunt
- pentru uz didactic Pentru aceast ipotez, variabilele independente sunt VI1: tipul filmului horror (cu modalitile horror sperietur i horror violen) i VI2: numrul scenelor horror (cu modalitile pn la 5 scene, ntre 6 i 10 scene i peste 10 scene). Variabila dependent este reactivitatea emoional (RE), operaionalizat prin scorul la un chestionar. Reprezentarea tabelar a designului va arta astfel:
VI1 VI2 Horror sperietur Horror violen modalitile variabilei independente 1 Grup de subieci care a urmrit pn la 5 scene horror dintr-un film n care domin violena. Acestora le msurm reactivitatea emoional. pn la 5 scene ntre 6 i 10 scene peste 10 scene
modalitile variabilei independente 2 Grup de subieci care a urmrit pn la 5 scene horror dintr-un film bazat pe sperierea privitorului. i acestora le msurm reactivitatea emoional.
n reprezentarea tabelar a designului apar urmtoarele elemente: cele dou modaliti ale variabilei independente 1; cele dou modaliti ale variabilei independente 2; numrul grupelor care vor fi comparate (6). Este vorba despre cele ase csue ale tabelului, fiecare dintre acestea reprezentnd cte un grup de subieci. De exemplu, csua din stnga sus (din interiorul tabelului) reprezint scorul obinut la chestionarul prin care am msurat RE de ctre subiecii care au vizionat maxim 5 scene horror dintr -un film de groaz bazat pe sperierea privitorului. Csua din dreapta jos (din interiorul tabelului) reprezint scorul obinut la chestionarul prin care am msurat RE de ctre subiecii care au urmrit peste 10 scene horror dintr-un film de groaz bazat pe violen. O prim concluzie important pe care o extragem din aceast prezentare este c alegerea unui numr mare de variabile sau modaliti ale acestora nu este o soluie potrivit, deoarece vor fi greu de controlat mai trziu din punct de vedere statistic. A doua concluzie vizeaz numrul participanilor necesari pentru testarea ipotezei formulate. innd cont c ar fi bine ca ntr -un grup s fie mcar 10-15 subieci, un design precum cel din exemplu presupune utilizarea unui numr de 6*15 participani, adic 90. Adugarea unor variabile sau modaliti suplimentare va impune utilizarea unui numr i mai mare de participani. Doi termeni ntre care trebuie s facem distincie sunt design experimental i design cvasiexperimental. Termenul design experimental, neles n sensul su strict, vizeaz studiile n care grupurile comparate au fost formate prin selecie aleatoare. De exemplu, prin tragere la sori am putea s selectm din populaia de elevi ai unei coli pe aceia care vor participa la o cercetare, iar mprirea celor selecionai n grupuri mai mici se va face tot aleator. Pe de alt parte, n designurile cvasiexperimentale mprirea subiecilor n grupurile care vor fi comparate nu se face aleator. O mprire deja existent poate fi utilizat pentru a compara grupurile. De exemplu, putem compara prezena la ore a grupei I a anului I Psihologie cu cea a grupei II i a
10
- pentru uz didactic formate este supus unui tip de intervenie, iar cellalt altui tip, urmnd ca scorurile s fie apoi comparate; (c). msurm rspunsurile aceleiai persoane la ntrebri diferite. De exemplu, putem cere unui lot de participani s evalueze printr-o ntr-o singur cifr de la 1 la 10 satisfacia fa de condiiile fizice ale muncii i satisfacia fa de atmosfera de la locul de munc. Condiia esenial este ca ambele evaluri s se realizeze pe aceeai scal n cazul nostru, note de la 1 la 10, unde 1 ar putea fi complet nemulumit, iar 10 complet mulumit. Astfel de grupuri se numesc eantioane perechi sau relaionate. (3). mixte o combinaie a celorlalte dou variante, n care cel puin dou grupuri diferite sunt msurate de cel puin dou ori, iar apoi comparm rezultatele. De exemplu, am putea avea un grup de femei i unul de brbai, crora le msurm rata pulsului nainte i dup susinerea unu i interviu de angajare. Definiii Eantioanele independente sunt reprezentate de grupuri diferite de subieci. Grupurile respective pot fi extrase din populaii diferite sau din aceeai populaie. Eantioanele perechi se refer la situaiile n care acelai grup este msurat de cel puin dou ori sau cercettorul formeaz perechi naturale sau artificiale.
Din pcate ns experiena ne arat c frecvent cercetrile sunt creionate neglijnd complet analizele statistice necesare mai trziu pentru testarea ipotezelor. Ca urmare, designurile sunt construite abia dup ce datele au fost culese, devenind simple formaliti. Singura lor raiune de a fi este c trebuie s apar n raportul de cercetare. Designurile sau mai precis spus retuarea lor devine astfel un panaceu post-hoc al unor cercetri prost conduse (Holmes i Friston, 2003).
12
Sunt puine alte modaliti de a raporta sub form tabelar aceste date, cu excepia unor detalii de prezentare: aranjarea n ordine alfabetic a rndurilor sau coloanelor, n ordinea frecvenelor sau dup orice alt criteriu arbitrar. Prezentarea acestor date se poate realiza i prin reducerea informaiilor, dac o anumit variabil ne intereseaz mai mult n comparaie cu celelalte, precum n tabelul urmtor:
religia frecvena procent ortodox 242 36,77% alii 416 63,22%
3.1.2. Scalele ordinale Se refer la variabilele categoriale pentru care exist o relaie clar de ordine ntre modalitile variabilei. Ordinea respectiv nu poate fi modificat arbitrar, deoarece corespunde unor intensiti sau 13
- pentru uz didactic mrimi diferite ale categoriilor. n psihologie, exemplele cele mai frecvente de scale ordinale se refer la msurarea unor atitudini, preferine etc. (Ct de mult suntei de acord cu afirmaia?; Ce prere avei despre). Nnu putem spune ct de mare este distana dintre dou categorii ale scalei, ci doar c o categorie este inferioar sau superioar uneia alturate (altfel spus, dei ordinea punctelor scalei este fix, diferenele dintre acestea sunt variabile). De exemplu, dac o persoan este de acord cu o afirmaie, iar alta n perfect dezacord, asta nseamn c prima persoan este de trei ori mai de acord cu afirmaia dect a doua persoan? n niciun caz! Ca i n cazul scalelor nominale, este vorba despre simple etichete. De aceea, codarea n SPSS se realizeaz n acelai mod, iar operaiile ari tmetice sunt din nou lipsite de sens n cazul lor. Ca i la scalele nominale, se pot numra ns indivizii/obiectele care fac parte din fiecare categorie, se pot raporta procentajele i valorile mod. Datele pot fi prezentate tabelar ntr -o form similar scalelor nominale. De exemplu, s presupunem c lucrm cu variabila gustul noului iaurt al firmei X, cu modalitile foarte plcut, plcut, nici prea plcut, nici prea neplcut, neplcut, foarte neplcut i nu tiu. Exist o ordine clar i fix ntre categoriile variabilei, dar distana dintre ele nu poate fi calculat.
gustul iaurtului frecvena procent foarte plcut 28 14,5% plcut 44 22,79% nici prea plcut, nici prea neplcut 52 26,94% neplcut 15 7,77% foarte neplcut 24 12,43% nu tiu 30 15,54%
Este permis ns aglutinarea unor modaliti apropiate, dac din punct de vedere logic i semantic este posibil. De exemplu, categoriile foarte plcut i plcut pot fi combinate pentru a da categoria plcut, la fel neplcut i foarte neplcut pentru a da categoria neplcut. Am obine astfel tabelul urmtor:
gustul iaurtului frecvena procent plcut 72 37,3% nici prea plcut, nici prea neplcut 52 26,94% neplcut 39 20,20% nu tiu 30 15,54%
14
15
- pentru uz didactic (2). n scorul total al unei variabile intr i itemi cotai invers. De exemplu, un item care vizeaz optimismul ar putea fi formulat astfel: Cred c ziua de mine nu va aduce nimic bun. Variantele de rspuns sunt (1) deloc de acord; (2) dezacord; (3) nici de acord, nici mpotriv; (4) de acord; (5) total de acord. Dac n instruciunile chestionarului folosit se spune c un scor ridicat obinut la chestionar semnific un nivel ridicat al optimismului, este clar c itemul din exemplu trebuie recodificat, deoarece dac subiectul nostru ar rspunde cu varianta (5) n niciun caz nu va arta mult optimism. De aceea, 5 va deveni 1, 4 va deveni 2, 3 rmne neschimbat, 2 devine 4, iar 1 devine 5. SPSS ne ofer posibilitatea de a recoda automat toi itemii a cror modaliti de rspuns sunt identice (vezi 3.3.2 - Recodarea valorilor unei variabile, pag. 42).
16
4.2. Eantionarea
Pentru a studia o anumit caracteristic a populaiei, avem la dispoziie dou ci (Carnet et al, 2000): metoda exhaustiv i metoda sondajelor. (1). metoda exhaustiv const n contactarea i investigarea tuturor indivizilor care fac parte din acea populaie. Metoda presupune costuri care de regul depesc posibilitile unui cercettor obinuit, i n plus este mare consumatoare de timp. n plus, este posibil ca investigaiile s nu se opreasc niciodat, deoarece noi i noi indivizi se altur populaiei iniiale pe msur ce culegem datele. n cercetarea oferit ca exemplu la nceputul capitolului, ne va fi foarte greu s culegem date de la ntreaga populaie de copii lsai acas de prinii plecai la munc n strintate, chiar dac numrul acestora ar fi relativ sczut. Motivele sunt dou: mereu se vor aduga cazuri noi, iar pn cnd terminm culegerea datelor este posibil ca unii dintre copii s nu se mai ncad reze n criterii (prinii s-au ntors ori i-au luat cu ei). (2). metoda sondajelor presupune extragerea unui eantion din populaia mam i, pe baza rezultatelor obinute la acest nivel, generalizarea ulterioar la ntreaga populaie. Dificultatea este reprezentat de obinerea unui eantion reprezentativ pentru populaie. n exemplul nostru, ct putem fi de siguri c eantionul de copii pe care i-am extras din populaia larg o reprezint cu adevrat? Ct de mare este eroarea pe care o comitem investignd acest eantion i nu populaia n sine? Ct de bine am realizat eantionarea, la urma urmei? Aadar, dei de obicei ntrebarea la care dorim s rspundem prin cercetarea noastr vizeaz ntreaga populaie, de obicei unui cercettor i este imposibil s investigheze fiecare persoan din populaia care l intereseaz. De aceea el va selecta un grup mai mic (eantion) din acea populaie i se va limita la studiul acestuia. Eantioanele sunt adesea structurate sau stratificate astfel nct s reprezinte un anumit segment al populaiei int. Pentru a se asigura c eantionul su seamn ct mai mult cu populaia din care a fost extras, cercettorul va face apel la eantionarea aleatoare. Utiliznd aceast procedur, fiecare element al populaiei are anse egale cu ale celorlalte de a fi inclus n eantion. Dac nu se realizeaz o repartizare aleatoare a subiecilor n grupurile studiate, cercettorul nu poate fi sigur c nu exist un factor, altul dect variabila independent, care s fi produs rezultatele. Eantionarea aleatoare a participanilor crete aadar ansele ca variabilele irelevante pentru cercettor n studiul su s aib o reprezentare egal n situaiile experimentale i astfel s influeneze mai puin rezultatele. n exemplul nostru, repartizarea aleatoare ar putea s evite formarea unor eantioane formate din copii care au participat deja la anumite programe de sprijin sau au beneficiat de alte avantaje. Acesta este motivul pentru care cercettorul nu ar trebui s permit participanilor s aleag grupul din care s fac parte, mai ales cnd scopul studiului este cunoscut. Lungu (2001) ofer un exemplu pentru a ilustra consecinele unei eantionri care nu este aleatoare. n anul 1948, trei dintre cele mai mari institute de sondare a opiniei din SUA (Gallup, Crossley i Roper) au prezis victoria n alegerile prezideniale a republicanului Dewey, n faa democratului Truman. Truman a ctigat ns alegerile, punnd sub semnul ntrebrii modalitatea de eantionare folosit. Ce se ntmplase? Operatorilor care culegeau date li se repartizase un numr fix de interviuri pe care trebuiau s le realizeze, acordndu-li-se libertatea de a alege persoanele intervievate, cu condiia s respecte cteva criterii legate de vrst, gen, ras etc. Problema a fost c rep ublicanii 17
- pentru uz didactic erau mai uor de gsit: aveau telefon, locuiau n case mai bune, aveau slujbe cu mai puine ore suplimentare etc. Aceste variabile au influenat rezultatele sondajelor. Sondajele derulate tiinific astzi se bazeaz pe eantionarea aleatoare: fiecare membru al populaiei are anse egale de a fi selectat pentru interviu (n cazul sondajelor electorale, fiecare cetean cu drept de vot ar avea anse egale de a fi intervievat). Contrar a ceea ce susin emisiunile de scandal, manipularea datelor nu se face neaprat la nivelul rezultatelor, dup ce ele au fost obinute. Soluia elegant este pur i simplu eantionarea preferenial, care este mai puin verificabil. Oamenilor le este virtual imposibil s produc singuri eantioane aleatoare. Kirk (20 08) descrie n acest sens un experiment n care participanilor li se cerea s propun aleator patru numere din intervalul 1-20. Potrivit definiiei eantionrii aleatoare, ar fi trebuit ca eantioanele de forma 1,2,3,4 sau 14, 16, 18, 20 s apar la fel de des ca i altele. Astfel de eantioane au fost ns produse foarte rar, oamenii evitnd s formeze eantioane cu elemente consecutive sau distane egale ntre ele, prefernd n schimb s utilizeze ntreaga lungime a intervalului. i c tot veni vorba, cte persoane ai vzut care la Loto 6 din 49 ar alege numerele 1, 2, 3, 4, 5 i 6? Pentru a obine eantioane aleatoare, putem apela la cteva tehnici consacrate. Una dintre ele este metoda loteriei, prin care fiecrui membru al populaiei i se atribuie un numr unic. Numerele sunt introduse ntr-un recipient i amestecate, apoi sunt extrase cteva numere. Membrii populaiei care au numerele respective vor constitui eantionul. n cazul populaiilor largi, v recomandm utilizarea unui generator automat de numere aleatoare. Un astfel de generator este disponibil gratuit la http://stattrek.com/Lesson3/SamplingTheory.aspx. 4.2.1. Alte tehnici de eantionare aleatoare i nonaleatoare n afara eantionrii aleatoare simple (bazat pe metoda loteriei), exist alte cteva proceduri care produc tot eantioane aleatoare (Kirk, 2008): eantionarea aleatoare sistematic (se mai numete cvasialeatoare) necesit cunoaterea volumului populaiei (notat cu N) i al eantionului dorit s fie investigat (notat cu n). N este mprit la n, obinndu-se un numr oarecare (notat cu X). Apoi se selecteaz aleator (prin metoda loteriei sau una similar computerizat) un numr ntre 1 i X. Pornind de la acest numr, fiecare al X-lea element al populaiei va fi selectat pentru a face parte din eantion. De exemplu, avem 300 de elevi (N) i avem nevoie de un eantion de 30 (n). 300/30=10, deci X=10. Selectm aleator un numr ntre 1 i 10, s zicem 9. Elevul numrul 9 va fi primul membru al eantionului, apoi elevul 19 (9+10), 19 (119+10) .a.m.d. eantionarea aleatorie stratificat populaia este divizat n grupe, n funcie de anumite caracteristici (apartenen de gen, categorii de vrst etc.) Din fiecare grup astfel format sunt selectate eantioane aleatoare, care sunt apoi combinate pentru a obine un singur eantion care s reprezinte populaia. eantionarea multistadial este utilizat n cercetrile ample. Primul pas este formarea mai multor eantioane mari, din care se alege aleator unul. n etapa a doua sunt formate mai multe eantioane aleatoare n interiorul eantionului ales, din care este ales unul singur, tot aleator. Procedura continu pn cnd scopurile sunt atinse sau pn cnd divizarea suplimentar nu mai are sens. Cercetrile fac apel uneori i la tehnici de eantionare nonaleatoare, chiar dac prin acestea reprezentativitatea eantioanelor nu mai este asigurat (ibidem):
18
19
- pentru uz didactic adeseori gsim n asumpiile unor teste statistice exprimarea datele s fie extrase dintr -o populaie normal sau diferenele dintre perechi s fie extrase dintr-o populaie normal. Astfel, cnd vorbim n statistic despre un eantion nelegem deseori setul de date pe care l obinem prin investigarea unui grup relativ restrns de persoane, extras dintr -o populaie n scopul cercetrii. Din acelai punct de vedere, populaia desemneaz setul complet de date, obinut pri n investigarea tuturor persoanelor care ndeplinesc criteriile cerute de cercetare. n exemplul folosit pe parcursul acestui capitol, am nelege prin eantion datele pe care le obinem de la grupul sau grupurile de copii pe care le studiem propriu-zis, iar prin populaie setul complet de date pe care am fi putut s-l obinem prin investigarea tuturor copiilor care ndeplinesc cerinele studiului. Nu trebuie s ne surprind aadar utilizarea termenului eantion de date n locul celui de eantion de persoane. Ambele formulri sunt corecte i acceptate de comunitatea tiinific.
5. Statistica descriptiv
20
- pentru uz didactic inteligen putem obine valorile 110, 125, 98, 90 i 115. Media aritmetic se calculeaz nsumnd valorile (110+125+98+90+115 = 538) i mprind suma obinut la numrul de cazuri (538/5 = 107,6). Este unul dintre indicatorii cei mai utilizai, nu doar n rapoartele de cercetare, ci i n calculele mai complexe ale altor coeficieni. De exemplu, media intr n formula de calcul ai unor indicatori ai dispersiei. Un avantaj i n acelai timp dezavantaj al mediei este c poate fi uor manipulat algebric. Cu alte cuvinte, este puternic influenat de valorile extreme ale distribuiei. Relund exemplul de mai sus, ce s-ar ntmpla dac pe lng coeficienii pe care i-am prezentat am avea nc dou, foarte sczute s zicem 67 i 55. Media ar deveni (67+55+110+125+98+90+115)/7 = 94,28, o valoare mult mai mic dect cea anterioar. La fel, gndii-v c avei un lot de 7 elevi care merg la olimpiad, dintre care 6 iau nota 10 la faza judeean. Ct de mult ar scdea media notelor grupului dac unul ar lua doar nota 5? 5.1.2. Mediana Este valoarea central a unui ir de date ordonate sau acea valoare care mparte irul de date n dou: jumtate deasupra medianei, jumtate sub median. Se noteaz de obicei cu med. Presupunnd c avem la dispoziie notele obinute de 31 de elevi la un test de cunotine, pentru calculul manual al medianei ar fi nevoie n primul rnd de ordonarea datelor, ascendent sau descendent (de la 4 la 10 sau de la 10 la 4). S zicem c obinem urmtoarele date pentru variabila note colare: 4,7,8,10,9,8,10,4,7,7,8,8,9,10,6,7,5,4,4,8,8,10,5,8,7,10,4,5,8,8,6 Primul pas este s le ordonm, s zicem ascendent: 4,4,4,4,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,10,10,10,10,10 Al doilea pas este s gsim locul medianei. Locul medianei se identific dup formula (N+1)/2, unde N este numrul valorilor din ir. Avem 31 de valori, deci locul medianei este (31+1)/2 = 16. Cutm n irul de date ordonate valoarea care se afl pe locul 16; aceea va fi mediana: n cazul nostru, 8. Dac numrul valorilor din ir ar fi fost par, s zicem 30, locul medianei ar fi fost calculat dup aceeai formul: (30+1)/2 = 15,5. Cutm n irul de date valorile 15 i 16, iar apoi facem media aritmetic a acestora. n cazul nostru, valoarea de pe locul 15 este 7, iar de pe locul 6 este 8. Media lor aritmetic este 7,5, deci med = 7,5. Din fericire pentru noi, SPSS va calcula mediana mult mai repede dect v-a luat s citii acest fragment. Singurul lucru care va lua timp va fi introducerea datelor, n rest cteva click-uri cu mouseul dureaz maxim cteva secunde. Am oferit totui exemplele, att pentru medie, ct i pentru median, pentru a nelege logica aflat n spatele calcului acestora. Utilizarea mediei sau a medianei? Exist trei situaii cnd utilizarea medianei este mai avantajoas dect a mediei: (1). avem multe scoruri extreme sau distribuii asimetrice; n aceste situaii media nu este un indicator eficace, deoarece nu este reprezentativ pentru majoritatea distribuiei. Valoarea mediei este puternic afectat chiar i de o singur valoare mult mai mic sau mai mare dect restul (vezi exemplele anterioare). Mediana pe de alt parte este mai
22
24
n concluzie, indicii descriptivi sunt utilizai pentru a descrie un set de date i din acest punct de vedere pot oferi o perspectiv general asupra acestora. Cercetarea nu se poate opri ns la raportarea acestor indici, deoarece putem ajunge la formularea unor generalizri forate. De exemplu, dac media notelor colare a unui eantion este 7,16, iar a altuia este 7,50, ce putem spune despre diferena respectiv? A aprut din ntmplare sau reflect diferene reale? Statistica inferenial ne poate ajuta s rspundem acestei ntrebri. 25
Pe baza acestui tabel, putem s afirmm c din totalul subiecilor (193), 28 de persoane (14,5%) au evaluat gustul iaurtului ca fiind foarte plcut. Definiie Distribuia frecvenelor este o distribuie n care valorile variabilei sunt ncadrate n grafice sau tabele n funcie de frecvena lor de apariie.
Ce s-ar ntmpla ns dac am complica lucrurile, respectiv am raporta rspunsurile subiecilor n funcie de apartenena de gen? O astfel de procedur ar oferi date suplimentare despre adresabilitatea iaurtului respectiv, sub forma unui tabel de contingen. Definiie Tabelele de contingen evideniaz sub forma unei matrici relaia dintre dou sau mai multe variabile categoriale. Csuele unui astfel de tabel sunt mutual exclusive: o valoare poate fi ncadrat unei singure csue.
f % f F % M
Totalul frecvenelor f dintr-un tabel de contingen reprezint numrul persoanelor care au participat la cercetare (193 n cazul nostru). Fiecare csu reprezint o intersecie a dou variabile; de exemplu, csua din dreapta jos cuprinde femeile care au rspuns nu tiu cnd au evaluat gustul iaurtului. Kirk (2008) distingea cinci situaii cnd se utilizeaz tabelele de contingen:
Gen
26
6. Testarea ipotezelor
Smith et al (2005) evideniau doi pai eseniali ai cercetrii tiinifice: generarea unei ipoteze tiinifice i testarea acesteia.
- pentru uz didactic despre un anumit fenomen (Smith et al, 2005). Utilizarea repetat a termenului tiinific subliniaz faptul c metodele de cercetare utilizate n culegerea datelor sunt neutre (nu favorizeaz niciuna dintre ipoteze) i sigure (alte persoane calificate pot repeta studiul pentru a obine rezultate similare) . Dincolo de ineditul fiecreia, utilitatea teoriilor depinde de satisfacerea ctorva cerine eseniale: s fie testabile; s stimuleze cercetarea prin postulatele lor; s permit organizarea contraexperimentelor; s clarifice i s explice datele obinute pe baza cercetrii, organizndu -le ntr-un cadru coerent; s ajute la nelegerea i predicia comportamentelor, la modificarea compor tamentelor i emoiilor. Din acest punct de vedere, Clocotici i Stan (2001, p. 105) subliniau c din punct de vedere metodologic calitatea esenial a unei teorii tiinifice este aceea c poate fi, direct sau indirect, confirmat de datele empirice. Teoria trebuie s fie capabil aadar s genereze ipoteze care vor fi apoi testate, devenind tiinific n msura n care poate face proba respingerii sale. De exemplu, Sokolov explica funcionarea ateniei involuntare prin legturile funcionale dintre cortex i formaiunea reticulat (apud Cioar, 2006). Informaia sosete la cortex pe dou ci, una direct, iar cealalt prin intermediul formaiunii reticulate. Mesajul este analizat n zonele specifice de proiecie, iar dac la acest nivel exist un model acceptor al stimulului receptat, cortexul inhib circuitul secundar, blocnd activarea formaiunii reticulate. Invers, cnd cortexul nu recunoate inputul proaspt sosit, el nu va mai bloca mesajul venit prin intermediul formaiunii reticulate, ceea ce va suplimenta activarea cortical deja existent. n acest fel, stimulul receptat va beneficia de resurse suplimentare de procesare, impunndu-se prioritar n cmpul contiinei (atenie involuntar). O astfel de teorie ar putea sta la baza formulrii unei ipoteze precum cea care afirm c vizionarea filmelor horror duce la creterea reactivitii emoionale.
28
29
- pentru uz didactic Raionamentul este corect pn aici. Ce se ntmpl ns dac inversm consecina (B) cu premisa (A)? Raionamentul ar arta astfel: A B: Berea tradiional (A) are () gust amrui (B). B Iat ceva ce are gust amrui. A? De aceea, acel ceva este o bere tradiional. Raionamentul este evident greit, acel ceva poate fi ciocolat amruie sau Paracetamol. Eroarea pe care am realizat-o se numete afirmarea consecinei. Transpunerea acestui raionament greit n termenii ipotezelor statistice ar arta astfel: A B: B A? Dac ipoteza nul este adevrat, atunci pragul de semnificaie este mai mare de 0,05. Pragul este mai mare de 0,05. De aceea, ipoteza nul este adevrat.
n exemplul cu berea, n cazul raionamentului greit nu aveam voie s spunem Acel ceva este bere, deoarece era greit. La fel, n exemplul anterior nu avem voie s spunem Ipoteza nul este adevrat, pentru c este tot greit. Logica vine ns n sprijinul statisticii, printr-un alt tip de regul, pe care o prezentm sub form de exemplu: A B: nonB nonA Berea tradiional (A) are () gust amrui (B). Iat ceva ce nu are gust amrui. De aceea, acel ceva nu este bere Silva.
n termenii ipotezelor statistice, regula ar fi transpus astfel: A B: nonB nonA Dac ipoteza nul este adevrat, atunci pragul de semnificaie este mai mare de 0,05. Pragul de semnificaie nu este mai mare de 0,05 (este mai mic). De aceea, ipoteza nul este fals.
Dac ipoteza nul este fals, nseamn c ipoteza specific trebuie s fie adevrat. Aceasta este logica testrii ipotezelor n cercetarea tiinific. Gravetter i Wallnau (2009) asemnau aceast procedur cu aceea a unui proces cu jurai:
Logica testrii ipotezelor ncepe cu formularea ipotezei nule, care susine c relaia dintre variabile se datoreaz hazardului; Procesul cu jurai ncepe cu ipoteza nul care susine c acuzatul este nevinovat (pn la proba contrarie) prezumia de nevinovie;
cercetarea tiinific i propune s caute Poliia caut dovezi pentru a arta c dovezi pentru a arta c exist diferene acuzatul este vinovat; ntre grupe, c variabila independent are efect, c variabilele se asociaz etc.; n ambele cazuri, scopul este respingerea ipotezei nule.
30
Sava (2004) sumarizeaz cinci caracteristici ale testrii ipotezelor: (1). se pornete de la premisa c ipoteza nul este adevrat; (2). ipoteza nul nu poate fi adeverit, ci doar respins; (3). decizia de a respinge ipoteza nul se ia pe baza unui prag de semnificaie (vezi 6.3 - Pragurile de semnificaie, pag. 85); (4). ipoteza nul nu nseamn neaprat ipoteza absenei Foarte muli cercettori neleg prin ipoteza nul absena corelaiei sau a diferenei dintre medii. Sava subliniaz ns c ipoteza nul nu se formuleaz negnd ipoteza specific, deoarece se ncalc logica inferenei. De exemplu, dac ipoteza specific se formuleaz astfel: Exist diferene ntre i ntre, ipoteza specific nu se formuleaz prin negare (Nu exist diferene ntre i ntre). Exprimarea corect este Diferenele dintre i se datoreaz ntmplrii. (5). testarea ipotezelor privete populaiile din care au fost extrase eantioanele studiate. 6.2.2. Ipoteze bilaterale i unilaterale n unele situaii este bine ca ipoteza s specifice direcia relaiei dintre va riabile, indiferent dac relaia este una cauzal sau de asociere, ori este vorba despre diferene ntre eantioane. Dac se precizeaz sensul relaiei dintre variabile, vorbim despre ipoteze unidirecionale sau unilaterale. De exemplu: Brbaii fumeaz mai mult dect femeile (pentru diferene ntre grupuri); Nivelul angajamentului organizaional crete dup intervenia specialistului (pentru studii experimentale); Exist o relaie de asociere pozitiv ntre numrul de goluri nscrise pe meci i numru l meciurilor ctigate (pentru studii corelaionale). O ipotez unilateral se formuleaz dac datele anterioare, limitrile fizice sau simul comun ne spun c dac ar exista o diferen ntre grupuri, aceasta nu se poate manifesta dect ntr -o direcie. Alegerea unei ipoteze unilaterale este util printre altele i pentru c exist anse mai mari ca ipoteza s fie sprijinit (Sava, 2004), deoarece un test unilateral njumtete gradul de semnificaie De exemplu, riscul de a grei de 3% n cazul unui test bilateral se transform ntr-unul de 1,5% n cazul unui test unilateral. Alegerea unei ipoteze unilaterale ridic ns o problem: ce se ntmpl dac observm o diferen mare ntre medii, dar nu n direcia ateptat, ci invers? Pentru a fi riguroi, ar trebui s concluzionm c diferenele se datoreaz hazardului, indiferent ct de mare este diferena nregistrat. Acesta este unul dintre motivele pentru care sunt preferate ipotezele bilaterale. Dac direcia relaiei nu este precizat, vorbim despre ipoteze bidirecionale sau bilaterale. De exemplu:
31
- pentru uz didactic Exist diferene ntre brbaii fumtori i femeile fumtoare n ceea ce privete numrul igrilor fumate pe zi (pentru diferene ntre grupuri); Exist diferene ntre pretest (naintea inerveniei) i posttest (dup intervenie) n ceea ce privete nivelul angajamentului organizaional (pentru studii experimentale); Exist o relaie de asociere ntre numrul de goluri nscrise pe meci i numrul meciurilor ctigate (pentru studii corelaionale).
32
- pentru uz didactic Cnd o cercetare ajunge la concluzia c nu exist diferene semnificative statistic, nu trebuie s credem neaprat c tratamentul sau intervenia nu a avut efect. Este posibil ca un efect minim s existe, dar nu a fost detectat de testul statistic din cauza eantionului mic sau a varianei prea mari a datelor. Afirmnd c nu exist diferene ntre grupurile comparate, cnd de fapt acestea exist, comitem ceea ce se numete eroarea de tip II. n interpretarea unor astfel de rezultate, trebuie s ne ntrebm ct de mare este puterea cercetrii n a identifica diferenele menionate n ipotez, dac acestea exist. Puterea cercetrii depinde de mrimea eantionului i de variana intragrup, cuantificat de abaterea standard. n mod ideal, ceea ce dorim este ca procedura statistic pe care o utilizm s ne spun ct mai corect dac exist de fapt diferene ntre eantioane. Este ceea ce se numete puterea unui test. Procedurile statistice difer n ceea ce privete aceast calitate. Testele parametrice sunt mai puternice dect echivalentele lor neparametrice, dar exist i ali factori de care trebuie s inem seama, cum ar fi de exemplu mrimea eantionului. Dup Stevens (1996), cnd eantionul este suficient de mare (mai mult de 100 de participani), puterea testului nu este o problem (apud Pallant, 2005). n studiile cu eantioane mici ns crete riscul de a obine rezultate nesemnificative, datorit puterii sczute a testelor. Exist autori care propun chiar creterea pragului alpha la 0,10 sau 0,15 pentru a compensa acest lucru. n concluzie, cele dou tipuri de erori reprezint oarecum capete ale unei axe. ncercnd s controlm eroarea de tip I (s scdem valoarea pragului alpha cu care dorim s lucrm, astfel nct s eliminm diferenele care apar din ntmplare), cresc ansele de a comite eroarea de tip II (de a afirma c diferenele sunt datorate ntmplrii, cnd de fapt ele sunt reale). Raportul dintre eroarea de tip I, eroarea de tip II i variantele corecte poate fi ilustrat prin acelai exemplu al procesului judiciar:
Decizia de acceptare a ipotezei nule consecina: eliberm acuzatul Ipoteza nul este adevrat, deci acuzatul este nevinovat Ipoteza nul este fals, deci acuzatul este vinovat decizie corect acuzatul este nevinovat i este eliberat eroarea de tip II acceptm ipoteza nul, dei nu ar fi trebuit eliberm acuzatul, chiar dac este vinovat Decizia de respingere a ipotezei nule consecina: condamnm acuzatul eroarea de tip I respingem ipoteza nul, dei nu ar fi trebuit acuzatul este condamnat pe nedrept
(1). n csua din stnga sus, avem situaia n care acceptm ipoteza nul, aceea c acuzatul este nevinovat, i el chiar este nevinovat. Decizia de a-l elibera este deci corect. (2). n csua din dreapta jos, avem situaia n care respingem ipoteza nul (aceeai, conform creia acuzatul este nevinovat), iar el chiar este vinovat. Decizia de a-l condamna este din nou corect. (3). n csua din dreapta sus este ilustrat eroarea de tip I: respingem incorect ipoteza nul, acuzatul fiind de fapt nevinovat, i l condamnm. n statistic, am spune c exist diferene ntre eantioane, cnd de fapt acestea se datoreaz ntmplrii. (4). n csua din stnga jos este ilustrat eroarea de tip II: acceptm incorect ipoteza nul, acuzatul fiind de fapt vinovat, i l eliberm. n statistic, am spune c diferenele dintre eantioane se datoreaz ntmplrii, cnd de fapt sunt reale.
34
35
n acest grafic, pe axa Ox apar valorile variabilei note colare, de la cea minim (4) la cea maxim (10). Pe axa Oy sunt trecute frecvenele pentru fiecare valoare, de la cea mai mic (2) la cea maxim (9). Fiecare dreptunghi din grafic ilustreaz astfel ci membri ai eantionului au obinut scorul respectiv. n cazul nostru, 5 elevi au luat nota 4, 3 elevi au luat nota 5, 2 elevi au luat nota 6 etc. Linia erpuit care unete mijloacele superioare ale dreptunghiurilor din grafic poart numele de curba distribuiei. Inspectarea vizual a acesteia poate s ofere un prim indiciu despre forma distribuiei, dei de obicei este puin concludent.
distribuie unimodal
distribuie bimodal
distribuie multimodal
Distribuiile bimodale pot fi un indicator al faptului c exist o variabil neluat n calcul de cercettor i care afecteaz distribuia. De exemplu, pentru variabila lungimea prului vom nregistra probabil dou vrfuri, unul indicnd aglomerarea scorurilor pentru femei, iar cellalt pentru brbai. Distribuiile multimodale ilustreaz de obicei fenomene ciclice; de exemplu, variabila numr de nari ar putea s aib o astfel de distribuie. (2). Oblicitatea arat dac scorurile obinute de subieci au tendina de a fi mai mari sau mai mici. ntr-o distribuie nclinat spre dreapta, scorurile mari sunt mai multe dect cele mici (situaia se mai numete asimetrie negativ). Exemplul clasic este cel al unui test foarte uor, la care foarte
36
asimetrie pozitiv
asimetrie negativ
distribuie simetric
distribuie simetric
distribuie simetric
Distribuia n care cele dou jumti ale curbei distribuiei (din stnga i din dreapta centrului) au aceeai form se numete simetric. Definiie ntr-o distribuie simetric, trasarea unei linii verticale prin mijlocul graficului creeaz forme similare pe cele dou pri, ca ntr-o oglind.
Evaluarea statistic a simetriei se realizeaz cu ajutorul indicatorului de oblicitate ( skewness). Dac valoarea acestuia este 0, atunci distribuia noastr este perfect simetric. O valoare pozitiv a coeficientului arat aglomerarea valorilor n partea stng a graficului (asimetrie pozitiv), iar o valoare negativ indic aglomerarea n partea dreapt (asimetrie negativ).Din punct de vedere statistic vom spune ns c o distribuie este asimetric pozitiv sau negativ doar dac valorile indicatorului de oblicitate sunt n afara intervalului [-,80; +,80]. O valoare aflat n acest interval poate fi nc tratat ca un semn al unei distribuii simetrice (Lewis-Beck, 1995, apud Sava, 2004).
dac skewness este atunci distribuia este i este posibil s arate cam aa:
(3). Boltirea arat ct de mprtiate sunt scorurile n jurul valorii centrale sau altfel spus ct de mare este variana acestora. Dac variana este mare distribuia va fi aplatizat, turtit, iar dac variana este mic distribuia va fi ascuit. Evaluarea boltirii se poate realiza cu ajutorul indicatorului de boltire (kurtosis). Dac valoarea coeficientului este 0, atunci distribuia este 37
- pentru uz didactic perfect mezocurtic (nici prea aplatizat, nici prea ascuit). Cnd coeficientul este pozitiv, distribuia este ascuit sau leptocurtic (valorile se aglomereaz n jurul mediei). Cnd coeficientul este negativ, distribuia este aplatizat sau platicurtic (valorile se mprtie spre extreme). O serie de autori accept ca aproximativ mezocurtic o distribuie cu un coeficient de boltire cuprins ntre -1,00 i 1,00 (Kirk, 2008).
dac kurtosis este atunci distribuia este i este posibil s arate aa
-1,00 platicurtic
1,00 leptocurtic
38
S lum un exemplu pentru a nelege aplicaiile acestor proprieti i de unde provin acel e cifre. Imaginai-v c avei un autoturism care, conform crii tehnice, consum n medie 5,5l/100km. Statisticile productorului afirm c abaterea standard a consumului este de 0,7l/100km. S spunem c ntr-o cltorie computerul de bord ne indic faptul c am consumat n medie 4,8l/100km i dorim s tim unde se ncadreaz acest consum. Cunoscnd media i abaterea standard, i presupunnd c distribuia este normal, putem stabili procentajul de cazuri n care am consumat o anumit cantitate de combustibil. n exemplul nostru, n 34,13% din cazuri am realizat un consum ntre 4,8 i 5,5l/100km. Cnd afirmm acest lucru ne bazm pe o proprietate a distribuiei normale (vezi figura anterioar), anume c ntre medie i minus o abatere standard se gsesc 34,13% din cazuri (m = 5,5; = 0,7; m- = 4,8). Putem s mergem mai departe i s afirmm, pe baza aceleiai proprieti, c n 68,27% din cazuri consumm ntre 4,8 i 6,2l/100km. Ce se ntmpl ns dac valorile crora dorim s le identificm poziiile n distribuie nu coincid cu valorile obinute prin adunarea mediei i a abaterii standard? Soluia este transformarea acestora n scoruri standardizate. Dintre acestea, cele mai utilizate sunt scorurile z, a cror medie este 0 i abaterea standard 1. Distribuia z fiind una normal, ntre z = -1 i z = 1 se gsesc 68,27% din cazuri, ntre z = -2 i z = 2 se gsesc 95,44% din cazuri. Scorurile z la care se face de obicei raportarea sunt ns 1,96 i 2,58. ntre z = --1,96 i z = 1,96 se gsesc 95% din cazuri, iar ntre z = -2,58 i z = 2,58 se gsesc 99% din cazuri. Acestea sunt valorile pe care ar fi bine s le reinei. n cazul n care trebuie s calculai procentul cazurilor aflate ntre alte valori z putei consulta un tabel special ntocmit de statisticieni pentru a v ajuta. La adresa http://www.intmath.com/Counting-probability/z-table.php gsii gratuit un astfel de tabel, care arat procentajul cazurilor cuprinse ntre medie i scorul z. Prezentm mai jos doar o parte, pentru a ilustra procedura de lucru.
z ,0 ,1 ,2 0,00 0,0000 0,0398 0,0793 0,01 0,0040 0,0438 0,0832 0,02 0,0080 0,0478 0,0871 0,03 0,0120 0,0517 0,0910 0,04 0,0160 0,0557 0,0948 0,05 0,0199 0,0596 0,0987 0,06 0,0239 0,0636 0,1026 0,07 0,0279 0,0675 0,1064 0,08 0,0319 0,0714 0,1103 0,09 0,0359 0,0753 0,1141
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
39
- pentru uz didactic 0,4938 2,5 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
n prima coloan trebuie cutat cifra ntreag i prima cifr de dup virgul a lui z. Pe primul rnd trebuie cutat a doua cifr de dup virgul a lui z. De exemplu, pentru un z = 0,23, procentul cazurilor aflate ntre medie i z este de 9,1% (n csu apare 0,0910). Cutnd z = 1,96, vedem c ntre medie i z se afl 47,50% din cazuri. Aceasta nseamn c n intervalul [m-z; m+z] se gsesc de dou ori mai multe: 95% din cazuri. 5% se vor afla n afara acestui interval, repartizate cte 2,5% n cele dou extremiti ale distribuiei. Similar, pentru z = 2,58 vedem c ntre medie i z se gsesc 49,51% din cazuri, deci n intervalul [m-z; m+z] se gsesc de dou ori mai multe: aproximativ 99%. 1% din cazuri se gsesc n afara acestui interval, repartizate cte 0,5% n cele dou extremiti ale distribuiei. Pentru a ilustra grafic ceea ce reprezint tabelul, urmrii figura urmtoare:
Partea haurat este ceea ce ne indic cifrele din tabel. Astfel, n intervalul cuprins ntre medie i z = 1,96 gsim un procentaj de 47,50% din cazuri. De aceea, n intervalul m+/ - z = 1,96 procentajul va fi dublu: 95%. Revenind la exemplul nostru cu consumul de carburani, pentru a afla procentajul cazurilor n care consumm ntre 6,5 i 7l/100km, vom transforma cele dou valori n cote z. Formula de transformare este
n care x este valoarea variabilei pe care dorim s o transformm, m este media populaiei, iar este abaterea standard a populaiei. Pentru x = 6,5 z este (6,5-5,5)/0,7 = 1,42, iar pentru x = 7 z este (7-5,5)/0,7 = 2,14. Cutnd n tabel, pentru z = 1,42 procentul cazurilor dintre medie i z este de 42,28%, iar pentru z = 2,14 procentul este de 48,38%. Acesta nseamn c ntre cele dou valori z avem un procent de 48,38-42,28 = 6,16. Aadar, n 6,16% din cazuri am consumat ntre 6,5 i 7l/100km. Atenie, pentru z gsii mai multe tipuri de tabele: unele arat procentul cazurilor aflate ntre medie i scorul z respectiv, altele arat procentajul cazurilor aflate n intervalul [m -z; m+z], iar altele arat procentajul cazurilor aflate n afara acestor intervale. Procedura de lucru este identic, ns trebuie s fii ateni la ce indic tabelul respectiv.
40
- pentru uz didactic recomandm s citii 6.3 - Pragurile de semnificaie, pag. 85, i 8.3 - Inferena statistic i pragurile de semnificaie (alpha), pag. 109. Interpretarea testului KS depinde nu doar de valoarea pragului de semnificaie, ci i de mrimea eantionului.
valoarea pragului de semnificaie mic (<0,05) mare (>0,05) volumul eantionului oricare mare concluzie Este puin probabil ca datele s aib distribuie gaussian. Datele au trecut testul normalitii. Probabil populaia are distribuie normal. Putem fi tentai s afirmm c distribuia populaiei este normal. Nu putem exclude posibilitatea ca din cauza volumului mic eantionul s nu ofere suficiente date pentru a discrimina ntre distribuia normal i cea nongaussian.
mare (>0,05)
mic
Atragem atenia asupra faptului c verificarea formei distribuiei se realizeaz doar pentru variabile continue; nu se efectueaz o astfel de verificare pentru variabile categoriale.
42
8. Inferena statistic
8.1. Clarificri conceptuale
Inferena statistic are sensuri diferite, n funcie de modul de abordare (Rozeboom, 1960). Pentru matematicieni, este un sistem complicat de calcule avansate, poate cu mai puin semnificaie empiric. Pentru filosofi, este un mister care nc mai necesit clarificare conceptual. Pentru cercettorul din tiinele socioumane, din psihologie n special, ea este un instrument subordonat cercetrii, un mecanism prin care date teoretic nelimitate pot fi rafinate pentru a obine un produs asimilabil de lumea tiinei. Pentru a fi siguri c pornim de la lucruri cunoscute, dorim n primul rnd s amintim ce nelegem prin termenii a infera i inferen statistic (vezi i 4.4 - Estimarea caracteristicilor populaiei pe baza datelor obinute de la eantioane, pag. 51-52). Procedurile de inferen statistic sunt utilizate pentru a formula generalizri de la nivelul eantionului la nivelul populaiei; altfel spus, prin inferen dorim s stabilim dac rezultatele obinute n cercetarea noastr pe eantionul nostru sunt obinute din ntmplare sau dac, pstrnd o anumit marj de eroare, putem spune c ele reflect caracteristicile reale ale populaiei. Deja n 1925 Fisher afirma c una dintre ideile de baz ale statisticii este aceea a unei populaii infinite de date, repartizate ntr-o distribuie a frecvenelor pentru o variabil dat. Dar, de vreme ce nu putem investiga toat populaia, va trebui s ne mulumim cu msurarea limitat a unui eantion. Astfel ne putem face o idee despre populaia din care datele noastre sunt extrase i totodat despre alte posibile eantioane pe care le vom extrage n viitor din acea populaie. Este evident c luarea deciziilor cu privire la populaii, pe baza unor date restrnse culese de la eantioane, este supus unui anumit grad de eroare. Statistica inferenial a fost dezvoltat pentru a mbunti acest proces de luare a deciziei, deoarece observaiile succesive ale eantioanelor evideniau un anumit grad de variabilitate, dei se realizau n condiii aparent identice. Variabilitatea poate fi una inerent fenomenului investigat sau participanilor, se poate datora erorilor de msurare, modificrilor nedetectabile ale condiiilor de observare sau unei combinaii a acestor factori (Kirk, 2008).
43
- pentru uz didactic Pentru a ilustra relaia dintre populaie i eantion, precum i logica inferenei statistice, Lungu (2001) oferea un exemplu inspirat. Presupunnd c fierbem o oal de fasole, cum ne dm seama c fasolea este fiart? Ar fi absurd s gustm toate boabele (s msurm toat populaia). Procedura cea mai simpl este de a amesteca i de a scoate cteva boabe, pe care le gustm. Dac acesta sunt fierte, decibidem c i restul boabelor sunt fierte. Metodele statistice au exact acest rol, de a estima cu un anumit grad de precizie dac populaia reflect caracteristicile eantionului. n cazul nostru, echivalentul ar fi s decibidem dac toate boabele de fasole (populaia) sunt fierte, pornind de la gustarea (msurarea) ctorva boabe (eantion).
44
- pentru uz didactic Dac valoarea pragului este mai mic de 0,01, ansele de a obine rezultatele respective din ntmplare este chiar mai mic, de 1%. Dac valoarea pragului este de peste 0,05, atunci afirmm c datele nu ofer dovezi pentru a susine existena diferenelor dintre medii. Nu nseamn c mediile sunt egale, ci doar c nu avem dovezi pentru a susine existena diferenelor dintre ele. Cercettorul este ns cel care decide la care valoare a pragului de semnificaie va face raportarea rezultatelor. Exist situaii n care poate decide scderea valorii pragului, pentru a evita comiterea erorii de tip I, sau situaii n care poate decide creterea valorii acestuia, pentru a evita comiterea erorii de tip II (vezi 6.4 Tipuri de erori, pag. 86-89).
Bibliografie
Carnec, H., Dagoury, J.M., Seroux, R., Thomas, M. (2000). Itineraires en Statistiques et Probabilits. Paris: Ellipse Marketing. Cioar, M. (2006). Atenia. n E. Bonchi (coord.), Psihologie general (pp. 217-249). Oradea: Editura Universitii din Oradea. Clocotici, V., & Stan, A. (2001). Statistic aplicat n psihologie. Iai: Editura Polirom. Diener, E., Emmons, R.A., Larsen, R.J., Griffin, S. (1985). The Satisfaction with Life Scale. Journal of Personality Assessment, 49, 71-75. Fisher, R.A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver and Boyd. Disponibil online la http://psychclassics.yorku.ca/Fisher/Methods/; data consultrii: 30.08.2010. Gravetter, F.J., Wallnau, L.B. (2009). Statistics for the Behavioral Sciences. Belmont, USA: Wadsworth, Cengage Learning. Holmes, A.P., Friston, K.J. (1997). Statistical Models and Experimental Design. In R.S.J. et al (eds), Human Brain Function (pp. 94-141). USA: Academic Press. Howitt, D., Cramer, D. (2006). Introducere n SPSS pentru psihologie. Iai: Editura Polirom. Kirk, R.E. (2008). Statistics: An Introduction. Belmont: Thomson Wadsworth.
46
47