Sunteți pe pagina 1din 55

Testul z pentru un singur esantion

Arhitectura constructii

Testul z pentru un singur esantion


Situatia de care ne-am servit pentru exemplul de mai sus este plauzibila dar putin probabila pentru o cercetare reala. Procedura utilizata, nsa, este una care defineste unul dintre testele statistice de semnificatie, numit "testul z pentru un singur esantion". Avnd n vedere faptul ca una din conditiile de aplicare ale acestuia este utilizarea unui esantion de minim 30 de subiecti (acceptat ca esantion "mare", n conformitate cu teorema limitei centrale), acest test este prezentat si ca "testul z pentru esantioane mari". Testul z se poate utiliza atunci cnd cunoastem media si abaterea standard a unei populatii[1][1] si dorim sa stim daca un esantion experimental face parte din aceasta populatie sau nu. Dat fiind faptul ca putine variabile de interes pentru psihologie au medii si abateri standard calculate la nivelul populatiei, acest test statistic nu este printre cele frecvent utilizate n cercetarea psihologica. Utilitatea lui este data, mai ales, de caracterul elementar, care permite introducerea unor notiuni fundamentale de teorie a ipotezelor statistice. Cu toate acestea, testul z nu poate fi ignorat, existnd destule situatii n care si poate dovedi utilitatea, chiar daca variabilele pentru care se cunosc parametrii populatiei nu sunt numeroase. De exemplu, un psiholog clinician poate testa ipoteza conform careia femeile cu depresie cronica sunt mai scunde dect media, comparnd media unui esantion de paciente cu media de naltime e femeilor, preluata din studii antropometrice. De asemenea, sunt destule cazurile n care populatia cercetarii nu este att de extinsa nct sa nu i se poata afla parametrii. De exemplu, dupa o evaluare la statistica se poate observa ca una dintre grupele unui an de studiu a obtinut o medie mai redusa dect celelalte. Pentru a testa ipoteza ca aceasta valoare este semnificativ mai mica fata de rezultatul ntregului an de studiu, este suficient sa efectuam testul z n raport cu media "populatiei" care, n acest caz, este data de media studentilor participanti la examen. Decizii statistice unilaterale si bilaterale Sa revenim, pentru moment, la exemplul nostru anterior. Ipoteza de la care am pornit a fost aceea ca cineva poate identifica subiectii cu inteligenta peste medie. Ca urmare, ne-a interesat sa vedem n ce masura rezultatul nostru confirma ipoteza pe directia valorilor din dreapta curbei normale (valori mari, cu z pozitiv). Am efectuat ceea ce se numeste un test unilateral (one-tailed). Daca mediumul ar fi pretins ca poate identifica subiectii cu inteligenta sub medie am fi procedat tot la un test unilateral, dar n partea stnga a curbei (valori mici, cu z negativ). n aceste doua situatii am fi avut acelasi z critic (1.65) cu semnul + sau - n functie de zona scalei pentru care faceam testarea. Imaginea de mai jos ilustreaza grafic cele doua directii de testare a ipotezelor statistice unilaterale si ariile valorilor semnificative/nesemnificative, n functie de valoarea critica a lui z.

Ce s-ar fi ntmplat, nsa, daca esantionul extras de medium ar fi obtinut un scor QI=96, ceea ce ar fi corespuns unui scor z=-1.36? n acest caz, aplicnd un test unilateral, conform ipotezei, am fi verificat doar masura n care ar putea fi depistati cei cu inteligenta peste medie, ignornd posibilitatea ca rezultatul sa cada n zona extrema opusa, a celor cu inteligenta sub medie. Aceasta ar nsemna ca mediumul, desi pretinde ca poate indica persoanele inteligente, este de fapt "sensibil" la cele neinteligente. Pentru a verifica ipoteza pe ambele laturi ale distributiei se aplica ceea ce se numeste testul z bilateral (two-tailed). n acest caz se pastreaza acelasi nivel alfa (0.05), dar el se distribuie n mod egal pe ambele extreme ale curbei, astfel nct pentru 2.5% de fiecare parte, avem un z critic de 1.96 (cu semnul - sau +). Aceasta valoare este luata din tabelul ariei de sub curba, n dreptul probabilitatii 0.4750 care corespunde unei probabilitati complementare de 0.025 (echivalent cu 2.5%).

Figura de mai sus indica scorurile critice pentru testul z bilateral. Se observa ca, n cazul alegerii unui test bilateral (z=1.96), nivelul E de 5% se mparte n mod egal ntre cele doua laturi ale curbei. Este de la sine nteles faptul ca semnificatia statistica este mai greu de atins n cazul unui test bilateral dect n cazul unui test unilateral. Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercetatorului. De regula nsa, se prefera testul bilateral. Motivul l constituie necesitatea de a introduce mai multa rigoare si de a lasa mai putin loc hazardului. Se alege testul unilateral doar atunci cnd suntem interesati de evaluarea

semnificatiei strict ntr-o anumi 111q161b ta directie a curbei, sau atunci cnd miza rezultatului este prea mare nct sa fie justificata asumarea unui risc sporit de eroare. n mod uzual, ipotezele statistice sunt testate bilateral, chiar daca ipoteza cercetarii este formulata n termeni unilaterali. Testarea unilaterala este utilizata numai n mod exceptional, n cazuri bine justificate. O scurta discutie pe tema nivelului alfa minim acceptabil (0.05) se impune, avnd n vedere faptul ca ntregul esafodaj al deciziei statistice se sprijina pe acest prag. Vom sublinia, din nou, ca p=0.05 este un prag de semnificatie conventional, impus prin consensul cercetatorilor din toate domeniile, nu doar n psihologie. Faptul ca scorul critic pentru atingerea pragului de semnificatie este 1.96 a jucat, de asemenea, un rol n impunerea acestei conventii. Practic, putem considera ca orice ndepartare mai mare de doua abateri standard de la media populatiei de referinta este semnificativa. Chiar daca persista posibilitati de a ne nsela, ele sunt suficient de mici pentru a le trece cu vederea. Impunerea unui prag minim de semnificatie a testelor statistice are nsa, mai ales, rolul de a garanta faptul ca orice concluzie bazata pe date statistice raspunde aceluiasi criteriu de exigenta, nefiind influentata de subiectivitatea cercetatorului. Nivelul alfa de 0.05 nu este dect pragul minim acceptat. Nimic nu mpiedica un cercetator sa si impuna un nivel mai exigent pentru testarea ipotezei de nul. n practica mai este utilizat pragul de 0.01 si, mai rar, cel de 0.001. Toate aceste praguri pot si exprimate si n procente, prin opusul lor. Astfel, printr-o probabilitate de 0.05 se poate ntelege si un nivel de ncredere de 95% n rezultatul cercetarii (99%, pentru p=0.01 si, respectiv, 99.9% pentru p=0.001). n fine, este bine sa subliniem faptul ca utilizarea acestor "praguri" vine din perioada n care nu existau calculatoare si programe de prelucrare statistica. Din acest motiv, cercetatorii calculau valoarea testului statistic pe care apoi o comparau cu valori tabelare ale probabilitatii de sub curba de referinta. Pentru a face mai practice aceste tabele, ele nu cuprindeau toate valorile de sub curba ci doar o parte dintre acestea, printre ele, desigur, cele care marcau anumite "praguri". Rezultatul cercetarii era raportat, de aceea, prin invocarea faptului de a fi "sub" pragul de semnificatie sau "deasupra" sa. Odata cu diseminarea pe scara larga a tehnicii de calcul si cu aparitia programelor de prelucrari statistice, semnificatia valorilor testelor statistice nu mai este cautata n tabele ci este calculata direct si exact de catre program, putnd fi afisata ca atare.

Testul t pentru un singur esantion


Asa cum am precizat mai sus, testul z poate fi utilizat doar atunci cnd cunoastem media populatiei de referinta si avem la dispozitie un esantion "mare" (adica de minim 30 de subiecti, n cazul unei variabile despre care avem motive sa credem ca se distribuie normal). Putine sunt variabilele utilizate n psihologie pentru care sa dispunem de masuratori la nivelul populatiei. n plus, nu ntotdeauna putem avea esantioane "mari" (minim 30 de subiecti). Pentru situatiile care nu corespund acestor conditii, testul z nu poate fi aplicat. si aceasta, pentru ca distributia mediei de esantionare urmeaza legea curbei normale standardizate doar pentru esantioane de minim 30 de subiecti, conform teoremei limitei centrale. La nceputul secolului XX, William Gosset, angajat al unei companii producatoare de bere din SUA, trebuia sa testeze calitatea unor esantioane de bere pentru a trage concluzii asupra ntregii sarje. Din considerente practice, el nu putea utiliza dect esantioane (cantitati) mici de bere. Pentru a rezolva problema, a dezvoltat un model teoretic propriu, bazat pe un tip

special de distributie, denumita distributie t, cunoscuta nsa si ca distributia "Student", dupa pseudonimul cu care a semnat articolul n care si-a expus modelul. n esenta, distributia t este o distributie teoretica care are toate caracteristicile unei distributii normale (este perfect simetrica si are forma de clopot). Specificul acestei distributii consta n faptul ca forma ei (mai exact, naltimea) depinde de un parametru denumit "grade de libertate" (df sau degrees of freedom), care este egal cu N-1 (unde N este volumul esantionului). Acest parametru poate fi orice numar mai mare dect 0, iar marimea lui este aceea care defineste forma exacta a curbei si, implicit, proportia valorilor de sub curba ntre diferite puncte ale acesteia. Imaginea de mai jos ilustreaza modul de variatie a naltimii distributiei t, n functie de gradele de libertate.

Asa cum se observa, curba devine din ce n ce mai aplatizata pe masura ce df (volumul esantionului) este mai mic. Acest fapt care are drept consecinta existenta unui numar mai mare de valori spre extremele distributiei. Nu este nsa greu de observat ca, pe masura ce df este mai mare, distributia t se apropie de o distributie normala standard astfel nct, pentru valori ale lui N de peste 31 (df=30), aria de sub curba distributiei t se apropie foarte mult de valorile de sub aria curbei normale standard (z) iar scorul critic pentru t este acelasi ca si cel pentru z pe curba normala (1.96). Din cele spuse rezulta ca, daca avem un esantion de volum mic (N 30), vom utiliza testul t n loc de testul z, pe baza unei formule asemanatoare: unde: m este media esantionului Q este media populatiei sm este eroarea standard a mediei Interpretarea valorii lui t se face n mod similar cu cea pentru valorea z, cu deosebirea ca se utilizeaza tabelul distributiei t (Anexa 2). n acest caz valorile critice ale lui t vor fi diferite n functie de numarul de grade de libertate. Se observa ca pragurile critice ale lui t (subntelegnd alfa=0.05 pentru test bilateral) se plaseaza la valori diferite n functie de nivelul df. n acelasi timp, daca df este mare (peste 30), valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96, la fel ca si n cazul valorilor lui z).

Date fiind caracteristicile enuntate, n practica, testul t se poate utiliza si pentru esantioane mari (Nu30). n nici un caz, nsa, nu poate fi utilizat testul z n cazul unor esantioane mici (N 30). Utilizarea testului bazat pe un singur esantion (fie z sau t) depinde ntr-o masura decisiva de asigurarea caracteristicii aleatoare a esantionului. Publicarea rezultatelor testului z sau t Publicarea rezultatelor diferitelor proceduri statistice trebuie facuta astfel nct cititorii sa si poata face o imagine corecta si completa asupra rezultatelor. n acest scop la publicarea rezultatelor trebuie respectate anumite reguli la care vom face trimitere n continuare, n legatura cu fiecare nou test statistic ce va fi introdus. n principiu, publicarea rezultatelor unui test statistic se poate face n doua moduri: o sintetic (sub forma tabelara), atunci cnd numarul variabilelor testate este relativ mare narativ, atunci cnd se refera, sa zicem, la o singura variabila.

n cazul testului pentru un singur esantion, se vor raporta: media esantionului, media populatiei, valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral). Daca avem n vedere rezultatele obtinute pe exemplul de mai sus, se apeleaza la o raportare de tip narativ, care poate utiliza o formulare n maniera urmatoare: "Esantionul selectat prin metoda "paranormala" a obtinut un scor (QI=104) peste media populatiei generale (QI=100). Testul z, cu alfa 0.05, a demonstrat ca diferenta nu este semnificativa statistic, z=1.36, p>0.05, unilateral". n exemplu de mai sus nu formularea ca atare este esentiala ci categoriile de informatii asociate publicarii testului z. Formularea ca atare poate diferi de cea prezentata mai sus, dar elementele informationale trebuie sa fie complete. Asa cum am spus mai sus, utilizarea programelor statistice ofera pentru orice valoare a lui z (sau oricare alt test statistic) valoarea exacta a lui p. Ea poate fi utilizata ca atare pastrnd, nsa, raportarea acesteia la pragul de semnificatie. Orice valoare a lui p mai mare de 0.05 este considerata nesemnificativa[2][2], daca nu a fost fixat un alt prag, mai sever.
TEMA PENTRU ACAS [3][3]

1. Un psihiatru testeaza eficienta unui nou medicament anxiolitic care pare sa aiba un posibil efect
secundar negativ n scaderea frecventei cardiace. Pentru un esantion de 50 de subiecti al carui puls a fost masurat dupa 6 saptamni de la initierea tratamentului, s-a obtinut o frecventa cardiaca medie de 70 de batai pe minut. Daca frecventa medie a populatiei generale este 72 bpm, cu o abatere standard de 12, se poate concluziona ca noul medicament produce bradicardie? (E=0,05, se efectueaza test unilateral) Reprimarea mniei conduce la cresterea tensiunii arteriale? ntr-un studiu ipotetic, 16 studenti cu scor ridicat de reprimare a mniei (rezultat din chestionare specifice) au fost supusi masurarii tensiunii arteriale. Media tensiunii pentru acest esantion a fost de 124 mm Hg (milimetri coloana de mercur). Daca media tensiunii la nivelul populatiei este 120 mm Hg cu o abatere standard de 10, se poate accepta ipoteza ca reprimarea mniei conduce la cresterea tensiunii? (E=0,05, test bilateral) Sa presupunem ca avem o scala care masoara anxietatea n note T (Q=50, W=10). Dupa un cutremur puternic se obtin urmatoarele scoruri pe un esantion de subiecti care se adreseaza unui cabinet de

2.

3.

psihologie clinica: 72, 59, 54, 56, 48, 52, 57, 51, 64, 67. Testati ipoteza de nul care afirma ca nivelul anxietatii nu este influentat de cutremur. (E=0,05, unilateral si bilateral)

Testul t pentru esantioane independente


Testul z (t) pentru un singur esantion sunt utile ntr-un model de cercetare n care ne propunem compararea valorii masurate pe un esantion cu media populatiei din care acesta provine. Asa cum am precizat deja, acest tip de cercetare este destul de rar ntlnit, ca urmare a dificultatii de a avea acces la parametrii populatiei. Unul dintre modelele de cercetare frecvente, nsa, este acela care vizeaza punerea n evidenta a diferentelor care exista ntre doua categorii de subiecti (diferenta asumarii riscului ntre barbati si femei, diferenta dintre timpul de reactie al celor care au consumat o anumita cantitate de alcool fata de al celor care nu au consumat alcool, etc.). n situatii de acest gen psihologul compara mediile unei variabile (preferinta pentru risc, timpul de reactie, etc.), masurata pe doua esantioane compuse din subiecti care difera sub aspectul unei alte variabile (sexul, consumul de alcool, etc.). Variabila supusa comparatiei este variabila dependenta, deoarece presupunem ca suporta "efectul" variabilei sub care se disting cele doua esantioane si care, din acest motiv, este variabila independenta[4][1]. n situatii de acest gen, esantioanele supuse cercetarii se numesc "independente", deoarece sunt constituite, fiecare, din subiecti diferiti. Distributia ipotezei de nul pentru diferenta dintre medii independente Sa ne imaginam ca dorim sa vedem daca un lot de sportivi, tragatori la tinta, care practica trainingul autogen[5][2] (variabila independenta) obtin o performanta (variabila dependenta) mai buna dect un lot de sportivi care nu practica aceasta tehnica de autocontrol psihic. n acest caz, variabila dependenta ia valori prin evaluarea performantei de tragere, iar variabila independenta ia valori conventionale, pe o scala nominala categoriala, dihotomica (practicanti si nepracticanti de sedinte de relaxare). n acest exemplu avem doua esantioane de cercetare, unul format din sportivi practicanti ai trainingului autogen (TA) si altul format din sportivi nepracticanti ai TA. Trebuie sa admitem ca fiecare dintre cele doua esantioane provine dintr-o populatie distincta: populatia sportivilor practicanti de TA si, respectiv, cea a nepracticantilor de TA. De asemenea, este evident faptul ca perechea de esantioane studiate nu este dect una din perechile posibile. Sa privim figura de mai jos, care ne sugereaza ce se ntmpla daca, teoretic, am extrage (selecta) n mod repetat de esantioane perechi din cele doua populatii:

Imaginea arata faptul ca, pe masura ce constituim perechi de esantioane (m11-m21, etc.) cu valori ale performantei la tinta, diferenta dintre mediile devine o distributie n sine, formata din valorile acestor diferente. Daca am reusi constituirea tuturor perechilor posibile de esantioane, aceasta distributie, la rndul ei, ar reprezenta o noua populatie, populatia diferentei dintre mediile practicantilor si nepracticantilor de training autogen. si, fapt important de retinut, curba diferentelor dintre medii urmeaza legea distributiei t. Cu alte cuvinte, la un numar mare (tinznd spre infinit) de esantioane perechi, trebuie sa ne asteptam ca cele mai multe medii perechi sa fie apropiate ca valoare, diferenta dintre mediile fiind, ca urmare, mica, tinznd spre 0 si ocupnd partea centrala a curbei. Diferentele din ce n ce mai mari fiind din ce n ce mai putin probabile, vor ocupa marginile distributiei (vezi figura de mai jos). Aceasta este ceea ce se numeste "distributia ipotezei de nul" pentru diferenta dintre mediile a doua esantioane independente. n acest moment este bine sa accentuam, din nou, semnificatia statistica a notiunii de populatie. Dupa cum se observa, aceasta nu face referire neaparat la indivizi ci la totalitatea valorilor posibile care descriu o anumita caracteristica (psihologica, biologica sau de alta natura). n cazul nostru, diferentele dintre mediile esantioanelor perechi (fiecare provenind dintr-o "populatie fizica" distincta) devin o noua "populatie", de aceasta data statistica, compusa din totalitatea diferentelor posibile, si a carei distributie se supune modelului curbei t. Procedura statistica pentru testarea semnificatiei diferentei dintre mediile a doua esantioane Problema pe care trebuie sa o rezolvam este urmatoarea: Este diferenta dintre cele doua esantioane suficient de mare pentru a o putea considera ca determinata de variabila independenta, sau este doar una dintre diferentele probabile, generata de jocul hazardului la

constituirea perechii de esantioane? Vom observa ca sarcina noastra se reduce, de fapt, la ceea ce am realizat anterior n cazul testului z sau t pentru un singur esantion. Va trebui sa vedem daca diferenta dintre doua esantioane reale se distanteaza semnificativ de diferenta la care ne putem astepta n cazul extragerii absolut aleatoare a unor perechi de esantioane, pentru care distributia diferentelor este normala. Mai departe, daca probabilitatea de a obtine din ntmplare un astfel de rezultat (diferenta) este prea mica (maxim 5%) o putem neglija si accepta ipoteza ca ntre cele doua variabile este o relatie semnificativa. Daca avem valoarea diferentei dintre cele doua esantioane cercetate, ne mai sunt necesare doar media populatiei (de diferente ale mediilor) si abaterea standard a acesteia, pentru a calcula testul z (n cazul esantioanelor mari) sau cel t (n cazul esantioanelor mici). n final, nu ne ramne dect sa citim valoarea tabelara pentru a vedea care este probabilitatea de a se obtine un rezultat mai bun (o diferenta mai mare ) pe o baza strict ntmplatoare. Media populatiei de diferente. Diferenta dintre mediile celor doua esantioane ale cercetarii face parte, asa cum am spus, dintr-o populatie compusa din toate diferentele posibile de esantioane perechi. Media acestei populatii este 0 (zero). Atunci cnd extragem un esantion aleator dintr-o populatie, valoarea sa tinde sa se plaseze n zona centrala cea mai probabila). Dar aceeasi tendinta o va avea si media oricarui esantion extras din populatia pereche. Ca urmare, la calcularea diferentei dintre mediile a doua esantioane, cel mai probabile sunt diferentele mici, tinznd spre zero. Astfel, ele vor ocupa partea centrala a distributiei, conturnd o medie tot mai aproape de zero cu ct numarul esantioanelor extrase va fi mai mare. Eroarea standard a diferentei (mprastierea), pe care o vom nota cu calculeaza pornind de la formula de calcul a erorii standard: Wm1-m2 , se

(formula 3.5) Din ratiuni practice, pentru a obtine o formula care sa sugereze diferenta dintre medii (m1-m2 ), formula de mai sus este supusa unor transformari succesive. Prin ridicarea la patrat a ambilor termeni si dupa extragerea radicalului din noua expresie, se obtine: (formula 3.6) Daca am utiliza-o pentru calcule, aceasta ultima formula ar produce acelasi rezultat ca si formula originara. Formula erorii standard a distributiei diferentei dintre medii ne arata ct de mare este mprastierea diferentei "tipice" ntre doua medii independente atunci cnd esantioanele sunt extrase la ntmplare (formula 3.7) Formula de mai sus indica faptul ca eroarea standard a diferentei dintre medii este data de suma erorii standard a celor doua esantioane. Unul dintre esantioane are N1 subiecti si o dispersie 12 iar celalalt esantion, N2 subiecti si dispersia 22. Faptul ca

obtinem eroarea standard a diferentei dintre medii ca suma a erorilor standard a celor doua esantioane este fundamentat pe o lege statistica a carei demonstratie nu se justifica aici. Pentru a calcula scorul z al diferentei, vom utiliza o formula asemanatoare cu formula notei z pe care o cunoastem deja:

Aceasta va fi:

(formula 3.8)

Numaratorul exprima diferenta dintre diferenta obtinuta de noi (m1-m2) si diferenta dintre mediile populatiilor (Q1-Q2). Daca ne amintim ca distributia ipotezei de nul (Q1-Q2) are media 0, atunci deducem ca expresia (Q1-Q2) poate lipsi. De altfel, daca am cunoaste mediile celor doua populatii nici nu ar mai fi necesara calcularea semnificatiei diferentei dintre esantioanele care le reprezinta. Numitorul descrie eroarea standard a diferentei, calculata cu formula 8.1, adica mprastierea diferentei "tipice" pentru extrageri aleatoare. n conformitate cu cele spuse pna acum, formula finala pentru scorul z al diferentei dintre doua esantioane devine : (formula 3.9) Se observa ca am eliminat (Q1-Q2) de la numarator, care este ntotdeauna 0 si am nlocuit Wm1-m2 cu expresia echivalenta din formula 3.7. Aceasta formula ne da ceea ce se numeste valoarea testului z pentru esantioane mariindependente. Valoarea astfel obtinuta urmeaza a fi verificata cu ajutorul tabelei z pentru curba normala, iar decizia statistica se ia n acelasi mod ca si n cazul testului z pentru un singur esantion. n formula 3.8 eroarea standard a diferentelor este calculata pe baza erorii standard a distributiei de esantionare pentru populatia din care sunt extrase cele doua esantioane ("practicanti" si "nepracticanti" de training autogen). n realitate nu cunoastem cele doua dispersii. Din fericire, daca volumul nsumat (N1+N2) al esantioanelor care dau diferenta noastra (m1 -m2 ) este suficient de mare (u30 dar, de preferat, ct mai aproape de 100) atunci ne amintim ca putem folosi abaterea standard a fiecarui esantion (s1 respectiv s2), care aproximeaza suficient de bine abaterile standard ale celor doua populatii.

Atunci cnd esantioanele nu sunt suficient de mari, trebuie sa ne asteptam la erori considerabile n estimarea mprastierii populatiei pe baza mprastierii esantionului. ntr-o astfel de situatie vom apela, desigur, la un test t, avnd doua optiuni de calcularea acestuia: a. Testul t pentru dispersii diferite Acesta se bazeaza pe considerarea separata a dispersiilor celor doua populatii (estimate prin dispersiile esantioanelor). Formula este foarte asemanatoare cu formula anterioara pentru testul z. Vom retine aceasta formula ca testul t pentru dispersii diferite:

(formula 3.10) Se observa nlocuirea lui W (pentru populatie) cu s (pentru esantion). Utilizarea ei este destul de controversata, deoarece rezultatul nu urmeaza cu exactitate distributia t asa cum am introdus-o anterior. Pentru eliminarea acestui neajuns, se utilizeaza o varianta de calcul care ia n considerare dispersia cumulata a celor doua esantioane. b. Testul t pentru dispersia cumulata Dispersiile celor doua esantioane pot fi considerate mpreuna pentru a forma o singura estimare a dispersiei populatiei (W2). Obtinem astfel ceea ce se numeste "dispersia cumulata", pe care o vom nota cu s2c si o vom calcula cu formula urmatoare: (formula 3.11) La numarator, formula contine suma dispersiilor multiplicate fiecare cu volumul esantionului respectiv (de fapt, gradele de libertate, N-1). n acest fel vom avea o contributie proportionala cu numarul de valori ale mprastierii fiecarui esantion la rezultatul final. La numitor, avem gradele de libertate (df) pentru cele doua esantioane luate mpreuna (N1+N2-2). nlocuind-o n formula 3.10, obtinem formula de calcul a testului t pentru dispersii cumulate

(formula 3.12):

Formula 3.12 este formula uzuala pentru calcularea diferentei dintre medii pentru doua esantioane independente. Chiar daca a fost introdusa ca utilizabila pentru "esantioane mici", caracteristicile distributiei t ne permit utilizarea ei si pentru esantioane mari, deoarece distributia t tinde spre cea normala la valori din ce n ce mai mari ale gradelor de libertate.

EXEMPLU DE CALCUL: Sa presupunem ca vrem sa vedem daca practicarea trainingului autogen (variabila independenta) determina o crestere a performantei n tragerea la tinta, manifestata printr-un numar mai mare de lovituri n centru tintei (variabila dependenta). Pentru aceasta selectam un esantion de 6 sportivi care practica trainingul autogen si un esantion de 6 sportivi care nu l practica. Pentru fiecare esantion masuram performanta de tragere. Formularea ipotezei cercetarii, a ipotezei de nul, si a criteriilor deciziei statistice Pentru exemplul de mai sus: Problema cercetarii: Are practicarea trainingului autogen un efect asupra performantei la tirul cu arcul? Ipoteza cercetarii (H1 ): "Practicarea trainingului autogen determina un numar mai mare de puncte la sedintele de tragere". Ipoteza de nul (statistica) (H0 ): "Numarul punctelor la sedintele de tragere nu este mai mare la cei care practica trainingul autogen". Aceasta varianta este potrivita cu o testare unilaterala a ipotezei (nu avem n vedere dect eventualitatea ca trainingul autogen sa creasca performanta sportiva). Daca, nsa, am dori sa testam n ambele directii, bilateral, atunci am avea urmatoarele versiuni ale ipotezelor: Ipoteza cercetarii: "Performanta sportiva este diferita la subiectii care practica trainig autogen fata de cei care nu practica" Ipoteza de nul (statistica): "Performanta nu difera semnificativ n functie de practicarea trainingului autogen". Fixarea lui t critic. Alegem efectuarea unui test bilateral, pentru ca nu putem sti dinainte daca TA nu are un efect negativ asupra performantei sportive a tragatorilor la tinta. Alegem nivelul: E=0,05. Stabilim gradele de libertate: df=N1+N2 -2=10 Utiliznd tabelul distributiei t pentru 10 grade de libertate (adica 12-2) si E=0,05, bilateral, gasim t critic=s2.228, la intersectia coloanei 0.025 si cu linia pentru 10 grade de libertate. Valoarea t calculata va trebui sa fie cel putin egala sau mai mare dect t critic, pentru a putea respinge ipoteza de nul si a accepta ipoteza cercetarii (vezi imaginea de mai jos).

Variabila independenta (calitatea de practicant-nepracticant Training Autogen) ia doua valori, sa zicem: "1" pentru practicantii trainingului autogen si "2" pentru nepracticanti. Valorile "1" si "2" sunt conventionale si ne indica faptul ca variabila independenta a cercetarii noastre este masurata pe o scala nominala, categoriala (dihotomica). Variabila dependenta (performanta de tragere la tinta) ia valori cantitative, exprimata n numar de lovituri n centrul tintei, fiind de tip cantitativ (raport). Datele cercetarii practicanti TA ("1") X1 (X1-m1)2 15 9 12 13 16 15 80 6 13.33 = 6.67 S= 2.58 2.16 2.78 18.74 1.76 0.10 7.12 2,78 33.28 ne-practicanti TA ("2") X2 (X2m2)2 10 2.78 8 0,10 11 7.12 5 11.08 7 1.76 9 0.44 50 23.28 6 8.33 = 4.66

7 N M

Calculam t pentru dispersii cumulate: Mai nti, eroarea standard a diferentei (numitorul formulei):

SDif =

= 1.34

Iar apoi:

t =

=3.73 3.73 > 2.228

Comparam t calculat cu t critic din tabelul distributiei t: Decizia statistica: Se respinge ipoteza de nul

Concluzia cercetarii: Se admite ipoteza cercetarii. "Practicarea trainingului autogen influenteaza performanta n tirul cu arcul" Publicarea rezultatului

La publicarea testului t pentru diferenta dintre mediile a doua esantioane independente vor fi mentionate: mediile si abaterile standard ale fiecarui esantion, volumul esantioanelor sau gradele de libertate, valoarea testului, nivelul lui p. n forma narativa, rezultatul pentru exemplul de mai sus poate fi formulat astfel: "Sportivii care practica trainingul autogen au fost comparati cu cei care nu practica. Primii au realizat o performanta mai buna (m=13.33, W=2.58) fata de ceilalti (m=8.33, W=2.16), t(10)=3.65, p<0.05" Interpretarea rezultatului la testul t pentru esantioane independente Trebuie sa precizam ca, atunci cnd calculam testul t, nu valoarea obtinuta este relevanta ci probabilitatea care este asociata acestei valori (p). Atunci cnd p este mai mic sau egal cu 0.05, rezultatul justifica aprecierea ca semnificativa a diferentei dintre mediile celor doua esantioane (adica suficient de mare pentru a respinge ipoteza ca ar putea fi ntmplatoare). Modelul de cercetare nu permite formularea acestei concluzii n termenii unei relatii cauzale ntre practicarea trainingului autogen si performanta sportiva, orict de tentata ar fi aceasta concluzie. n plus, existenta unei diferente semnificative nu este similara cu existenta unei diferente cu valoare practica. Este posibil ca diferenta dintre cele doua loturi de sportivi, desi semnificativa statistic, sa nu justifice costurile angajate n desfasurarea programului de relaxare psihica. ntr-o asemenea situatie, studiul nu este lipsit de valoare dar concluziile sunt utile doar n plan teoretic. imitele de ncredere ale diferentei dintre mediile a doua populatii Daca cercetarea noastra ar fi avut drept obiectiv numai verificarea teoriei conform careia trainingul autogen poate conduce la cresterea performantei (de exemplu, prin diminuarea stresului si favorizarea concentrarii) consemnarea semnificatiei statistice a testului ar fi absolut suficienta. Din perspectiva unui antrenor, nsa, aceasta concluzie s-ar putea sa nu fie la fel de multumitoare. n fapt, un astfel de studiu nu are drept scop stabilirea diferentei dintre mediile celor doua loturi particulare de sportivi, ci masura n care diferenta existenta ar putea fi generalizata la nivelul populatiilor (de tragatori cu arcul practicanti si nepracticanti de training autogen).

n acest scop este util sa estimam limitele de ncredere ale diferentei dintre mediile populatiilor cercetarii, ntr-o maniera similara cu estimarea mediei populatiei pe baza mediei esantionului. Pentru aceasta, avem punctul de estimare definit ca diferenta dintre cele doua medii (m1 -m2=13.33-8.33=5 puncte). Valoarea diferentei dintre mediile populatiilor din care fac parte cele doua esantioane se ncadreaza, cu o anumita probabilitate, n jurul diferentei de 5 puncte. Sa presupunem ca dorim sa fixam limitele de variatie a diferentei dintre mediile populatiilor pentru un nivel de ncredere de 95%, bilateral. n acest caz, fixam mai nti valorile critice pentru t ntre care se afla 95% dintre valorile distributiei, pentru df=10. n exemplul dat acestea sunt, asa cum am vazut deja, 2.2281.[6][3] Mai departe calculam limitele de variatie pentru diferenta dintre mediile populatiilor cercetarii pornind de formula testului t:

n aceasta expresie, t este chiar t critic iar pe noi ne intereseaza diferenta dintre mediile populatiilor, ceea ce se obtine astfel: (formula 3.13) De unde deducem, mai departe: (formula 3.14) Daca nlocuim valorile calculate n exemplul de mai sus, obtinem:

De unde calculam limita inferioara=2.015 si limita superioara=7.985. Ceea ce trebuie sa observam, n primul rnd, la aceste valori, este ca ntre ele nu se afla valoarea 0 (fapt care ar corespunde ipotezei de nul). Sa retinem ca, indiferent de valoarea calculata a testului, daca intervalul de ncredere al acestuia include valoarea 0, ipoteza de nul nu va putea fi respinsa. Mai departe, cercetatorul va trebui sa aprecieze ct de rentabil este sa instituie un astfel de program daca diferenta de performanta se afla n plaja mentionata. Daca aceasta plaja este foarte mare, nseamna ca estimarea pe baza celor doua esantioane nu este foarte precisa si, ca urmare, nici foarte utila. Dimpotriva, daca diferenta esantioanelor este aproape de cele doua limite, estimarea este mai sigura. n principiu, cu ct volumul esantioanelor va creste, cu att precizia estimarii va fi mai mare. n fine, o ultima precizare n legatura cu calcularea limitelor de ncredere. Calcularea lor nu este relevanta din punct de vedere practic atunci cnd variabila dependenta este exprimata n unitati de masura care nu au o semnificatie prin ele nsele. Sa ne imaginam, spre exemplu, un experiment n care un grup priveste un film trist iar un alt grup priveste un film vesel, dupa care starea de spirit a celor doua grupuri este evaluata prin numararea cuvintelor triste sau vesele pe care subiectii si le pot aminti dintr-o lista citita imediat dupa vizionare. n

aceasta situatie calcularea limitelor de ncredere nu este absolut justificata, fiind greu de interpretat n cazul "numarului de cuvinte". Nu acelasi lucru se ntmpla daca, de exemplu, n cazul unui experiment n care utilizarea unui anumit tip de exercitii la locul de munca, se traduce n cresterea productivitatii muncii, masurata prin numarul de produse finite. Este evident ca numarul de produse finite este un indicator cu relevanta practica si usor de interpretat.

Conditiile n care putem calcula testul t pentru esantioane independente

Esantioane aleatoare (ideal) Esantioane independente (distincte din punctul de vedere al variabilei independente, care determina constituirea grupurilor) Variabila supusa masurarii sa se distribuie normal n ambele populatii. Aceasta ne garanteaza ca si distributia diferentelor dintre medii se distribuie normal. Totusi, teorema limitei centrale ne permite asumarea normalitatii distributiei mediei de esantionare chiar si n cazul variabilelor care nu se distribuie normal la nivelul populatiei, pentru esantioane mari. Daca, nsa, analiza distributiilor indica forme aberante, se va alege solutia unui test neparametric. Vom mentiona, totusi, ca testele t sunt robuste la ncalcarea conditiei de normalitate. Dispersia celor doua esantioane sa fie omogena. Testul t poate fi aplicat strict n cazurile n care dispersiile celor doua populatii ("practicanti", "nepracticanti") au aceeasi dispersie (omogenitatea dispersiei). Din fericire, exista trei situatii n care aceasta conditie nu trebuie sa ne preocupe: y y y cnd esantioanele sunt suficient de mari (cel putin 100 fiecare) cnd cele doua esantioane au acelasi volum (N1=N2) cnd dispersiile celor doua esantioane nu difera semnificativ (dar, chiar si pentru acest caz, exista formule care tin cont de diferenta dispersiilor).

Cnd se utilizeaza testul t pentru esantioane independente? Acest test statistic se utilizeaza n situatiile n care vrem sa aflam daca o variabila dependenta, masurata pe o scala de interval/raport, difera semnificativ ntre doua grupuri (esantioane) diferentiate pe o variabila independenta, masurata pe scala de tip nominal (dihotomic). Deoarece este unul dintre modelele frecvent ntlnite n practica cercetarii psihologice, utilizarea testului t pentru esantioane independente este si ea des ntlnita n literatura de specialitate.

***
TEMA PENTRU ACAS

ntr-un studiu asupra efectelor unui nou tratament al fobiei, datele pentru grupul experimental obtinute printr-o scala de evaluare a tendintelor fobice sunt: m1 =27.2, s1=4 si N1=15 Datele pentru grupul de control sunt: m2 =34.4, s2=14 si N2=15 Formulati:
y y y

Problema (ntrebarea) cercetarii Ipoteza cercetarii (H1) Ipoteza de nul (H0)

Aflati t critic pentru E=0,05; bilateral Nota: Desi datele din exemplu arata ca m1 este mai mic dect m2, vom alege un test bilateral pentru ca, sa nu uitam, n practica, criteriile deciziei statistice sunt fixate naintea masurarii experimentale, cnd, deci, nu aveam de unde sti care vor fi valorile pe care le vom obtine.
y y y y

Calculati testul t pentru diferenta dintre cele doua esantioane Calculati intervalul de ncredere (99%) pentru diferenta dintre mediile populatiilor. Formulati si motivati decizia statistica

Formulati concluzia cercetarii

Testarea diferentei dintre mai mult de doua medii-analiza de varinta (ANOVA)


n exemplul prin care am comparat performanta la tinta a celor doua grupe de sportivi (practicanti si nepracticanti de training autogen), testul t a rezolvat problema semnificatiei diferentei pentru doua medii. n practica de cercetare ne putem ntlni nsa cu situatii n care avem de comparat trei sau mai multe medii. De exemplu, atunci cnd am efectuat un test de cunostinte de statistica si dorim sa stim daca diferentele constatate ntre cele 5 grupe ale unui an de studiu difera semnificativ. Performanta la nivelul fiecarei grupe este data de media raspunsurilor corecte realizate de studenti. La prima vedere, am putea fi tentati sa rezolvam problema prin compararea repetata a medie grupelor, doua cte doua. Din pacate, exista cel putin trei argumente pentru care aceasta optiune nu este de dorit a fi urmata: y y n primul rnd, volumul calculelor ar urma sa fie destul de mare si ar creste si mai mult daca numarul categoriilor variabilei independente ar fi din ce n ce mai mare. n al doilea rnd, problema cercetarii vizeaza relatia dintre variabila dependenta (n exemplul de mai sus, performanta la statistica) si variabila independenta, exprimata prin ansamblul tuturor categoriilor sale (grupele de studiu). Ar fi bine sa putem utiliza un singur test si nu mai multe, pentru a afla raspunsul la problema noastra. n fine, cel mai puternic argument, este acela ca, prin efectuarea repetata a testului t se acumuleaza o cantitate de eroare de tip I mai mare dect este permis pentru o decizie statistica (0.05). Sa presupunem ca dorim sa testam ipoteza unei relatii dintre nivelul anxietatii si intensitatea fumatului, evaluata n trei categorii: 1-10

tigari zilnic; 11-20 tigari zilnic si 21-30 tigari zilnic. n acest caz, avem trei categorii ale caror medii ar trebui comparate doua cte doua. Dar, n acest fel, prin efectuarea repetata a testului t pentru esantioane independente, s-ar cumula o cantitate totala de eroare de tip I de 0.15 adica 0.05+0.05+0.05. Pentru a elimina aceste neajunsuri si, mai ales pe ultimul dintre ele, se utilizeaza o procedura statistica numita analiza de varianta (denumita pe scurt ANOVA, de la "ANalysis Of VAriance", n engleza). n mod uzual, analiza de varianta este inclusa ntr-o categorie aparte de teste statistice. Motivul pentru care o introducem aici, imediat dupa testul t pentru esantioane independente, este acela ca, n esenta, ANOVA nu este altceva dect o extensie a logicii testului t pentru situatiile n care se doreste compararea a mai mult de doua medii independente. Dar, daca problema este similara, solutia este, asa cum vom vedea, diferita. Exista mai multe tipuri de ANOVA, doua fiind mai frecvent folosite: ANOVA unifactoriala: o Presupune o variabila dependenta masurata pe o scala de interval/raport (anxietatea, n exemplul de mai sus). Presupune o variabila independenta de tip categorial (nominala sau ordinala) care ia trei sau mai multe valori (cele trei categorii de fumatori: "1-10 tigari zilnic", "11-20 tigari" si "21-30 tigari"). n contextul ANOVA, variabila independenta este definita ca "factor". Modelul de analiza de varianta cu o singura variabila independenta se numeste "ANOVA unifactoriala", "ANOVA simpla" sau, cel mai frecvent, "ANOVA cu o singura cale" (One-way ANOVA).

ANOVA multifactoriala o Presupune o variabila dependenta (la fel ca n cazul ANOVA unifactoriala) o Presupune doua sau mai multe variabile independente, fiecare cu doua sau mai multe valori masurate pe o scala nominala sau ordinala. De exemplu, n cazul de mai sus, se poate adauga sexul ca variabila independenta, urmnd sa se raspunda la ntrebarea daca intensitatea fumatului si caracteristica de sex au, mpreuna, o relatie cu nivelul anxietatii.

Nu vom discuta aici dect prima dintre cele doua variante de ANOVA. Cadrul conceptual pentru analiza de varianta unifactoriala n esenta, ANOVA este o procedura de comparare a mediilor esantioanelor. Specificul consta n faptul ca n locul diferentei directe dintre medii se utilizeaza dispersia lor, gradul de mprastiere. Procedura se bazeaza pe urmatorul demers logic: Ipoteza cercetarii sugereaza ca fiecare categorie de fumatori face parte dintr-o populatie distincta, careia i corespunde un nivel specific de anxietate (adica o medie caracteristica, diferita de a celorlalte doua populatii). Prin opozitie, ipoteza de nul, ne obliga sa presupunem ca cele trei esantioane[7][1] (categoriile de fumatori) pe care vrem sa le comparam, provin dintr-o populatie unica de valori ale anxietatii, iar diferentele dintre mediile lor nu reprezinta dect expresia variatiei

firesti a distributiei de esantionare. n imaginea de mai jos populatiile cercetarii (Pc1, Pc2, Pc3) sunt exprimate cu linie continua, iar populatie de nul cu linie discontinua.

Chiar daca absenta unei legaturi ntre numarul de tigari fumate si intensitatea anxietatii (ipoteza de nul) este adevarata, cele trei grupuri (esantioane) nu trebuie sa aiba n mod necesar aceeasi medie. Ele pot avea medii diferite care sa rezulte ca expresie a variatiei aleatoare de esantionare (m1{m2{m3) si, de asemenea, mprastieri (dispersii) diferite (s1{s2{s3). Sa ne gndim acum la cele trei medii pe care vrem sa le comparam ca la o distributie de sine statatoare, de trei valori (sau mai multe, pentru cazul n care variabila independenta are mai multe categorii). Cu ct ele sunt fi mai diferite una de alta, cu att distributia lor are o mprastiere (varianta) mai mare. Este evident faptul ca, daca esantioanele ar apartine populatiei de nul, diferenta mediilor (exprimata prin dispersia lor) ar fi mai mica dect n cazul n care acestea ar proveni din populatii distincte (corespunzator ipotezei cercetarii). n continuare se pune urmatoarea problema: Ct de diferite (mprastiate) trebuie sa fie mediile celor trei esantioane, luate ca distributie de sine statatoare de trei valori, pentru ca sa putem concluziona ca ele nu provin din populatia de nul (dreptunghiul punctat) ci din trei populatii diferite, corespunzatoare esantioanelor de cercetare (Pc1, Pc2, Pc3)? Pentru a raspunde la aceasta ntrebare este necesar: a) Sa calculam dispersia valorilor individuale la nivelul populatiei de nul, care se bazeaza pe valorile anxietatii tuturor valorilor masurate, indiferent de intensitatea fumatului; Sa calculam dispersia mediilor anxietatii grupurilor cercetarii (considerate ca esantioane separate); Sa facem raportul dintre aceste doua valori. Obtinerea unei valori mai ridicate a acestui raport ar exprima apartenenta fiecareia din cele trei medii la o populatie distincta n timp ce obtinerea unei valori mai scazute ar sugera provenienta mediilor dintr-o populatie unica (de nul). Decizia statistica cu privire la marimea raportului si, implicit, cu privire la semnificatia diferentelor dintre mediile comparate, se face prin raportarea valorii raportului la o distributie teoretica adecvata, alta dect distributia normala, asa cum vom vedea mai departe.

b) c)

Sa ne concentram acum asupra fundamentarii modului de calcul pentru cei doi termeni ai raportului. Calcularea exacta a dispersiei populatiei de nul este imposibila (deoarece nu avem acces la toate valorile acesteia), dar ea poate fi estimata prin calcularea mediei dispersiei

grupurilor de cercetare. Valoarea astfel obtinuta se numeste "dispersia intragrup" si reprezinta estimarea mprastierii valorilor masurate la nivelul populatiei de nul. La rndul ei, dispersia mediilor grupurilor de cercetare, calculata dupa metoda cunoscuta de calcul a dispersiei, formeaza ceea ce se numeste "dispersia intergrup". Valoarea astfel obtinuta evidentiaza ct de diferite (mprastiate) sunt mediile esantioanelor care fac obiectul comparatiei. Raportul dintre "dispersia intergrup" si "dispersia intragrup" se numeste raport Fisher si ne da valoarea testului ANOVA unifactorial. Cu ct acesta este mai mare, cu att mprastierea mediilor este mai mare si, implicit, diferenta lor poate fi una semnificativa, ndepartata ce o variatie pur ntmplatoare. Imaginile de mai jos dau expresie grafica acestui rationament: Figura a reprezinta expresia grafica a ipotezei de nul: Presupunem ca cele trei grupuri provin din aceeasi populatie. Ca urmare, cele trei medii sunt egale (Q1=Q2=Q3), iar distributiile sunt suprapuse. Figura b reprezinta grafic ipoteza cercetarii: Cele trei grupuri sunt diferite, provenind din populatii distincte. Daca distanta (mprastierea) dintre mediile esantioanelor care provin din cele trei populatii depaseste un anumit nivel, atunci putem concluziona ca nu avem o singura populatie (ipoteza de nul) ci mai multe, mediile grupurilor prezentnd o diferenta semnificativa. Fundamentarea procedurii de calcul ANOVA Esenta procedurii de calcul pentru ANOVA se bazeaza pe o dubla estimare a dispersiei a populatiei cercetarii. Estimarea dispersiei populatiei de nul pe baza mediei dispersiei grupurilor (varianta intragrup) Atta timp ct nu cunoastem dispersia populatiei (W2) din care ar putea proveni grupurile, trebuie sa o estimam prin dispersiile celor trei grupuri (s12, s22, s32). Calculnd media celor trei dispersii vom obtine o valoare care estimeaza dispersia pentru cele trei grupuri luate mpreuna. Aceasta valoare se considera ca estimeaza dispersia populatiei totale. Deoarece ea se calculeaza pe baza dispersiilor n interiorul grupurilor, este desemnata n mod uzual prin termenul de intragrup (sau, mai frecvent, prin forma engleza: within-group) si se noteaza cu s2intragrup si se calculeaza cu una dintre formulele urmatoare: Atunci cnd volumele esantioanelor comparate sunt egale (N1=N2=N3):

(formula 3.15) Atunci cnd grupurile comparate sunt de volum inegal:

(formula 3.16) unde: df1=N1-1; df2=N2 -1; df3=N3-1 iar dfintragrup=Nsubiecti-Ngrupuri

Estimarea dispersiei populatiei de nul pe baza dispersiei mediilor grupurilor( varianta intergrup) Mediile celor trei grupuri (esantioane) sunt numere care pot fi analizate ca distributie n sine, a caror dispersie (varianta) poate fi calculata, fiind o estimare a mprastierii valorilor la nivelul populatiei. Din cauza ca se bazeaza pe mediile grupurilor, aceasta se mai numeste si varianta intergrupuri (between groups, n limba engleza). ntre variatia acestor medii si variatia valorilor din grupurile analizate, luate mpreuna, exista o legatura care poate fi exprimata pe baza formulei transformate a erorii standard, astfel:

de unde se deduce: (formula 3.17) Vom putea utiliza dispersia mediilor celor trei esantioane pentru a estima dispersia populatiei totale (vezi exemplul de mai jos). Aceasta se numeste estimarea variantei intergrupuri, notata cu s2intergrup. Daca nlocuim, n expresia de mai sus, expresia de calcul a dispersiei (formula 3.17), obtinem: unde m este media fiecarui grup separat, M este media celor trei grupuri luate mpreuna, N este numarul subiectilor dintr-un grup, atunci cnd grupurile sunt egale, iar dfintergrup se calculeaza ca numarul grupurilor-1. Ca urmare, pentru o situatie cu trei grupuri, formula desfasurata se scrie astfel: (formula 3.18)

unde: m1, m2, m3 sunt mediile celor trei grupuri, iar celelalte valori sunt cele descrise pentru formula anterioara. Ambele tipuri de estimari sunt estimari independente ale variantei populatiei de nul. nsa, n timp ce varianta intragrup o estimeaza n mod direct (media variantelor), varianta intergrup o masoara indirect (varianta mediilor). Aceasta din urma, varianta intergrup, reprezinta o estimare a variantei populatiei de nul numai daca ipoteza de nul este adevarata. Daca ipoteza de nul este falsa, ea reflecta de fapt masura n care valorile variabilei independente (factorul) influenteaza mediile variabilei dependente. Pe aceasta particularitate se bazeaza procedura analizei de varianta. Raportul dintre cele doua estimari s2intergrup/s2intragrup va tinde sa devina cu att mai mare cu ct diferenta dintre mediile grupurilor (tradusa prin dispersia mediilor) devine mai mare dect dispersia din interiorul grupurilor (tradusa prin media dispersiilor). Acest raport se numeste "raport Fisher", dupa numele celui care a fundamentat acest tip de analiza[8][2], si se scrie astfel:

(formula 3.19) Distributia Fisher Valorile raportului F (sau testul F) se distribuie ntr-un mod particular, numit distributia F sau distributia Fisher. Ca si distributia normala, distributia F este o familie de distributii, avnd urmatoarele caracteristici: 1. asimetrie pozitiva (tendinta valorilor de grupare spre partea stnga, cu valori mici); 2. poate lua o valori orict de mari; 3. valoarea minima este 0, deoarece decurge din raportul a doua dispersii, iar dispersiile nu pot fi niciodata negative[9][3]. 4. forma distributiei variaza n functie de o pereche de grade de libertate formata din numarul grupelor (categoriile variabilei independente) si numarul subiectilor.

Imaginea de mai sus reprezinta curba F pentru 3 grupuri cu 30 de subiecti n total. Distributia Fisher are forme distincte n functie de numarul esantioanelor comparate si volumul acestora. Calcularea gradelor de libertate Ca si n cazul distributiei t, distributia F se prezinta sub o varietate de forme. Distributia F rezulta dintr-un raport a doua distributii diferite (s2intergpup si s2intragrup), fiecare cu gradele ei de libertate. Ca urmare, si schimba forma, n acelasi timp, n functie de numarul

grupurilor si de numarul subiectilor din fiecare grup. n concluzie, vom avea doua grade de libertate, unul pentru MSB si altul pentru MSW, calculate astfel: dfintergrup=numarul grupurilor-1 dfintragrup=numarul cumulat al subiectilor din toate grupurile-numarul grupurilor EXEMPLU DE CALCUL Vom lua ca exemplu de calcul un set de date ipotetice pentru exemplul sugerat mai sus. Problema cercetarii: Avem rezultatele la o scala de evaluare a anxietatii pentru trei grupuri de fumatori (n functie de frecventa zilnica a tigarilor fumate), fiecare grup format din 6 subiecti, si vrem sa vedem daca exista o relatie ntre nivelul anxietatii si intensitatea fumatului. Ipoteza cercetarii: Fumatorii afirma ca fumatul "i linisteste". n acest caz putem emite ipoteza ca "numarul zilnic de tigari este n legatura cu nivelul anxietatii (fumatorii au o structura mai "anxioasa")". Ipoteza de nul: "Nu exista o legatura ntre numarul zilnic de tigari si nivelul anxietatii." Fixam criteriile deciziei statistice: Nivelul E=0.05 Stabilim F critic: 5. dfintergrup=3-1=2 6. dfintragrup=18-3=15 7. Citim F critic (F(0.05, 2, 15)) din tabelul F pentru E=0.05: Fcritic=3.6823 (Anexa 3) Nota privind utilizarea tabelei pentru distributiile F Spre deosebire de tabelele distributiilor utilizate pna acum, (z si t), pentru interpretarea lui F avem mai multe tabele, calculate fiecare pentru un anume nivel al lui E. Mai nti cautam tabela pentru E dorit (sa zicem, E=0.05). Apoi citim valoarea critica pentru F la intersectia dintre coloana care reprezinta numarul gradelor de libertate pentru numarul grupurilor (dfB) cu linia care reprezinta numarul gradelor de libertate pentru volumul total al subiectilor (dfW). Daca valoarea obtinuta prin calcul este mai mare sau egala dect cea tabelara, atunci putem lua decizia de respingere a ipotezei de nul. O precizare importanta cu privire la ANOVA ca test statistic, priveste caracterul ei "unilateral" (one-tailed). ntr-adevar, spre deosebire de celelalte teste studiate pna acum, ANOVA este interpretata ntr-o singura directie si anume, daca mediile grupurilor difera

semnificativ ntre ele (au o variatie mai mare dect cea normala pentru o distributie aleatoare). Nu putem avea o valoare negativa pentru F si, ca urmare, testul F este ntotdeauna un test unilateral. Calculam F pe baza datelor centralizate n tabelul urmator[10][4]:
Intensitatea fumatului "MEDIE" "MIC " X2 (X2X3 (X3-m3)2 (anxietate) m2)2 (anxietate) 4 ,11 3 1,00 7 7,13 5 1,00 3 1,77 2 4,00 6 2,79 1 9,00 4 ,11 6 4,00 2 5,43 7 9,00 26 17.33 24 28 6 6 m2=4.33 m3=4.00 M=(m1+m2+m3)/3=5.39 3.47 5.60 -1.06 -1.39 1.12 1.93 7(m-M)2=9

7X N M s2 (m-M) (m-M)2

"MARE" X1 (X1(anxietate) m1)2 9 1,37 7 ,69 6 3,35 8 ,03 10 4,71 7 ,69 47 10,83 6 m1=7.83 2.17 2.44 5.95

Calculam numaratorul, adica dispersia mediilor celor trei grupuri. Dat fiind faptul ca nu cunoastem dispersia populatiei vom utiliza dispersia esantioanelor, conform formulei 3.18 pentru grupuri egale. Prin nlocuire cu valorile calculate n tabelul de mai sus, obtinem: Mai departe, calculam numitorul raportului F (s2intragrup), prin nlocuirea valorilor calculate pentru dispersiile din interiorul celor trei grupuri luate separat, n formula 3.15: n acest caz dfintragrup=nr. grupurilor, pentru ca N1=N2=N3 n final, calculam raportul F:

Valoarea astfel obtinuta o comparam cu F critic gasit anterior n tabel. Constatam ca F calculat (7.2), este mai mare dect F critic (3.6823). Decizia statistica: Respingem ipoteza de nul si acceptam ipoteza cercetarii: "Nivelul anxietatii prezinta o variatie n legatura cu intensitatea fumatului, evaluata n cele trei categorii".

Publicarea rezultatului testului F (ANOVA) n raportul de publicare pentru ANOVA vor fi descrise grupurile (categoriile) comparate, mediile lor, valoarea testului F cu numarul gradelor de libertate si pragul de semnificatie al testului. ntr-o maniera narativa, rezultatul obisnuit pe exemplul de mai sus, poate fi prezentat astfel: "Au fost comparati subiecti fumatori, grupati n trei categorii pe baza numarului zilnic de tigari ("1-10 tigari", "11-20 tigari", "21-30 tigari"), n functie de nivelul scorului la un test de anxietate. Mediile anxietatii pentru cele trei grupuri au fost 7.83, 4.33, respectiv 4. Analiza de varianta unifactoriala a relevat o diferenta semnificativa ntre aceste medii, F (2, 15)=7.2; pe0.05". Graficul urmator prezinta variatia mediilor anxietatii celor trei categorii de fumatori. Asa cum se observa, nivelul anxietatii scade de la categoria marilor fumatori la cei care fumeaza sub 20 de tigari pe zi. n acelasi timp, putem constata ca marii fumatori manifesta un nivel considerabil mai ridicat dect celelalte doua categorii, ntre care diferentele de anxietate sunt ceva mai mici.

Acest lucru ne poate sugera ca, desi semnificativ pe ansamblul celor trei categorii, cea mai mare cantitate de variatie provine de la distanta dintre media grupului de mari fumatori si celelalte doua. Masura n care fiecare dintre grupurile prezente n studiu contribuie la varianta totala va putea fi pusa n evidenta prin analiza post-hoc. Pentru a nu apela la formule complicate si la calcule greoaie, vom prezenta modul de operare cu analiza post-hoc mai departe, n sectiunea SPSS. Se va retine ca rationamentul si modul de calcul al ANOVA prezentat mai sus pentru o variabila independenta cu trei categorii se mentine identic si pentru un numar mai mare de

categorii. n acest caz, desigur, volumul prelucrarilor este corespunzator mai mare. n fine, este de precizat faptul ca valoarea n sine a testului ANOVA, ca si a testului t, de altfel, nu este relevanta. Singurul aspect care face obiectul interpretarii este semnificatia testului, probabilitatea cu care valoarea raportului F ar fi putut fi mai mare daca valorile testate ar fi fost aleatoare. Avantajele ANOVA Utilizarea ANOVA pentru testarea ipotezelor n cazul unui numar mai mare de grupuri (esantioane) prezinta doua avantaje. Primul, tine de ceea ce am precizat deja, si anume faptul ca reducem riscul cumularii unei cantitati prea mare de eroare de tip I, prin efectuarea repetata a testului t. Al doilea, rezulta din faptul ca avem posibilitatea sa punem n evidenta diferente semnificative ntre mediile a mai multe grupuri, chiar si atunci cnd nici una dintre ele nu difera semnificativ una de cealalta (testul t). Desi, n mod normal, analiza de varianta este utilizata doar n situatia n care se doreste testarea diferentei dintre mediile a mai mult de doua grupuri independente, ea poate fi utilizata si n cazurile n care exista numai doua grupuri. Dar, utilizarea testului t pentru testarea diferentei dintre doua medii este o metoda mult mai directa, mai usor de aplicat si de nteles, dect analiza de varianta. Conditii de utilizare a testului ANOVA Utilizarea analizei de varianta unifactoriale presupune ndeplinirea urmatoarelor conditii: o o independenta esantioanelor (grupurilor supuse comparatiei) normalitatea distributiei de esantionare, n conformitate cu teorema limitei centrale egalitatea variantei grupurilor comparate (denumita "homoscedasticitate")

Atunci cnd una sau mai multe dintre aceste conditii nu sunt ntrunite, se poate adopta una dintre solutiile urmatoare: o renuntarea la ANOVA n favoarea unei prezentari descriptive (solutie care ne lipseste de posibilitatea unei concluzii testate statistic) transformarea variabilei dependente astfel nct sa dobndeasca proprietatile necesare (printre metodele uzuale, citam aici doar logaritmarea sau extragerea radicalului din toate valorile variabilei dependente) transformarea variabilei pe o alta scala de masurare si aplicarea altui test statistic (de exemplu, prin transformarea pe o scala nominala, se poate aplica testul neparametric chi-patrat sau, prin transformarea pe o scala ordinala, se poate aplica testul neparametric Kruskal-Wallis, ambele fiind tratate mai departe)

Analiza "post-hoc"

Testul ANOVA ne ofera o imagine "globala" a relatiei dintre categoriile variabilei independente si valorile variabilei dependente, fara sa ne spuna nimic cu privire la "sursa" de provenienta acesteia. n exemplul nostru, valoarea obtinuta pentru F ar putea decurge doar prin "contributia" unui singur grup (sa zicem, "marii fumatori"), celelalte grupuri avnd o "contributie" minora sau inexistenta. Cercetatorul poate fi, nsa, interesat care dintre grupuri difera ntre ele si n ce sens. Pentru a rezolva aceasta problema, au fost dezvoltate diverse teste, denumite "posthoc", calculate dupa aplicarea procedurii ANOVA. Printre cele mai frecvent utilizate sunt testele: Scheffe, Tukey si Bonferoni (desigur, se utilizeaza unul sau altul dintre ele, la alegere). Nu vom intra n detalii teoretice si de calcul cu privire la aceste teste. Fiecare are avantajele si dezavantajele sale. Important aici este sa ntelegem ca testele post-hoc se interpreteaza n mod similar testului t pentru diferenta mediilor pentru esantioane necorelate, calculate astfel nct sa ia, att ct se poate, masuri de precautie mpotriva excesului de eroare de tip I mentionat anterior. Este important de retinut faptul ca analiza post-hoc este permisa numai daca a fost obtinut un rezultat semnificativ pentru testul F. Aceasta nseamna ca analiza post-hoc nu poate fi utilizata ca substitut pentru testul t efectuat n mod repetat. Ca urmare, n practica, analiza de varianta va cuprinde doua faze: prima, in care se decide asupra semnificatiei testului F, si a doua, n cazul ca acest raport este semnificativ, n care se analizeaza comparativ diferentele dintre categoriile analizate, pe baza unui test post-hoc. n ce priveste calcularea testelor post-hoc mentionate mai sus, vom prezenta modul lor de calcul n sectiunea dedicata programului SPSS. *** TEMA PENTRU ACAS Un psiholog trebuie sa recomande unui patiser culoarea glazurii pentru un nou tip de prajitura, avnd de ales ntre verde, rosu si galben. n acest scop alege 18 subiecti, carora le cere sa efectueze o sarcina plictisitoare avnd la ndemna platouri cu prajituri glazurate. Subiectii sunt mpartiti n trei grupe, fiecare primind prajituri de o singura culoare. Dupa un timp, numara cte prajituri a mncat fiecare subiect din cele trei grupuri si construieste tabelul urmator. Verde 3 7 1 0 9 2 Rosu 3 4 5 6 4 6 Galben 2 0 4 6 4 1 Gasiti F critic pentru E=0.05 Calculati F Care este decizia statistica n acest caz Prezentati rezultatul n format APA

Testul t pentru diferenta dintre mediile a doua esantioane dependente


Testele de comparatie prezentate pna aici (t si ANOVA) au vizat situatii n care mediile comparate apartineau unor grupuri compuse din subiecti diferiti si independenti,

(motiv pentru care sunt denumite ca "independente"). Din cauza ca acest model presupune comparatii ntre subiecti, el se mai numeste si model intersubiect (betwenn subject design). Un alt model uzual n cercetarea psihologica vizeaza comparatia a doua valori masurate pe aceiasi subiecti. Iata cteva situatii de cercetare tipice: a) Situatiile n care n care o anumita caracteristica psihologica se masoara naintea unei conditii si dupa actiunea acesteia. Exemple: (i) evaluarea nivelului anxietatii nainte si dupa un program de desensibilizare; (ii) evaluarea performantei cognitive a unui lot de subiecti, nainte si dupa procedura de ascensiune simulata n camera barometrica la 5000m; (iii) evaluarea unei timpului de reactie nainte si dupa ingerarea unei substante. Deoarece se bazeaza pe masurari repetate ale aceleiasi variabile, acest model de cercetare este cunoscut ca modelul masurarilor repetate" (repeated-measures design). Situatiile n care cercetatorul utilizeaza doua conditii de investigare, dar plaseaza aceiasi subiecti n ambele conditii. De exemplu, ntr-un studiu asupra efectelor unui anumit tip de stimulare, se pot masura undele cerebrale, simultan n cele doua emisfere cerebrale. Fiind vorba despre masurarea unor variabile care sunt evaluate concomitent, la aceiasi subiecti, acesta este un model "intrasubiect" (within-subjects design).

b)

c) Situatiile n care natura situatiei experimentale nu permite utilizarea acelorasi subiecti pentru cele doua masurari. De exemplu, n cazul unei interventii terapeutice care are un efect pe termen foarte lung. n acest caz se poate gasi pentru fiecare subiect corespunzator conditiei initiale un subiect "similar", corespunzator conditiei finale, constituind astfel "perechi de subiecti" apartinnd fiecare unui grup distinct, ntre care se poate face o comparatie directa. Ca urmare, desi diferiti, vom trata cei doi subiecti din pereche ca si cum ar fi aceeasi persoana. Sau, ntr-un alt context, putem compara subiecti care sunt ntr-un anumit tip de relatie, interesndu-ne diferenta dintre ei sub o anumita caracteristica. De exemplu, ne poate interesa daca ntre nivelul de inteligenta dintre baietii si fetele care formeaza cupluri de prieteni, exista o anumita diferenta. n acest caz, desi avem doua esantioane distincte, fiecarui subiect din esantionul de baieti i corespunde un subiect din esantionul de fete, constituirea celor doua esantioane facndu-se pe baza relatiei de prietenie dintre ei. n aceiasi categorie se afla comparatiile ntre perechi de gemeni sau cele dintre soti. n astfel de cazuri, avem de a face cu asa numitul model al "esantioanelor perechi" (matched pairs design). Indiferent de tipul lor, toate modele prezentate mai sus au un obiectiv similar, acela de a pune n evidenta n ce masura o anumita conditie (variabila independenta) corespunde unei modificari la nivelul unei caracteristici psihologice oarecare (variabila dependenta). Vom observa ca, n toate exemplele evocate, variabila independenta este una de tip nominal, dihotomic (nainte/dupa; semestru/sesiune; grup de cercetare/grup de control; baiat/fata; sot/sotie, etc.), n timp ce variabila dependenta se masoara pe o scala de interval/raport. De asemenea, scoatem n evidenta faptul ca n ambele situatii se utilizeaza masuratori de acelasi fel, cu acelasi instrument, care produce valori exprimate n aceeasi unitate de masura, ntre care se poate efectua un calcul direct al diferentei.

Pentru descrierea testului statistic adecvat acestor situatii sa ne imaginam urmatoarea situatie generica de cercetare: Un grup de pacienti cu tulburari de tip anxios sunt inclusi ntrun program de psihoterapie, avnd drept scop ameliorarea nivelului anxietatii. nainte de nceperea programului a fost aplicata o scala de evaluare a anxietatii. Acelasi instrument a fost aplicat din nou, dupa parcurgerea programului de terapie. Aici s-ar putea pune ntrebarea de ce nu consideram valorile rezultate din cele doua masuratori ca fiind independente, urmnd sa utilizam testul t pentru acest tip de date? Exista mai multe argumente n favoarea respingerii acestei variante simplificatoare: y Utilizarea valorilor perechi ofera informatii mai bogate despre situatia de cercetare. n modele de cercetare de tip nainte/dupa ea capata chiar valente de experiment; Testul t pentru esantioane independente surprinde variabilitatea dintre subiecti, n timp ce testul t pentru esantioane dependente (masurari repetate) se bazeaza pe variabilitatea "intra-subiect", aceea care provine din diferenta valorilor de la o masurare la alta, la nivelul fiecarui subiect n parte; Daca exista o diferenta reala ntre subiecti, atunci testul diferentei dintre valorile perechi are mai multe sanse sa o surprinda dect cel pentru valori independente.

Revenind la tema de cercetare pe care am enuntat-o mai sus, desi avem aceiasi subiecti, si n primul si n al doilea caz, ne vom raporta la aceasta situatie ca si cum ar fi doua esantioane. Unul al subiectilor care "nu au urmat" nca un program de terapie, iar celalalt, al subiectilor care "au urmat" un astfel de program. Datorita faptului ca cele doua esantioane sunt formate din aceiasi subiecti, ele se numesc "dependente" sau "corelate". n acest tip de studiu, obiectivul testului statistic este acela de a pune n evidenta semnificatia diferentei dintre mediile anxietatii n cele doua momente. Cea mai simpla procedura de calcul este metoda diferentei directe. Pentru aceasta, calculam diferentele fiecarei perechi de valori din cele doua distributii (X2-X1), obtinnd astfel o distributie a diferentelor, pe care o vom nota cu D. Logica ipotezei de nul Daca programul de terapie ar fi total ineficient, trebuie sa presupunem ca diferentele pozitive le-ar echilibra pe cele negative ceea ce, la un numar mare de esantioane ipotetice, ar conduce la o medie a diferentelor egala cu 0. Ca urmare, ipoteza de nul presupune ca media diferentelor la nivelul populatiei este 0. Ceea ce nseamna ca testul t trebuie sa demonstreze ca media diferentelor masurate este suficient de departe de 0, pentru a respinge ipoteza de nul si a accepta ipoteza cercetarii. Rezulta ca putem reduce metoda de calcul la formula testului t pentru un singur esantion:

care devine n cazul nostru:

formula 3.20 unde mD este media distributiei D (a diferentelor dintre cele doua masurari), este media "populatiei" de diferente, iar sD este eroarea standard a distributiei D (masoara mprastierea distributiei D). Exemplu analitic de calcul Problema cercetarii: Se poate obtine o reducere a reactiilor anxioase prin aplicarea unei anumite proceduri de psihoterapie? Ipoteza cercetarii (H1 ): Pentru test bilateral p Programul de psihoterapie are un efect asupra anxietatii. Pentru test unilateral p Programul de psihoterapie reduce intensitatea reactiilor de tip anxios. Ipoteza de nul (H0 ): Pentru test bilateral p Programul de psihoterapie nu are nici un efect asupra anxietatii. Pentru test unilateral p Programul de psihoterapie nu reduce nivelul anxietatii.

Populatiile cercetarii: Populatia 1 p Subiectii cu anxietate ridicata care nu au urmat un program de terapie Populatia 2 p Subiectii cu anxietate ridicata care au urmat un program de terapie Ipoteza cercetarii afirma ca ele sunt diferite, n timp ce ipoteza de nul afirma ca ele sunt identice.

Esantion: Un singur grup de subiecti cu probleme anxioase (N=8) al carui nivel de anxietate este evaluat nainte si dupa programul de terapie. Criteriile deciziei statistice Alegem modul de testare a ipotezei: bilateral Fixam, conventional, nivelul E=0.01 Sa spunem ca preferam acest nivel deoarece costurile de implementare a programului sunt destul de mari, iar pacientii trebuie convinsi ca merita timpul si banii. Cautam t critic pentru E=0.01 n tabelul distributiei t, pentru 7 grade de libertate (8-1). Tabelul ne da valorile pentru un test unilateral (dreapta curbei). Pentru testul bilateral trebuie mai nti sa njumatatim valoarea aleasa pentru E (0.01/2=0.005). n continuare, cautam valoare aflata la intersectia coloanei gradelor de libertate (7) cu coloana lui E=0.005 si citim t critic= -3.49. i atribuim semnul minus, deoarece ne asteptam ca nivelul anxietatii sa scada dupa aplicarea programului de terapie. Datele cercetarii: Dupa nainte de program (X1) 6 8 10 9 5 6 11 5 60 8 7.50 D program (X2-X1) (X2) 6 7 11 8 5 5 10 4 56 8 7.00 .00 -1.00 1.00 -1.00 .00 -1.00 -1.00 -1.00 -4 8 mD=-0,5 .50 -.50 1.50 -.50 .50 -.50 -.50 -.50 .25 .25 2.25 .25 .25 .25 .25 .25 7(D-mD)2=4 D-mD (D-mD) 2

7X N

sD =

Nota: n principiu, sub aspectul procedurii statistice, nu prezinta nici o importanta daca utilizam diferenta X1-X2 sau X2-X1. Depinde de ceea ce doreste sa determine cercetatorul. Important este ca, n final, sa interpreteze corect rezultatul obtinut, n functie de semnul

diferentei si semnificatia concreta a acestuia. Totusi, n modelele de tip nainte/dupa, este mai adecvata utilizarea diferentei X2-X1.

Introducem valorile n formula 3.20 si obtinem:

Rationamentul decizional y y Comparam t calculat cu t critic pentru E=0.01 bilateral: -2,08 < -3.49 Decizia statistica: "acceptam ipoteza de nul". Probabilitatea de a se obtine un nivel al anxietatii mai redus doar ca urmare a jocului hazardului este mai mare dect nivelul pe care ni l-am impus drept criteriu de decizie (adica mai mica de 1%). Decizia cercetarii: "datele nu sprijina ipoteza cercetarii". Ca urmare, nu putem accepta ca efectul obtinut se datoreaza programului de terapie. Programul de terapie nu reduce n mod semnificativ nivelul anxietatii.

Publicarea rezultatului La publicare se vor mentiona: volumul esantionului, mediile variabilei dependente n raport cu valorile variabilei independente, valoarea testului t, pragul de semnificatie si daca testul a fost unilateral sau bilateral. Avnd n vedere faptul ca, uzual, testele statistice se efectueaza bilateral, se poate mentiona numai cazul n care testul este unilateral, eventual cu explicarea motivului pentru care a fost preferata aceasta solutie. Pentru exemplul de mai sus, o prezentare narativa a rezultatului ar putea arata astfel: "Un esantion de 8 subiecti cu probleme de anxietate au participat la un program de terapie anxiolitica. Nivelul anxietatii (masurat cu o scala specifica) a fost evaluat nainte si dupa programul de terapie. S-a constatat o reducere a nivelului anxietatii de la o medie de 7.50 la 7.0, dupa aplicarea terapiei. Diferenta nu a atins pragul semnificatiei statistice t(7)=2,08, p>0.01, pentru E=0.01 bilateral." Limitele de ncredere pentru diferenta dintre medii La fel ca si n cazul testului t pentru esantioane independente, se pune problema generalizarii rezultatului la nivelul populatiei, cu alte cuvinte, care este intervalul n care ne putem astepta sa se afle diferenta dintre medii, pentru variabilele studiate. Pentru o estimare cu o precizie de 99%, conform cu nivelul alfa ales, limitele critice pentru diferenta dintre medii sunt cele care corespund valorilor lui p=0,005, de o parte si de alta a curbei t (3.4998). Formula de calcul pentru intervalul de ncredere deriva, si n acest caz, din formula testului:

de unde rezulta formula pentru calculul limitelor de ncredere ale mediei diferentei:

n conditiile studiului nostru, decizia statistica de acceptare a ipotezei de nul a infirmat ipoteza cercetarii dar analiza intervalului de ncredere poate ajuta la ntelegerea mai buna a situatiei. nlocuind valorile corespunzatoare studiului nostru, obtinem urmatoarele limite de ncredere: Limita inferioara: Limita superioara = -0,5-(-3.4998)*0.26=+0.40 = -0,5+(-3.4998)*0.26=-0.90

Rezultatul arata ca daca media diferentei n conditiile esantionului de cercetare este de 0.5, atunci media adevarata a diferentie, la nivelul populatiei, se afla, cu o probabilitate p=0.99 (sau 99%), ntre o limita inferioara de +0.40 si o alta superioara de -0.90.

Nota: n acest caz, +0.40 este limita inferioara deoarece t critic este negativ, iar o diferenta mai aproape de zero, nseamna o valoare mai mica n raport cu extrema negativa a curbei.

Imaginea ilustreaza faptul ca n, conditiile estimate pe esantionul de diferente cercetat, diferenta reala la nivelul populatiei de perechi de esantioane ar fi undeva ntre o valoare minima de +0.40 si una maxima de -0.90. Ceea ce ne atrage atentia este faptul ca intervalul de ncredere include si valoarea zero, care corespunde diferentei nule dintre mediile

esantioanelor comparate. Acest lucru corespunde faptului ca testul t a avut o valoare nesemnificativa.O analiza a datelor ar putea sa i arate cercetatorului ca unul dintre subiecti a obtinut un scor mai mare al anxietatii dupa terapie, fapt care este nefiresc si trebuie luat n discutie. Acest caz se pare ca a fost decisiv n neatingerea pragului de semnificatie. O discutie cu subiectul n cauza poate conduce la concluzia ca problemele lui sunt de alta natura si ca, n cazul sau, terapia respectiva nu este eficienta pentru ca nu este adecvata suferintei pe care o are. Daca se constata ca asa stau lucrurile n realitate, psihologul poate elimina din calcul valoarea acelui subiect, si poate reface calculele, situatie n care testul t ar putea deveni semnificativ iar metoda terapeutica, validata. Atentie, nsa, daca n acest exemplul am recomandat eliminarea cazului atipic, am facut-o bazati pe presupunerea ca inadecvarea respectiva a fost dovedita convingator si indubitabil. Eliminarea nejustificata a valorilor neconvenabile dintr-o cercetare este interzisa. Nu trebuie sa omitem faptul nici faptul ca, n exemplul nostru, este vorba de un esantion foarte mic iar esantioanele de acest gen conduc la valori mari ale erorii standard a mediei si, prin aceasta, la intervale de ncredere mai largi. Chiar atunci cnd obtinem rezultate semnificative pe esantioane mici, ele pot prezenta un interval de ncredere mai mare dect rezultatele obtinute pe esantioane mari. n acelasi timp, trebuie sa retinem ca distributia de esantionare a mediilor obtinute pe esantioane mici este instabila, fapt care impune cel putin replicarea cercetarii, pentru mai multa siguranta. ***
TEMA PENTRU ACAS Ne propunem sa scoatem n evidenta efectul stresului temporal (criza de timp) asupra performantei de operare numerica. n acest scop, selectam un esantion de subiecti carora le cerem sa efectueze un test de calcule aritmetice n doua conditii experimentale diferite: prima, n conditii de timp nelimitat, cu recomandarea de a lucra ct mai corect; a doua, n conditii de timp limitat, cu conditia de a lucra ct mai repede si mai corect n acelasi timp. Rezultatele celor doua reprize sunt cele din tabelul alaturat. Sa se rezolve urmatoarele sarcini: Fara criza de timp 67 79 83 80 99 95 80 100 Cu criza de timp 65 73 70 85 93 88 72 69 1. 2. 3. 4. 5. 6. APA) Formularea ipotezei cercetarii si a ipotezei de nul Stabilirea valorii t critic pentru =0,05 bilateral Calcularea testului t Decizia statistica Decizia cercetarii Formularea concluziei n raportul de cercetare (format

Coeficientul de corelatie liniara (Pearson)

Introducere

Testul t pentru esantioane dependente se aplica n situatia n care avem o variabila dependenta masurata n doua situatii diferite. n practica cercetarii, nsa, exista si situatia n care avem doua variabile dependente, masurate pentru aceiasi subiecti. Cu alte cuvinte, avem doua masurari pentru aceiasi subiecti, dar efectuate cu instrumente diferite. Acest gen de situatie este ntlnit n cercetari a caror problema se exprima n maniera: "exista o legatura ntre numarul atitudini pozitive pe care le manifesta oamenii si numarul atitudinilor pozitive pe care le primesc din partea celor din jur?". Sau: "exista o legatura ntre timpul de reactie si nivelul extraversiunii ca trasatura de personalitate?". n aceste cazuri avem doua variabile dependente cu valori perechi pentru fiecare subiect si nici o variabila independenta. Pentru situatii de acest gen, problema care se pune este existenta unei relatii variatia reciproca a acelor doua variabile. Testul statistic utilizat este testul de corelatie (coeficientul de corelatie). Termenul de corelatie, nainte de a fi un concept statistic este un cuvnt uzual n limbajul cotidian. n esenta, el exprima o legatura ntre anumite aspecte ale realitatii asa cum este ea reflectata n plan observatiei directe. (O parcare plina cu masini ne sugereaza ca magazinul alaturat este plin cu cumparatori, ntre numarul de masini din parcare si numarul de cumparatori existnd o anumita "corelare"). La nivel statistic, corelatia exprima o legatura cantitativa sistematica ntre valorile a doua variabile perechi, masurate pe subiecti apartinnd aceluiasi esantion de cercetare. Sa presupunem ca un grup de studenti au efectuat un test de inteligenta bazat pe rationament abstract/figurativ si unul altul, bazat pe rationament verbal/logic. Daca pe masura ce performanta la unul dintre teste creste concomitent cu performanta la celalalt test, avem ceea ce se numeste o corelatie pozitiva. Daca, dimpotriva, cresterea performantei la un test este asociata cu scaderea performantei la celalalt test, ne aflam n fata unei corelatii negative. Este evident ca exista si posibilitatea ca variatia performantei la unul din teste sa nu aiba nici o legatura cu variatia performantei la al doilea test. Intensitatea legaturii dintre cele doua valorile celor doua distributii se exprima prin coeficientul de corelatie liniara, notat cu simbolul r. Introdus de Karl Pearson[1], el mai este cunoscut si sub numele de coeficientul de corelatie Pearson, sau al "moment-produsului", dupa expresia uneia din formulele de calcul. n exemplul de mai sus am presupus valori care se refera la doua teste de inteligenta, masurate, ambele, prin numarul de raspunsuri corecte. Cum am putea corela nsa, doua variabile masurate fiecare cu alta unitate de masura, de exemplu, timpul de reactie n sutimi de secunda, cu extraversiunea, exprimata prin scorul la un test? Solutia cea mai simpla este aceea de a transforma ambele variabile n distributii standardizate z, care sunt independente de unitatea de masura. Pe aceasta transformare se bazeaza si formula de calcul a coeficientului de corelatie:

(formula 3.21)

unde zx respectiv zy sunt scorurile z ale variabilelor x si y iar N este volumul esantionului Daca presupunem ca cele doua variabile au valori identice, atunci zx ar fi egali cu zy iar formula ar deveni:

(formula 3.22)

n continuare, prin nlocuirea expresiei de calcul a lui z am ajunge la formula deja cunoscuta a dispersiei. Ori, stim ca dispersia unei distributii z este ntotdeauna egala cu +1. Am obtinut astfel valoarea maxima pe care o poate atinge coeficientul de corelatie n cazul unei corelatii pozitive perfecte (rmax=+1). n cazul unei corelatii negative perfecte, conform aceluiasi rationament, obtinem valoarea minima a coeficientului de corelatie (rmin= -1).

Reprezentarea grafica a corelatiei

Plasarea valorilor celor doua variabile pe un grafic produce o imagine intuitiva a relatiei dintre valori. Acest tip de grafic se numeste scatterplot.

n cazul unei corelatii pozitive, reprezentarile scatterplot pot arata astfel:

Tendinta este aceea ca valorilor mari de pe axa orizontala sa le corespunda valori mari pe axa verticala. n cazul unei corelatii pozitive perfecte (r=+1), punctele de intersectie ale perechilor de valori se plaseaza pe o linie. Cu ct corelatia este mai mica, cu att norul de puncte este mai larg dar forma elipsei indica relatia pozitiva dintre cele doua variabile.

n imaginea de mai jos avem reprezentari scatterplot caracteristice pentru corelatii liniare negative.

Tendinta este aceea ca valorilor mari de pe axa orizontala sa le corespunda valori mici pe axa verticala. Ca urmare, att linia corelatiei negative perfecte (r=-1) ct si diagonala mare a elipsei norului de puncte al corelatiei imperfecte se orienteaza din stnga sus spre dreapta jos a sistemului de coordonate.

Atunci cnd corelatia dintre cele doua variabile este inexistenta, norul punctelor de intersectie are o forma circulara, care nu contureaza nici o tendinta (r=0).

Calcularea coeficientului de corelatie liniara (Pearson)

De obicei, pentru a usura calcularea manuala a coeficientului de corelatie, atunci cnd avem date numeroase, formula 3.21 este transformata prin nlocuirea expresiilor pentru scorul z. Se obtine astfel o formula cu aparenta mai complicata, dar mai usor de pus n practica, deoarece se bazeaza pe valori care se obtin prin calcule simple:

de unde obtinem:

(formula 3.23)

unde: y y y y X si Y reprezinta valorile individuale ale distributiilor X si Y mx si my reprezinta mediile distributiilor X si Y sx si sy reprezinta abaterile standard ale distributiilor X si Y N este volumul esantionului

Formula 3.23, numita si a "momentului produselor" poate fi utilizata pentru calcule, la fel de bine ca si formula 3.22, obtinndu-se rezultate identice.

EXEMPLU DE CALCUL

Vom lua n considerare cazul aplicarii celor doua teste de rationament de tip diferit. n acest caz, ipoteza cercetarii se exprima n maniera: "exista o legatura (corelatie) ntre cele doua tipuri de rationament, cei care obtin rezultate bune la unul din teste, vot tinde sa obtina rezultate bune si la celalalt". Desigur, ipoteza poate fi formulata si corespunzator unei corelatii negative, daca avem motive sa presupunem acest lucru.

Scorul la un test de calcul aritmetic X 25 32 40 29 31 16 28 .35 1.53 - .09 .20 -2.02 - .24 ZX = -.68

Scorul la un test de rationament verbal Y 28 27 41 34 25 19 26 - .41 1.59 .59 -.70 -1.55 - .55 ZY = -.27

Produsul Z ZX*ZY (-.68)(-.27) = .18 - .14 2.43 - .05 - .14 3.13 .13

36 7X = 237 mX= 29.63 sX = 6.76

.94

39 7Y = 239 mY = 29.88 sY = 7.01

1.30

1.23 7 zX*zY = 6.77

Graficul scatterplot exprima o asociere pozitiva ntre cele doua variabile:

Pentru calcularea coeficientului de corelatie am ales formula de definitie (11.1), care se preteaza la distributii cu numar mic de valori. nlocuind valorile n formula, obtinem coeficientului de corelatie:

Semnificatia coeficientului de corelatie

La fel ca si n cazul celorlalte teste statistice, si coeficientul r se raporteaza la o distributie teoretica, derivata din distributia t. Indiferent ct de mare este r calculat, nu putem avea ncredere n acesta atta timp ct nu stim n ce masura este diferit de un r care ar rezulta prin jocul ntmplarii. Pentru aceasta se utilizeaza distributia t si o formula care deriva din testul t. Pentru usurarea evaluarii semnificatiei, a fost creat un tabel special cu praguri de semnificatie ale coeficientului de corelatie r si care poate fi folosit fara a mai fi necesara utilizarea formulei (Anexa 4). Practic, se cauta n tabel care este nivelul lui r pentru numarul gradelor de libertate (df=N-2) si pragul E ales n prealabil. Daca valoarea tabelara este cel putin egala cu valoarea calculata a lui r, atunci ipoteza de nul se respinge, coeficientul de corelatie fiind considerat semnificativ. n cazul exemplului de mai sus, pentru test unilateral, E=0.05 si df=6 (8-2), citirea tabelului se face ca n figura alaturata. Valoarea din tabel a lui r este 0.62. n timp ce valoarea calculata de noi este 0.85. Aceasta nseamna ca am obtinut un coeficient de corelatie mai mare dect cel care ar fi rezultat prin jocul ntmplarii[2].

Ca urmare, respingem ipoteza de nul ("ntre cele doua variabile nu este nici o legatura") si acceptam ipoteza cercetarii ("performanta aritmetica si cea verbal logica sunt corelate, variaza concomitent, n acelasi sens ")

Interpretarea coeficientului de corelatie

Asa cum am spus deja, avem o corelatie perfecta atunci cnd r este egal cu +1 sau -1. Valoarea obtinuta de noi (+0.85) este apropiata de +1 ceea ce ne sugereaza ca ntre cele doua tipuri de performanta exista o legatura. Desigur, +0.85 este mai putin dect +1 dar si mai mult dect, sa zicem, +0.32. O asemenea interpretare, desi absolut corecta, nu poate fi satisfacatoare. Se simte necesitatea de a avea un criteriu de valorizare a cuantificarii numerice a corelatiei. De-a lungul timpului au fost propuse diverse astfel de scale de valorizare, prin atribuirea unor calificative coeficientilor de corelatie, n functie de marimea lor. Aceasta problema comporta multe discutii iar solutiile oferite de diferiti autori sunt deseori diferite. Ca regula generala, toti autorii sunt de acord ca valorile sub 0,1 ale coeficientilor de corelatie trebuie sa fie considerate "neglijabile", chiar si atunci cnd ating pragul de semnificatie statistica. Mai departe, oferim, cu caracter orientativ, modelul de descriere sugerat de Hopkins[3] cu privire la interpretarea valorilor coeficientilor de corelatie:

Coeficientul de corelatie Descriptor 0.0-0.1 0.1-0.3 0.3-0.5 0.5-0.7 0.7-0.9 0.9-1 Foarte mic, neglijabil, nesubstantial Mic, minor Moderat, mediu Mare, ridicat, major Foarte mare, foarte ridicat Aproape perfect, descrie relatia dintre doua variabile practic indistincte

naintea oricarui calificativ nsa, prima conditie pentru a lua n considerare existenta unei corelatii ntre doua variabile ramne atingerea pragului de semnificatie (alfa). Daca valoarea lui r corespunde unui nivel alfa mai mare de 0.05, sau dect alt prag legitim decis de cercetator, existenta unei corelatii este de neluat n seama, indiferent de marimea coeficientului Pearson. Aceasta, deoarece nu avem temei pentru a accepta ca se ndeparteaza suficient de o valoare care ar fi putut decurge din jocul hazardului. n cele din urma, ce trebuie sa luam n considerare, semnificatia sau intensitatea asocierii? Desigur, raspunsul este unul relativ. Daca finalitatea studiului este aceea de a lua decizii, ca n cazul selectiei de personal, de exemplu, se vor cauta valori ct mai mari ale coeficientului de corelatie (r), implicit ale celui de determinare (r2). Dar, daca obiectivul este preponderent teoretic, de a pune n evidenta relatii "ascunse" ntre variabile, atunci indiferent de marimea lor, coeficientii de corelatie vor fi luati n considerare (dar numai daca sunt mai mari de 0.1).

Limitele de ncredere pentru coeficientul de corelatie

Atunci cnd calculam coeficientul de corelatie pentru valorile masurate pe un esantion o facem, desigur, cu scopul de a avea o estimare asupra gradului n care cele doua variabile au o variatie comuna la nivelul ntregii populatii. Deoarece calcularea corelatiei pe "valorile populatiei" este practic imposibila, tot ce putem face este sa o estimam, cu o anumita marja de eroare, prin utilizarea esantionului. Astfel, n termeni formali, r (calculat pentru esantion) este o estimare pentru (ro), corelatia "adevarata" la nivelul populatiei.

Calcularea limitelor de ncredere

Construirea intervalelor de ncredere pentru coeficientul de corelatie la nivelul populatiei ( ) nu este la fel de simpla ca n cazul altor valori statistice. Atunci cnd =0, valorile rs (cele care ar fi calculate pe esantioanele extrase din aceeasi populatie) ar forma o distributie simetrica, n jurul lui zero ("normala", daca volumul esantionului este suficient de mare). Dar daca =+0.7 distributia lui rs are o mprastiere asimetrica n jurul lui acestei valori. Motivul este simplu: este mai mult "loc" pentru valori sub +0.7 dect peste aceasta valoare (deoarece stim ca r ia valori ntre -1 si +1). Cu ct estimarea pentru este mai aproape de limitele teoretice ale lui r, cu att distributia rs este mai asimetrica spre partea opusa. Aceasta particularitate creeaza o piedica n transformarea coeficientilor rs n scoruri Z (cu majuscula, pentru a se evita confuzia cu scorurile z clasice), necesare construirii limitelor intervalului de ncredere pentru . Problema a fost rezolvata de Fisher, care a elaborat un algoritm pe

baza caruia valorile rs sunt transformate n valori Z, a caror arie de distributie sub curba normala este cunoscuta:

Z = 0.5log[(1 + r)/(1 - r)]

Pentru a se evita aplicarea acestei formule relativ greoaie, se poate utiliza un tabel (vezi Anexa 5) care, chiar daca nu contine toate valorile intermediare, este suficient pentru a acoperi nevoile practice. Sa luam ca exemplu valoarea coeficientului de corelatie partiala obtinut de noi mai sus: r=0.85. Ne propunem sa aflam care sunt limitele de ncredere ale acestei valori, adica sa definim intervalul n care se poate afla o astfel de valoare, cu o probabilitate asumata. De regula, asa cum stim, aceasta probabilitate asumata este de 0.05 sau, exprimata altfel, un nivel de ncredere de 95%. Practic, aflarea limitelor se face astfel: Se transforma r calculat n valoare Z, citind tabela Fisher: n cazul nostru, pentru r=0.85 avem o valoare Z=1.2561 (facem o medie ntre valorile tabelare apropiate). Pe o distributie normala, cum este distributia de esantionare Z, stim ca aproximativ 95% dintre valori se ntind ntre 1.96 si +1.96. Adica, pe o distanta de aproximativ doua abateri standard n jurul mediei (abaterea standard a valorilor Z fiind 1). Se calculeaza eroarea standard a transformarii Z, cu formula:

unde N este volumul esantionului

Se calculeaza limitele superioara si inferioara a intervalului:

, adica:

Limita superioara (exprimata n unitati Z): 1.2562+1.96*0.447=+2.132 Limita inferioara (exprimata n unitati Z): 1.2562-1.96*0.447=+0.380

Limitele astfel calculate sunt exprimate n valori transformate Z, ori noi avem nevoie sa stim limitele n valori ale lui r. Pentru aceasta, facem acum transformarea inversa, citind valorile lui Z n tabela Fisher, corespunzatoare celor doua limite de mai sus:

Limita superioara de ncredere pentru r=+0.97 Limita inferioara de ncredere pentru r=+0.36

Utilizarea limitelor de ncredere

Daca analizam limitele intervalului de ncredere obtinute, pentru exemplul nostru, trebuie sa constatam ca ele sunt foarte mari, n zona valorilor pozitive, dar avnd limita inferioara extrem de aproape de valoarea zero. Acest fapt conduce la concluzia ca, desi este att mare si semnificativ statistic, coeficientul obtinut are o valoare mica de generalizare. Situatia este generata de volumul extrem de mic al esantionului. Amplitudinea intervalului de ncredere este direct dependenta de volumul esantionului. Cu ct N este mai mare, cu att valoarea erorii standard tinde sa scada, ceea ce aduce limitele intervalului de ncredere mai aproape de valoarea calculata a lui r. Sa ne imaginam ca am efectuat un calcul de corelatie pe 30 de subiecti si am obtinut r=0.30. Limitele de ncredere pentru acesta sunt ntre -0.07 si +0.60, ceea ce arata ca este nesemnificativ, dat fiind faptul ca ntre cele doua limite este si valoarea zero, aceea care este vizata de ipoteza de nul. Dar, dat fiind faptul ca n formula erorii standard a lui r volumul esantionului de afla la numitor, cu ct N va fi mai mare, cu att valoarea lui re va fi mai mica iar limitele intervalului de ncredere pentru r, mai aproape de r. Pentru exemplul anterior, calculele ne arata ca, daca am creste volumul esantionului la 50 de subiecti, limita inferioara trece deja peste valoarea zero. Celelalte linii din tabel prezinta efectul de marime al esantionului n cazul cresterii lui N pna la 100 de subiecti.

Pearson N r 30 40 50 60 70 80 90 100 0,30 0,30 0,30 0,30 0,30 0,30 0,30 0,30

Niv. de ncredere (%) 95 95 95 95 95 95 95 95

Limite de ncredere inferioara superioara -0,07 -0,01 0,02 0,05 0,07 0,09 0,10 0,11 0,60 0,56 0,53 0,51 0,50 0,49 0,48 0,47

Corelatie si cauzalitate

Coeficientul de corelatie ne ofera infirmatii despre modul n care variaza valorile a doua variabile una n raport cu cealalta. Ca urmare, nu i se poate atribui o semnificatie de cauzalitate ntre variabile dect atunci cnd cele doua variabile au fost masurate ntr-un context care probeaza cauzalitatea. Iar acest lucru se petrece numai n situatii de experiment.

Coeficientul de determinare

Valorile lui r trebuie considerate pe o scala ordinala. Cu alte cuvinte, nu este permis sa afirmam ca un coeficient de corelatie de 0.40 este de doua ori mai mare dect un altul de 0.20. Daca dorim sa comparam n mod direct doi coeficienti de corelatie trebuie sa ridicam valorile lui r la patrat (r2) obtinnd astfel ceea ce se numeste coeficient de determinare (prezentat n programele statistice si ca "r squared"). Pentru exemplificare, 0.852 = 0.72. Daca citim n procente rezultatul obtinut, putem spune ca 72% din variatia (mprastierea) uneia dintre cele doua variabile este concomitenta cu variatia celeilalte variabile. Sau, pentru a fi si mai corecti, cele doua variabile au in comun 72% din variatia care le caracterizeaza. Caracterul liniar al corelatiei Pearson

Trebuie sa retinem ca ceea ce exprima r este nivelul corelatiei liniare, adica masura n care linia care uneste valorile perechi este rectilinie. Aceasta este o forma de aproximare a legaturii dintre variabile. n realitate, uneori, corelatia dintre doua variabile are o forma care se abate de la modelul rectiliniu (este o curba). Daca privim imaginile de mai jos, vom vedea cteva tipuri posibile de curbe de corelatie. Figurile a si b exprima corelatii perfecte dar care se supun unui model curbiliniu, n timp ce figura c reprezinta o corelatie perfecta dar rectilinie.

Exista si proceduri de calculare a coeficientului de corelatie curbilinie dar acestea nu fac obiectul unei introduceri n statistica aplicata. Calcularea corelatiei Pearson pentru variabilele reprezentate in figurile a si b, ar conduce la valori mici ale acesteia, n ciuda asocierii grafice evidente a valorilor lor. Iata si un exemplu concret n acest sens. Am introdus valorile lui z si probabilitatile corespunzatoare de pe curba normala, ntr-un program de prelucrari statistice. Coeficientul de corelatie si curba de distributie pentru cele doua variabile sunt prezentate n imaginea de mai jos[4]:

Asa cum se observa, n timp ce r=0 indica absenta oricarei corelatii liniare ntre variabile, desi curba de distributie arata o corelatie curbilinie perfecta.

Din fericire, astfel de situatii sunt rare n realitate, modelul corelatiei liniare fiind adecvat pentru un mare numar de relatii dintre variabilele naturale, incluzndu-le si pe cele psihologice. Atunci cnd exista suspiciuni consistente cu privire la natura liniara a legaturii dintre variabile, se pot efectua anumite transformari care sa le aduca n cadrul unei variatii liniare (de exemplu, extragerea radicalului sau logaritmarea variabilelor). Atunci cnd se raporteaza un coeficient de corelatie fara a se preciza caracterul liniar sau curbiliniu, vom considera ca acesta se refera la corelatia liniara. Oricum, graficul scatterplot ofera informatii suplimentare semnificative si, din acest motiv, este recomandabila analizarea acestuia de fiecare data cnd utilizam testul de corelatie Pearson.

Conditii pentru calcularea coeficientului de corelatie Pearson

Pentru a putea utiliza n mod legitim calculul de corelatie, esantionul trebuie sa fie aleator iar cele doua variabile (ambele masurate pe scale de interval/raport) trebuie sa aiba o distributie care sa nu se abata grav de la distributia normala. Aceasta conditie este cu att mai importanta cu ct esantionul este mai mic. Utilizarea coeficientul de corelatie

Analiza de corelatie este una dintre cele mai uzuale proceduri statistice n cercetarea psihologica. Printre utilizarile cele mai comune mentionam analiza consistentei si validitatii testelor psihologice. Consistenta se refera la gradul n care un instrument de evaluare se concentreaza asupra unei anumite realitati psihice. Validitatea, se refera la faptul daca ceea ce presupune ca masoara un instrument psihologic este masurat cu adevarat (de exemplu, o scala de anxietate masoara cu adevarat anxietatea?). Din cele prezentate, rezulta ca putem utiliza coeficientul atunci cnd avem serii perechi de distributii. Pentru o mai buna ntelegere, se cuvine sa facem cteva aprecieri comparative cu testul t pentru esantioane dependente. Testul t pentru esantioane dependente, se aplica atunci cnd masuram o anumita variabila n doua situatii diferite (de ex. nainte/dupa), ceea ce presupune aceeasi unitate de masura. Coeficientul de corelatie poate fi aplicat att pentru variabile masurate cu aceeasi unitate de masura ct si pentru variabile exprimate n unitati de masura diferite. Aceasta deoarece formula de calcul ia n considerare expresia standardizata a valorilor (corurile z). ntrebarea este, cnd utilizam unul sau altul dintre cele doua teste? Raspunsul tine de scopul pe care ni-l propunem. Daca dorim sa punem n evidenta diferenta dintre valorile medii ale variabilelor, vom aplica testul t pentru esantioane dependente. Daca ne intereseaza intensitatea variatiei concomitente a variabilelor, vom utiliza coeficientul de corelatie.

Publicarea rezultatului corelatiei (APA style)

"A fost evaluata performanta la un test de calcul aritmetic si la unul de rationament verbal logic. Scorurile mari se refera la performante ridicate. Media scorului la primul test a fost de m=29.63 (s=6.76) iar la al doilea m=29.88 (s=7.01). Am obtinut o corelatie semnificativa ntre cele doua performante, r(6)=0.85, p<0.05, bilateral."

NOT : Se precizeaza neaparat semnificatia valorilor variabilelor n raport de marimea lor, pentru a se putea aprecia corect natura relatiei dintre variabile.

TEMA PENTRU ACAS

Se poate spune ca inteligenta este unul dintre criteriile pe care se constituie cuplurile de prieteni baieti/fete?

A fost selectionat aleator un esantion de cupluri de adolescenti carora li s-a aplicat un test de inteligenta. Rezultatele sunt n tabelul alaturat.

Enuntati ipoteza statistica, ipoteza cercetarii, definiti populatiile, definiti criteriile de decizie statistica

Calculati coeficientul de corelatie Pearson si stabiliti decizia statistica pentru E=0.01, bilateral

Baieti 110 100 120 90 108 115 122 110 127 118

Fete 105 108 110 95 105 125 118 116 118 126

[1] Karl Pearson (1857-1936), matematician, filozof al stiintei, biometrician si statistician englez [2] n mod uzual, valorile lui r se raporteaza cu doua zecimale, chiar daca valorile tabelare si cele calculate de programele statistice sunt cu mai mult de doua zecimale. [3] Hopkins, W. G. (2000). A new view of statistics. Internet Society for Sport Science: http://www.sportsci.org/resource/stats/ [4] Exemplul se bazeaza pe un esantion de 61 de perechi de valori, selectate de pe toata plaja distributiei z Regresia liniara simpla

Una dintre utilizarile importante ale coeficientului de corelatie este realizarea de predictii. Daca stim corelatia dintre doua variabile, putem sa prezicem valorile uneia dintre ele pe baza valorilor celeilalte. Acest rationament de aplica, de exemplu, n cazul evaluarilor psihologice de selectie a personalului. Ne putem imagina situatia n care aplicam un test de coordonare motorie la admiterea n scoala de pilotaj, pentru a prezice nsusirea tehnicii de pilotaj. Prima variabila (coordonarea motorie) se numeste variabila predictor, iar cea de a doua (nsusirea tehnicii de pilotaj), variabila criteriu. Atragem atentia ca, si n acest caz, relatia dintre cele doua variabile nu va putea fi interpretata n termeni de cauzalitate, n ciuda succesiunii temporale a masurarilor. Tot ce putem afirma, n cazul obtinerii unei corelatii semnificative si pozitive, este ca cei care au un nivel mai ridicat de inteligenta tind sa aiba si rezultate scolare mai ridicate. Statistica nu ne permite sa ducem acest rezultat la nivelul unei interpretari de cauzalitate. Este suficient sa ne gndim, de exemplu, ca ambele variabile pot fi influentate de alte variabile (inteligenta generala, motivatie, etc.,).

Esenta conceptului de corelatie, aceea de variatie concomitenta a valorilor a doua variabile, permite fundamentarea unei proceduri de "predictie" reciproca ntre variabilele respective. Sa ne amintim situatia n care doua variabile coreleaza perfect. n acest caz orice valoare zx corespunde unei valori zy identice. Cu alte cuvinte, daca stim ca doua variabile au o corelatie liniara egala cu 1 (indiferent de semn) putem prezice orice valoare a unei variabile pe baza valorii celeilalte.

Formula 3.24

Formula de mai sus descrie modul de predictie n valori z pentru variabila Y, pornind de la valorile variabilei X, numita din acest motiv "predictor". Pentru ca valoarea lui Y din formula de mai sus este una "prezisa", se noteaza cu indicele "prim". Sa ne imaginam ca am descoperit o corelatie perfecta (r=+1) ntre scorul la un test de inteligenta verbala (X) si cel la un test de inteligenta abstracta (Y). Conform formulei, pentru o valoare zx=1.5 vom prezice o valoare identica pentru Y, zy'=1.5. Din pacate corelatiile perfecte sunt mai degraba exceptii, fiind rar sau de loc ntlnite n realitate. Ca urmare, predictia suporta riscul unei erori data de faptul ca doar o parte din variatia unei variabile este nsotita (explicata) de variatia celeilalte variabile. Solutia pentru luarea n considerare a acestui aspect este data n formula modificata:

Formula 3.25

unde r este valoarea coeficientului de corelatie dintre cele doua variabile.

Vom observa ca atunci cnd r=+1, se pastreaza identitatea dintre valoarea predictor si valoarea prezisa (afirmatie valabila si pentru r=-1 cu specificatia ca valoarea prezisa are semn schimbat). n situatia n care r=0, pentru orice a valoare a lui X obtinem valoarea 0 pentru Y, ceea ce reprezinta, n termenii scorului z, o valoare medie. n acest fel avem o minimizare a erorii de predictie, estimnd toate valorile ca fiind egale cu media (este evident ca o astfel de predictie, care nu produce nici o diferenta ntre valorile "prezise" nu prezinta nici o utilitate practica). Pe de alta parte, trebuie sa observam ca pe masura ce valoarea lui r este mai mica, tinznd spre 0, valorile prezise se vor abate mai putin de la medie (zy'=0) oscilnd mai aproape de aceasta. Conceptul de regresie a fost introdus de Francis Galton care, studiind relatia dintre naltimea copiilor si a parintilor a observat ca parintii cu naltimi excesive tind sa aiba copii cu naltime mai mica dect a lor, adica mai aproape de medie dect a parintilor. Sa luam un exemplu ilustrativ. Galton a gasit un coeficient de corelatie ntre naltimea parintilor (X) si cea a copiilor (Y) r=+0.67. Putem deci prezice naltimea copilului daca stim ca naltimea medie a celor doi parinti, exprimata n scoruri z, este zx=2 (adica cu doua abateri standard mai nalti dect media):

Asa cum se observa, parintii a caror naltime este mai mare cu doua abateri standard mai mare dect media, pot avea copii a caror naltime sa se abata doar cu 1.34 abateri standard de la medie. Galton a denumit aceasta tendinta ca "regresie catre mediocritate" dar termenul consacrat este acum cel de "regresie catre medie". Faptul ca se bazeaza pe corelatia de tip liniar ne permite sa vorbim de o "regresie liniara catre medie".

Reprezentarea grafica a regresiei

Imaginea alaturata reprezinta linia de regresie simpla n cazul unei corelatii perfecte pozitive (r=+1). Ea se mai numeste "liniara", deoarece relatia dintre cele doua variabile este aproximata printr-o dreapta, si "simpla", deoarece doar avem o singura variabila predictor si o singura variabila criteriu. Cercurile marcheaza intersectia fiecarei valori X cu valoarea corespondenta a variabilei Y. Originea liniei de regresie se afla n punctul 0 iar nclinarea (panta) liniei de regresie este de 45o. Mai observam, de asemenea, ca distanta dintre fiecare punct de intersectie si linie este nula, fapt ce ne spune ca linia de regresie estimeaza perfect, fara erori, modelul relatiei dintre cele doua variabile.

Dar aceasta situatie este doar una de exceptie. Atunci cnd corelatia este diferita de 1, linia regresie este trasata pe o traiectorie de "aproximare" prin norul de puncte, astfel nct distanta dintre fiecare punct si linie sa fie ct mai mica posibil. n esenta, pentru a putea trasa dreapta de regresie a doua variabile, ne sunt necesare punctul de origine al acesteia si nclinarea, sau "panta". Odata aflate, putem trasa linia de regresie utiliznd formula clasica a liniei drepte: Y=a+b*X, unde: Y este valoarea prezisa a fiecarui punct de pe dreapta a este originea dreptei sau termenul liber al ecuatiei, de fapt punctul n care linia de regresie intersecteaza ordonata (axa Oy). b este panta liniei de regresie X este valoare predictor a variabilei Y n ce priveste "panta", daca privim formula 11.4 putem constata ca ea poate fi nteleasa si implicit, exprimata, ca fractiuni din valorile variabilei X, fractiuni determinate de valoarea lui r. Astfel, daca r=1, pentru o unitate a lui X avem o nclinare de aceeasi unitate a lui Y. Atunci cnd r=0.5, de exemplu, pentru a anumita unitate a variabilei X avem o jumatate din unitatea valorii lui Y. Atunci cnd corelatia este perfecta, toate punctele se situeaza pe linia de regresie. Cnd corelatia este diferita de 1, punctele se situeaza n jurul liniei de regresie ntr-un "nor", cu att mai ndepartat de aceasta cu ct corelatia este mai mica. Intuitiv, linia de regresie poate fi vazuta ca o "medie" a norului de puncte, fiind trasata astfel nct distantele fata de punctele distributiei celor doua variabile sa fie similare de o parte si de alta a liniei.

Formula de calcul a regresiei pentru scorurile primare (brute)

Formula 11.4 este adecvata pentru situatia n care operam cu scorurile standard (z).

Pentru a opera direct cu scorurile primare (brute) ale variabilelor, trebuie operate o serie de transformari succesive ale acestei formule, pna va fi adusa la o forma care sa

corespunda ecuatiei liniei drepte, prezentata mai sus. Vom prezenta aici numai rezultatul final al acestor transformari, care se exprima n urmatoarea formula de calcul pentru linia de regresie:

Formula 3.26

care poate fi privita ca expresie a ecuatiei generice de regresie liniara:

unde: Y' este valoare prezisa

ayx este originea dreptei sau termenul liber al ecuatiei, de fapt punctul n care linia de regresie intersecteaza ordonata (axa Oy). byx X este panta liniei de regresie este valoare predictor a variabilei X

Relativa complexitate a ecuatiei de regresie liniara este compensata de faptul ca, n prezent, aceasta cade n sarcina programelor specializate. Graficul de mai jos reprezinta linia de regresie corespunzatoare relatiei de asociere dintre cele doua variabile din exemplul de mai sus.

Analiza reziduurilor

Asa cum se observa, linia de regresie reprezinta doar o estimare a relatiei dintre cele doua variabile. Ea se obtine, de fapt, prin cautarea unui traseu prin norul de puncte astfel nct distanta nsumata dintre dreapta si punctele de deasupra sa fie egala cu distanta nsumata fata de punctele de sub linie. n cazul unei corelatii perfecte toate punctele de intersectie ale valorilor celor doua variabile se afla exact pe dreapta de regresie. n cazul corelatiilor "imperfecte" distantele dintre puncte si dreapta de regresie exprima, de fapt, eroarea de estimare a asocierii dintre variabile. Distanta dintre pozitia reala a punctelor si cea estimata cu ajutorul liniei de regresie se numeste "valoare reziduala" si exprima, desigur, o eroare de estimare. Din acest motiv nici panta (unghiul de nclinare al liniei), nu este exact de 45o. Cu ct suma distantelor de la fiecare punct la linia de regresie este mai mare, cu att eroarea de estimare este mai pronuntata. Patratul sumei tuturor distantelor dintre valorile de pe linie si punctele din afara liniei de regresie reprezinta ceea ce se numeste "varianta estimarii" sau "varianta reziduala", si se calculeaza astfel:

Formula 3.28

Cu ct vor fi mai apropiate punctele de intersectie de linia de regresie, cu att mai putina eroare vom avea n predictie si, implicit, o corelatie mai mare. Invers, cu ct punctele de intersectie vor fi mai ndepartate de linia de regresie, cu att cu att valoarea reziduala va fi mai mare iar corelatia va fi mai mica. La limita, pentru o corelatie egala cu 0, linia de regresie va avea o traiectorie orizontala, nclinarea ei fiind 0.

Utilitatea analizei de regresie

Analiza de regresie se utilizeaza n situatiile n care suntem interesati sa facem predictii asupra unei variabile, pe baza coeficientilor B (sau beta) obtinuti pe date rezultate din masurari anterioare. De exemplu, daca am efectuat o analiza de regresie ntre coeficientul de inteligenta si performanta scolara pe un lot de subiecti, putem ulterior sa estimam nivelul performantei scolare a altor subiecti prin evaluarea inteligentei lor. Aceasta este procedura tipica pe care se bazeaza predictiile psihologice n contextul examenelor de selectie.

[1][1]

Sa ne amintim ca, atunci cnd nu cunoastem abaterea standard a populatiei, putem utiliza n formula erorii standard a mediei, abaterea standard a esantionului (s)

[2][2] Programele de

prelucrari statistice utilizeaza termenul "Sig." (de la "significance" n loc de "p". Ele sunt strict echivalente.
[3][3] Exercitii

preluate din BH Cohen, 1996, Eplaininig Psychological Statistics, Brooks/Cole Publishing, pp.216-217
[4][1]

Am pus cuvntul "efect" ntre ghilimele deoarece, chiar daca este logic sa consideram ca este vorba de o relatie de tip cauza-efect, simpla masurare a diferentelor pe doua esantioane de subiecti nu este suficienta pentru a concluziona o relatie cauzala. Pentru aceasta, ar fi mai potrivit sa masuram timpul de reactie la aceiasi subiecti nainte si dupa consumarea unei cantitati de alcool.
[5][2] O

metoda de relaxare psihica

[6][3] Intr-o

maniera absolut similara se pot construi limite de ncredere pentru orice alt interval: 99% sau 99,9%
[7][1] Pentru simplificare,

n continuare ne vom referi la trei esantioane dar se va ntelege "trei

sau mai multe" [8][2] Sir Ronald Aylmer Fisher (1890-1962). Astronom de formatie, interesat de teoria erorilor, s-a remarcat
prin contributiile sale n teoria statisticii, careia, din anul 1922, i-a dat o noua orientare. [9][3]

n practica, se poate ajunge n situatia ca dispersia intragrup sa rezulte a fi mai mica dect dispersia intergup si, ca urmare, valoarea lui F sa fie mai mica dect 0. Acest lucru este determinat de inegalitatea severa a dispersiilor ntre grupurile analizate.
[10][4]

Atentie, acest mod de prezentare a datelor serveste calcularii manuale a testului F. ntro baza de date SPSS vom avea cte o nregistrare pentru fiecare subiect, cu doua variabile, una pentru nivelul anxietatii si cealalta pentru intensitatea fumatului, aceasta din urma cu trei valori conventionale, sa zicem 1, 2, 3 pentru fiecare nivel de intensitate a fumatului.