Sunteți pe pagina 1din 8

Testul t pentru diferena dintre mediile a dou eantioane dependente Lector univ. dr. Gh.

Perea Testele de comparaie prezentate pn aici (t pentru eantioane independente i ANOVA) au vizat situaii n care mediile comparate aparineau unor grupuri compuse din subieci diferii (motiv pentru care sunt denumite ca independente, sau necorelate). Din cauz c acest model de cercetare presupune comparaii ntre subieci, el se mai numete i model intersubiect (between subject design). Un alt model uzual n cercetarea psihologic vizeaz comparaia a dou (sau mai multe) valori msurate pe aceiai subieci. Iat cteva ilustrri tipice: a)Situaia n care o anumit caracteristic psihologic se msoar naintea unei condiii i apoi, dup aciunea acesteia. Exemple: (i) evaluarea nivelului anxietii nainte i dup un program de desensibilizare; (ii) evaluarea performanei cognitive a unui lot de subieci, nainte i dup procedura de ascensiune simulat n camera barometric la 5000m; (iii) evaluarea timpului de reacie nainte i dup ingerarea unei substane. Deoarece se bazeaz pe msurri repetate ale unei variabile pe aceiai subieci, acest model de cercetare este cunoscut ca modelul msurrilor repetate (repeated-measures design). b)Situaia n care cercettorul utilizeaz dou condiii de investigare, dar plaseaz aceiai subieci n ambele condiii. De exemplu, ntr-un studiu asupra efectelor unui anumit tip de stimulare, se pot msura undele cerebrale, simultan n cele dou emisfere cerebrale. Fiind vorba despre msurarea unor variabile care sunt evaluate concomitent, la aceiai subieci, acesta este un model intrasubiect (within-subjects design). c)Cazul n care natura situaiei experimentale nu permite utilizarea acelorai subieci pentru cele dou msurri, de exemplu, n contextul unei intervenii terapeutice care are un efect pe termen foarte lung. n acest caz este se poate gsi pentru fiecare subiect corespunztor condiiei iniiale un subiect similar, corespunztor condiiei finale, constituind astfel perechi de subieci aparinnd fiecare unui grup distinct, ntre care se poate face o comparaie direct. Ca urmare, dei diferii, vom trata cei doi subieci din pereche ca i cum ar fi aceeai persoan. Sau, ntr-un alt context, putem compara subieci care sunt ntr-un anumit tip de relaie, interesndu-ne diferena dintre ei sub o anumit caracteristic. De exemplu, ne poate interesa daca ntre nivelul de inteligen dintre bieii i fetele care formeaz cupluri de prieteni exist o anumit diferen. n acest caz, dei avem dou eantioane distincte, fiecrui subiect din eantionul de biei i corespunde un subiect din eantionul de fete, constituirea celor dou eantioane fcndu-se pe baza relaiei de prietenie dintre ei. n aceeai categorie se afl comparaiile ntre perechi de gemeni, sau cele dintre soi. n astfel de cazuri, avem de a face cu aa numitul model al eantioanelor perechi (matched pairs design). Indiferent de tipul lor, toate modele prezentate mai sus au un obiectiv similar, acela de a pune n eviden n ce msur o anumit condiie (variabila independent) corespunde unei modificri la nivelul unei caracteristici psihologice oarecare (variabila dependent). Vom observa c, n toate exemplele evocate, variabila independent este

una de tip nominal, dihotomic (nainte/dup; semestru/sesiune; grup de cercetare/grup de control; biat/fat; so/soie, etc.), n timp ce variabila dependent se msoar pe o scal cantitativ, de interval sau de raport. De asemenea, trebuie s consemnm faptul c n ambele situaii se utilizeaz msurtori de acelai fel, cu acelai instrument, care produce valori exprimate n aceeai unitate de msur, ntre care se poate efectua un calcul direct al diferenei. Pentru descrierea testului statistic adecvat acestor cazuri s ne imaginm urmtoarea situaie generic de cercetare: Un grup de pacieni cu tulburri de tip anxios sunt inclui ntr-un program de psihoterapie, avnd drept scop ameliorarea nivelului anxietii. nainte de nceperea programului a fost aplicat o scal de evaluare a anxietii. Acelai instrument a fost aplicat din nou, dup parcurgerea programului de terapie. Aici s-ar putea pune ntrebarea de ce nu considerm valorile rezultate din cele dou msurtori ca fiind independente, urmnd s utilizm testul t pentru acest tip de date? Exist mai multe argumente n favoarea respingerii acestei variante simplificatoare: a)Utilizarea valorilor perechi ofer informaii mai bogate despre situaia de cercetare. n modele de cercetare de tip nainte/dup ea capt chiar valene de experiment. b)Testul t pentru eantioane independente surprinde variabilitatea dintre subieci, n timp ce testul t pentru eantioane dependente (msurri repetate) se bazeaz pe variabilitatea intra-subiect, aceea care provine din diferena valorilor de la o msurare la alta, la nivelul fiecrui subiect n parte. c)Dac exist o diferen real ntre subieci, atunci testul diferenei dintre valorile perechi are mai multe anse s o surprind dect cel pentru valori independente (puterea unui model de cercetare intra-subiect este mai mare dect n modelul inter-subieci). Revenind la tema de cercetare pe care am enunat-o mai sus, dei avem aceiai subieci, i n primul i n al doilea caz, ne vom raporta la aceasta situaie ca i cum ar fi dou eantioane. Unul, cel al subiecilor care nu au urmat nc un program de terapie, iar celalalt, al subiecilor care au urmat un astfel de program. Datorit faptului c cele dou eantioane sunt formate din aceiai subieci, ele se numesc dependente sau corelate. n acest tip de studiu, obiectivul testului statistic este acela de a pune n eviden semnificaia diferenei dintre mediile anxietii n cele dou momente. Cea mai simpl procedur de calcul este metoda diferenei directe. Pentru aceasta, calculm diferenele fiecrei perechi de valori din cele dou distribuii (X2-X1), obinnd astfel o distribuie a diferenelor, pe care o vom nota cu D. Logica ipotezei de nul Dac programul de terapie ar fi total ineficient, trebuie s presupunem c diferenele pozitive le-ar echilibra pe cele negative ceea ce, la un numr mare de eantioane ipotetice (formate din acelai numr de subieci), am obine o medie a diferenelor egal cu 0. Ca urmare, ipoteza statistic presupune c media diferenelor la

nivelul populaiei de nul este 0. Aceasta nseamn c testul t trebuie s demonstreze c media diferenelor msurate pe eantionul cercetrii este suficient de departe de 0, pentru a respinge ipoteza de nul i a accepta ipoteza cercetrii. De aici rezult c putem reduce metoda de calcul la formula testului t pentru un singur eantion, pornind de la formula cunoscut a testului t,

Numitorul, eroarea standard a diferenei dintre medii, se calculeaz cu formula:

Ca urmare, formula pentru testul t al diferenei dintre medii dependente este:

mD este media distribuiei D (a diferenelor dintre cele dou msurri), D este unde media populaiei de nul a diferenelor dintre eantioane de acelai fel, iar seD este eroarea standard a distribuiei D (mprtierea distribuiei D). Exemplu analitic de calcul Problema cercetrii: Se poate obine o reducere a reaciilor anxioase prin aplicarea unei anumite proceduri de psihoterapie? Ipoteza cercetrii (H1): Pentru test bilateral Programul de psihoterapie are un efect asupra anxietii. Pentru test unilateral Programul de psihoterapie reduce intensitatea reaciilor de tip anxios. Ipoteza de nul (H0): Pentru test bilateral Programul de psihoterapie nu are nici un efect asupra anxietii. Pentru test unilateral Programul de psihoterapie nu reduce nivelul anxietii. Populaiile cercetrii: Populaia 1 Subiecii cu anxietate ridicat care nu au urmat un program de

terapie

Populaia 2 Subiecii cu anxietate ridicat care au urmat un program de terapie Ipoteza cercetrii afirm c ele sunt diferite (m1-m20), n timp ce ipoteza de nul afirm c ele sunt identice (m1-m2=0). Eantion: Un singur grup de subieci cu probleme anxioase (N=8) al crui nivel de anxietate este evaluat nainte i dup programul de terapie.

Criteriile deciziei statistice Alegem modul de testare a ipotezei, bilateral. Fixm, convenional, nivelul =0.01. S spunem c preferm acest nivel deoarece costurile de implementare a programului sunt destul de mari, iar pacienii trebuie convini c merit timpul i banii1. Cutm t critic pentru =0.01 n tabelul distribuiei t pentru 7 grade de libertate (N-1). Tabelul ne d valorile pentru un test unilateral (n dreapta curbei). Pentru testul bilateral trebuie mai nti s njumtim valoarea aleas pentru (0.01/2=0.005). n continuare, cutm valoare aflat la intersecia coloanei gradelor de libertate (7) cu coloana lui =0.005 i citim t critic= -3.49. i atribuim semnul minus, deoarece ne ateptm ca nivelul anxietii s scad dup aplicarea programului de terapie. Datele cercetrii: D nainte de Dup program (X2-X1) program (X2) (X1) 6 6 0.00 8 7 -1.00 10 11 1.00 9 8 -1.00 5 5 0.00 6 5 -1.00 11 10 -1.00 5 4 -1.00 60 56 -4 8 8 8 7.50 7.00 mD=-0,5 D-mD 0.50 -0.50 1.50 -0.50 0.50 -0.50 -0.50 -0.50 (D-mD) 2 0.25 0.25 2.25 0.25 0.25 0.25 0.25 0.25 (D-mD)2=4

X N X m= N SD=(D-mD)2 /N-1

SD=4/7= 0.75 Not: n principiu, sub aspectul procedurii statistice, nu prezint nici o importan dac utilizm diferena X1-X2 sau X2-X1. Ordinea depinde de ceea ce dorete s scoat n eviden cercettorul. Important este ca, n final, s interpreteze corect rezultatul obinut, n funcie de semnul diferenei i semnificaia concret a acestuia. Introducem valorile n formula 3.24 i obinem:

Am optat pentru alfa=0.01 doar pentru a varia exemplele de calcul, dar in practic se utilizeaz n mod obinuit alfa=0.05.

Raionamentul decizional Comparm t calculat cu t critic pentru =0.01 bilateral: -2,08 < -3.49 Decizia statistica: acceptm ipoteza de nul. Probabilitatea de a se obine un nivel al anxietii mai redus doar ca urmare a jocului hazardului, este mai mare dect nivelul alfa pe care ni l-am impus drept criteriu de decizie (adic mai mic de 1%). Decizia cercetrii: datele nu sprijin ipoteza cercetrii. Ca urmare, nu putem accepta c efectul obinut se datoreaz programului de terapie. Programul de terapie nu reduce n mod semnificativ nivelul anxietii. Mrimea efectului Indicele de mrime a efectului (d - Cohen) pentru diferena dintre medii dependente se calculeaz cu formula lui Cohen:

Interpretarea indicelui d se face n conformitate cu recomandrile lui Cohen, astfel: 0.20, efect mic; 0.50, efect mediu, 0.80, efect mare. Pentru exemplul nostru, indicele de mrime a efectului este:

Valoarea obinut indic o diferen medie-mare sau relativ important ntre mediile comparate (semnul lui d nu are relevan). Aa cum se vede, este posibil s obinem un indice al mrimii efectului mediu spre ridicat n condiiile unui rezultat nesemnificativ statistic. Acest lucru trebuie s ne atrag odat n plus atenia asupra faptului c cele dou proceduri (testul statistic i mrimea efectului) vizeaz aspecte diferite. Pentru exemplul nostru, vom concluziona c efectul terapiei este relativ important, dar nu are o putere suficient penmtru a atinge pragul de semnificaie pe un lot de numai 8 subieci. Este mai mult dect probabil c pe un eantion mai mare rezultatul ar atinge i pragul de semnificaie statistic. Limitele de ncredere pentru diferena dintre medii La fel ca i n cazul testului t pentru eantioane independente, se pune problema generalizrii rezultatului la nivelul populaiei, cu alte cuvinte, care este intervalul n care ne putem atepta s se afle diferena dintre medii, pentru variabilele studiate. Pentru o estimare cu o precizie de 99%, conform cu nivelul alfa ales, limitele critice pentru diferena dintre medii sunt cele care corespund valorilor lui p=0,005, de o parte i de alta a curbei t (3.4998). Formula de calcul pentru intervalul de ncredere deriv, i n acest caz, din formula 3.24:

t=mD - D / SeD de unde rezult formula pentru calculul limitelor de ncredere ale mediei diferenei: D=mDtcrit*seD (formula 3.26) n condiiile studiului nostru, decizia statistic de acceptare a ipotezei de nul a infirmat ipoteza cercetrii dar analiza intervalului de ncredere poate ajuta la nelegerea mai bun a situaiei. nlocuind valorile corespunztoare studiului nostru, obinem urmtoarele limite de ncredere: limita inferioar: D = -0.5-(-3.4998)*0.26= +0.40 limita superioar D = -0.5+(-3.4998)*0.26=-1.4 Rezultatul arat c media diferenei la nivelul populaiei se afl, cu o probabilitate de 0.99 (sau 99%), ntre o limit inferioar=+0.40 i o alta superioar1.40. n acest caz, inferior se refer la o valoare plasat n jumtatea stng a curbei t, unde valori inferioare sunt cele care se apropie de 0, care este media diferenei de nul. Aa cum se constat, intervalul de ncredere cuprinde i valoarea 0, care exprim ipoteza de nul (diferen nul). Acest lucru este concordant cu decizia statistic, n urma creia am admis ipoteza de nul i am respins ipoteza cercetrii. O privire mai atent asupra datelor ar putea s i arate cercettorului c unul dintre subieci a obinut un scor mai mare al anxietii dup terapie dect nainte de terapie, fapt care este nefiresc i ar trebui analizat. Acest caz se pare ca a fost decisiv n neatingerea pragului de semnificaie. O reluare a procesului de diagnostic psihologic cu subiectul n cauz poate, eventual, conduce la concluzia c problemele lui sunt de alt natur (de ex., sufer de depresie i nu de anxietate) i c, n cazul su, terapia respectiv nu are nici un efect. Refacerea calculelor cu scoaterea din eantionul de cercetare a acestui subiect (numai dac acest lucru este bine motivat), va conduce, cu siguran, la un interval mai restrns de ncredere pentru diferena dintre medii, ceea ce va nsemna o precizie de estimare mai ridicat i, implicit, poate, la atingerea pragului de semnificaie. Nu trebuie s omitem, de asemenea, faptul c n exemplul nostru este vorba de un eantion foarte mic, iar eantioanele mici conduc la valori ridicate ale erorii standard a mediei i, prin aceasta, la intervale de ncredere largi. n astfel de situaii riscul erorii de tip II (imposibilitatea de a pune n eviden diferene reale, rezultat fals negativ) este mai mare. Dar, atunci cnd obinem rezultate semnificative pe eantioane mici, ele pot prezenta un nivel de ncredere cu att mai mare. n acelai timp, eantioanele mici sunt instabile (n exemplul nostru, o singur diferen pozitiv poate schimba rezultatul cercetrii), fapt care impune cel puin replicarea cercetrii, pentru mai mult siguran. Publicarea rezultatului La publicare se vor meniona: volumul eantionului, mediile variabilei dependente n raport cu valorile variabilei independente, valoarea testului t, pragul de semnificaie, tipul de test (unilateral sau bilateral), mrimea efectului i limitele de ncredere ale

diferenei. Avnd n vedere faptul c, uzual, testele statistice se efectueaz bilateral, se poate meniona numai cazul n care testul este unilateral, eventual cu explicarea motivului pentru care a fost preferat aceast soluie. Pentru exemplul de mai sus, o prezentare narativ a rezultatului ar putea arta astfel: Un eantion de 8 subieci cu probleme de anxietate au participat la un program de terapie anxiolitic. Nivelul anxietii (msurat cu o scal specific) a fost evaluat nainte i dup programul de terapie. S-a constatat o reducere a nivelului anxietii de la o medie de 7.50 la 7.0, dup aplicarea terapiei. Diferena nu a atins pragul semnificaiei statistice t(7)=-2,08, p<0.01, pentru =0.01 bilateral, cu limitele de ncredere (99%) cuprinse ntre +0.40 i -1.40. Indicele d (Cohen) al mrimii efectului (0.66) arat totui existena unei diferene relativ importante ntre mediile celor dou momente. Absena semnificaiei statistice se datorez, foarte probabil, volumului foarte redus al eantionului i existenei unui scor extrem al unuia dintre subieci. n concluzie, rezultatele ncurajeaz utilizarea n continuare a metodei terapeutice i reevaluarea eficienei ei pe un eantion mai mare.

EXERCIII I. Ne propunem s scoatem n eviden efectul stresului temporal (criza de timp) asupra performanei de operare numeric. n acest scop, selectm un eantion de subieci crora le cerem s efectueze un test de calcule aritmetice n dou condiii experimentale diferite: prima, n condiii de timp nelimitat, cu recomandarea de a lucra ct mai corect; a doua, n condiii de timp limitat, cu condiia de a lucra ct mai repede i mai corect n acelai timp. Rezultatele celor dou reprize sunt cele din tabelul urmtor: Fr criz de timp 67 79 83 80 99 95 80 100 Cu criz de timp 65 73 70 85 93 88 72 69

S se rezolve urmtoarele sarcini: a)Formularea ipotezei cercetrii i a ipotezei de nul b)Stabilirea valorii t critic pentru =0,05 bilateral c)Calcularea testului t pentru eantioane dependente d)Decizia statistic e)Decizia cercetrii f)Indicele de mrime a efectului g) Limitele de ncredere pentru diferena dintre medii h) Formularea concluziein formatul recomandat II. (a) Decidei asupra semnificaiei diferenei dintre mediile primelor dou evaluri la statistic tiind: . N=209 . m1=13.64 . m2=12.56 . abaterea standard a diferenei=3.16 (b)Calculai indicele de mrime a efectului pentru diferena dintre medii (c)Estimai limitele de ncredere (95%) intervalului pentru media diferenei.