Sunteți pe pagina 1din 8

Curs 9 – Testul t pentru eșantioane dependente (perechi)

Lector univ. dr. Adrian Gorbănescu

De mic copil urmăresc cursele de Formula 1. În timpul sezonului, aștept cu nerăbdare


weekendurile în care sunt programate curse, iar uneori îmi place să joc Formula 1 pe PC.
Pasionat de acest sport, când eram elev în clasa a VI-a, am creat o competiție similară celei
de Formula 1 cu materiile de la școală (la acea vreme nu existau jocuri de F1 pentru PC).
Astfel, fiecare materie de la școală reprezenta un pilot, iar nota pe care o primeam la materia
respectivă reprezenta numărul de puncte primit în cursă. De exemplu, Matematica era
corespondentul lui Mika Hakkinen, Lb. Română era corespondentul lui David Coulhard,
Istoria îl reprezenta pe Damon Hill ș.a.m.d. Chiar mi se părea că acest joc mă motivează să
învăț mai bine, astfel încât să adun cât mai multe puncte. Oare chiar era adevărat? Testul t
pentru eșantioane dependente m-ar fi ajutat să compar media notelor obținute înainte și după
introducerea acestui joc.

9.1 Introducere

În secțiunea anterioară am prezentat testul t pentru eșantioane independente care este


utilizat atunci când dorim să comparăm mediile a două eșantioane formate din participanți
diferiți. Însă, situațiile de cercetare, mai ales în domeniul psihologiei, ne pun de multe ori în
situația de a compara mediile provenite de la un eșantion care este supus unui set de evaluări
repetate. Un astfel de context este tipic testului t pentru eșantioane dependente. În concluzie,
testul t pentru eșantioane dependente (perechi, corelate) este utilizat atunci când comparăm
scoruri măsurate pe aceiași participanți. Literatura de specialitate (Popa, 2008; Salkind, 2015)
precizează trei contexte care solicită aplicarea testului t pentru eșantioane dependente:
1. Măsurători repetate (înainte – după) – în această situație o caracteristică psihologică
este evaluată pe același eșantion înainte și după aplicarea unui „tratament” (training,
psihoterapie, medicație etc.). De exemplu, evaluarea depresiei înainte și după
participarea la un program terapeutic.
2. Perechi naturale – acest context presupune ca cercetătorul să măsoare un aspect
psihologic pe două eșantioane formate din participanți care au trăsături similare. De cele
mai multe ori astfel de eșantioane perechi sunt formate în cadrul relațiilor de familie
(soț – soție, gemeni, tată – fiu etc). Un exemplu de cercetare în care avem un astfel de
design este cel în care dorim să comparăm diferența dintre satisfacția în cuplu a soților
și a soțiilor.
3. Modelul intra-subiect (within-subjects) – implică realizarea unei comparații între două
metode de investigare a aceleiași caracteristici folosind același eșantion. De exemplu,
compararea tensiunii arteriale folosind un stetoscop și un instrument electronic.

În fiecare din aceste contexte suntem interesați să analizăm în ce măsură apariția unui
fenomen (variabila independentă) generează o modificare a trăsăturii investigate (variabila
dependentă). În cadrul testului t pentru eșantioane dependente variabila independentă este
măsurată pe scală nominal dihotomică (înainte-după, vară-iarnă, stânga-dreapta), iar variabila
dependentă este măsurată pe scală de interval-raport.
În cadrul testului t pentru eșantioane dependente accentul cade pe diferențele dintre cele
două perechi de valori (X1 – X2). Rezultatele astfel obținute vor forma o distribuție a
diferențelor care este simbolizată cu D.
Ipoteza de nul susține că media populației de diferențe (µD) este egală cu 0. Cu alte
cuvinte, diferențele negative dintre cele două evaluări le egalează pe cele pozitive. Ipoteza
cercetării susține că media diferențelor (media distribuției de diferențe) este semnificativ
diferită față de 0. Cele două ipoteze sunt notate astfel:
H0: µ1 - µ2 = 0
H1: µ1 - µ2 ≠ 0
• µ1 – reprezintă media primului eveniment/condiții.
• µ2 – reprezintă media celui de al doilea eveniment/condiții.

Formula de calcul a testului t pentru eșantioane dependente este:


𝑚𝐷
𝑡= , 𝑢𝑛𝑑𝑒:
𝑠𝑒𝐷
(formula 8.1)
• mD – este media distribuției de diferențe între cele două evaluări (media distribuției D).
• seD – reprezintă eroarea standard a distribuției D.
𝑠𝐷
𝑠𝑒𝐷 = , 𝑢𝑛𝑑𝑒:
√𝑁
(formula 8.2)
• sD – este abaterea standard a distribuției de diferențe D.
• N – este volumul eșantionului.

9.2 Exemplu de calcul

Un cercetător este interesat să studieze efectul pe care îl are administrarea unor vitamine
asupra rezistenței fizice a unor cicliști (α = 0,05, bilateral). În acest sens, măsoară numărul de
kilometri parcurși de fiecare sportiv pe o durată de 30 de minute înainte și după introducerea
medicamentației. În tabelul 8.1 sunt prezentate performanțele sportivilor (N=15) înainte,
respectiv după administrarea vitaminelor.
Ipoteza cercetării: Performanța cicliștilor se va modifica după administrarea vitaminelor.
Ipoteza de nul: Performanța cicliștilor nu se va modifica după administrarea vitaminelor.
Pentru a putea lua decizia statistică trebuie să comparăm valoarea lui t (calculat) cu tcritic.
Îl vom obține pe tcritic în tabelul din Anexa 3, la intersecția dintre coloana corespunzătoare lui
α = 0,025 (deoarece α = 0,05 bilateral) cu linia pentru 14 grade de libertate (df = N - 1). Astfel,
lui tcritic îi corespunde valoarea ±2,14.
Tabelul 9.1 – Datele cercetării și calculele necesare testului t pentru două eșantioane dependente
Înainte După D
(X1) (X2) (X1 – X2) D – mD (D – mD)2
22 25 -3 -1,733 3,003
20 24 -4 -2,733 7,469
25 20 5 6,267 39,275
17 19 -2 -0,733 0,537
16 20 -4 -2,733 7,469
25 23 2 3,267 10,673
20 24 -4 -2,733 7,469
23 21 2 3,267 10,673
25 28 -3 -1,733 3,003
23 23 0 1,267 1,605
21 22 -1 0,267 0,071
19 22 -3 -1,733 3,003
20 22 -2 -0,733 0,537
22 24 -2 -0,733 0,537
26 26 0 1,267 1,605
m1 = m2 mD= - ∑=
21,6 =22,867 1,267 96,933

În prima etapă a procedurii de calcul suntem interesați să obținem distribuția de diferențe


D (X1 – X2). Această distribuție are media mD = -1,267. După cum se poate observa, mD este
egală cu diferența dintre m1 și m2. Nu contează dacă distribuția de diferențe D este obținută
prin realizarea diferenței X1 – X2 sau X2 – X1, deoarece valoarea calculată a lui t este aceeași,
doar semnul fiind schimbat . Este importantă maniera în care este interpretat semnul diferenței.
Faptul că diferența X1 – X2 are semn negativ înseamnă că scorurile din prima condiție (înainte
de administrarea vitaminelor, în exemplul nostru) sunt mai mici comparativ cu al doilea
moment al măsurării. În concluzie, după administrarea vitaminelor performanța cicliștilor a
crescut. Acum trebuie să testăm dacă această creștere a performanței este una semnificativă
statistic.
În a doua etapă vom calcula abaterea individuală a fiecărei diferențe de la media
distribuției de diferențe (D – mD), după care vom ridica fiecare abatere individuală la pătrat (D
– mD)2. Aceste calcule ne permit să obținem eroarea standard a mediei distribuției de diferențe.
Totuși, mai înainte de toate, avem nevoie de abaterea standard a distribuției D.
∑(𝐷 − 𝑚𝐷 )2 96,933
𝑠𝐷 = √ → 𝑠𝐷 = √ → 𝑠𝐷 = √6,923 → 𝑠𝐷 = 2,631
𝑁−1 14
𝑠𝐷 2,631 2,631
𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = 0,679
√𝑁 √15 3,872

Astfel, valoarea calculată a testului t este:


𝑚𝐷 −1,267
𝑡= ,→ 𝑡 = → 𝑡 = −1,865
𝑠𝑒𝐷 0,679

Pentru a lua decizia statistică vom compara valoarea calculată a lui t cu tcritic. La fel ca în
cazul testului t pentru eșantioane independente, când │tcalculat│≥ │tcritic│ luăm decizia de a
respinge ipoteza de nul. Dacă │tcalculat│< │tcritic│vom lua decizia de a accepta ipoteza de nul.
Deoarece │-1,86│< │-2,14│vom accepta ipoteza de nul și vom respinge ipoteza cercetării. În
concluzie, probabilitatea ca cicliștii să obțină o performanță superioară, ca urmare a întâmplării,
după administrarea vitaminelor este mai mare decât nivelul erorii de tip I (α) stabilit și nu ne
putem asuma că diferența observată se poate datora vitaminelor.

Imaginea 8.1 – Decizia statistică bilaterală folosind distribuția t

9.3 Intervalul de încredere pentru diferența dintre medii

Nu trebuie să pierdem din vedere că obiectivul principal al utilizării testelor statistice și


al statisticii inferențiale este de a generaliza rezultatele obținute la nivelul populației. Precizia
cu care vom estima intervalul în care se află diferența dintre medii depinde de α. Noi ne-am
asumat un prag α = 0,05 și vom face estimarea cu o precizie de 95%. Limitele intervalului de
încredere pentru diferența dintre medii îl vom calcula folosind formula:
𝜇𝐷 = 𝑚𝐷 ± 𝑡𝑐𝑟𝑖𝑡𝑖𝑐 ∗ 𝑠𝑒𝐷
(formula 8.3)
• µD – reprezintă media populației de diferențe.
• mD – este media distribuției de diferențe.
• tcritic – reprezintă valoarea critică tabelară obținută pentru nivelul de încredere stabilit.
• seD – reprezintă eroarea standard a distribuției D.

După introducerea valorilor corespunzătoare în formulă vom obține următoarele limite
ale intervalului de încredere:
• lim inf 95% = -1,267 – 2,14*0,679 → lim inf 95% = -1,267 – 1,453 → lim inf 95% = -
2,72.
• lim sup 95% = -1,267 + 2,14*0,679 → lim sup 95% = -1,267 + 1,453 → lim sup 95%
= 0,186.

Analiza intervalului de încredere pentru diferența dintre medii ne permite să observăm că


valoarea 0 este cuprinsă între cele două limite. Astfel, cu o precizie de 95% media populației
de diferențe poate să aibă orice valoare cuprinsă între -2,72 și 0,186, inclusiv 0 (așa cum susține
ipoteza de nul). Prezența lui 0 între cele două limite ale intervalului de încredere pentru diferența
dintre medii este un alt indiciu pentru acceptarea ipotezei de nul.

9.4 Testul t pentru eșantioane dependente cu SPSS

Vom rula testul t pentru eșantioane dependente în SPSS folosind datele din exemplul de
la secțiunea 8.2. Variabila dependentă este reprezentată de numărul de kilometri parcurși de
cicliști în cele 30 de minute înainte, respectiv după administrarea vitaminelor (măsurată pe scală
de interval/raport). Variabila independentă este reprezentată de momentul măsurării (înainte /
după) și este măsurată pe scală nominală dihotomică.
Pentru început trebuie să aranjăm baza de date în SPSS. Vom crea două variabile: una
care va cuprinde numărul de kilometri parcurși înainte de a lua vitaminele și alta care primește
valorile pentru performanța de după administrare. Apoi vom introduce datele din tabelul 8.1. în
secțiunea Data View din SPSS. Atunci când realizăm baza de date este esențial să realizăm
corespondența între performanța înregistrată de un participant înainte și cea avută după
„tratament”. Astfel, aruncând o privire peste imaginea de mai jos, care arată cum au fost
introduse datele, înțelegem că al treilea participant a parcurs 25 de kilometri înainte de a primi
tratamentul și 20 de kilometri după administrare. Participantul cu numărul 10 a rulat 23 de
kilometri atât înainte de a lua vitaminele, cât și după finalizarea „tratamentului”.

Pentru a lansa testul folosim meniul Analyze → Compare Means → Pired-Samples T


Test.

Cu ajutorul săgeții sau prin tehnica „drag and drop” în zona Paired-Variables vom trece
cele două variabile în zona Variable 1, respectiv Variable 2 în funcție de maniera în care dorim
să analizăm diferența dintre variabile. SPSS întotdeauna realizează diferența în sensul Variable
1 – Variable 2. În final se acționează butonul OK.
În zona de afișare a rezultatelor vom obține trei tabele. Tabelul Paired Samples Statistics
prezintă statistica descriptivă a celor două măsurători: media, volumul eșantionului, abaterea
standard și eroarea standard a mediei.

Paired Samples Corelations prezintă rezultatele testului de corelație Pearson dintre cele
două măsurători, dar informațiile din acest tabel nu fac obiectul de interes al acestei secțiuni.
Vom detalia testul de corelație Pearson în capitolul 10.

Tabelul Paired Samples Test conține rezultatele testului t pentru eșantioane dependente,
unde:
• Mean – media distribuției de diferențe (-1,267).
• Std. Deviation – abaterea standard a distribuției de diferențe (2,631).
• Std. Error Mean – eroarea standard a mediei diferențelor (0,679).
• 95% CI Confidence Interval of Diference – reprezintă limitele intervalului în care se
află media reală a diferenței dintre medii. În cazul nostru, cu o probabilitate de 95%
diferența reală dintre medii se află între -2,724 și 0,191.
• t – valoarea calculată a testului t pentru eșantioane dependente (-1,864).
• df –numărul de grade de libertate.
• Sig (2-tailed) – este probabilitatea asociată testului și este simbolizată prin p. Pe
principiul explicat și cu ocazia testelor statistice anterioare când p > α acceptăm ipoteza
de nul și respingem ipoteza cercetării. Dacă p ≤ α respingem H0 și acceptăm H1. Pentru
exemplul prezentat p (0,083) > α (0,05) și vom accepta ipoteza de nul.
9.5 Raportarea rezultatelor testului t pentru eșantioane dependente

Rezultatele testului statistic trebuie transpuse sub forma unui raport de cercetare. Astfel,
rezultatele obținute în exemplul analizat vor fi prezentate într-o formă narativă (American
Psychological Association, 2010) astfel : Utilizând un prag α = .05 a fost aplicat testul t pentru
eșantioane dependente pentru a evalua dacă rezistența fizică a cicliștilor se modifică
semnificativ după administrarea unor vitamine. Rezultatele indică faptul că media rezistenței
cicliștilor (exprimată în kilometri rulați în 30 de minute) înainte de administrarea vitaminelor
(M = 21.60, SD = 2.99) nu diferă semnificativ de media rezistenței cicliștilor înregistrată după
administrarea tratamentului (M = 22.87, SD = 2.41), obținându-se o valoare calculată t(14) =
1.86, p > .05, d = -.47. Intervalul de încredere (95%) al diferenței dintre medii este cuprins
între -2.72 și .19.

Tabelele prezentate în output trebuie raportate conform standardelor APA (2010) astfel:

Tabel 8.2 – Rezultatele testului t pentru eșantioane dependente kilometri înainte versus kilometri după
Mean t df p Cohen’s d
-1.26 1.86 14 > .05 -.47

Tema 9

Studenții seriei I (grupele 1, 2, 3,4 și 5) vor trimite temele pe e-mail la adresa


v.d.cruceanu@gmail.com până luni, 3 decembrie ora 20.00. La secțiunea subject se va
specifica Seminar Statistică. Temele trimise fără a avea această specificație la Subjet nu
vor fi luate în considerare.

Studenții seriei II (grupele 6, 7, 8, 9 și 10) vor trimite tema pe e-mail la adresa


adrian.gorbanescu@gmail.com până luni, 3 decembrie, ora 20.00.
Pe e-mail se vor trimite următoarele documente:
1. Baza de date va fi salvată sub denumirea Nume Prenume_grupa (de exemplu,
Popescu Bogdan_grupa 1) și va fi trimisă prin e-mail la adresa menționată mai
sus.
2. Output-ul salvat sub denumirea Nume_Prenume_grupa.
3. Un document word salvat sub aceeași denumire care va cuprinde răspunsurile la
subpunctele a, b, c, și d. De asemenea documentul va cuprinde, pe lângă rezolvarea
exercițiului, explicația procedurilor utilizate pentru a obține rezultatele
prezentate.
4. Poza foii A4 pe care ați rezolvat punctul 3e. al temei

1. În ce context se folosește testul t pentru eșantioane dependente?


2. Pe ce scală este măsurată variabila independentă în contextul testului t pentru
eșantioane dependente?
3. Un cercetător este interesat să studieze efectul pe care îl are vizionarea unor filme
documentare asupra comportamentului agresiv al adolescenților. În acest sens, măsoară
numărul comportamentelor agresive, înainte și după vizionarea filmului documentar. În
tabelul de mai jos sunt prezentate datele cercetării.
Înainte După
5 2
4 2
5 4
6 4
5 3
7 5
4 1
5 3
6 3
4 2
4 0
4 0
3 2
4 2
6 5

Pentru α = 0,01 (bilateral):


a. Enunțați ipoteza cercetării.
b. Enunțați ipoteza de nul.
c. Precizați rezultatele testului t pentru eșantioane dependente (t, sig (p)), decizia cu privire
la ipoteza de nul și ipoteza cercetării și precizați limitele intervalului de încredere.
d. Prezentați rezultatele în stil APA.
e. Descrieți procedura de calcul a testului t pentru eșantioane dependente (calculați
valoarea lui t și specificați valoarea tcritic) și luați decizia statistică.

S-ar putea să vă placă și