Sunteți pe pagina 1din 10

Testul t cu un singur eșantion îl folosim atunci când dorim să comparăm media unui eșantion cu

media unei populații.

Preliminarii. Înainte de a face exerciții cu teste t este bine să vă reamintiți cotele standard z
respectiv distribuția normală și cea de eșantionare.

a) Cotele standard z sunt o metodă de standardizare prin care se indică la câte abateri
standard se află un scor față de medie. Pentru ilustrare, să ne amintim cum era în timpul
școlii dacă luam o notă: acea notă era comparată cu cea a colegilor (un fel de medie) și
era influențată de ce note au luat fiecare (de împrăștierea scorurilor). Ca atare formula
este următoarea: z= (x-m)/s (scorul participantului – media eșantionului)/abaterea
standard (acest raționament va fi folosit în fiecare din aceste teste t, doar că vor fi
modificate câteva aspecte la fiecare tip de test).
b) Distribuția normală este o distribuție de frecvențe de scoruri. Aceasta ilustrează o
tendință pe care o au scorurile unor populații atunci când numărul de măsurători crește
foarte mult. Printre caracteristicile sale sunt următoarele:
i) este simetrică
ii) modul, mediana și media sunt egale (cu alte cuvinte: media este cel mai
întâlnit scor, media este scorul aflat la mijlocul distribuției etc)
iii) Fiecare punct al liniei care definește distribuția reprezintă frecvența
acelui scor (pe linia de jos (OX) avem posibilele valori, iar pe linia de sus
(OY) avem posibilele frecvențe ale acelor valori)
iv) Etc
c) Tabelul z: Tabelul z reprezintă probabilitatea cumulată pentru fiecare valoarea standard
a distribuției. Cu alte cuvinte, reprezintă cât la sută din scoruri se află sub sau la acea
valoare.

Exerciții explicate:

Problema 1.

În urma unei colectări de date la nivel național în ceea ce privește încrederea în sine la nivelul
adolescenților s-a obținut o distribuție normală cu media 11,5. Într-o școală au fost întreprinse
o serie de intervenții de către psihologul școlar. Un eșantion de 30 de elevi din acea școală au
avut următoarele scoruri:

11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14,
15.

Cu un nivel de încredere de 95%, putem afirma că aceste intervenții au fost eficiente?


Cum raționăm:

a) Vrem să vedem dacă intervențiile au fost eficiente. Deci ca atare ipoteza noastră de
cercetare este aceea că μ1> μ0, cu alte cuvinte dacă μ1este mai mare decât 11,5. Înseamnă că
ipoteza de nul pe care o folosim este μ1= μ0,cu alte cuvinte μ0=11,5.

Deci primii pași sunt stabilirea ipotezei de nul respectiv a ipotezei alternative. În cazul nostru:

Ipoteza de nul, H 0 : μ1= μ0

Ipoteza alternativă (sau de cercetare), H 1: μ1> μ0

Motivul pentru care folosim simbolurile este pentru că vrem să vedem dacă populația din
care face parte eșantionul (adolescenții care au primit intervenție) este diferită de populația de
adolescenți sau nu (adică faptul că s-a făcut acea intervenție îi modifică pe acei adolescenți
astfel încât să se diferențieze mult de adolescenții obișnuiți).

b) Ar părea la prima vedere că întrebarea nu are sens, ne uităm la media eșantionului și


vedem dacă este mai mare sau mai mic. În același timp, trebuie avut în vedere că eșantionul
este doar o parte din totalul scorurilor și că scorul acestuia poate fi influențat de o eroare de
eșantionare (adică să fii selectat fix acei copii care poate au mai multă încredere în ei sau vice
versa care au mai puțină încredere în ei). Ca atare, pentru a putea spune dacă sunt diferențe
semnificative între cele două populații, vom folosi un test t.

Următorul pas este stabilirea pragului de semnificație. Vom folosi testul t care ne spune
dacă sunt diferențe importante. O sarcină este de a decide în afara a câte scoruri din distribuția
populației trebuie să se afle media celeilalte populații pentru a spune că este semnificativ
diferită de cealaltă: în afara a 95% din scoruri, 99%? Pragul stabilit inclusiv de problemă este de
95%. Deci avem un prag alfa stabilit la 5% de șansă de a face eroare de tip I (adică de a spune că
există un efect, atunci când în realitate acesta nu există). Modul în care este afirmată ipoteza de
cercetare ( H 1) ne poate spune dacă dorim un studiu unilateral sau unul bilateral (adică dacă ne
uităm într-un singur sens asupra diferenței dintre cele două populații sau în ambele posibilități).
Sarcina noastră este de a verifica dacă intervențiile sunt eficiente, deci dacă sunt scorul
populației adolescenților ce au primit intervenția este semnificativ mai mare decât populația
adolescenților. Deci ne vom uita în direcția din dreapta (unde se află cele mai mari scoruri ale
populației adolescenților) și vom vedea dacă media populației adolescenților cu intervenție este
în primii 5% din scorurile de la populația de bază (cea a tuturor adolescenților). Deci prin
ipoteza de cercetare: μ1> μ0, vom avea un test unilateral pe partea dreaptă.

c) Testul statistic folosit este testul t cu un singur eșantion


De ce am folosit acest test și nu altul. În primul rând, avem în fapt comparația dintre un
eșantion și populația din care acesta face parte. Ca atare folosim un test t cu un singur eșantion.
De ce folosim t și nu z?

Deoarece testul z poate fi folosit doar atunci când eșantionul este mai mare de 30 și
cunoaștem abaterea standard la nivelul populației. În cazul nostru abaterea standard la nivelul
populației nu este cunoscută, avem doar abaterea standard la nivelul eșantionului. Ca atare
vom folosi testul t.

Formula de la testul t:

m−μ0
t = S , unde m reprezintă media eșantionului, μ0 este media populației față de care se
√n
S
face comparația, iar este eroarea standard a mediei, unde s este abaterea standard
√n
estimată iar n este numărul de participanți din eșantion. Principiul este similar cu cel de la
cotele standard z pentru scorul dintr-o distribuție, doar că în acest caz comparația se face la
nivelul medie eșantion cu medie populație și sub un alt indice al împrăștierii (eroarea standard
a mediei). Dar raționamentul este același, cât de mult se îndepărtează o medie a eșantionului
față de media populației (populație care este distribuită într-o distribuție a tuturor
eșantioanelor posibile).

Numele de eroare standard al mediei vine de la faptul că mediiile eșantioanele pot să fie
diferite, dar motivul pentru care acestea diferă nu îl cunoaștem, așa că atribuim erorii aceste
diferențieri față de medie (de aici și numele eroarea standard a mediei).

Ce informații avem:

media populației ( μ0=11,5) respectiv numărul de participanți (n = 30).

Trebuie să calculăm:

Media eșantionului (m=adunăm toate scorurile/numărul de scoruri) respectiv abaterea


standard la nivelul eșantionului.

Valorile în cazul nostru sunt: m = 12,47 iar s = 5,22.

12, 47−11, 5 12, 47−11, 5 0 , 97


Ca atare: t = 5 , 22 = 5 , 22 = 5 ,22 = 00 ,, 97
95
= 1,02
√ 30 √ 30 5 , 47

Decizia statistică:
Vrem să vedem dacă media obținută este semnificativ mai mare față de media populației
tuturor adolescenților. Cu alte cuvinte, în acest caz, vrem să vedem dacă media eșantionului
este în primele 5% valorile ale mediilor eșantioanelor din distribuția tuturor eșantioanelor
posibile luate din populația adolescenților. Ca atare vom utiliza tabelul testului t.

Ne uităm la tabel la gradele de libertate aferente eșantionului nostru, anume n-1, deci 29. În
tabel este coloana cea mai din stânga (aflată sub df – degrees of freedom). În dreapta, sunt mai
multe coloane. Pragul pe care noi îl căutăm este acela de 0,05 (adică cel de 5%, pragul stabilit
de la început, iar faptul că testul este unilateral atunci acest prag este pus într-o singură
direcție, astfel că nu va fi împărțit în două). Valoarea sub care se află primele 95% din scoruri
este 1,699. Valoarea noastră t calculat este 1,02; 1,02 este mai mică decât 1,699 deci este o
valoarea care se află în primele 95% din scoruri, astfel că diferența dintre cele două medii nu
este una care să fie semnificativ statistică, astfel că nu infirmăm ipoteza de nul.

Recapitulare: v

1. Stabilim ipoteza de nul și ipoteza de cercetare (alternativă)


2. Stabilim pragul
3. Stabilim ce tip de test folosim
4. Realizăm calculele
5. Verificăm dacă valoarea calculată depășește sau nu pragul critic.

Problema 2.

Dan și-a cumpărat un frigider nou. Producătorul spune că acesta consumă în mod obișnuit 90
de W pe zi. Cu toate acestea, lui Dan i se pare că frigiderul său consumă destul de mult. Acesta
vrea să vadă dacă sunt diferențe între frigiderul său și cele obișnuite.Astfel că s-a apucat să facă
o serie de măsurători ale consumului. A măsurat în 41 de zile și a observat că în medie
consumul în aceste zile a fost de 95 cu o abatere standard de 5.

Rezolvare

a) Cum raționăm? Vrem să vedem dacă sunt diferențe între frigiderul său și cel de la
producător. Ca atare, avem un eșantion de scoruri de consum ale frigiderului său versus
media de consum la nivelul populației de frigidere. Prin urmare, avem de a face cu un test t
cu un singur eșantion.

Ipoteza de cercetare este că sunt diferențe între frigiderul lui Dan (cu alte cuvinte, între
populația de scoruri la consumul zilnic de la frigiderul acestuia) și populația de frigidere ale
producătorului.

Ipoteza de nul, H 0 : μ1= μ0


Ipoteza alternativă (sau de cercetare), H 1: μ1≠ μ0

b) Am decis că folosim testul t cu un singur eșantion. Putem folosi testul z cu un singur


eșantion? Răspunsul este nu. Sunt două reguli pe care o situație trebuie să le îndeplinească
pentru a putea folosi testul z cu un singur eșantion:

a- Să cunoaștem abaterea standard de la nivelul populației

b- Să avem un eșantion suficient de mare (minim 30).

În timp ce a doua condiție este îndeplinită (41>30), prima condiție nu este îndeplinită, noi
cunoscând la nivelul populației doar media.

Ca atare vom folosi testul t cu un singur eșantion

c) Pragul de semnificație. Stabilim de obicei la 5% pragul de semnificație, cu alte cuvinte riscul


de a face eroare de tip 1 (a zice că este un efect atunci când el nu este) respectiv cât de atipic
trebuie să fie acea medie față de distribuția de eșantionare (în afara a cât la sută din distribuție
să se afle pentru a putea spune că acest scor nu este tipic (Spre ex. într-o test bilateral, diferiți
față de o clasă vor fi elevii premianți, respectiv cei corigenți, care nu sunt tipici pentru acea
clasă, nu reprezintă majoritatea).

Modul în care este prezentată problema: „dacă sunt diferențe între frigiderul lui și cel obișnuit”
indică faptul că ne uităm la posibile diferențe, dar nu știm exact în ce direcție sunt (poate este
mai mare, poate este mai mic). Ca atare, această frază (sunt diferențe, fără a se indica direcția)
ne arată că testul pe care îl folosim va fi unul bilateral. Pragul este în continuare la 5% la fel ca la
cel unilateral, doar că în cazul testului bilateral, acest 5% se împarte o dată pentru o parte a
distribuției și o dată pentru cealaltă. Astfel, în direcția dreaptă pragul va fi stabilit la 5/2, anume
2,5%, iar la fel în partea stângă pragul va fi stabilit la 5/2, anume 2,5%.
m−μ0
Formula pentru testul t = S , unde m reprezintă media eșantionului, μ0 este media
√n
S
populației față de care se face comparația, iar este eroarea standard a mediei, unde s este
√n
abaterea standard estimată iar n este numărul de participanți din eșantion.

Ce informații avem:

m = 95

μ0=90

s=5

n = 41.

95−90 5
5
Ca atare: t = 5 = 5 = =6,41
0 ,78
√ 41 6, 4

t calculat (mai puteți întâlni și sintagma t observat) este 6,41. Vrem să vedem dacă trece sau nu
de pragul de semnificație. Ca atare, ne uităm în tabelul pentru testul t. Ne uităm în coloana
stângă la grade de libertate (df). Gradele de libertate sunt în cazul acesta n-1, adică 41-1=40. Ne
uităm pe coloana din dreapta unde este setat ,025 pentru că avem un test bilateral (ne
amintim, acesta a împărțit pragul în două, într-o parte și alta a distribuției). Valoarea de prag
pentru 0,025 pentru 40 df este de 2,021. Valoarea noastră este 6,41, aceasta este mai mare
decât pragul stabilit (este mai în dreapta, ca atare are o probabilitate mai scăzută de a apărea,
și deci nu putem argumenta că ar fi doar hazardul cel care să explice apariția acelui scor și nu al
altuia; ne amintim că cu cât o valoare este mai înspre capetele distribuției, cu atât aceasta este
mai puțin probabilă).

Deci valoarea t calculat depășeste pragul, ca atare putem să infirmăm ipoteza de nul, astfel că
sunt diferențe semnificative între frigiderul lui Dan și frigiderele obișnuite de la acea firmă, așa
că ar putea să meargă să îl ducă la reparat, să facă reclamație etc.

Problema 3.

Un manager a observat că scorul la nivelul motivație pentru angajații care lucrează în schimbul
de dimineață este de 106 (n=30). Media la nivelul întregii firme este de 100, cu o abatere
standard de 15. Acesta vrea să vadă dacă nivelul acestor angajați este diferit de cel de la nivelul
firmei.

Cum raționăm? Vrem să vedem dacă sunt diferențe între o grupă de angajați și întreaga firmă.
Ca atare, aceasta este diferența dintre un eșantion și o populație, astfel că vom folosi testul t cu
un singur eșantion.

Întrebarea este dacă sunt diferențe. Ca atare, ipoteza de cercetare și cea de nul va fi una de
următoarea formă:

Ipoteza de nul, H 0 : μ1= μ0

Ipoteza alternativă (sau de cercetare), H 1: μ1≠ μ0

Putem folosi și testul z cu un singur eșantion? Sunt condițiile îndeplinite pentru așa ceva?

Avem atât un eșantion suficient de mare (n=30) cât și abaterea standard la nivelul populației.
Ca atare putem folosi testul z (este recomandat, când putem, să folosim testul z).

Stabilirea pragului de semnificație. Ca de obicei, stabilim un 5% ca prag de semnificație (dacă


stabilim un prag prea strict, putem să cădem în riscul de a face erori de tip II (adică să nu vedem
un efect atunci când acesta există), ca atare este necesar un soi de echilibru între cele două
tipuri de erori). Cercetarea se concentrează în jurul problemei dacă sunt diferențe, deci nu este
clar sensul acestei diferenței, prin urmare se va folosi test bilateral.
m−μ0
Formula pentru testul z = σ , unde m reprezintă media eșantionului, μ0 este media
√n
σ
populației față de care se face comparația, iar este eroarea standard a mediei, unde σ este
√n
abaterea standard estimată iar n este numărul de participanți din eșantion.

Datele pe care le avem:

m = 106

μ0=100

σ=15

n = 30.

106−100 6
6
z= 15 = 15 = 2 ,74 =+2,18
√30 5 , 47

Pentru a vedea dacă această valoare depăsește pragul ne putem uita în tabelul z. ( Putem să
spunem și direct având în vedere că scorul z se bazează pe distribuția normală, iar în distribuția
normală 95% de scoruri se află între -1,96 și +1,96 din scoruri, iar acest z=+2,18 fiind în afara
acestui interval, ne permite să spunem că trece de acel prag de semnificație și ca atare este
semnficativ diferit de acesta.) Dacă folosim testul z ne putem uita la cât înseamnă valoarea de
+2,18. Valoarea de la z=+2,18 este de .9857, adică are o valoarea mai mare decât 98,57% din
posibilele medii de eșantioane din distribuție și depășește acel prag de 2,5% din partea dreaptă
(peste care treceau toate scorurile care depășeau valoarea de 97,5%). Ca atare, există diferențe
semnificative între această grupă și populația din care face parte astfel că infirmăm ipoteza de
nul.

Problema 4.

Media populației la nivelul României este de 40 la un anumit chestionar de anxietate. După


cutremurele din Gorj un psiholog a cules date pentru a vedea nivelul de anxietate din acel
județ. El a cules câteva date, și anume acest eșantion: 62, 49, 44, 46, 48, 52, 57, 51, 44, 47.
Vrem să vedem dacă cumva anxietatea din județul Gorj este semnificativ mai mare decât cea de
la nivelul populației (cu o încredere de 95%).

Cum raționăm? Vrem să vedem dacă sunt diferențe între media eșantionului din Gorj față de
populație. Ca atare vom utiliza un test t cu un singur eșantion. Ipoteza de cercetare vrea să vadă
dacă este semnificativ mai mare, ca atare ipoteza de cercetare respectiv ipoteza de nul vor
arăta:

Ipoteza de nul, H 0 : μ1= μ0

Ipoteza alternativă (sau de cercetare), H 1: μ1> μ0

Pragul de semnificație este stabilit la 5% (anume acea încredere de 95%). Testul este unul
unilateral deoarece dorește indică o anumită direcție a posibilei diferențe, ca atare este
unilateral în dreapta (adică dacă valoarea mediei eșantionului din Gorj se află în primele 5% din
acea distribuție de eșantionare (distribuția mediilor tuturor eșantioanelor); ca atare, având în
vedere că valorile cele mai mari se află în dreapta, testul nostru este unilateral în dreapta).

Putem să folosim un test z în locul unui test t? Aceasta poate avea loc doar dacă eșantionul este
suficient de mare și cunoaștem abaterea standard de la nivelul populației. Niciunul dintre
aceste cerințe nu este cunoscută, ca atare nu putem folosi testul z ci vom continua cu testul t.

Ce informații avem în acest moment:

μ0=40

n = 10.

m−μ0
Formula la testul t = S , unde m reprezintă media eșantionului, μ0 este media populației
√n
S
față de care se face comparația, iar este eroarea standard a mediei, unde s este abaterea
√n
standard estimată iar n este numărul de participanți din eșantion.

Ca atare, trebuie să cunoaștem media și abaterea standard a eșantionului. Media este egală cu
suma scorurilor împărțit la numărul de participanți (500/10), rezultă m=50. Abaterea standard
este rădăcină din raportul dintre suma tuturor diferențelor ridicate la pătrat supra numărul de

scoruri -1. (În cazul nostru este s=


√ 300
9
= √ 33 ,3 =5,77

50−40 10
10
Ca atare testul nostru t va fi t = 5 ,77 = 5 , 77 =
1, 8 = 5,55
√10 3 , 16

t calculat este egal cu 5,55. Valoarea lui t critic pentru pragul stabilit este 1,83 (linia de la df=9 și
coloana de la probabilitatea de .05 pentru că am avut un test unilateral). Valoarea noastră este
de 5,55 deci trece pragul de semnificație (este mai puțin probabilă de 5% să apară doar din
întâmplare) deoarece 5,55>1,83. Ca atare, respingem ipoteza de nul.

S-ar putea să vă placă și