Sunteți pe pagina 1din 26

Statistica inferenţiala

Teste statistice
• Definiţie, aplicabilitate
• Ipoteza statistică vs. ipoteza clinică
• Testarea unei ipoteze statistice:
– Etapele unui test statistic
• Teste statistice (utilitate, aplicabilitate)
INTRODUCERE

 Formularea de noi ipoteze (modele sau teorii) este


una dintre cele mai importante aspecte ale
cercetării ştiinţifice.
 O ipoteză nouă trebuie t e s t a t ă pentru a vedea
că are temei (în concordanţă cu observaţiile), şi
pentru a justifica dacă este “mai bună” decât alte
ipoteze alternative.
Definiţie, aplicabilitate

• Un test statistic este conceput şi utilizat pentru


verificarea unei ipoteze statistice.
• De regulă, ipoteza care trebuie testată (H0, ipoteza
nulă) se poate formula ca fiind una în care nu există
nici o schimbare:
– Nu există nici o diferenţă între mediile a două
populaţii (media taliei la o populaţie de nou-
născuţi la termen şi respectiv născuţi prematur)
– Nu există diferenţă semnificativă între mediile a
două eşantioane extrase din aceste populaţii.
METODE PENTRU TESTAREA IPOTEZELOR

Compararea a două ipoteze sau teorii concurente


 Prima dată trebuie formulate ca modele.
 Ipoteza nulă H0, reprezintă modelul pe care
experimentatorul ar dori să-l înlocuiască.
 Ipoteza alternativă H1este noul model care de regulă
reprezintă o negaţie a ipotezei nule.
Termeni

• Ipoteza nulă (H0): ipoteza care urmează


a fi testată
• Ipoteza alternativă (H1): opusul ipotezei
nule
• Prag de semnificaţie:
– Probabilitatea de eroare acceptată de
cercetător
– De obicei este de 5% (0,05)
Testul statistic

• Metodă de comparaţie a două sau mai multe


populaţii, prin intermediul unor variabile observate
ale lor.
Ipoteza statistică vs ipoteza clinică

• Scopul unui test statistic este de a defini realitatea.


• Definirea întrebării de cercetare (ipoteza clinică):
– Tratamentul cu Nebivolol este la fel de eficient
ca şi cel cu Valsartan în tratamentul
hipertensiunii arteriale?
• Transpunerea întrebării de cercetare în termeni
statistici (ipoteza statistică):
– Media tensiunii arteriale a pacienţilor trataţi cu
Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu
Nebivolol
Etapele unui test statistic

1. Formularea problemei în termenii ipotezelor


statistice.
2. Alegerea şi calcularea parametrului statistic al
testului.
3. Regiunea critică.
4. Concluzia testului.
1. Formularea problemei în termenii
ipotezelor statistice
• Ipoteza nulă: ipoteza care trebuie testată, testul
efectuându-se sub prezumţia că ipoteza nulă ar fi
adevărată

• Ipoteza alternativă: acea ipoteză care într-un sens


sau altul contrazice ipoteza nulă. Această ipoteză se
mai numeşte şi ipoteza de lucru
2. Alegerea şi calcularea parametrului
statistic al testului
• Parametrul statistic al testului exprimă într-o anumită formă,
diferenţa dintre elementele comparate.

• Ţinând seama de faptul că eşantionul sau eşantioanele utilizate


sunt aleator extrase din populaţiile care fac obiectul testului,
parametrul statistic este o variabilă aleatoare de selecţie, care
urmează o anumită lege de probabilitate.
• Un parametru statistic bun al testului trebuie să îndeplinească
două condiţii:
– Trebuie să se comporte diferit atunci când ipoteza nulă H0
este adevărată faţă de situaţia în care ipoteza alternativă H1
este adevărată.
– Distribuţia de probabilitate a parametrului statistic al
testului sub prezumţia că H0 este adevărată, este cunoscută.
3. Regiunea critică
• Trebuie să fim capabili să decidem în funcţie de valoarea
parametrului statistic calculat care dintre ipoteze, cea nulă sau
cea alternativă, este adevărată.

• Dacă valoarea parametrului statistic aparţine regiunii critice,


ipoteza nulă H0 va fi respinsă şi va fi acceptată ipoteza
alternativă H1.

• Dacă valoarea parametrului statistic nu aparţine regiunii critice,


ipoteza nulă H0 va fi acceptată.
• Decidem mărimea regiunii critice.
– Pentru aceasta trebuie să specificăm mărimea riscului de
eroare pe care îl acceptăm.
– Pe scurt, definim nivelul de semnificaţie, notat cu α, sau
mărimea riscului pe care suntem dispuşi să ni-l asumăm în
respingerea ipotezei nule H0 în cazul în care aceasta nu este
adevărată.
– De obicei se alege un nivel de semnificaţie între 1% şi 5%.
3. Regiunea critică
• Decidem mărimea regiunii critice.
– Probabilitatea unei erori de tipul I:
• probabilitatea de respingere a ipotezei nule H0 în
favoarea ipotezei alternative H1, în condiţiile în care H0
este adevărată.
• probabilitatea unei erori de tipul I se notează cu α şi se
mai numeşte nivel de semnificaţie al testului.
– Probabilitatea unei erori de tipul II:
• probabilitatea acceptării ipotezei nule în condiţiile în care
ipoteza alternativă H1 este adevărată.
• această probabilitate se notează cu β.
ETAPA 3

Depinzând de ipoteza alternativă, se poate alege una din


următoarele trei regiuni critice:
Regiunea critică unilaterală la dreapta – valoarea parametrului statistic
al testului este mai mare sau egală cu valoarea din dreapta a intervalului
critic;
Regiunea critică unilaterală la stânga – valoarea parametrului statistic
al testului este mai mică sau egală cu valoarea din stânga a intervalului
critic;
Regiunea critică bilaterală – valoarea parametrului statistic al testului
este mai mică sau egală cu valoarea extremă din stânga regiunii critice
sau mai mare sau egală cu valoarea
extremă din dreapta regiunii critice, valorile extreme ale regiunii
critice având nivele egale de semnificaţie.
4. Concluzia testului

• Ipoteza nulă H0 este respinsă dacă valoarea


parametrului statistic aparţine regiunii critice.
• Regiunea critică trebuie astfel aleasă încât dacă
ipoteza alternativă H1 este adevărată, probabilitatea
de respingere a ipotezei nule H0 este mai mare decât
în cazul în care ipoteza nulă H0 ar fi adevărată.
• Acceptarea ipotezei nule H0 atunci când ipoteza
alternativă H1 este adevărată, este cunoscută ca şi
eroarea de tipul II.
– probabilitatea ei se notează cu β
– măsoară „nivelul de eroare”
ETAPA 4 - DECIZIA
(FOLOSIND VALOAREA LUI P)

 La aplicarea testelor statistice, programele de


prelucrare statistica vor afisa o probabilitate de
semnificatie a testului statistic, numita si nivel de
semnificatie observat (notat cu p).
 Stabilirea semnificaţiei testului pe baza valorii lui p se face
frecvent cu următoarea regulă empirică
(consideram nivelul ales α=0,05) :
1. Dacă 0,01 <= p<0,05 , rezultate semnificative.
2. Dacă 0,001 <= p<0,01, rezultate înalt semnificative.
3. Dacă p<0,001, rezultate foarte înalt semnificative.
4. Dacă p>=0,05, rezultate nesemnificative statistic.
5. Dacă 0,05 <= p <0,1, se notează o oarecare tendinţă
spre considerarea unei semnificaţii statistice.
4. Concluzia testului

• În testarea oricărei ipoteze statistice, există patru situaţii


care determină dacă decizia noastră este corectă sau nu

Cazuri

H0 este adevărată H0 este falsă


Concluzie H0 se acceptă decizie corectă eroare de tipul II
H0 se respinge eroare de tipul I decizie corectă
Inferenţa statistică pe date cantitative
• Variabile cantitative continue:
– Testul z şi Student (t) (o medie sau medii
perechi)
– Testul z şi Student (t) (testarea a două medii)
– ANOVA (≥ 3 medii)
• Ranguri (variabile cantitative discrete sau
cantitative care nu îndeplinesc condiţia de
normalitate):
– Testul sumei rangurilor: Wilcoxon
– Kruskal-Wallis (≥ 3 eşantioane independente)
– Friedman (≥ 3 eşantioane dependente)
Testul Student (t) de comparare a unei medii
cu o medie cunoscută (variaţii necunoscute)
• Scopul testului: investigarea semnificaţiei diferenţei dintre
media unui eşantion şi o medie standard cunoscută.
• Ipoteza nulă H0: nu există diferenţă semnificativă între media
eşantionului şi media standard.
• Ipoteza alternativă H1: există diferenţă semnificativă între media
eşantionului şi media standard.
• Condiţii de aplicare
– Testul se poate aplica atunci când variaţia σ2 nu este
cunoscută iar estimarea s2 a acesteia se realizează pentru
un eşantion mic (n < 30) care respectă o distribuţie normală.
Dacă această condiţie de normalitate nu este satisfăcută
atunci testul îşi pierde validitatea.
– Dacă se cunoaşte variaţia populaţiei σ2, şi n ≥ 30 se aplică
testul Z care este un test mult mai puternic.
Testul Student (t) de comparare a unei medii
cu o medie cunoscută/teoretica
• Numărul de grade de libertate
(df): df = n-1 • Parametrul testului:
• Pragul de semnificaţie: α = 0,05. X − µ0
t=
• Regiunea critică pentru testul σ
bilateral este: n

(−∞;−t α ] ∪ [t α ;+∞) • n = volumul eşantionului


n −1, n −1, • µ0 = media standard
2 2
• X = media eşantionului
σ = deviaţia standard a
(−∞;− t n −1;0, 025 ] ∪ [ t n −1;0, 025 ;+∞) eşantionului. n
∑ i
( x − X ) 2

σ = σ2 = i =1
n −1
Testul Student de comparare a unei medii cu o medie
cunoscuta/teoretica

• Uneori cunoastem din literatura de specialitate care este media populatiei din care
presupunem ca este extras un lot si dorim sa verificam ipoteza ca esantionul apartine
într-adevar populatiei respective.
• Variabila aleatoare tc, se calculeaza dupa formula:

• si are o repartitie Student cu n-1 grade de libertate.

Din tabelele statistice pentru t se cauta valoarea lui t95%


pentru n-1 grade de libertate si se compara cu valoarea lui tc.

Interpretarea testului:
Daca atunci nu avem motive suficiente pentru a afirma ca exista o diferenta
semnificativa intre media de esantionare si media teoretica.

Daca putem afirma ca exista o diferenta semnificativa intre media de


esantionare si media teoretica.
Testul Student (t) de comparare a două
medii (variaţii necunoscute şi egale)
• Ipoteza nulă: Diferenţa mediilor celor două populaţii
este egală cu zero.
• Ipoteza alternativă pentru testul bilateral: Diferenţa
mediilor celor două populaţii este diferită de zero.
• Condiţii de aplicare
– Variabila de analizat în cele două populaţii este normal
distribuită şi variaţiile celor două populaţii sunt egale.
– Dacă aceste condiţii nu sunt satisfăcute atunci testul
îşi pierde validitatea.
– Dacă se cunoaşte variaţia populaţiei σ2, se aplică
testul Z care este un test mult mai puternic.
Testul Student (t) de comparare a două
medii (variaţii necunoscute şi egale)
• Numărul de grade de Parametrul statistic al testului
libertate (df):
– df = n1 + n2 - 2 X1 − X 2
t=
• Pragul de semnificaţie:
1 1
α = 0,05. σ  + 
• Regiunea critică pentru  n1 n2 
testul bilateral:
(n1 − 1) s12 + (n2 − 1) s22
s=
(−∞;−t α ] ∪ [t α ;+∞) n1 + n2 − 2
n1 + n2 − 2; n1 + n2 − 2;
2 2
Testul Student (t) de comparare a mediilor a două
eşantioane perechi

• Scopul testului: compararea pentru o variabilă cantitativă


continuă media ei aritmetică pentru două eşantioane perechi
(observaţii ale aceleiaşi variabile cantitative realizate pe
elementele unui eşantion înainte şi după acţiunea unui factor ).

• Condiţii de aplicare: fiecărei observaţii din primul eşantion îi


corespunde o observaţie pereche din al doilea eşantion iar
diferenţele dintre valorile perechi sunt normal distribuite.
• Ipoteza nulă: Media diferenţei valorilor perechi din eşantioanele
perechi nu este semnificativ diferită de zero.

• Ipoteza alternativă pentru testul bilateral: Media diferenţei


valorilor perechi din eşantioanele perechi este semnificativ
diferită de zero.
Testul Student (t) de comparare a mediilor a două
eşantioane perechi
• Numărul de grade de
libertate (df): df = n – 1. • Parametrul statistic al
testului
• Pragul de semnificaţie
este: α = 0,05. t=
d (d + d 2 + ... + d n )
d= 1
s
• Regiunea critică: n
n
(−∞;− t α ] ∪ [t α ;+∞)
n −1; n −1;
2 2

• s = deviaţia standard a
diferenţelor
• n = volumul eşantionului
Etapele testarii statistice ale unei
ipoteze
1. Se stabilesc ipotezele Ho si H1
2. Se alege testul statistic potrivit (t, Z, Anova)
3. Se stabileste nivelul de semnificatie (α)
α = probabilitatea respingerii gresite a ipotezei nule atunci
cand de fapt aceasta este adevarata;
4. Se stabileste daca testul este uni- sau bi-directional
5.Se stabilesc valorile critice din tabelele statistice in
functie de α si gradele de libertate
6. Se calculeaza testul statistic t
7. Se compara testul statistic calculat cu cel teoretic.
8. Se trag concluziile privin ipoteza nula si ipoteza
alternativa.

S-ar putea să vă placă și