C4 Statistica Inferentiala

STATISTICA
INFERENŢIALĂ
CURS 4
1
OBIECTIVE
 Testarea ipotezelor statistice

 Ipoteza nulă, ipoteza alternativa
 Erori în testarea ipotezelor statistice
 Teste de tip t- Student
2
INTRODUCERE
Formularea de noi ipoteze (modele sau teorii)

este una dintre cele mai importante aspecte
ale cercetării ştiinţifice.
O ipoteză nouă trebuie t e s t a t ă pentru a
vedea că are temei (în concordanţă cu
observaţiile), şi pentru a justifica că este “mai
bună” decât alte ipoteze alternative.
3
METODE PENTRU TESTAREA IPOTEZELOR
Compararea a două ipoteze sau teorii

concurente
 Prima dată trebuie formulate ca modele.
 Ipotezanulă H 0 , reprezintă modelul pe care
experimentatorul ar dori să-l înlocuiască.
 Ipotezaalternativă H 1 este noul model care de regulă
reprezintă o negaţie a ipotezei nule.
4
 Indiferent cum este formulat protocolul

experimentului, scopul cercetătorului este de a testa
ipoteza nulă (de cele mai multe ori pentru a o
respinge)
 Ipoteza nulă nu trebuie probată, ci anulată
 Inferenţă negativă
 Un test statistic este conceput şi utilizat pentru
verificarea unei ipoteze statistice.
 Scopul testului statistic este de a dovedi că i poteza
nulă H 0 este falsă
  nu putem niciodată afirma că acceptăm ipoteza nulă
 O putem nega sau nu o putem nega
5
Prin respingerea ipotezei nule, cercetătorul

afirmă că rezultatele observate nu sunt
datorate întâmplării (rezultatele sunt
semnificative).
Când ipoteza nulă nu este respinsă,

cercetătorul afirmă că diferenţele observate
sunt datorate întâmplării (rezultatele nu sunt
semnificative).
6
IPOTEZA STATISTICĂ - IPOTEZA CLINICĂ
 Scopul unui test statistic este de a defini

realitatea.
 Definirea întrebării de cercetare (ipoteza clinică):
 Tratamentul cu medicamentul A este la fel de
eficient ca şi cel cu medicamentul B în tratamentul
HTA?
 Transpunerea întrebării de cercetare în termeni
statistici (ipoteza statistică):
 Media TA a pacienţilor trataţi cu A nu diferă
semnificativ de media TA a pacienţilor trataţi cu B.
7
ETAPELE UNUI TEST STATISTIC
 1. Specificăm ipoteza nulă şi ipoteza alternativă.
 2. Alegem statistica adaptată situaţiei.

 3. Alegem nivelul de semnificaţie şi pe baza sa
calculăm pragul de separare (între valorile
“acceptabile” şi cele considerate ca “inacceptabile”).
 4. Calculăm valoarea statisticii, folosind datele din
eşantion (ales aleator).
 5. Decidem, prin compararea valorii calculate cu
pragul dat de nivelul de semnificaţie, dacă
respingem sau nu ipoteza nulă.
8
ETAPA 1: FIXAREA IPOTEZELE STATISTICE
 Ipoteza nulă H 0 este ipoteza care trebuie testată,

testul efectuându-se sub prezumţia că ipoteza nulă
ar fi adevărată.
 Ipoteza alternativă H 1 este acea ipoteză care într -un

sens sau altul contrazice ipoteza nulă. Această
ipoteză se mai numeşte şi ipoteza de lucru.
9
ETAPA 2 -DEFINIREA PARAMETRULUI
STATISTIC
Definirea unui parametru care sub ipoteza nulă H 0

urmează o anumită lege de probabilitate cunoscută
(de exemplu- legea normală).
10
Etapa 3
 Definirea unui prag de semnificaţie 
(probabilitatea de a respinge H 0 când ea de fapt
este adevarată)
-de obicei se alege un nivel de semnificaţie între
1% (=0.01) şi 5%. ( = 0.05)
Etapa 4
 Definirea unei regiuni critice pentru parametrul
definit la etapa 2, asociată pragului de semnificaţie
 (adică a regiunii unde parametrul are cel puţin
probabilitatea  de a se găsi).
11
ETAPA 4
Depinzând de ipoteza alternativă, se poate alege una din

următoarele trei regiuni critice:
 Regiunea critică unilaterală la dreapta – valoarea parametrului
statistic al testului este mai mare sau egală cu valoarea din
dreapta a intervalului critic;
 Regiunea critică unilaterală la stânga – valoarea parametrului
statistic al testului este mai mică sau egală cu valoarea din
stânga a intervalului critic;
 Regiunea critică bilaterală – valoarea parametrului statistic al
testului este mai mică sau egală cu valoarea extremă din
stânga regiunii critice sau mai mare sau egală cu valoarea
extremă din dreapta regiunii critice, valorile extreme ale regiunii
critice având nivele egale de semnificaţie.
12
ETAPA 5 - DECIZIA
(FOLOSIND REGIUNEA CRITICĂ)
 Dacă parametrul statistic calculat se află în regiunea critică, atunci se

respinge ipoteza nulă H 0 , deci s e a c c e p t ă ipoteza alternativă H 1 .
Această decizie are un risc de eroare  ,  fiind riscul de prima speţă.
 Dacă parametrul statistic nu se află în regiunea critică atunci nu există

niciun motiv de a respinge ipoteza nulă H0. Acceptând-o, există un risc de
eroare, numit risc de s p e ţ a a doua notat cu .
13
ETAPA 5 - DECIZIA
(FOLOSIND VALOAREA LUI P)
 La aplicarea testelor statistice, programele de
prelucrare statistica vor afisa o probabilitate de
semnificatie a testului statistic, numita si nivel de
semnificatie observat (notat cu p).
 Stabilirea semnificaţiei testului pe baza valorii lui p se
face frecvent cu următoarea regulă empirică
(consideram nivelul ales =0,05) :
1.Dacă 0,01 <= p<0,05 , rezultate semnificative.
2. Dacă 0,001 <= p<0,01, rezultate înalt semnificative.
3. Dacă p<0,001, rezultate foarte înalt semnificative.
4. Dacă p>=0,05, rezultate nesemnificative statistic.
5.Dacă 0,05 <= p <0,1, se notează o oarecare tendinţă
spre considerarea unei semnificaţii statistice.
14
ERORI ÎN TESTAREA IPOTEZELOR STATISTICE
realitatea
H0 este falsa H0 este

adevarata
Respingem H0 Corectă! Eronată (eroare

de tipul I)
decizia
Nu respingem Eronată (eroare Corectă!
H0 de tipul al II-lea)
15
EROAREA DE TIP I ŞI NIVELUL DE
SEMNIFICAŢIE
 Probabilitatea comiterii unei erori de tip I = nivelul
de semnificaţie, α (alfa)
 Probabilitatea este determinată prin teste statistice
 Am decis că există reale diferenţe deşi acestea sunt
datorate şansei
 Decidem că un tratament este eficient pe baza unei
interpretări greşite
 Nivelul alfa (riscul maxim acceptabil) 5%  există o
şansă de 5% de a respinge incorect ipoteza nulă
 p= 0,18 ipoteza nulă nu se poate respinge
 p= 0,04 ipoteza nulă se poate respinge cu un risc
acceptabil de 4% de a comite o eroare de tipul I
16
EROAREA DE TIP II
 H 0 nu este respinsă, deşi este falsă;

 Am decis că diferenţele observate sunt datorate
şansei atunci când acestea apar datorită diferenţelor
dintre eşantioane
 Am putea abandona un tratament pe care tocmai îl
testăm sau o direcţie de cercetare
 Probabilitatea de a nu rejecta o ipoteză nulă falsă =
β, probabilitatea de a face o eroare de tipul II
 1- β = complementul lui β, puterea unui test
 Puterea = probabilitatea ca un test să respingă
ipoteza nulă sau să obţină semnificaţie statistică
17
Teste
statistice
COMPARAŢII PE DOUĂ
EŞANTIOANE
18
COMPARATII PE DOUĂ
EŞANTIOANE
Cea mai simplă comparaţie statistică este cea
între două grupuri aleator alese
Acest mod de distribuire permite
cercetătorului să presupună că diferenţele
individuale sunt egal distribuite între grupuri
la începutul experimentului şi că cele două
grupuri sunt echivalente
D.p.d.v statistic cele două grupuri sunt
eşantioane extrase din aceeaşi populaţie, deci
diferenţele dintre ele sunt rezultatul erorii de
eşantionare sau al întâmplării
19
COMPARAREA A DOUĂ MEDII
Compararea mediilor eşantioanelor pentru

determinarea statistică a diferenţelor se face
prin două caracteristici:
 Media – diferenţa mediilor între grupuri
caracterizează nivelul de separare între grupuri
 Varianţa – caracterizează variabilitatea în interiorul
grupurilor
Ambele caracteristici sunt o sursă de
variabilitate utilizabilă pentru a descrie
efectele tratamentului
29
COMPARAREA A DOUA MEDII
 Situaţia reală
 Există diferenţe între grupuri
 Există diferenţe în interiorul grupurilor
 Trebuie demonstrat dacă diferenţele observate
între mediile parametrului studiat sunt datorate
experimentului şi nu întâmplării
21
TESTUL STUDENT (T)
Subtipuri:
Testul t pentru eşantioane independente:
 Varianţe egale
 Varianţe inegale
Testul t pentru eşantioane perechi
22
Testul Student (t) de comparare a unei
medii cu o medie cunoscută (variaţii
necunoscute)
Scopul testului: investigarea semnificaţiei diferenţei dintre media unui
eşantion şi o medie standard cunoscută.
Ipoteza nulă H0: nu există diferenţă semnificativă între media eşantionului
şi media standard.
Ipoteza alternativă H1: există diferenţă semnificativă între media
eşantionului şi media standard.
Condiţii de aplicare
Testul se poate aplica atunci când variaţia 2 nu este cunoscută iar
estimarea s2 a acesteia se realizează pentru un eşantion mic (n < 30) care
respectă o distribuţie normală. Dacă această condiţie de normalitate nu
este satisfăcută atunci testul îşi pierde validitatea.
Dacă se cunoaşte variaţia populaţiei 2, şi n ≥ 30 se aplică testul Z care
este un test mult mai puternic.
Testul Student (t) de comparare a două
medii (variaţii necunoscute şi egale)
Ipoteza nulă: Diferenţa mediilor celor două populaţii este
egală cu zero.
Ipoteza alternativă pentru testul bilateral: Diferenţa mediilor
celor două populaţii este diferită de zero.
Condiţii de aplicare
Variabila de analizat în cele două populaţii este normal distribuită
şi variaţiile celor două populaţii sunt egale.
Dacă aceste condiţii nu sunt satisfăcute atunci testul îşi pierde
validitatea.
Dacă se cunoaşte variaţia populaţiei σ2, se aplică testul Z care este
un test mult mai puternic.
Testul Student (t) de comparare a mediilor a
două eşantioane perechi
Scopul testului: compararea pentru o variabilă cantitativă continuă media

ei aritmetică pentru două eşantioane perechi (observaţii ale aceleiaşi
variabile cantitative realizate pe elementele unui eşantion înainte şi după
acţiunea unui factor ).
Condiţii de aplicare: fiecărei observaţii din primul eşantion îi corespunde o

observaţie pereche din al doilea eşantion iar diferenţele dintre valorile
perechi sunt normal distribuite.
Ipoteza nulă: Media diferenţei valorilor perechi din eşantioanele perechi nu
este semnificativ diferită de zero.
Ipoteza alternativă pentru testul bilateral: Media diferenţei valorilor perechi

din eşantioanele perechi este semnificativ diferită de zero.
Vă mulţumesc!!!
33

C4 Statistica Inferentiala

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

C4 Statistica Inferentiala

Încărcat de

Drepturi de autor:

Formate disponibile

STATISTICA

 Testarea ipotezelor statistice

Formularea de noi ipoteze (modele sau teorii)

Compararea a două ipoteze sau teorii

 Indiferent cum este formulat protocolul

Prin respingerea ipotezei nule, cercetătorul

Când ipoteza nulă nu este respinsă,

 Scopul unui test statistic este de a defini

 1. Specificăm ipoteza nulă şi ipoteza alternativă.

 2. Alegem statistica adaptată situaţiei.

 Ipoteza nulă H 0 este ipoteza care trebuie testată,

 Ipoteza alternativă H 1 este acea ipoteză care într -un

Definirea unui parametru care sub ipoteza nulă H 0

Depinzând de ipoteza alternativă, se poate alege una din

 Dacă parametrul statistic calculat se află în regiunea critică, atunci se

 Dacă parametrul statistic nu se află în regiunea critică atunci nu există

H0 este falsa H0 este

Respingem H0 Corectă! Eronată (eroare

 H 0 nu este respinsă, deşi este falsă;

Compararea mediilor eşantioanelor pentru

Scopul testului: compararea pentru o variabilă cantitativă continuă media

Condiţii de aplicare: fiecărei observaţii din primul eşantion îi corespunde o

Ipoteza alternativă pentru testul bilateral: Media diferenţei valorilor perechi

S-ar putea să vă placă și