Sunteți pe pagina 1din 21

TESTAREA IPOTEZELOR

STATISTICE
Călinici Tudor

OBIECTIVE EDUCAŢIONALE
 Definirea conceptului de test statistic

 Prezentarea etapelor unui test statistic

 Prezentarea şi exemplificarea testelor de tip Z


pentru comparația mediilor

 Prezentarea și exemplificarea testelor de tip T


pentru comparația mediilor

1
IPOTEZE
 Formularea de noi ipoteze (sau modele sau teorii)
este una dintre cele mai importante aspecte ale
cercetării ştiinţifice. Aceste ipoteze încercă să
descrie sau să explice anumite fenomene reale. In
multe cazuri există ipoteze anterioare (descrieri
sau explicaţii) pe care oamenii de ştiinţă doresc
să le înlocuiască cu altele noi
 Pentru a fi valabile, ipotezele trebuie să fie
testate

POPULAŢIE - EŞANTION
 Atunci cînd o investigaţie de tip statistic se efectuează pe
un eşantion, orice rezultat obţinut are o valoare relativă,
în sensul că datele respective nu numai că nu coincid cu
cele referitoare la populaţie, dar nici măcar nu se poate
afirma cu certitudine care este diferenţa dintre cele două
genuri de date, de vreme ce starea populaţiei este, de
regulă, necunoscută.

2
IPOTEZA STATISTICĂ
 Prin urmare, asupra populaţiilor studiate selectiv nu se
pot emite judecăţi cu valoare de certitudine, ci se pot
exprima nişte supoziţii care poartă denumirea de ipoteze
statistice.
 Testarea ipotezelor statistice înseamnă
supunerea ipotezelor unor probe, numite teste statistice,
operaţie în urma căreia ipoteza se respinge sau se
acceptă. O asemenea decizie are întotdeauna la bază
calculul intervalului de confidenţă ce corespunde unui
prag de semnificaţie ales

TEST STATISTIC - CONCEPT


 Testarea unei ipoteze statistice se face prin
compararea a două ipoteze concurente:
 Ipoteza nulă – modelul pe care cercetătorul doreşte
să îl înlocuiască
 Ipoteza alternativă – noul model, menit să
înlocuiască ipoteza nulă

 Exemplu de ipoteză statistică: Populaţia X este


diferită de populaţia Y din punct de vedere al ...

3
SCOPUL TESTULUI STATISTIC
 Scopul testului statistic este de a dovedi că
ipoteza nulă este falsă.

 Rezultatul testului
 Nu putem afirma că acceptăm ipoteza nulă
 O putem sau nu nega

ETAPELE UNUI TEST STATISTIC


 Definirea ipotezelor
 Alegerea unui parametru

 Alegerea unui prag de semnificaţie

 Alegerea unei regiuni critice

 Calcularea valorii observate a parametrului

 Luarea deciziei

4
FORMULAREA PROBLEMELOR ÎN TERMENII
IPOTEZELOR STATISTICE

 Definirea ipotezei nule – testul se desfăşoară sub


prezumţia că ipoteza nulă ar fi adevărată

 Definirea diferenţei alternative - numită şi ipoteză de


lucru – contrazice ipoteza nulă

ALEGEREA PARAMETRULUI STATISTIC AL


TESTULUI

 Parametrul statistic al testului exprimă într-o


anumită formă diferenţa dintre elementele
comparate.

 Conceptual, parametrul testului este o variabilă


aleatoare de selecţie care urmează o anumită
lege de probabilitate

 Este specific fiecărui test statistic în parte

5
ALEGEREA PRAGULUI DE SEMNIFICAŢIE
 Pragul (nivelul) de semnificaţie reprezintă
mărimea riscului de eroare pe care cercetătorul
este dispus să îl accepte, implicit să şi-l asume

 De obicei se alege un nivel de semnificaţie între 1


şi 5%

ALEGEREA REGIUNII CRITICE


 Regiunea critică este un interval sau o reuniune
de intervale care specific atât de testului statistic
cât şi de nivelul de semnificaţie ales

 (-, -Z ]
 [Z , + )

 (-, -Z ]  [Z , + )

 Constanta Z  se obţine din tabelele teoretice


(cunoscute)

6
CALCULAREA PARAMETRULUI

 Se calculează valoarea parametrului definit anterior


pe baza datelor de cercetare

LUAREA DECIZIEI CU AJUTORUL REGIUNII


CRITICE

 H0 este respinsă dacă valoarea parametrului aparţine


regiunii critice. În acest caz ipoteza alternativă va fi
acceptată, cu un risc de eroare <α – risc de primă speţă
 Dacă valoarea parametrului este în afara regiunii
critice atunci ipoteza nulă nu poate fi respinsă, cu un
risc de eroare de speţă a doua de valoare β

7
CONCLUZIE
 Prin respingerea ipotezei nule cercetătorul
afirmă că rezultatele observate nu sunt datorate
întâmplării = efect semnificativ
 Când ipoteza nulă nu este respinsă cercetătorul
afirmă că diferenţele observate sunt datorate
întâmplării şi rezultatele nu sunt semnificative

SEMNIFICAŢIA STATISTICĂ
 P – Probability

 Nivelul minim de semnificaţie - teoretic - pentru


care se poate respinge ipoteza nulă

 Este specific aplicării testelor cu ajutorul


software-ului statistic

 P nu reprezintă probabilitatea ca ipoteza nulă să


fie adevărată!

8
INTERPRETAREA VALORII P
 0,01≤ p ≤ 0,05 – rezultate semnificativ statistice
 0,001≤ p < 0,01 – rezultate înalt semnificativ
statistice
 p<0,001 - rezultate foarte înalt semnificativ
statistice
 p>0,05 – rezultate nesemnificativ statistice

 0,05< p ≤ 0,1 – tendinţă către semnificaţie


statistică

CONCLUZIE TEST STATISTIC ÎN FUNCŢIE


DE SEMNIFICAŢIA STATISTICĂ

 Ipoteza nulă poate fi negată dacă rezultatul testului


are cel puţin semnificaţie statistică

 Dacă rezultatul testului nu are cel puţin semnificaţie


statistică, ipoteza nulă nu poate fi negată

9
ERORI ÎN TESTELE STATISTICE

Adevăr

H0 adevărată H0
Falsă

H0 se Eroare tip I
Corect
respinge (α)
Rezultat
H0 nu se Corect
Eroare tip II
respinge (β)

EROAREA DE TIP I
 = H0 este respinsă deşi este adevărată
 Am concluzionat că există reale diferenţe deşi acestea
sunt datorate şansei
 Concluzionăm că un tratament este eficient pe baza
unei interpretări greşite

10
EROAREA DE TIP II
 = H0 este nu este respinsă deşi este falsă
 Am concluzionat că există diferenţele observate
sunt datorate şansei atunci când acestea apar
datorită diferenţelor dintre eşantioane
 Am putea abandona un tratament pe care tocmai
îl testăm sau o direcţie de cercetare
 “Puterea testului” = 1-probabilitatea apariţiei
unei erori de tip II

TEST STATISTIC – MANOPERĂ TEORETICĂ


 Ca realizare, un test statistic constă în calcularea
unei valori specifice testului (notată cu z, t, F, chi2 etc)
cu ajutorul datelor de cercetare, valoare ce se compară
apoi cu valorile „critice", aflate într-un tabel (valori
cunoscute), şi se decide dacă ipoteza nulă se respinge
sau nu.

11
TEST STATISTIC – MANOPERĂ ÎN PRACTICĂ

 Se utilizează un software statistic, se alege testul


statistic corespunzător şi se interpretează rezultatul

TESTE STATISTICE - CLASIFICĂRI


 Parametrice – de semnificaţie
 Pentru indicatori ai caracteristicilor cantitative –
medie, variaţie, coeficient de corelaţie, abatere
standard, etc.
 Neparametrice – de concordanţă
 Pentru caracteristici calitative – distribuţii de
frecvenţe, coeficienţi de asociere

12
TESTE PARAMETRICE

 Variabile cantitative – comparaţii de medii

 Conceptul de comparaţie este diferit în funcţie de


domeniul de aplicare

 Test unilateral, test bilateral

MODEL TEORETIC
 Avem dovezi să afirmăm că două populații sunt
diferite din punct de vedere al unui parametru –
cantitativ
 Se poate formula ipoteza ca “din punct de vedere
al respectivului parametru, populațiile sunt
diferite” sau ” în prima populație parametrul
respectiv este mai mare decât în a doua”

13
IPOTEZELE STATISTICE
 Ipoteza H0 – nu există diferenţă semnificativ
statistică între cele două medii
 Ipoteza alternativă test bilateral H1– cele două
medii sunt semnificativ diferite
 Ipoteza alternativă test unilateral H1 – una
dintre medii este semnificativ mai mare decât
cealaltă

IPOTEZE STATISTICE – FORMULARE


MATEMATICĂ

H 0 :  A  B sau H 0 :  A  B  0

H1 :  A  B sau H1 :  A  B  0

H1 :  A  B sau H1 :  A  B  0

H1 :  A  B sau H1 :  A  B  0

14
REGIUNE CRITICĂ
 Pentru test bilateral – reuniune de intervale
(-, -Z ]  [Z , + )

 Pentru testul unilateral


(-, -Z ] sau [Z , + ) – în funcţie de direcţia de
comparaţie

CATEGORII TESTE PARAMETRICE

 Teste de tip Z

 Teste de tip T

15
TESTE DE TIP Z
 Condiţii de aplicare

 Populaţie normal distribuită


 Variaţia în populaţie este cunoscută, sau cel puţin
poate fi estimată
 Eşantioane mari – mai mari de 30 de persoane

TIPURI DE TESTE Z
 Comparaţia mediei unui eşantion cu media unei
populaţii

 Comparaţia mediilor a două populaţii

16
EXEMPLU 1
 Se cunoaşte că media taliei normale a nou-
născuţilor la termen este de 51 cm. Pe un
eşantion reprezentativ de 49 nou-născuţi
prematur se observă o medie a taliei de 45 cm cu
o variaţie de eşantionare egală cu 9. Diferenţa
între cele două medii este semnificativă? Adică,
se poate afirma că prematurii se nasc cu o talie
mai mică decât nou-născuţii la termen?

REZOLVARE (1)
 Ipoteza nulă H0: In ceea ce priveşte talia la
naştere nu există o diferenţă semnificativă între
talia prematurilor şi cea a nou născuţilor la
termen.
 Ipoteza alternativă H1: In ceea ce priveşte talia la
naştere EXISTĂ o diferenţă semnificativă între
talia prematurilor şi cea a nou născuţilor la
termen.

17
REZOLVARE (2)
 Parametrul testului este
 m
U=  n

Alegem pragul de semnificaţie α = 0,05, regiunea


critică va fi (-, -1,96]  [1,96, + )

REZOLVARE (3)

 Pentru datele de cercetare parametrul U are valoarea

51 − 45 6𝑥7
𝑈= = = 4,66
9 9
49

 4,66>1,96, deci U aparţine regiunii critice, deci ipoteza


nulă H0 se poate respinge cu un risc de eroare de speţa
I < 0,05

18
CONCLUZIE
 Talia prematurilor este în medie semnificativ
diferită (mai mică) decât cea a nou născuţilor la
termen. Afirmând acest lucru există o
probabilitate mai mică de 5% de a face o eroare.

EXEMPLU 2
 Se doreşte să se studieze dacă există diferenţă
semnificativ statistică între nivelul seric al
magneziului la persoanele emigrate din
Republica Moldova în România. Se cunoaşte
faptul că nivelul seric al magneziului urmează
legea normală cu o variaţie de 1 mg/100ml la
persoanele din România, respectiv cu o variaţie
de 2,3/100ml la persoanele din Moldova.
 Nivelul mediu al magneziului seric, obţinut la un
eşantion de 120 de persoane din România a fost 2
mg/100 ml în timp ce la măsurătorile pe un grup
de 80 de persoane emigrate din Republica
Moldova a rezultat un nivel mediu de
2,5mg/100ml

19
REZOLVARE (1)
 Ipoteza nulă H0: In ceea ce priveşte nivelul seric
al magneziului la persoanele emigrate din
Republica Moldova în România nu există
diferenţă semnificativ statistică faţă de
persoanele născute în România
 Ipoteza alternativă H1: In ceea ce priveşte nivelul
seric al magneziului la persoanele emigrate din
Republica Moldova în România EXISTĂ
diferenţă semnificativ statistică faţă de
persoanele născute în România

REZOLVARE (2)
 În acest caz parametrul este

𝑋1 − 𝑋2
𝑍=
𝜎 21 𝜎 2 2
𝑛1 + 𝑛2
Alegem pragul de semnificaţie α = 0,05, regiunea critică va
fi (-, -1,96]  [1,96, + )

20
REZOLVARE (3)
 Utilizând datele de cercetare obţinem

2 − 2,5
𝑍= = −2,59
1 2,3
120 + 80
-2,59 <-1,96 deci Z aparţine regiunii critice, deci
ipoteza nulă H0 se poate respinge cu un risc de
eroare de speţa I < 0,05

CONCLUZIE
 In ceea ce priveşte nivelul seric al magneziului la
persoanele emigrate din Republica Moldova în
România EXISTĂ diferenţă semnificativ
statistică faţă de persoanele născute în România

21

S-ar putea să vă placă și