Documente Academic
Documente Profesional
Documente Cultură
7-Testarea Ipotezelor Statistice. Teste de Medie PDF
7-Testarea Ipotezelor Statistice. Teste de Medie PDF
STATISTICE
Călinici Tudor
OBIECTIVE EDUCAŢIONALE
Definirea conceptului de test statistic
1
IPOTEZE
Formularea de noi ipoteze (sau modele sau teorii)
este una dintre cele mai importante aspecte ale
cercetării ştiinţifice. Aceste ipoteze încercă să
descrie sau să explice anumite fenomene reale. In
multe cazuri există ipoteze anterioare (descrieri
sau explicaţii) pe care oamenii de ştiinţă doresc
să le înlocuiască cu altele noi
Pentru a fi valabile, ipotezele trebuie să fie
testate
POPULAŢIE - EŞANTION
Atunci cînd o investigaţie de tip statistic se efectuează pe
un eşantion, orice rezultat obţinut are o valoare relativă,
în sensul că datele respective nu numai că nu coincid cu
cele referitoare la populaţie, dar nici măcar nu se poate
afirma cu certitudine care este diferenţa dintre cele două
genuri de date, de vreme ce starea populaţiei este, de
regulă, necunoscută.
2
IPOTEZA STATISTICĂ
Prin urmare, asupra populaţiilor studiate selectiv nu se
pot emite judecăţi cu valoare de certitudine, ci se pot
exprima nişte supoziţii care poartă denumirea de ipoteze
statistice.
Testarea ipotezelor statistice înseamnă
supunerea ipotezelor unor probe, numite teste statistice,
operaţie în urma căreia ipoteza se respinge sau se
acceptă. O asemenea decizie are întotdeauna la bază
calculul intervalului de confidenţă ce corespunde unui
prag de semnificaţie ales
3
SCOPUL TESTULUI STATISTIC
Scopul testului statistic este de a dovedi că
ipoteza nulă este falsă.
Rezultatul testului
Nu putem afirma că acceptăm ipoteza nulă
O putem sau nu nega
Luarea deciziei
4
FORMULAREA PROBLEMELOR ÎN TERMENII
IPOTEZELOR STATISTICE
5
ALEGEREA PRAGULUI DE SEMNIFICAŢIE
Pragul (nivelul) de semnificaţie reprezintă
mărimea riscului de eroare pe care cercetătorul
este dispus să îl accepte, implicit să şi-l asume
(-, -Z ]
[Z , + )
(-, -Z ] [Z , + )
6
CALCULAREA PARAMETRULUI
7
CONCLUZIE
Prin respingerea ipotezei nule cercetătorul
afirmă că rezultatele observate nu sunt datorate
întâmplării = efect semnificativ
Când ipoteza nulă nu este respinsă cercetătorul
afirmă că diferenţele observate sunt datorate
întâmplării şi rezultatele nu sunt semnificative
SEMNIFICAŢIA STATISTICĂ
P – Probability
8
INTERPRETAREA VALORII P
0,01≤ p ≤ 0,05 – rezultate semnificativ statistice
0,001≤ p < 0,01 – rezultate înalt semnificativ
statistice
p<0,001 - rezultate foarte înalt semnificativ
statistice
p>0,05 – rezultate nesemnificativ statistice
9
ERORI ÎN TESTELE STATISTICE
Adevăr
H0 adevărată H0
Falsă
H0 se Eroare tip I
Corect
respinge (α)
Rezultat
H0 nu se Corect
Eroare tip II
respinge (β)
EROAREA DE TIP I
= H0 este respinsă deşi este adevărată
Am concluzionat că există reale diferenţe deşi acestea
sunt datorate şansei
Concluzionăm că un tratament este eficient pe baza
unei interpretări greşite
10
EROAREA DE TIP II
= H0 este nu este respinsă deşi este falsă
Am concluzionat că există diferenţele observate
sunt datorate şansei atunci când acestea apar
datorită diferenţelor dintre eşantioane
Am putea abandona un tratament pe care tocmai
îl testăm sau o direcţie de cercetare
“Puterea testului” = 1-probabilitatea apariţiei
unei erori de tip II
11
TEST STATISTIC – MANOPERĂ ÎN PRACTICĂ
12
TESTE PARAMETRICE
MODEL TEORETIC
Avem dovezi să afirmăm că două populații sunt
diferite din punct de vedere al unui parametru –
cantitativ
Se poate formula ipoteza ca “din punct de vedere
al respectivului parametru, populațiile sunt
diferite” sau ” în prima populație parametrul
respectiv este mai mare decât în a doua”
13
IPOTEZELE STATISTICE
Ipoteza H0 – nu există diferenţă semnificativ
statistică între cele două medii
Ipoteza alternativă test bilateral H1– cele două
medii sunt semnificativ diferite
Ipoteza alternativă test unilateral H1 – una
dintre medii este semnificativ mai mare decât
cealaltă
H 0 : A B sau H 0 : A B 0
H1 : A B sau H1 : A B 0
H1 : A B sau H1 : A B 0
H1 : A B sau H1 : A B 0
14
REGIUNE CRITICĂ
Pentru test bilateral – reuniune de intervale
(-, -Z ] [Z , + )
Teste de tip Z
Teste de tip T
15
TESTE DE TIP Z
Condiţii de aplicare
TIPURI DE TESTE Z
Comparaţia mediei unui eşantion cu media unei
populaţii
16
EXEMPLU 1
Se cunoaşte că media taliei normale a nou-
născuţilor la termen este de 51 cm. Pe un
eşantion reprezentativ de 49 nou-născuţi
prematur se observă o medie a taliei de 45 cm cu
o variaţie de eşantionare egală cu 9. Diferenţa
între cele două medii este semnificativă? Adică,
se poate afirma că prematurii se nasc cu o talie
mai mică decât nou-născuţii la termen?
REZOLVARE (1)
Ipoteza nulă H0: In ceea ce priveşte talia la
naştere nu există o diferenţă semnificativă între
talia prematurilor şi cea a nou născuţilor la
termen.
Ipoteza alternativă H1: In ceea ce priveşte talia la
naştere EXISTĂ o diferenţă semnificativă între
talia prematurilor şi cea a nou născuţilor la
termen.
17
REZOLVARE (2)
Parametrul testului este
m
U= n
REZOLVARE (3)
51 − 45 6𝑥7
𝑈= = = 4,66
9 9
49
18
CONCLUZIE
Talia prematurilor este în medie semnificativ
diferită (mai mică) decât cea a nou născuţilor la
termen. Afirmând acest lucru există o
probabilitate mai mică de 5% de a face o eroare.
EXEMPLU 2
Se doreşte să se studieze dacă există diferenţă
semnificativ statistică între nivelul seric al
magneziului la persoanele emigrate din
Republica Moldova în România. Se cunoaşte
faptul că nivelul seric al magneziului urmează
legea normală cu o variaţie de 1 mg/100ml la
persoanele din România, respectiv cu o variaţie
de 2,3/100ml la persoanele din Moldova.
Nivelul mediu al magneziului seric, obţinut la un
eşantion de 120 de persoane din România a fost 2
mg/100 ml în timp ce la măsurătorile pe un grup
de 80 de persoane emigrate din Republica
Moldova a rezultat un nivel mediu de
2,5mg/100ml
19
REZOLVARE (1)
Ipoteza nulă H0: In ceea ce priveşte nivelul seric
al magneziului la persoanele emigrate din
Republica Moldova în România nu există
diferenţă semnificativ statistică faţă de
persoanele născute în România
Ipoteza alternativă H1: In ceea ce priveşte nivelul
seric al magneziului la persoanele emigrate din
Republica Moldova în România EXISTĂ
diferenţă semnificativ statistică faţă de
persoanele născute în România
REZOLVARE (2)
În acest caz parametrul este
𝑋1 − 𝑋2
𝑍=
𝜎 21 𝜎 2 2
𝑛1 + 𝑛2
Alegem pragul de semnificaţie α = 0,05, regiunea critică va
fi (-, -1,96] [1,96, + )
20
REZOLVARE (3)
Utilizând datele de cercetare obţinem
2 − 2,5
𝑍= = −2,59
1 2,3
120 + 80
-2,59 <-1,96 deci Z aparţine regiunii critice, deci
ipoteza nulă H0 se poate respinge cu un risc de
eroare de speţa I < 0,05
CONCLUZIE
In ceea ce priveşte nivelul seric al magneziului la
persoanele emigrate din Republica Moldova în
România EXISTĂ diferenţă semnificativ
statistică faţă de persoanele născute în România
21