Documente Academic
Documente Profesional
Documente Cultură
2016-C6-Teste Statistice PDF
2016-C6-Teste Statistice PDF
STATISTICE 1
NOTIUNI
2
INTRODUCERE
3
METODE PENTRU TESTAREA
IPOTEZELOR
4
METODE PENTRU TESTAREA
IPOTEZELOR
Indiferent cum este formulat protocolul
experimentului, scopul cercettorului este de a
testa ipoteza nul (de cele mai multe ori pentru a o
respinge)
Ipoteza nul nu trebuie probat, ci anulat
Inferen negativ
5
METODE PENTRU TESTAREA
IPOTEZELOR
Prin respingerea ipotezei nule, cercettorul afirm
c rezultatele observate nu sunt datorate
ntmplrii (efect semnificativ)
Cnd ipoteza nul nu este rejectat, cercettorul
afirm c diferenele observate sunt datorate
ntmplrii i rezultatele nu sunt semnificative.
6
TESTE STATISTICE
7
SCENARIU
8
ETAPELE UNUI TEST STATISTIC
Pasul 1: Specificm ipoteza nul i ipoteza
alternativ.
Pasul 2: Alegem statistica adaptat situaiei .
Pasul 3: Alegem nivelul de semnificaie i pe baza sa
calculm pragul de separare (ntre valorile
acceptabile i cele considerate ca
inacceptabile).
Pasul 4: Calculm valoarea statisticii, folosind datele
din eantion (ales aleator).
Pasul 5: Decidem, prin compararea valorii calculate
cu pragul dat de nivelul de semnificaie, dac
respingem sau nu ipoteza nul.
9
ETAPELE UNUI TEST STATISTIC 1
(IPOTEZELE STATISTICE)
10
ETAPELE UNUI TEST STATISTIC -1 EXEMPLU
Ipoteza nul
H0: A = B (A - B = 0)
Media valorilor unei variabile cantitative n
populaia A nu este diferit de media
valorilor n populaia B;
Ipoteza alternativ
H1: A B (A - B 0)
Media valorilor n populaia A este diferit de
media valorilor n populaia B.
11
ETAPELE UNUI TEST STATISTIC -1
EXEMPLU
Ipotezele anterioare stipulau diferena fr a
o enuna: ipoteze non-direcionale
12
REGIUNEA CRITICA
Reject Ho Reject Ho
Accept Ho
1
Critical value Critical value
Reject Ho
Accept Ho
1
Critical value
Reject Ho
Accept Ho
1
Critical value
13
ETAPELE UNUI TEST STATISTIC 2
(DEFINIREA PARAMETRULUI STATISTIC)
15
ETAPELE UNUI TEST STATISTIC 2
(DEFINIREA PARAMETRULUI STATISTIC)
16
ETAPELE UNUI TEST STATISTIC 4
17
ETAPELE UNUI TEST STATISTIC 5
DECIZIA (FOLOSIND REGIUNEA CRITIC)
18
ETAPELE UNUI TEST STATISTIC 5
DECIZIA (FOLOSIND VALOAREA LUI P)
La aplicarea testelor statistice programele de
prelucrare statistica vor afisa o probabilitate de
semnificatie a testului statistic, numita si nivel de
semnificatie observat (notat cu p).
Stabilirea semnificaiei testului pe baza valorii lui p se
face frecvent cu urmtoarea regul empiric
(consideram nivelul ales =0,05) :
1. Dac 0,01 <= p<0,05 , rezultate semnificative.
2. Dac 0,001 <= p<0,01, rezultate nalt semnificative.
3. Dac p<0,001, rezultate foarte nalt semnificative.
4. Dac p>=0,05, rezultate nesemnificative statistic.
5. Dac 0,05 <= p<0,1, se noteaz o oarecare tendin
spre considerarea unei semnificaii statistice.
19
ERORI N TESTAREA IPOTEZELOR
STATISTICE
realitatea
Nu respingem
H0 Eronat (eroare
Corect!
de tipul al II-lea)
21
EROAREA DE TIP I I NIVELUL DE
SEMNIFICAIE
Probabilitatea comiterii unei erori de tip I = nivelul
de semnificaie, (alfa)
Probabilitatea este determinat prin teste statistice
Am concluzionat c exist reale diferene dei
acestea sunt datorate ansei
Concluzionm c un tratament este eficient pe
baza unei interpretri greite
Nivelul alfa (riscul maxim acceptabil) 5% exist o
ans de 5% de a respinge incorect ipoteza nul
exemple:
p= 0,18 ipoteza nul nu se poate respinge
p= 0,04 ipoteza nul se poate respinge cu un risc
acceptabil de 4% de a comite o eroare de tipul I
22
H0 este falsa H0 este adevarata
Eronat (eroare
EROAREA DE TIP II Respingem H0
Corect!
de tipul I)
Nu respingem H0 Eronat (eroare
Corect!
de tipul al II-lea)
23
CE DETERMIN PUTEREA UNUI TEST?
Criteriul de semnificaie
Variana
Dimensiunea eantionului
Dimensiunea efectului
24
24
REGIUNEA CRITIC
= regiunea de respingere, aria mrginit
de Z=1,96
25
STATISTICI PARAMETRICE I NON-
PARAMETRICE
26
TESTE STATISTICE
COMPARATII PE DOUA ESANTIOANE 27
COMPARAREA A DOU MEDII
Compararea mediilor eantioanelor pentru
determinarea statistic a diferenelor se face
prin dou caracteristici:
Media diferena mediilor ntre grupuri
caracterizeaz nivelul de separare ntre grupuri
Variana caracterizeaz variabilitatea n interiorul
grupurilor
28
TESTUL STUDENT (T)
Subtipuri:
Testul t pentru eantioane independente:
Variane egale
Variane inegale
Testul t pentru eantioane perechi
Dac eantioanele nu au o distribuie normal,
atunci se vor folosi teste neparametrice (Mann-
Whitney)
29
TESTUL T PENTRU EANTIOANE
INDEPENDENTE
30
TESTUL T PENTRU EANTIOANE
PERECHE
Se folosete n protocoale de cercetare care
implic msurtori repetate asupra acelorai
indivizi sau asupra unor indivizi cu
caracteristici asemntoare (chiar gemeni)
Datele sunt considerate mperecheate
deoarece pentru fiecare valoare exist o
valoare pereche
Testul evalueaz scorul de diferen din
cadrul fiecrei perechi astfel nct subiecii
sunt comparai numai cu ei nii sau cu
perechea lor
31
COMPARAII PE MAI
MULTE EANTIOANE
ANALIZA DE VARIAN ANOVA
Este utilizat atunci cnd trebuiesc comparate 3 sau
mai multe eantioane independente.
Ipoteza statistic:
H0: 1 = 2 = 3 ... = n
L C ( f 0 f t )2
2 i t i
i1 f
i
TESTUL HI PTRAT
Servete la compararea a dou distribuii,
urmnd dou modele, care constau n:
compararea unei distribuii observate (sau empirice)
pe un eantion cu o distribuie teoretic. In acest caz,
se caut s se determine dac un eantion se
aseamn cu un anumit model teoretic, fiind astfel
vorba de un test Hi-ptrat de ajustare.
compararea a dou distribuii observate n scopul
stabilirii fie a independenei dintre dou criterii sau
omogenitatea dintr-un tabel de contingen. Este
vorba n acest caz de un test Hi-ptrat de
omogenitate sau de independen.
TESTUL HI PTRAT - PASI
T
Tabelul de contingen observat (cu frecvenele observate)
CALCULUL TABELULUI DE CONTINGEN
TEORETIC
Trebuie s completm un tabel de contingen teoretic
(numit i tabel de contingen calculat)
Ipoteza de independen dintre cele dou caractere M i
F permite s se calculeze probabilitile:
Pr(M F) = Pr(M) Pr(F), unde
- Pr(M F) este probabilitatea de a avea simultan
caracterele M i F
- Pr(M) este probabilitatea de a avea caracterul M
- Pr(F) este probabilitatea de a avea caracterul F.
EXEMPLU-CONTINUARE
Estimri ale acestor probabiliti se obin astfel:
Numarul de indivizi avind M 160
Pr(M) = Numarul total de indivizi
400 i analog,
130
Pr(F) = ,
400
Numaruldeindiviziavind M siF F ( F , M )
Pr(MF) = ,
Numarultotal deindivizi 400
parametrului fi = + + +
n 78 108
- Se calculeaz (190 162) 2
( f i0 f it ) 2
LC + =37.2
X
2 162
i 1 f it
Etapa 6. Dac X 2 [3.84, ) se X2 >> 3.84 aa c ipoteza nul
Decizia respinge H 0 cu un risc de H0 se respinge cu un risc
eroare de prima spet . inferior lui 5%.
Dac X 2 [3.84, ) atunci In concluzie, fumatul are
H0 nu se respinge, influen asupra maladiei M
acceptndu-se H 0 cu un risc favoriznd-o.
de eroare de spea a doua
OBSERVAII