Documente Academic
Documente Profesional
Documente Cultură
statistice
Structura curs 2
2
Ipoteza statistică.Concepte
Testarea ipotezelor statistice reprezintă o altă modalitate,
alături de estimaţia pe interval de încredere, de a realiza
inferenţa statistică.
Scopul acestui tip de inferenţă este să determinăm dacă există
suficiente dovezi statistice care să ne permită să concluzionăm
că o afirmaţie (sau o ipoteză) despre un parametru este
adevărată.
În urma prelevării unui eşantion dintr-o populaţie statistică,
prin prelucrarea datelor provenite din sondaj se obţine un
estimator (estimație) al parametrului urmărit în populaţia de
origine.
Estimatorul reprezintă valoarea indicatorului din esantionul
probabilistic care aproximeaza parametrul ce caracterizeaza
populatia de referinta, cea din care s-a extras esantionul
Despre parametru se crede ca este egal cu o valoare
revendicate sau valoare initiala sau valoare admisa, deci
apare o ipoteză statistică. Se verifica acest lucru cu ajutorul
datelor de sondaj
Indicatorii utilizați în testare-Notaţii,
Mod de Calcul (n≤30 observatii)
INDICATORUL COLECTIVITATEA COLECTIVITATEA DE
GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n
MEDIA x i x
i 1
i
i 1 x
N n
x x
N n
xi 2 2
DISPERSIA i
(VARIANŢA) 2 i 1
s2 i 1
N n 1
ABATEREA MEDIE N
x x
n
xi
2 2
PĂTRATICĂ i
(ABATEREA
2 i 1
s s2 i 1
STANDARD) N n 1
4
Ipoteza statistica.Definiție
Definiție = “presupunerea” care se face cu privire la
parametrul unei repartiții sau a legii de repartiție pe care o
urmează anumite variabile aleatoare.
Există două ipoteze statistice:
ipoteza nulă este ipoteza care urmează a fi testată și
este notată cu H0. Aceasta reprezintă situația initiala,
starea initiala si presupune ca sunt asemanari intre
valorile comparate (cea revendicata sau admisa sau
initiala, pentru parametru populatiei cu cea rezultata
din sondaj) sau pot exista eventuale deosebiri care au
un caracter intamplator;
ipoteza alternativă reprezinta o situatie a parametrului
populatiei ulterioara celei nule si se noteaza cu H 1.
Este gresit sa consideram ca ipoteza alternativa este
negarea celei nule.
Ipoteza statistică.Concepte
Procedeul de verificare a unei ipoteze statistice se numeşte test sau
criteriu de semnificaţie.
Există cinci componente principale ce se precizează in testarea unei ipoteze
statistice:
• ipoteza nulă-ea specifica intotdeauna o singura valoare a
parametrului populatiei si reprezinta status-quo-ul ,ceea ce este
acceptat pana se dovedeste ca poate fi respinsa pe baza dovezilor de
sondaj;
• ipoteza alternativă-ea este validata de catre decident doar cand
exista suficiente dovezi,evidente, pentru a respinge ipoteza nula;
• statistica testului; formula de calcul = (valoare de sondaj – valoare
revendicata sau admisa)/eroarea standard
• nivelul de semnificatie; riscul ales, maxim acceptat pentru a gresi si
a respinge in mod gresit ipoteza nula atunci cand in realitate este
adevarata
• regiunea critică (de respingere a ipotezei nule).
6
Statistica testului este utilizata drept criteriu de respingere sau nu a
ipotezei nule
Ipoteza statistică.Concepte
Regiunea critică Rc (de respingere a lui H0) = reprezintă valorile
numerice ale statisticii testului pentru care ipoteza nulă va fi respinsă, cu
probabilitatea 1 - α
Dacă valoarea calculata a testului cade în regiunea critică Rc, ipoteza H0
se respinge, iar dacă valoarea calculata a testului cade în afara regiunii
critice Rc, ipoteza H0 nu se poate respinge (sau nu avem motive, dovezi
sa o respingem).
Zona de nerespingere = a unei ipoteze statistice denumita si interval de
încredere reprezinta acel interval in care pe baza aplicarii unui test
statistic se accepta ipoteza nula careia i se asocieaza o probabilitate (1-
α).
Eroare de genul întâi = eroarea pe care o facem eliminând ipoteză
nulă, deşi este adevărată in realitate
Riscul de gradul întâi (α) reprezinta probabilitatea comiterii unei erori
de genul întâi si se numeşte nivel de semnificaţie.
Eroare de tip II =eroarea pe care o facem acceptand ipoteza nula, desi
este falsa in realitate. Probabilitatea (riscul) comiterii unei astfel de erori
se noteaza cu β.Puterea testului statistic este 1-β.
Etapele procesului de testare
1. Se identifică cele doua ipoteze : cea nulă H0 si cea alternativă H1
2. Identificarea statisticii testului si a repartitiei acestuia in raport cu
presupunerile care se fac despre populația ce este eșantionată pentru a
respinge sau nu ipoteza nula.
3.Se stabileste nivelul de semnificatie (α) al testului.
test bilateral:
H0 : μ = μ 0
H1: μ ≠ μ0 (μ < μ0 si μ > μ0)
test unilateral dreapta:
H0 : μ = μ 0
H1 : μ > μ 0
9
Formularea ipotezelor statistice
H 0 : 0
pentru testul unilateral stânga
H1 : 0
Pentru eşantioane de volum mic , testul
statistic utilizat este:
Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum redus
Exemplu_1
Conducerea unei companii apelează la 5 experţi
pentru a previziona profitul companiei în anul
curent. Valorile previzionate sunt 2,6; 3,32; 1,80;
3,43; 2,00 (miliarde lei). Ştiind că în anul anterior
profitul a fost de 2,01 miliarde lei, se poate
concluziona cu o probabilitate de 95% că media
previziunilor experţilor este semnificativ mai
mare decât cifra anului anterior ?
Rezolvare
n = 5 experţi
xi - valorile profitului companiei previzionate
2,6; 3,32; 1,80; 3,43; 2,00 (miliarde lei).
o 2,01 mld lei profitul anului anterior
(1 )100 95% probabilitatea de 95%
Etapa 1:
H 0 : o sau 2,01 Profitul previzionat de
experti in anul curent este egal cu valoarea profitului
din anul anterior
H1 : o sau 2,01 Profitul previzionat de
experti in anul curent este semnificativ mai mare decat
valoarea profitului din anul anterior
Etapa 2 - tipul testului: deoarece n 30 , utilizăm
testul ”t” (test ”t” unilateral dreapta) şi se începe
construirea graficului
2. Testarea ipotezelor statistice (testul Student)
16
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
Etapa 4: se stabileşte :
”t” critic : t ,n 1 t 0,05,51 2,132 , iar valorile se
trec pe grafic
Regiunea de respingere (critică): dacă Rc : t t ,n 1
atunci ipoteza nulă H 0 se respinge in favoarea lui
H1
care se valideaza in 95% din cazuri
2. Testarea ipotezelor statistice (testul Student)
17
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
s x2
(x i x) 2
2,203
0,5507 sx s x2 0,74
n 1 4
x 0 x 0 2,63 2,01
t 1,874
sx sx / n 0,74 5
1- α
0,95
α
Regiune de H0 se respinge
nonrespingere H1 se validează
0,025 în 95% cazuri
-∞ µ=0 ∞
Compararea mediilor
dintre două eşantioane de volum redus
i
( x x1 ) 2
i
( x x 2 ) 2
S c2 i 1 i 1
n1 n 2 2
sau
( n 1) S 2
( n 1) S 2
S c2 1 x1 2 x2
n1 n2 2
( x1 x 2 ) D ( x1 x 2 ) D n1 n 2 n1 n2 2
t
2 1 1 S x21 n1 1 S x22 n2 1 n1 n2
S c
n1 n2
Rc : t t ,n1 n2 2
pentru testul unilateral dreapta
Rc : t t ,n1 n2 2
pentru testul unilateral stânga
D =diferența ipotetică dintre mediile populațiilor, deseori egală cu 0.
4. Testarea ipotezelor statistice privind eşantioanele de volum mic 23
Compararea mediilor
dintre două eşantioane de volum redus
H 0 : ( 1 2 ) D H 0 : 1 2
Test unilateral dreapta
H1 : ( 1 2 ) D H 1 : 1 2
H 0 : ( 1 2 ) D H 0 : 1 2
Test unilateral stânga
H1 : ( 1 2 ) D H 1 : 1 2
S c2
8 10,485 2 12 10,635 2
0,3379
8 12 2
t
5,696 5,273 0
0,423
1,594
1 1 0,2653
0,3379
8 12
1- α
0,90