Sunteți pe pagina 1din 30

MATEMATICI SPECIALE I E

si
I C
i le
CURSUL 15 e ri
. I.s
.T
. T
a E
t ate
u l
TESTE DE VERIFICARE F a c A
l e
IPOTEZELOR e c i a STATISTICE
s p
tic
i (continuare)
a
a tem
e M
l d
rs u
Cu
Testarea ipotezelor privind mediile a două populații I E
si
statistice diferite I C
i l e
e ri
a) Cazul eșantioanelor de volum mare .I. s
. T
Multe probleme de analiză statistică . T cer compararea
a E
mediilor a două colectivităţi diferite. a t e Dacă notăm cu μ1
u lt
media teoretică a primei populații, a c iar cu μ2 media
F
teoretică a celei de a doua i a l e populații, atunci un
estimator al diferenţei c
e μ1 - μ2, dintre acestea, ar putea fi
s p
i
diferenţa x1  x 2atdintre ic mediile a două eșantioane: câte
unul din fiecare t e m populație.
a
e M
l d
r su
Cu
Pentru eşantioanele de volum mare (n1 > 30 şi n2i I>E
s
30) distribuția diferenţei de eşantionare ( x1  x 2 )I Ceste
aproximativ normală. Din acest motiv i l e
e ri
s
1) media distribuţiei de eşantionare a .lui I ( x1  x 2 )
.
. T
este (μ1 – μ2); E . T
2) dacă cele două eşantioaneasunt t a
e independente,
l t
atunci abaterea medie pătratică a c a distribuţiei de
u
eşantionare va avea forma e F
i a l
e c
s p
i c i  2
 2
t
ma   x1  x 2 
 x1
 x2
,
ate n1 n2
e M
l d
r su
Cu
unde  x21 şi  x22 sunt dispersiile celor două populaţiisi I E
eşantionate, iar n1 şi n2 sunt volumele eşantioanelor I C
i l e
respective. e ri
. s
Daca notăm cu D diferența ipoteticăTdintre .I mediile
T .
teoretice ale celor două populații statistice E . studiate,
atunci pentru testul bilateral ipotezele t e a de lucru au
l t a
forma c u
F a
a l e
i
Hp0e:c (μ1- μ2) = D,
i s
ti c
a
Ha: (μ1- μte2)m≠ D, ((μ1- μ2) > D, sau (μ1- μ2) < D),
a
e M
ld
testul ustatistic are expresia
r s
Cu
I E
si
z
 x 1 
 x2  D
, i le I C
ri
  x x  .s
e
1 2
. I
T .
. T
E
iar regiunea critică este descrisăatde ea relațiile
u lt
a c
Rc : z < - z α/2 e ,F sau z > z α/2;
i a l
e c
s p
pentru testul unilateral i c i dreapta ipotezele de lucru au
a t
forma e m
a t
e M
l d H 0 : (μ 1 - μ 2 ) = D,
r su
Cu
Ha: (μ1- μ2) > D, I E
si
I C
testul statistic are expresia i le
e ri
. I.s

z
 
x 1  x 2  DE.T.
T
a ,
  x  xlt2a t e
1u
a c
e F
i a l
iar regiunea critică este p e descrisă de relațiile
c
i s
ti c
ma Rc : z > z α ;
at e
e M
l d
r su
Cu
pentru testul unilateral stânga ipotezele de lucru aui I E
s
forma I C
i l e
e ri
H0: (μ1- μ2) = D, . s
. I
. T
. T
E
Ha: (μ1- μ2) <teD, a
l t a
c u
testul statistic are expresia F a
l e
c ia
e
 
p
s x x D
i c i 2
a t z
1
,
m   x  x2 
ate
e M 1

l d
r s u
Cu
iar regiunea critic este descrisă de relațiile I E
si
I C
Rc : z < - z α. e i l
e ri
. s
. I
Observație: Dacă volumele ambelor.Teșantioane .T
E
folosite în cadrul testului sunt mai t e a mari decât 30,
a
atunci înlocuirea parametrilor c u  x1 și  x2 cu sx1 ,
l t
F a
respectiv sx , adică folosirea a l e statisticii
2
c i
p e
i s

t e
a t
m z
i c
 x 1
 
x 2 D
,
a 2 2
e M s s
u l d x1
 x2

r s n1 n2
Cu
I E
si
nu va afecta în mod apreciabil nivelul de semnificație I C
al testului original. i l e
e ri
Acest lucru este deosebit de important . s
atunci când
. I
nu se cunosc dispersiile teoretice  x21 .Tşi.T x22 ale
a E
populațiilor studiate. a t e
u lt
a c
b) Cazul eșantioanelor de e Fvolum redus
i a l
e c
Atunci când, pentru i s p testarea ipotezelor privind
ti c
diferența dintre amediile a două populații statistice
e m
diferite, dorim
a să folosim eşantioane de volum redus,
t
va trebuidesăM construim, ca şi în penultimul paragraf, o
u l
r s
Cu
statistică Student, t. Pentru aceasta va trebui însă săi I E
s
presupunem că: I C
1) ambele colectivităţi din care s-au extras i l e
e ri
eşantioanele sunt normal, . s
. I
sau aproximativ normal, distribuite; .T.T
E
2) dispersiile în cele două colectivităţi t e a studiate sunt
l t a
egale; c u
3) eşantioanele de sondaj F a sunt selectate independent
a l e
unul de celălalt. c i
p e
În cazul în care i s
presupunem că cele două
ti c
colectivităţi studiate ma au dispersiile teoretice egale
t e2
( 1   2 M ), un estimator al dispersiei
2 2 a
d e
u l
r s
Cu
(variabilităţii) totale a celor două populaţii combinate I E
si
poate fi I C
i l e
e ri
2s
   
n1 n2
.
 xi  x1   xi .Tx2 I
2
.
. T
sc 
2 i 1 i 1
a E .
n1  n2ltat 2 e
c u
F a
În legătură cu acest indicator, a l e observăm ușor că
c i
p e
i s
2a
ti c n  1  s 2
  n  1  s 2

c 
1 x1 2 x2
sm .
M
a t e
 n1  1   n2  1
d e
u l
r s
Cu
Cu alte cuvinte, dispersia combinată sc2 este mediasi I E
aritmetică ponderată a dispersiilor celor două I C
i l e
eşantioane, s x1 şi sx2 . În aceste condiții, statistica
2 2
e ri
. s
Student, t, cu n1  n2  2 grade de libertate, . T . I pe care
urmează să o folosim va avea expresia . T
a E
a t e
lt
 u
x 1 Faxc2  D
t  iale .
e c 1 1
s p s2  
c i c 
a ti  n1 n2 
t e m
a
M
Corespunzător
l d e acestei statistici, pentru testul bilateral
r su
Cu
H0: μ1- μ2 = D, I E
si
I C
H1: μ1- μ2 ≠ D, e i l
e ri
. s
. I
regiunea critică Rc este caracterizată.Tde .T inegalitățile
a E
a t e
t  t  / 2, n1  n2  2 , sau c u ltt  t  / 2, n  n  2 ;
F a 1 2

a l e
pentru testul unilateral i
c dreapta
p e
i s
ti c
a
e m H 0: μ1- μ2 = D,
at
e M
l d Ha: μ1- μ2 > D,
r s u
Cu
regiunea critică Rc este caracterizată de inegalitateai I E
s
I C
t  t  , n1  n2  2  ; i l e
e ri
. s
. I
. T
iar pentru testul unilateral stânga E.T
t e a
l t a
H0: μ1-aμcu2 = D,
e F
i a l
H eac: μ1- μ2 < D,
s p
c i
a ti
regiunea critică e m R c este caracterizată de inegalitatea
at
e M
r s u l d t   t   , n 1  n 2  2  .
Cu
I E
si
Observații : 1) Dacă dispersiile celor două populații I C
nu sunt egale ( x21   x22 ), atunci testul statistic i l efolosit
e ri
. s
va avea forma . I
. T
( x1  x2 )  D E.T
t a ,
s12 lsta22 te
u
c
nF1a n2
l e
c ia
despre care se știei că p eurmează repartiția Student cu
s
ti c
ma
a t e
e M
l d
r su
Cu
1 I E
si
u12 u2 2 I C
 i le
n1  1 n2  1 e ri
. I.s
.T
grade de de libertate, unde . T
a E
2
s1 / n1 a t e 2
s2 / n2
u1  2 t
, uc2u  2
l .
s1 / n1  s2 / n2 Fa
2
s1 / n1  s2 / n2
2

l e
c ia
p e
2) În cazul în care,i după s testarea ipotezei privind
ti c
normalitatea distribuţiei a în colectivitatea generală cu
e m
ajutorul testelor a prezentate anterior, această ipoteză nu
t
M
este acceptată,
d e se poate apela la teste statistice
u l
r s
Cu
neparametrice, în cadrul cărora nu se fac presupuneri I E
si
speciale asupra formei distribuţiei. I C
i l e
e ri
Testarea ipotezelor asupra dispersiei .unei .I s populaţii
. T
. T
E
Dacă populaţia eşantionată este t e a normal distribuită,
t a
atunci se știe că suma pătratelor c u diferenţelor
l
n F a
i 1
( xi  x ) , (care este, ide
2

e c a l e fapt, egală cu n  s sau cu 2

s p
(n  1)  s pentru teşantioane
2
i c i mici) împărţită la dispersia
a
teoretică a colectivităţii,
t e m are o distribuţie  2
cu (n  1)
a
grade deelibertate.M Prin urmare pentru a verifica o
d
ipoteză
r s u l de forma H 0 :  2
  0
2
, se poate folosi statistica
C u
I E
si
(n  1) s 2
C
 
2
. le I
0 2
e rii
. I.s
T .
Procedeul de utilizare este următorul: . T
a E
pentru testul bilateral a t e
u l t
a2 c
F
Hi0al:    0 ,
e 2

e c
s p
i
a ti c H a :  2
  2
0,
t e m
a
M
regiuneadecritică Rc este caracterizată de inegalitățile
u l
r s
Cu
   1   / 2, n  1 sau     / 2, n  1; si I E
2 2 2 2

I C
i l e
pentru testul unilateral dreapta e ri
. s
. I
. T
H 0 :    0 , E.T
2 2

t e a
l t a
Ha : a   0 ,
2 u
c 2

e F
i a l
e c
regiunea critică Rc este s p caracterizată de inegalitatea
c i
a ti
 2   2  , antem1;
e M
l d
pentru
r su testul unilateral stânga
Cu
I E
si
H0 :   ,
2 2
0 I C
i le
e ri
H a :  2   02 , . I.s
T .
. T
E
a de inegalitatea
regiunea critică Rc este caracterizată t a t e
u l
a c
  ale1   , n  1 .
2 2 F

c i
p e
i s
Observaţie: Punctele a
m 2
ti c  2
1   / 2, n  1 ,
  / 2, nM 1 ,   , n  1 ,  1   , n  1 , se
2
a t e 2

determină d e respectiv din condiţiile


l
r su
Cu
1
 n 1
1 
t
I E
 n  1   t 2
e 2
dt  1   / 2, n
I
 C
si*,
2   

n 1 /2
 2 1 /2, n 1 e
 rii l
 2  . se
. I
. T
. T
1
 n 1
1 
t
a E
 2 te
  
2 *
t e t dt
a / 2, n ,
 n1/2  n  1   2  /2, n1 u l
 a c
2  F
 2  i a l e
c
 e n 1 t
1 p  
s t 2 e 2 dt   , n  * ,
c
1
i i
 n1/2  n  1m
t
 a 2  , n1
2   te 
 M2a 
d e
u l
r s
Cu
1
 n 1
1 
t
I E
     si
2 2 *
t e dt 1 , n .C
 n  1  I
2   

n 1 /2
 2 1 , n 1 e
 rii l
 2  . se
. I
. T
. T
Aplicaţie: Înspectoratul Şcolar aleaunui E anumit județ
a t
este preocupat de organizareautimpului lt liber al elevilor.
a c
În acest sens el vrea să știe e Fdacă opțiunile de petrecere
a timpului liber depind i a
de
l contingentele de vârstă ale
e c
elevilor. Pentru a cse s pedifica în această privință, solicită
i i
elevilor din rețeaua a t școlară pe care o coordonează să
m
te chestionar. Rezultatul centralizării a
completeze aun
M
600 astfel l d de chestionare este prezentat în tabelul
e
alaturat
r su
Cu
Nr. elevi Nr. elevi I E
Nr. elevi si
care care I C
Ciclul de care
preferă preferăriile Total
studiu preferă se
activitățile activitățile
. I .
excursiile .T
culturale . Tsportive
a E
Gimnazial 88 82 te 74 244
l t a
Liceal 142 144
c u 70 356
F a
Total 230 le 226 144 600
c ia
p e
i s
ti c Tabelul 2
ma
a t e
În legătură
e M cu datele cuprinse în acest tabel se pot
l d
formula
r su următoarele ipoteze:
Cu
H0: preferința elevilor pentru sport, excursii saui I E
s
activități culturale este independentă de categoria I C de
vârstă în care se încadrează; i l e
e ri
Ha: alegerea modului de petrecere a .timpului .I s liber
depinde de contingentul de vârstă al.Trespondentului. .T
a E
Pentru a stabili dacă datele cuprinse t e în tabelul 2
lt a
oferă suficiente argumente decurespingere a ipotezei
F a
nule cu un nivel de semnificație l e de 0,05, vom folosi
c i a
testul p e
i s
ti c
a
m  S T 
2
ate  
2
,
e M
d T
u l
r s
Cu
unde S reprezintă frecvențele absolute de sondaj (sau I E
si
frecvențele absolute observabile empiric) consemnate I C
în tabel, T reprezintă frecvențele teoretice (sau i l e
e ri
frecvențele planificate/așteptate) ale tabelului, . s suma
. I
T
 S T  .
2
. T
rapoartelor extinzându-se a E la toate celulele
T a t e
u lt
tabelului. a c
F 2
Pentru a calcula statistica i a l e  trebuiesc determinate
e c
frecvențele teoreticespT corespunzătoare fiecărei celule
c i
a ti
a tabelului 2 (frecventele de sondaji sunt cele
em
meţionate ȋnattabelul 2). În acest sens ne vom folosi de
ipoteza dnulăe M potrivit căreia factorii care intervin în
problemă u l sunt independenți. Aceasta înseamnă că
r s
Cu
frecvențele teoretice corespunzătoare celulelor I E
si
tabelului 2 trebuie să fie proporționale cu totalele I C
marginale ale rândurilor și coloanelor pe care i l ese află
e ri
acele celule. Modul de calcul al acestor .frecvențe .I s este
prezentat în tabelul 3. . T
. T
a E
a t e
u lt
a c
e F
i a l
e c
s p
c i
a ti
t e m
a
e M
l d
r su
Cu
Nr. mediu Nr. mediu Nr. mediu I E
si
Ciclul al elevilor
care al elevilor al elevilor
care I C
de care i l eTotal
preferă
studiu activitățile preferă preferăeri
activitățile . s
. I
culturale excursiile sportive
T . T
230
 244 
226
 244 
.
E 600  244 
144
Gimna- 600 600
t a
e 244

244
 230  
244
 226 lt
a  144  244
zial 600 600
c u 600
 93,54  91,90
F a  58,56
230
 356  a l e226
 
144
 356 
600 i
c 356 600
356
600
Liceal 
356
 230  sp
e   226  
356
144  356
600
i c i 600 600
 136,a46t  134,10  85, 44

Total atem230 226 144 600


e M
l d
r su Tabelul 3
Cu
I E
si
Folosind datele din cele două tabele (tabelul I2Cși
l e
tabelul 3) calculăm valoarea statisticii e rii
s
 S T  .
2
. I 2*
 
2
și ca rezultat obținem . T . T  9,211.
T a E
Apoi calculăm numărul gradelor a t ede libertate ale
u lt
testului a c
F
df   l  1 c  i a1l    2  1 3  1  2 ,
e
e c
s p
c i
ti
și în final valoarile
te ma critice  2
 0,975, 2,   0,0506 și
  0,025,
2
e M2   7,378. Astfel regiunea critică a testului
a
este Rc   , 0,0506   7,378 ,  
l d
efectuats u
u r
C
Observații: 1) Testul la care ne referim are I E
si
 l  1 c  1 grade de libertate, unde l reprezintă I C
i l e
numărul de linii, iar c numarul de coloane eale ri
. s
tabelului folosit. . I
. T
2) Atunci când l  1, sau c  1, numărul E . T gradelor de
libertate, df , va fi prin definițieaegal t a
e cu numărul
u l t
celulelor din tabel minus 1. ac
e F
i a l
Revenind la problemă, e c cum  2*  R va trebui să
s p c
respingem ipoteza i c inulă și să acceptăm ipoteza
a t
alternativă. Astfel,t e m pentru un prag de semnificație
a
statisticăeaM 0,05, datele din tabelul 3 ne îndreptățesc
d
să credems u l că preferințele de petrecere a timpului liber
u r
C
depind de contingentele de vârstă cărora le aparțin i I E
s
elevii. I C
i l e
e ri
. s
. I
. T
. T
a E
a t e
u lt
a c
e F
i a l
e c
s p
c i
a ti
t e m
a
e M
l d
r su
Cu

S-ar putea să vă placă și