Documente Academic
Documente Profesional
Documente Cultură
Exemplu:
coeficientul mediu de inteligenţă calculat la un eşantion de studenţi, este o
aproximare foarte proastă a coeficientului mediu de inteligenţă al întregii
populaţii, deoarece un eşantion de studenţi nu este reprezentativ pentru
întreaga populaţie.
coeficientul mediu de inteligenţă calculat la un eşantion mare de indivizi
aleşi la întâmplare din populaţie, va fi probabil o aproximare mai bună a
coeficientului mediu de inteligenţă al întregii populaţii
o nouă serie statistică M n : m1 , m2 , m3 ,... - seria
s
• deviaţia standard a seriei M n este sn = s , (s = deviaţia standard a populației)
n
• distribuţia seriei M n este Gauss.
Exemplu:
➢ Media coeficientului de inteligenţă într-o populaţie m = 100 , iar deviaţia
standard s = 15
➢ O serie de cercetători, dorind să aproximeze deviația standard, iau fiecare câte un
eşantion, şi calculează coeficientul de inteligenţă mediu, fiecare la eşantionul pe care
şi l-a ales.
Rezultatul: aproximaţii → mai bune sau mai proaste
→ unele sub media reală, altele peste
→ unele mai mici, altele mai mari
- 1− =
- = riscul sau nivel semnificație
- = 1 + 2
- 1 - risc la stânga
- 2 = risc la dreapta
- = + interval simetric bilateral
2 2
- Riscul poate fi plasat simetric sau asimetric fața de media care se dorește a fi
estimată.
Astfel estimarea unui parametru teoretic nu se face printr-o singură valoare ci
printr-un interval în care parametrul estimat se gasește cu o probabilitate mare numit
interval de încredere.
Intervalul de variație pentru variabila aleatoare studiată și pentru o anumită
probabilitate (95% standard) se numește și interval de confidență sau de încredere.
( L ,U ) P ( L U ) = 1 −
- α - pragul de semnificație.
- X – v.a. ce caracterizează o populaţie statistică repartizată normal N ( , 2 ) , cu
parametrii μ şi 2 .
P X − 1.96 m X + 1.96 0.95
n n
I95% = X − tn−1, 95% , X + tn−1, 95%
n n
• Media populației
• Dispersia populației
• Diferența a două medii, când se compară două eșantioane
→ scade cu cât creşte numărul observaţiilor, deci cu cât este mai mare numărul
gradelor de libertate.
media reală se află (1-α)% sigur (95% sigur, 99% sigur, etc), între limitele
intervalului de încredere.
= P − X + z − −X + z =
1−
2 n 2 n
= P−X − z − − X + z =
1− 1−
2 n 2 n
= P X − z X +z = 1−
1− 1−
2 n 2 n
( L ,U ) = X − z1− ,X +z
n
1−
2 n 2
Mărimea Err = z poartă numele de eroare.
1− n
2
s s
= P −X + t − − X +t =
n −1, n −1,1−
2 n 2 n
s s
= P −X − t − − X + t =
n −1,1− n −1,1−
2 n 2 n
s s
= P X −t X +t = 1−
n −1,1− n −1,1−
2 n 2 n
t = −t
n −1, n −1,1−
2 2
s
( L ,U ) = X − tn −1,1− s
,X +t
n
n −1,1−
2 n 2
s
În acest caz eroarea este Err = t
n −1,1− n
2
Exemplu:
7 containere au greutățile 9.8; 10.2; 10.4; 9.8; 10.0; 10.2; 9.6. Să se găsească
un interval de încredere cu 1 − = 0.95 pentru media greutății presupunând
că greutatea este distribuită normal.
Soluție
X −
T= repartizată T (n − 1)
s
n
X=
x i
=
9,8 + 10,2 + 10,4 + 9,8 + 10 + 10,2 + 9,6
= 10.0 ;
n 7
1
xi − X ( )
2
s2 = =
n −1
= =
7 −1
1 2 2 4 2 2 4
2 2 2 2 2 2
= + + + − + + − 0, 09
6 10 10 10 10 10 10
s = 0.3
2 = 0.025
1 − = 95 = 0.05
1 − = 0.975
2
t T t t6,0.025 T t6,0.975
n −1, n −1,1−
2 2
t6,0.025 = − t6,0.975
t6,0.025 = −2.447
t6,0.975 = 2.447
X − 10 − 0.3
t6,0.025 t6,0.975 − 2.447 2.447
s 0.3 7
n 7
0.3 0.3
− 2.447 10 − 2.447 − 10
7 7
− 0.258 − 10 − 0.258 − 10
( 9.258;10.258)
n1 n2
x1i x2i
- X1 = 1
și X 2 = 1
n1 n2
- ni volumul de selecție
- (
M X 1 − X 2 = 1 − 2 media )
- (
D X1 − X 2 = ) 12
n1
+
22
n2
dispersia
Variabila aleatoare
z=
(X 1 )
− X 2 − ( 1 − 2 )
=
(X 1 )
− X 2 − ( 1 − 2 )
N ( 0,1)
(
D X1 − X 2 ) 12
+
22
n1 n2
z = − z 2 2
1−
2 2
−z
(X 1 )
− X 2 − ( 1 − 2 )
z
12
+
22
1−
12 22 1− n1 n2
+
2 2
n1 n2
12 22 12 22
−z
1−
n1
+
n2
(
X 1 − X 2 − ( 1 − 2 ) z) 1−
n1
+
n2
(
− X1 − X 2 )
2 2
12 22
(
− X1 − X 2 − z ) 1−
n1
+
n2
− ( 1 − 2 )
2
12 22
(
− X1 − X 2 + z ) 1−
n1
+
n2
( −1)
2
12 22 12 22
(
X1 − X 2 + z ) 1−
n1
+
n2
( 1 − 2 ) X1 − X 2 − z ( ) 1−
n1
+
n2
2 2
12 22 12 22
(
X1 − X 2 − z ) 1−
n1
+
n2
1 − 2 X1 − X 2 + z ( ) 1−
n1
+
n2
2 2
12 22 12 22
( L ,U ) = ( X1 − X 2 ) − z1− + (
, X1 − X 2 + z ) +
n2
n1 n2 1− n1
2 2
și variabila aleatoare
T=
(X 1 )
− X 2 − ( 1 − 2 )
T ( n1 + n2 − 2 )
1 1
sp +
n1 n2
t
(X 1 )
− X 2 − ( 1 − 2 )
t
n1 + n2 − 2, 1 1 n1 + n2 − 2,1−
2
sp + 2
n1 n2
−t
(X 1 )
− X 2 − ( 1 − 2 )
t
n1 + n2 − 2,1− 1 1 n1 + n2 − 2,1−
2
sp + 2
n1 n2
1 1
X1 − X 2 + t sp + 1 − 2
n1 + n2 − 2,1− n1 n2
2
1 1
X1 − X 2 − t sp + ( −1)
n1 + n2 − 2,1− n1 n2
2
1 1
X1 − X 2 − t sp + 1 − 2
n1 + n2 − 2,1− n1 n2
2
1 1
X1 − X 2 − t sp +
n1 + n2 − 2,1− n1 n2
2
1 1
cu eroarea Err = t sp + .
n1 + n2 − 2,1− n1 n2
2
( n − 1) s 2
v= 2 ( n − 1) şi ca urmare
2
s2
2 ( n − 1) 2
n −1,
2 2 n −1,1−
2
1 2 1
( n − 1) s 2
2
n −1,
( n − 1) s 2
2
n −1,1−
2 2
( n − 1) s 2 2 ( n − 1) s 2
( n − 1) s 2 2 ( n − 1) s 2
2
2
2 2
n −1, n −1,1− n −1,1− n −1,
2 2 2 2
Estimarea intervalului de încredere pentru
raportul a două dispersii
s12
12 s12 22
Raportul F = F ( n1 − 1, n2 − 1) F = F ( n1 − 1, n2 − 1)
s22 12 s22
22
s12 22 s22
f f
n1 −1, n2 −1,
2 12 s22 n1 −1, n2 −1,1−
2 s12
s22 22 s22
f f
s12 n1 −1,n2 −1, 2 12 s12 n1 −1,n2 −1,1− 2
intervalul de estimaţie pentru raportul dispersiilor este:
s22 s22
( L ,U ) = 2 f n −1,n −1, , 2 f n −1,n −1,1−
s1 1 2 2 s1 1 2 2