Documente Academic
Documente Profesional
Documente Cultură
Sondajul
statistic -III
tema 9
sapt.23-27 aprilie 2012
al.isaic-maniu
www.amaniu.ase.ro
http://www.ase.ro/ase/studenti/index.asp?item=Fisiere&ID=288
Distributia Normala
Distributia Normala
Cea mai importanta distributie continua :
– Numeroase variabile aleatoare pot fi adecvat
modelate daca sunt normal distribuite.
– Multe distributii pot fi aproximate printr-o
distributie normala.
– Distributia normala este piatra de temelie a
inferentei statistice.
1
Legea normală (Gauss-Laplace)
• Una din ipotezele fundamentale in sondajul statistic este
normalitatea (apartenenţa la legea Gauss-Laplace) a caracterizării
investigate este necesar să discutăm despre această lege statistică.
2
(2)
• Repartiţia normală apare de fapt pentru prima oară în 1733
într-o lucrare a lui Abraham de MOIVRE (1667-1754),
matematician cunoscut mai curând prin „formula Moivre”
referitoare la numerele complexe
• Abia odată cu lucrările lui Carl Friedrich GAUSS (1777-1855)
şi cele ale lui Pierre Simon, Marquis de LAPLACE (1749-1827)
se pun în lumină proprietăţile şi importanţa deosebită a
acestei legi statistice ca descriptor – iniţial al comportării
erorilor de observaţie (Gauss, 1809 în „Theoria Motus
Corpum Caelestium”
• Laplace (1810/1811 în „Theorie analitique des
Probabilites” din 1812) arată rolul teoretic (şi practic)
excepţional jucat de legea normală prin aşa-numita
TEOREMĂ LIMITĂ CENTRALĂ.
f0 (u) =
1
(
exp − u2 / 2 )
2π
u
1
F 0 (u ) = ∫e
−t 2 / 2
dt
2π −∞
3
Grafice ale legii normale
4
• Nivel de încredere (Confidence level)
Valoarea P = (1 − α ) a probabilităţii asociate unui interval de încredere.
Prob = (1 − α ) poate fi exprimat în procente [ (1 − α ) 100].
Test statistic
(Statistical test)
• Procedura statistică prin care se decide dacă ipoteza
nulă poate fi respinsă în favoarea ipotezei alternative
sau nu
• În general, un test preia apriori o anumită ipoteză, care
trebuie verificată (de exemplu, ipoteza de
independenţă a observaţiilor, ipoteza de normalitate
etc.).
• Testele pot fi construite cu ajutorul mediei aritmetice
şi cu ajutorul altor variabile aleatoare de sondaj,
acestea numindu-se de regulă statistici decizionale ale
testului statistic
Testarea normalităţii
5
Testul hi-pătrat - testul χ
2
(Chi-squared test)
◊ Testul statistic în care, pentru validarea ipotezei nule, statistica utilizată presupune
existenţa repartiţiei χ 2 . Testul este aplicat, de exemplu, la următoarele probleme:
a. testul de egalitate între varianta unei populaţii normale şi o valoare specificată, statistica
testului având la bază varianta eşantionului;
b. comparaţia între efectivele teoretice şi cele observate;
c. în validarea unei legi de repartiţie, ca de pildă cea normală.
◊ O formă clasică de construire a regiunii critice a testului χ 2 este următoarea:
◊ Fie X o variabilă care poate lua valorile x1, x2, …, xm, cu probabilităţile p1, p2, …, pm. Fie
n1, n2, …,nm frecvenţele de apariţie a valorilor x1 , x2, …, xm, într-un eşantion de volum n.
Regiunea critică a testului χ 2 pentru verificarea ipotezei p1 = p2 = … = pm se construieşte pe
baza indicatorului statistic de forma:
n
(n i − np i ) 2
∑i =1 np i
care pentru n → ∞ are repartiţia χ 2 cu n – 1 grade de libertate.
Distributii de esantionare
1.Introducere
• In practica , parametrii unei populatii nu se
calculeaza deoarece populatiile sunt foarte mari
• Decat sa se investigheze intreaga populatie, se ia
un esantion, se calculeaza o statistica legata de un
parameteru de interes, si se realizeaza o inferenta.
• Distributia de esantionare a statisticii este un
instrument care ne arata cat de apropiata este
statistica de parametru
17
M(X) = 1(1/6) +
x 1 2 3 4 5 6 2(1/6) + 3(1/6)+
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 ………= 3.5
V(X) = (1-3.5)2 +
(2-3.5)2 + ………
………. = 2.92
18
6
• Presupunem ca dorim sa estimam µ din x
media unui esantion de dimensiune n = 2.
• Care este distributia pe care o urmeaza x ?
Esantion Medie Esantion Mean Esantion Medie
1 1,1 1 13 3,1 2 25 5,1 3
2 1,2 1,5 14 3,2 2,5 26 5,2 3,5
3 1,3 2 15 3,3 3 27 5,3 4
4 1,4 2,5 16 3,4 3,5 28 5,4 4,5
5 1,5 3 17 3,5 4 29 5,5 5
6 1,6 3,5 18 3,6 4,5 30 5,6 5,5
7 2,1 1,5 19 4,1 2,5 31 6,1 3,5
8 2,2 2 20 4,2 3 32 6,2 4
9 2,3 2,5 21 4,3 3,5 33 6,3 4,5
10 2,4 3 22 4,4 4 34 6,4 5
11 2,5 3,5 23 4,5 4,5 35 6,5 5,5
12 2,6 4 24 4,6 5 36 6,6 6
19
x
M( ) =1.0(1/36)+
6/36 1.5(2/36)+….=3.5
V(X) = (1.0-
5/36 3.5)2(1/36)+
4/36 (1.5-3.5)2(2/36)... =
1.46
3/36
2/36
1/36
1 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
6.0 x 20
De asemenea,
Valoarea asteptata a populatiei = (1 + 2 + 3)/3 = 2
Valoarea asteptata a mediei esantionului = (1.5 + 2 + 2.5)/3 = 2
21
7
Distributia de esantionare a mediei esantionului
1. µ x = µ x
2
2 σx
2. σ x =
n
3 . Daca x este normala, x este normala.
Terminologie N
∑(X − X 0 )2
• Dispersia populaŃiei investigate σ2 = i =1
i
S2 Z 2S 2
∆x = ⋅Z rezultă: n=
n ∆2x
8
Sondajul aleator simplu fără revenire
1. Intervalul de încredere pentru media aritmetică
X − ∆x < X0 < X + ∆x
2. Eroarea limită sau maxim admisibilă ∆ x = µx ⋅ Z
3. Eroarea medie de reprezentativitate
µx =
σ2 1 − Nn dacă n>30 atunci: σ 2 ≈ S2
n
S2 n
(factor de vom avea: µx = 1 −
corecŃie) n N
4. Stabilirea volumului eşantionului
Z 2S 2
S2 n n=
∆x = 1 − ⋅ Z rezultă: Z 2S 2
n N ∆2x +
N
σ 2 = δ 2 +σ 2 (5)
11.Aprilie .2011 26
σ2 S2
µx = dacă n>30 atunci: σ 2
≈S2 vom avea: µx = (3' ' )
n n
9
Sondajul aleator stratificat -fără revenire
σ2
1 − Nn dacă n>30 atunci:σ ≈S2
2
µx =
n
deci : S2 n (3' ' ' )
(factor de µx = 1 −
corecŃie) n N
4. Stabilirea volumului eşantionului
Z 2S 2
S2 n n= ( 4' ' ' )
∆x = 1 − ⋅ Z de unde rezultă: Z 2S 2
28
n N11.Aprilie
.2011
∆ +
2
x
N
• repartizarea egală
În fiecare dintre cele r grupe se repartiza câte n/r unităţi
statistice
repartizarea proporŃională
În fiecare dintre cele r grupe se repartiza unităţile statistice
proporţional cu ponderile gi celor r grupe.
Formula pentru gi = Ni
Formula de ni = n ⋅ gi
ponderi: ∑ Ni repartizare:
repartizarea optimă
În fiecare dintre cele r grupe se repartiza unităţile statistice proporţional cu
ponderile yi celor r grupe şi ţinând cont şi de mărimea dispersiei din
interiorul fiecărei grupe. * 2
Formula pentru g i = SiSN2 Ni Formula de ni = n ⋅ g29i*
11.Aprilie .2011
ponderi: ∑ i i repartizare:
10
Aplicaţie (2)
I) în prima grupă de vechime, cei 25 de
angajaţi au produs în medie 15 bucăţi pe zi cu o
dispersie de 12
II) în a doua grupă de vechime, cei 50 de
angajaţi au produs în medie 20 bucăţi pe zi, cu
un coeficient de variaţie de 20%
Aplicaţie (3)
Aplicaţie (4)
n=10%* N=1000
N angajaţi
P=95,45% Z=
2
Grupa de vechime I (vechime sub 5 ani)
11.Aprilie .2011 33
11
Aplicaţie (5)
Grupa de vechime II (vechime între 5 şi 10
ani)
nII=50 angajaţi
xII = 20buc CVII =20%
CVII = 100= 20%
SII
xII
S II = 20⋅20
100
= 4 buc S2II=16
Aplicaţie (6)
Tabel 1. Informaţiile calculate şi sistematizate
11.Aprilie .2011 35
12