Sunteți pe pagina 1din 33

BAZELE STATISTICII

- anul universitar 2016-2017 -


Programa analitic
1. Noiuni introductive
2. Analiza unei serii statistice unidimensionale, folosind
metode grafice i numerice (variabile cantitative:
indicatori ai tendinei centrale, indicatori ai dispersiei i
indicatori ai formei; variabile calitative).
3. Analiza unei serii statistice bidimensionale.
Programa analitic
4. Probabiliti i distribuii teoretice
5. Estimarea parametrilor unei populaii
6. Testarea statistic
7. Indicatori ai seriilor de timp
5. Estimarea parametrilor unei populaii
5.1. Concepte fundamentale
a) Populaie - Eantion
 O populaie statistic este definit prin precizarea naturii sale,
a caracteristicilor intrinseci, spaiului i timpului.

 Un eantion reprezint o sub-populaie sau un sub-ansamblu


extras din populaia de referin dup o procedur anume.
5. Estimarea parametrilor unei populaii
b) Sondajul aleator simplu repetat
 Sondajele aleatoare permit calcularea a priori a probabilitii
fiecrei uniti din populaie de a aparine eantionului.
 Un sondaj aleator simplu repetat presupune ca fiecare unitate
din populaie s aib aceeai probabilitate de a fi inclus n
eantion.
n
 Aceasta este p = .
N
5. Estimarea parametrilor unei populaii
c). Numrul de eantioane care se pot extrage
- n cazul eantionrii aleatoare repetate:

K=Nn
5. Estimarea parametrilor unei populaii
5.2. Parametru Estimator Estimaie
Parametrul reprezint o valoare fix i necunoscut, numit
i valoare real sau adevrat, a unei populaii studiate dup o
anumit variabil.
Estimatorul este o statistic, adic o variabil aleatoare care
este determinat de totalitatea eantioanelor posibile de
volum n care se pot extrage din populaia de referin.
Estimatorul este definit ca o funcie a variabilelor de selecie.
5. Estimarea parametrilor unei populaii
 Estimaia este o valoare realizat dintre valorile posibile ale
estimatorului.
 O estimaie se obine la nivelul unui eantion extras, pe baza
datelor culese, i este o funcie a valorilor de sondaj.
5. Estimarea parametrilor unei populaii
Proprietile estimatorilor
 De regul, exist o diferen ntre estimaie i parametru,
care reprezint o eroare de estimare.
 Aceast eroare poate fi msurat cu ajutorul proprietilor
estimatorilor:

1. Nedeplasarea

M () =
5. Estimarea parametrilor unei populaii
2. Convergena:

V () 0, cnd n N
- convergena n probabilitate impune o condiie de volum al
eantionului: dac acesta este suficient de mare, atunci orice
valoare posibil a estimatorului (orice estimaie) converge
ctre parametru.
Aceast proprietate este o expresie a legii numerelor mari.
5. Estimarea parametrilor unei populaii
- convergena n repartiie (teorema limit central)
impune o condiie de volum pentru estimatorul transformat
prin operaia de standardizare:
~ M ( )
=
V ( )
Dac volumul eantionului crete peste o anumit limit,
atunci variabila aleatoare obinut prin standardizarea
estimatorului urmeaz o lege de repartiie normal standard:
~

Z ~ N( 0,1)

3. Eficiena: V ( ) = min .
5. Estimarea parametrilor unei populaii
5.3. Statistici uzuale n inferena statistic

a) Media de selecie
 Estimatorul numit medie de selecie este obinut ca o medie
aritmetic a variabilelor aleatoare de selecie Xi.
 O valoare posibil a estimatorului este media de sondaj.
 Variabila media de selecie se caracterizeaz prin legea
normal - teorema limit central bazat pe legea numerelor
mari.
2
~ N ( , )
n
5. Estimarea parametrilor unei populaii
 Caracteristici ale estimatorului :
- nedeplasat;
- convergent;
- eficient.

b) Dispersia de selecie 2
- Este un estimator deplasat.
- Ca o corecie la acest estimator, se construiete dispersia de
selecie modificat sau corectat. O valoare posibil a acestui
estimator este dispersia de sondaj modificat:
5. Estimarea parametrilor unei populaii
1
s' 2 =
n 1
( xi x )2

c) Proporia de selecie
- are aceleai proprieti cu media de selecie.
(1 )
~ N ( , )
n
5. Estimarea parametrilor unei populaii
5.4 Estimarea punctual a parametrilor unei populaii

a) Definire
- presupune calculul unei estimaii la nivelul unui eantion, ca
o valoare a unui estimator convenabil ales, care respect
proprietile de nedeplasare i convergen.
b) Estimarea punctual a mediei unei populaii
c) Estimarea punctual a varianei unei populaii
d) Estimarea punctual a proporiei unei populaii
5. Estimarea parametrilor unei populaii
5.5 Estimarea prin interval de ncredere (IC) a parametrilor
unei populaii

a) Definire
- a estima prin IC un parametru presupune a identifica dou
variabile aleatoare, Li i Ls , care, pentru o anumit
probabilitate ( 1 ) , numit nivel de ncredere, respect
condiia:

P( Li Ls ) = ( 1 )
- , cu ( 0 ,1 )
5. Estimarea parametrilor unei populaii
- estimarea prin IC se bazeaz pe estimatori nedeplasai i
convergeni, crora li se aplic Teorema limit central.

b) Estimarea prin IC a mediei unei populaii


- cnd se cunoate parametrul :

2
~ N ( , ) Z ~ N (0,1)
n

Z= =
/ n
5. Estimarea parametrilor unei populaii


P( z / 2 + z / 2 ) = ( 1 )
/ n


P( z / 2 + z / 2 ) = (1 )
n n
5. Estimarea parametrilor unei populaii
 la nivelul unui eantion extras:


x z /2 , x + z /2
n n

- cnd nu se cunoate parametrul :


Variabila Z devine o variabil Student:

t= ~ t( n 1 )
'
n
5. Estimarea parametrilor unei populaii
P( t / 2 t t / 2 ) = ( 1 )
- valoarea t / 2 se citete din tabelul Student pentru:

P( t t / 2 ) = / 2

s' s'
x t / 2 , x + t / 2
n n
Exemplu
Pentru un eantion format din 20 de persoane, extras aleator
simplu repetat, s-au obinut urmtoarele rezultate privind
vrsta (ani):

x = 20 ani ; s' = 2 ani .

S se estimeze prin interval de ncredere vrsta medie a


ntregii populaii din care a fost extras eantionul,
considernd un risc de 0,05.
Exemplu
 n estimarea prin IC a mediei populaiei se folosete statistica
t Student. Din Tabela Student se citete valoarea:
t0,025;20-1=2,093.

 IC este :
s' 2
x t 0.025 ;19 =
20 2 ,093 = [19 ,064; 20 ,936 ]
n 20

 Interpretare: Se poate garanta cu o probabilitate de 0,95 c


vrsta medie a ntregii populaii din care a fost extras
eantionul este acoperit de intervalul: 19,064 ~ 19 ani i
20,936 ~ 21 ani.
5. Estimarea parametrilor unei populaii
Observaie:
Precizia estimrii crete (mrimea intervalului de ncredere
este mai mic), atunci cnd:

- volumul eantionului (n) crete.


6. Estimarea parametrilor unei populaii

df t0.1 t0.05 t0.025

1 3,078 6,314 12,706

2 1,886 2,920 4,303

3 1,638 2,353 3,82


5. Estimarea parametrilor unei populaii
- variana eantionului este mic (valorile aberante afecteaz
mrimea intervalului de ncredere).
5. Estimarea parametrilor unei populaii
c) Estimarea prin IC a proporiei unei populaii

- cnd se cunoate variana variabilei alternative:



z / 2
, + z / 2

n n

- cnd nu se cunoate variana variabilei alternative:


p( 1 p ) p( 1 p )
p t / 2 , p + t / 2
n n
Exemplu
 n urma realizrii unui sondaj electoral la nivelul unui
eantion format din 1500 persoane, se observ c 840
persoane au votat pentru candidatul A. S se estimeze prin
interval de ncredere proporia persoanelor care voteaz
pentru candidatul A la nivelul ntregii populaii, considernd
un risc de 0,05.
Rezolvare
- proporia persoanelor care au votat pentru candidatul A, la
nivelul eantionului, este: p=840/1500=0,56.
- I.C. se calculeaz astfel:

p (1 p ) 0 ,56 ( 1 0 ,56 )
p t / 2 = 0 ,56 1,96 = [0 ,53; 0 ,59 ]
n 1500
5. Estimarea parametrilor unei populaii
5.6. Estimarea prin IC n SPSS
Descriptives

Statistic Std. Error


rata_som_2010 Mean 7.7442 .32041
95% Confidence Lower Bound 7.0976
Interval for Mean Upper Bound
8.3908

5% Trimmed Mean 7.8339


Median 8.0000
Variance 4.414
Std. Deviation 2.10105
Minimum 2.30
Maximum 11.80
Range 9.50
Interquartile Range 2.60
Skewness -.605 .361
Kurtosis .418 .709
Estimarea prin IC n Excel
Column1
Mean 7.466667
Standard Error 0.735926
Median 8
Mode 9
Standard Deviation 2.85023
Sample Variance 8.12381
Kurtosis 0.752301
Skewness -0.84626
Range 11
Minimum 1
Maximum 12
Count 15
Confidence Level(95.0%) 1.578405
5. Estimarea parametrilor unei populaii
5.7. Calcularea volumului eantionului (n)
 Pentru determinarea volumului eantionului se folosete, de
regul, ca variabil de baz o variabil alternativ pentru a
estima parametrul , care, n cazul unui sondaj de opinie
electoral, poate fi proporia de voturi obinute de un candidat.
 n practic, se fixeaz probabilitatea sau nivelul de ncredere,
(1-), cu care dorim s garantm rezultatul (de regul, 0,95)
i eroarea maxim admisibil (de exemplu, 3% ).
5. Estimarea parametrilor unei populaii
 tiind c:

= z / 2
n , unde:
este eroarea maxim admisibil, iar este abaterea
standard a variabilei alternative pentru care se estimeaz

z2 / 2 2
 Se afl n: n=
2
 Parametrul 2 , care exprim gradul de omogenitate al
populaiei, de regul nu se cunoate, ns n calculul
volumului eantionului se poate utiliza valoarea lui maxim,
care este egal cu 0,25.
6. Estimarea parametrilor unei populaii
Exemplu
 Pentru o probabilitate de 0,95 i o eroare maxim admisibil
de 3% , s se calculeze volumul eantionului.
 Ce se ntmpl dac se utilizeaz o eroare de 2% ?

S-ar putea să vă placă și