Sunteți pe pagina 1din 41

ASIMETRIA

Asimetria unei distributii statistice se determin prin


compararea indicatorilor tendinei centrale.
- vizibil grafic (forma histogramei / poligonului
frecvenelor).
1. Distribuia perfect simetric
Mo = Me = media

2. Asimetria pozitiv
Mo < Me < media
x
M
o
3.Asimetria negativ
media < Me < Mo


x M
o
Coeficienii de asimetrie Pearson

(-1, 1)
o
as
M x
C
_

e
as
C


Pentru distribuii uor asimetrice, unde:
e
as
M x
C
_
3
) ( 3
e o
M x M x =
) ( ) (
) ( ) (
1 3
1 3
Q Me Me Q
Q Me Me Q
C
Q
Coeficientul de asimetrie Yulle
Asimetrie moderat: -0,3< C <0,3.

e (-1, 1)
Sondajul statistic


Informatiile privind o colectivitate se pot obine
prin:
cercetare total
cercetare selectiv
Cercetarea selectiv este preferabil cnd:
populatia este prea mare sau se modific
rapid
localizarea unor uniti ale populatiei este
necunoscut
informatia se obine prin metode distructive
(ex. controlul calitii produselor)
cercetarea total este prea costisitoare/
laborioas/ndelungat.

Sondajul este o metod statistic de obinere
a informaiilor referitoare la o colectivitate
prin investigarea direct a unei pri din
aceasta (eantion).
Faze:
I. Descrierea eantionului: alegerea unitilor
care formeaz eantionul i calcularea
indicatorilor statistici pentru eantion.
II. Inferena: extinderea rezultatelor prelucrrii
eantionului asupra colectivitii totale.

Populatie
Esantion
Parametri
estimai
(pe baza
eantionului)
Indicatori
statistici
calculai
II. Inferena populaiei cu ajutorul rezultatelor eantionului
I. Descrierea eantionului

Utilizrile sondajului:
Controlul calitii produciei
Analiza consumului populatiei
Cercetri de marketing
Agricultur
Sondaje electorale.

Avantaje:

1. Mult mai ieftin i mai rapid dect
observarea total.
2. Erori mai uor de detectat i nlturat
3. Pot fi nregistrate mai multe variabile
4. nlocuiete cercetarea total pt. controlul
distructiv al calitaii productiei, testarea
noilor medicamente etc.

Noiuni de baz
Populaia total (N)
Eantionul (n)
Indicatori statistici pentru eantion
(valori calculate)
i pentru colectivitatea total
(parametri estimai).
N
x
x
N
i
i
=
=
1
0
n
x
x
n
i
i
=
=
1
N
x x
N
i
i
=

=
1
2
0
2
0
) (
o
n
x x
n
i
i
=

=
1
2
2
) (
o
I
n
d
i
c
a
t
o
r

Populatie
total
Eantion
M
e
d
i
e

D
i
s
p
e
r
s
i
e

Reprezentativitatea eantionului
Un eantion este reprezentativ pentru
populatia total dac surprinde trsturile ei
eseniale.

Conditii:
unitile eantionului s fie alese aleator
eantion suficient de mare
selectarea independent a unitilor
Procedee de selectie a eantionului
1. Selecie aleatoare.
2. Selectie dirijat
3. Selecie mixt.



1.Selecie aleatoare simpl Se atribuie un numr
fiecrei uniti statistice din colectivitatea total, se
amestec toate numerele ntr-o urn i se extrag la
ntmplare attea uniti cte sunt necesare pentru a
forma eantionul (n uniti din N).
1.1.Repetat (bila selectat se reintroduce n urn );
probabilitatea de selecie este constant; exist riscul
seleciei repetate a unei uniti.
1.2.Nerepetat: probabilitatea
de selecie crete; erori mai mici
p
1
= 1/N; p
2
=1/(N-1) ....
p
n
= 1/(N-n-1).

2. Procedeul tabelului cu numere aleatoare
presupune numerotarea ntr-o ordine oarecare a tuturor
unitilor colectivitii generale i extragerea a n uniti
pe baza unui tabel n care numerele sunt aezate
aleator pe linii i coloane.
Se aleg la ntmplare rndul i coloana de unde ncepe
selecia i se rein n numere succesive.
Aceste numere reprezint unitile care vor fi incluse n
eantion.

Col. 01-05 Col. 06-10 Col. 11-15 Col. 16-20
87032
98340
70363
09749
00235
27893
03287
34002
03951
00025
20789
10793
08215
00998
29861
10034
00039
28465
45087
19704
EX. Fie o parte din tabelul numerelor aleatoare :
Pt a selecta un esantion de 6 uniti dintr-o populatie de
1100 unitati:
-alegem aleator ca punct de pornire rndul 2, coloanele 06 -10.
Numrul de patru cifre aflat aici este 0328.
-reinem de pe coloanele urmtoare numerele mai mici dect
1100: 0328, 0395, 0002, 1079, 0821, 0099. Acestea sunt unitile
eantionului.

3. Selecia mecanic presupune stabilirea unui pas de
numrare p parte ntreag din volumul colectivitii
totale (N) supra volumul eantionului (n): p = N/n

Din primele p uniti se alege una aleator, apoi se adaug
succesiv, de n-1 ori, pasul de numrare p, incluznd n
eantion unitile corespunztoare.

Ex. Pentru a obine un eantion de 3 persoane dintr-un total
de 10 (p=3), din lista alfabetic se alege aleator una din
primele 3 persoane (de ex. 3). Selectm persoanele din
trei n trei => eantion: 3, 6, 9.

SELECIA DE SERII

Atunci cnd colectivitile generale sunt alctuite
din uniti complexe (familii, colective, formaii de
lucru etc.) numite serii, selecia nu se face la nivel
de uniti simple, ci la nivel de serii.

Ex. O companie are 30 uniti de producie din care 5
sunt selectate aleator pentru a fi investigat
productivitatea angajailor. Toi salariaii acestor 5
uniti vor fi inclui n eantion.
SONDAJUL TIPIC (STRATIFICAT)
Colectivitatea general este mprit n grupe
=> se poate extrage in fiecare grup (prin unul din
procedeele de selecie aleatoare) un numr fixat de
uniti care vor forma o subgrup a eantionului.
Ex. Selecia separat a femeilor i brbailor din
populaie. Eantionul final se obine prin reunirea
celor 2 subeantioane.
EROAREA = abaterea care exist ntre valoarea unui
parametru (de exemplu, media) calculat prin prelucrarea
datelor din eantion i valoarea acestuia dac ar fi fost
prelucrate datele de la toate unitile colectivitii

1. Erori de nregistrare: erori comune tuturor tipurilor de
observare (total sau parial)

2. Erori de reprezentativitate - specifice cercetrii prin
sondaj.
2.1.Erorile de reprezentativitate sistematice pot fi
evitate dac se respect ntocmai principiile teoriei
seleciei.
2.2.Erorile ntmpltoare de reprezentativitate -
inevitabile.
2.2.1.Erori efective
2.2.2.Erori probabile (eroarea medie i eroarea
limit de reprezentativitate).
Eantioanele care se pot forma din aceeasi
colectivitate general au medii diferite.

Distribuia acestor medii de selecie tinde ctre
modelul distribuiei normale, indiferent de forma de
distribuie a variabilei pentru care se face
cercetarea=> tendina erorilor de reprezentativitate
de a urma aceeai lege.

Erorile de reprezentativitate ale eantioanelor sunt
sintetizate n eroarea medie de reprezentativitate,
calculat ca medie ptratic a tuturor abaterilor
mediilor de selecie posibile de la media colectivitii
totale.


Eroarea medie de reprezentativitate
- sondaj repetat - sondaj nerepetat







Daca nu se cunoaste dispersia colectivitii totale
poate fi nlocuit prin dispersia eantionului
n
x
2
0

) 1 (
2
0
N
n
n
x
2
0
o
2
o
volumul
colectivitii
volumul
eantionului

Eroarea limit de reprezentativitate definete
sigurana estimrii mediei colectivitii generale
prin media eantionului.

z- din tabelul distributiei Gauss-Laplace, n funcie de
probabilitatea care caracterizeaz sigurana
estimrilor (nivelul de ncredere asociat sondajului)
Ex. 0.9545 (sau 95.45%) -> z=2; 0.9973 -> z=3 ;
0.9999 -> z=5 => unui nivel de ncredere mai ridicat i
corespunde z mai mare => creterea erorii limit.

Eroarea limit pentru sondaj repetat / nerepetat

n
z
x
2
0

) 1 (
2
0
N
n
n
z
x
= A
o
x
x
z


Determinarea volumului eantionului necesar pentru
a obine o anumit eroare limit:

Sondaj aleator repetat



Sondaj aleator nerepetat




Daca nu se cunoaste dispersia colectivitii totale
poate fi nlocuit prin dispersia eantionului

2
2
0
2
x
z
n
N
z
z
n
x
2
0
2
2
2
0
2
2
0
o
2
o

Caracteristica alternativ
Eroarea medie de reprezentativitate:
Sondaj aleator repetat



Sondaj aleator nerepetat


Eroarea limit
n
w w
w
) 1 (
) 1 (
) 1 (
N
n
n
w w
w

w w
z

1.SELECIA ALEATOARE SIMPL
este folosit pentru colectiviti omogene.

Eantionul este format din uniti simple care se extrag
din colectivitatea general prin selecie aleatoare
repetat/nerepetat.

Din cauza erorilor specifice, sondajul nu furnizeaz
valoarea real a parametrului cutat (de ex. media), ci
un interval de ncredere n care se afl (cu o anumit
probabilitate) valoarea real.

Acest interval este delimitat de media eantionului +/-
eroarea limit i este caracterizat printr-o anumit
probabilitate.
TIPURI DE SONDAJ

I. Intervalul de ncredere pentru media colectivitii
generale:
variabila nealternativ:

variabila alternativ :

Cu ct este mai mare nivelul de ncredere (implicit, z),
cu att intervalul de ncredere este mai mare.

II. Intervalul de ncredere pentru valoarea total
(cumulat) a variabilei:
var. nealternativ:

var. alternativ :


x x
x x x A + < < A
0
w w
w p w A + < < A

) ( ) (
1
x
N
i
i
x
x N x x N A + < < A
=
) ( ) (
w w
w N M w N A + < < A
31
Intervale de ncredere

din intervale
contin media
adevrat ;
o 100% nu.
Intervalul de ncredere pentru medie
/ 2 o
/ 2 o
X
1 o
( )
1 100% o
x x
x x x A + < < A
0
x x =
0
x
x A +
x
x A
Factorii care determin mrimea
intervalului de ncredere
1. mprtierea datelor
msurat prin dispersia o
2

2. Mrimea eantionului
n

3. Nivelul de ncredere
(1 - o) influeneaz z
) 1 (
2
0
N
n
n
z
x
= A
o

2.SELECIA TIPIC (STRATIFICAT)
se utilizeaz atunci cnd o populaie neomogen este
mprit n grupe omogene.
Unitile eantionului se extrag separat din fiecare
grup, prin selecie aleatoare simpl
repetat/nerepetat.
Numrul de uniti (n
i
) selectat din fiecare grup i trebuie
s fie proportional cu mrimea grupei (N
i
):
, i=1,2,, r

Dac dimensiunile grupelor nu sunt cunoscute, un
numr egal de uniti va fi selectat din fiecare grup:
, r- numrul de grupe
N
N
n
n
i i
=


r
n
n
i


Erorile seleciei tipice (stratificate)

Eroarea medie de reprezentativitate:



Se utilizeaza media dispersiilor de grup n
locul dispersiei totale!
Consecin: erori mai mici
Eroarea limit:
n
y
2
0

) (
N
n
n
y
= 1
2
0
o
o
y y
zo = A
I. Estimarea intervalului de ncredere pentru medie in
colectivitatea total:


II. Estimarea intervalului de ncredere pentru
valoarea total:



Mrimea noului eantion
pentru un alt sondaj cu o eroare
limit diferit:

N
z
z
n
y
2 2
2
2 2
o
o

+ A
'

=
'


y y
y y y
0

) ( ) (
y
N
i
i
y
y N y y N A + < < A
=1

Aplicaie. Sondaj proporional stratificat N=8000 n= 400.
Grupe de
turiti
dup
vrst
(ani)
Nr.
turiti
Cheltuieli
suplim.
medii
zilnice
(RON)
Abaterea
medie
ptratic a
cheltuielilor
suplimentare
(RON)
Sub 30
30-50
50 si peste
130
180
90
200
300
400
40
75
132


Media eantionului:
290
400
90 400 180 300 130 200
1
1
=
+ +
= =
=
=
r
i
i
r
i
i i
n
n y
y


Dispersiile de grup:

, i=1,2,3.



Media dispersiilor de grup:
65 , 6971
400
90 17424 180 5625 130 1600
1
1
2
2
=
+ +
= =
=

=
r
i
r
i
i i
n
n o
o
1600
2
1
= o

5625
2
2
= o

17424
2
3
= o
2 2
) (
i i


Eroarea medie de reprezentativitate:



Eroarea limit (z=2 corespunznd unei
probabiliti de 95.45%).


Intervalul de ncredere pentru media colectivitii
generale:

290 8,138< <290 +8,138 281,862 < <298,138
(Ron/tourist )
069 , 4
8000
400
1
400
65 , 6971
1
2
=
|
.
|

\
|
=
|
.
|

\
|
=
N
n
n
y
o
o
138 , 8 069 , 4 2 = = = A
y
y
z o
y y
y y y
0
0
y

0
y



Intervalul de ncredere pentru valorile agregate
(Cheltuielile suplimentare pentru toi cei 8000 de
turiti):
) ( ) (
y
N
i
i
y
y N y y N A + < < A
=1
138 , 298 8000 862 , 281 8000
8000
1
< <
= i
i
y
2385104 2154896
8000
1
< <
= i
i
y


Redimensionarea eantionului




Noua eroare limit RON / turist




Repartizarea proporional pe grupe a noului eantion:
n
1
=(130/400)*364=118
n
2
=(180/400)*364=164
n
3
=(90/400)*364=82
Total eantion n=n
1
+n
2
+n
3
=118+164+82=364 turiti.
N
N
n n
i
i
, ,
=
N
z
z
n
y
2 2
2
2 2
o
o

+ A
'

=
'
545 , 8 05 , 1 = A = A
'
y y

364
8000
65 , 6971 4
545 , 8
65 , 6971 4
2
=

=
'
n