Sunteți pe pagina 1din 30

ANCHETE I

SONDAJE
-Completare -

PROF. DR. ISAIC- MANIU ALEXANDRU

web : www.amaniu.ase.ro

e-mail: AL.ISAIC-MANIU@CSIE.ASE.RO

PRELUCRAREA
DATELOR DE
SONDAJ I
INFERENA
STATISTIC

Bibliografie

+ Orice manual/ tratat recomandat la seciunea Bibliografie de pe


site

Estimare (Estimation)

Operaie de stabilire, n baza datelor unui eantion,


a valorilor parametrilor repartiiei populaiei din care
a fost prelevat eantionul
Rezultatul, se poate exprima printr-o valoare unic
(estimator punctual), sau printr-un interval
Inferena statistic

Spre deosebire de statistica descriptiv, inferena


statistic folosete procedee specifice bazate pe
modele matematice (n esen, probabiliste) pentru
analiza materialului statistic organizat de metodele
descriptive
Termenul inferen este mprumutat din englez i conform cu The
American Heritage Dictionary of the English Language (Peter Davies,
editor, Dell Publ. Co. Inc. New York, 1972, pag. 365) to infer sau
inferring nseamn a face o inferen adic a extrage o concluzie sau a
face o deducie pe baza unor fapte sau indicii

Eroare de estimare

(Estimation error)

Eroarea n estimarea unui parametru (^ - )


unde ^ este rezultatul estimrii, iar este
parametrul estimat
Eroarea de estimare poate fi provocat de
una sau mai multe cauze

Interval de ncredere (Confidence interval)


Interval de ncredere bilateral (Two-sided
confidence interval; Intervalle de confiance
bilatral).
Dac Z1 i Z2 sunt dou funcii ale valorilor
observate, iar este un parametru estimat al
populaiei, astfel ca probabilitatea este cel
puin egal cu 1 - alfa, [unde 1 -alfa este un
numr fixat, pozitiv i mai mic dect 1],
intervalul dintre Z1 i Z2 este un interval de
ncredere bilateral de pentru .
Limitele Z1 i Z2 ale intervalului de ncredere
sunt statistici care, n general, au valori diferite
de la un eantion la altul

Legea normal (Gauss-Laplace)

Una din ipotezele fundamentale in sondajul statistic


este normalitatea (apartenena la legea Gauss-Laplace)
a caracterizrii investigate este necesar s discutm
despre aceast lege statistic.

Modelul Gauss-Laplace uzual, din punct de vedere


matematic reprezint o repartiie statistic definit de

funcia de repartitie

1
x
2
F x; ;
exp
dx
2

2 2

unde

R, 0, x R

Respectiv

functia de frecventa

1
x
f x
exp

2
2
2

sau funcia de densitate a repartitiei


variabilei aleatoare X

X mrimea fizic msurat i care reprezentat


grafic are binecunoscuta form de clopot (aazisul clopot al lui Gauss):
Se tie c o funcie de densitate trebuie s
ndeplineasc urmtoarele cerine:

(i) f x 0, x D i
(ii) f x dx 1 unde D este domeniul de definiie al
D X, n cazul nostru dreapta real, R.
variabilei

Scurt istoric legea normala (1)

. Originea

acestui model o gsim n lucrarea Dialog despre


cele dou sisteme fundamentale ale lumii a lui Galileo
GALILEI (1564-1642), n care el i expune prerile
referitoare la msurarea distanelor dintre diferite corpuri
cereti:
Galilei considera c:
erorile ntmpltoare sunt inevitabile n observaiile obinute
cu diverse mijloace de msurare
erorile mici au anse mai mari de apariie dect cele mari sau
foarte mari
msurrile tind s se distribuie aproximativ egal la stnga i la
dreapta unei valori de referin
majoritatea valorilor observate tind s se grupeze (s se
aciuiasc) n jurul acestei valori de referin
erorile aleatoare prezente n procesul msurrii/observrii
sunt diferite (distincte) de cele ce pot aprea n calculele
efectuate de experimentator

(2)
Repartiia normal apare de fapt pentru prima oar n
1733 ntr-o lucrare a lui Abraham de MOIVRE (16671754), matematician cunoscut mai curnd prin
formula Moivre referitoare la numerele complexe:
Abia odat cu lucrrile lui Carl Friedrich GAUSS
(1777-1855) i cele ale lui Pierre Simon, Marquis de
LAPLACE (1749-1827) se pun n lumin proprietile
i importana deosebit a acestei legi statistice ca
descriptor iniial al comportrii erorilor de
observaie (Gauss, 1809 n Theoria Motus Corpum
Caelestium

Laplace (1810/1811 n Theorie analitique des


Probabilites din 1812) arat rolul teoretic (i practic)
excepional jucat de legea normal prin aa-numita
TEOREM LIMIT CENTRAL.

(3) Teorema Limita Centrala


Aceast teorem, menionat azi i n diverse
documente ISO (de exemplu ISO Guide 13434,
Anexa G. pp. 74-75) a constituit fundamentul
construirii fielor de control de tip SHEWHART
destinate verificrii unui proces (vezi SRISO 8258/1999).

ntr-o formulare popular Teorema Limit


Central afirm c: dac sunt variabile aleatoare
continue, identic repartizate cu aceeai medie (m)
i aceeai dispersie (D2), atunci variabila medie
este aproximativ normal repartizat, cu aceeai
medie (m) dar cu dispersia mai mic i anume
D2 / n
Acest fapt are loc chiar pentru valori modeste ale lui n .

Cateva proprietati ale legii normale


graficul funciei are un singur maximum
pentru x
si dou inflexiuni de abscise x
2

parametrii descriptori i au semnificaia


mediei i dispersia teoretice:E x ; varx 2

intervalul 3 , 3 conine aproximativ 99,73%


din valorile mrimii X.

Variabila U x / se numeste variabila


normal standard (sau standardizat) i
are funcia de densitate respectiv de
repartiie sub
1
2

f
u

exp

u
/ 2

0
2

F0 u

1
2

t 2 / 2

dt

adic variabila U are media O i dispersia 1.

Aceste funcii au fost tabelate iniial de ctre


Laplace.

Grafice ale legii normale

Repartiia t (STUDENT)
dac

parametrii
variabila

xi N , 2

sunt independente, cu

X n

s2

1
xi x

n 1

x
s/

se numete variabila STUDENT (sau t) i


joac un rol important n experimentele

privind compararea a dou medii normale


(adic a mediilor a dou populaii
caracterizate de legea normal )

Repartiia t (STUDENT)
Densitatea de tip t are forma:
f t

unde

n / 2
t2

1
n 1
n 1 n 1

2
1

n / 2

x t x 1e t dt
0

este binecunoscuta funcie GAMMA a lui EULER


(1707-1783).

Denumirea STUDENT provine de la chimistul i statisticianul britanic William Sealy


GOSSET (1876-1937) care a lucrat la o celebr fabric de bere din Dublin, n calitate de
supervizor al procesului de fabricaie al acestui produs, apreciat azi pe ntreg mapamondul
.Gosset a avut ca sarcin de serviciu printre altele i compararea calitii berii
produse de firma respectiv cu cea a concurenilor acesteia. Gosset i-a ales pseudonimul
STUDENT, cu care i-a semnat toate lucrrile, publicate n principal n celebra revist
BIOMETRIA >nfiinat n 1900 de GALTON i PEARSON.

Repartiia t (STUDENT)
Densitatea de tip t are forma:
f t

unde

n / 2
t2

1
n 1
n 1 n 1

2
1

n / 2

x t x 1e t dt

0
este binecunoscuta funcie GAMMA a lui
EULER (1707-1783).

Testarea normalitii

Verificarea faptului c datele


experimentale obinute sunt repartizate
dup legea Gauss-Laplace se poate face
n mai multe moduri, i anume:

algebric (utiliznd indicatorii de eantionaj


cu proprietile lor specifice n cazul legii
normale);
grafic (folosind aa-numitele hrtii sau
reele de tip probabilist)
analitic (utiliznd procedee statistice
speciale aa numitele teste de
concordan).

Ipoteza nul i ipoteza alternativ


(Null hypothesis and alternative
hypothesis)
Afirmaii asupra unuia sau mai multor parametri,
sau asupra unor repartiii, care urmeaz a fi
validate prin teste statistice. Decizia asupra
ipotezei nule este luat pe baza unui test statistic.
Testul statistic este construit cu elemente
aleatoare, luarea deciziei comport un anumit risc
de eroare.

H 0 ( p1 p 2 )

H 1 ( p1 p 2 )

Ipoteza nul (H0) se refer la afirmaii supuse


testrii, n timp ce ipoteza alternativ (H1) se
refer la afirmaii care vor fi acceptate dac se
respinge ipoteza nul.

Exemple de diferite ipoteze


Testarea ipotezei c media a unei variabile
aleatoare X dintr-o populaie nu este inferioar/
sau superioara unei valori date m0
Testarea ipotezei c proporiilor indivizilor
neconformi din dou populaii, p1 i p2 au
aceeai valoare (nespecificat)
Testarea ipotezei c o variabil aleatoare X are
o repartiie normal (cu parametri
nespecificai);Ipoteza alternativ: repartiia nu
este normal.

Erori in verificarea ipotezelor


statistice (Hypothesis testing errors)
Erori ce se pot face n procesul de verificare a
ipotezelor statistice.
Eroare de genul nti: ipoteza H se respinge, cnd
ea este adevrat.
Eroare de genul al doilea: ipoteza H se admite,
cnd ea este fals.
Probabilitile de a fi comise cele dou tipuri de erori
sunt: probabilitatea erorii de genul nti risc de
genul I i respectiv probabilitatea erorii de genul al
doilea-risc de genul II .

Puterea testului
(Power of a test)

Probabilitatea de a nu comite eroarea


de tipul II. Aceast probabilitate, n
general notat cu ( 1- beta), corespunde
respingerii ipotezei nule, cnd aceasta
este fals.

Test statistic
(Statistical test)

Procedura statistic prin care se decide dac


ipoteza nul poate fi respins n favoarea
ipotezei alternative sau nu.
n general, un test preia apriori o anumit
ipotez, care trebuie verificat (de exemplu,
ipoteza de independen a observaiilor,
ipoteza de normalitate etc.).
Testele pot fi construite cu ajutorul mediei
aritmetice i cu ajutorul altor variabile
aleatoare de sondaj, acestea numindu-se de
regul statistici decizionale ale testului
statistic

Testul t Student
Testul statistic n care, pentru validarea ipotezei nule, statistica
utilizat presupune existena repartiiei t (Student)
Testul este aplicat, de exemplu, la urmtoarea problema : cnd
se verific ipoteza Ho: m 1= m0, indicatorul t are expresia:

x1 m 0
t
s
Cu

n 1

grade de libertate, n fiind volumul eantionului

Test U (U test)
Test utilizat pentru verificarea ipotezelor
referitoare la mediile populaiilor normale
cnd se cunosc dispersiile teoretice.
Testul U are forme diferite, n funcie de
ipotezele statistice formulate:
De exemplu, cnd se verific ipoteza H0: m
= m0, testul U are expresia:
x m0
U

S-ar putea să vă placă și