Sunteți pe pagina 1din 28

 Consistenţa şi acurateţea datelor

influenţează corectitudinea rezultatelor


unei analize statistice.
 Consistenţa şi acurateţea datelor depind
de metoda de colectare.
 Trei dintre cele mai uzitate surse de date
statistice sunt:
◦ Date publicate
◦ Rezultate ale anchetelor şi sondajelor
◦ Studii experimentale
Procedeu prin care se caracterizează o
populaţie în baza cercetării unei parţi a
acesteia (eşantion) prelevate din întreaga
colectivitatea generală.
Rezultatele obţinute pe baza sondajului se
extrapolează la dimensiunea întregii
populaţii. Extinderea rezultatelor, de la
parte la întreg, are caracter probabilistic,
adică este supusă riscului de a fi eronată.
Totuşi avantajul sondajului constă în faptul
că erorile pot fi predimensionate, fixându-
se o probabilitate de garantare a
rezultatelor.
 Una sau mai multe unităţi de eşantionare
prelevate dintr-o populaţie şi destinate să
furnizeze informaţii despre această
populaţie. Un eşantion poate servi ca bază
pentru o decizie asupra populaţiei (sau
procesului de producţie).
 Este unanim acceptat faptul că, cu cât un
eşantion este mai mare, cu atât va reflecta
mai fidel proprietăţile întregii populaţii.
 Eşantionarea în care fiecare unitate de
eşantionare prelevată, după observare,
este reintrodusă în populaţie, înainte de
prelevarea următoarei unităţi de
eşantionare.
 În acest caz, aceeaşi unitate de
eşantionare poate apare în eşantion de
mai multe ori.
 Eşantionul din n unităţi de eşantionare
prelevat dintr-o populaţie de N indivizi astfel
ca toate combinaţiile posibile de n unităţi de
eşantionare au aceeaşi probabilitate de a fi
prelevate.
 Într-o eşantionare sistematică periodică, este
intervalul la finele căruia este prelevată o
unitate de eşantionare
 Intervalele de eşantionare pot fi de lungimi

egale sau de lungimi dependente de durata


de fabricaţie, de desfăşurare a procesului sau
de sezonalitate, perioade (de timp) în
repetarea cercetărilor etc.
 Diferenţa dintre valoarea reală şi cea estimată
a unui parametru al populaţiei originare
 Considerând toate eşantioanele de acelaşi

volum, eroarea de sondaj apare ca o variabilă


aleatoare
◦ Aceste erori apar din cauza greşelilor făcute pe
parcursul procesului de obţinere a datelor
◦ Creşterea volumului eşantionului nu va reduce
aceste tipuri de erori
◦ Există trei tipuri de erori de sondaj:
 Erori de obţinere a datelor,
 Erori de non-răspuns,
 Erori de reprezentativitate
 Diferenţa dintre valoarea unui indicator
sintetic calculată pe baza informaţiei
cuprinse în eşantion şi valoarea
indicatorului de acelaşi tip din populaţia
originară.
 Eroarea de reprezentativitate sistematică
este determinată de nerespectarea
tehnicilor de sondaj, care face astfel
posibilă deplasarea eşantionului ales în
raport cu eşantionul care se intenţiona a fi
obţinut.
 Eroarea de reprezentativitate întâmplătoare
derivă din însăşi natura cercetării pe bază
de sondaj, aceasta având drept obiect
numai o parte a populaţiei originare
 Eroarea maximă care se poate admite în
cercetarea pe bază de sondaj şi care se
stabileşte anticipat în funcţie de gradul de
variaţie a caracteristicii cercetate, de
volumul necesar al eşantionului şi de
probabilitatea cu care se garantează
aceste erori.
 Într-o populaţie care poate fi divizată în
diferite subpopulaţii separate (numite
straturi), eşantionarea este efectuată astfel
încât proporţiile specificate ale eşantionului
sunt extrase din diferitele straturi şi din
fiecare strat este extrasă cel puţin o unitate
de eşantionare.
 I. Sondaje aleatoare
 Simplu
 Tipic
 De serii
 Secvenţial
 În trepte
 II. Sondaje dirijate
 III. Sondaje sistematice
 Fiecare din tipurile de sondaj poate fi
efectuat în 2 variante
a. Repetat – o unitate prelevată din populaţia
generală este restituită şi astfel are şansa de
a reintra în eşantion
b. Nerepetat – unitatea prelevată nu mai este
reintrodusă în populaţia generală
Simboluri Număr Media Media Dispersia Dispersia
de caracteristicii caracteristicii caracteristicii caracteristicii
unităţi alternative
alternative

Populaţia N  p 2 p(1-p)
generală

Eşantion n x f s2 f(1-f)
 Operaţie de stabilire, în baza datelor unui
eşantion, a valorilor parametrilor repartiţiei
populaţiei din care a fost prelevat eşantionul.
Rezultatul, se poate exprima printr-o valoare
unică (estimator punctual), sau printr-un
interval.
 Spre deosebire de statistica descriptivă,
inferenţa statistică foloseşte procedee specifice
bazate pe modele matematice (în esenţă,
probabiliste) pentru analiza materialului
statistic organizat de metodele descriptive
 Acest procedeu de eşantionare împarte
populaţia în grupe, straturi (seturi) mutual
exclusive, şi apoi extrage aleator simplu
eşantioane din fiecare strat.

 Cu această procedură putem obţine informaţii


despre
 Întreaga populaţie
 Fiecare strat
 Legăturile dintre straturi.
Eşantionarea cluster este un sondaj aleator
simplu de grupuri sau clustere (serii) de
elemente.
Această procedură este utilă atunci când
 Este dificil şi implică costuri ridicate realizarea
unei liste complete a membrilor populaţiei
 Membrii populaţiei sunt dispersaţi geografic.
Eşantionarea cluster creşte erorile de sondaj
deoarece este probabil să existe similarităţi
între membrii unui cluster.
1. Intervalul de încredere

 pentru media aritmetică x  x    x  x

   
N

 pentru nivel totalizator N  x   x   xi  x   x  N


i 1

2. Eroarea limită sau maxim admisibilă

Dacă n  30, atunci  x  t  sx

Dacă n  30, atunci  x  z  sx


3. Eroarea medie de reprezentativitate

s2
sx 
n

4. Stabilirea volumului eşantionului

Dacă n  30, atunci


t 2
 s 2
n* 
*x2

z2  s2
Dacă n  30, atunci n  *

*x2
1.Intervalul de încredere
 pentru media aritmetică f f  p  f f
 
 pentru nivel totalizator N  f   f  M  f   f  N  
.  f 1  f 
m 2
Unde: xalt .  f  salt salt .  salt
2
.
n
2. Eroarea limită sau maxim admisibilă

Dacă n  30, atunci  f  t  sf


Dacă n  30, atunci  f  z  sf
3. Eroarea medie de reprezentativitate
2
salt f 1  f 
sf  .

n n
4. Stabilirea volumului eşantionului

t 2
 s 2

Dacă n  30, atunci n*  alt .


*f2

z 2
 s 2
Dacă n  30, atunci n*  alt .
*f2
1. Intervalul de încredere

 pentru media aritmetică x  x    x  x


   
N
 pentru nivel totalizator N  x   x   xi  x   x  N
i 1

2. Eroarea limită sau maxim admisibilă

Dacă n  30, atunci  x  t  sx

Dacă n  30, atunci  x  z  sx


3. Eroarea medie de reprezentativitate

s2 n n
sx   1 unde 1 este factor de corecţie
n N N

4. Stabilirea volumului eşantionului


t 2
 s 2

Dacă n  30, atunci n* 


t 2  s2
x 
*2

Dacă n  30, atunci z 2


 s 2
n* 
z2  s2
x 
*2

N
1.Intervalul de încredere
 pentru media aritmetică f f  p  f f
 
 pentru nivel totalizator N  f   f  M  f   f  N  
.  f 1  f 
m 2
Unde: xalt .  f  salt salt .  salt
2
.
n
2. Eroarea limită sau maxim admisibilă

Dacă n  30, atunci  f  t  sf


Dacă n  30, atunci  f  z  sf
3. Eroarea medie de reprezentativitate
2
salt n f 1  f  n
sf  .
 1   1
n N n N
n
unde 1 este factor de corecţie
N
4. Stabilirea volumului eşantionului
t 2  salt
2
Dacă n  30, atunci n*  .
t  salt
2 2
f 
*2 .
N
Dacă n  30, atunci z 2  salt
2
n 
* .
z  salt
2 2
f 
*2 .
N
1.Intervalul de încredere
 pentru media aritmetică f f  p  f f
 
 pentru nivel totalizator N  f   f  M  f   f  N  
.  f 1  f 
m 2
Unde: xalt .  f  salt salt .  salt
2
.
n
2. Eroarea limită sau maxim admisibilă

Dacă n  30, atunci  f  t  sf


Dacă n  30, atunci  f  z  sf
3. Eroarea medie de reprezentativitate
2
salt f 1  f 
sf  .

n n
4. Stabilirea volumului eşantionului

t 2
 s 2

Dacă n  30, atunci n*  alt .


*f2

z 2
 s 2
Dacă n  30, atunci n*  alt .
*f2

S-ar putea să vă placă și