Sunteți pe pagina 1din 15

STATISTIC SOCIAL

Conf. univ. dr. PETRU ALEXANDRESCU

OBIECTIVE

Pregtirea i familiarizarea studenilor cu principalele metode


statistice utilizate n cercetrile concrete din domeniul tiinelor sociale;
formarea unei gndiri statistice.
Statistica social se ocup cu gruparea, analiza i interpretarea datelor
referitoare la un fenomen social. Totodat se are n vedere i efectuarea
unor previziuni privind producerea fenomenului n viitor.
Analiza statistic a unui fenomen comport dou etape:
Statistica descriptiv, care nseamn procesul de culegere a datelor
asupra unui fenomen i nregistrarea acestora.
Statistica matematic care se ocup cu gruparea datelor, analiza
i interpretarea lor n vederea unor predicii asupra comportrii n viitor a
fenomenului.
Prin populaie statistic vom nelege orice mulime care formeaz
obiectul de studiu al analizei statistice.
Exemple de populaii statistice: populaia colar, populaia adult (de
peste 18 ani) etc.
Elementele unei populaii statistice se numesc uniti statistice, iar
nsuirea comun a tuturor elementelor statistice se va numi caracteristic.
O analiz statistic a unui fenomen social se efectueaz dup una sau
mai multe caracteristici care pot pune n lumin aspectele relevante ale
fenomenului luat n studiu.
Exemple:
1. Dac ne intereseaz rezultatele obinute de studenii unei faculti,
atunci mulimea tuturor studenilor formeaz populaia statistic.
Fiecare student al facultii respective va fi o unitate statistic, iar
notele obinute la examen vor constitui caracteristica studiat.
263

2. Dac n studiu avem n vedere numrul locuitorilor fiecrei


localiti din ar la o anumit dat, atunci mulimea localitilor
constituie populaia statistic, fiecare localitate devine o unitate
statistic, iar numrul lociutorilor la data respectiv a fiecrei
localiti devine caracteristica studiat.
O caracteristic care se poate msura se va numi caracteristic
cantitativ. n caz contrar, caracteristica se va numi calitativ.
Caracteristicile din exemplele anterioare sunt cantitative. Alte exemple
de caracteristici cantitative sunt: vrsta, salariul lunar, venitul obinut etc.
Exemple de caracteristici calitative: sexul, profesia, culoarea ochilor etc.
Unele caracteristici se constat c pot lua numai valori ntregi (numrul
de locuitori ai unui ora, numrul pensionarilor dintr-o localitate, numrul
firmelor etc.). Aceste caracteristici se vor numi discrete.
O caracteristic care poate lua orice valoare, numr real, dintr-un
interval finit sau infinit se numete continu. Astfel de caracteristici pot fi:
greutatea fiecrui individ al unei populaii statistice, nlimea indivizilor
unei populaii etc.
I. GRUPAREA DATELOR

S presupunem c s-au nregistrat notele obinute de studenii anului II


la examenul de statistic social. Rezultatele sunt prezentate aceste date
grupat astfel:
Nota
Nr. stud.

1
0

2
1

3
2

4
5

5
10

6
25

7
31

8
25

9
15

10
6

Din aceste date putem trage unele concluzii privind nivelul de pregtire
i de prezentare la examen a studenilor.
Analiza statistic a unui fenomen, n raport cu o singur caracteristic
conduce la prezentarea unei serii de perechi de valori, pe care o vom numi
serie statistic.
n cazul caracteristicilor calitative, prima valoare a perechii din seria
statistic nu mai este numeric.
Exemplu: S considerm drept exemplu distribuia dup caracteristica
sex a unei populaii statistice:
Sex
Nr. unit. statistice
264

Masculin
86

Feminin
94

Total
180

De asemenea, distribuia dup caracteristica grupei de vrst a unei


populaii active n cmpul muncii, ar genera o serie statistic a crei prim
valoare este cuprins ntre 18 i 62 ani.
Vrsta
Nr. unit. statistice

18 19 20 .......................................................................62
.............................................................................................

Din motive practice se pot face grupri pe intervale mai mari ale
vrstei subiecilor, de exemplu din 5 n 5 ani sau din 10 n 10 ani, astfel:
Grupe de vrst
Nr. unit. statistice

18 - 20

21 - 30

31 - 40

41 - 50

51 - 60

61 - 62

II. FRECVEN ABSOLUT. FRECVEN RELATIV. FRECVENE


CUMULATE

Numim frecven absolut a unei valori a caracteristicii numrul de


uniti ale populaiei statistice corespunztoare acelei valori.
De exemplu, n tabela distribuiei dup caracteristica sex, valoarea 86
reprezint numrul persoanelor masculine sau frecvena absolut
respectiv. Analog, 94 reprezint frecvena absolut sau numrul
persoanelor de sex feminin.
Suma frecvenelor absolute ale tuturor valorilor caracteristicii este
egal cu totalul populaiei statistice.
Numim frecven relativ a unei valori m a caracteristicii raportul
dintre frecvena absolut a valorii respective m a caracteristicii i totalul
populaiei statistice. Vom scrie:
f=
unde:

m
n

f este frecvena valorii respective a caracteristicii;


m este frecvena absolut a acestei valori;
n este totalul populaiei statistice.
Revenind la exemplul anterior, frecvenele relative vor fi:
f1 = 86 =0,48 sau 48%
180
f2 = 94 =0,52 sau 52%
180

Tabela respectiv devine:


Masculin Feminin

0,52
0,48

265

Seria statistic asociat unei caracteristici statistice se poate asocia cu


distribuia unei variabile aleatoare, care, reamintim, este un tabel de forma:

x1

p1

x2
p2

... x n

... p n

n care x1, x2,.............xn sunt valorile aleatoare corespunztoare cu


probabilitile p1, p2,.........pn.
Evident, avem c p1 + p2 +.........+ pn = 1
De multe ori, putem folosi termenul de variabil statistic n loc de
caracteristic.
Numim frecven absolut cumulat a unei valori x a variabilei
statistice, suma frecvenelor absolute ale tuturor valorilor variabilei care
apar pn la valoarea x inclusiv.
III. REPREZENTAREA GRAFIC A SERIILOR STATISTICE

S considerm distribuia investiiilor n cteva sectoare ale


economiei naionale:
Sectorul
Investiii procentuale
A...........................................................................................5,5%
B...........................................................................................14,5%
C...............................................................................................20%
D...............................................................................................25%
E................................................................................................35%
__________________________________________________________
Total investiii
100%

25%
35%

5.50%
14.50%

266

20%

Reprezentarea grafic corespunztoare poart denumirea de


diagram.
Seriile cu caracteristic cantitativ se reprezint grafic n raport cu un
sistem de axe. Astfel, distribuia de mai sus poate fi reprezentat grafic prin
mai multe feluri:
a) Reprezentarea prin batoane
40
30
20
10
0
A B C D E F

b) Reprezentarea prin histograme


40
30
20
10
0
1 2 3 4 5 6

n cazul reprezentrilor spaiale se utilizeaz cartodiagramele.


Diagramele n cerc sau dreptunghiulare se mai numesc diagrame de
structur.
Histogramele se utilizeaz n cazul seriilor cu intervale egale.
Ulterior se poate construi poligonul frecvenelor.
Dac unim punctele poligonului de frecven printr-o curb
oarecare, obinem curba frecvenelor sau curba de distribuie.
267

IV. FORMA DISTRIBUIILOR CU O CARACTERISTIC

1. Distribuii simetrice. Se prezint sub forma unui clopot. Cele mai


rspndite distribuii simetrice sunt distribuiile normale care
urmeaz legea normal de probabilitate studiat de Laplace i
K. J. Gauss.

2.
3.
4.
5.

Distribuii uor asimetrice.


Distribuii pronunat asimetrice.
Distribuii n form de J.
Distribuii n form de U.

V. ELEMENTE CARACTERISTICE ALE UNEI SERII STATISTICE

Vom numi valoare central a unei clase de variaie media


aritmetic a extremitilor acestei clase.
Modul sau dominanta unei serii statistice este valoarea
caracteristicii corespunztoare celei mai mari frecvene.

268

Mediana unei serii este un numr x cu proprietatea c exist attea


uniti statistice corespunztoare valorilor mai mici dect x, ct i cele
corespunztoare valorilor mai mari dect x.
Media aritmetic. Dac x1, x2,.....xn sunt n valori, atunci media
aritmetic a lor este:

x 1 + x 2 + ... + x n
n

n cazul distribuiei variabilei x:


Valori
Frecvene

x1
y1

x2...............................................xn
y2...............................................yn

Valoarea medie a variabilei respective este:

x=

x 1 y1 + x 2 y 2 + ... + x n y n
y1 + y 2 + ... + y n

dac N = y1 + y2 +.............yn este totalul populaiei, atunci:

x = x 1f1 + x 2 f 2 + ... + x n f n

unde f i =

yi
, i = 1, 2, , n.
N
VI. DISPERSIA

Fiind date n valori x1, x2,........xn cu media


acestor valori, mrimea:

2 =

x , numim dispersia

1 n
(x i x) 2 ,
n i=1

iar mrimea = 2 se numete abaterea medie ptratic.


Abaterea medie ptratic indic gradul de mprtiere a valorilor n jurul
mediei aritmetice. Din inegalitatea lui Cebiov rezult c n intervalul

[ x 2, x + 2]

se afl mai mult de 3/4 din numrul abaterilor.

269

VII. VARIABILE ALEATOARE

O variabil aleatoare este un tabel de forma:

x
X : 1
p1

x2 ...
p2 ...

xn

pn

unde xi sunt valorile pe care le poate lua variabila x cu probabilitile pi. n


plus, este ndeplinit conotaia:
p1 + p2 + ......pn = 1
Pot exista variabile aleatoare diferite cu aceeai distribuie.
Operaii cu variabile aleatoare

x1

Dac X :
p1

x 2 ... x m
y
, Y : 1
p 2 ... p m
q1

y 2 ... y n
i a R o
q 2 ... q n

constant, atunci se definesc v.a. urmtoare:

ax
aX : 1
p1

ax 2 ... ax n
a + x1
; a + X :
p 2 ... p n
p1

x + y1
X + Y : 1
p11

x 2 + y2
p12

a + x2
p2

... a + x n
;
...
p n

... x m + y n

...
p mn

unde pij este probabilitatea realizrii simultane a evenimentelor X = xi , Y = yj

x y
XY : 1 1
p11

x 2 y2
p12

... x m y n

... p mn

unde pij este definit ca mai sus.


Variabile aleatoare independente
V.a. X i Y sunt independente dac evenimentele X = xi i Y = yj sunt
independente pentru toate cuplurile i i j.
Putem scrie:
pij = P( X = xi , Y = yj ) = P ((X = xi) (Y = yj) ) = P(X = xi)P(Y = yj) = piqj

270

Valoarea medie a unei v.a.


Valoarea medie a v.a. X este:
M(X) = m = x = p1x1 + p2x2 + + pnxn
Numim moment de ordin k al v.a. X, valoarea medie a v.a. Xk:
Mk(X) = M(Xk) = p1x1k + + pnxnk
Variabila X-M(X) se numete abaterea de la medie a v.a. X
Cel mai bun indicator al mprtierii unei v.a. este dat de expresia:
M[(X-m)2]
Care este un moment centrat de ordinul al doilea numit dispersia v.a. X

2 = D2(X)= M[(X-m)2]
= = D(X) =
2

, m = M(X)

M(X 2 ) M 2 (X)

se numete abatere medie ptratic.


Inegalitatea lui Cebev:

2
P(|X-m| < ) 1 - 2

Unde m = M(X) iar 2 este dispersia v.a. X


Covariana a 2 v.a. X i Y este coeficientul

XY = M[(X X )(Y Y )] = M (XY) M (X) M (Y)


Coeficientul de corelaie a 2 v.a. X i Y este

XY =

XY
=
XY

M (XY) M (X) M (Y)

M (X 2 ) M 2 (X) M (Y 2 ) M 2 (Y)

Proprieti:
1) -1 XY 1
2) Dac = 1 ntre v.a. X i Y exist o dependen liniar. Astfel:

Y
( X - M(X)) , (cazul = 1)
X

y - M(Y) = - Y ( X - M(X)) , (cazul = -1)


X
y - M(Y) =

3) Dac v.a. X i Y sunt independente, atunci XY = 0


271

Coeficientul de variaie (sau de mprtiere)


V=

M (X )

VIII. CORELAIA RANGURILOR

Fie n uniti statistice A1, A2, , An fiecare fiind definit prin 2


caracteristici:
(x1, y1) , (x2, y2) , , (xn, yn)
Ne punem problema existenei unei corelaii ntre aceste caracteristici.
Coeficientul de corelaie a rangurilor al lui Spearman:

6 d i2
= 1
,
n (n 2 1)

(n > 1)

Proprieti: -1 1
Coeficientul de corelaie a rangurilor al lui Kendall

r=

2(P Q)
n (n 1)

unde P este un indicator al concordanei pozitive, iar Q un indicator al


concordanei negative.
Coeficieni de corelaie parial i multipl

xi

yi

zi

Dac X : , Y : , Z : sunt 3 v.a. i m11=M(x-m1)2 ;


pi
qi
ri
m12 = M(x-m1)(y-m2) , m22=M(x-m2)2,
atunci

12 =

m12
m11m 22

este coeficientul de corelaie parial ntre variabilele X i Y. n mod analog


se definete 23 i 31.
Corelaia dintre variabila X i grupul Y i Z se stabilete de ctre
coeficientul de corelaie multiplu:
272

1.23 = 1
m11

unde M = m 21
m
31
iar

M ij

M
m11 M11

m13

m 23
m 33

m12
m 22
m 32

este minorul elementului mij din |M|

n mod analog,

2.31 = 1

M
m 22 M 22

i 3.12 = 1

M
m 33 M 33

Coeficientul multiplu ntre variabilele Xi i grupul (X1, , Xi-1, Xi+1, , Xn)


este dat de formula:

i;1, 2,...,i1,i+1,...,n = 1

M
m ii M ii

IX. ANALIZA DE REGRESIE


Fie o distribuie teoretic discret de 2 variabile bidimensionale, X i Y de
repartiii

bj
a
X : i , Y :
pi
q j
i P(X=ai , Y=bj)
Se pune problema determinrii parametrilor i astfel nct:
M(Y-X-)2 = min
sau
n

p ij (b j a i ) 2 = minim
i =1 j=1

analiza de regresie rezolv aceast problem a minimizrii sau a gsirii


dreptelor de cea mai bun aproximare, obinndu-se dreptele de regresie:
273

X
( X - M(X)) i
Y

y - M(Y) = Y ( X - M(X))
X

y - M(Y) =

cu centrul de greutate: (M(X), M(Y))


X. ANALIZ CAUZAL

Termeni echivaleni: path analysis, cauzal analysis, analiz de


dependen.
Problema care se pune este determinarea relaiilor ntr-un
ansamblu de variabile n contextul unei structuri cauzale.
Numim variabil orice criteriu de clasificare fie c este vorba de o
nsuire dichotomic (sexul), de ordin (nivelul de colarizare) sau variabil
cantitativ (precum venitul).
Metodele mai importante aparin lui Simon, H. Blalock i
R. Boudon.
Metodele se bazeaz pe observaia coeficienilor de corelaie liniar
ntre variabile care au la baz tehnicile clasice ale analizei de regresie.
XI. MODELUL RECURSIV

(M. Simon, H. Blalock, R. Boudon, Duncan i Alker)


Ipoteze:
I. Relaiile sunt liniare.
Orice variabil a graficului este exprimat ca funcie liniar de una sau mai
multe variabile.
Ex. x2=a12x1+e2
x1
x1
x2

x3

x4
x4=a24x2+a34x3+e4
274

e2

x2

II. Nu exist efect de interaciune.


III. Reziduurile ei nu sunt corelate ntre ele.
x1

Sistemul de ecuaii ataat grafului


orientat alturat:
x3

x2
x4

x2=a12x1+e2
x3=a23x2+e3
x4=a14x4+a24x2+a34x3+e4

XII. EANTIONAREA

Eantionarea reprezint acel procedeu statistic prin care se prelev


un lot al populaiei statistice intrate n studiu, numit eantion, i ale crei
caracteristici pot fi extinse, prin interferen statistic, la ntreaga populaie
statistic, numit adesea i universul de eantionare.
Principiul de baz al eantionrii este ca fiecare element al
colectivitii statistice s aib anse reale, nenule, de apariie n lotul de
selecie numit eantion.
Reprezentativitatea eantionului este capacitatea acestuia de a reproduce
ct mai fidel structurile i caracteristicile populaiei din universul de
eantionare.
Gradul de reprezentativitate este msurat de 2 indicatori:
d = eroarea maxim care exprim diferena cea mai mare pe care o
aceptm ntre o valoare v* din eantion i v- valoarea
corespunztoare populaiei;
P nivelul de ncredere care arat ce anse sunt ca eroarea real
comis s nu depeasc eroarea maxim admis (v* - d, v* + d)
interval de ncredere.
Gradul de reprezentativitate al unui eantion depinde de:
caracteristicile populaiei;
mrimea eantionului;
procedura de eantionare folosit.

275

Tehnici de eantionare:
Eantionare
aleatoare (probabilistic);
nealeatoare.
Tipuri de eantionare:
Eantionarea simpl aleatoare;
Eantionarea prin stratificare;
Eantionarea multistadial;
Eantionarea pe cote;
Eantionarea fixe (panel).
Tipuri de erori:
de eantionare;
de observare.
Organizarea unui sondaj statistic.
Dosarul unui sondaj.
Construirea unei baze de sondaj.
Construirea unui model de eantion noional.
Teste de semnificaie:
testul
mi frecvene teoretice;
hi frecvene experimentale.
Grade de libertate, prag de semnificaie.
Interpretare. Ipoteza nul.
XIII. CHESTIONARUL PSIHO-SOCIOLOGIC

Tipuri de ntrebri:
dup coninut:
factuale, de opinie, de cunoatere;
dup forma de nregistrare a rspunsurilor:
nchise, deschise, ntrebri cu posibiliti multiple de rspuns.

276

Analiza scalar (de ierarhizare):


Tipuri de scale:
scale nominale;
scale ordinale;
scale cu intervale;
scale proporionale.
Analiza non rspunsurilor.
Analiza metodelor bazate pe ierarhii.
Paradoxul lui
Indicatorii de agregare.
BIBLIOGRAFIE SELECTIV
1. Alexandrescu P., Introducere n statistica social, Editura Paralela 45, Bucureti,
2004.
2. Chelcea S., Metodologia cercetrii sociologice Metode cantitative i calitative,
Editura Economic, Bucureti, 2001.
3. Rotariu T., Ilu P., Ancheta sociologic i sondajul de opinie, Editura Polirom,
Iai, 1997.
4. Sandu. D., Statistica n tiinele sociale, Universitatea Bucureti, 1992.

277