Sunteți pe pagina 1din 14

Statistica Sociala

Curs Blackboard sem. II, anul I Fac. de Sociologie-Psihologie

LECłIA 1 . GRUPAREA DATELOR

Să presupunem că s-au înregistrat notele obŃinute de studenŃii anului II la examenul de


statistică socială. Rezultatele sunt prezentate aceste date grupat astfel:

Nota 1 2 3 4 5 6 7 8 9 10
Nr. 0 1 2 5 10 25 31 25 15 6
stud.

Din aceste date putem trage unele concluzii privind nivelul de pregătire şi de
prezentare la examen a studenŃilor.Analiza statistică a unui fenomen, în raport cu o singură
caracteristică conduce la prezentarea unei serii de perechi de valori, pe care o vom numi serie
statistică. În cazul caracteristicilor calitative, prima valoare a perechii din seria statistică nu mai
este numerică.

Exemplu: Să considerăm drept exemplu distribuŃia după caracteristica sex a unei populaŃii
statistice:

Sex Masculin Feminin Total


Nr. unit. 86 94 180
statistice

De asemenea, distribuŃia după caracteristica grupei de vârstă a unei populaŃii active în


câmpul muncii, ar genera o serie statistică a cărei primă valoare este cuprinsă între 18 şi 62 ani.

Vârsta 18 19 20 .............................................62
Nr. unit. ................................................................
statistice

Din motive practice se pot face grupări pe intervale mai mari ale vârstei subiecŃilor,
de exemplu din 5 în 5 ani sau din 10 în 10 ani, astfel:

Grupe de 18 - 21 - 31 - 41 - 51 - 61 -
vârstă 20 30 40 50 60 62
Nr. unit.
statistice

Istoria Psihologiei curs sem II-Blackboard 1


II. FRECVENłĂ ABSOLUTĂ. FRECVENłĂ RELATIVĂ.
FRECVENłE CUMULATE
Numim frecvenŃă absolută a unei valori a caracteristicii numărul de
unităŃi ale populaŃiei statistice corespunzătoare acelei valori.
De exemplu, în tabela distribuŃiei după caracteristica sex, valoarea 86
reprezintă numărul persoanelor masculine sau frecvenŃa absolută
respectivă. Analog, 94 reprezintă frecvenŃa absolută sau numărul
persoanelor de sex feminin.
Suma frecvenŃelor absolute ale tuturor valorilor caracteristicii este
egală cu totalul populaŃiei statistice.
Numim frecvenŃă relativă a unei valori m a caracteristicii raportul
dintre frecvenŃa absolută a valorii respective m a caracteristicii şi totalul
populaŃiei statistice. Vom scrie:
f=
m
n
unde:
f -este frecvenŃa valorii respective a caracteristicii; m -
este frecvenŃa absolută a acestei valori;
n -este totalul populaŃiei statistice.
Revenind la exemplul anterior, frecvenŃele relative vor fi:
86
f1 = =0,48 sau 48%
180
94
f2 = =0,52 sau 52%
180
Tabela respectivă devine:
 Masculin Feminin
 
 
0 ,48 0,52
Seria statistică asociată unei caracteristici statistice se poate asocia cu
distribuŃia unei variabile aleatoare, care, reamintim, este un tabel de forma:
 x 1x 2 x n
 
 
 p 1p 2 p n
în care x1, x2,... ....... .xn sunt valorile aleatoare corespunzătoare cu
probabilităŃile p1, p2,... ... ...pn.
Evident, avem că p1 + p2 +... ......+ pn = 1

Istoria Psihologiei curs sem II-Blackboard 2


De multe ori, putem folosi termenul de variabilă statistică în loc de
caracteristică.
Numim frecvenŃă absolută cumulată a unei valori x a variabilei
statistice, suma frecvenŃelor absolute ale tuturor valorilor variabilei care
apar până la valoarea x inclusiv.

Istoria Psihologiei curs sem II-Blackboard 3


III. REPREZENTAREA GRAFICĂ A SERIILOR STATISTICE

Să considerăm distribuţia investiţiilor în câteva sectoare ale economiei naţionale:

Sectorul Investiţii procentuale


A...........................................................................................…5,5%
B.........................................................................................…..14,5%
C...............................................................................................20%
D...............................................................................................25%
E................................................................................................35%
__________________________________________________________
Total investiţii 100%

25%
35%

5.50% 20%

14.50%

Reprezentarea grafică corespunzătoare poartă denumirea de diagramă.


Seriile cu caracteristică cantitativă se reprezintă grafic în raport cu un sistem de axe. Astfel, distribuţia de
mai sus poate fi reprezentată grafic prin mai multe feluri:
a) Reprezentarea prin batoane

40

30
20
10

0
A B C D E F

b) Reprezentarea prin histograme


40
30
20
10
0
1 2 3 4 5 6

Istoria Psihologiei curs sem II-Blackboard 4


În cazul reprezentărilor spaţiale se utilizează cartodiagramele.
Diagramele în cerc sau dreptunghiulare se mai numesc diagrame de structură.
Histogramele se utilizează în cazul seriilor cu intervale egale. Ulterior se poate construi poligonul
frecvenţelor.
Dacă unim punctele poligonului de frecvenţă printr-o curbă oarecare, obţinem curba frecvenţelor sau
curba de distribuţie.

FORMA DISTRIBUŢIILOR CU O CARACTERISTICĂ

1. Distribuţii simetrice. Se prezintă sub forma unui clopot. Cele mai răspândite distribuţii simetrice sunt
distribuţiile normale care urmează legea normală de probabilitate studiată de Laplace şi K. J. Gauss.
2. Distribuţii uşor asimetrice.
3. Distribuţii pronunţat asimetrice.
4. Distribuţii în formă de J.
5. Distribuţii în formă de U.

Istoria Psihologiei curs sem II-Blackboard 5


IV. ELEMENTE CARACTERISTICE ALE UNEI
SERII STATISTICE
Vom numi valoare centrală a unei clase de variaŃie media
aritmetică a extremităŃilor acestei clase.
Modul sau dominanta unei serii statistice este valoarea
caracteristicii corespunzătoare celei mai mari frecvenŃe.
Mediana unei serii este un număr x cu proprietatea că există
atâtea unităŃi statistice corespunzătoare valorilor mai mici decât x, cât
şi cele corespunzătoare valorilor mai mari decât x.
Media aritmetică. Dacă x1, x2,... ..xn sunt n valori, atunci
media aritmetică a lor este:
x1 + x 2 + + xn
n

În cazul distribuŃiei variabilei x:

Valori x1 x2............................................. ..xn


FrecvenŃe y1 y2................................................yn

Valoarea medie a variabilei respective este:


x 1y1 + x 2 y2 + + x n yn
x= y 1+y 2+ +y n

dacă N = y1 + y2 +.. +.yn este totalul populaŃiei, atunci:

Istoria Psihologiei curs sem II-Blackboard 6


x = x 1 f 1+ x 2 f 2 + + x nf n
yi
unde f i = , i = 1, 2, … , n.
N

DISPERSIA

Fiind date n valori x1, x2,... ..xn cu media x , numim


dispersia acestor valori, mărimea:
2 1n 2
σ = ∑ ( x i −x ) ,
ni 1
=

iar mărimea σ = σ 2 se numeşte abaterea medie pătratică.


Abaterea medie pătratică indică gradul de împrăştiere a valorilor în
jurul mediei aritmetice. Din inegalitatea lui Cebişov rezultă că în
intervalul
[x − 2σ , x + 2σ ]
se află mai mult de 3/4 din numărul abaterilor.

Istoria Psihologiei curs sem II-Blackboard 7


V. VARIABILE ALEATOARE

O variabilă aleatoare este un tabel de forma:

 x 1 x 2 xn 
X : 

 p 1 p 2 pn 

unde xi sunt valorile pe care le poate lua variabila x cu probabilităŃile pi.


În plus, este îndeplinită conotaŃia:

p1 + p2 + ... ...pn = 1

Pot exista variabile aleatoare diferite cu aceeaşi distribuŃie.

OperaŃii cu variabile aleatoare

Dacă

 x 1x 2 x m y 1y 2 y n
X:  ,Y :  şi a o
 p p p q q q
 1 2 m  1 2 n

constantă reală, atunci se definesc v.a. Următoare:

 ax 1 ax 2 ax n   a +x 1a +x 2 a +x n
aX :  ; a +X :   ;
  

 p1 p2 p n  p1 p2 pn 

Istoria Psihologiei curs sem II-Blackboard 8


 x 1+ y1 x 2+y 2 x m+ y n
X + Y :  
 p 11 p 12 p mn 

unde pij este probabilitatea realizării simultane a evenimentelor X = xi,


Y = yj
 x 1y 1x 2y 2 x my n
XY : 
 p p p 
 11 12 mn 

unde pij este definit ca mai sus.

Variabile aleatoare independente


V.a. X şi Y sunt independente dacă evenimentele X = xi şi Y = yj sunt
independente pentru toate cuplurile i şi j.
Putem scrie:
pij = P( X = xi , Y = yj ) = P ((X = xi) (Y = yj) ) = P(X = xi)P(Y = yj) =
piqj

Valoarea medie a unei v.a.

Valoarea medie a v.a. X este:


M(X) = m = x = p1x1 + p2x2 + … + pnxn
Numim moment de ordin k al v.a. X, valoarea medie a v.a. Xk:
Mk(X) = M(Xk) = p1x1k + … + pnxnk
Variabila X-M(X) se numeşte abaterea de la medie a v.a. X

Cel mai bun indicator al împrăştierii unei v.a. este dat de expresia:
M[(X-m)2]
Care este un moment centrat de ordinul al doilea numit dispersia v.a.
X

Istoria Psihologiei curs sem II-Blackboard 9


σ2 = D2(X)= M[(X-m)2] , m = M(X)

2 2 2
σ=
σ = D(X) = M ( X −M ( X )
)

se numeşte abatere medie pătratică.

Inegalitatea lui Cebîşev:


σ 2
P(|X-m| < ε) ≥ 1 -
ε 2

Unde m = M(X) iar σ2 este dispersia v.a. X

CovarianŃa a 2 v.a. X şi Y este coeficientul

µ XY = M[(X − X)(Y − Y)] = M(XY) − M(X) ⋅ M(Y)

Coeficientul de corelaŃie a 2 v.a. X şi Y este

µ XY M(XY) − M(X) ⋅ M(Y)


ρ XY = =
σ σ 2 2 2 2
X Y M(X ) − M (X) ⋅ M(Y ) − M (Y)

ProprietăŃi:

1) -1 ≤ ρXY ≤ 1
2) Dacă ρ = ± 1 între v.a. X şi Y există o dependenŃă liniară. Astfel:
σ Y
y - M(Y) = ( X - M(X)) , (cazul ρ = 1)
σ X

σ Y
y - M(Y) = - ( X - M(X)) , (cazul ρ = -1)
σ X

Istoria Psihologiei curs sem II-Blackboard 10


3) Dacă v.a. X şi Y sunt independente, atunci ρXY = 0

Coeficientul de variaŃie (sau de împrăştiere)


σX
V=
M (X)

Istoria Psihologiei curs sem II-Blackboard 11


VI. CORELAłIA RANGURILOR

Fie n unităŃi statistice A1, A2, … , An fiecare fiind definită prin 2


caracteristici:
(x1, y1) , (x2, y2) , … , (xn, yn)

Ne punem problema existenŃei unei corelaŃii între aceste caracteristici.

Coeficientul de corelaŃie a rangurilor al lui Spearman:


6 ∑ d i2
ρ= 1− 2 , (n > 1)
n(n− 1)

ProprietăŃi: -1 ≤ ρ ≤ 1

Coeficientul de corelaŃie a rangurilor al lui Kendall


2 ( P −Q )
r=
n ( n −1 )
unde P este un indicator al concordanŃei pozitive, iar Q un indicator al
concordanŃei negative.

CoeficienŃi de corelaŃie parŃială şi multiplă

 x i  y i  z i
Dacă X :   ,Y: , Z:  sunt 3 v.a. şi m11=M(x-m1)2 ;


p   q  r
i  i  i
m12 = M(x-m1)(y-m2) , m22=M(x-m2)2,
atunci

m 12
ρ 12 =
m 11 m 22

este coeficientul de corelaŃie parŃială între variabilele X şi Y. În


mod analog se defineşte ρ23 şi ρ31.

Istoria Psihologiei curs sem II-Blackboard 12


CorelaŃia dintre variabila X şi grupul Y şi Z se stabileşte de către
coeficientul de corelaŃie multiplu:

M
ρ 1 . 23 = 1−
m 11 M 11

unde

 m 11 m 12 m 13 
 
M =  m 21 m 22 m 23 
 
 m 31 m 32 m 33 

iar M este minorul elementului mij din |M|ij


În mod analog,

M M
ρ 2 . 31 = 1− şi ρ 3 . 12 = 1−
m 22 M m 33 M 33
22

Coeficientul multiplu între variabilele Xi şi grupul (X1, … , Xi-1, Xi+1,


… , Xn) este dat de formula:
M
ρ i ; 1 , 2 ,..., i −1 , i + 1 ,..., n = 1−
m ii M ii

ANALIZA DE REGRESIE
Fie o distribuŃie teoretică discretă de 2 variabile bidimensionale, X şi Y de
repartiŃii
 a i  b j
X:  ,Y: 
   
 p i  q j
şi P(X=ai , Y=bj)

Istoria Psihologiei curs sem II-Blackboard 13


Se pune problema determinării parametrilor α şi β astfel încât:

M(Y-αX-β)2 = min

sau

n n

∑∑ p ij (b j − α ai − β )2 = minim
i= 1 j = 1

analiza de regresie rezolvă această problemă a minimizării sau a găsirii


dreptelor de cea mai bună aproximare, obŃinându-se dreptele de regresie:
σ X
y - M(Y) = ρ ( X - M(X)) şi
σ Y

σ Y
y - M(Y) = ρ ( X - M(X))
σ X
cu centrul de greutate: (M(X), M(Y))

“””Copied from Blackboard Academic Suite-Universitatea Spiru


Haret///All rights reserved to Universitatea Spiru Haret///copied by
dumy1dumy@yahoo.com”””

Istoria Psihologiei curs sem II-Blackboard 14

S-ar putea să vă placă și