Sunteți pe pagina 1din 4

Curs 7

1. Regula de compunere a variabilităţii

În cazul seriilor de date formate din mai multe subserii, constituite din motive de
omogenitate a datelor, variaţia totală a variabilei X se poate calcula dupa o schemă cunoscută
sub numele de “regula de compunere a variabilităţii totale”.
Abaterea fiecărei valori de la media totală a seriei este explicată prin influenţa
factorului de grupare şi a altor factori ce acţionează la nivelul fiecărei grupe. Putem cuantifica,
astfel, cât din variaţia caracteristicii studiate este explicată de factorul de grupare ales.
Dacă o serie statistică de volum n este alcătuită din m grupe, pentru fiecare grupă de
m
volum ni , i  1, m ( n   ni ) se pot determina mediile ( x i ) şi dispersiile ( si2 ).
i 1

Abaterea individuală ( xij , i  1, m , j  1, ni ) de la media totală a variabilei ( x )poate fi

descompusă astfel:

xij  x  xij  xi  xi  x  
Media totală a variabilei este:
1 m ni 1 m
x 
n i 1 j 1
xij   x i  ni .
n i 1

Prin ridicarea la pătrat şi însumarea fiecărui termen şi folosind proprietăţile mediei se obţine:

 x     
m ni m ni m
 x   xij  x i   x i  x  ni
2 2 2
ij
i 1 j 1 i 1 j 1 i 1
     
variatia totala variatia din interiorul grupelor variatia dintre grupe

Se notează:

 x 
m ni
2
SST= ij x variaţia totală sau variabilitatea totală, adică suma pătratelor abaterilor
i 1 j 1

individuale de la media totală a seriei (sum of total squares).

 x   s
m ni m
 ni  1 variaţia din interiorul grupelor, adică suma pătratelor
2
SSW= ij  xi 2
i
i 1 j 1 i 1

abaterilor individuale de la mediile de grupă (sum of squares within groups).

 x 
m
2
SSB = i  x  ni variaţia dintre grupe, adică suma pătratelor abaterilor mediilor de grupă
i 1

de la media totală (sum of squares between groups).

1
Relaţia SST= SSW+SSB se numeşte “regula de compunere a variabilităţii totale”.
Variaţia totală astfel determinată permite:
determinarea dispersiei seriei cu formula:
SST
s2 
n 1
determinarea măsurii în care factorul de grupare influenţează variaţia caracteristicii
studiate prin calculul coeficientului/gradului de determinaţie:
SSB
R2  100
SST
Dacă variaţia dintre grupe (SSB) are o pondere mai mare de 50% în variaţia totală
(SST) atunci factorul de grupare este considerat factor esenţial de influenţă asupra variabilei
studiate. explică mai mult variaţia caracteristicii studiate.
determinarea măsurii în care factorii consideraţi neesenţiali în analiză influenţează variaţia
caracteristicii studiate prin calculul coeficientului/gradului de nedeterminaţie:
SSW
K2   100  100  R 2 .
SST
Dacă variaţia din interiorul grupelor (SSW) are o pondere mai mare de 50% în variaţia
totală (SST) variaţia caracteristicii studiate este influenţată semnificativ de alţi factori decât
factorul de grupare considerat.

Exemplu 9. Pentru a cerceta dacă firma BETA are un comportament discriminatoriu faţă de femei
un cercetător selectează aleator un eşantion de 105 salariaţi şi înregistrează timpul scurs între două
promovări succesive (luni). Datele, grupate în funcţie de genul persoanei, au fost prelucrate folosind
EXCEL şi s-au obţinut următoarele rezultate:

Genul Nr. Timpul mediu scurs între Dispersia timpului scurs


persoanei persoane două promovări succesive între două promovări
(luni) succesive
Masculin 45 22,5 32,89
Feminin 60 26 90,23
Total 105 1 m 22.5  45  26  60
x 
n i 1
x i  ni 
105
 24.5

Pentru a determina în ce măsură genul persoanei reprezintă un factor de influenţă în variaţia timpului
scurs între două promovări succesive pentru eşantionul de salariaţi considerat se va determina
coeficientul de determinaţie R 2 :

2
SSB
R2  100 , SST = SSW + SSB
SST
m
SSW=  s  n
i 1
2
i i  1  32.89  44  90.23  59  6770.73

 x 
m
 x  ni  22.5  24.5  45  26  24.5  60  315
2 2 2
SSB = i
i 1

SST = 6770.73+315=7085.73
315
R2   100  4.65%
6770.73
Valoarea coeficientului de determinaţie R 2 arată că factorul de grupare considerat (variabila „gen”)

influenţează în proporţie de aproximativ 5% variaţia timpului scurs între două promovări succesive,
nefiind un factor esenţial de influenţă. Putem aprecia aşadar că firma BETA nu are un comportament
discriminatoriu faţă de persoanele de gen feminin din această perspectivă.

2. Media şi dispersia variabilei alternative

1. Media variabilei alternative

Media variabilei alternative este proporţia răspunsurilor afirmative (care posedă


caracteristica studiată), în totalul unităţilor statistice.
Dacă sistematizăm datele pentru o variabilă alternativă şi acordăm, convenţional,
valorile numerice 1 şi 0 celor două variante de răspuns (afirmativ şi negativ), media
aritmetică determinată va fi ponderea răspunsurilor afirmative în total:
Frecvenţe Frecvenţe relative
Varianta de răspuns xi
ni ni*
m
Afirmativ 1 m  f
n
nm
Negativ 0 n-m  1 f
n
Total – n 1

x n
i 1
i i
1  m  0n  m  m
x    f
n n n

2. Dispersia unei variabile de tip alternativ


Pentru o variabilă de tip alternativ dispersia este:

s 2  s 2f 
1  f 2 m  0  f 2 n  m  1  f 2 f  f 2 1  f   f 1  f 1  f  f 
n

3
s 2f  f 1  f  .

Dispersia (împrăştierea) maximă pentru o variabilă alternativă este egală cu 0,25,


înregistrată atunci când ponderea răspunsurilor afirmative este egală cu cea a răspunsurilor
negative ( f  1  f  0,5 ).
Utilitatea dispersiei unei astfel de variabile este evidentă în proiectarea unui sondaj
statistic stratificat pe baza unui criteriu dihotomic (când se lucrează cu valoarea maximă a
dispersiei, adică 0,25.

Exemplul 10. Un eşantion 80 de turişti cazaţi la o pensiune agroturistică au fost întrebaţi dacă sunt
mulţumiţi de serviciile de cazare. Dintre aceştia 65 au răspuns că sunt mulţumiţi (m) şi 15 turişti şi-au
declarat nemulţumirea faţă de serviciile oferite.

Media variabilei alternative este: f=m/n=60/80=0,75, adică 75% dintre persoanele chestionate sunt
mulţumite de serviciile de cazare.

Dispersia variabilei alternative este: s f  f 1  f   0,75  0,25  0,1875 .


2

S-ar putea să vă placă și