Sunteți pe pagina 1din 16

STATISTIC

CURSURILE 7 si 8
Msuri statistice descriptive pentru date
univariate
-

Media si dispersia unei variabile alternative


Regula de compunere a variabilitii unei serii mprite
n mai multe subserii

Media i dispersia unei variabile de tip alternativ


 Dac variabila este alternativ celor dou variante de
rspuns li se vor acorda, convenional, valorile numerice
1 i 0.
 Datele pot fi sistematizate astfel:

Varianta de rspuns
Afirmativ

xi
1

Frecvene Frecvene relative


ni
ni*
m

Negativ

n-m

Total

m
=f
n
nm
= 1 f
n
1
2

Media i dispersia unei variabile de tip alternativ




Media este proporia rspunsurilor afirmative (care posed


caracteristica studiat), n totalul unitilor statistice:
2

xn

i i

x=


i =1

1 m + 0(n m ) m
= = f
n
n

Dispersia este:
s

= s 2f

(
1 f )2 m + (0 f )2 (n m)
=
= (1 f )2 f + f 2 (1 f ) = f (1 f )(1 f + f )
n

s 2f = f (1 f )


Dispersia maxim pentru o variabil alternativ este 0,25,


(ponderea rspunsurilor afirmative este egal cu cea a
rspunsurilor negative f = 1 f = 0,5 )
3

Exemplu
 200 de turiti dintr-o staiune balnear au fost ntrebai
dac sunt mulumii de serviciile de cazare. Dintre
acetia 160 au rspuns afirmativ (m) i 40 negativ.
Media variabilei alternative este:
f=m/n=160/200=0,8,
adic 80% dintre persoanele anchetate (intrebate) sunt
mulumite de serviciile de cazare.
Dispersia este:

s 2f = f (1 f ) = 0,8 0,2 = 0,16


4

Exemplu
Pentru adecvarea promoiilor la cadourile de srbtori, un magazin
realizeaz un studiu referitor la veniturile clienilor, nivelul sumelor pe
alocate pentru cadouri si categoria socio-profesional.
Datele referitoare la cheltuielile pentru cadouri, in sute lei, nregistrate
pentru 14 clieni, sunt:
6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7
Media de selectie
Dispersia de selectie
Abaterea standard
Coeficientul de variatie

4,3357 sute lei


4,1686
2,0417sute lei
47,09%

Regula de compunere a variabilitii


Deoarece seria are un grad redus de omogenitate, clienii au fost
mprii n 2 grupe, n funcie de categoria socio-profesional astfel:
Cheltuieli pentru cadouri (sute lei)
Pensionari (Grupa 1) Salariati (Grupa 2 )
2
3
2,5
5
3
4
3,2
5,5
2,2
6,5
2,3
8
6,5
7
Pensionari (Grupa 1) Salariati (Grupa 2)
Media de selectie
2,5333 sute lei
5,6875 sute lei
Dispersia de selectie 0,2227
2,7098
Abaterea standard
0,4719 sute lei
1,6462 sute lei
Coeficient de variatie 18,63%
28,94%
6

Regula de compunere a variabilitii




Consideram ca o unitate statistica este caracterizata de doua variabile X si Y.

Variabila X, in general nenumerica, are r categorii sau variante de raspuns:


Categoria 1, Categoria 2,, Categoria r, care vor determina impartirea
colectivitatii generale in r grupe astfel:






Grupa 1 (unitatile colectivitatii generale care au ca raspuns Categoria 1 pentru var. X

Grupa 2 (unitatile colectivitatii generale care au ca raspuns Categoria 2 pentru var. X)

Grupa r (unitatile colectivitatii generale care au ca raspuns Categoria r pentru var. X)

Grupele sunt disjuncte iar reuniunea lor este colectivitatea statistica.


Variabila X se mai numeste si variabila independenta sau factor de grupare.
Cealalta variabila de interes, Y, este variabila numerica, numita si variabila
dependenta.
Suntem interesati sa evaluam influenta factorului de grupare X asupra variatiei
totale a variabilei numerice Y.
7

Regula de compunere a variabilitatii




Dac populatia statistica este alctuit din mai multe grupe


componente, variaia total a variabilei numerice Y se poate
calcula dupa o schem cunoscut sub numele de regula de
compunere a variabilitii totale.

Din fiecare Grupa i, i=1,,r, se extrage cate un subesantion de


volum ni unitati statistice, pentru care se inregistreaza valorile
observate asupra variabilei numerice Y.

Volumul esantionului extras din populatia statistica este


n=n1+n2+...+nr

Abaterea fiecrei valori observate de la media total a seriei de


date numerice este explicat prin influena factorului de
grupare i a altor factori ce acioneaz la nivelul fiecrei grupe.

Putem cuantifica, astfel, ct din variaia caracteristicii numerice


studiate este explicat de factorul de grupare ales.
8

Regula de compunere a variabilitii


Dac esantionul de volum n este alcatuit din r subesantionare extrase din cele r grupe, volumul
r

fiecarui subesantion fiind ni , i = 1, r ( n = ni = n1 + n2 + ... + nr ) se pot determina mediile de selectie de


i =1

grupa ( yi ) i dispersiile de selectie de grupa ( si2 ) astfel:


Grupele

Volumul
subesantionului

Valorile
observate in
subesantion

Media de selectie a
Grupei i

n1

y1,1 ; y1, 2 ;K; y1,n1

1 n1
y1 = y1, j
n1 j =1

n2

y2,1; y2, 2 ;K; y2,n2

1
y2 =
n2

( ni ) extras din Grupa i

Grupa 1
Grupa 2
M

Grupa i
M

Grupa r

( si )

n2

s12 =

yi ,1 ; yi , 2 ;K; yi ,ni

yi =

1
ni

j =1

1 n2
(y2, j y2 )2
s =

n2 1 j =1

ni

ni

2, j

xi, j

si2 =

j =1

yr ,1 ; yr , 2 ;K; yr ,nr

yr =

1
nr

1 n1
(y1, j y1 )2

n1 1 j =1

2
2

nr

yi )

ni

Dispersia de selectie a
Grupei i

1
(yi, j yi )2

ni 1 j =1
M

nr

y
j =1

r, j

sr2 =

nr

1
(yr , j yr )2

nr 1 j =1

Regula de compunere a variabilitii


Abaterea individual de la media total poate fi descompus astfel:

yi , j y = ( yi , j yi ) + ( yi y )
unde:
n1

1, j

y=

n2

nr

j =1

j =1

+ y 2, j + ... + yr , j

j =1

n1 + n2 + ... + nr

y1 n1 + y2 n2 + ... + yr nr
n1 + n2 + ... + nr

este media total a seriei la nivelul intregului esantion de volum n=n1+n2+...+nr.


Prin ridicarea la ptrat i nsumarea fiecrui termen i folosind proprietile mediei se
obine:
r

ni

(y

ni

i , j y ) = ( yi , j yi ) + ( y i y ) ni
i =1 j =1
i =1 j =1
i =1
442443
1
442443 1
442443 1
variatia totala

variatia din interiorul grupelor

variatia dintre grupe


10

Regula de compunere a variabilitatii


Se noteaz:
SSW = Sum of Squares Within groups sau variatia din interiorul grupelor,
adica suma patratelor abaterilor individuale de la mediile de grup
r

ni

SSW = ( yi , j yi )

i =1 j =1
n1

n2

nr

= ( y1, j y1 ) + ( y2, j y2 ) + ... + ( yr , j yr )


2

j =1

j =1

j =1

= (n1 1) s12 + (n2 1) s22 + ... + (nr 1) sr2


SSB = Sum of Squares Between groups sau variatia dintre grupe,
adica suma patratelor abaterilor mediilor de grupa de la media totala
r

SSB = ( yi y ) ni
2

i =1

= ( y1 y ) n1 + ( y2 y ) n2 + ... + ( yr y ) nr
2

11

Regula de compunere a variabilitii


SST = Sum of Total Squares sau variatia totala,
adica suma patratelor abaterilor individuale ale tuturor valorilor observate in esantion
fata de media totala
r

ni

SST = ( yi , j y )

i =1 j =1

SST = SSW + SSB

12

Regula de compunere a variabilitii


Relaia

SST = SSW + SSB

- se numete REGULA DE COMPUNERE A VARIABILITII TOTALE


sau identitatea fundamentala a analizei dispersionale
- permite determinarea dispersiei de selectie a esantionului de volum n dupa
formula

s y2 =

SST
n 1

- permite determinarea msurii n care factorul de grupare influeneaz


variaia caracteristicii studiate prin calculul coeficientului de
determinaie:

R2 =

SSB
SST

sau, n expresie procentual, gradul de determinaie:

R%2 =

SSB
100
SST
13

Regula de compunere a variabilitii


 Dac variatia dintre grupe SSB are o pondere mai mare n
variatia total SST atunci nseamn c factorul de grupare
explic mai mult variaia caracteristicii studiate.
 Dac variatia din interiorul grupelor SSW are o pondere
mai mare n variatia total SST atunci nseamn c variaia
caracteristicii studiate este influenat de ali factori


Se poate calcula coeficientul/gradul de nedeterminaie:

SSW
K =
= 1 R2
SST
2

SSW
K =
100 = 100 R%2
SST
2
%

14

Exemplu - continuare
Pentru a analiza n ce proporie categoria socio-profesional influeneaz variaia
cheltuielilor pentru cadouri se determin:
Grupa

Volumul
subesantionului
ni extras din Grupa i
n1=6

Grupa 1

Media de selectie a
Grupei i
( yi )

y1 = 2,5333 sute lei

s12 = 0,2227

y 2 = 5,6875 sute lei

s22 = 2,7098

(Pensionari)
Grupa 2 (Salariati)

n2=9

Dispersia de
selectie a Grupei i
( si2 )

Variatia din interiorul grupelor este:


2

ni

SSW = ( yi , j yi ) = ( y1, j y1 ) + ( y2, j y2 ) =


2

i =1 j =1

j =1

j =1

= (n1 1) s12 + (n2 1) s22 = (6 1) 0,2227 + (8 1) 2,7098


SSW = 20,0821

15

Exemplu - continuare
Media totala la nivelul intregului esantion de volum n=n1+n2=14 clienti este

y=

y1 n1 + y2 n2 2,5333 6 + 5,6875 8 60,7


=
=
n1 + n2
6+8
14

y = 4,3357

sute lei.

Variatia dintre grupe este


2

SSB = ( yi y ) ni =
2

i =1

= ( y1 y ) n1 + ( y2 y ) n2 =
2

= (2,5333 4,3357) 2 6 + (5,6875 4,3357) 2 8


SSB = 34,1101
Variatia totala este SST=SSW+SSB=20,0821+34,1101, deci SST=54,1922
Coeficientul de determinatie este
sau

R2 =

SSB 34,1101
=
= 0,6294
SST 54,1922

R%2 = 62,94% , categoria socio-profesionala influenteaza variatia cheltuielilor cu cadourile in

proportie de 62,94%, restul de 37,06% din variatia totala a cheltuielor cu cadourile fiind influentata
de alti factori.

16