Sunteți pe pagina 1din 16

STATISTIC

CURSURILE 7 si 8

Msuri statistice descriptive pentru date


univariate

- Media si dispersia unei variabile alternative


- Regula de compunere a variabilitii unei serii mprite
n mai multe subserii

1
Media i dispersia unei variabile de tip alternativ

 Dac variabila este alternativ celor dou variante de


rspuns li se vor acorda, convenional, valorile numerice
1 i 0.
 Datele pot fi sistematizate astfel:

Frecvene Frecvene relative


Varianta de rspuns xi
ni ni*
m
Afirmativ 1 m =f
n
nm
Negativ 0 n-m = 1 f
n
Total n 1

2
Media i dispersia unei variabile de tip alternativ

 Media este proporia rspunsurilor afirmative (care posed


caracteristica studiat), n totalul unitilor statistice:
2

xn
i =1
i i
1 m + 0(n m ) m
x= = = = f
n n n
 Dispersia este:
(1 f )2 m + (0 f )2 (n m)
s 2
= s 2f = = (1 f )2 f + f 2 (1 f ) = f (1 f )(1 f + f )
n
s 2f = f (1 f )

 Dispersia maxim pentru o variabil alternativ este 0,25,


(ponderea rspunsurilor afirmative este egal cu cea a
rspunsurilor negative f = 1 f = 0,5 )
3
Exemplu
 200 de turiti dintr-o staiune balnear au fost ntrebai
dac sunt mulumii de serviciile de cazare. Dintre
acetia 160 au rspuns afirmativ (m) i 40 negativ.
Media variabilei alternative este:

f=m/n=160/200=0,8,

adic 80% dintre persoanele anchetate (intrebate) sunt


mulumite de serviciile de cazare.

Dispersia este:

s 2f = f (1 f ) = 0,8 0,2 = 0,16


4
Exemplu
Pentru adecvarea promoiilor la cadourile de srbtori, un magazin
realizeaz un studiu referitor la veniturile clienilor, nivelul sumelor pe
alocate pentru cadouri si categoria socio-profesional.
Datele referitoare la cheltuielile pentru cadouri, in sute lei, nregistrate
pentru 14 clieni, sunt:

6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7

Media de selectie 4,3357 sute lei


Dispersia de selectie 4,1686
Abaterea standard 2,0417sute lei
Coeficientul de variatie 47,09%

5
Regula de compunere a variabilitii
Deoarece seria are un grad redus de omogenitate, clienii au fost
mprii n 2 grupe, n funcie de categoria socio-profesional astfel:
Cheltuieli pentru cadouri (sute lei)
Pensionari (Grupa 1) Salariati (Grupa 2 )
2 3
2,5 5
3 4
3,2 5,5
2,2 6,5
2,3 8
6,5
7

Pensionari (Grupa 1) Salariati (Grupa 2)


Media de selectie 2,5333 sute lei 5,6875 sute lei
Dispersia de selectie 0,2227 2,7098
Abaterea standard 0,4719 sute lei 1,6462 sute lei
Coeficient de variatie 18,63% 28,94%

6
Regula de compunere a variabilitii

 Consideram ca o unitate statistica este caracterizata de doua variabile X si Y.

 Variabila X, in general nenumerica, are r categorii sau variante de raspuns:


Categoria 1, Categoria 2,, Categoria r, care vor determina impartirea
colectivitatii generale in r grupe astfel:
 Grupa 1 (unitatile colectivitatii generale care au ca raspuns Categoria 1 pentru var. X

 Grupa 2 (unitatile colectivitatii generale care au ca raspuns Categoria 2 pentru var. X)

 Grupa r (unitatile colectivitatii generale care au ca raspuns Categoria r pentru var. X)


 Grupele sunt disjuncte iar reuniunea lor este colectivitatea statistica.
 Variabila X se mai numeste si variabila independenta sau factor de grupare.
 Cealalta variabila de interes, Y, este variabila numerica, numita si variabila
dependenta.
 Suntem interesati sa evaluam influenta factorului de grupare X asupra variatiei
totale a variabilei numerice Y.
7
Regula de compunere a variabilitatii
 Dac populatia statistica este alctuit din mai multe grupe
componente, variaia total a variabilei numerice Y se poate
calcula dupa o schem cunoscut sub numele de regula de
compunere a variabilitii totale.
 Din fiecare Grupa i, i=1,,r, se extrage cate un subesantion de
volum ni unitati statistice, pentru care se inregistreaza valorile
observate asupra variabilei numerice Y.
 Volumul esantionului extras din populatia statistica este
n=n1+n2+...+nr
 Abaterea fiecrei valori observate de la media total a seriei de
date numerice este explicat prin influena factorului de
grupare i a altor factori ce acioneaz la nivelul fiecrei grupe.
 Putem cuantifica, astfel, ct din variaia caracteristicii numerice
studiate este explicat de factorul de grupare ales.
8
Regula de compunere a variabilitii
Dac esantionul de volum n este alcatuit din r subesantionare extrase din cele r grupe, volumul
r
fiecarui subesantion fiind ni , i = 1, r ( n = ni = n1 + n2 + ... + nr ) se pot determina mediile de selectie de
i =1

grupa ( yi ) i dispersiile de selectie de grupa ( si2 ) astfel:

Grupele Volumul Valorile Media de selectie a Dispersia de selectie a


subesantionului observate in Grupei i Grupei i
( ni ) extras din Grupa i subesantion ( yi ) 2
( si )
Grupa 1 1 n1 1 n1
n1 y1,1 ; y1, 2 ;K; y1,n1 y1 = y1, j s12 = (y1, j y1 )2
n1 j =1 n1 1 j =1
Grupa 2 y2,1; y2, 2 ;K; y2,n2 1 n2
1 n2
n2 y2 = y 2, j
2
s =
2 (y2, j y2 )2
n2 j =1 n2 1 j =1
M M M M
Grupa i 1 ni
1 ni
ni yi ,1 ; yi , 2 ;K; yi ,ni
yi = xi, j si2 = (yi, j yi )2
ni j =1
ni 1 j =1
M M M M
Grupa r 1 nr
1 nr
nr yr ,1 ; yr , 2 ;K; yr ,nr
yr = y r, j
sr2 = (yr , j yr )2
nr j =1
nr 1 j =1

9
Regula de compunere a variabilitii
Abaterea individual de la media total poate fi descompus astfel:

yi , j y = ( yi , j yi ) + ( yi y )
unde:
n1 n2 nr

y j =1
1, j + y 2, j + ... + yr , j
j =1 j =1 y1 n1 + y2 n2 + ... + yr nr
y= =
n1 + n2 + ... + nr n1 + n2 + ... + nr
este media total a seriei la nivelul intregului esantion de volum n=n1+n2+...+nr.
Prin ridicarea la ptrat i nsumarea fiecrui termen i folosind proprietile mediei se
obine:
r ni r ni r

(y i , j y ) = ( yi , j yi ) + ( y i y ) ni
2 2 2

i =1 j =1 i =1 j =1 i =1
1 442443 1 442443 1 442443
variatia totala variatia din interiorul grupelor variatia dintre grupe

10
Regula de compunere a variabilitatii
Se noteaz:
SSW = Sum of Squares Within groups sau variatia din interiorul grupelor,
adica suma patratelor abaterilor individuale de la mediile de grup
r ni
SSW = ( yi , j yi )
2

i =1 j =1
n1 n2 nr
= ( y1, j y1 ) + ( y2, j y2 ) + ... + ( yr , j yr )
2 2 2

j =1 j =1 j =1

= (n1 1) s12 + (n2 1) s22 + ... + (nr 1) sr2


SSB = Sum of Squares Between groups sau variatia dintre grupe,
adica suma patratelor abaterilor mediilor de grupa de la media totala
r
SSB = ( yi y ) ni
2

i =1

= ( y1 y ) n1 + ( y2 y ) n2 + ... + ( yr y ) nr
2 2 2

11
Regula de compunere a variabilitii

SST = Sum of Total Squares sau variatia totala,


adica suma patratelor abaterilor individuale ale tuturor valorilor observate in esantion
fata de media totala
r ni
SST = ( yi , j y )
2

i =1 j =1

SST = SSW + SSB

12
Regula de compunere a variabilitii

Relaia SST = SSW + SSB


- se numete REGULA DE COMPUNERE A VARIABILITII TOTALE
sau identitatea fundamentala a analizei dispersionale
- permite determinarea dispersiei de selectie a esantionului de volum n dupa
formula
SST
s y2 =
n 1
- permite determinarea msurii n care factorul de grupare influeneaz
variaia caracteristicii studiate prin calculul coeficientului de
determinaie:
SSB
R2 =
SST
sau, n expresie procentual, gradul de determinaie:
SSB
R%2 = 100
SST
13
Regula de compunere a variabilitii

 Dac variatia dintre grupe SSB are o pondere mai mare n


variatia total SST atunci nseamn c factorul de grupare
explic mai mult variaia caracteristicii studiate.

 Dac variatia din interiorul grupelor SSW are o pondere


mai mare n variatia total SST atunci nseamn c variaia
caracteristicii studiate este influenat de ali factori
 Se poate calcula coeficientul/gradul de nedeterminaie:

SSW 2 SSW
2
K = = 1 R2 K =
% 100 = 100 R%2
SST SST

14
Exemplu - continuare
Pentru a analiza n ce proporie categoria socio-profesional influeneaz variaia
cheltuielilor pentru cadouri se determin:
Grupa Volumul Media de selectie a Dispersia de
subesantionului Grupei i selectie a Grupei i
ni extras din Grupa i ( yi ) ( si2 )
Grupa 1 n1=6 y1 = 2,5333 sute lei s12 = 0,2227
(Pensionari)
Grupa 2 (Salariati) n2=9 y 2 = 5,6875 sute lei s22 = 2,7098

Variatia din interiorul grupelor este:


2 ni 6 8
SSW = ( yi , j yi ) = ( y1, j y1 ) + ( y2, j y2 ) =
2 2 2

i =1 j =1 j =1 j =1

= (n1 1) s12 + (n2 1) s22 = (6 1) 0,2227 + (8 1) 2,7098


SSW = 20,0821

15
Exemplu - continuare
Media totala la nivelul intregului esantion de volum n=n1+n2=14 clienti este
y1 n1 + y2 n2 2,5333 6 + 5,6875 8 60,7
y= = = y = 4,3357 sute lei.
n1 + n2 6+8 14
Variatia dintre grupe este
2
SSB = ( yi y ) ni =
2

i =1

= ( y1 y ) n1 + ( y2 y ) n2 =
2 2

= (2,5333 4,3357) 2 6 + (5,6875 4,3357) 2 8


SSB = 34,1101
Variatia totala este SST=SSW+SSB=20,0821+34,1101, deci SST=54,1922

SSB 34,1101
Coeficientul de determinatie este
R2 = = = 0,6294
SST 54,1922

sau R%2 = 62,94% , categoria socio-profesionala influenteaza variatia cheltuielilor cu cadourile in


proportie de 62,94%, restul de 37,06% din variatia totala a cheltuielor cu cadourile fiind influentata
de alti factori. 16

S-ar putea să vă placă și