Sunteți pe pagina 1din 4

Curs nr.

MARKETING

CARACTERIZAREA STATISTIC A FORMELOR DE REPARTIZARE


A FRECVENELOR
Analiza statistic a formelor de repartizare a frecvenelor presupune deplasarea
valorilor individuale fa de anumite valori tipice ale tendinei centrale (Me, Mo sau x ) i a
aplatizrii curbei frecvenelor.

1.

Asimetria (oblicitatea) distribuiilor statistice

O distribuie este simetric dac observaiile nregistrate sunt egal dispersate de o


parte i alta a valorii lor centrale. ntr-o distribuie simetric, cele trei valori cu care se
exprim tendina central, valoarea modal (Mo), median (Me) i medie ( x ) se confund.
Mediana (50%)
nj
Cuantila inferioar
(25%)

Cuantila superioar
(75%)

25%

25%

25%

25%
xj

xmin

Q1

Me Mo X

Q3

xmx

O repartiie asimetric (sau oblic) se caracterizeaz prin faptul c frecvenele


valorilor caracteristicii urmrite sunt deplasate mai mult sau mai puin, ntr-o parte i alta fa
de tendina central.

nj

nj

Mo Me X
Mo Me X
Etalarea frecvenelor spre stnga
Repartiie oblic pozitiv
As>0

xj

X Me Mo

xj

Mo Me X
Etalarea frecvenelor spre dreapta
Repartiie oblic negativ
As<0

O distribuie va fi cu att mai asimetric (din punct de vedere al formei sale), cu ct


diferena dintre aceti indicatori este mai mare.
n mrime absolut, asimetria se poate msura cu ajutorul indicatorilor:
As x Mo sau As 3( x Me)
Acetia au unitatea de msur a variabilei studiate i pot fi pozitivi sau negativi, n
funcie de tipul de asimetrie.

Curs nr. 6

MARKETING

Amploarea asimetriei statistice unimodale se caracterizeaz sintetic cu ajutorul unor


coeficieni adimensionali.
1) Coeficientul lui Yule i Kendall (Casyk)
Yule i Kendall, comparnd modul de etalare a frecvenelor la dreapta i la stnga
medianei i innd cont de poziia cuantilelor n raport cu mediana, au recomandat pentru
msurarea asimetriei urmtorul coeficient:
(Q Me) ( Me Q1 )
C asyk 3
(Q 3 Me) ( Me Q1 )
Observm urmtoarele:
valoarea coeficientului lui Yule i Kendall este cuprins n intervalul -1 i +1;
dac Casyk = 0 simetrie (sau cuartilele sunt echidistante);
dac Casyk > 0 asimetrie pozitiv;
dac Casyk < 0 asimetrie negativ;
dac acest coeficient are valoarea sub 0,1 seria este considerat moderat asimetric; iar
peste 0,3 seria este pronunat asimetric;
nu poate fi utilizat n compararea asimetriei mai multor repartiii de frecvene.
2) Coeficientul Pearson
Acesta ia valori cuprinse ntre zero i unu;
C as

3 x Mo
x Mo
C as
sau
x
x

Cu ct valorile acestui coeficient sunt mai apropiate de zero, cu att seria este mai
simetric (simetria exist cnd valoarea sa este zero); cu ct valorile sale sunt mai apropiate
de unu cu att seria este mai asimetric.
Asimetria distribuiilor unitilor ntr-o colectivitate dup caracteristica urmrit poate
fi vizibil pe reprezentrile grafice (histograma, poligonul frecvenelor) comparate cu alura
clopotului lui Gauss.

2.

Analiza statistic a concentrrii/diversificrii

Problematica concentrrii-diversificrii formulat pentru prima dat de Corado Gini


prezint interes n diverse domenii: caracterizarea structurii pieelor; analiza inegalitilor
dintre repartiiile de structur; analiza repartiiilor regionale etc.
Prin concentrare se nelege, n general, aglomerarea unitilor unei populaii
statistice sau a valorilor globale ale unei distribuii n jurul unei valori tipice a variabilei
analizate X. n mod complementar se definete noiunea de diversificare.
Caracterizarea statistic a concentrrii/diversificrii se poate realiza prin mijloace
grafice i prin procedee numerice (de calcul).

Indicatori ai concentrrii n seriile calitative atributive


Punctul de pornire n analiza concentrrii n cazul seriilor calitattive atibutive l
reprezinta calculul ponderilor (greutilor specifice), notate prin gi.
Raportul de concentrare (RC), un indicator de concentrare utilizat frecvent n
cercetrile de marketing, exprim ponderea deinut de primele n cele mai mari uniti dintr-o
populaie statistic observat dup o variabil (un criteriu) care definete mrimea (talia) lor.
Numrul n este ales n mod arbitrar, din numrul total (N) al unitilor populaiei.
Acest indicator (RC) se determin dup relaia urmtoare:
n

RC g i
i 1

Curs nr. 6

MARKETING

ni

gi

unde:

ni
i 1

Raportul de concentrare calculat prezint urmtoarele caracteristici: se determin


simplu i rapid i nu ine seama n calculul su dect de datele referitoare la primele n (n>N)
cele mai mari uniti; restul unitilor (N-n) nu sunt luate n considerare.
Coeficientul de concentrare Corrado Gini (CG) se determin dup relaia
urmtoare:
K

g i2

CG

i 1

Unde: K = numrul de categorii ale variabilei analizate

1
,1 ceea ce nseamn c prezint dezavantajul variabilitii limitei minime.
K

CG

Pentru a elimina neajunsul precizat n analiz (n comparaii) se utilizeaz forma


corectat a coeficientului de concentrare Corrado Gini cunoscut i sub denumirea de
coeficientul de concentrare Strck (CS). Relaia de calcul a acestuia este:
K

K g i2 1
i 1

CS

3.

K 1

Regula de adunare a dispersiilor

Sistematizarea datelor dup dou variabile (pe variante sau pe intervale de variaie) are
ca rezultat obinerea unei serii bidimensionale (bivariate). Presupunem n acest sens c
valorile variabilei X au fost sistematizate pe r variante (sau intervale) i s-au urmrit n
fiecare din cele c intervale (grupe) formate dup o alt variabil Y.
RAD se utilizeaz n cazul n care seria statistic este alctuit din mai multe serii
componente. n acest caz, media aritmetic a ntregii serii poate fi calculat ca medie a
mediilor pariale.
Dac avem dou variabile statistice X i Y, pentru care s-au calculat mediile x i y ,
media sumei valorilor individuale ( x i y i ) este ntotdeauna egal cu suma mediilor
x y x y . n aceeai situaie, media produselor valorilor individuale ( x i y i ) este egal
cu produsul mediilor, numai n cayul n care cele dou variabile sunt independente:
x y x y . Dac variabilele sunt dependente, diferena x y x y 0 i poart
denumirea de covarian ntre x i y (covxy) i este un indicator care msoar intensitatea
dependenei legturii ntre cele dou variabile.
Pentru dispersie, compunerea se va face dup RAD:
2

2x x 2x

x
nj

2x

i 1

xj

- dispersia general, care sintetizeaz pe ansamblu influena

nj

factorilor, indiferent natura lor. x j reprezint media grupei j.

Curs nr. 6

MARKETING

x
c

2x

j1

x nj

nj

- dispersia dintre grupe, care sintetizeaz influena factorului de

j1

grupare luat n considerare. x

x jn j
n j

reprezint media ntregii colectiviti studiate.

2j n j
j1

nj

- media dispersiilor condiionate pariale, care sintetizeaz influena

j1

factorilor aleatori (reziduali) din interiorul fiecrei grupe j 1, c . j reprezint dispersia


grupei j.
2
Cu ct valoarea lui x este mai mare, cu att factorii reziduali au o importan mai
2
mare n variaia variabilei. Cu ct valoarea lui x este mai mare, cu att factorul de grupare
are o importan mai mare n variaia variabilei.
Relaia mai poate fi scris i sub forma:
R 2 K 2 1 , care pot fi calculai att n mrime absolut ct i relativ.
2

R
2

2x

[0;1] - coeficient de determinare (determinaie). El arat msura n care

2x

variaia general este explicat de factorul de grupare, adic arat intensitatea legturii dintre
variabila X i variabila Y. cu ct valoarea lui se apropie de 1, cu att legtura este mai strns
i cu ct valorile sale sunt mai apropiate de zero legtura dintre X i Y este mai slab. Dac
R2=0 nseamn c ntre variaia celor dou variabile nu exist nici o legtur.
R %
2

2x
2x

100 - gradul de determinare (determinaie).

K2

x
1 R 2 [0;1] - coeficient de nedeterminare (nedeterminaie). El exprim
2x

msura n care variaia variabilei analizat este explicat de factorii reziduali (aleatori) care
acioneaz n interiorul fiecrei grupe i este complementar lui R2.
2

K2 %

x
100 - grad de nedeterminare (nedeterminaie).
2x

S-ar putea să vă placă și