Documente Academic
Documente Profesional
Documente Cultură
Capitolul V.
ANALIZA UNIVARIATĂ A DATELOR ÎN CERCETĂRILE DE
MARKETING
x i
x i 1 ;
n
media aritmetică ponderată:
93
Metode statistice utilizate în cercetarea de marketing
x n
j 1
j j
.
x m
n
j 1
j
unde:
în cazul formulelor de calcul ale mediilor simple:
- xi - valorile înregistrate ale caracteristicii;
- n – numărul de unităţi cercetate;
în cazul formulelor de calcul ale mediilor ponderate:
- x j - variantele de variaţie (centrele intervalelor de variaţie în cazul grupărilor pe
intervale) înregistrate ale caracteristicii;
- n j – frecvenţele de apariţie ale fiecărei variante de variaţie (fiecărui interval de
variaţie).
Indicatorii de poziţie
Indicatorii de poziţie caracterizează forma în care sunt distribuite frecvenţele într-
o serie de repartiţie. Aceşti indicatori sunt: modul sau dominanta seriei, cuantilele şi
mediala.
unde:
94
Metode statistice utilizate în cercetarea de marketing
Cuantilele sunt indicatori ai tendinţei centrale care împart seria într-un anumit
număr de părţi (fiecare parte înregistrând acelaşi efectiv din numărul total de unităţi). Din
categoria acestora amintim:
mediana (cuantila de ordinul 2) – divizează distribuţia în două părţi;
cuartilele (cuantilele de ordinul 4) – divizează distribuţia în patru părţi;
decilele (cuantilele de ordinul 10) – divizează distribuţia în zece părţi;
centilele (cuantilele de ordinul 100) – divizează distribuţia în o sută părţi.
Cuantilele de ordin superior se calculează pentru serii cu număr mare de grupe,
fiind utilizate mai rar în cercetările de marketing, comparativ cu mediana.
Calculul medianei în seriile de repartiţie simple (negrupate) presupune ordonarea
crescătoare sau descrescătoare a valorilor. În cazul seriilor cu număr par de termeni,
mediana va fi egală cu media aritmetică a valorilor centrale, respectiv, a valorilor cu
numerele de ordine n şi respectiv, n 1 .
2 2
În cazul în care numărul de termeni al serie este impar mediana este egală cu
valoarea centrală a seriei, respectiv, cu termenul cu numărul de ordine n 1 ,
2
unde n – numărul de termeni ai seriei.
În cazul seriilor grupate, pentru determinarea medianei (şi a celorlalte cuantile) se
vor determina frecvenţele cumulate în sens crescător.
Dacă gruparea s-a realizat pe variante de variaţie, mediana este dată de termenul
m
n j
căruia îi corespunde prima frecvenţă cumulată mai mare decât valoarea j 1 , iar dacă
2
gruparea este realizată pe intervale, atunci intervalul care corespunde primei frecvenţe
m
n j
cumulate mai mare decât valoarea j 1 reprezintă intervalul median, iar pentru calculul
2
medianei se utilizează următoarea formulă:
m
n j j Me 1
n
j 1
j
2 j 1
Me x jMe d
nj
Me
unde:
n j – frecvenţa intervalului j;
95
Metode statistice utilizate în cercetarea de marketing
n
j 1
j – frecvenţa cumulată precedentă intervalului median (frecvenţele cumulate până la
n j
corespunde prima frecvenţă cumulată mai mare decât valoarea j 1 , a doua va fi egală cu
4
m
n j
termenul căruia îi corespunde prima frecvenţă cumulată mai mare decât valoarea 2 j 1
4
(este egală cu mediana seriei), iar a trei-a, cu termenul căruia îi corespunde prima frecvenţă
m
n j
cumulată mai mare decât valoarea 3 j 1 . În cazul grupărilor pe intervale, după algoritmul
4
prezentat se determină doar intervalele în care se încadrează cei trei indicatori, calculul lor
fiind similar cu cel al medianei.
În determinarea decilelor şi a centilelor se va ţine cont de faptul că acestea împart
seria în 10 şi, respectiv, 100 părţi egale, calculându-se, în consecinţă, 9 decile şi 99 centile.
Mediala este un indicator al tendinţei centrale care împarte (în condiţiile ordonării
crescătoare a termenilor seriei), suma valorilor globale ale caracteristicii sau suma
termenilor seriei în două părţi egale. Respectiv, este valoarea caracteristicii până la care se
n
realizează jumătate din suma termenilor x (în cazul seriilor simple) sau jumătate din
i 1
i
m
suma produselor termenilor
x n (în cazul seriilor cu frecvenţe).
j 1
j j
x i
mare decât valoarea i 1 .
2
În cazul seriilor grupate pe variante de variaţie, se determină valorile cumulate ale
produselor termenilor x j n j , mediala fiind egală cu acel termen căruia îi corespunde primul
m
x j nj
nivel cumulat care este egal sau mai mare decât valoarea j 1 .
2
În cazul seriilor grupate pe intervale de variaţie, intervalul medial este cel căruia îi
corespunde primul nivel cumulat al produselor termenilor x j n j egal sau mai mare decât
96
Metode statistice utilizate în cercetarea de marketing
m
x j nj
valoarea j 1 . Formula de calcul a valorii medialei este asemănătoare cu cea a
2
medianei:
m
x n j j j Ml 1
x n
j 1
j j
2 j 1
Ml x jMl d
x n
j
j Ml
unde:
x jMl – limita inferioară a intervalului medial;
d - mărimea intervalului medial;
jMl 1
x n
j 1
j j – valorile globale ale caracteristicii cumulate până la nivelul intervalului
medial;
x n
j j Ml – valoarea globală corespunzătoare intervalului medial.
Amplitudinea variaţiei
Amplitudinea variaţiei se poate calcula fie în mărime absolută, fie în mărime
relativă. Amplitudinea absolută a variaţiei se calculează ca diferenţă între nivelul maxim şi,
respectiv, nivelul minim al variabilei cercetate:
A = x max – x min
Amplitudinea relativă a variaţiei se exprimă, de regulă, în procente şi se calculează
prin raportarea amplitudinii absolute a variaţiei la media aritmetică a termenilor:
A
A% 100
x
97
Metode statistice utilizate în cercetarea de marketing
x
n 2
i x
i 1 ;
n
în cazul seriilor de frecvenţe:
x
m
2
j x nj
j 1 .
m
n
j 1
j
Dispersia (varianţa)
Dispersia se calculează ca o medie aritmetică a pătratelor abaterilor termenilor
faţă de media lor. Acest indicator este utilizat, îndeosebi, în analiza dispersională (metodă
prezentată distinct în capitolul “Studierea legǎturilor dintre variabilele de marketing” al
prezentei lucrări). Dispersia se calculează cu ajutorul formulelor:
în cazul seriilor simple:
x
n 2
i x
2 i 1 ;
n
în cazul seriilor de frecvenţe:
x
m
2
j x nj
j 1 .
2 m
n
j 1
j
Coeficientul de variaţie
Coeficientul de variaţie este un indicator ce măsoară gradul de omogenitate al
seriei sau reprezentativitatea mediei. Acest indicator se poate calcula ca raport între
abaterea medie pătratică şi media aritmetică a termenilor. Intervalul în care acest indicator
ia valori este (0, 100%), o valoare mai mică atestând un grad mai mare de omogenitate. Se
consideră că dacă acest coeficient este mai mic de 35 – 40% seria este omogenă, iar media
este reprezentativă pentru seria dată. Când coeficientul de variaţie depăşeşte această limită
se impune o divizare a colectivităţii pe grupe omogene şi calculul mediilor parţiale.
V 100
x
De fapt, coeficientul de variaţie se poate folosi ca un test de semnificaţie pentru
media aritmetică a termenilor.
98
Metode statistice utilizate în cercetarea de marketing
unde:
x - media aritmetică a termenilor;
Mo – modul sau dominanta seriei;
σ – abaterea medie pătratică.
Acest coeficient ia valori între (-1, 1), o valoare mai apropiată de limitele
intervalului de variaţie atestând o asimetrie mai pronunţată. Dacă se apropie de 0, asimetria
este mai redusă. Dacă C As = 0, seria este perfect simetrică.
99
Metode statistice utilizate în cercetarea de marketing
n
n g i2 1
C i 1 ,
n 1
unde:
n – numărul unităţilor cercetate;
g i – ponderea valorii caracteristicii realizate de unitatea i în valoarea totală a caracteristicii
realizată de cele n unităţi cercetate.
Acest coeficient este utilizat frecvent pentru măsurarea repartiţiei în spaţiu a
activităţii de piaţă. În acest caz, n va fi constituit din unităţi administrativ – teritoriale,
întreprinderi, puncte de vânzare, etc, iar g i va reprezenta ponderea vânzărilor realizate de
unitatea i în totalul realizărilor celor n unităţi.
Coeficientul C aparţine intervalului [0, 1]. Luând exemplul studierii gradului de
concentrare a activităţii de piaţă, o valoare apropiată de 1 semnifică o concentrare
puternică, iar o valoare apropiată de 0 atestă o distribuţie relativ uniformă a activităţii de
piaţă la nivelul celor n unităţi. Când valoarea coeficientului de concentrare este 1, suntem
în situţia de monopol (întreaga activitate de piaţă este desfăşurată de o singură unitate), iar
valoarea 0 atestă o echirepartiţie (toate cele n unităţi au contribuţii identice la desfăşurarea
activităţii de piaţă).
Cu ajutorul ambilor coeficienţi prezentaţi anterior (datorită faptului că limitele
intervalelor de variaţie nu depind de numărul de unităţi cercetate), se pot realiza
comparaţii, din punctul de vedere al gradului de concentrare, între mai multe colectivităţi
supuse investigaţiei.
2
n
Oi Ai 2 ,
i 1 Ai
unde:
n = numărul de variante ale variabilei studiate;
O i = frecvenţele reale aferente variantei i a variabilei cercetate;
A i = frecvenţele teoretice aferente variantei i, corespunzătoare ipotezei
nule conform căreia diferenţele dintre grupe nu sunt semnificative.
n
O i
Ai i 1 .
n
100
Metode statistice utilizate în cercetarea de marketing
101
Metode statistice utilizate în cercetarea de marketing
STUDII DE CAZ
Analiza univariată a unei serii de distribuţie simple
Piaţa unui produs “A” circumscrisă unui anumit teritoriu este disputată de 8 firme
concurente. Vânzările realizate de fiecare dintre acestea, în decursul unui an, se prezintă în
următorul tabel:
Nr. crt. întreprindere I II III IV V VI VII VIII
Vânzări (mil. u.m.) 13 32 21 89 87 52 40 32
Pe baza acestor date se doreşte realizarea analizei vânzărilor înregistrate de cele 8
unităţi comerciale:
Ponderile deţinute de fiecare unitate în totalul vânzărilor realizate, indicatori ce atestă, de fapt,
cotele de piaţă ale fiecărei întreprinderi, se prezintă astfel:
Nr. crt. întreprindere I II III IV V VI VII VIII Total
Vânzări (mil. u.m.) 3,6 8,7 5,7 24,3 23,8 14,2 10,9 8,7 100.0
Se observă că lider pe respectiva piaţă este unitatea IV, urmată de V, fiecare dintre
ele deţinând aproximativ un sfert din piaţa de referinţă.
x i
13 32 21 89 87 52 40 32
x i 1
45,75 mil. u.m.;
n 8
modul sau dominanta:
M o = 32 mil. u.m.;
mediana:
102
Metode statistice utilizate în cercetarea de marketing
Indicatorii variaţiei:
amplitudinea variaţiei:
A = x max – x min = 89-13=76 mil. u.m.;
amplitudinea relativă a variaţiei:
A 76
A% 100 100 166,12% ;
x 45,75
x
n 2
i x
(13 45,75) 2 (32 45,75) 2 (21 45,75) 2 .... (32 45,75) 2 mil. u.m.;
i 1
26,71
n 8
dispersia (varianţa):
x
n 2
i x
(13 45,75) 2 (32 45,75) 2 (21 45,75) 2 .... (32 45,75) 2
2 i 1
713,44 ;
n 8
coeficientul de variaţie :
26,71
V 100 100 58,38% .
x 45,75
Studierea asimetriei:
Coeficientul lui Pearson:
x Mo 45,75 32
C As 0,515
26,71
gi2 0,001 0,008 0,003 0,059 0,057 0,020 0,012 0,008 0,168
103
Metode statistice utilizate în cercetarea de marketing
n
n g i2 1
i 1 8 0,168 1
C 0,221
n 1 8 1
Gradul de concentrare a desfacerilor la nivelul celor 8 întreprinderi este relativ
mic.
Distribuţia unui eşantion de 600 persoane, consumatori ai unui produs “A”, după
cheltuielile realizate cu această destinaţie, în decursul unui an, se prezintă în următorul
tabel:
Grupe de persoane după cheltuielile
Număr persoane
realizate, în decursul unui an, pentru
(frecvenţe absolute)
achiziţionarea produsului “A”
ni
(mil. u.m.)
0-30 120
30-60 180
60-90 140
90-120 100
120-150 60
Total 600
Pe baza acestor date se doreşte realizarea analizei cheltuielilor efectuate de către
cei 600 consumatori, în decursul unui an, pentru achiziţionarea produsului “A”.
Notă: Calculele necesare determinării valorilor diferiţilor indicatori sunt prezentate în tabelul de la
sfârşitul aplicaţiei.
Indicatorii tendinţei centrale:
media aritmetică:
m
x n
j 1
j j
39.000 mil. u.m.;
x m
65
600
n
j 1
j
modul:
1 (180 120 )
Mo x jMo d 30 30 48 mil. u.m.;
1 2 (180 120) (180 140)
mediana:
m
n j jMe 1
j 1
2
n j
300 300
60 mil. u.m.;
j 1
Me x jMe d 60 30
nj 140
Me
104
Metode statistice utilizate în cercetarea de marketing
mediala:
m
x n j j j Ml 1
x n
j 1
j j
2 19.500 9.900
87,43 mil. u.m.
j 1
Ml x jMl d
x n j j Ml
60 30
10.500
Indicatorii tendinţei centrale atestă că, în medie, fiecare din cei 600 consumatori au
realizat cheltuieli pentru achiziţionarea produsului “A” în valoare de 65 mil. u.m.
Nivelul cheltuielilor cel mai frecvent întâlnit la nivelul eşantionului cercetat este
de 48 mil. u.m.
Din cele 600 persoane, 50% realizează cheltuieli de până la 60 mil. u.m., iar restul
de 50% peste această valoare.
Jumătate din totalul cheltuielilor realizate de cei 600 consumatori pentru
m
achiziţionarea respectivului produs ( j 1
x j n j = 39.000 mil.u.m.) este realizată de către
persoanele care au înregistrat cheltuieli cu această destinaţie de până la 87,43 mil. u.m., iar
restul de 50% de către cei care au realizat cheltuieli mai mari de 87,43 mil. u.m.
Indicatorii variaţiei:
amplitudinea variaţiei:
A= x max – x min = 150 – 0 =150 mil. u.m.;
amplitudinea relativă a variaţiei:
A 150
A% 100 100 230,77% ;
x 65
abaterea medie pătratică (abaterea standard):
x
m
2
x nj
j 1
j
840.000 mil. u.m.;
m
37,42
600
n
j 1
j
dispersia (varianţa):
x
m
2
j x nj
j 1 840.000 ;
2 m
1400
600
n
j 1
j
coeficientul de variaţie :
37,42
V 100 100 57,57% .
x 65
În ceea ce priveşte gradul de variaţie, se observă că variabila “cheltuieli pentru
achiziţionarea produsului A” înregistrează, la nivelul eşantionului constituit din cei 600
105
Metode statistice utilizate în cercetarea de marketing
consumatori, o amplitudine absolută de 150 mil. u.m., ceea ce, raportat la media
termenilor, reprezintă 230,77%.
În medie cheltuielile pentru achiziţionarea produsului “A” se abat de la media lor
aritmetică cu +/- 37,42 mil. u.m. Ceea ce se observă este faptul că media cheltuielilor nu
este reprezentativă pentru colectivitatea cercetată, datorită lipsei omogenităţii valorilor
înregistrate. Se impune, astfel, divizarea colectivităţii pe grupe omogene şi calculul
mediilor parţiale.
Studierea asimetriei:
Coeficientul lui Pearson:
x Mo 65 48
C As 0,454
37,42
106
Metode statistice utilizate în cercetarea de marketing
Numărul Oi Ai 2
Aprecieri faţă de noul
respondenţilor Ai (O i -A i ) (O i -A i )2
produs Ai
Oi
Foarte favorabile 324 240 84 7056 29,4
Favorabile 356 240 116 13456 56,1
Neutre 214 240 -26 676 2,8
Nefavorabile 185 240 -55 3025 12,6
Foarte nefavorabile 121 240 -119 14161 59,0
Total 1200 1200 - - 159,9
O
i 1
i
1200
Ai 240
n 5
n
Oi Ai 2 159,9
2
i 1 Ai
107