Sunteți pe pagina 1din 6

Analiza univariat a datelor n cercetrile de marketing

Cap. 19. ANALIZA UNIVARIAT A DATELOR N


CERCETRILE DE MARKETING

n strategia unei cercetri de marketing, o atenie deosebit trebuie acordat


deciziei privitoare la modalitatea de analiz a datelor culese.
Analiza reprezint un proces complex i sistematic de aplicare a tehnicilor
statistico-matematice, n scopul extragerii din baza de date constituit a tuturor
informaiilor necesare procesului decizional.
Metodologia de analiz a fenomenelor de marketing a cunoscut n ultimele trei
decenii, pe plan internaional, o adevrat revoluie, paralel cu dezvoltarea tehnologiei
de msurare, culegere i prelucrare a informaiilor. Aceasta s-a datorat, n mare msur
i progreselor nregistrate n folosirea pe scar tot mai larg a calculatoarelor
electronice.
Numeroasele metode de analiz care constituie bogatul arsenal metodologic
pot fi grupate dup criterii foarte diferite, cum sunt:
tipul de scal utilizat (nominal, ordinal, interval sau proporional);
numrul eantioanelor cercetate (unul, dou sau mai mult de dou);
natura relaiei dintre aceste eantioane (independente sau dependente);
numrul variabilelor considerate o dat (una, dou sau mai mult de
dou).
Printre obiectivele urmrite n procesul de analiz a datelor se nscriu, de
obicei, urmtoarele:
determinarea tendinei centrale a variabilelor considerate;
caracterizarea variaiei i a repartiiei acestora;
msurarea gradului de asociere dintre ele;
realizarea unor estimri i previziuni;
evaluarea diferenelor dintre variabile sau grupuri de variabile;
evidenierea legturilor cauzale dintre ele.

19.1.

Modaliti de determinare a tendinei centrale

Pentru determinarea tendinei centrale a variabilelor considerate, punctul de


plecare l constituie considerarea tipului de scal utilizat pentru msurarea acestora.

255

Cercetri de marketing

Dup cum s-a evideniat ntr-un capitol anterior, tendina central se caracterizeaz
diferit, funcie de nivelul la care s-a realizat msurarea (vezi tabelul nr.19.1.).
Tabelul 19.1. Modul de caracterizare a tendinei centrale funcie
de tipul de scal utilizat
Tipuri de
scale
Nominal
Ordinal
Interval
Proporional

Indicatori ai tendinei centrale


Grupul modal
Mediana
Media
(valoarea modal)
aritmetic
x
x
x
x

x
x
x

x
x

Media
geometric
x

Dac datele sunt negrupate, valoarea modal, primul indicator al tendinei


centrale, este cea care prezint cea mai mare frecven de apariie. S presupunem c
ntr-o cercetare direct a preferinelor populaiei capitalei pentru turismul de sfrit de
sptmn, eantionul investigat cuprinde 400 persoane care practic frecvent aceast
form de turism, distribuite dup statutul socio-profesional astfel (vezi tabelul
nr.19.2):
Tabelul 19.2. Repartizarea pe categorii socio-profesionale a persoanelor care
practic frecvent turismul de sfrit de sptmn
Categoria socio-profesional
Muncitori
Maitri-tehnicieni
Liber ntreprinztori
Funcionari
Cadre cu studii superioare
Elevi-studeni
Casnice
Pensionari
Alte categorii

Numr de persoane
120
70
30
30
90
120
10
15
15

Se observ cu uurin c valoarea modal este 120, ea corespunznd


categoriei muncitori i categoriei elevi-studeni.
Dup cum se cunoate, n cazul distribuiilor de frecvene specifice datelor
grupate, grupul modal este constituit din grupul care cuprinde cele mai multe
componente comparativ cu celelalte grupuri.
S presupunem c acelai eantion format din cele 400 persoane se distribuie,
pe grupe de vrst, dup cum urmeaz (vezi tabelul nr.19.3.):
256

Analiza univariat a datelor n cercetrile de marketing

Tabelul 19.3. Repartizarea pe grupe de vrst a persoanelor care


practic frecvent turismul de sfrit de sptmn
Grupe de vrst (ani)
sub 14
14-18
19-24
25-30
31-40
41-50
51-60
61 i peste

Numr de persoane
15
45
110
90
80
30
20
10

Rezult clar c grupul modal este reprezentat de grupul care cuprinde


persoanele n vrst de 19-24 ani. Acest grup cuprinde 27,5 % din persoanele care
practic frecvent turismul de sfrit de sptmn. Valoarea modal se situeaz undeva
n jurul vrstei de 22 ani.
Mediana, un alt indicator al tendinei centrale, reprezint dup cum se
cunoate valoarea deasupra i dedesubtul creia se situeaz cte o jumtate din
observaii.
Dac datele sunt negrupate, dac sunt aranjate n ordine, de la valoarea cea
mai mic la valoarea cea mai mare, sau invers i dac numrul de observaii este fr
so, valoarea median se stabilete fr nici o dificultate (vezi tabelul nr.19.4.):
Tabelul 19.4. Numrul de porii dintr-un preparat culinar vndute ntr-o zi n
apte restaurante
Restaurantul
R1
R2
R3
R4
R5
R6
R7

Numrul de porii
60
70
110
120 Mediana
130
130
150

n situaia n care exist un numr de observaii cu so, mediana se consider


n mod convenional c este situat la jumtate, ntre cele dou valori centrale.
Dac datele sunt grupate, mediana se calculeaz astfel: numrul total de
observaii (frecvene) se mparte la 2 i astfel rezult cte observaii trebuie s fie
deasupra i cte dedesubtul medianei; dup aceasta se determin frecvenele cumulate
257

Cercetri de marketing

pentru a stabili n care grup se situeaz mediana; n final, se calculeaz valoarea


medianei.
Considernd datele din tabelul cu repartiia pe grupe de vrst rezult c
valoarea medianei se situeaz undeva n grupa de vrst de 25-30 ani. Pentru a ne situa
la jumtatea numrului observaiilor (200), se pondereaz mrimea intervalului acestei
grupe (5), cu numrul de observaii adiionale necesare (110/260) iar valoarea obinut
se adaug la 25. Rezult c mediana este situat la categoria de vrst de 27 ani.
Aa cum s-a artat, datelor msurate n scal metric li se poate calcula
tendina central i sub forma mediei aritmetice (ncepnd cu scala interval) sau chiar
sub forma mediei geometrice (n cazul scalei proporionale).
Media aritmetic, x , a unei variabile x despre care se cunosc n observaii
ntr-un eantion investigat, se calculeaz astfel:
n

x
i 1

Dac vnzrile a cinci puncte de desfacere situate pe plaj au fost ntr-o


anumit zi de: 170; 220; 270; 320 i respectiv 370 mil. lei, rezult c media
desfacerilor n ziua respectiv este:
170 220 270 320 370
270 mil.lei
5
Deseori, n calculul mediei aritmetice, apare necesitatea unei ponderri.
S presupunem c ntr-o cercetare a imaginii unui grup de 200 turiti,
amplasamentul unui camping a fost apreciat pe o diferenial semantic cu 5 trepte,
astfel:
x

foarte favorabil

70

45

35

30

20

foarte nefavorabil

Pentru o evaluare sintetic a acestor aprecieri se calculeaz o medie a lor,


pornind de la nota 5 atribuit, pe scara respectiv, aprecierilor foarte favorabile,
descrescnd pn la nota 1 pentru aprecierile foarte nefavorabile. Aprecierea medie se
calculeaz astfel:

70 5 45 4 35 3 30 2 20 1
3,575
200

Dac datele sunt grupate, pentru calculul mediei aritmetice se folosete


urmtoarea relaie:
n

x
unde:

258

f
i 1

mi

fi reprezint frecvena grupului i;


mi punctul de mijloc al intervalului unui grup;

Analiza univariat a datelor n cercetrile de marketing

n numrul total de observaii cuprinse n eantion.


n tabelul nr.19.5 se ilustreaz, printr-un exemplu, modul de calcul al mediei
aritmetice n acest caz.
Tabelul 19.5. Desfacerile zilnice ale unor cabane, situate pe trasee
turistice montane (calculul mediei aritmetice)
Desfaceri
(mil. lei)
15-20
20-25
25-30
30-35
35-40
TOTAL

Numr de uniti
(fi)
7
12
15
11
5
50

Mijlocul intervalului
(mi)
17,5
22,5
27,5
32,5
37,5

fi mi
122,5
270,0
412,5
357,5
187,5
1350,0

1350
27mil.lei
50

Atunci cnd pentru msurare s-a folosit o scal proporional, pentru


caracterizarea tendinei centrale, se poate calcula chiar i media geometric x G
(aceasta este totui destul de rar utilizat n cercetrile de marketing). Formula de
calcul este urmtoarea:
xG n

x
i 1

sau n forma logaritmic


n

log xG

19.2.

log x
i 1

Modaliti de caracterizare a variaiei i repartiiei variabilelor

Caracterizarea variaiei, un alt obiectiv obinuit al analizei datelor culese prin


cercetrile de marketing, se poate face n mod difereniat, n funcie de nivelul de
msurare realizat printr-un tip de scal sau altul (vezi tabelul nr.19.6.)
Foarte adesea, datele, indiferent de tipul de scal utilizat, sunt caracterizate
prin prezentarea distribuiei de frecvene att n form tabelar (frecvenele se pot
prezenta n valori absolute, simple sau cumulate, sau prin folosirea procentelor 1), ct i
1

Pentru calculul procentelor cumulate sunt necesare date cel puin de natur ordinal.
259

Cercetri de marketing

n form grafic (poligoane de frecvene, histograme, ogive etc.).


Tabelul 19.6. Caracterizarea variaiei funcie de nivelul de msurare realizat
Indicatori ai
variaiei
Distribuia de frecvene
Procente
Decile
Centile
Cuartile
Amplitudinea variaiei
Abaterea medie
Variana
Abaterea standard

Nominale
x
x
-

Tipuri de scale
Ordinale
Interval
x
x
x
x
x
x
x
x
x
x
x
x
x
x

Proporionale
x
x
x
x
x
x
x
x
x

Mai rar, n procesul analizei datelor se calculeaz i cuartilele, decilele sau


centilele. Cuartilele reprezint dou valori stabilite astfel ca o ptrime din observaii s
se afle sub prima cuartil, denumit i cuartil inferioar i o ptrime din observaii s
se afle deasupra celei de-a doua cuartile, denumit i cuartil superioar. Celelalte
dou ptrimi din observaii se afl ntre valorile celor dou cuartile i median. n mod
similar, numrul de observaii se poate mpri la 10 sau 100 cu ajutorul decilelor i
respectiv centilelor.
Destul de frecvent, n caracterizarea datelor se folosete amplitudinea
variaiei, care se poate calcula n form absolut (diferena dintre observaia cu
valoarea cea mai mare i cea cu valoarea cea mai mic) sau n form relativ (raportul
dintre amplitudinea absolut i medie).
De cte ori nivelul de msurare conduce la date de natur metric, pentru
caracterizarea variaiei acestora se pot folosi, alturi de amplitudinea variaiei i trei
indicatori ai variaiei, respectiv, abaterea medie (media aritmetic a valorilor absolute
ale abaterilor termenilor eantionului de la media lor), variana (media aritmetic a
ptratelor abaterilor individuale ale termenilor eantionului de la medie) precum i
abaterea standard (radical cu semnul plus din varian).
Pentru caracterizarea variaiei i a repartiiei unei singure variabile, deosebit
de utile sunt i metodele bazate pe cunoscutele tipuri de repartiii normale, Poisson,
binomiale etc., precum i cele care presupun abordarea bayesian aplicat unei
singure variabile.

260