Sunteți pe pagina 1din 10

ANALIZA UNIVARIATĂ A DATELOR ÎN CERCETĂRILE

DE PIAŢĂ

În strategia unei cercetări de marketing, o atenţie deosebită trebuie


acordată deciziei privitoare la modalitatea de analiză a datelor culese.
Analiza reprezintă un proces complex şi sistematic de aplicare a
tehnicilor statistico-matematice, în scopul extragerii din baza de date
constituită a tuturor informaţiilor necesare procesului decizional.

Metodologia de analiză a fenomenelor de marketing a cunoscut în


ultimele trei decenii, pe plan internaţional, o adevărată revoluţie, paralel cu
dezvoltarea tehnologiei de măsurare, culegere şi prelucrare a informaţiilor.
Aceasta s-a datorat, în mare măsură şi progreselor înregistrate în folosirea pe
scară tot mai largă a calculatoarelor electronice.
Numeroasele metode de analiză care constituie bogatul arsenal
metodologic pot fi grupate după criterii foarte diferite, cum sunt:
• tipul de scală utilizat (nominală, ordinală, interval sau
proporţională);
• numărul eşantioanelor cercetate (unul, două sau mai mult de
două);
• natura relaţiei dintre aceste eşantioane (independente sau
dependente);
• numărul variabilelor considerate o dată (una, două sau mai mult
de două).

1
Printre obiectivele urmărite în procesul de analiză a datelor se înscriu,
de obicei, următoarele:
• determinarea tendinţei centrale a variabilelor considerate;
• caracterizarea variaţiei şi a repartiţiei acestora;
• măsurarea gradului de asociere dintre ele;
• realizarea unor estimări şi previziuni;
• evaluarea diferenţelor dintre variabile sau grupuri de variabile;
• evidenţierea legăturilor cauzale dintre ele.

Modalităţi de determinare a tendinţei centrale

Pentru determinarea tendinţei centrale a variabilelor considerate,


punctul de plecare îl constituie considerarea tipului de scală utilizat pentru
măsurarea acestora. După cum s-a evidenţiat într-un capitol anterior, tendinţa
centrală se caracterizează diferit, funcţie de nivelul la care s-a realizat
măsurarea (vezi tabelul nr.1).

Indicatori ai tendinţei centrale


Tipuri de Grupul modal Mediana Media Media
scale (valoarea aritmetică geometrică
modală)
Nominală x - - -
Ordinală x x - -
Interval x x x -
Proporţională x x x x

2
Tabelul 1. Modul de caracterizare a tendinţei centrale funcţie
de tipul de scală utilizat
Dacă datele sunt negrupate, valoarea modală, primul indicator al
tendinţei centrale, este cea care prezintă cea mai mare frecvenţă de apariţie. Să
presupunem că într-o cercetare directă a preferinţelor populaţiei capitalei
pentru turismul de sfârşit de săptămână, eşantionul investigat cuprinde 400
persoane care practică frecvent această formă de turism, distribuite după
statutul socio-profesional astfel (vezi tabelul nr.2):

Categoria socio-profesională Număr de persoane


Muncitori 120
Maiştri-tehnicieni 70
Liber întreprinzători 30
Funcţionari 30
Cadre cu studii superioare 90
Elevi-studenţi 120
Casnice 10
Pensionari 15
Alte categorii 15

Tabelul 2. Repartizarea pe categorii socio-profesionale a persoanelor care


practică frecvent turismul de sfârşit de săptămână

Se observă cu uşurinţă că valoarea modală este 120, ea corespunzând


categoriei muncitori şi categoriei elevi-studenţi.

3
După cum se cunoaşte, în cazul distribuţiilor de frecvenţe specifice
datelor grupate, grupul modal este constituit din grupul care cuprinde cele
mai multe componente comparativ cu celelalte grupuri.
Să presupunem că acelaşi eşantion format din cele 400 persoane se
distribuie, pe grupe de vârstă, după cum urmează (vezi tabelul nr.3):

Grupe de vârstă (ani) Număr de persoane


sub 14 15
14-18 45
19-24 110
25-30 90
31-40 80
41-50 30
51-60 20
61 şi peste 10

Tabelul 3. Repartizarea pe grupe de vârstă a persoanelor care practică frecvent


turismul de sfârşit de săptămână

Rezultă clar că grupul modal este reprezentat de grupul care cuprinde


persoanele în vârstă de 19-24 ani. Acest grup cuprinde 27,5 % din persoanele
care practică frecvent turismul de sfârşit de săptămână. Valoarea modală se
situează undeva în jurul vârstei de 22 ani.
Mediana, un alt indicator al tendinţei centrale, reprezintă după cum se
cunoaşte valoarea deasupra şi dedesubtul căreia se situează câte o jumătate din
observaţii.

4
Dacă datele sunt negrupate, dacă sunt aranjate în ordine, de la valoarea
cea mai mică la valoarea cea mai mare, sau invers şi dacă numărul de
observaţii este fără soţ, valoarea mediană se stabileşte fără nici o dificultate
(vezi tabelul nr.4.):

Restaurantul Numărul de porţii


R1 60
R2 70
R3 110
R4 120 Mediana
R5 130
R6 130
R7 150

Tabelul 4. Numărul de porţii dintr-un preparat culinar vândute într-o zi în şapte


restaurante

În situaţia în care există un număr de observaţii cu soţ, mediana se


consideră în mod convenţional că este situată la jumătate, între cele două valori
centrale.
Dacă datele sunt grupate, mediana se calculează astfel: numărul total
de observaţii (frecvenţe) se împarte la 2 şi astfel rezultă câte observaţii trebuie
să fie deasupra şi câte dedesubtul medianei; după aceasta se determină
frecvenţele cumulate pentru a stabili în care grupă se situează mediana; în final,
se calculează valoarea medianei.
Considerând datele din tabelul cu repartiţia pe grupe de vârstă rezultă
că valoarea medianei se situează undeva în grupa de vârstă de 25-30 ani. Pentru

5
a ne situa la jumătatea numărului observaţiilor (200), se ponderează mărimea
intervalului acestei grupe (5), cu numărul de observaţii adiţionale necesare
(110/260) iar valoarea obţinută se adaugă la 25. Rezultă că mediana este situată
la categoria de vârstă de 27 ani.
Aşa cum s-a arătat, datelor măsurate în scală metrică li se poate calcula
tendinţa centrală şi sub forma mediei aritmetice (începând cu scala interval)
sau chiar sub forma mediei geometrice (în cazul scalei proporţionale).
Media aritmetică, x , a unei variabile x despre care se cunosc n
observaţii într-un eşantion investigat, se calculează astfel:
n

∑x i
x= i =1

n
Dacă vânzările a cinci puncte de desfacere situate pe plajă au fost într-o
anumită zi de: 170; 220; 270; 320 şi respectiv 370 mil. lei, rezultă că media
desfacerilor în ziua respectivă este:

170 + 220 + 270 + 320 + 370


x= = 270 mil.lei
5
Deseori, în calculul mediei aritmetice, apare necesitatea unei ponderări.
Să presupunem că într-o cercetare a imaginii unui grup de 200 turişti,
amplasamentul unui camping a fost apreciat pe o diferenţială semantică cu 5
trepte, astfel:

foarte favorabil 70 45 35 30 20 foarte nefavorabil

Pentru o evaluare sintetică a acestor aprecieri se calculează o medie a


lor, pornind de la nota 5 atribuită, pe scara respectivă, aprecierilor foarte

6
favorabile, descrescând până la nota 1 pentru aprecierile foarte nefavorabile.
Aprecierea medie se calculează astfel:
70 × 5 + 45 × 4 + 35 × 3 + 30 × 2 + 20 × 1
x= = 3,575
200
Dacă datele sunt grupate, pentru calculul mediei aritmetice se foloseşte
următoarea relaţie:
n

∑f i × mi
x= i =1

n
unde: fi – reprezintă frecvenţa grupului i;
mi – punctul de mijloc al intervalului unui grup;
n – numărul total de observaţii cuprinse în eşantion.

În tabelul nr.5 se ilustrează, printr-un exemplu, modul de calcul al


mediei aritmetice în acest caz.

Desfaceri Număr de unităţi Mijlocul fi mi


(mil. lei) (fi) intervalului
(mi)
15-20 7 17,5 122,5
20-25 12 22,5 270,0
25-30 15 27,5 412,5
30-35 11 32,5 357,5
35-40 5 37,5 187,5
TOTAL 50 1350,0

7
Tabelul 5. Desfacerile zilnice ale unor cabane, situate pe trasee turistice
montane (calculul mediei aritmetice)

1350
x= = 27mil.lei
50

Atunci când pentru măsurare s-a folosit o scală proporţională, pentru


caracterizarea tendinţei centrale, se poate calcula inclusiv media geometrică
xG (aceasta este totuşi destul de rar utilizată în cercetările de marketing).

Formula de calcul este următoarea:


n
xG = n ∏x
i =1
i

sau în forma logaritmică


n

∑ log x i
log xG = i =1

Modalităţi de caracterizare a variaţiei şi repartiţiei variabilelor

Caracterizarea variaţiei, un alt obiectiv obişnuit al analizei datelor


culese prin cercetările de marketing, se poate face în mod diferenţiat, în funcţie
de nivelul de măsurare realizat printr-un tip de scală sau altul (vezi tabelul nr.6)
Foarte adesea, datele, indiferent de tipul de scală utilizat, sunt
caracterizate prin prezentarea distribuţiei de frecvenţe atât în formă tabelară
(frecvenţele se pot prezenta în valori absolute, simple sau cumulate, sau prin

8
folosirea procentelor 1 ), cât şi în formă grafică (poligoane de frecvenţe,
histograme, ogive etc.).

Indicatori ai Tipuri de scale


variaţiei Nominale Ordinale Interval Proporţionale
Distribuţia de x x x x
frecvenţe
Procente x x x x
Decile - x x x
Centile - x x x
Cuartile - x x x
Amplitudinea variaţiei - - x x
Abaterea medie - - x x
Varianţa - - x x
Abaterea standard - - x x

Tabelul 6. Caracterizarea variaţiei funcţie de nivelul de măsurare realizat

Mai rar, în procesul analizei datelor se calculează şi cuartilele, decilele


sau centilele. Cuartilele reprezintă două valori stabilite astfel ca o pătrime din
observaţii să se afle sub prima cuartilă, denumită şi cuartilă inferioară şi o
pătrime din observaţii să se afle deasupra celei de-a doua cuartile, denumită şi
cuartilă superioară. Celelalte două pătrimi din observaţii se află între valorile
celor două cuartile şi mediană. În mod similar, numărul de observaţii se poate
împărţi la 10 sau 100 cu ajutorul decilelor şi respectiv centilelor.

1
Pentru calculul procentelor cumulate sunt necesare date cel puţin de natură ordinală.

9
Destul de frecvent, în caracterizarea datelor se foloseşte amplitudinea
variaţiei, care se poate calcula în formă absolută (diferenţa dintre observaţia
cu valoarea cea mai mare şi cea cu valoarea cea mai mică) sau în formă relativă
(raportul dintre amplitudinea absolută şi medie).
De câte ori nivelul de măsurare conduce la date de natură metrică,
pentru caracterizarea variaţiei acestora se pot folosi, alături de amplitudinea
variaţiei şi trei indicatori ai variaţiei, respectiv, abaterea medie (media
aritmetică a valorilor absolute ale abaterilor termenilor eşantionului de la media
lor), varianţa (media aritmetică a pătratelor abaterilor individuale ale
termenilor eşantionului de la medie) precum şi abaterea standard (radical cu
semnul plus din varianţă).
Pentru caracterizarea variaţiei şi a repartiţiei unei singure variabile,
deosebit de utile sunt şi metodele bazate pe cunoscutele tipuri de repartiţii
normale, Poisson, binomiale etc., precum şi cele care presupun abordarea
bayesiană aplicată unei singure variabile.

10