Sunteți pe pagina 1din 25

Analiza datelor in cercetarile de marketing

1.Activitati preliminare in analiza datelor

Dupa culegerea datelor prin intermediul chestionarelor si sistematizarea


acestora, inainte ca acestea sa intre in procesul de prelucrare si analiza
propriu-zisa au loc urmatoarele activitati:

a)determinarea bazei de calcul procentual

b)calculul erorilor

c)testarea semnificatiei procentajelor

a)determinarea bazei de calcul procentual

Este importanta pentru prelucrarile ulterioare ale datelor colectate cu


ajutorul chestionarelor. Presupunem ca unui esantion de 500 de subiecti li
s-a aplicat un chestionar cu patru intrebari inchise.

1.Inchiriati casete video? a)Da b)Nu (Daca nu, interviul nu mai are loc)

2.Vi se par tarifele de inchiriere ridicate a)Da b) Nu

3.Ce fel de inregistrari video inchiriati: a) filme, b)desene animate,


c)spectacole, d) documentare, e)videoclipuri, f) competitii sportive, g)
altele

Ce tipuri de filme inchiriati? a) de actiune, b)comedii, c)muzicale, d)SF, e)


altele

Informatiile colectate din chestionare au fost sistematizate tabelar, astfel:

Intrebarea Raspunsuri Numar total


raspunsuri respondenti
a)300, b)200
a)150, b)100
a)165,b)57,c)62,d)48,

e)120,f)35,g)23
a)124,b)75,c)38,d)15
0

e)62

Sa se stabileasca baza de calcul procentual care trebuie sa fie considerata


pentru prelucrarea datelor cu ajutorul chestionarului.

Ca baza de calcul procentual se poate utiliza:

-numarul total de subiecti pe esantion

-numarul total de respondenti

Diferenta dintre cele doua o reprezinta:

- nonraspunsurile –apar in cazul persoanelor din esantion care nu au


dorit sau nu au stiut sa raspunda la o anumita intrebare

-persoanele neimplicate –subiecti care fac parte din esantion dar care
nu sunt vizati de o anumita intrebare, respectiv care au fost separati de
restul esantionului printr-o intrebare filtru.

La intrebarea 2, marimea esantionului nu este relevanta, deoarece


aceasta intrebare ii priveste doar pe cei care inchiriaza casete video (300
de persoane), numarul persoanelor neimplicate fiind de 200.

Da  150 50 %

Nu  100 33,33 %

Non raspunsuri 50 16,7%

Subpopulatia 300 100 %

In acest caz, baza de calcul este numarul subiectilor care inchiriaza casete
video.

Se poate lua ca baza de calcul si numarul respondentilor, 250.

Da  150 60%

Nu  100 40 %

Respondenti  250 100 %

La intrebarea 3, baza de calcul ar putea fi stabilita astfel:


Numarul raspunsurilor este mai mare decat al subiectilor din esantion.Se
pot utiliza ambii indicatori, dar semnificatia rezultatelor este diferita.

Inregistrari video Numar de Ponderea in numarul total


raspunsuri de raspunsuri de respondenti(%)
a.filme artistice
b. desene animate
c.spectacole
d.documentare
e.clipuri
f.competitii sportive
g.altele
Total

raspunsuri

respondenti

b)calculul erorilor

Eroarea datorata nonraspunsurilor se poate calcula in mai multe moduri.

EXEMPLU

Intr-un chestionar referitor la intentiile de efectuare a unei vacante in


strainatate s-a pus intrebarea Intentionati sa efectuati o vacanta in
strainatate in urmatoarele 6 luni ?

Da

Nu

Nu stiu

Raspunsurile pe un esantion de 1200 sunt:

Variante de raspuns ab c
Numar de raspunsuri

Aparitia nonraspunsurilor poate fi determinata de urmatoarele cauze:

1.imposibilitatea intervievarii subiectilor inclusi pe lista de sondaj-nu au


putut fi contactati, si-au schimbat domiciliul, se afla vacanta, sunt bolnavi
etc

2.refuzul de a raspunde
3.abandon pe parcursul completarii chestionarului

imposibilitatea de a raspunde-intrebari neclare, subiect necunoscut,


nefamiliar, nu-si amintesc un aspect solicitat etc.

Se calculeaza ponderile nonraspunsurilor:

 ponderea celor care nu vor efectua o vacanta in


strainatate

 ponderea celor care s-ar putea sa plece intr-o


vacanta in strainatate(cei care nu au raspuns s-ar putea sa plece totusi in
strainatate)

 ponderea celor care vor calatori probabil in


strainatate

(indecisii-300, se impart in mod egal intre cele doua alternative de


raspuns)

 ponderea celor care s-ar putea sa efectueze o


calatorie in strainatate in urmatoarele 6 luni, in ipoteza ca persoanele
indecise au aceeasi atitudine ca si respondentii.

Eroarea totala este produsul dintre eroarea de esantionare, eroarea


datorata nonraspunsurilor si eroarea de masurare.

Eroarea totala se calculeaza cu metoda ERA(Error Ratio Analysis) a


lui Brown:

unde:

 este eroarea totala

 este eroarea de esantionare


 este eroarea datorata nonraspunsurilor

 este eroarea de masurare

EXEMPLU

Se considera un sondaj in care au fost determinati indicatorii:

-proportia reala a componentelor populatiei statistice care au o anumita


caracteristica, t=0,7

-proportia observata, r=0,8

-proportia reala in esantionul prevazut p=0,6

-proportia reala in esantionul intevievat a=0,9

Sa se calculeze eroarea totala, eroarea datorata nonraspunsurilor,


eroarea de esantionare, eroarea de masurare.

Eroarea totala: 

Eroarea de esantionare: 

Eroarea datorata nonraspunsurilor: 

Eroarea de masurare: 

c)testarea semnificatiei procentajelor

In cazul unei esantionari probabilistice simple si a unei intrebari cu


raspuns unic, testarea semnificatiei diferentei dintre doua procentaje   
si  se realizeaza cu formula:
unde n este marimea esantionului si n> 30.

Regula de decizie este urmatoarea:

daca  > 1,96 diferenta este semnificativa pentru pragul de


probabilitate de 95%

daca  <1,96, diferenta nu este semnificativa la pragul de probabilitate


de 95%

In cazul unei esantionari probabiliste simple si al unei intrebari cu


raspunsuri multiple, testarea semnificatiei diferentei dintre doua
procentaje   si  se realizeaza cu formula:

n este marimea esantionului, iar   este ponderea subiectilor care au


mentionat simultan doua criterii.

2.Analiza univariata a datelor

Analiza datelor reprezinta procesul de aplicare a tehnicilor statistico-


matematice, in scopul extragerii din baza de date a informatiilor necesare
procesului decizional de marketing.

Metodele de analiza se pot grupa dupa mai multe criterii si anume:

   tipul de scala utilizat(nominala, ordinala, interval sau


proportionala)

   numarul esantioanelor cercetare(unul, doua sau mai multe)

   natura relatiei dintre esantioane(independente sau


dependente)

   numarul variabilelor considerate

Obiectivele urmarite in analiza datelor sunt de obicei:

   determinarea tendintei centrale a variabilelor

   caracterizarea variatiei si repartitiei acestora

   masurarea gradului de asociere dintre ele


   realizarea unor estimari si previziuni

   evaluarea diferentelor dintre variabile sau grupuri de variabile

   evidentierea legaturilor cauzale dintre ele

2.1. Determinarea tendintei centrale

Tendinta centrala se caracterizeaza diferit in functie de nivelul la care s-a


realizat masurarea.

Tabel 1

Tipuri de scale Indicatori ai tendintei centrale


Grupul Mediana Media Media
modal(valoarea aritmetica geometrica
modala)
Nominala x
Ordinala x x
Interval x x x
Proportionala x x x x

Indicatorii tendintei centrale sunt:

       valoarea modala

       grupul modal

       mediana

       media aritmetica

       media geometrica

Daca datele sunt negrupate, valoarea modala este cea care prezinta cea


mai mare frecventa de aparitie.

Exemplu:

Intr-o cercetare directa a preferintelor populatiei unui oras pentru


turismul de weekend, esantionul este alcatuit din 350 de persoane, care
practica aceasta forma de turism, distribuite dupa statutul socio –
profesional, dupa cum urmeaza:
Tabel 2

Categoria socio-profesionala Numar persoane


Muncitori
Maistri-tehnicieni
Liber intreprinzatori
Functionari
Persoane cu studii superioare
Elevi-studenti
Casnice
Pensionari
Altii

Valoarea modala este 110.

In cazul distributiei de frecvente specifice datelor grupate, grupul


modal este constituit din grupul care cuprinde cele mai multe
componente comparativ cu celelalte grupuri.

Presupunem ca acelasi esantion se distribuie pe grupe de varsta:

Tabel 3.

Grupa de varsta(ani) Numar de persoane


sub 14 ani
61 si peste

Grupul modal este reprezentat de grupul 19-24 de ani.

Mediana-reprezinta valoarea deasupra si dedesubtul careia se afla cate o


jumatate din observatii.

Daca datele sunt negrupate si daca numarul observatiilor este fara sot,
mediana este la mijloc.

EXEMPLU:

Numarul de portii dintr-un preparat culinar vandute in cinci restaurante

Tabel 4

Restaurantul Numarul de portii


R1
R2
R3 110 mediana
R4
R5

Daca numarul observatii este cu sot, mediana se considera a fi la


jumatate, intre cele doua valori centrale.

Exemplu:

Tabel 5

Restaurantul Numarul de portii


R1
R2
R3
R4

Mediana este 90.

In cazul datelor grupate, mediana se calculeaza astfel:numarul total de


observatii(frecvente) se

imparte la doi si astfel rezulta cate observatii trebuie sa fie deasupra si


cate dedesubtul medianei; dupa aceasta se determina frecventele
cumulate pentru a stabili in care grupa se situeaza mediana; in final se
calculeaza valoarea medianei.

In cazul datelor din Tabelul 3., totalul frecventelor este 350, rezulta ca
175 de observatii trebuie sa se afle deasupra medianei si 175 dedesubtul
ei.Observam ca grupei 19-24 ani frecventele cumulate care ii corespund
sunt 220-valoarea care este cea mai apropriata de 175, decat ar fi
frecventele cumulate corespunzatoare grupei 14-18 ani.Deci valoarea
medianei se situeaza undeva in cadrul grupei de de varsta 19-24
ani.Marimea intervalului 19-24 ani este de 5, aceasta se pondereaza cu
numarul de observatii aditionale necesare(120/126), iar valoarea se
adauga la 19.Rezulta ca mediana este situata la categoria de varsta de
23,75 ani, deci aproape 24 de ani.

Media aritmetica este un indicator al tendintei centrale in cazul scalelor


interval si proportionale(vezi Tabel 1).

Media aritmetica,   a unei variabile x despre care se cunosc n observatii


intr-un esantion investigat, se calculeaza dupa formula:
Daca vanzarile unui supermarket au fost pe parcursul unei saptamani de:
300 u.m. (luni), 530 u.m.(marti), 340 u.m.(miercuri), 320 u.m.(joi), 510
(u.m.)vineri, 710 u.m.(sambata), media vanzarilor zilnice, pe saptamana
in cauza este:

 u.m.

Media aritmetica ponderata se calculeaza cu formula:

 unde   reprezinta valoarea variabilei x corespunzatoare


frecventei  .

EXEMPLU.

In cazul unei cercetari a imaginii unui hotel de catre un grup de turist,


amplasamentul a fost apreciat de catre membrii esantionuluii pe o
diferentiala semantica cu 5 trepte astfel:

f.favorabil 70 45 35 30 20 f.nefavorabil

Pentru evaluarea sintetica a opiniei turistilor, se atribuie fiecarei trepte o


nota(care reflecta aprecierea lor): 5=f.favorabil, 1=f.nefavorabil.

Aprecierea medie:

Daca datele sunt grupate, pentru calcul mediei aritmetice se foloseste


formula:

unde   este frecventa grupului i

 este punctul de mijloc al intervalului unui grup

n este numarul de observatii cuprinse in esantion


EXEMPLU

Calculul mediei vanzarilor in cazul unui numar de 50 de magazine,


grupate dupa vanzarile realizate.

Tabel 6

Vanzari Numar de unitati Mijlocul


intervalului ( )
(u.m.) ( )
TOTAL

Media geometrica este un indicator al tendintei centrale in cazul scalelor


proportionale(vezi Tabel 1.)

Formule de calcul:

2.2.Modalitati de caracterizare a variatiei si repartitia variabilelor

Caraterizarea variatiei se face diferentiat in functie de nivelul de masurare


realizat printr-un tip de scala sau altul(Tabel 7)

Tabel 7.

Indicatori ai Tipuri de scale


variatiei Nominal Ordinal Interva Proportionale
e e l
Distributia x x x x
de frecvente
Procente x x x x
Decile x x x
Centile x x x
Cuartile x x x
Amplitudine x x
a variatiei
Abaterea x x
medie
Varianta x x
Abaterea x x
standard

Cuartilele –reprezinta doua valori stabilite ca o patrime din observatii sa


se afle sub prima cuartila(numita cuartila inferioara) si o patrime din
observatii se afle deasupra celei de-a doua cuartile(cuartila
superioara).Celelalte doua patrimi din observatii se afla intre valorile celor
doua cuartile si mediana.

Decilele –reprezinta impartirea numarului observatiilor la 10.

Centilele-reprezinta impartirea numarului observatiilor la 100.

Amplitudinea absoluta a variatiei-este diferenta dintre observatia cu


valoarea cea mai mare si cea cu valoarea cea mai mica.

Amplitudinea relativa a variatiei este raportul dintre amplitudinea


absoluta si medie.

Abaterea medie-este media aritmetia a valorilor absolute ale abaterilor


termenilor esantionului de la media lor.

Varianta-este media aritmetica a patratelor abaterilor individuale ale


termenilor esantionului de la medie.

Abaterea standard este radical cu semnul plus din varianta.

3.Analiza bivariata ( analiza gradului de asociere a doua variabile)

Presupune masurarea gradului de asociere a doua variabile, sub


aspectul:

- directiei(naturii),

- intensitatii;

- semnificatiei statistice.

3.1.Masurarea asocierii dintre variabile nominale

Se poate realiza cu ajutorul:


-coeficientului de corelatie phi

-coeficientul de contigenta

Procesul de masurare a gradului de asociere in cazul acestor variabile


incepe prin construirea de tabele de contigenta.

Un asemenea tabel contine distributia de frecvente, considerata


simultan pentru doua sau mai multe variabile caracteristice.

EXEMPLU

Dorim sa aflam daca preferintele barbatilor pentru un anumit tip de


fastfood, in care fumatul este interzis, difera semnificativ de preferintele
femeilor.

Cu datele culese de la un esantion de 500 de persoane, din care 300


barbati si 200 femei, se poate alcatui tabelul de contingenta:

Tabel 8

Sexul Prefera unitatea Nu prefera unitatea Total


Barbati
Femei
TOTAL

Calculam procentual preferintele membrilor esantionului.

Tabel 9.

Sexul Prefera unitatea(%) Nu prefera unitatea Total


Barbati
Femei

Probabilitatea ca un barbat sa prefere fastfoodul este de 65,33%, iar ca o


femeie sa-l prefere este de 71 %.

Gradul de asociere dintre cele doua variabile: sex si preferinta(variabile


dihotomice) se poate determina cu ajutorul coeficientului de corelatie
phi. El se calculeaza cu formula:

unde a,b,c,d, reprezinta frecventele tabelului de contigenta de tipul 2 x 2,


dupa cum urmeaza:
a b
c d

In cazul nostru:

a=19 b=10
6 4
c=58 d=14
2

deci 

Coeficientul de corelatie   poate lua valori intre -1,0 si +1,0.Cele doua


extreme indica o asociere perfecta intre variabile, iar valoarea zero indica
lipsa corelatiei.

Pentru a determina in ce proportie preferintele pentru fastfoodul


investigat sunt explicate de variabila sex coeficientul   se ridica la
patrat, pentru a obtine coeficientul de determinare, care indica
proportia variatiei explicate a unei din variabile de catre cealalta variabila.

Aceasta inseamna ca 12,67 % din variatia preferintelor este explicata de


variabila sex.

Concluzia este ca intensitatea asocierii intre cele doua variabile este


foarte slaba.

Semnul coeficientului de corelatie caracterizeaza directia asocierii.Semnul


+ indica o corelatie pozitiva, in sensul ca exista o asociere intre sexul
masculin si preferinta pentru fastfoodul luat in discutie.

Pentru testarea gradului de semnificatie a asocierii dintre opiniile


subiectilor din cele doua esantioane independente(barbati si femei) si
preferinta pentru fastfood, se utilizeaza testul neparametric  .Prin
acest test se urmareste sa se stabileasca daca preferintele barbatilor
difera semnificativ fata de ale femeilor.

Realizarea testului  are ca punct de plecare ipoteza nula –faptul ca


valoarea coeficientului de corelatie  nu difera semnificativ fata de zero,
adica preferintele barbatilor nu difera semnificativ de ale femeilor.
ipoteza nula H 0: 

ipoteza alternativa H1: 

Se determina   cu formula:

unde:

r si k reprezinta numarul de randuri si respectiv de coloane ale tabelului


de contigenta

 frecventele randului i si ale coloanei j care rezulta din observare

frecventele randului i si ale coloanei j care se asteapta sa rezulte


conform ipotezei nule; ele se obtin prin inmultirea frecventei marginale a
randului i cu cea a coloanei j si impartirea produsului la numarul total al
cazurilor(marimea esantionului)

Valorile rezultate prin utilizarea formule de mai sus au o repartitie de


esantionare care poate fi aproximata de o repartitie   cu (r-1)(k-1)
grade de libertate.Daca valoarea calculata a lui   este egala sau mai
mica decat valoarea teoretica corespunzatoare unui numar de grade de
libertate si unui anumit grad de semnificatie, atunci ipoteza nula se
accepta.

In exemplul nostru:

Valoarea teoretica pentru (2-1)(2-1)=1 grad de libertate este


de  .Deoarece   se poate afirma ca la un nivel de
semnificatie de 0,05 ipoteza nula nu se accepta(se accepta ipoteza H1)
adica   difera semnificativ de zero, deci preferintele barbatilor difera
semnificativ de cele ale femeilor.

Ori de cate ori tabelul de contingenta este de tipul 2 x 2, pentru


determinarea valorii lui   se poate utiliza si urmatoarea formula :
unde a, b, c, d au aceeasi semnificatie, iar N=a+b+c+d.

Deoarece, asa cum este cazul si in acest exemplu, testul care este
conceput pentru repartitii continue se aplica unor date in forma discreta,
pentru o mai mare exactitate, apare necesitatea unei corectii pentru
continuitate, cunoscuta sub denumirea de corectia lui Yates.

In aceste conditii, valoarea calculata a lui  se face cu formula:

In cazul nostru:

Intrucat  concluziile raman aceleasi cu cele stabilite pentru


aplicarea primei formule.

Pentru masurarea gradului de asociere intre variabilele unui tabel de


contigenta cu orice numar de randuri sau coloane se
utilizeaza coeficientul de contingenta C, care se calculeaza dupa
formula:

unde:  este valoarea calculata a lui 

N-este numarul subiectilor din esantion

Daca numarul de coloane ale tabelului de contigenta este egal cu numarul


de linii, atunci valoarea coeficientului C este pozitiva si variaza intre zero

si  , unde c este numarul de coloane ale tabelului de contingenta.


In cazul cercetarilor de marketing se uilizeaza scheme de proiectare de tip
„inainte-dupa”, in care subiectii din esantion sunt supusi la doua
masurari-.inainte si dupa aplicarea factorului experimental.

De exemplu, daca factorul experimental este o actiune promotionala, este


mare probabilitatea de a se modifica opinia subiectilor, masurata dupa
aplicarea acestuia.

In aceste situatii, pentru testarea semnificatiei schimbarilor de opinie de


la o masurare la alta, se foloseste testul McNemar.

Tabelul de contigenta in acest caz este:

Masurare „dupa” Imagine nefavorabila Imagine favorabila


Imagine favorabila a b
Imagine nefavorabila c d

unde a, b, c,d reprezinta frecventele de aparitie a celor patru cazuri


posibile in urma aplicarii factorului experimental.

Ceea ce intereseaza in acest exemplu sunt doar frecventele inregistrate in


celulele a si d, suma lor reprezentand totalul persoanelor care si-au
modificat imaginea intre prima si a doua masurare.

Conform ipotezei nule se asteapta ca jumatate din modificari si

anume  sa fie intr-o directie (ele vor aparea in celula a) si jumatate


sa fie in cealalta directie(ele vor apare in celula d).

Testul McNemar este o adaptare a testului  la specificul unui tabel de


contigenta in care sunt considerate doar frecventele inregistrate in cele
doua celule.

se determina cu formula:

unde   frecventele care rezulta din observare

frecventele care se asteapta sa rezulte conform ipotezei nule,

respectiv 
Dupa realizarea gruparii si simplificari, se ajunge la forma finala :

Daca aplicam corectia lui Yates, atunci:

Daca valoarea lui   este egala sau mai mare decat valoarea teoretica,
corespunzatoare unui grad de libertate si a unui anumit grad de
semnificatie, ipoteza nula nu se accepta, deci factorul experimental a avut
o influenta semnificativa asupra imaginii subiectilor care compun
esantionul.

Presupunem ca avem urmatorul tabel de contigenta, in cazul unui


esantion de 250 de persoane.

Masurare „dupa” Imagine nefavorabila Imagine favorabila


Imagine favorabila
Imagine nefavorabila

Rezulta ca :

Valoarea teoretica pentru un grad de libertate este de 


Deoarece  calculat are valoare mai mare decat  teoretic, la un grad de
semnificatie de 0,025, ipoteza nula nu se accepta, adica actiunea
promotionala a determinat schimbari semnificative ale produsului in
randul turistilor.

3.2.Masurarea asocierii variabilelor ordinale

Masurarea gradului de asociere intre variabile masurate cu ajutorul


scalelor ordinale este mai plina de semnificatii, deoarece, inafara relatiei
de echivalenta presupusa de o scala nominala, tipul de scala ordinala
permite si ordonarea alternativelor cercetate pentru fiecare variabila
cercetata.

Variabilele ordinale pot varia concomitent intr-o anumita directie, care


poate fi pozitiva(variatia se realizeaza in acelasi sens) sau
negativa(variatia se realizeaza in sensuri contrare).
Exista doua modalitati de cercetare a relatiilor de asociere:

a)relatiile dintre rangurile alternativelor considerate pentru cele


doua variabile

b)relatiile dintre variabilele de tip ordinal

a) relatiile dintre rangurile alternativelor variabilelor

Se utilizeaza coeficientul Spearman de corelatie a rangurilor, 


, care are formula de calcul:

-diferenta intre cele doua ranguri, detinute de variabila i

n-marimea esantionului

EXEMPLU

Consideram 10 firme de turism, A,B,C,D,E,F,G,H,I,J, care ocupa locurile


1,2,3,4,5,6,7,8,9,10 in ceea ce priveste profitabilitatea la sfarsitul anului
si locurile 2,4,1,5,3,7,6,9,8,10 in ceea ce priveste gradul de ocupare.

Pentru masurarea gradului de asociere dintre rangurile detinute de cele


10 firme in privinta profitabilitatii, pe de o parte, si gradului de ocupare,
pe de alta, se va folosi coeficientul de corelatie a rangurilor Spearman  .

Tabelul de date:

Firma Rangul detinut in ceea ce


priveste
Profitabilitatea Gradul de
ocupare

A
B
C
D
E
F
G
H
I
L
TOTAL

Rezulta ca :

Stiind ca   poate lua valori intre -1(pentru o corelatie inversa perfecta) si
+1 ( pentru o corelatie directa perfecta, iar zero pentru lipsa totala de
asociere, in cazul considerat intre profitabilitate si gradul de ocupare
exista o corelatie directa si foarte intensa.

Pentru a testa gradul de semnificatie statistica a coeficientului de corelatie


se formuleaza ipoteza nula si ipoteza alternativa:

ipoteza nula: H0 

ipoteza alternativa H1: 

Pentru un nivel de incredere de 0,99 valoarea coeficientului Z este 2,58.

Pentru determinarea valorii calculate a lui Z se foloseste formula:

Stiind ca daca   se accepta ipoteza nula, iar in caz contrar se


accepta ipoteza alternativa, concluzia este ca se accepta H1, adica
valoarea coeficientului de corelatie a rangurilor in populatia cercetata
difera in mod semnificativ de zero.

b)relatiile dintre variabilele ordinale

Atunci cand se cerceteaza relatiile dintre variabilele ordinale si cand mai


multe alternative sunt la egalitate, gradul de asociere se masoara
prin coeficientul lui Goodman si a lui Kruskal,  .

Acesta se calculeaza cu formula:

 unde P si Q sunt valori calculate, ca in exemplul de mai jos.


EXEMPLU

Se organizeaza degustarea unui preparat culinar dietetic intr-un esantion


de 301 de persoane, culegandu-se informatii cu privire la intentia de a le
cumpara in viitor.Intentiile sunt prezentate pe cinci niveluri, de la
categoria 1- sigur va cumpara, la categoria 5 -sigur nu va cumpara.

Prezentarea datelor culese:

Categorii de Intentii de cumparare


varsta
sub 20 de ani

20-40 de ani

40-50 de ani

peste 50 de
ani

Se doreste a se afla gradul de asociere dintre variabilele „intentii de


cumparare” si „varsta”.

Pentru calculul lui P se procedeaza in felul urmator: se porneste prin a


inmulti frecventa din partea stanga sus cu suma frecventelor aflate mai
jos cu un rind si la dreapta, astfel:

Apoi pe coloana a doua, a treia si a patra.

Mai departe se considera frecventele situate pe randurile doi si trei:

+15+10+5+25+20+20+1)=960

10(15+10+5+20+5+1)=560

15(10+5+5+1)=315

20(5+1)=120

20(25+20+5+1)=1020

15(20+5+1)=390

15(5+1)=90

10(1)=10

Insumand toate produsele obtinute se obtine P=6815


Pentru calcularea lui Q se porneste din stanga sus si se procedeaza
similar.

linia 1

+10+15+20+20+15+15+10+35+25+20+5)=5000

20(10+10+15+20+15+15+35+25+20)=3300

15(10+10+20+15+35+25)=1725

10(10+20+35)=650

linia 2

20(10+15+15+20+35+25+20+5)=2900

20(15+15+20+35+25+20)=2600

15(20+15+35+25)=1425

10(20+35)=550

linia 3

5(5+20+25+35)=425

10(20+25+35)=800

15(25+35)=900

15(35)=525

Q=20800

Cunoscand ca   poate lua valori in intervalul -1 si +1, in acest caz,


intentiile de cumparare ale produsului culinar testat si varsta exista o
corelatie inversa destul de intensa.

OBSERVATIE

Avand determinate sumele P si Q, se poate calcula si coeficientul de


corelatie a rangurilor a lui Kendall, cu formula:
, in care S=P+Q, iar n este marimea esantionului.

3.3.Corelatia dintre variabilele metrice

In cazul scalelor metrice(de tip interval sau proprotionale) este posibila


masurarea distantelor dintre alternative.Astfel, pentru masurarea gradului
de asociere a variabilelor masurate pe scale metrice se
utilizeaza coeficientul de corelatie a lui Pearson, r.

unde X si Y sunt variabilele masurate cu ajutorul scalelor metrice.

EXEMPLU.

Se doreste stabilirea corelatie care exista intre modificarea venitului


national in ultimii 6 ani intr-o tara oarecare si circulatia turistica interna
din tara respectiva-exprimata prin cheltuielile pentru turism ale populatiei.

In tabel sunt prezentati indicii cu baza fixa ai celor doua variabile


considerate in cei 6 ani si calculele necesare pentru determinarea lui r.

Anul Venitul national X Cheltuieli pentru XY


turism Y

deci valoarea lui r este :

Ridicam la patrat:   si obtinem coeficientul de determinare,


care indica proportia variatia explicate a uneia din variabile(97%) de catre
cealalta variabila.

Coeficientul r poate lua valori intre -1 si

In cazul considerat, cele doua variabile sunt strans corelate.


Pentru a testa gradul de semnificatie, se formuleaza:

ipoteza nula H0: r

ipoteza alternativa H1: 

Din tabele, pentru un nivel de incredere de 0,99, valoarea coeficientului Z


este de 2,58.

Se calculeaza  .

Intrucat   nu se accepta ipoteza nula, adica valoarea


coeficientului de corelatie difera in mod semnificativ de zero.
BIBLIOGRAFIE

Catoiu, Iacob(coordonator)-Metode si tehnici utilizate in cercetarile de


marketing.Aplicatii, Editura Uranus,Bucuresti, 1999

Catoiu,Iacob(coordonator)-Cercetari de marketing,Editura Uranus,k


Bucuresti, 2002

Chelcea, Septimiu-Metodologia cercetarii sociologice:metode cantitative


si calitatice, Editura Economica, Bucuresti,2001

Florescu,C.,Malcomete,P.,Pop,N.Al-Marketing.Dictionar explicativ,
Editura Economica, 2000

Gherasim, Toader, Gherasim, Adrian-Cercetari de marketing, Editura


Economica, Bucuresti, 2003

Kotler, Ph.-Managementul marketingului, Editura Teora, 2003

Lefter, C.-Cercetarea de marketing.Teorie si practica, Editura Lux Libris,


Brasov, 1996

Olteanu, V. –Management-marketing , Editura Ecomar, Bucuresti,2003

Popescu, Ioana Cecilia-Metode cantitative utilizate in cercetarile de


marketing, Editura ASE, Bucuresti, 2000

Prutianu,Stefan, Anastasiei,Bogdan,Jijie,Tudor-Cercetarea de
marketing.Studiul pietei pur si simplu, Editura POLIROM, Iasi, 2002

Rotariu, Traian, Ilut, Petre-Ancheta sociologica si sondajul de


opinie.Teorie si practica, Editura POLIROM Iasi, 1999

S-ar putea să vă placă și