Documente Academic
Documente Profesional
Documente Cultură
Analiza dispersional permite testarea semnificaiei relaiei ntre dou sau mai multe
tipuri de clasificri, determinnd importana factorilor respectivi asupra acestor relaii. Cu
alte cuvinte, analiza dispersional stabilete contribuiile pe care le aduc la dispersia total a
eantionului de date, dispersiile factorilor utilizai drept criterii pentru clasificarea
observaiilor6.
Dac n acest raport variana atribuit unui factor este mai mare dect variana estimat
a eantionului, i anume ntr-o
La baza analizei dispersionale se afl segregarea dispersiei mrime superioar celei la
totale a unei serii de date n dispersiile componente, care pot care ne-am atepta ca s
fi atribuite diferiilor factori implicai.Variana care poate fi provin numai din variaiile
atribuit unui factor este mprit la variana estimat a de eantionare, atunci i se
eantionului, aceasta fiind o dispersie normal, dat de efectul recunoate acestui factor
variaiilor de eantionare asupra datelor din eantion. calitatea de a exercita o
influen asupra datelor din
eantion.
Semnificaia mrimii cu care variana unui factor depete variana estimat a eantionului
se determin interpolnd valoarea acestui raport F. Celebra distribuie F provine de la numele
celui care n anul 1924 a dezvoltat aceast metod R.A. Fisher (1890-1962) si ale carui
contributii il pun alaturi de Karl Pearson, tatal gindirii statistice moderne. Cu ajutorul
distribuiilor de probabilitate F, se stabileste dac valoarea calculat depete sau nu valoarea
corespunztoare la nivelul de semnificaie = 0,05 a lui F, pentru fiecare mrime a gradelor de
libertate.
In mod obisnuit ne ateptm s apar o valoare F mai mare dect cea dat ca urmare a
variaiilor de eantionare ntmpltoare. Analiza dispersionala se aplica atunci cind (1) fiecare
populatie poate fi descrisa printr-o variabila sau factor considerata ca efect principal asupra
variatiei datelor, (2) fiecare variabila independenta poate fi impartita in doua sau mai multe
grupuri (alternative), (3) variabila care trebuie masurata este numita variabila dependenta), (4)
scopul este acela de a determina impactul efectelor principale asupra variabilei dependente dar
si interactiunile dintre variabilele independente. Se presupune ca erorile sunt normal
distribuite, dispersiile esantionului nu difera semnificativ, esantioanele din fiecare populatie
sunt aleatoare si independente iar datele masurate sunt bazate pe scala proportionala ori
interval.
Cel mai mare avantaj al analizei dispersionale este dat de capacitatea acesteia de a
localiza sursa diferenelor semnificative din gruprile combinate, ntocmite dup 2, 3 sau
mai multe caracteristici7.
6 Isaic-Maniu A., Mitru C., Voineagu V., Statistica pentru managementul afacerilor, Editura Economic,
1996
7 Colibab Dana tefania, Prospectarea pieei bunurilor de larg consum prin metodele cantitative specifice
Aceast prim abordare se va realiza prin tehnici aritmetice, robuste, uor de intuit i
reinut, dar dup verificarea calcul cu calcul vom proceda la utilizarea facilitilor pachetului mai
sus amintit.
Asupra datelor acioneaz variabila independent cu alternativele din coloanele tabelului
statistic. Pentru verificarea omogenitii datelor, deci a lipsei de influen a variabilei
considerate independente, se utilizeaz cel mai adesea, testul prezentat la punctul 2.1.1.
T. j .T. j . T. .
Figura 2.1
Analiza dispersional 69
nsumrile la captul liniei presupun neluarea n considerare a variabilei din coloane sau
a altor variabile-ntrebri reprezentnd ct de multe rspunsuri exist pentru fiecare alternativ i a
unei ntrebri X ce depinde de respondent (atribut sau caracteristic dependent, efect, intrinsec,
endogen) de aceea totalul parial este notal cu Ti . , unde punctul este simbolul indiferenei
fata de variabila din coloana.
n acela fel, T.. reprezint totalul (numrul) celor ce rspund la cele dou ntrebri X, Y
(i poate fi mai mic sau egal cu cel al colectivitii intervievate) indiferent de alternativele de
rspuns i sau j
c
Ti .= x ij (2.1)
j=1
r
Tj .= x ij (2.2)
i =1
c r
T. .= x ij x ij (2.3)
j=1 i =1
1. Formularea ipotezei nule H0, care afirm c ntre cele dou variabile-ntrebri de
segmentare nu exist legtur cauzal, sau asociere;
2
4.Calcularea lui cu ajutorul formulei;
c
r, c ( - 2
2 x ij ij )
xc = ij
(2.5)
i, j
70 Metode cantitative n marketing
2 2
5. Se compar cu obinut din tabelul repartiiei 2 astfel:
c t
2 2
dac > se respinge ipoteza nul i deci exist o legtur ntre variabilele
c t
de segmentare studiate;
2 2
dac se admite ipoteza nul i deci nu exist o legtur ntre
c t
variabilele de segmentare studiate.
2
[0,1]
xc
C= (2.6)
2
N + xc
Cu ct valoarea lui C este mai aproape de 1 (dar nu ajunge niciodat s fie egal cu 1)
cu att variabilele sunt mai strns corelate.
Vom nota cu litera r (rnd, row n englez) numrul de rnduri ale tabelului de
contingen, cu litera c (coloana, column n englez) numrul de coloane iar cu litera n,
unitile observate (n = r * c), iar cu (alfa) probabilitatea erorii de genul I care se numete i
risc de genul I, reprezentnd un prag de semnificaie necesar pentru aflarea valorii F (Fisher)
din tabelele statistice.
n urma centralizrii datelor culese dint-o cercetare de teren, a rezultat tabelul nr 2.1, cu
numrul de chestionare realizate de 10 operatori de interviu. Se urmrete obinerea informaiei
sunt sau nu diferene ntre operatori ca numr de chestionare completate.
TABELUL 2.1
DISTRIBUIA NR. DE CHESTIONARE PE ZILE I OPERATORI
Nr. chestionare
Ziua i / Observator - j 1 2 .8 9 10
Luni ziua 1 99 70 70 85 92
Mari ziua 2 96 65 51 84 91
Miercuri ziua 3 95 60 93 80 93
Joi ziua 4 98 65 94 86 90
Vineri ziua 5 97 65 92 90 89
Total- Tj 485 325 .400 425 455
Cifrele din interiorul tabelului reprezint respondenii chestionai n cele cinci zile ale
cercetrii.
Modelul statistico-matematic este urmtorul:
x ij = + j + ij (2.7)
n care fiecare dat din tabel, xij este egal cu o medie a populaiei care sufer abaterea datorat
coloanei j, j i a unei erori experimentale ij.
Se presupun seturile de ipoteze statistice:
1 = 2 = 3 = .j = . = c (2.9)
1 . j (2.11)
df1 = c - 1 = 9
df2 = (r 1)*c = 40
= 0,05
Ft (9,40) = 2,05
2
T .. (2.12)
C=
n
n care T.. reprezint totalul general (mrimea eantionului, n cazul de fa numrul de
chestionare) iar n reprezint numrul de date observate (csue completate n tabel).
Vom avea:
2
4.000
C= = 320 .000
10 5
c T2
.j
SPC = n
-C (2.13)
j=1 j
n care T.j reprezint totalurile din fiecare coloan j (sau alternativ de rspuns n parte) ale
factorului observat, iar nj numrul de date observate din factorul respectiv (numrul de csue
completate din coloan).
SPC
MPC = (2.16)
df1
6.810
MPC = = 756, 67
9
Se determin media ptratelor pe eroarea experimental:
SPE
MPE = (2.17)
df 2
3.138
MPE = = 78,45
40
Se determin raportul Fisher calculat pentru fiecare factor de influen n parte (n acest
exemplu, conform ipotezei i modelului matematic, doar factorul din coloane):
MPC
Fc = (2.18)
MPE
756,67
Fc = = 9,65
78,45
Figura 2.2
Dac ipoteza unui singur factor o verificm pentru rnduri, avem valorile din tabelul de
mai jos, n varianta Microsoft EXCEL.
Analiza dispersional 75
TABELUL 2.2
ANOVA: SINGLE FACTOR
RNDUL ESTE CAUZA VARIAIEI
SUMMARY
Groups Count Average Variance
Sum
Ziua 10 55 5.5 9.16
1 10 830 83 152.89
2 10 790 79 215.33
3 10 750 75 324
4 10 820 82 154.22
5 10 810 81 214.44
Between
Groups 46652. 5 9330.41 52.317 1.71E-19 2.38
Within
Groups 9630. 54 178.34
Total 56282 59
.
Trinicia relaiilor funcionale este dat de repetabilitatea lor. Un scop major n tiin este
acela de a permite prognoza fenomenelor naturale.
Dac variaia datelor conforme variabilei predictive corespunde n acelai mod cu variaia
datelor variabilei rezultative, atunci avem o relaie funcional i putem prognoza rezultatul pe
care nc nu l-am aflat (observat) cunoscnd doar valoarea variabilei independente. Din pcate,
ne nfruntm cu surse variate de eroare ce provin din mediul din care am extras datele, din
greelile legate de identificarea unor relaii ntmpltoare, greeli de calcul sau rotunjire, din
existena i neluarea n calcul a mai multe surse de influen simultan i altele.
Cteodat se realizeaz o relaie sistematic ntre dou variabile pur i simplu din
intmplare, cnd nimic, cu excepia Erorii, nu opereaz. Din aceast cauz trebuie s fim
permanent n poziia de a distinge ntre rezultatele experimentelor care se produc doar datorit
ansei sau erorilor mediului i acelea care indic prin repetabilitate o relaie sistematic ntre
variabile.
Problema ncrederii n datele furnizate de o relaie este dat de repetabilitate, aa nct
trinicia unei relaii este repetabilitatea ei. Dac exist cu Adevrat o relaie sistematic ntre
variabile atunci una dintre ele va prezice cu regularitate valorile celeilalte. Dac aceast relaie se
datoreaz mai degrab Erorii sau ntmplrii, atunci nu ne putem baza pe ea i nu ne este de folos
n prognoze.
Dar ce facem cu fenomenul socio-economic, unde sunt miriade de relaii ntre variabile,
funcii compuse i compuneri de funcii? Cercettorul ori experimentatorul care caut s
deslueasc aceaste fenomene trebuie s tind, poate, pentru nelegere ctre poetica lumii lui
Eminescu. Acesta avnd o lume a lui, personal, secret, destinat unei experiene solitare.
Plin de fulguraii i umbre, de strbateri uluitoare i de ciudate fracturi i stagnri, de struine
i de renateri a cror lege interioar uneori se las regndit, alteori nu. Un labirint de miraje,
ecouri i oglinzi, de uitri i de anamneze, de masive construcii i de paragini, n care i-au
lsat urmele i clipele i eonii, i timpul din lume i cellalt.8
Mersul ideilor Demiurgului ctre Luceafr este la Petru Creia urmtorul: mi ceri s-i
iau eternitatea ca s poi muri, ca s te poi ntoarce n vecinicul repaos dup care, cuprins de
ispita iubirii, atta nsetezi. Dar eu:
a) Nu pot s-i dau condiia de muritor pentru c, noi fiind cosubstaniali, ar nsemna s
m neg pe mine nsumi, s tgduiesc adevrul care ne cuprinde pe amndoi n
venicia lui
b) Chiar dac te-a face muritor, te-a integra ntr-o lume n care moartea la care
aspiri este pur aparen, de vreme ce entitile pieritoare din care este fcut umplu
nite tipare, nite Forme inalterabile, pe veci nepieritoare, sustrase timpului i
devenirii; i-ai pierde doar identitatea, fr s te poi stinge n repaos, pierind i
renscndu-te mereu n neodihna venic a naterilor i pierderilor care se perind
prin eternitatea formelor. Mai mult, pentru a-i face i mai evident teza aceasta,
Este subliniat juxtapoziia a dou teze exprimate n prima parte a vorbirii Demiurgului: a)
cea a diferenei i incompatibilitii dintre ordinea eternului i cea a efemerului i b) cea a
eternitii formelor sau a tiparelor efemerului.
Dar cum putem recunoate c relaia observat este datorat sau nu ntmplrii (erorii)? De
cele mai multe ori metoda pe care oamenii de tiin o ntrebuineaz este o versiune mai
organizat a bunului sim. S ne reamintim poezia Luceafrul creat de genialul Eminescu.
Ctlina: l vede azi, l vede mni/Astfel dorina-i gata/El iar privind de sptmni,/i
cade drag fata. (repetabilitatea ce justific trinicia relaiei)
Situaia grea n care se afl Hyperion este aceea a unui experimentator. Ambii doresc
s afle dac ceea ce s-a ntmplat (chemrile repetate, oaptele) este datorat unui ceva
important. n ambele cazuri ei trebuie s se ngrijoreze dac reaciile obinute (datele) sunt
produse de fluctuaiile necontrolate ale unor factori neinteresani. Ar trebui s se ntrebe pe ei
nii Am primit un mesaj important, sau este datorat zgomotului din mediu
(variabilitii mediului)?
Hyperion nu tie dac toate aceste chemri nu au fost alarme false, adic ceea ce
experimentatorul va numi erori de tip I, eroarea lui fiind n acest caz renunarea la nemurire
cnd de fapt nu exist dragoste. Cu alte cuvinte crede n existena variabilei independente
(amor), cnd aceasta nu exist. Dar mai exist un tip de eroare. Ce se ntmpl dac El nu
renun la nemurire i dragostea exist? Experimentatorul tie c este eroarea de tip II.
- Tu-mi cei chiar nemurirea mea /n schimb pe-o srutare,/Dar voi s tii asemenea/Ct
te iubesc de tare;
Ctlina face eroarea de tip II, ea fiind convins c Hyperion nu va renuna la nemurire:
Lucete c-un amor nespus /Durerea s-mi alunge,/Dar se nal tot mai sus/Ca s nu-l
pot ajunge.
Eroarea de tip I este corectat, acel ceva important nu exist, se pare c reaciile
obinute sunt produse de fluctuaiile necontrolate ale unor factori neinteresani (muritorii
Ctlin i Ctlina). Prin urmare, El tremur ca alte di/n codrii i pe dealuri, / Cluzind
singurti/De mictoare valuri;, Dar nu mai cade ca-n trecut / n mri din tot naltul;/- Ce-i
pas ie, chip de lut,/Dac-ai fi eu sau altul ?
78 Metode cantitative n marketing
Dac judecm n continuare la rece, statistic, reaciile celor doi atunci ajungem la un punct
fundamental al experimentului i anume ncercarea de a detecta un semnal n prezena unui
mediu zgomotos. oaptele naturii, ale mrii, ale pdurii, ale vntului trebuiesc
difereniate de oaptele iubitei; apariiile misteriosului Luceafr trebuie discriminate de
apariiile altor frumoi tineri (Ctlin).
Pentru experimentator raportul este observaie / eroarea estimat. Rezult o privire asupra
diferenei ntre tratament i condiiile de control n contrast cu diferenele ce se observ fr
tratament. Dac raportul (semnal + zgomot) / zgomot este destul de mare n raport cu
zgomot/zgomot atunci exist acel ceva, semnalul. n cazul nostru oapte + larm.
n secolul XVIII, Blaise Pascal a creat un model matematic pentru situaii de joc pentru a
nu fi nevoii s repetm experimentul de 1000 de ori, cazul nostru. Modelul se cheam
distribuie binomial.Conform anexei create de aceast distribuie, i presupunnd c
Luceafrul coboar de 7 ori din cele 10 chemri netiind dac este iubit sau nu, atunci
probabilitatea este 0,172. Aceasta nseamn c ne putem atepta s coboare la orice oapt n
17% din cazuri fr s tie dac este realmente dorit sau nu. Considerm c sunt cam riscante
att de multe teleportri fr efect.
n analiza cazului de mai sus, ipotezele H0 i H1 pentru Luceafr, respectiv Ctlina sunt
urmtoarele:
LUCEAFR
CTLINA
Cum am apreciat anterior, eroarea Luceafrului este de genul nti, respinge ipoteza Ho
dei n realitate ea este adevrat n timp ce Ctlina face o eroare de genul al doilea, accept Ho
cnd ipoteza e fals9.
O decizie just este luat pe baza seleciei de date (sau observaii ori informaii) i
atunci:
(1) acceptm H0 cnd este adevrat evitnd eroarea de genul I i
(2) respingem H0 cnd este fals i astfel nu comitem o eroare de genul II.
Analiza dispersional permite testarea semnificaiei relaiei ntre dou sau mai multe tipuri
de clasificri, determinnd importana factorilor respectivi asupra acestor relaii. Cu alte cuvinte,
analiza dispersional stabilete contribuiile pe care le aduc la dispersia total a
eantionului de date, dispersiile factorilor utilizai drept criterii pentru clasificarea
observaiilor.
Vom lua n considerare acelai exemplu din tabelul 2.1, dar n acest caz socotim c
variaia datelor din tabel se datoreaz att operatorilor (coloanele tabelului de contingen) ct i
zilelor sptmnii, rndurile tabelului.
Modelul matematic este urmtorul:
x ij = + i + j + ij (2.19)
n care fiecare variabil observat xij este egal cu media populaiei, care sufer abaterea liniei
i, abaterea coloanei j i a erorii experimentale ij.
9 Mihi N.V., Eseu privind incertitudinea i comunicarea, Sesiunea tiinific a cadrelor didactice,
( ) i , i = 0 (2.20)
() i , i 0 (2.21)
1 = 2 = 3 = .j = . = c
() j , j 0
sau cel puin dou medii pe coloan nu sunt egale:
1 .j
2
T.. (2.22)
C=
rc
10Hicks, Charles R., Fundamental Concepts in the Design of Experiments., New York: Holt, Rinehart and
Winston, Inc. 1964
82 Metode cantitative n marketing
2
4.000
C= = 320 .000
10 5
c T2
.j
SPC = r
-C (2.24)
j=1
r c
SPT = xij2 - C
i =1 j =1
SPC
MPC =
df1
6.810
MPC = = 756, 67
9
SPE
MPE =
df 2
2.738
MPE = = 76,06
36
756,67
Fc = = 9,95
76,06
TABELUL 2.3
Se apeleaz din meniul Tools, Data Analysis i se alege :
1 5 485 97 2.5
2 5 325 65 12.5
3 5 350 70 262
4 5 475 95 24
5 5 310 62 74.5
6 5 410 82 24.5
7 5 365 73 6.5
8 5 400 80 362.5
9 5 425 85 13
10 5 455 91 2.5
Total 9948 49
Rezultate similare cu lucrul direct
Analiza dispersional 85
2.4. IDENTIFICAREA INTERACIUNILOR NTRE VARIABILE
Vom analiza cazul n care asupra datelor din tabel acioneaz doi factori simultan
(alternativele n rnduri pentru unul i alternativele celuilalt n coloan) iar interaciunea
existent sau nu ca legatur, va fi descoperit pe baza repetiiei observaiilor.
Vom lua n calcul cazul n care exist interaciune ntre zilele lucrtoare ale sptmnii
i amplasamentul unor uniti comerciale. n acest caz, rndurile tabelului de contingen vor
cuprinde zilele lucrtoare , coloanele vor fi societile comerciale, iar drept repetiie vom lua
n considerare observaiile fcute dimineaa i dup orele 15.
TABELUL 2. 4
Dou intrri Vadul
comercial
Ziua / repetiia S.C. 1 S.C. 2 S.C. 3
Luni Dimineaa 72 66 80
T1. = 450
Dup ora 15 76 72 84
Mari Dimineaa 71 69 97
Dup ora 15
T2. = 480
75 73 95
Miercuri Dimineaa 81 75 100
Dup ora 15
T3. = 510
83 75 96
Joi Dimineaa 70 64 95
Dup ora 15
T4. = 456
72 66 89
T.j. 600 560 736 Ti..
n care fiecare variabil observat xijk este egal cu o medie a populaiei care sufer: abaterea
liniei i, fa de medie, abaterea coloanei j, fa de medie, interaciunea dintre linie i coloan
ij, abateri fa de medie datorit influenei simultane att a liniilor ct i coloanelor, sau datorit
erorii experimentale ijk (ali factori influeneaz datele i ei nu au fost luai n model, exist
perturbaii majore asupra datelor i le fac s difere fa de medie).
86 Metode cantitative n marketing
Pentru a verifica modelul avem nevoie de un factor de control. Repetarea experimentului
este un bun factor de control. Spre exemplu datele sunt culese dimineaa i dup ora 15 i se
prezint n dou tabele de contingen pentru a se observa de multe ori instantaneu dac sunt sau
nu diferene. Variabila de control trebuie s fie indiferent altfel devine una dintre variabilele
care vor fi luate n model ca una dintre cauzele perturbrii acestora fa de medie.
( ) i , i = 0
H1 sunt diferene semnificative ntre mediile pe rnduri; ex.n unele zile datele centralizate
pe cele trei S.C.-uri sunt semnificativ diferite fa de media pe sistem datorit abaterilor.
Relaia este n acest caz (2.21)
() i , i 0
( ) j , j = 0
H1 datele difer statistic semnificativ de la o unitate la alta; ex. totalurile obinute difer
semnificativ statistic fa de medie, exist abateri. Folosim relaia (2.10)
() j , j 0
( ) i , j , ij = 0 (2.29)
H1 anumitor S.C.-uri le merg bine n zile cnd altora le merge prost i vice-versa, sunt
abateri semnificative statistic fa de medie.
( ) i , j , ij 0 (2.30)
Se calculeaz numrul de grade de libertate df1 pentru rnd, coloan, interaciune (fiecare
factor de influen din model) i numrul de grade de libertate df2 pentru ntregul tabel, unde sunt
r rduri, c coloane, i n repetiii.
df1 = r - 1 = 3
df1 = c - 1 = 2
Analiza dispersional 87
df1 = (r - 1)(c - 1) = 6
df2 = r c (n - 1) = 12
pentru = 0,05 avem Fisher tabelat pentru:
Ftabelat rnd (3, 12) = 3,49;
Ftabelat coloan (2, 12) = 3,88;
Ftabelat interaciune (6, 12) = 3,00
Se determin factorul de corecie C:
T 2... (2.31)
C=
r cn
2
C = 1.896 = 149.784
24
unde T este totalul general, n care dispare identitatea liniei i, coloanei j i repetiiei k.
Se determin suma ptratelor SP pentru fiecare factor de influen din model:
r T i2.
SPR = cn
-C (2.32)
i =1
2+ 2+ 2+ 2
SPE = 450 480 510 456 - 149.784 = 372
6
c T2
.j (2.33)
SPC = r xk - C
j =1
r c T2
rep
SPRep = n
-C (2.34)
i =1 j =1
( 72 + 76 )2 + (66 + 72 )2 + ...
SP Re p = - 149.784 = 2.676
2
unde SPRep semnific suma ptratelor subtotalurilor repetiiilor pe categorii ale coloanelor iar
SPI, suma ptratelor interaciunii, ceea ce rmne dup extragerea influenei rndului i
coloanei.
SPE 102
MPE = = = 8,5
r * c * ( n 1) 12
Se determin raportul Fisher calculat pentru fiecare factor de influen:
Ce trebuie iar apreciat este faptul c valoarea SPE a fost calculat diferit (rndul de mai sus
Within) ceea ce arat nc odat, diferena ntre gndirea diferit a colilor de teorie statistic. Trebuie
subliniat atitudinea specialistului de a nu rmne robul unei singure tehnici, dar mai ales verificarea
din mai multe, unghiuri de vedere, cu tehnici diferite, deoarece ele nu sunt singurele purttoare de
adevr.
90 Metode cantitative n marketing
2.3. Identificarea interaciunilor prin experimente factoriale.
Experimentele factoriale au la baz studierea influenei factorilor asupra datelor observate, n
condiiile n care factorii acioneaz simultan, independent i apoi n interaciune cte doi, rei etc. Pentru a
realiza acest faot se iau n calcul nivelurile factorilor n comparaii aritmetice.
Cele mai utilizate experimente de acest fel sunt: experimentul 22 (doi factori cu dou niveluri),
experimentul 23 (trei factori cu dou niveluri) i experimentul 32 (doi factori cu trei niveluri).
O firm de publicitate outdoors dorete s tie dac factorii sex, momentul zilei i tipul de
panotaj pentru reclam influeneaz fenomenul de recall reamintire pe care o au trectorii
chestionai ntr-o intersecie. Pentru a se valida cercetarea a fost luat n calcul ca test de control o alt
intersecie amenajat identic ca panotaj. n urma cercetrii, au rezultat urmtoarele rezultate :
TABELUL 5
Sptmna n care
s-a desfurat
Combinatia Efect simplu si
experimentul Total
factorilor combinat
I II
1 69 74 143 t1
A 72 81 153 ta
B 71 80 151 tb
C 75 82 157 tc
AB 73 80 153 tab
AC 77 87 164 tac
BC 79 94 173 tbc
ABC 82 95 177 tabc
Total 589 673 1271 Total
Cifrele reprezint numrul de intervievai care au tiut unde au mai vzut reclama din panotajul
afiat. Factorul A: sex Niveluri: 0 Femeie 1 Brbat
Factorul B: momentul zilei Niveluri: 0 dimineaa 1 dup ora 15
Factorul C: Tipul panotajului Niveluri: 0 n strad 1 pe o faad
Interaciunile sunt date de combinarea factorilor: ab, ac, bc, abc.
Figura 1 de mai jos arat cele 23 combinaii n care nivelurile A, B, C, sunt succesiv i alternativ la nivel 0
i 1, ilustrarea fcndu-se cnd cu litere mici, cnd cu litere mari.
AbC101 111
ABC
Abc Abc
100 Abc 110
(a) (ab)
abC
001
(c)
aBC
001 abc O11(bc)
000 O1O
abc (1) (b)aBc
Analiza dispersional 91
Modelul matematic este urmtorul:
xi jk l = + i + j + k + i j + i k + j k + i jk + i jk l
0 0 0 69 74 143 t1
Frecvenele au rezultat n urma strii: cte femei i amintesc,
intervievate dimineaa, de reclama aprut pe un panou stradal
1 0 0 72 81 153 ta
Frecvenele au rezultat n urma strii: ci brbai i amintesc,
intervievai dimineaa, de reclama aprut pe un panou stradal
0 1 0 ... ... ... tb
Frecvenele au rezultat n urma strii: cte femei i amintesc,
intervievate dup ora 15 , de reclama aprut pe un panou stradal
0 0 1 ... ... ... tc
Frecvenele au rezultat n urma strii: cte femei i amintesc,
intervievate dimineaa, de reclama aprut pe un panou situat pe o
faad
1 1 0 ... ... ... tab
Frecvenele au rezultat n urma strii: ci brbai i amintesc,
intervievai dup ora 15, de reclama aprut pe un panou stradal
1 0 1 ... ... ... tac
Frecvenele au rezultat n urma strii: ci brbai i amintesc,
intervievai dimineaa, de reclama aprut pe un panou situat pe o
faad
0 1 1 ... ... ... tbc
Frecvenele au rezultat n urma strii: cte femei i amintesc,
intervievate dup ora 15, de reclama aprut pe un panou situat pe
o faad
1 1 1 ... ... ... tabc
Frecvenele au rezultat n urma strii: ci brbai i amintesc,
intervievai dup ora 15, de reclama aprut pe un panou situat pe
o faad
92 Metode cantitative n marketing
10 010
Avnd n vedere c factorul A ctig influennd la patru subtotaluri i anume ta, tab, tac, tabc;
pentru a obine efectul lui A, simplu i combinat, vom scdea din suma ctigului contribuiile altora
fr factorul A, i anume ali factori din mediu (1), ctigul lui B fr A, ctigul lui C fr A, i
ctigul combinaiei ntre B i C, fr A. Situaia se repet i pentru factorii B i C. Vom organiza datele
n tabel astfel nct s obinem aceste noi totaluri.
Datele vor fi organizate ntr-un tabel al semnelor aritmetice, astfel:
1 a b c ab ac bc abc Total
+ + + + + + + + 1271 T1
- + - - + + - + 23 Ta
- - + - + - + + 37 Tb
- - - + - + + + 71 Tc
+ - - + + - - + (-11) Tab
+ - + - - + - + (-1) Tac
+ + - - - - + + 21 Tbc
- + + + - - - + 5 Tabc
Sumele s-au obinut prin adunarea , acolo unde este semnul "+" i prin scderea, acolo unde este
semnul "-" a subtotalurilor efectelor pariale i combinate obinute n urma cercetrii i ilustrate n tabelul
6.
Spre exemplu:
Ta=-t1+ta-tb-tc+tab+tac-tbc+tabc=
-143+153-151-157+153+164-173+177=23
iar interacinea AC este:
Tab=+t1-ta+tb-tc-tab+tac-tbc+tabc= 143-153+151-157 153 +164-173+177 = - 1
Grafic, interaciunea AC arat astfel:
interaciunea
AC
94 Metode cantitative n marketing
interaciune
a BC
interaciunea
AB
1 1 1 2
2
SPT = x i j k l -C=
i=0 j =0 k =0 l =1
SPE 37,96
MPE = = = 5,42
df 2 7
Se determin raportul Fisher calculat pentru fiecare factor de influen i combinaia
MP Re p 351,56
F = Re p = = 64,86 > F t Fa =
MPA (2.60)
MPE 5,42 MPE
33,06
Fa = = 6,09 > Ft
5,42
MPB (2.61)
Fb =
MPE
85,56
F b= = 15,74 > F t
5,42
MPC (2.62)
Fc =
MPE
315,06
Fc = = 58,12 > F t
5,42
MPAB (2.63)
Fab =
MPE
7,56
Fab = = 1,39 < Ft
5,42
MPAC (2.64)
Fac =
MPE
0,06
Fac = = 0,01 < Ft
5,42
MPBC (2.65)
Fbc =
MPE
27,56
Fbc = = 5,08 < Ft
5,42
MPABC (2.66)
F abc =
MPE
MPABC 1,56
Fabc = = = 0,28 < F t
MPE 5,42
Analiza dispersional 97
De vreme ce Fisher tabelat are valoarea 5,59, ipoteza nul este respins n primele
patru teste i acceptat n ultimele patru teste. Sptmnile produc diferene
semnificative statistic (panoul st mai mult timp, iar dup dou sptmni devine lesne
reamintirea).
Efectele principale ale variabilelor independente, sex, momentele zilei i tipul de
panotaj sunt semnificative statistic, adic sunt diferene notabile ntre numrul de panouri de
care i-au reamintit pe faade stradale, momentele observaiilor i-au spus cuvntul i chiar
surpriza c reamintirea difer n funcie de sex. Se remarc faptul c nici o interaciune nu este
obinut semnificativ statistic,dar interaciunea dintre momentul zilei i tipul de panotaj care
nu este semnificativ la un nivel al semnificaiei de 0,05, poate deveni semnificativ la un
nivel de 0,10.
Aplicaia utiliznd rezultatele MicrosoftEXCEL este redat n figura
2.7, 2.8, 2.9 i 2.10.
Figura 2.7 Comenzi succesive n MicrosoftEXCEL
Data Pivot Microsoft Excel list or database Next Range
Table
Report
= E18 =$B$17
A B C D E F G
=D19 = B19
Linie EXCEL =E18
=$B$17 =C19
17 Experiment cu 3 factori si rep. B
18 Repetitii C A 1 2 Total
20 1 1 1 69 71 140
21 2 72 73 145
22 1 Total 141 144 285
23 2 1 75 79 154
24 2 77 82 159
25 2 Total 152 161 313
26 1 Total 293 305 598
27 2 1 1 74 80 154
28 2 81 80 161
29 1 Total 155 160 315
30 2 1 82 94 176
31 2 87 95 182
32 2 Total 169 189 358
33 2 Total 324 349 673
34 Grand Total 617 654 1271
Figura 2.9
Plasarea n Pivot Table poate fi urmrit n continuare n figura 2.10.
Rep.1 Rep.2
=E20 =E27
LEGENDA 2&3 =E21 =E28
=F20 =F27
REPETITIE Factorul B =E23 =E30
Factorul C count Of =F21 =F28
Factorul A repeti ie =E24 =E31
=F23 =F30
=F24 =F31
=B20 =B27
Repeti-
tii
1 2 Total SPEvariabilei
1 69 74 143 1271 100965 C
Analiza dispersional 99
A 72 81 153 23 33.06 SPA 6.10 Fa
B 71 80 151 37 85.56 SPB 15.78 Fb
C 75 82 157 71 315.06 SPC 58.13 Fc
AB 73 80 153 -11 7.56 SPAB 1.39 Fab
AC 77 87 164 -1 0.06 SPAC 0.01 Fac
BC 79 94 173 21 27.56 SPBC 5.08 Fbc
ABC 82 95 177 5 1.56 SPABC 0.28 Fabc
T.rep 598 673 1271 100. 351.56 SPRep 64.86 Frep
965
859.93 SPT
C =sus 37.93 SPE Ftab 5,59
=
5.42 MPE
Figura 2.10
Ptratul latin reprezint un plan experimental incomplet pentru analiza a trei factori prin
folosirea unui model trifactorial ANOVA, n cazul verificat al lipsei interaciunii ntre factori.
n acest fel se msoar efectele pe care le au diferitele nivele ale anumitor variabile simultan, n
timp ce efectele altor variabile ar trebui meninute la un nivel constant, sau aa cum se ntmpl
n prelucrrile obinuite, ignorate i considerate fr o influen esenial asupra rezultatelor
proiectrilor experimentale.
Construcia ptratelor latine se bazeaz pe teoria corpurilor Galois, iar denumirea lor
provine de la folosirea literelor din alfabetul latin pentru desemnarea nivelelor factorului al treilea
(tratamentul).
Organizarea experimentului dup aceast metod presupune mprirea n n
tratamente, n rnduri i n coloane astfel nct fiecare tratament s apar o singur dat n
fiecare rnd sau coloan corespunztoare nivelurilor celor dou variabile independente
(respectiv din rnd i coloan). Tratamentele vor fi distribuite n mod aleator n celulele tabelului
dar niciodat pe linie ori coloan nu vom avea aceeai liter.
Tabelele pot avea diverse forme:
Spre exemplu, Primria dorete s aprecize, nainte de diversele licitaii pentru obinerea
dreptului de folosire a panourilor publicitare, valoarea amplasamentului acestora n locurile
amenajate n acest scop. Pentru o firm care liciteaz, Tabelul 2.9 poate conine a) pe linii cele
trei alternative pentru zona n care sunt amplasate: centru, intermediar, periferie; b) n coloana
ntia zilele cuplate (sau oricare) luni, mari i miercuri ca nceputul sptmnii de lucru,
considernd similitudini n comportamentul subiecilor n aceste zile dar deosebiri fa de cele
100 Metode cantitative n marketing
din coloana a II-a, care cuprinde zilele joi i vineri, sau de weekend din coloana a III-a, zilele
smbt i duminic. Tratamentul poate consta din trimiterea unor observatori (studeni sau
personal auxiliar instruit) n cursul dimineii (alternativa A), zilei (B) sau serii (C).
Problema const n utilizarea eficient a resurselor umane i de timp ori bani. n loc de a
obine informaii privind numrul de ceteni, maini mici i mari care se deplaseaz prin faa
panourilor n discuie din 3 zone x 3 zile omogene x 3 segmente omogene ale zilei, ce
nseamn 27 de surse de date ce trebuie investigate, experimentatorul care utilizeaz ptratele
latine consider c sunt suficiente doar 9. Sigurana acestei convingeri rezult din proiectarea
atent i tratamentul adecvat al acestor surse. Astfel n zonele cercetate nu se fac observaii n
toate zilele i la orice or, ci dup o planificare experimental atent spre exemplu: n zona
central, la nceputul sptmnii doar dimineaa (tratament A), n timpul sptmnii, la prnz i
n weekend doar seara, n timp ce simultan, n zona a II-a (intermediar), la nceputul sptmnii
n timpul prnzului, n zilele de joi-vineri, seara; pentru zonele situate n periferie, la nceputul
sptmnii, seara, n timpul sptmnii, dimineaa, iar n weekend, la mijlocul zilei.
Una dintre ipotezele importante de lucru este aceea c ntre variabilele analizate (inclusiv
cu tratamentul) nu exist interaciuni. Panourile publicitare pot fi vzute n orice fel de zon n
orice perioad de timp din sptmn sau zi.
Dar poate c importante pentru Primrie sunt panourile plasate pe 4 mari artere de
circulaie identificate ca fiind interesante pentru strbaterea localitii cercetate. De altfel, nu
zilele sau chiar sptmnile sunt importante deoarece nchirierea se face pe termen lung, aa c
variabila din coloan trebuie s fie alta, spre exemplu poziia panoului publicitar (pe trotuar, la
nivelul de 3-5 m, 5-8 m i peste 8 metri. Tratamentul poate consta n locul n care este situat
panoul n sensul A-foarte aproape de centru, B-la distan de 2 km de centru, C-5 km de centru,
D-foarte departe de centru.
Aceasta nseamn c vom avea (pentru tabelul 210):
4 rnduri 4 coloane 4 forme ale tratamentului = 43 = 64 observaii.
Aceste 64 de observaii se reduc la 16 deoarece avem 4 forme ale tratamentului (A, B, C,
D) iar tratamentul este unul singur! Rezult c vom avea: 16 date observate n tabel = 42 = n2
uniti de test.
Prin intermediul acestui tip de proiectare pot fi controlate simultan dou sau mai multe
variabile independente care pot afecta concret rspunsul unitilor experimentale. Acest control
simultan permite nlturarea efectelor variabilelor respective asupra erorii experimentale.
Calculele analizei dispersionale mpart dispersia total n efectele distincte ale
tratamentului, coloanei, rndului i eroarea experimental.
TABELUL 2.15
Zona
Reperele orare
OBS. 800-1200 1200-1600 1600-2000 2000-2400 Ti.
Zona 1 85 B 79 A 76 C 78 D 318
Zona 2 73 D 81 B 84 A 75 C 313
Zona 3 75 C 78 D 92 B 83 A 328
Zona 4 82 A 70 C 79 D 90 B 321
T.j 315 308 331 326 1.280
( ) i , i = 0
() i , i 0
() j , j 0
Tratament (ziua din sptmn)
Analiza dispersional 103
H0 numrul de persoane care i amintesc reclama este aproape acelai indiferent de ziua din
sptmn;
( ) k, k = 0
H1 numrul de persoane care i amintesc reclama este diferit n zile diferite;
() k , k 0
Se calculeaz numrul de grade de libertate df1 pentru fiecare factor de influen i
numrul de grade de libertate df2 pentru ntregul tabel.
df1 = r - 1 = c - 1 = k - 1 = n - 1 = 4 - 1 = 3
df2 = (n2 - 1) - (r - 1) - (c - 1 ) - (k - 1)
= n2 - 3n + 2 = (n - 1)(n - 2) = 6
pentru = 0,05 avem
Ft(3,6) = 4,76
1.2802
C= = 102.400
16
Se determin suma ptratelor pe fiecare factor de influen
m
T i2.
SPR = c
-C (2.68)
i=1
3182 + ...... + 3212
SPR = - 102.400= 30
4
n T2
.j
SPC = r
-C (2.69)
j=1
Se calculeaz suma ptratelor SP pe tratament, care este cel de-al treilea factor. Pentru
aceasta, vom calcula numrul totalul de persoane care i-au amintit reclama pe zi, indiferent de
loc sau moment al zilei.
Luni A = 79 + 84 + 83 + 82 = 328;
Mari B = 92 + 90 + 85 + 81 = 348;
Miercuri C = 76 + 70 + 75 + 75 = 296;
Joi D = 79 + 78 + 73 + 78 = 308;
Total general, = 1.280.
104 Metode cantitative n marketing
tr
T 2trat
SPTratament = k
-C (2.70)
k =1
SPR (2.73)
MPR =
df 1
30
MPR = = 10
3
SPC (2.74)
MPC =
df 1
82
MPC = = 27.33
3
SPTratament
MPTratament = (2.75)
df 1
392
MPTratament = = 130,67
3
SPE (2.76)
MPE =
df 2
Analiza dispersional 105
20
MPE =
= 3,33
6
Se determin raportul Fisher calculat pentru fiecare factor de influen (folosind
formulele 2.18, 2.27).:
MPR
Fr=
MPE
10
Fr = = 3,00
3,33
MPC
Fc =
MPE
27,33
Fc = = 8,21
3,33
MPTratament
F tratament = (2.77)
MPE
130,67
F tratament = = 39,24
3,33
Se compar valoarea tabelar cu valoarea calculat:
Fr < 4,76; Fc > 4,76; Ftratament > 4,76
Concluziile sunt urmtoarele: nu sunt diferene semnificative ntre cei ce i-au
reamintit reclamele ei fiind intervievai n zone diferite n schimb ziua este variabila care
arat diferene semnificative, se pare c mari i luni memoria este mai proaspt fa de joi
i miercuri, iar diferene mai mici dar semnificative statistic se regsesc la nivelul orelor n
cursul zilei.
Calculele realizate utiliznd ANOVA prin MicrosoftEXCEL sunt redate cu
explicaiile de rigoare n textul integrat mai jos:
TABELUL 2.16
A B C D E F G H I J
1 Coloa- Coloa- Coloa Coloa- TRATA-
na 1 na 2 na 3 na 4 MENT
2 Rnd 1 85 79 76 78 B A C D
3 Rnd 2 73 81 84 75 D B A C
4 Rnd 3 75 78 92 83 C D B A
5 Rnd 4 82 70 79 90 A C D B
6
7 Se apeleaz din meniul Tools, Data
Analysis i se alege :
8 Anova: Without
Two-Factor Replication
9
10 n ecranul aprut se introduce: Output Range $B$14
Input Range $A$1:$E$5
11 se bifeaz: Lab el
12
13
14 Anova: Two-Factor Without
106 Metode cantitative n marketing
Replication
15
16 SUMM
Count Sum Average Variance
ARY
17 1 4 318 79.5 15
18 2 4 313 78.25 26.25
19 3 4 328 82 55.33
20 4 4 321 80.25 68.25
21
22 1 4 315 78.75 32.25
23 2 4 308 77 23.33
24 3 4 331 82.75 48.92
25 4 4 326 81.5 43
26
27
28 ANOV A
29 Source
of P-
SS df MS F F crit
Varia- value
tion
30 Rows 29.5 3 9.833 0.2143 0.884 3.862
31 Co- 81.5 3 27.167 0.592 0.635 3.862
lumns
32 Error 413 9 45.889
33
34 Total 524 15
J K L M N O P Q
1 Total rind
1 2 3 4
2 Rand 1 A 79 84 83 82 328
3 Rand 2 B 85 81 92 90 348
4 Rand 3 C 76 75 75 70 296
5 Rand 4 D 78 73 78 79 308
6
7 Pentru tratament, datele din tabelul de mai sus sunt obinute
prin functiile:
8
9 Pentru M2:
=IF(F2="A",+B2,IF(G2="A",+C2,IF(H2="A",+D2,I
F(I2="A",+E2))))
10 ..
11 Pentru P5:
=IF(F5="D",+B5,IF(G5="D",+C5,IF(H5="D",+D5,I
F(I5="5",+E5))))
12
13 Se apeleaz din meniul Tools,
Data Analysis si se alege :
14 Anova: Two- Without
Factor Replicati
on
15
16 n ecranul aprut se introduce: Input
Analiza dispersional 107
Range $K$1:$P$5
17 se bifeaz: Output
Label Range
$K$21
18
19
20
21 Anova: Two-Factor Without
Replication
22
23 Vari
SUMMARY Count Sum Average
ance
24 1 4 328 82 4.67
25 2 4 348 87 24.67
26 3 4 296 74 7.33
27 4 4 308 77 7.33
28
29 1 4 318 79.5 15
30 2 4 313 78.25 26.25
31 3 4 328 82 55.33
32 4 4 321 80.25 68.25
ANOVA
Source of P-
SS df MS F F crit
Variation value
Rows 392 3 130.66 11.47 0.00 3.863
7 2
Columns 29.5 3 9.833 0.86 0.49 3.863
5
Error 102.5 9 11.389
Total 524 15
A B C D F G H I
n C40 funcia este: EXIST DI FE RE N-
=C34 -C30 -C31- L37 E?
n anex vom prezenta cteva studii de caz pentru aplicarea metodelor cantitative n
marketing