Sunteți pe pagina 1din 16

MODELE, METODE ȘI TEHNICI APLICATE ÎN MARKETING

Definirea termenului de model în domeniul economic în general și în marketing în


particular, nu este o sarcină ușoară datorită multiplelor înțelesuri pe care aceasta o are în rândul
specialiștilor. Astfel, un model poate reprezenta pentru unii specialiști ceva foarte precis și explicit,
iar pentru alții ceva mai puțin precis și implicit1. Iacobucci (2013) consideră un model o
reprezentare simplificată a lumii, construită pentru a o înțelege mai bine și pentru a o putea
previziona2. În consens cu definiția de mai sus, Cătoiu3 consideră că un model nu este decât pur și
simplu o reprezentare a unor sau a tuturor proprietăților unui sistem mai mare, iar dacă sistemul
reprezintă mediul total care înconjoară problema, modelul este o descriere a aspectelor sistemului
care sunt esențiale pentru analiză. Prin adaptarea definițiilor de mai sus domeniului marketing,
împărtășim înțelesul dat de domnul profesor Cătoiu (2009) unui model de marketing ca un set de
variabile și relațiile dintre ele, proiectat ca să reprezinte un sistem sau proces real de marketing.
O perspectivă istorică a dezvoltării de modele în marketing este structurată de Leeflang
și Witting4 în 5 mari etape, după cum urmează:
a. O primă perioadă (1950 – 1965) este caracterizată de aplicarea metodologiei
cercetărilor operaționale existente și a managementului științific în cadrul problemelor specifice
marketingului;
b. A doua perioadă (1965 – 1970) suprinde adaptarea modelelor la realitatea piețelor
diferitelor bunuri și servicii;
c. A treia perioadă (1970 – 1985) inițiază utilizarea modelelor de marketing ca suport
decizional pentru decidenții de marketing. În cadrul acestei etape, modelele de marketing
dezvoltate sunt considerate reprezentări acceptabile ale realității
economice în general și ale fenomenelor de marketing, în particular, ușor de înțeles și de
aplicat de către decidenți;
d. Cea de-a patra etapă (1985 – 2000) este dominată de utilizarea modelelor de marketing
ca instrumente în cadrul procesului decizional aferent domeniului marketing;
e. Ultima etapă (2000 - prezent) a creat o explozie a modelelor de marketing datorită
numeroaselor surse de date (dezvoltări ale tehnologiei informaționale) și a îmbunătățirii continue
a tehnicii de calcul. Aplicarea repetată (cu succes) a modelelor de marketing, oportunitatea de
automatizare a deciziilor de piață pe baza modelelor de marketing, numeroasele studii și jurnale
din acest domeniu și adaptarea modelelor existente la noi contexte (conjuncturi) reprezintă patru
aspecte prin care se certifică maturitatea modelelor de marketing în cadrul acestei etape.
Modelele de marketing își dovedesc importanța atât pe plan academic, cât și pe plan
practic prin următoarele forme de utilizare:
a. Ca instrumente analitice ce au drept scop dezvoltarea teoriei de marketing sau
perfecționarea modelelor existente;
b. Ca surogat pentru înțelegerea sistemului real caracterizat de complexitatea fenomenelor
de marketing;

11
Cătoiu , I. (coord), Cercetări de marketing – Tratat, Editura Uranus, București, 2009
2
Iacobucci, D., Marketing Models. Multivariate Statistics and Marketing Analytics, South-Western: Cengace Learning, 2013.
3
Cătoiu , I. (coord), 2009, op. cit.
4
Leeflang, P.S.H., Wittink, R.D., Builiding Models for Marketing Decisions: Past, Present and Future, International Journal of Research in
Marketing, Vol. 17, No. 2-3, 2000, pag. 105 – 126.
c. Ca formă de cunoaștere a fenomenului de marketing cercetat;
d. Ca fundament științific a deciziilor de marketing în general și cu privire la politicile de
marketing, planurile de marketing și programele de marketing, în particular.
e. Ca mijloc pedagogic ce facilitează transmiterea coerentă și eficace a informațiilor.

Literatura de specialitate5 propune următoarele criterii pentru clasificarea modelelor de


marketing:

1. Scopul propus al modelului:

a. Modele de măsurare – urmăresc măsurarea cererii individuale sau agregate pentru un


produs/serviciu ca o funcție de variabile independente. Cererea de produse nu trebuie interpretată
în sensul strict al cantității cerute sau cumpărate, ci și ca preferință sau intenție de cumpărare.
Variabilele independente care modelează cererea pot fi elemente interne (elementele mix-ului de
marketing) sau externe companiei (caracteristicile clienților, acțiunile concurenților, indicatori
macroeconomic, s.a.)
b. Modele pentru fundamentarea deciziei – asistă decidenții de marketing în cadrul
procesului decizional. În afara proprietății de măsurare, modelele pentru fundamentarea deciziilor
propun decidenților variante decizionale cu privire la elementele mix-ului de marketing.
c. Modele teoretice sau de dezvoltare a teoriei de marketing – urmăresc descrierea și
explicare fenomenelor de marketing. Acest tip de modele se dezvoltă pe baza unor ipoteze validate
sau nu empiric, respectiv pe deducții logice prin care se înlesnește înțelegerea fenomenului
investigat. Spre deosebire de modelele pentru fundamentarea deciziei care se aplică într-un anumit
context, pentru o anumită parte interesată, modelele teoretice încearcă să descrie în mod obiectiv
o anumită conjunctură a fenomenelor de marketing studiate.
Respectiv,
a. Modele descriptive – au în vedere înțelegerea problemei de marketing prin detalierea
componentelor ce formează sistemul real al problemei. În acest sens, modelele descriptive reduc
sistemul real la o cantitate informațională ce poate fi ușor înțeleasă, identifică și explorează părți
sau structuri ale problemei de marketing pe care le transpune în ipoteze ce urmează a fi testate,
convergând înspre o mai bună definire și specificare a problemei de marketing;
b. Modele predictive – reprezintă o a doua clasă de modele prin care se urmărește
identificare, definirea și explorarea problemei de marketing. Spre deosebire de modelele
descriptive, modelele predictive vizează realizarea de previziuni asupra sistemului real.
Neconcordanța în previziune și realitate poate fi datorată fie specificațiilor modelului de previziune
(utilizarea improprie a anumitor metode de estimare a parametrilor modelului), fie sistemului real
modelat (prin neincluderea unor elemente);
c. Modele normative – urmăresc specificarea căii prin care ar trebui să se rezolve o
anumită problemă de marketing prin optimizarea unui criteriu considerat important de către
decident. Avantajul principal al acestui tip de model este că oferă decidentului un cadru complet
al implicațiilor unei decizii asupra sistemului real pe baza ipotezelor și a constrângerilor specifice
modelului realizat.

5
Eliashberg, J., Lilien, G.L., Mathematical Marketing Models: Some Historical Perspectives and Future Projections, Handbooks in Operations
Research and Management Science, Vol. 5, 1993, pag. 3 – 23.
2. Gradul de explicitare și forma de reprezentare

a. Modele implicite – sunt acele modele care nu au o formă clară de reprezentare;

b. Modele explicite:

i. Modele verbale – sunt acele modele care sunt transmise pe cale orală (verbală), neavând
un suport fizic, vizibil;
ii. Modele grafice – reprezintă categoria de modele care sintetizează sistemul real studiat
în reprezentări grafice variate, după cum urmează: diagramă de tip schemă logică, diagramă PERT,
diagramă cauzală, diagramă de tip arbore de decizie, diagramă a relațiilor funcționale, diagramă
de tip feed-back sau răspuns;
iii. Modele matematice – sunt caracterizate prin cuantificarea dimensiunilor sistemului
real studiat și a relațiilor dintre ele sub forma unor ecuații matematice. La rândul lor, modelele
matematice pot fi împărțite într-o serie de subcategorii: liniare/nelinare (natura relațiilor dintre
variabilele studiate), statice/dinamice (abordarea factorului timp), deterministe/probabilistice
(abordarea relațiilor structurale ale variabilelor considerate), continue/discrete/mixte (tipul de
scală utilizat pentru măsurarea variabilelor considerate).

3. Modul de reprezentare a caracteristicilor fenomenului investigat:

i. Modele iconice – sunt reprezentări vizuale ale sistemului real studiat, însă la o scală
mai mică; astfel de modele au avantajul de a oferi o perspectivă vizuală (în miniatură), de ansamblu
asupra sistemului real;
ii. Modele simbolice – fiecare dimensiune studiată a sistemului real este înlocuită printr-
un simbol, relațiile dintre dimensiuni (simboluri) fiind exprimate sub forma ecuațiilor matematice;
iii. Modele analogice – preiau caracteristici de la ambele tipuri de modele prezentate
anterior, ele reprezentând o înțelegere a sistemului real studiat prin intermediul unui model
(iconic/simbolic sau mixt) al altui sistem real.
Dezvoltarea propriu-zisă a unui model de marketing constituie o etapă din cadrul unui
proces ce formează un subdomeniu distinct al marketingului și anume modelarea în marketing.
Modelarea în marketing este considerată atât o artă, cât și o știință.

Caracterul științific al modelării în marketing este reflectat de procesul riguros ce trebuie


respectat în crearea unui model, respectiv de capacitatea modelului de a explica sau descrie și
previziona aspecte ale fenomenului de marketing studiat. Arta modelării în marketing rezidă în
creativitatea cercetătorului de a utiliza metode și tehnici de analiză specifice fenomenului de
marketing studiat, capacitatea cercetătorului și a managerului (decidentului) de a comunica eficace
cu scopul de a determina toate aspectele contextului problematic și informația necesară ce urmează
a fi atrasă de pe urma aplicării modelului, respectiv expertiza cercetătorului în ceea ce privește
corelarea contextului problematic (situațiilor decizionale) cu teoriile consacrate în dezvoltarea
modelului.
Figura 1. Etapele procesului modelării de marketing
Sursă: adaptată după Cătoiu, I. (coord), Cercetări de marketing – Tratat, Editura Uranus,
București, 2009

Procesul de modelare în marketing (figura 1) presupune un demers laborios în care


componenta teoretico-metodologică trebuie să se combine în mod organic cu componenta practică,
respectiv cu faptele din realitate. Realitatea organizațiilor este reprezentată de mediul de marketing
în care activează, care, prin interacțiunea componentelor sale crează situații decizionale ce necesită
decizii cu privire la viitoare acțiuni de marketing. În cele mai multe cazuri, efectele acțiunilor de
marketing sunt decalate în timp, neliniare, stocastice și dificil de măsurat. Pe baza realității
observabile, contextul problematic de marketing poate fi înțeles, conducând spre definirea
problemei decizionale. În dezvoltarea modelelor de marketing trebuie să se țină cont de
informațiile necesare asistării procesului decizional caracteristic contextului dat. De asemenea, în
dezvoltarea modelului, este impetuoasă corelarea realității cu ipotezele paradigmei alese a
cercetării științifice. Din acest punct de vedere, cercetarea științifică realizată în domeniul
marketing, în general, respectiv marketing relațional, în particular, s-a bazat pe următoarele
paradigme/filozofii/școli de gândire ale cercetării științifice6:

6
Uddin, N.M., Hamiduzzaman, M., The Philosophy of Science in Social Research, The International Journal of Social Research, Vol. 2, No. 6,
2009, pag. 655 – 664.
(1) Școala raționalistă – se bazează pe principiul conform căruia cunoașterea rezultă într-
o mare măsură din rațiune și nu din experiență. Plecând de la acest principiu, fenomenul de
marketing studiat este considerat o structură rațională ce este analizată prin intermediul unor
presupuneri fundamentale. Astfel, expresia fenomenului de marketing investigat poate lua forma
unui model dezvoltat pe bază de deducții logice și relații matematice, și care, având la baza ipoteze
incontestabile, nu trebuie validat prin date empirice.
(2) Școala empirică – este guvernată de principiul conform căruia cunoașterea este
datorată experienței și nu rațiunii. Adepții acestei școli de gândire consideră că mediul înconjurător
(universul) este unul ordonat, fiind alcătuit din evenimente discrete și observabile care urmează
reguli universal valabile, respectiv șabloane repetitive. Un model dezvoltat conform empirismului
presupune construcția sa inițială pe baza unui set de date observabile, respectiv rafinarea sa prin
validare sau nu pe baza altui set de date observabile. Ipotezele sau prespunerile teoretice ce nu au
fost verificate prin experiență sau experiment nu se bucură de încredere în cadrul empirismului;
singura constantă fiind experiența trăită.
(3) Școala pozitivistă – presupune că știința, în general, și științele sociale, în particular,
trebuie să își bazeze construcția pe instrumentele științelor naturale. Astfel, principiul după care se
ghidează școala pozitivistă consideră cunoașterea un efect doar al unor teorii confirmate prin
metode strict științifice (specifice științelor naturale) și nu al unor supoziții abstracte. Mediul
înconjurător este considerat a fi format din obiecte observabile supuse unor reguli care pot fi
indentificate, explicate și controlate. Modelele dezvoltate în conformitate cu pozitivismul sunt
caracterizate atât de o validitate empirică a ipotezelor pe care sunt construite, cât și de capacitatea
de a generaliza rezultatele obținute, dar și de a previziona stări viitoare ale obiectului cercetat.
(4) Școala fenomenologică – este fundamentată pe principiul conform căruia cunoașterea
rezultă din interpretarea cercetătorului a obiectului cercetat. Astfel, capacitatea de interpretare,
proprie subiectului cercetării este opusă instrumentarului logico-matematic al pozitivismului.
Mediul înconjurător este considerat a fi format din evenimente sociale, a căror succesiune și
interacțiune nu sunt guvernate de un set de reguli sau legi universale, ci de legi proprii contextului
dat. Modelele ce au la bază școala fenomenologică trebuie să surprindă complexitatea socială a
mediului înconjurător în dezvoltarea lor.

Tehnicile de analiză utilizate în cercetările din domeniul marketingului relațional se


subscriu arsenalului bogat de tehnici al cercetării de marketing. Literatura de specialitate7 indică
un număr de patru criterii în funcție de care se pot clasifica tehnicile de analiză, și anume:
a. Tipul de scală utilizat (nominală, ordinală, interval sau proporțională);
b. Numărul eșantioanelor cercetate (unul, două sau mai mult de două);
c. Natura relației dintre aceste eșantioane (independente sau dependente);
d. Numărul variabilelor considerate o dată (una, două sau mai mult de două).

Tehnicile de analiză ce utilizează mai mult de două variabile în structurarea lor reprezintă
tehnici de analiză multivariată. Acestea diferă de tehnicile de analiză univariată și prin prisma
scopului lor, în sensul că primele pun accent pe studiul relațiilor dintre variabilele considerate
(direcție, intensitate și semnificație statistică), iar cele din urmă pe nivelul (tendința centrală) și
distribuția (variația) variabilei considerate.
O clasificare a tehnicilor de analiză multivariată este prezentată în figura de mai jos
(figura 2). Natura relației dintre variabilele considerate este un prim criteriu de clasificare; astfel,

7
Cătoiu, I., (coord.), 2009, op. cit.
variabilele se pot afla într-o relației de dependență (relație de tip cauză-efect) sau de
interdependență (relație de asociere) una față de cealaltă. În cazul relațiilor de dependență, poate
exista o singura variabilă dependentă, respectiv mai multe variabile dependente. Interdependența
variabilelor poate fi studiată prin intermediul variației lor comune, respectiv prin similitudinile
inter-obiecte.

Figura nr. 2. Clasificare a tehnicilor de analiză multivariată


Sursă: Malhotra, N.K., Marketing Research. An Applied Orientation. Sixth Edition, Pearson
Education Inc, 2010.

Clasificare de mai sus este detaliată prin adăugarea unui nou criteriu, și anume: tipul de
scală utilizată pentru măsurarea variabilelor în cauză8. Desfășurea tehnicilor de analiză
multivariată este prezentată sub forma unei scheme logice cu trei niveluri decizionale în funcție de
cele trei criterii expuse (natura relației, existența unei sau mai multor variabile dependente și tipul
de scală utilizată pentru măsurarea variabilelor) (figura 3).

8
Cătoiu, I., (coord.), 2009, op. cit.
Figura 3. Clasificarea tehnicilor de analiză multivariată
Sursă: Cătoiu, I. (coord), Cercetări de marketing – Tratat, Editura Uranus, București, 2009
Metoda de analiză multivariată aplicate în cadrul marketingului

1. Metoda regresiei multiple

Metoda regresiei liniare multiple este considerată una dintre cele mai frecvent utilizate
metode de analiză în cadrul cercetărilor de marketing. Această metodă presupune dezvoltarea unei
funcții prin intermediul căreia se încearcă explicarea unei relații de dependență liniară între
dimensiunile unui fenomen de marketing studiat. Dimensiunile fenomenului de marketing studiat
sunt considerate variabile în cadrul funcției ce urmează a fi dezvoltată. Combinarea variabilelor
într-o relație de dependență se realizează pe baza teoriei economice, în general, respectiv pe baza
teoriei de marketing, în particula; exemple în acest sens ar fi: vânzările unei companii depind de
bugetul cheltuit pentru promovare, diferite forme ale ofertelor promoționale, numărul canalelor de
distribuție sau oferta generală a companiei.
Obiectivul principal al metodei regresiei liniare multiple este explicarea și previziunea
variației variabilei dependente în funcție de covariația ei cu variabilele independente. Astfel,
variabilele ce sintetizează dimeniunile fenomenului de marketing studiat, sunt împărțite în două
categorii: variabile dependente și variabile independente, clasificarea fiind realizată de către
cercetător pe baza teorie de marketing și a experienței sale. Variabila dependentă este considerată
un efect (variabilă efect) al interacțiunii dintre două sau mai multe variabile independente
(variabile cauză). Scala pe care este măsurată variabila dependentă trebuie să fie, în mod categoric,
de natură parametrică (interval sau proporțională), în timp ce variabilele independente pot fi
măsurate atât prin intermediul scalelor neparametrice (nominale și ordinale), cât și cu ajutorul
scalelor parametrice.
Forma sau modelul general al regresiei liniare multiple este cel prezentat mai jos:

Unde Y – variabila dependent sau variabila efect;


X1, X2,…,Xk – variabilele independente sau variabilele cauză, numărul lor variind cu k
de la 1 la n;
 - variabila reziduală.
Setul ales de variabile independente explică doar o parte din variația variabilei
dependente, restul variației fiind datorat variabilei reziduale. Existența variabilei reziduale este
datorată mai multor factori, factorul principal fiind faptul că un model, oricât de complex și bine
elaborat ar fi el, nu poate să capteze fiecare influență asupra unei variabile economice din cauza
erorilor de măsurare existente.
Modelul regresiei liniare multiple, fiind alcătuit din două părţi (o parte deterministă
datorată variabilelor independente și o a doua parte necunoscută sau aleatoare datorată variabilei
reziduale) este supus unor ipoteze, care, prin validare, confirmă consistența sa explicativă. În
conformitate cu Green9, ipotezele modelului regresiei liniare multiple sunt următoarele:
(Ipoteza 1) Linearitatea: modelul se bazează pe o relație liniară între variabila efect și
variabilele cauză. Astfel, valoarile medii ale variabilei efect datorate creșterilor individuale ale
variabilelor cauză, se află pe o dreaptă.
(Ipoteza 2) Multicoliniaritate: nu există o relație liniară exactă între variabilele
independente ale modelului.
(Ipoteza 3) Exogenitatea variabilelor independente: fiecare valoare estimată a variabilei
reziduale nu este în funcție de vreo variabilă independentă. Aceasta înseamnă că variabilele
independente nu conțin informație relevantă pentru variabila reziduală.
(Ipoteza 4) Homoschedasticitate și lipsa autocorelării (non-autocorelare): variabila
reziduală este caracterizată de o variație constantă pentru fiecare nivel al variabilelor independente;
valorile ei (ale variabilei reziduale) nefiind corelate una cu cealaltă.
(Ipoteza 5) Date generate exogen: procesul de generare a datelor este exterior ipotezelor
modelului, asigurând-se astfel independența sa.
(Ipoteza 6) Distribuția normală: variabila reziduală urmează o distribuție normală.

9
Greene, W.H., Econometric Analysis. Fifth Edition, Pearson Education, Inc., 2003.
2. Analiza factorială

Analiza factorială este un nume generic dat unei categorii de metode statistice
multivariate al căror scop rezidă în cercetarea legăturilor de interdependență dintre mai multe
variabile ce caracterizează un anumit fenomen de marketing10, respectiv în reducerea numărului
de variabile la un nivel ce poate fi gestionat, cu o pierdere minimă de informație.
Principiul de bază al acestei tehnici este că fiecare bază de date (caraterizată de un număr
de variabile cu valorile aferente) poate fi redusă la un număr de variabile mai mic decât cel inițial
printr-o pierdere mai mare sau mai mică de informație. În alte cuvinte, se poate afirma că numărul
inițial de variabile poate fi condensat într-un număr mai redus de variabile (denumite factori sau
componente, denumiri folosite interschimbabil în cadrul prezentului subcapitol) cu care sunt în
corelație, respectiv împart informație cu aceștia. Alegerea unei metode din setul de metode ce
compun tehnica analizei factoriale ar trebui să se bazeze pe următoarele două criterii:
1. generalizarea sau nu a rezultatelor obținute în cadrul eșantionului la nivelul populației
și
2. explorarea datelor sau testarea unor ipoteze.

În cazul în care cercetătorul dorește explorarea unui fenomen de marketing doar pe baza
informațiilor specifice unui eșantion considerat, fără a dori extrapolarea rezulatelor la nivelul
populației, metodele analizei factoriale ce pot fi avute în vedere sunt: metoda componentelor
principale (în engleză: principle components), metoda factorilor principali (în engleză: pricipal
axis factoring) și image factoring.
Dacă elementele eșantionului utilizat sunt extrase în mod aleator din cadrul populației
țintă și eșantionul este reprezentativ din punct de vedere statistic pentru variabilele considerate,
cercetătorul poate folosi următoarele metode ale analizei factoriale asupra variabilelor în cauză:
metoda verosimilității maxime (în engleză: maximum-likelihood method) și Kaiser alpha factoring.
Aceste metode permit extinderea rezultatelor obținute pe baza eșantionului considerat la nivelul
populației investigate în funcție de setul de variabile avut în vedere. Ambele categorii de metode
prezentate (care permit/nu permit extrapolarea rezultatelor) au drept scop explorarea unui set de
variabile, respectiv a dimensiunilor unui fenomen de marketing, fiind calificate drept metode ale
analizei factoriale exploratorii.
Metodele de analiză factorială confirmatorie urmăresc testarea unor ipoteze cu privire la
structura unui set de variabile latente. În acest caz, interdependențele dintre variabilele considerate
se bazează pe un model teoretic, cercetătorul luând decizii cu privire la sensul și intensitatea
legăturii dintre variabile.
Scopul metodei componentelor principale este de a reduce un set inițial de variabile la un
set final de alte variabile (denumite factori) inferior numeric primului. Variabilele trebuie înțelese
ca dimensiuni prin care se încearcă măsurarea unui fenomen de marketing (spre exemplu:
loialitatea clientului poate fi măsurată prin latura sa atitudinală, respectiv prin latura sa
comportamentală; loialitatea atitudinală având la rândul ei trei dimensiuni, și anume: dimensiunea
cognitivă, afectivă și conativă). Un concept esențial al acestei metode este cel de comunalitate a
unei variabile (din engleză: communality). Comunalitatea unei variabile (o variabilă formează
alături de alte variabile setul inițial de variabile supuse metodei componentelor principale) trebuie
înțeleasă ca variația comună pe care această variabilă o deține cu restul variabilelor din setul
10
Cătoiu, I., (coord.), 2009, op. cit.
considerat. În alte cuvinte, se poate afirma că variația unei variabile (dintr-un set de variabile) este
divizată în două părți: variație comună sau comunalitate cu alte variabile și variație unică. La
rândul ei, variația unică a unei variabile este datorată unui factor unic (care induce variație unică
sistematică) și unui factor aleator (care determină variație unică aleatoare).
Comunalitatea variabilelor stă la baza transformării setului inițial de variabile într-un set
final de factori sau componente. Procedura de transformare este destul de complexă, pentru mai
multe detalii statistico-matematice se poate consulta Smith11. O sinteză a procedurii de
transformare este realizată în cele ce urmează. Astfel, comunalitatea variabilelor este exprimată
sintetic fie prin coeficienții de covariație sau coeficienții de corelație (diferența dintre coeficienții
de covariație și de corelație rezidă în faptul că valorile coeficienților de covariație devin, prin
standardizare, valorile coeficienților de corelație). Valorile acestora coeficienți (indiferent că sunt
de corelație sau covariație; pentru a evita confuziile, se vor considera în continuarea, valorile
coeficienților de corelație) pot fi grupate în cadrul unei matrici denumită R care are n X n linii și
coloane (unde n este numărul inițial de variabile considerate) și 1 pe diagonala principală. Pe baza
elementelor matricii R, se va identifica un număr de n vectori coloană formați din n linii pentru
care este validă egalitatea:

La o privire mai atentă a ecuație de mai sus, se poate observa că Eigenvectorii (sau
componentele extrase) nu sunt altceva decât vectori care, înmulțiti la stânga cu o matrice pătratică,
nu își modifică sensul, ci doar lungimea prin apariția Eigenvalue aferente. Denumirea de
Eigenvector este similară semantic noțiunii de componentă sau factor. Principalele proprietăți ale
Eigenvectorilor sunt: ortogonalitatea (fiecare Eigenvector este perpendicular pe restul
Eigenvectorilor) și faptul că pot fi extrași din anumite matrici pătratice. Proprietatea de
ortogonalitate prezintă o importanță ridicată în cadrul cercetărilor de marketing deoarece, prin
ortogonalitatea, se asigură independența factorilor (se elimină multicoliniaritatea lor), ei putând fi
utilizați ca intrare în cadrul altor tehnici de analiză multivariată, precum regresia multiplă liniară
sau analiza discriminantului liniar multiplu.
Pe baza ideilor enunțate mai sus, se poate considera că fiecare variabilă din setul inițial
de variabile poate fi reprezentată sub forma unei combinații algebrice liniare de factori, după cum
urmează:

11
Smith, L.I., A Tutorial on Principal Components Analysis, 2002.
După ce factorii au fost extrași, urmează o rotație a lor în funcție de un anumit unghi care
maximizează comunalitatea unor variabile față de anumiți factori, respectiv minimizează
comunalitatea lor față de alți factori. Factorii rezultați în urma procedurii de rotație pot fi
considerați dimensiuni care cuprind informația din setul inițial de variabile în altă formă. Pe baza
valorii Eigenvalue (se va exemplifica în cele ce urmează) proprie fiecărui factor de după rotație
(rotated Eigenvector) se pot reține spre analize viitoare un număr de factori redus față de cel al
variabilelor inițial, dar cu o anumită pierdere de informație.
3. Discriminantul liniar multiplu

Metoda discriminantului liniar presupune diferențierea (discriminarea) grupelor unei


variabile categoriale în funcție de un set de variabile măsurate pe scale de tip metric. Această
metodă este o metodă statistică de analiză multivariată prin care se încearcă estimarea unei relații
liniare între o variabilă dependentă de tip categorial și una sau mai multe combinații liniare ale mai
multor variabile independente măsurate pe scale metrice. În cazul în care variabila categorială
dependentă este de tip dihotomic (este caracterizată prin două categorii sau grupe), metoda se
numește metoda discriminantului liniar pentru două grupe; dacă variabila dependentă prezintă mai
multe de două grupe (este de tip multihotomic) metoda poartă denumirea de metoda
discriminantului liniar multiplu.
Literatura de specialitate din domeniul cercetărilor de marketing indică următoarele
obiective ale metodei discriminantului liniar:
1. Identificarea acelor funcții discriminant alcătuite din combinații algebrice liniare ale
variabilelor independente (predictori), care diferențieze cel mai bine grupele variabilei dependente;
2. Examinarea măsurii în care diferențele dintre grupele variabilei dependente sunt
datorate predictorilor considerați individual;
3. Determinarea contribuției fiecărui predictor din cadrul funcțiilor discriminant la
diferențierea grupelor variabilei dependente;
4. Clasificarea observațiilor (cazurilor) pe grupele variabilei dependente în funcție de
valorile lor obținute pe baza funcțiilor discriminant;
5. Evaluarea acurateții clasificării descrise la punctul 4.

Metoda discriminantului liniar multiplu se aseamănă ca și obiective și algoritm de calcul


cu regresie liniară multiplă, respectiv cu analiza multivariată a variației (Manova). Diferențele
dintre cele trei metode sunt prezentate în cele ce urmează.
Metoda regresiei liniare multiple presupune estimarea unei relații liniare între o singură
variabilă dependentă, măsurată pe scală metrică, și un set de variabile independente (măsurate fie
pe scale metrice sau nemetrice). În cadrul regresiei liniare multiple, variabilele independente de
tip nemetric sunt codificate ca variabile Dummy în algoritmul de estimare a funcției de regresie.
Estimarea coeficienților de regresie se realizează prin minimizare valorilor reziduale, respectiv a
diferenței dintre valorile observate ale variabilei dependente și a valorilor estimate ale variabilei
dependente pe baza funcției de regresie.
Analiza multivariată a variației (Manova) are ca scop identificarea diferențelor ce apar în
cadrul unui set de variabile dependente (măsurate pe scale metrice) în funcție de categoriile sau
grupele unui set de variabile independente (măsurate pe scale de tip neparametric). Diferențierea
setului de variabile dependente se realizează pe baza raportului dintre variația (mai concret suma
pătratelor abaterilor) setului de variabile dependente dintre grupele variabilei independente și
variația setului de variabile dependente în cadrul grupelor variabilelor independente. Astfel, efectul
variabilei independente (prin grupele sale) asupra setului de variabile dependente se determină
raportând, în termeni relativi variația setului de variabile dependente datorată grupelor variabilei
dependente, la variația setului de variabile dependente datorată diferenței dintre observații din
cadrul fiecărei grupe a variabilei independente.
Discriminantul liniar multiplu este considerat metoda inversă Manovei în sensul că ea
urmărește discriminarea sau diferențierea grupelor unei variabile dependente (măsurată pe scală
de tip neparametric) pe baza unor funcții discriminant calculate ca și combinații algebrice liniare
ale variabilelor dependente (numite și predictori) măsurate pe scale de tip metric. Ineditul acestei
metode (comparativ cu Manova) este că poate determina măsura în care dependența dintre
variabilele independente poate diferenția grupele variabilei independente.

O sinteză a celor prezentate mai sus este realizată în următorul tabel (tabel nr 1):

Tabel nr 1. Asemănări și diferențe între analiza mulivariată a variației (și analiza


univariată a variație), regresia liniară multiplă și discriminantul liniar multiplu
Manova/Anova Regresia liniară multiplă Discriminantul liniar
multiplu
Asemănări
Numărul Mai multe/Una Una Una
variabilelor Mai multe Mai multe Mai multe
dependente
Numărul
variabilelor
independente
Diferențe
Scala variabilelor Metrică Metrică Nemetrică
dependente Nemetrică Metrică sau/și Metrică
Nemetrică
Scala variabilelor independente
Sursa adaptat după Malhotra, N.K., Marketing Research. An Applied Orientation. Sixth Edition,
Pearson Education Inc, 2010

Metoda regresiei liniare multiple presupune estimarea unei relații liniare între o singură
variabilă dependentă, măsurată pe scală metrică, și un set de variabile independente (măsurate fie
pe scale metrice sau nemetrice). În cadrul regresiei liniare multiple, variabilele independente de
tip nemetric sunt codificate ca variabile Dummy în algoritmul de estimare a funcției de regresie.
Estimarea coeficienților de regresie se realizează prin minimizare valorilor reziduale, respectiv a
diferenței dintre valorile observate ale variabilei dependente și a valorilor estimate ale variabilei
dependente pe baza funcției de regresie.
Analiza multivariată a variației (Manova) are ca scop identificarea diferențelor ce apar în
cadrul unui set de variabile dependente (măsurate pe scale metrice) în funcție de categoriile sau
grupele unui set de variabile independente (măsurate pe scale de tip neparametric). Diferențierea
setului de variabile dependente se realizează pe baza raportului dintre variația (mai concret suma
pătratelor abaterilor) setului de variabile dependente dintre grupele variabilei independente și
variația setului de variabile dependente în cadrul grupelor variabilelor independente. Astfel, efectul
variabilei independente (prin grupele sale) asupra setului de variabile dependente se determină
raportând, în termeni relativi variația setului de variabile dependente datorată grupelor variabilei
dependente, la variația setului de variabile dependente datorată diferenței dintre observații din
cadrul fiecărei grupe a variabilei independente.
Discriminantul liniar multiplu este considerat metoda inversă Manovei în sensul că ea
urmărește discriminarea sau diferențierea grupelor unei variabile dependente (măsurată pe scală
de tip neparametric) pe baza unor funcții discriminant calculate ca și combinații algebrice liniare
ale variabilelor dependente (numite și predictori) măsurate pe scale de tip metric. Ineditul acestei
metode (comparativ cu Manova) este că poate determina măsura în care dependența dintre
variabilele independente poate diferenția grupele variabilei independente.

Ca orice metodă statistică de analiză multivariată a datelor, discriminantul liniar multiplu


presupune următoarele ipoteze:
1. Observațiile utilizate sunt culese pe baza unei eșantionări aleatoare;
2. Variabilele independente sunt măsurate pe scale de tip metric, iar variabila dependentă
ar trebui să fie cel puțin dihotomică (să dețină cel puțin două categorii);
3. Fiecare variabilă independentă (predictor) urmează o distribuție normală;
4. Pentru fiecare variabilă independentă în parte, o observație face parte dintr-o singură
categorie variabilei dependente;
5. Matricea variațiilor-covariațiilor (pentru setul considerat de variabile independente) nu
ar trebui să difere semnificativ în cadrul grupelor variabilei dependente.

Pentru a evita o aglomerare de termeni, se vor folosi în continuare, următoarele asocieri


de termeni: variabilele independente vor fi în locuite cu predictori, iar variabila dependentă cu
factor. Astfel, scopul discriminantului liniar multiplu este de a determina acea combinație
algebrică a predictorilor care se diferențieze cel mai bine grupele factorului.
Procedura discriminantului liniar multiplu are la bază matricea HE-1 (descrisă și calculată
în cadrul analizei multivariate a variației) care prin descompunerea:

rezultă în identificare de Eigenvectori și Eigenvalues. Readucem aminte că un


Eigenvector este acel vector specific unei matrici pătratice care înmulțit la stânga cu o constantă
devine matricea pătratică inițială înmulțită cu același Eigenvector la dreapta. Fiecărui Eigenvector
îi va corespunde Eigenvalue care reprezintă lungimea Eigenvectorului.
Determinarea valorilor Eigenvalue se face prin calcul simplu matriceal, după cum urmează:
Elementele matricei HE-1 conțin variația setul de predictori datorată diferențelor dintre
grupele factorului raportată la variația setului de predictori datorată variației setului de predictori
din cadrul grupelor factorului. Altfel spus, măsura în care grupele factorului diferențiază setul de
predictori. Prin descompunerea în Eigenvectori si Eigenvalues, informația din matricea inițială nu
se pierde. Coordonatele Eigenvectorilor reprezintă coeficienții canonice nestandardizați ai
funcțiilor discriminat, semnificând corelația parțială a fiecărui predictor cu funcția discriminant
identificată.
Pentru exemplul considerat în care se determinat un singur Eigenvector:

Fiecărui Eigenvector îi corespunde o lungime, respectiv o valoare Eigenvalue. Valorile


Eigenvalue identificate reprezintă capacitatea de diferențiere a grupelor factorului de către funcțiile
discriminant. Astfel, cu cât valorile Eigenvalues sunt mai mari, cu atât funcțiile discriminat au o
capacitatea mai mare de diferențiere a grupelor factorului. Implicit, validitatea statistică a funcțiilor
discriminant se determină printr-un test statistic (Wilks’ Lambda) care verifică ipoteza nulă ca
valoarea calculată a testului nu diferă semnificativ de 0. Valoarea calculată a testului reprezintă
partea neexplicată de către funcția discriminant a alocării observațiilor în cadrul grupelor
factorului. Valorile calculate ale testului Wilks’ Lamba sunt caracteristice unei capacități reduse
de discriminare a funcțiilor discriminant.
Pentru clasificarea observaţiilor se vor alege doar acele funcţii discriminant care sunt
reprezentative din punct de vedere statistic. Scorurile obținute de către fiecare observație pe baza
funcției discriminant se vor clasifica în concordanța cu centroizii grupelor factorului. Centroizii
grupelor sunt scoruri ale funcțiilor discriminant bazate pe valorile medii inițiale ale predictorilor
în cadrul fiecărei grupe în parte. Astfel, observațiile vor fi clasificate într-o grupă sau alta în funcție
de distanța euclidiană a lor față de cetroizii grupelor.

S-ar putea să vă placă și