Analiza statistica multivariata exista de aproape un secol. Cu toate acestea,
aplicarea ei n cercetarile de marketing si are nceputurile n perioada anilor 1950, cnd unii cercetatori foloseau, ocazional, una sau cteva tehnici. n timp, utilizarea acestor aplicatii a devenit din ce n ce mai frecventa, ca rezultat al aprecierii crescnde a aportului si valorii lor venite din partea cercetatorilor dar si a celor responsabili cu deciziile de marketing.
1.1. Locul si rolul analizei statistice multivariate n cercetarile de
marketing
Un reper important n surprinderea relatiei dinamice dintre marketing si analiza
statistica multivariata este articolul realizat de Jagdish N. Sheth1 n 1971, intitulat Revolutia multivariata n cercetarile de marketing. Autorul prezenta cadrul de lucru al celor mai utile tehnici statistice multivariate pentru cercetarile de marketing, alaturi de o scurta descriere a fiecareia. n plus, articolul trata rolul extrem de important al tehnologiei informatice, a dezvoltarii echipamentelor si programelor, pentru extinderea rapida a utilizarii pe scara larga a acestor metode. ncepnd cu acel moment, se considera ca utilizarea metodelor multivariate de analiza a nceput sa creasca simtitor, iar aceasta tendinta se va mentine si n viitor. Revolutia nca nu s-a ncheiat. Daca termenul de revolutie pare prea pretentios, este importanta ntelegerea modului n care era realizata analiza statistica a datelor de marketing nainte de aplicarea metodelor multivariate. De-a lungul istoriei cercetarii de marketing, majoritatea analizelor implicau o singura variabila (analiza univariata) sau cel mult doua variabile considerate simultan (analiza bivariata). Datele referitoare la variabile erau introduse n tabele simple sau ncrucisate (cu dubla intrare) si erau analizate prin calcularea unora dintre urmatorii indicatori statistici: tendinta centrala media, mediana si modul; variabilitatea (distributia) deviatia standard (abaterea medie patratica), varianta, deviatia medie, amplitudinea, distanta interquartile; intervalele de ncredere erori standard ale diferitilor indicatori statistici (intervalele de ncredere fac legatura ntre conceptele de tendinta centrala si de variatie); testarea ipotezelor testele t , Z, F si analiza variatiei. Ctiva din analistii temerari ai acelor vremuri calculau, ocazional, un coeficient de corelatie ntre doua variabile pentru a surprinde forma si intensitatea legaturii dintre acestea. Iar dintre acestia, doar un numar restrns de cercetatori erau capabili sa aplice cteva din tehnicile avansate precum regresia multipla, analiza discriminantului, analiza factoriala sau alte metode statistice de analiza multivariata pe datele obtinute, n cea mai mare masura, n baza unor cercetari directe asupra clientilor sau consumatorilor. Dar cea mai mare parte a variabilelor de marketing erau introduse (tabulate), prezentate si centralizate n tabele individuale sau ncrucisat, cu o alta variabila sau cel mult alte doua variabile (ocazional). Pe ct de folositoare si importante erau si sunt aceste tipuri de analize, n majoritatea studiilor de marketing din ziua de astazi ele reprezinta (sau ar trebui sa reprezinte) doar nceputul, partea de analiza primara. Ca o perspectiva istorica, n anii 50 si 60, cercetatorii realizau regresia multipla si analiza factoriala, efectund calculele manual sau cu ajutorul calculatoarelor de birou. Acest demers dura, de obicei, zile sau chiar saptamni, nainte de a se ajunge la etapa de verificare a erorilor. n ziua de astazi, gratie evolutiei tehnologieiIT, realizarea calculelor aferente analizelor multivariate necesita cteva minute, sau chiar cteva secunde, prin folosirea calculatorului personal (PC) si a unui program informatic specializat. Metodele statisticii multivariate furnizeaza instrumente mult mai puternice care permit cercetatorilor sa descopere configuratii ale relatiilor dintre mai multe variabile, configuratii care altfel ar ramne ascunse sau foarte putin vizibile. n plus, cele mai multe metode pot face acest lucru cu o buna precizie, existnd posibilitatea testarii semnificatiei statistice prin calcularea nivelului de ncredere asociat validarii legaturii respective la nivelul ntregii populatii si nu doar a esantionului investigat1. Aceste metode contribuie la cresterea substantiala a volumului de informatii relevante si utile care putea fi extrase dintr-o sursa de marketing. O buna analogie care sa exprime raportul dintre contributia informationala a metodelor uni- si bivariate, pe de o parte si cea a celor multivariate, pe de alta parte, ar putea fi exemplul comparatiei dintre o fotografie alb-negru si una color. Principalele directii de utilizare a metodelor de analiza multivariata n marketing au n vedere : 1: simplificarea datelor. Una din situatiile cu care se confrunta cel mai des un cercetator este cea de scalare. Respondentilor li se pot pune ntrebari legate de atributele multiple ale unui produs sau pot evalua importanta caracteristicilor unor produse sau servicii. Astfel de ntrebari vin n grupuri de 20 sau 30 iar uneori pot ajunge si la cteva sute. Dar n timp ce un producator poate considera importante chiar si 100 de atribute ale unui produs, este mai mult ca sigur faptul ca majoritatea consumatorilor au n vedere numai cteva dimensiuni ale acestuia. n aceste situatii calculele arata mici diferente de la o ntrebare la alta. Chiar si cnd diferentele sunt semnificative, poate fi dificil sa le centralizezi dupa caracteristicile consumatorilor, cum ar fi cele demografice, din moment ce aceste diferente ar implica ntrebari multiple si apar pe mai multe pagini de analiza (familii ntregi de tehnici multivariate au fost nevoite sa nfrunte acesta problema). 2. segmentarea pietei. Segmentarea pietei este aria care arata cel mai clar accesibilitatea analizei multivariate. Aproape orice schema de grupare este rezultatul aplicarii uneia sau a ctorva tehnici multivariate. Orice ancheta bine proiectata poate fi subiectul unor tehnici variate de analiza multivariata pentru a dezvolta scheme de segmentare bazate pe intrebarile incluse n ancheta. Datele de identificare geografica a respondentilor din ancheta sau un fisier cu informatii despre clienti permit ca datele nregistrate sa fie legate de cele de structura demografica din statisticile oficiale si astfel sa fie utilizate pentru a elabora o schema de grupare specifica produsului sau serviciului oferit. Aceste scheme raportate la client ofera o imagine speciala asupra pietelor pe care sistemele de grupare mai generale nu o pot oferi. n anumite cazuri, precum marketingul business-to-business sau marketingul pentru nise, aceste tehnici sunt aproape singura modalitate pentru a obtine informatii pentru segmentare relevante statistic. 3. realizarea previziunilor de marketing. Previziunile de ncredere impun o abordare multivariata. Vnzarile viitoare, de exemplu, depind de o suita de factori precum cei socio-demografici, economici etc. Chiar si ntr-o analiza a trendului, activitatea viitoare nu este o simpla functie a proiectarii direct liniare sau a unei medii dinamice. Poate fi ciclica, poate avea componente sezoniere sau poate avea decalaje complicate n timp, toate putnd si trebuind sa fie modelate prin analiza multivariata. Tehnicile econometrice multivariate au fost dezvoltate pentru a face fata problemelor legate de anticipari si previziuni. Aceste tehnici au fost imbunatatite pentru a obtine previziuni matematice cu erori minime, avand ca input anumite date. Exista, de asemenea, o serie de tehnici larg acceptate care trateaza problema interdependentelor dintre variabilele previzionate si dintre acele variabile si perioadele de timp care pot sa nu apara n cele mai detaliate calcule. Daca nu sunt controlate, aceste interdependente pot conduce la o serie de rezultate false. 4.analiza cauzala. Una dintre ariile n care analiza multivariata si poate aduce aportul este analiza cauzala. Exista un ansamblu de tehnici proiectate n mod specific pentru a modela si testa teoriile legate de cauzalitate. Aceste tehnici isi pot dovedi valoarea chiar si atunci cnd sunt doar trei cauze intercorelate. In aceste situatii, chiar si cel mai mare esantion poate fi prea mic pentru a izola factorii cauzali importanti printr-o analiza simpla. Prin aplicarea unor teorii statistice bine dezvoltate, tehnicile multivariate pot utiliza datele chiar dintr-un esantion mic pentru a furniza o cale de a testa ipotezele detaliate legate de piata. Daca are loc o ancheta pentru a determina cauza reducerii vanzarilor, de exemplu, tehnicile multivariate ofera o cale obiectiva de a modela aceste posibile cauze si a determina care dintre ele este cea mai importanta. Cel mai important lucru este probabil faptul ca, desi cuprinde tehnici statistice evoluate, analiza multivariata furnizeaza rezultate care sunt accesibile att cercetatorilor ct si managerilor. Din punct de vedere al utilitatii pentru afaceri, tehnicile multivariate nu adauga complexitate actului decizional (desi sunt tehnici evoluate) ci clarifica, simplifica si cresc utilitatea oricaror rezultate pe care un cercetator le poate furniza beneficiarului studiului.
1.2. Clasificarea metodelor de analiza multivariata
nainte de a prezenta metodele specifice acestei categorii, devine necesara
definirea termenului multivariat. Asa cum se poate ntelege si din denumirea sa, multivariat nseamna, n cel mai simplu sens, mai multe variabile considerate simultan n analiza, n cele mai multe cazuri fiind vorba de mai mult de doua variabile. n acest sens, metodele multivariate pot analiza inter- relationarea dintre mai multe variabile analizate simultan, n baza unui modelul specific fiecarei metode n parte. Majoritatea tehnicilor identifica configuratii ale asemanarilor sau legaturilor dntre variabile, sau pot realiza previziuni si/sau estima importanta relativa a fiecarei variabile n previzionarea sau explicarea anumitor variabile. Metodele multivariate de analiza difera de cele univariate prin faptul ca se concentreaza ntr-o masura mai mare asupra intensitatii legaturilor (corelatiilor sau covariantelor) dintre variabile si nu att de mult asupra nivelurilor (mediilor) sau distributiilor acestora. Clasificarea metodelor de analiza multivariata de mai sus ia n considerare trei caracteristici ale variabilelor analizate: a. daca unele dintre variabile sunt dependente de altele sau daca ntre ele exista doar relatii de asociere; b. n cazul relatiilor de dependenta, daca sunt incluse n model una sau mai multe variabile dependente; c. daca pentru masurarea variabilelor se utilizeaza o scala metrica (interval sau proportionala) sau nemetrica (nominala sau ordinala). Fig. 1.1. Metode de analiza statistica multivariata3
Metodele multivariate pot fi clasificate n metode de analiza a dependentelor,
caracterizate prin faptul ca una sau mai multe variabile sunt considerate dependente iar un alt grup formeaza setul variabilelor independente (factori sau predictori) si metode de analiza a interdependentelor, care urmaresc gruparea datelor pe baza similitudinilor existente ntre ele sau covariatiei, permitnd identificarea unor structuri (configuratii) n setul de date; ele nu analizeaza legaturile de dependenta dintre variabile.
1.2.1. Metode multivariate de studiere a dependentelor
Atunci cnd cercetatorul urmareste sa explice, sa previzioneze sau sa nteleaga
anumite variabile de marketing (n special cele care masoara rezultatele sau efectele) este recomandata utilizarea tehnicilor multivariate de studiere a dependentelor. Fie ca este vorba de vnzari sau cote de piata, de evaluari ale produselor sau serviciilor, de gradul de satisfactie sau de intentiile de cumparare, cel care ia deciziile de marketing va fi interesat sa afle care sunt variabilele care pot explica sau influenta aceste rezultate si sa afle mai multe despre natura legaturii dintre toate acestea. n toate aceste cazuri cercetatorul va urmari stabilirea (evalurea) legaturilor dintre una sau mai multe variabile rezultative, denumite variabile dependente si una sau mai multe variabile factoriale sau explicative, denumite variabile independente, ca urmare a modului n care au fost considerate n modelul de studiere a relatiilor de dependenta. Cu toate ca aceste metode poarta denumirea de metode de studiere a dependentelor, trebuie precizat ca ele cerceteaza si estimeaza relatiile dintre variabile si nu si propun demonstrarea cauzalitatii dintre variabile (cu exceptia situatiilor n care urmaresc n mod direct acest lucru si ndeplinesc conditiile metodologice necesare, specifice experimentelor de marketing). Alegerea variabilelor care sa fie incluse n modelele de analiza impune o abordare mai complexa, bazata pe cunostintele, informatiile si rezultatele anterioare, pe teorie, dar si pe rationamentul si experienta cercetatorului. n analiza relatiilor de dependenta exista trei categorii mari de metode: analiza regresiei urmareste cercetarea relatiei liniare dintre o variabila (dependenta) masurata n scala metrica si una sau mai multe variabile (independente) masurate pe scale metrice sau nemetrice, cu scopul de a explica si previziona variatia variabilei dependente. Utilizarea mai multor variabile independente n explicarea unei variabile considerate dependente este cunoscuta sub numele de analiza regresiei multiple. n situatia n care extindem analiza si avem n vedere un grup de variabile dependente si un grup de variabile independente (toate variabilele fiind tratate simultan), metoda de analiza poarta denumirea de analiza canonica care se aplica, cu foarte mici diferente, similar regresiei multiple (n acest sens, cunoasterea aspectelor specifice analizei multivariate a variatiei ajuta la ntelegerea specificitatii analizei unui grup de variabile dependente). analiza discriminantului este o metoda statistica multivariata de estimare a relatiei liniare dintre o variabila dependenta nemetrica de tip dihotomic (cu doua stari) sau multihotomic (cu mai mult de doua stari) si combinatii liniare ale mai multor variabile independente de tip metric. Atunci cnd avem de-a face cu o variabila dihotomica (doua categorii), tehnica este cunoscuta sub numele analiza discriminantului a doua grupuri pe cnd n situatia n care variabila dependenta are mai mult de doua categorii, se utilizeaza denumirea de analiza a discriminantului multiplu. analiza variatiei (ANOVA) si analiza covariatiei (ANCOVA) sunt folosite pentru a examina diferentele dintre valorile medii ale variabilei dependente sub efectul unor variabile independente controlate, dupa izolarea efectului unor variabile independente necontrolate. Procedurile de analiza a variatiei se diferentiaza prin numarul de factori si numarul de variabile dependente analizate simultan n model. Atunci cnd analizam o singura variabila dependenta si sunt luati n considerare mai multi factori (n) metoda poarta denumirea de analiza variatiei cu n-factori. n situatia n care sunt analizate simultan mai multe variabile dependente si mai multi factori metoda cunoaste o abordare mai complexa, cunoscuta sub denumirea de analiza multivariata a variatiei (MANOVA).
1.2.2. Metode multivariate de studiere a interdependentelor
Spre deosebire de metodele prezentate anterior, analiza interdependentelor nu
mai separa variabilele n dependente si independente ci le considera pe toate ca fiind independente si avnd, a priori, aceeasi importanta pentru analiza. n acest caz interesul principal al cercetatorului este orientat catre determinarea unor configuratii a relatiilor dintre toate variabilele analizate (relatii de interdependenta) cu scopul de a identifica grupuri de variabile, de obiecte sau de persoane sau de a stabili similitudini sau diferente. La fel ca si celelalte metode de analiza multivariata, metodele multivariate de studiere a interdependentelor au nceput sa fie folosite pe scara mai extinsa n cercetarile de marketing dupa introducerea calculatoarelor, dat fiind volumul mare de date necesar a fi analizate. n mod similar celorlalte metode, alegerea variabilelor care sa fie incluse n modelele de analiza trebuie facuta n functie de cunostintele si rezultatele anterioare, de teoria de specialitate fiind importante, n acelasi timp, experienta si rationamentul cercetatorului. Metodele de analiza a interdependentelor au cstigat foarte mult teren n ultima perioada, fiind apreciate si preferate n mod deosebit de multi utilizatori ai rezultatelor cercetarilor de marketing, de cei responsabili cu decizia de marketing, n special datorita faptului ca genereaza informatii clare si operationale. Sunt considerate ca fiind metode moderne, avansate de analiza a datelor, nglobnd tehnologie de ultima generatie, utila si performanta, care ajuta la ntelegerea simplificata a unei realitati caracterizate prin multidimensionalitate. Principalele categorii de metode de analiza a relatiilor de dependenta ce vor fi tratate sunt : analiza factoriala cerceteaza legaturile de interdependenta dintre mai multe variabile cu ajutorul carora se caracterizeaza un anumit fenomen, prin reducerea (condensarea) volumului datelor cuprinse n variabilele initiale si constituirea unui set mai mic de dimensiuni (factori), urmarindu-se o pierdere minima de informatii. Ea nu si propune sa faca estimari si previziuni ci urmareste gruparea variabilelor luate n analiza, focaliznd astfel pe analiza interdependetelor dintre acestea. analiza grupurilor urmareste clasificarea componentelor unei multimi eterogene (obiecte, indivizi sau cazuri) n grupuri relativ omogene, n functie de o serie de variabile si relatiile de interdependenta dintre acestea. Analiza grupurilor urmareste, pe lnga asigurarea unei omogenitati a obiectelor n cadrul grupurilor si o diferentiere ct mai mare ntre grupuri. Cele mai multe metode de grupare sunt euristice, bazate pe algoritmi si relativ simple. Ele nu au la baza modele si un instrumentar statistic complex si exhaustiv, fiind, din acest punct de vedere, substantial diferite de metodele de analiza multivariata a variatiei, a regresiei, a discriminantului liniar multiplu sau de analiza factoriala. Ca finalitate si dar si ca metoda de lucru, analiza grupurilor este interesata de raporturile de similitudine dintre obiecte. scalarea multidimensionala reprezinta un proces n care, cu ajutorul diferitelor tehnici, obiectele analizate (stimulii) sunt reprezentate prin puncte ntr-un spatiu perceptual multidimensional. Axele acestui spatiu sunt interpretate ca atribute cu ajutorul carora obiectele sunt diferentiate unele de altele si se presupune ca ele sunt expresia resorturilor psihologice prin care respondentii si formeaza perceptii si preferinte legate de stimuli. Fiind tot o metoda care focalizeaza pe studierea similitudinilor dintre obiecte, scalarea multidimensionala este oarecum reversul analizei grupurilor: n timp ce analiza grupurilor clasifica obiectele n concordanta cu asemanarile dintre ele, n functie de unele dimensiuni prespecificate, scalarea multidimensionala deduce dimensiunile fundamentale din asemanarile si preferintele indicate de consumatori1. Cele doua categorii de metodele multivariate de analiza de studiere a dependentelor, respectiv a interdependentelor, nu se exclud ntre ele ci, n conditiile n care ntrunesc conditiile de aplicare, este posibila, recomandata sau chiar se impune utilizarea lor combinata n cadrul aceluiasi proiect. De exemplu, analiza grupurilor (o metoda de studiere a interdependentelor) poate fi folosita pentru a segmenta respondentii n grupuri similare iar apoi se poate apela la analiza regresiei (o metoda de studiere a dependentelor) pentru a identifica factorii-cheie ai comportamentului pentru fiecare segment n parte. Sau am putea realiza o analiza factoriala (metoda pentru interdependente) asupra atributelor de evaluare a unui produs si apoi sa folosim rezultatele acestei analize (scorurile factoriale) pentru a construi o harta multivariata a pozitionarii folosind analiza discriminantului (metoda pentru dependente) sau pentru a segmenta respondentii folosind analiza grupurilor cluster (metoda pentru interdependente).
Macroeconomia simplificată, investiția prin interpretarea piețelor financiare: Cum să citim și să înțelegem piețele financiare pentru a investi în mod conștient datorită datelor furnizate de macroeconomie