Sunteți pe pagina 1din 7

Curs Cercetari de marketing

Capitolul 11 ANALIZA DATELOR IN CERCETARILE DE MARKETING 11.1. Prepararea datelor 11.2. Analiza univariata a datelor in cercetarile de marketing 11.3. Modalitati de analiza bivariata 11.4. Tehnici de analiza multivariate

18.05.2010

11.1. Prepararea datelor Prepararea datelor este o faza premergatoare procesului de analiza propriu-zisa. Presupune realizarea a 3 categorii de activitati: pregatirea datelor; codificarea raspunsurilor; prezentarea datelor. Pregatirea datelor Consta in verificarea, completarea si asigurarea coerentei si lizibilitatii datelor. Calitatea analizei (etapa urmatoare), depinde de calitatea materiei prime, adica de calitatea datelor brute care vor constitui fisjerul. Verificarea datelor se realizeaza in 2 faze: a. verificarea in teren, realizata de controlorul de teren b. verificarea realizata la sediul institutiei care realizeaza cercetare, de catre persoane anume desemnate. a. Verificarea in teren = activitatea preliminara de pregatire a datelor. - in aceeasi zi in care se desfaoara interviurile trebuie sa se urmareasca urmatoarele etape / aspecte: existenta unor omisiuni din motive tehnice (exemplu: pagina alba de chestionar, neimprimata sau prost imprimata); se verifica daca scrisul de mana poate fi citit; trebuie sa se clarifice raspunsurile inconsistente din punct de vedere logic. - daca aceasta activitate se desfaoara la sfaritul fiecarei zile, controlorul va putea sa corecteze o serie de aspecte legate fie de nonraspunsuri, fie de raspunsurile incomplete. Atunci cand este vorba de omisiuni, respondent pot fi contactati pentru a remedia aceasta situatie si nu in ultimul rand, poate fi verificata munca operatorului de teren, modul in care el intervine, in special cand este vorba de intrebarile deschise. Se pune intrebarea: El intervine corect sau nu?; Operatorul trebuie trimis la reinstruire sau trebuie inlocuit? b. Verificarea la sediul echipei de cercetare Se face atunci cand verificarile in teren nu sunt posibile (de exemplu, atunci cand este vorba de anchete prin posta). Se urrnarete, daca data de expediere a chestionarului se incadreaza in data limita fixata, daca scrisul poate fi citit sau daca exista omisiuni. De exemplu, daca unii subiecti au omis sa raspunda la intebari privind varsta sau sexul, ei pot fi contactati telefonic pentru a se putea completa raspunsurile respective. Prindpalele activitati pe care le necesita pregatirea datelor 1) Verificarea lizibilitatii scrisului - important in special pentru anchetele autoadministrate si mai ales pentru intrebarile deschise. 2) Completarea datelor lipsa. Acestea apar in cazul unor omisiuni realizate fie prin neatentia respondentului, fie din neatentia operatorului: nu s-au inregistrat date privind sexul, varsta sau venitul exista intrebari constituite din 2 parti, logic legate intre ele, dar subiectul a raspuns numai la una dintre ele; exista situatii cand respondentul, in mod deliberat, nu doreste sa raspunda i efectiv nu raspunde la unele intrebari sensibile (nivelul de pregatire, varsta, statut social, venit) Acestea le asimilam
1

categoriilor nonraspunsuri. In aceste situatii nu se mai poate face nimic. Nonraspunsurile sunt considerate ca ,,valori omise" sau ,,raspunsuri incomplete", raspunsuri in alb" si sunt codificate ca atare. 3) Asigurarea coerentei si consistentei raspunswilor Se corecteaza acele raspunsuri care nu sunt in concordanta cu cerintele anchetei sau cu logica iegaturii dintre intrebari si care au la baza, evident, greseli involuntare. De exemplu, o persoana de profesie medic figureaza ca avand nivel de pregatire primara, sau: respondent!! unui chestionar trebuie sa aiba peste 18 ani; din datele completate rezulta ca unii au sub 18 ani. Acele chestionare nu sunt luate in considerare, pentru ca nu sunt respectate cerintele de esantionare. Trebuie facuta, de asemenea, o verificare a legaturilor logice care trebuie sa existe intre diferite raspunsuri. De exemplu, o persoana raspunde ca nu poseda automobil, dar raspunde ca au fost facute cheltuieli pentru asigurarea auto. 4) Aranjarea corecta a raspunswilor date la intrebarile deschise Exista situatii cand subiectii, in raspunsul pe care-1 dau la o intrebare, pot sa raspunda in acelasi timp si la o intrebare deschisa care urmeaza, ca ordine, ulterior acestei intrebari. Operatorul nu mai pune intrebarea la care s-a raspuns, dar controlorul va transfera raspunsul dat anterior, la intrebarea in cauza. 5) Usurarea procesului de codificare Exista situatii cand raspunsul dat are in vedere o scala care cuprinde numere. In graba, fie se incercuiesc simultan 2 cifre, fie se noteaza cu ,,x" deasupra numerelor indicate, dar intre 2 cifre. Controiul pe baza unei analize logice trebuie sa faca corectia care se impune. In ceea ce priveste raspunsurile: ,,nustiu" Motive pentru care respondentul opteaza pentru nu stiu" : intr-adevar nu cunoaste produsul, marca, situatia avuta in vedere nu este sigur si nu poate formula o opinie clara nu vrea sa raspunda la intrebarea respectiva. Controiul va trebui sa faca distinctie intre un ,,nu stiu" real care inseamna ,,fara opinie" si un ,,nu tiu" care de fapt ascunde o opinie. Introducerea in analiza a raspunsurilor ,,nu stiu" ridica nai multe probleme in fata cercetatorului. Sunt mai multe alternative: 1. Se inregistreaza toate tipurile de raspunsuri ,,nu stiu" ca o categoric unica, separata; poate reflecta o categoric reala de raspunsuri poate determina o serie de complicatii in calculele in care intervin procentele. 2. Se elimina raspunsurile ,,nu ?tiu" din baza de calcul a procentelor; 3. Se distribute ,,nu tiu" proportional, in cadrul celorlalte categorii de raspunsuri (incorect) Codificarea datelor Este procesul de identificare si de atribuire a unor simboluri numerice, datelor care anterior au fost aduse in forma lor finals. Fiecarei modalitati de raspuns i se asociaza un simbol numeric facand posibila identificarea si clasificarea raspunsului respectiv si, in acelasj timp, transferul datelor din chestionare in memoria calculatoarelor. Codificarea se bazeaza pe utilizarea codurilor. Codurile sunt definite, in sens larg, ca reprezentand regulile pentru interpretarea, clasificarea si inregistrarea datelor in procesul codificarii. In general, codurile sunt simboluri numerice care asigura procesarea datelor. intrebarile deschise dispun de un numar prestabilit de categorii de raspunsuri care urmeaza a fi codificate. De exemplu, categoriile de raspuns si codificarea lor, la o intrebare inchisa, se poate prezenta astfel: [8] Cre?terea preturilor la carburanti determina scumpirea tuturor produselor" 1. _ acord total 2. _ acord 3. _ dezacord 4. _ dezacord total 5. _ nu stiu 6. _ fara raspuns Pentru stabilirea codurilor trebuie respectate doua reguli de baza: codificarea trebuie sa fie exhaustiva . Ea trebuie sa cuprinda toate aspectele si variantek posibile de raspuns. Atunci cand sunt incluse cele mai importante categorii de raspunsuri, dai in afara acestora
2

pot exista si altele, se recurge la categoria ,,altele"; codificarea categoriilor este mutual exclusiva si independents , adica nu trebuie sa existe categorii care sa se suprapuna; un anumit raspuns nu se poate asocia decat unei anumile categorii de raspuns. Atunci cand chestionarele sunt puternic structurate, categoriile pot fi precodificate de la bun Tnceput. adica inainte de a se culege datele.

De exemplu: [22] Va rugam sa bifati intervalul de venituri in care se afla suma tuturor veniturilor lunare nete ale familiei dvs. 1. _ mai putin de 500 2. _ 500-1000 3. _ 1000-2 000 4. _ 2 000-3 000 5. _ 3 000-4 000 6. _ 4 000 si peste [28] Posedati masina proprietate personals? 1. _Da 2. _Nu La o mtrebare care presupune utilizarea unei scale cu mai multe nivele, pentru fiecare aspect avut in vedere, se stabilesc numere de cod pentru fiecare nivel si pentru fiecare aspect care trebuie evaluat. Exemplu: [7] Avand in vedere ce stiti despre banca ,,X", pornind de la reputatia ei si din experienta dumneavoastra, va rugam sa evaluati urmatoarele atribute: Peste Nivel Sub Nu nivel mediu nivel $tiu mediu mediu 1 2 3 4 Solidd sub aspect fmanciar Cunoscuta pe plan national Dispune de personal competent Satisfacere prompta si corecta a clienfilor Oferta avantajoasa a serviciilor ei bancare (12) (13) (14) (15) (16)

Pentru intrebari cu multiple variante de raspuns, fiecare variants propusa va fi codificata, iar fiecarei variante i se vor stabili coduri pentru nivelurile posibile. Exemplu: Care din urmatoarele tari vest-europene le-ati vizitat in ultimii doi ani? 1 2 Germania Da ___ Nu (10) Franta Da _ Nu (11) Italia _ Da _ Nu (12) Belgia Da _ Nu (13) Olanda _ Da _ Nu (14)
In ceea ce priveste intrebarile deschise: acestea nu pot fi codificate anticipat. Codificarea se realizeaza dupa culegerea datelor. Scopul codificarii este de a reduce pe cat posibil numarul foarte mare de variante de raspuns, adica, se urmareste obtinerea catorva categorii generale de raspunsuri care astfel pot fi codificate. Cum? Prin analiza de continut se pot repartiza raspunsurile similare obtinute, in categorii de raspunsuri. Se pune problema ca variantele de raspuns stabilite sa acopere toate cazurile posibile. Principalul obiectiv al procesului de stabilire a codurilor pentru intrebarile deschise consta in a realiza un transfer precis al semnificatiei raspunsurilor date in scris in coduri numerice. Ideea de baza : acest transfer pleaca de la intelegerea gandurilor si nu de la cuvintele scrise. Rezultatul final; o lista care cuprinde intr-o forma sintetizata opiniile si gandurile exprimate in
3

raspunsurile la intrebarile deschise. Principalele categorii de raspunsuri care vor fi codificate vor fi determinate pe baza a circa 20% din totalul raspunsurilor date la acest tip de intrebari. Procedura de codificare Opiniile respondentilor sunt impartite in categorii de ganduri, de afirmatii distincte, mutual exclusive. Aceste afirmatii distincte se pot exprima printr-un cuvant, o propozitie sau o fraza; dar fiecare exprima un singur gand care se va codifica. Este necesar de a se citi intregul raspuns inainte ca acesta sa fie divizat in afirmatii care redau ganduri. Pentru anumite produse, in special alimente, o serie de caracterizari exprimate prin adjective sau adverbe, pot reflecta mai multe intelesuri care, in mod distinct, trebuie luate in considerare. Se concepe o lista care cuprinde variantele de raspuns sub forma unor ganduri distincte, codate. Aceasta lista cuprinde, initial, un numar mare de categorii; ulterior ea poate fi restructurata intr-un numar mai redus de categorii. Urmatoarea activitate va fi cea de prelucrare si analiza a datelor. => Cercetatorul trebuie sa dispuna. in orice moment, de un instrument care sa-i permita cunoasterea unei variabile. Acesta este cartea de codun sau dictionarul de variabile. Ea identifies fiecare variabila cuprinsa in studiu si localizarea ei in memoria calculatorului. Cartea de coduri = o lista care cuprinde elementele de identificare ale studiului si ale fiecarui chestionar, numarul intrebarii, numarul coloanei si prezentarea continutului / sensului valorilor de cod.

Jrezentarea datelor Datele brute, verificate, codate si introduse in calculator, alcatuiesc fisierul de date pe baza caruia se vor efectua analiza datelor si prelucrarile de natura statistica. Fisierul poate permite obtinerea unor structuri sub forme diverse tabele sau tnatrice de date; reprezentari geometrice; blocuri de date.
6.2. Analiza univariata a datelor in cercetarile de marketing

Metodologia de analiza a fenomenelor de marketing a cunoscut in ultimele trei decenii, pe plan international, o adevarata revolutie, paralel cu dezvoltarea tehnologiei de masurare, culegere si prelucrare a informatiilor. Aceasta s-a datorat, in mare masura si progreselor inregistrate in folosirea pe scara tot mai larga a calculatoarelor electronice. Analiza reprezinta un proces complex $i sistematic de aplicare a tehnicilor statistico - matematice, in scopul extragerii din baza de date comtituita a tuturor informatiilor necesare procesului decizional. Metodele de analiza utilizate in cercetarile de marketing pot fi grupate dupa mai multe criterih o tipul de scala utilizat (nominala, ordinala, interval, proportionala); o numarul eqantioanelor utilizate (unul, doua sau mai multe); o natura relatiei dintre aceste esantioane (dependente, independente); o numarul variabilelor considerate (una, doua sau mai mult de doua). Objective urmarite in procesul de analiza a informatiilor: determinarea tendintei centrale a variabilelor considerate; caracterizarea variatiei, a repartitiei acestora; masurarea gradului de asociere dintre ele; realizarea unor estimari si previziuni; evaluarea diferentelor dintre variabile/grupuri de variabile si evidentierea legaturiloi cauzale dintre ele. Determinarea tendintei centrale: se porneste de la tipul de scala utilizat pentru masurarea acestora. tendinta centrala se caracterizeaza diferit, functie de nivelul la care s-a realizat masurarea.

Tipuri de scale Nominala Ordinala Interval Proportionala

Indicatori ai tendintei centrals Grupul modal Mediana Media (valoarea aritmetica modala) X X X X X X X X X

Media geometrica X

Daca datele sunt negrupate, valoarea modala, primul indicator al tendintei centrale, este cea care prezinta cea mai mare frecventa de aparitie. In cazul distributiilor de frecvente specifice datelor grupate, grupul modal este constituit din grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri. Mediana - indicator al tendintei centrale - reprezinta valoarea deasupra si dedesubtul careia se situeaza cate o jumatate din observatii. Daca datele sunt: < = >negrupate : ^ daca sunt aranjate in ordine, de la valoarea cea mai mica la valoarea cea mai mare, sau invers, si daca numarul de observatii este fara sot, valoarea mediana se stabilete fara nici o dificultate (conform defmitiei ei); ^ daca exista un numar de observatii cu sot, mediana se considera in mod conventional ca este situata la jumatate, intre cele doua valori centrale; => grupate: numarul total de observatii (frecvente) se imparte la 2 si astfel rezulta cate observatii trebuie sa fie deasupra s.i cate dedesubtul medianei; apoi se determina frecventele cumulate pentru a stabili in care se situeaza mediana; in final se calculeaza valoarea medianei. Media aritmetica, x , a unei variabile x despre care se cunosc n observatii intr-un esantion investigat, se calculeaza astfel:

x=

x
i =1

Daca datele sunt grupate, pentru calculul mediei aritmetice se foloseste urmatoarea relatie:

x=

f
i =1

* mi

unde: f i = reprezinta frecventa grupului i mi = punctul de mijloc al intervalului unui grup n = numarul total de observatii cuprinse in esantion. Atunci cand pentru masurare s-a folosit o scala proportionala, pentru caracterizarea tendintei centrale, se poate calcula chiar sj media geometrica xc (destul de rar utilizata in cercetarile de marketing). Formula de calcul:

Variatia si repartitia variabilelor: se face in mod diferentiat, in functie de nivelul de masurare realizat printr-un tip de scala sau altul; indicatori utilizati: distributia de frecvente (eel mai adesea utilizata, indiferent de tipul de scala utilizat), procente, cuartile, amplitudinea variatiei, abaterea medie, variatia, abaterea standard; pentru caracterizarea variatiei si repartitiei unei singure variabile deosebit de utile sunt metodele bazate pe tipuri de repartitii normale, Poisson, binomiale etc.

6.3. Modalitati de analiza bivariata Analiza univariata reprezinta, in cercetarile de marketing, doar inceputul (ia in considerare 'ariabilele in mod separat). Analiza bivariata, reprezinta, in continuare un obiectiv important, presupunand masurarea gradului le asociere a doua variabile, sub aspectul: directiei, intensitatii, semnificatiei statistice. Masurarea gradului de asociere a doua variabile: aspect important sub aspectul: intensitatii, directiei, semnificatiei statistice metode utilizate: coeficientul de contingent^, coeficientul de corelatie a rangurilor Spearman, coeficientul lui Goodman s.i a lui Kruskal, coeficientul de corelatie Pearson, coeficientul de elasticitate, analiza bivariata a variatiei, regresia simpla, analiza bazata pe testul neparametric % 2, testul probabilitatii exacte a lui Fisher, testul U, testul neparametric McNemar. = metode de analiza bivariata (cerceteaza legaturile de asociere care exista intre doua variabile). -> pentru testarea sradului de semnificatie a diferentelor de opinie intre subiectii constituiti in doua sau mai multe eantioane independente cu privire la o caracteristica cercetata -> testul neparametric 2 (hi). Exemplu: Un sondaj de piata cu un esantion de 2000 persoane. Produsul ,,x" a patruns in consum, dupa cum urmeaza: Structura pe sexe TOTAL Felul consumlui

- curent - ocazional TOTAL

M 537
549

F 583
571

1120
56%

443
431

437
449

880
44%

980

1020

2000

Exista deosebiri semnificative, in functie de sex in ceea ce prives.te frecventa consumului alimentar X? La prima vedere: consumul acestui produs este mai mare la femei decat la barbati. Dar, este vorba de o cercetare selectiva -^ putem extrapola aceste concluzii la nivelul populatiei? Folosim testul 2 Introducem ipoteza nula, conform careia, criteriul respectiv nu influenteaza distributia esantionului pe cele doua grupe. consum curent: 56% consum ocazional: 44% Deci: frecventele dupa ipoteza nula, adica: presupunand ipoteza nula ca adevarata, sa vedem care ar fi trebuie sa fie distribu^iile daca nu exista nici c deosebire intre distributii in functie de sex.
Distributia reala Distribuia corespunzatoare ipotezei nule

Valoarea calculate a lui 2 :


2 =
(537 549) 2 (583 571) 2 (443 431) 2 (437 449) 2 + + = 1,168 549 571 431 449

Cautam in tabelele statistice valoarea calculata pentru y; aceasta reprezinta praguri pana la care trebuie sa admitem ipoteza nula, adica praguri pana la care putem trage concluzia ca nu exista diferente semnificative. grade de libertate (r-l)(k-l)=(2-l)(2-l)=l nivel de semnificatie: 0,05, adica probabilitate 95% 2 tab = 3,841
6

2 2 calc < tab => ipoteza nula se accepta adica: nu exista diferente semnificative idica: criteriul utilizat (sexul) nu are o influenta semnificativa asupra naturii consumului idica: structura pe sexe nu influenteaza natura consumului.

Pentru masurarea gradului de asociere mtre variabilele unui tabel de contingenta utilizam: coeficientul de contingenta:

C=

c2 N + c2
C= 1,168 2 = 0,024 2000 + 1,168

In exemplul nostru:

C=0,024 -> nu difera in mod semnificativ de zero ->frecventa consumului populatiei (produsul x) este foarte slab corelata cu caracteristica sex. Limite: teoretic, valoarea minima poate fi zero (cand variabilele nu sunt deloc corelate); in schimb, valoarea maxima nu ajunge nicicand sa fie egala cu 1 (cum se intampla cu coeficientii de corelatie Pearson, Spearman, Kendall).

6.4. Tehnici de analiza multivariata In cercetarea de marketing se intalnesc foarte frecvent situatii in care sunt supuse analizei mai mull de doua variabile. Apare astfel ca indispensabila, analiza multivariata. Metodele de analiza multivariata presupun utilizarea unui grup de metode statistico-matematice cu ajutorul carora se pot cerceta simultan legaturile de asociere mtre 3 sau mai multe variabile. Cele mai cunoscute metode de analiza multivariata sunt urmatoarele: analiza de regresie multipla; analiza discriminantului liniar multiplu; analiza multivariata a variatiei; analiza canonica; analiza factoriala; analiza grupurilor; scalarea multidimensionala; analiza structurilor latente.
Alegerea uneia din aceste metode se face in functie de 3 caracteristici ale variabilelor analizate: a) daca unele variabile sunt: dependente de altele (relatii cauzale); sau exista doar legaturi de asociere. b) in cazul relafiilor de dependenta: exista una exista mai multe variabile dependente c) daca pentru masurarea variabilelor se utilizeaza o scala metrica sau nemetrica.