Sunteți pe pagina 1din 12

ANALIZA DATELOR DE MARKETING

Criterii de selecție a metodei de analiză

• Tipul de scală utilizat (NOIR)


• Nr eșantioanelor cercetate (1, 2 sau mai multe)
• Natura relației dintre eșantioane (independente sau dependente)
• Nr variabilelor considerate o dată (1, 2 sau mai multe)

Obiectivele urmărite în procesul de analiză

• Determinarea tendinței centrale pt variabilele considerate


• Caracterizarea variației și a repartiției acestora
• Măsurarea gradului de asociere dintre ele
• Realizarea unor estimări și previziuni
• Evaluarea diferențelor dintre variabile sau grupuri de variabile
• Evidențierea legăturilor cauzale dintre ele

ANALIZA UNIVARIATĂ

Tipuri de scale Indicatori ai tendintei centrale


Modul Mediana Media aritmetica Media
geometrica
Nominala x - - -
Ordinala x x - -
Interval x x x -
Proportionala x x x x

Indicatori ai variației Tipuri de scale


Nominale Ordinale Interval Proportionale
Distributia de frecvente x x x x
Procente x x x x
Cuantile - x x x
Amplitudinea variatiei - - x x
Abaterea medie - - x x
Varianța - - x x
Abaterea standard - - x x
ANALIZA BIVARIATĂ

Se măsoară gradul de asociere dintre 2 variabile sub aspectul

• Direcției (natura legăturii)


• Intensității
• Semnificației statistice

VARIABILE PE SCALA NOMINALĂ

Corelația phi (rphi)

• Două variabile nominale, dihotomice, eșantioane independente


Măsoară gradul de asociere între două variabile nominale, pe baza tabelului de contingență
(distribuția de frecvență).

Rphi ia valori de la -1 la 1, extremele reprezentând o asociere perfectă între variabile. Valoarea


0 indică lipsa corelației.
rphi^2 = “în ce proporție variația variabilei y este explicată de variabila x”

Testul neparametric hi-pătrat

• Variabile nominale, eșantioane independente, N>40, Aij > 5 (și pt mai mult de 2
variabile, Oij ≥ 1 și Oij < 5 să nu depășească 20%)
Măsoară gradul de semnificație a asocierii dintre opiniile subiecților din cele 2 eșantioane
independente.
Ipoteza nulă, H0: rphi = 0
Ipoteza alternativă, H1: rphi ≠ 0
Valorile obținute au o repartiție care poate fi aproximată de o repartiție hi-pătrat cu (r-1)(k-1)
grade de libertate.
Dacă valoarea calculată a lui hi-pătrat este egală sau mai mică decât valoarea teoretică
(tabelată), corespunzătoarea nr de grade de libertate și unui anumit grad de semnificație, atunci
se acceptă ipoteza nulă.
Hi-pătrat calculat ≤ hi-pătrat tabelat => H0 adevărată, diferențe nesemnificative
Hi-pătrat calculat > hi-pătrat tabelat => H0 falsă, diferențe semnificative

**Corecții pentru continuitate (Corecția lui Yates)


Deoarece testul hi-pătrat este conceput pentru repartiții continue, atunci când este aplicat unor
date discrete sunt necesare aceste corecții pentru continuitate (pentru o mai mare acuratețe).
Când folosim și când nu folosim testul hi-pătrat (pt date nominale)

• Dacă într-un tabel de contingență de tipul 2x2, N > 40 se poate utiliza cu succes testul
hi-pătrat, fiind preferabilă formula cu corecție
• Dacă 20 < N < 40, testul hipătrat se poate folosi doar dacă toate frecvențele Aij ≥ 5; în
situația în care cea mai mică frecvență Aij < 5, este necesar să se folosească testul
probabilității exacte a lui Fisher
• Dacă N < 20, indiferent de valorile Aij, se va utiliza testul probabilității exacte a lui Fisher

Testul probabilității exacte a lui Fisher

• Două variabile nominale, 2 eșantioane independente, N<20 sau Aij < 5


Obiectivele testului sunt identice cu cele ale testului hi-pătrat.

Ceoficientul de contingență C

• Orice nr de linii sau coloane în tabelul de contingență, se utilizează independent de


natura variabilelor (continue sau discrete) și indiferent de natura repartiției acestora
(normală sau discretă)

Coeficientul de contingență C

• Ia valori între 0 și radical [(k-1)/k], dacă k=r


• Doi coeficienți de contingență din tabele de mărimi diferite nu pot fi comparați
• C poate fi utilizat doar atunci când hi-pătrat poate fi utilizat
• C nu poate fi comparat cu alt coeficient cum ar fi Pearson, Speramnan, Kendall

Testul McNemar
- Eșantioane dependente, cazuri de tip înainte-după, este o adaptare a testului hi-pătrat
- Dacă frecvența care se așteaptă conform ipotezei nule, respctiv ½ (a+d) < 5, în locul
testului McNemar se va folosi testul binomial
VARIABILE PE SCALA ORDINALĂ

Coeficientul Spearman de corelație a rangurilor


- Ia valori între -1 și 1

- Putem aplica un test Z pentru a stabili semnificația statistică a coeficientului

Coeficientul ϫ al lui Goodman și Kruskal


- Dacă în cercetarea relațiilor dintre ranguri mai multe alternative sunt la egalitate, atunci
se apelează la acest coeficient
- Ia valori între -1 și 1
VARIABILE METRICE

Coeficientul de corelație al lui Pearson (r)


- r Ia valori de la -1 la 1
- Dacă ridicăm la pătrat, obținem coeficientul de determinare (r^2 = coeficientul de
determinare)
- Putem face test Z pentru a verficia ipoteza nulă (H0: r=0)
- Condiții de aplicare a coeficientului de corelație Pearson
• Variabilele sunt continue
• Repartiția variabileleor este una normală
• Legătura este liniară, dispersii egale ale tuturor valorilor variabilelor
ANALIZA MULTIVARIATĂ

Pentru clasificarea metodelor de analiză multivarită se au în vedere 3 criterii:

• Dacă unele variabile sunt dependente de altele (relații de natură cauzală) sau dacă
între variabile există doar legături de asociere
• În cazul relațiilor de dependență, dacă se consideră una sau mai multe variabile
dependente
• Scala de măsurare – metrică sau nemetrică
Metoda regresiei multiple (simultane sau în trepte)
- Este posibilă cercetarea relației liniare dintre o variabilă dependentă, măsurată cu o
scală metrică și două sau mai multe variabile independente măsurate cu orice tip de
scală
- Este cea mai frecvent utilizată în cmk
- Are ca scop principal explicarea și previziunea variației variabilei dependente în funcție
de covarianța ei cu varibilele independente
- În calcul, are la bază metoda celor mai mici pătrate
- E folosită în cmk pentru analiza cererii de bunuri și servicii în funcție de factorii săi
determinanți (venituri, prețuri etc)

Metoda discriminantului liniar multiplu


- Estimează relația liniară dintre o variabilă dependentă de tip dihotomic sau multihotomic
(deci o variabilă nemetrică) și combinații liniare ale mai multor variabile independente,
măsurate pe scală metrică
- Se pot face clasificări și previziuni
- Folosirea metodei presupune mai întâri definirea apriorică a grupurilor (2 sau mai multe)
care va sta la baza clasificării și care reprezintă stări posibile ale variabilei dependente
- Metoda discriminantului liniar multiplu urmărește delimitarea grupurilor astfel încât ele să
fie cât mai omogene în interior și cât mai eterogene unele față de altele (statistic,
maximizarea raportului dintre dispersia dintre grupuri și dispersia din interirorul
grupurilor)
- 1. Prin această metodă este posibil să se determine contribuția fiecărei variabile la
explicative la discriminarea dintre grupuri
- 2. De asemenea, metoda permite găsirea celei mai bune combinații de ale variabilelor
explicative care maximizează raportul amintit mai sus
- 3. Metoda permite să se stabilească proceduri pentru a repartiza noi componente care
nu au făcut parte din eșantionul inițial, într-u grup sau altul
- 4. Metoda permite să se analizeze dacă există diferențe semnificative întreprofilurile
grupurilor definite în prealabil
- Este foosită în cmk pentru segmentarea pieței
Analiza multivariată a variației
- Relația dintre factori – variabile independente – discrete (scale nemetrice) asupra
variabilelor dependente măsurate pe scală metrică
- Se testează diferențele dintre mediile variabilelor efect
- Printre cele mai cunoscute metode amintitm: proiectările factoriale, pătratele latine,
pătratele greco-latine
- Condiții
• Repartiție normală
• Selecție aleatoarea a subiecților
• Variație constantă (abatere standard constantă)
• Variația aleatoare este independentă de la o observare la alta
• Se presupune că efectele factorilor sunt aditive, ci nu multiplicative
- Utilizată mai ales pentru date provenite din experimente, unde se poate face separarea
și testarea diferiților factori, aceștia fiind controlați

Analiza canonică
- Studiază relația dintre două grupuri de variabile (unele dependente, altele independente)
și unele și altele putând fi măsurate pe orice tip de scale metrice sau nemetrice
- Numărul maxim de funcții liniare care poti fi construite este egal cu nr variabileleor din
grupul cel mai mic (dacă avem 3 variabile cauză și 4 efect, avem maxim 3 fc canonice)
- Principalul avataj al acestei metode este că oferă posibilitatea exprimării sintetice a ceea
ce altfel ar fi presupus un număr mare, greu de manipulat de corelații bivariate
- Exemplu în carte cu turism – interval de vizitare, probabilitatea vizitării, durata sejurului
(variabile dependente) și distanța de domiciliu, prețuri, amabilitatea personalului
(variabile independente)
Analiza factorială
- Este un nume generic pentru o categorie de metode statistice multivariate al căror scop
îl reprezintă cercetarea legăturilor de interdependență dintre mai multe variabile cu
ajutorul cărora se caracterizează un anumit fenomen, prin reducerea (condensarea)
volumului datelor cuprinse în variabilele inițiale și construirea unui set mai mic de
dimensiuni (factori), urmărindu-se o pierdere minimă de informații
- Printre tehnicile de analiză factorială amintim: metoda componentelor principale, metoda
varimax, metoda quartimax, metoda rotației axelor)
- Analiza factorială e folosită pentru investigații privind schimbarea atitudinilor
consumatorilor, preferințele pentru diferite băuturi alcoolice sau nonalcoolice

Analiza grupurilor
- Reprezintă un nume generic dat unui grup de metode statistice multivariate de
clasificare a componenetelor unei mulțimi eterogene (consumaotr, produse, întreprinderi
etc) în grupuri omogene, având la bază un anumit criteriu
- Analiza grupurilor se deosebește de analiza discriminantului liniar prin faptul că pleacă
de la niște grupuri predefinite și nu împarte variabilele prin care sunt caracterizate
componentele mulțimii cercetate în dependente și independente, ci consideră
interdependențele în cadrul întregului set de componente, lăsând ca grupurile să apară
ca rezultat al acestor relații
- Analiza grupurilor s-a impus în domeniul segmentării pieței

Scalarea multidimensională
- Măsoară opiniile subiecților investigați, privind obiecte sau fenomene supuse cercetării
- Dimensiunile sau atributele nu sunt definite de cercetător, ci sunt generate de subiecții
investigați

- Măsoară opiniile subiecților investigați, privind obiecte sau fenomene supuse cercetării,
crearea unui spațiu perceptual definit de subiecți

Analiza structurilor latente


- O metodă foarte nouă care realizează atât obiective urmărite de analiza factorială
(extragerea factorilor latenți și definirea acestora), cât și obiective legate de clasificarea
subiecților cercetați în grupuri omogene
- S-a dezvoltat la început în domeniul sociologiei pe baza întrebărilor cu răspuns
dihotomic din testele psihologice
- Unele variante ale analizei structurilor lantente prezintă asemănări sau sunt chiar
identice cu analiza factorială

S-ar putea să vă placă și