Sunteți pe pagina 1din 9

Marketing Strategic

Analiza informaţiilor utilizând SPSS

Teme :
Analiza bivariată – Testul X ² bivariat
Analiza multivariată – Metoda regresiei multiple

1
Analiza bivariată – Testul neparametric X ²
Prezentare
Testul X ² bivariat îşi găseşte aplicabilitatea într-o foarte mare varietate de situaţii
decizionale care se pot ivi şi este unul din testele cele mai utilizate în studiile de
marketing. Ca metodă de analiză bivariată acest test ne arată dacă există o relaţie de
interdependenţă între două variabile nominale, determinând gradul de semnificaţie al
asocierii dintre opiniile subiecţilor constituiţi în două eşantioane independente.
Aplicaţie:
Se poate prezenta un mod de rulare al testului cu ajutorul programului SPSS , plecând de
la un exemplu simplu. Să presupunem că un producător de ciocolată a lansat pe piaţă trei
sortimente de bomboane din ciocolată: cu lichior, simple şi cu cremă. După ce a
determinat, în urma unei cercetări, sortimentul aflat în topul preferinţelor clienţilor săi
potenţiali şi anume bomboanele umplute cu lichior (bomboanele simple fiind pe ultimul
loc), producătorul ar dori să ştie dacă există o asociere între aceste preferinţe şi sexul
clienţilor săi, pentru a-şi orienta mai bine campaniile promoţionale.
Cu datele culese din cercetarea de marketing (rezultatele anchetei privind preferinţele pe
sexe) de la un eşantion de 300 de subiecţi, dintre care 160 bărbaţi şi 140 femei, se poate
alcătui următorul tabel de contingenţă, tabel ce cuprinde distribuţia de frecvenţe
considerată simultan pentru cele două variabile caracteristice acestui eşantion.

Tabelul 1.Distribuţia preferinţelor pe sexe pentru cele trei sortimente de bomboane din ciocolată
sexul persoanei * sortimente bomboane ciocolata Crosstabulation

Count
sortimente bomboane ciocolata
cu lichior cu crema simple Total
sexul persoanei feminin 78 45 37 160
masculin 56 43 41 140
Total 134 88 78 300

În acest caz, avem de-a face cu două variabile nominale: variabila sex, având două
variante (bărbaţi şi femei), pentru care vom folosi inbdicele i (i = 1,2) şi variabila
preferinţe cu trei variante (cu „lichior”, „cremă cappucino” şi „simple”), pentru care vom
folosi indicele k (j = 1,3).

2
1. Formularea ipotezei de lucru ( ipoteza nulă şi ipoteza alternativă)
Luând ca punct de plecare al cercetării ipoteza alternativă (H1), conform căreia ar exista
diferenţe între preferinţele bărbaţilor şi ale femeilor, ipoteza nulă (Ho) a cercetării afirmă
că nu există nici o diferenţă între cele două sexe în ceea ce priveşte preferinţa pentru un
sortiment de ciocolată sau altul. Ipoteza nulă va fi respinsă dacă frecvenţele teoretice
diferă semnificativ de frecvenţele observate. Prin urmare ipotezele de cercetare vor fi:
Ho : Oij = Tij ;
H1: Oij ≠ Tij
Pentru probabilitatea ca ipoteza nulă să fie acceptată sau respinsă admitem un nivel de
semnificaţie al testării de 5%, adică vom utiliza un nivel de încredere de 95%.

2. Alegerea metodei
Pentru testarea gradului de semnificaţie al asocierii dintre opiniile subiecţilor constituiţi
în cele două eşantioane independente (bărbaţi şi femei) şi preferinţa pentru sortimentele
cercetate, vom urmări să stabilim dacă preferinţele bărbaţilor diferă semnificativ de
preferinţele femeilor, utilizând testul neparametric X ².

3. Calcularea parametrului folosit în testare


În cazul testării ipotezei nule este necesară determinarea lui Xc ² - valoarea calculată

a lui X ². Această valoare se compară cu valoarea teoretică, adică Xt ², pentru nivelul


de încredere ales şi (r – 1)(k – 1) grade de libertate. În urma rezultatelor se va
considera:
Xc ² > Xc ² : se respinge ipoteza nulă;
Xc ² ≤ Xt ² : se acceptă ipoteza nulă
Frecvenţale teoretice pentru exemplul prezentat se găsesc în tabelul de mai jos.
sexul persoanei * sortimente bomboane ciocolata Crosstabulation

Expected Count
sortimente bomboane ciocolata
cu lichior cu crema simple Total
sexul persoanei feminin 71.5 46.9 41.6 160.0
masculin 62.5 41.1 36.4 140.0
Total 134.0 88.0 78.0 300.0

3
Tabelele rezultate mai jos afişează nivelul de semnificaţie al asocierii dintre cele două
variabile.

Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 2.540(a) 2 .281
Likelihood Ratio 2.545 2 .280
N of Valid Cases 300

a 0 cells (.0%) have expected count less than 5. The minimum expected count is 36.40.

Symmetric Measures

Value Approx. Sig.


Nominal by Nominal Contingency Coefficient .092 .281
N of Valid Cases 300

4. Interpretarea (compararea valorii calculate cu valoarea teoretică şi adoptarea


deciziei de acceptare sau respingere a ipotezei nule).
În acest caz, nivelul de încredere ales este 95%, iar numărul gradelor de libertate este (2-
1) (3-1) = 2. Conform repartiţiei din tabelele teoretice, valoarea teoretică corespunzătoare
lui Xt ² este 5,99. Pe baza informaţiilor prelucrate în SPSS, reiese că valoarea calculată

Xc ² este egală cu 2,54. Rezultă că Xc ² < Xt ², ceea ce înseamnă că vom accepta


ipoteza nulă.

5. Concluzii.
Putem afirma, cu un nivel de încredere de 95%, că frecvenţele teoretice nu diferă
semnificativ de cele observate; nu există deci diferenţe importante între preferinţele
bărbaţilor şi cele ale femeilor. Prin urmare, campaniile de promovare se vor adresa în
aceeaşi măsură publicului masculin şi feminin.

Analiza multivariată – Metoda regresiei multiple.

4
Prezentare

Analiza de regresie multiplă este printre cele mai utilizate metode de analiză multivariată
în cercetările de marketing. Regresia multiplă cercetează legătura de cauzalitate dintre o
variabilă dependentă şi una sau mai multe variabile independente, având ca obiectiv
principal explicarea variaţiei variabilei dependente în funcţie de covarianţa ei cu
variabilele independente. Pentru a determina cea mai bună combinaţie de variabile
independente care explică variaţia variabilei independente, SPSS oferă mai multe metode
de rulare a analizei de regresie: introducerea treptată a variabilelor sau simultană,
eliminarea pas cu pas a acestora. Procedeul ales aici, Backward (eliminarea pas cu pas),
începe cu toate variabilele considerate în model şi la fiecare pas se elimină cel mai slab
predictor, adică acea variabilă care determină cea mai mică reducere a statisticii Fisher,
până când un prag de semnificaţie stabilit pentru F nu mai este atins.
Aplicaţie:
Pentru exemplul privind analiza de regresie multiplă sunt folosite datele din fişierul
Carpet.sav, referitoare la anumite caracteristici ce pot influenţa preferinţele pentru
achiziţionarea de covoare. Datele cuprind informaţii privind preţul, brandul, design-ul,
etc. Această analiză îşi propune să determine gradul în care preferinţele pentru
cumpărarea unui covor este influenţat de caracteristici cum ar fi brandul, design-ul şi
preţul produsului.
Descriptive Statistics

Mean Std. Deviation N


Preference 11.4545 6.44188 22
Brand name 2.0455 .84387 22
Price 2.0000 .87287 22

Package design 1.9091 .86790 22

În tabelul Correlations sunt afişaţi coeficienţii de corelaţie Pearsons, valoarea


semnificaţiei (Sig.) pentru fiecare coeficient de corelaţie şi numărul cazurilor considerate
în analiză ( N = 22 ). Pentru exemplul dat sunt prezentate corelaţiile simple ale fiecărei
variabile independente cu variabila dependentă – preferinţe reprezentate prin matricea
corelaţiilor din tabelul următor.
Correlations

5
Package
Preference Brand name Price design
Pearson Correlation Preference 1.000 .206 .440 -.657
Brand name .206 1.000 .065 -.189
Price .440 .065 1.000 -.126
Package design -.657 -.189 -.126 1.000
Sig. (1-tailed) Preference . .179 .020 .000
Brand name .179 . .388 .200
Price .020 .388 . .289
Package design .000 .200 .289 .
N Preference 22 22 22 22
Brand name 22 22 22 22
Price 22 22 22 22
Package design 22 22 22 22

Se observă că valoarea coeficienţilor de corelaţie de pe diagonală este egală cu 1,


deoarece fiecare variabilă este corelată perfect cu ea însăşi. Se constată că legătura cea
mai semnificativă este între preferinţe şi design pentru că între variabila dependentă
preference şi variabila independentă package design există o legătură directă. Valoarea
coeficientului de corelaţie este egală cu 0, 657 cu o valoare Sig mai mică decât 0,05.

Tabelul următor furnizează o prezentare a rezultatelor eliminării pas cu pas, a variabilelor


care au cea mai redusă contribuţie.

Variables Entered/Removed(b)

Variables Variables
Model Entered Removed Method
1
Package
design,
. Enter
Price, Brand
name(a)

2
Backward
(criterion:
Probability
. Brand name
of F-to-
remove
>= .100).

a All requested variables entered.


b Dependent Variable: Preference

6
În exemplul considerat, este eliminată, în ordinea celei mai slabe influenţe asupra
preferinţelor, variabila brand.

Tabelul Model Summary prezintă pentru fiecare model de regresie valoarea coeficientului
de determinaţie (R²).

Model Summary

Change Statistics
R Square
Model Change F Change df1 df2 Sig. F Change
1 .566(a) 7.822 3 18 .002
2 -.005(b) .195 1 18 .664

a Predictors: (Constant), Package design, Price, Brand name


b Predictors: (Constant), Package design, Price

În cazul dat, valoarea R², arată că variabila independentă care estimează cel mai bine
variabila dependentă este variabila package dessign.

În tabelul coeficienţilor de regresie multiplă, apar statisticile de coliniaritate, toleranţa şi


factorul de inflaţie a variaţiei. Coliniaritatea exprimă existenţa unei corelaţii puternice
între variabilele independente. În astfel de situaţii se calculează statisticile toleranţei.
Considerând numai variabilele independente, variabila dependentă este exclusă din
model.

Coefficients(a)

Model Collinearity Statistics


Tolerance VIF
1 Brand name .963 1.039
Price .982 1.018
Package design .951 1.051
2 Price .984 1.016
Package design .984 1.016

a Dependent Variable: Preference

7
Collinearity Diagnostics(a)

Mode Condition
l Dimension Eigenvalue Index Variance Proportions
Package
(Constant) Brand name Price design
1 1 3.633 1.000 .00 .01 .01 .01
2 .194 4.323 .00 .12 .12 .53
3 .138 5.139 .00 .46 .58 .00
4 .035 10.258 1.00 .41 .28 .46
2 1 2.770 1.000 .01 .02 .02
2 .179 3.929 .00 .41 .47
3 .050 7.430 .99 .57 .51

a Dependent Variable: Preference

Diagnosticul coliniarităţii presupune analiza rezultatelor din tabelul de mai sus.


Eigenvalue dă o indicaţie asupra numărului de legături care există între variabilele
independente. Când mai multe eigenvalues sunt mai apropiate de zero, variabilele sunt
puternic intercorelate. Indicii de condiţie indică probleme de coliniaritate atunci când au
valoare mai mare de 15. În exemplul prezentat, pentru modelul 1, indicele corespunzător
dimensiunii 4 ( variabila brand ) are valoarea 10.258 , apropiată de limita respectivă.
Proporţia varianţei eviidenţiază contribuţia fiecărei variabile la varianţă, valorile mari
pentru acest indicator arată problemele de coliniaritate. După cum se observă din tabel,
variabilele cu probleme de coliniaritate şi care influenţează varianţa sunt: price şi design.

Tabelul Excluded Variables prezintă informaţii despre variabile care sunt excluse la
fiecare pas.
Excluded Variables(b)

Model Collinearity Statistics


Minimum
Beta In VIF Tolerance
2 Brand name .070(a) 1.039 .951

a Predictors in the Model: (Constant), Package design, Price


b Dependent Variable: Preference

Beta In este coeficientul de regresie care ar rezulta dacă în pasul următor s-ar păstra în
model variabila exclusă. Valorile mici pentru toleranţă şi valorile mari pentru VIF denotă

8
existenţa multicoliniarităţii care determină o varianţă mare a coeficientului de regresie, şi
ca urmare o instabilitate a estimaţiei.
În exemplul prezentat, variabila independentă brand este exclusă, fiind considerată ca un
predictor slab în influenţarea variabilei independente. În concluzie în preferinţele asociate
achiziţionării unui covor, marca are o importanţă mică, preferinţele fiind orientate în
special în funcţie de design-ul şi de preţul produsului.

Bibliografie

Cătoiu Iacob (coordonator) & all, Cercetări de Marketing, Editura Uranus


Jaba Elisabeta, Grama Ana, Analiza statistică cu SPSS sub Windows, Editura Polirom