Sunteți pe pagina 1din 9

Data Analysis in SPSS

SEMINAR 10.
REGRESIE MULTIPLĂ

Definirea regresiei multiple1:


O tehnică statistică care dezvoltă simultan o relație matematică între o singură variabilă metrică
(scale) dependentă și două sau mai multe variabile metrice independente (predictori).

Utilizări ale regresiei multiple2:


Analiza de regresie multiplă examinează relațiile asociative între o variabilă dependentă și una
sau mai multe variabile independente în următoarele moduri:
◦ Determină dacă variabilele independente explică o variație semnificativă din variabila
dependentă: dacă există o relație.
◦ Determină cât de mult din variația variabilei dependentă poate fi explicată prin variabilele
independente: cât de puternică e relația.
◦ Determină structura sau forma relației: ecuația matematică referitoare la variabilele
independente și variabila dependentă.
◦ Previzionează valorile variabilei dependente.
◦ Controlul pentru anumite variabile independente atunci când se evaluează contribuțiile unei
variabile specifice sau a unui set de variabile.
Regresia multiplă poate fi folosită în mai multe contexte de cercetare, cum ar fi 3:
■ Poate fi explicată variația vânzărilor din perspectiva variației cheltuielilor de publicitatea,
prețurilor și a nivelului de distribuție?
■ Poate fi variația cotelor de piață explicată de mărimea forței de vânzare, cheltuielile de
publicitatea și bugetul de promovare a vânzărilor?
■ Sunt percepțiile consumatorilor privind calitatea determinate de percepția lor asupra prețurilor,
a imaginii și a atributelor brandului?
■ Care este contribuția cheltuielilor de publicitate în explicarea variației vânzărilor atunci când
nivelurile prețurilor și distribuției sunt controlate sau constante?

Modelul regresiei multiple4:


1
Field, A. (2009). Discovering Statistics using SPSS. London: SAGE.
2
. Malhotra, N., Nunan, D. and Birks, D. (2017). Marketing Research: an applied approach: 5th Edition. Harlow, UK. Pearson
Education.
3
. Malhotra, N., Nunan, D. and Birks, D. (2017). Marketing Research: an applied approach: 5th Edition. Harlow, UK. Pearson
Education.
4
Malhotra, N., Nunan, D. and Birks, D. (2017). Marketing Research: an applied approach: 5th Edition. Harlow, UK. Pearson
Education.

1
Data Analysis in SPSS

Forma generală a modelului de regresie multiplă este următoarea:

Y =α + β 1 X 1+ β2 X 2 + β 3 X 3 +… .+ β k X k +ε

și este estimată prin următoarea ecuație:

Y^ =a+b1 X 1 +b 2 X 2 +b 3 X 3+ …+b k X k

Observații privind Ecuația 1:

Y = variabila dependentă,
X 1 , X 2 … X k = variabilele independente (predictor)
β 1, β 2 … β k = coeficienții
ε = eroarea
k = numărul de variabile independente din model
n = numărul de observații analizat

Observații privind Ecuația 2:

Y^ = valoarea estimată / previzionată a variabilei dependente


a = parametrul care reprezintă intersecția cu Oy
b 1 , b2 ..b k = coeficienții parțiali de regresie

În SPSS:
 Software-ul statistic estimează parametrii (a și b 1 , b2 ..b k ) într-o manieră care minimizează
eroarea totală.
 Acest proces maximizează, de asemenea, corelația dintre valorile reale ale lui Y și valorile
^.
previzionate ale lui Y

Pentru a analiza regresiei multiple5, folosim următoarele teste:

 Multiple R. Coeficient de corelație multiplă (Multiple R). R Multiplu este corelația dintre valorile
observate ale lui Y și valorile lui Y previzionat din cadrul modelului de regresie multiplă. Prin
urmare, valorile mari ale R multiplu reprezintă o corelație mare între valorile preconizate și cele
observate ale variabilei dependente. Un R Multiplu de 1 reprezintă o situație în care modelul
previzionează perfect datele observate. Ca atare, R Multiplu este un indicator al cât de bine
modelul previzionează datelor observate.

 R2. Coeficient multiplu de determinare. Acest coeficient arată cât de puternică este asocierea
într-o regresie multiplă.
 ◦ Rezultatul R2 poate fi interpretat în același mod ca și la o regresie lineară simplă: este măsura în
care variația variabilei dependente este explicate de modelul de regresie multiplă.

 F test. Testul F este utilizat pentru a testa ipoteza nulă conform căruia F = 0. Dacă Sig. < 0.05 
Respingem ipoteza nulă  Modelul liniei de regresie oferă o estimare mai bună decât dacă am
folosi media variabilei dependente Y.
5
Malhotra, N., Nunan, D. and Birks, D. (2017). Marketing Research: an applied approach: 5th Edition. Harlow, UK. Pearson
Education.

2
Data Analysis in SPSS

 Coeficienți parțiali de regresie6.


Pentru a înțelege semnificația unui coeficient parțial de regresie, să luăm în considerare un caz în
care există două variabile independente într-un model de regresie:
Y^ =a+b1 X 1 +b 2 X 2

◦ Coeficientul parțial de regresie, b1, denotă schimbarea în variabila estimată, Y^ , per o


schimbare de o unitate în X1 atunci când celelalte variabile independente (sau multipli
predictori X2 - Xk) din model sunt menținute constante.
◦ b1 reprezintă schimbarea așteptată în Y când X1 este schimbat cu o unitate, dar X2
este păstrat la un nivel constant sau controlat.
◦ La fel, b2 reprezintă schimbarea așteptată în Y când X2 este schimbat cu o unitate,
dar X1 este păstrat la un nivel constant sau controlat.
◦ Prin urmare, denumirea de coeficienți parțiali de regresie este potrivită pentru b1 și b2.
◦ Efectele combinate ale X1 și X2 asupra Y sunt aditive / cumulate. Cu alte cuvinte,
dacă X1 și X2 sunt schimbate cu 1 unitate, schimbarea așteptată în Y ar fi (b1+ b2).

 Coeficienții Beta. Coeficienții beta sunt coeficienții parțiali de regresie obținuți atunci când toate
variabilele (Y, X1, X2, . . . Xk) au fost standardizate la o medie de 0 și o variație de 1 înainte de a
estima ecuația de regresie.

6
Field, A. (2009). Discovering Statistics using SPSS. London: SAGE.

3
Data Analysis in SPSS

Exercițiu 1. Dezvoltați o analiză de regresie multiplă bazată pe Intentia de achizitie produse Nike (ca și
variabilă dependentă) și Atitudinea pentru Nike, Preferința pentru Nike, Număr de achiziții Nike în
ultimul an (ca și variabile independente). Interpretați rezultatele pe baza întrebărilor prezentate mai jos.

Prin această analiză de regresie liniara multiplă, vom putea răspunde la următoarea întrebare de
cercetare:

Este intentia de achizitie pentru Nike determinată de atitudinea, preferința și numărul de


achiziții precedente ale respondenților acestui eșantion?

Indiciu: Analyze  Regression  Linear

 Alegeți Intentia de achizitie produse Nike ca și variabilă depedentă.


 Alegeți Atitudinea pentru Nike, Preferința pentru Nike, Număr de achiziții Nike în ultimul an ca și
variabile independente.
 Statistics --- selectați Estimates, Model fit
 Continue și OK.

4
Data Analysis in SPSS

Soluții

Model Summary
Model R R Adjusted R Std. Error of
Square Square the Estimate
1 .796a .633 .607 1.153
a. Predictors: (Constant), Număr de achiziții Nike în ultimul an,
Preferința pentru Nike, Atitudinea pentru Nike

1. Ce reprezintă coeficientul R?
 R=R multiplu=coef de corelatie multipla
 In regresia simpla, valoarea inregistrata pentru R multiplu 0,796 indica o corelatie
puternica intre valorile previzionate si valorile observate ale variabilei
dependente(Intentia de achizitie Nike). Prin urmare, aceasta valoare denita cat
de bine modelul estimeaza/previzioneaza datele observate.

2. Ce reprezintă coeficientul R Square?


 R square=coeficientul multiplu de determinare=0,633-63,3%
 Acest coeficient arata cat de puternica este asocierea intr-o regresie multipla
 Rezultatul R2 0,633, poate fi interpretat ca fiind masura in care variantia variabilei
dependente( Intentia de cumparare Nike) este explicate de modelul de regresie
multipla. In cazul nostru, putem afirma ca 63,3% din schimbarea(variatia) in
intentia de achizitie(var. Dependenta) este datorata schimbarii in cele 3 variabile
independente/predictori(nr. De achizitie nike in ultimul an, pref. pt. Nike,
atitudinea pt nike)
 100-R2= restul variatiei care nu este explicata de model(respectiv de cele 3
variabile independente adaugate in model).
 100%-63,3%=36,7%
 Se poate afirma ca sunt si alti factori care explica aceasta variatie, insa modelul
nostru care include 3 predictori, explica aprox. 63,3% din variatie. Acest lucru
indica faptul ca 36,7% din variatie, variabila dependenta nu poate fi explicata
doar de 3 predictori. Prin urmare sunt si alti factori/variabile care ar avea o

5
Data Analysis in SPSS

influenta asupra intentiei de achizitie pentru Nike, din prisma celor 45 de


respondenti din esantion/baza de date.

ANOVAa
Model Sum of df Mean F Sig.
Squares Square
1 Regression 94.118 3 31.373 23.619 .000b
Residual 54.460 41 1.328
Total 148.578 44
a. Dependent Variable: Intentia de achizitie produse Nike
b. Predictors: (Constant), Număr de achiziții Nike în ultimul an, Preferința pentru Nike,
Atitudinea pentru Nike

3. Cum puteți interpreta valoarea lui F, în funcție de nivelul său de semnificație?


 H0:F=0
 Sig.<0,05-respingem H0/ipoteza nula
 Modelul liniei de regresie ofera o estimare mai buna decat daca am folosi media
variabilei dependente Y, respectiv intentia de cumparare Nike.
 Putem concluziona ca acest model de regresie descrie intr-o maniera semnificativa
relatia dintre intentia de achizitie(Y) si cele 3 variabile independente.
 Pe scurt, modelul de regresie prev/estimeaza varibila dependente intr-o maniera
semnificativa.

Coefficientsa
Model Unstandardized Coefficients Standardized t Sig.
Coefficients
B Std. Error Beta
1 (Constant) .406 .574 .707 .484
Atitudinea pentru .406 .144 .419 2.809 .008
Nike(X1)-alfa
Preferința pentru Nike (X2) .491 .184 .398 2.673 .011
Număr de achiziții Nike în .026 .071 .065 .362 .720
ultimul an (X3)
a. Dependent Variable: Intentia de achizitie produse Nike

4. Care este interpretarea coeficientului de semnificație, Sig., pentru variabilele predictor


(variabile independente)?

 Sig.<0,05-bun predictor in cadrul modelului de regresie


 0,008<0,05-predictor semnificativ
 0,011<0,05-predictor semnificativ
 0,720>0.05-predictoe nu este relevant modelului de regresie

 Daca un predictor are un nivel de semnificativ <0,05 atunci variabila


independeta(predictor) estimeaza semnificativ variabila dependent.

6
Data Analysis in SPSS

 Daca un predictor are un nivel de semnificativ >0,05 atunci variabila


independeta(predictor) nu este semnificativ si nu are o contributie.
 Modelul denota ind. Pozitivi, din perspectiva R, R2, testul F si o relevanta a modelului de
regresie, un predictor are un coef. Semnificativ in cadrul analizei. Acest lucru indica
faptul ca variabila Nr. De achizitie nu contribuie in cadrul modelului de regresie.

5. Interpretați coeficienții parțiali de regresie pentru fiecare predictor și coeficienții beta.


 Coef. Atitudinea pt Nike (X1) este 0,406, aceste valori indica faptul ca atunci cand X1
creste cu o unitate, intentia de achizitie pentru Nike(Y) creste cu 0,406. Aceasta
interpretare este adevarata doar daca efectele pentru X2-pref. Nike si X3-nr de achizitie,
sunt mentinute la un nivel constant.
 Coef beta corespunde este 0,419.
 X3- nu este semnificativ-nu ar trebui sa fie interpretat din perspectiva coef. Partial de
regresie si a coef. Beta. Mai mult, val. inreg. de 0,026 este foarte aproape de 0 indicand
faptul ca nu contribuie la modelul de regresie.

6. Care este relația matematică (ecuația) dintre variabila dependentă și cele independente?

Intentia de achizitie=0,406+0,406*Atitudinea(X1)+0,491*Preferinte pentru Nike(X2).

TEMA

Exercițiu 2. Folosind baza de date Nike, dezvoltați o analiză de regresie multiplă bazată pe intenția de
cumpărare a respondenților pentru Nike (ca și variabilă dependentă) și pe Atitudinea pentru Nike și
Preferința pentru Nike (ca și predictori). Interpretați rezultatele pe baza întrebărilor prezentate mai sus.

Model Summary

Model R R Square Adjusted R Square Std. Error of the Estimate

1 ,795a ,632 ,615 1,141

a. Predictors: (Constant), Preferinta pentru Nike, Atitudinea pentru Nike

7
Data Analysis in SPSS

1. Coeficientul R-R multiplu-coeficientul de corelatie multipla, in regresia simpla


valoarea inregistrata pentru R multiplu este de 0,795 ce indica o corelatie puternica
intre valorile previzionate si valorile observate ale variabilelor dependente(Intentia de
achizitionare pentru Nike). Aceasta valoare indica cat de bine modelul estimeaza sau
previzioneaza datele observate.

2.Coeficientul R Square:coeficientul multiplu de determinare=0,632-63,2%-acest


coeficient arata cat de puternica este asocierea intr-o regresie multipla. R2=0,632-
63,2%-poate fi interpretat ca fiind masura in care variatia variabilei
dependetente( Intentia de cumparare Nike) este explicata de modelul de regresie
multipla. 100%-R2=100%-63,2%=36,8%-se poate afirma ca sunt si alti factori care
explica aceasta variatie, insa modelul nostru care include 2 predictori, explica
aproximatic 63,2% din variatie. Acest lucru indica faptul ca 36,8% din variatia variabilei
dependente nu poate fi explicata doar de 2 predictori.
3. interpreta valoarea lui F, în funcție de nivelul său de semnificație

ANOVAa

Model Sum of Squares df Mean Square F Sig.

1 Regression 93,944 2 46,972 36,110 ,000b

Residual 54,634 42 1,301

Total 148,578 44

a. Dependent Variable: Intentia de achizitie produse Nike


b. Predictors: (Constant), Preferinta pentru Nike, Atitudinea pentru Nike

Coefficientsa

8
Data Analysis in SPSS

Standardized
Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) 0,325 0,523 0,621 ,538

Atitudinea pentru Nike


0,001<0.05-
0,436 0,117 0,450 3,711 predictor
semnificativ

Preferinta pentru Nike


0,001<0.05-
0,529 0,150 0,429 3,538 predicor
semnificativ

a. Dependent Variable: Intentia de achizitie produse Nike

S-ar putea să vă placă și