Sunteți pe pagina 1din 7

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS

UNIVERSITATEA ROMANO AMERICANA

Analiza datelor de marketing folosind SPSS

Raluca Modrogeanu Anul I, grupa 2MKA

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS

STATISTICA
Pentru fiecare variabil: numrul de cazuri valide, medie i deviaia standard. Pentru fiecare model de: coeficienii de regresie, matricea de corelaie, parte i corelaiile pariale, multiplu R, R2, R2 ajustat, schimbare n R2, eroarea standard de estimare, masa de analiza-de-variaie, a prezis valori, i reziduuri. De asemenea, intervale de 95%-de ncredere pentru fiecare coeficient de regresie, matricea de variancovarian, coeficient de inflaie variaie, toleran, Durbin-Watson, msurile distan (Mahalanobis, Cook, i valorile de prghie), DfBeta, DfFit, intervale de predicie, i diagnosticare . Terenuri: regresii, terenuri pariale, histograme, parcele i a probabilitii normal.

Regresie liniar
Unul din principalele capitole ale statisticii are n vedere posibilitatea de a face predictii. Desi nu se gasesc relatii perfecte n lumea reala, prin intermediul regresiei se pot face predictii ale unei variabile, n functie de valoarea alteia. Predictia este procesul de estimare a valorii unei variabile cunoscnd valoarea unei alte variabile. Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica ntre doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca am avea o corelatie perfecta (+1 sau 1) estimarea ar fi extrem de precisa.

Exemplu
Este numrul de jocuri ctigate de o echip de baschet ntr-un sezon legat de numrul mediu de puncte scoruri obtinute de echipa pe meci? Regresia indic faptul c aceste variabile sunt liniar legate. Numrul de jocuri ctigate i numrul mediu de puncte marcate de adversar sunt, de asemenea, dependent n mod linear. Aceste variabile au o relaie negativ. Pe msur ce numrul jocurilor ctigate crete, scade numrul mediu de puncte marcate de adversar. Cu ajutorul regresiei liniare, se poate modela relaia dintre aceste variabile. Un model bun poate fi folosit pentru a prezice ct de multe jocuri va ctiga o echipa.

DATE CONSIDERATE REGRESIE LINIARA


DATELE
Cele dependente i independente variabile ar trebui s fie cantitative. Variabilele categoriale, cum ar fi religia, domeniu major de studiu, sau regiunea de reedin, trebuie s fie recodat la binare (inactiv) variabile sau alte tipuri de variabile de contrast. 2

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS

PRESUPUNERI
Pentru fiecare valoare a variabilei independente, distribuia variabilei dependente trebuie s fie normal. Dispersia distribuiei variabilei dependente trebuie s fie constant pentru toate valorile variabilei independente. Relaia dintre variabila dependent i fiecare variabil independent trebuie s fie liniar i toate observaiile ar trebui s fie independente.

Pentru a obine o analiza de regresie liniar:


Aceast caracteristic necesit opiunea de baze statistice. Din meniuri se alege: Analizai> regresie> Linear ... n caseta de dialog regresie liniar, selectai o variabil dependent numeric. Selectai una sau mai multe variabile independente numerice. Opional, avei posibilitatea s: Grupai variabile independente n blocuri i s specificai metode diferite de intrare pentru diferite subgrupuri de variabile. Alegei o variabil de selecie pentru a limita analiza la un subset de cazuri cu o anumit valoare (i) pentru aceast variabil. Selectai o variabil de identificare pentru identificarea punctelor din tabela. Selectai o variabil numerica WLS greutate pentru o analiz a ptratelor. WLS. V permite s obinei un model de ponderat mici ptrate. Puncte de date sunt ponderate cu inversul varianelor lor. Acest lucru nseamn c observaiile cu variaii mari au un impact mai mic asupra analizei de observatii asociate cu variaii mici. n cazul n care valoarea variabilei de ponderare este zero, negativ, sau lipsete, cazul este exclus din analiz.

Opiuni de regresie liniar


Urmtoarele opiuni sunt disponibile: PAS CU PAS CRITERIILE METODEI. Aceste opiuni se aplic atunci cnd, fie metoda avansare, devansare, sau n trepte selecia de variabile a fost specificata. Variabilele pot fi introduse sau eliminate din modelul funcie fie semnificaie (probabilitate) din valoarea F sau valoarea F in sine.

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS UTILIZAREA PROBABILITATII F. O variabil este nscrisa n modelul dac nivelul de semnificaie de valoarea ei F este mai mic dect valoarea de intrare i se ndeprteaz, dac nivelul de semnificaie este mai mare dect valoarea de demontare. Intrarea trebuie s fie mai mic de demontare, iar ambele valori trebuie s fie pozitive. Pentru a introduce mai multe variabile n model, crete valoarea de intrare. Pentru a elimina mai multe variabile din model, se reduce valoarea de eliminare. UTILIZAREA VALORII F . O variabil este nscrisa n modelul dac valoarea F este mai mare dect valoarea de intrare i se ndeprteaz, dac valoarea F este mai mic dect valoarea de demontare. Intrarea trebuie s fie mai mare de demontare, iar ambele valori trebuie s fie pozitive. Pentru a introduce mai multe variabile n model,se reduce valoarea de intrare. Pentru a elimina mai multe variabile din model, crete valoarea de eliminare.

INCLUDEREA CONSTANTEI IN ECUATIE. n mod implicit, modelul de regresie include o constanta. Debifarea acestei opiuni foreaz regresia prin origine, care se face foarte rar. Unele rezultate ale regresiei prin origine nu sunt comparabile cu rezultatele de regresie care nu includ o constant. De exemplu, R2 nu pot fi interpretate n mod obinuit.

VALORILE LIPSA
Exclude cazurile listwise. Numai cazuri cu valori valide pentru toate variabilele sunt incluse in analize. Exclude cazurile pairwise. Cazurile cu datele complete pentru perechea de variabile fiind corelate sunt utilizate pentru a calcula coeficientul de corelaie pe care se bazeaz analiza regresiei. Grade de libertate se bazeaz pe minim perechi N. nlocuire cu medie. Toate cazurile sunt folosite pentru calcul, cu media variabilei substituita pentru observaii lips.

Cu ajutorul acestei regresii vrem s vedem ce influeneaz mai mult salariul current i anume timpul de cnd ne-am angajat sau experiena anterioar.
Descriptive Statistics Mean Current Salary Months since Hire Previous Experience (months) $34,419.57 81.11 95.86 Std. Deviation $17,075.661 10.061 104.586 N 474 474 474

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS

In acest prim tabel observm la Mean cele 3 variabile i valorile lor medii, avnd o deviaie standard cu limite maxime admise precum cele din tabel. N-ul reprezint numrul de persoane i anume 474.
Correlations Current Salary Months since Hire Previous Experience (months) Current Salary Pearson Correlation Months since Hire Previous Experience (months) Current Salary Sig. (1-tailed) Months since Hire Previous Experience (months) Current Salary N Months since Hire Previous Experience (months) 1.000 .084 -.097 . .034 .017 474 474 474 .084 1.000 .003 .034 . .474 474 474 474 -.097 .003 1.000 .017 .474 . 474 474 474

In tabelul Correlations vrem s vedem ce variabli independent are o legtur mai puternic cu cea dependent, ne putem da seama de asta vznd care are valoarea mai apropiat de 1. Observm c experiena anterioar este mai important avnd valoarea .097, fa de .084, deci dac avem o experien anterioar mai vast i n alt companie este mai probabil s avem un salariu mai mare dect dac am lucra de mai mult timp n firma respectiv.
Variables Entered/Removeda Model Variables Entered Variables Removed Method Stepwise (Criteria: Probability-of-F-toPrevious Experience 1 (months) Probability-of-F-toremove >= .100). a. Dependent Variable: Current Salary . enter <= .050,

Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS


1 .097
a

.009

.007

$17,012.353

a. Predictors: (Constant), Previous Experience (months)

R-ul din tabel ne arat de asemenea legtura puternic dintre salariul current i experiena anterioar, avnd valoarea de .097 cum am zis apropiat de 1.
ANOVA Model Regression 1 Residual Total Sum of Squares 1310179340.332 136606316096.008 137916495436.340 df 1 472 473
a

Mean Square 1310179340.332 289420161.220

F 4.527

Sig. .034
b

a. Dependent Variable: Current Salary b. Predictors: (Constant), Previous Experience (months)

Tabelul Anova trebuie s ne spun daca variabila dependent a fost definit semnificativ pe baza celor independente. Observm c pentru experiena anterioar avem valoarea lui F n tabel de 4.527 care ar trebui s fie sub 0.05 pentru a fii semnificativ.

Coefficientsa Model Unstandardized Coefficients Standardized Coefficients B (Constant) 1 Previous Experience (months) a. Dependent Variable: Current Salary -15.913 7.479 -.097 -2.128 .034 -.097 -.097 Std. Error Beta 35945.029 1060.488 Zero-order 33.895 Partial .000 Part t Sig. Correlations

In acest tabel observm din nou contribuia mai mare la model a experienei anterioare, valoarea Beta fiind una mare. T i Sig ne arat impactul asupra variabilei, un t mai mare i un sig ct mai mic duc la un impact mai mare asupra variabilei. Valorile pentru acestea sunt 2.128 respectiv .034, fiind singura variabil acceptat normal creeaz cel mai bun model.
Excluded Variablesa Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance 1 Months since Hire .084b 1.847 .065 .085 1.000

Raluca Modrogeanu Analiza datelor de marketing folosind SPSS


a. Dependent Variable: Current Salary b. Predictors in the Model: (Constant), Previous Experience (months)

Variabila exclus n urma analizei este n mod normal timpul de cnd ne-am angajat, dup cum observm are o valoare Beta mai mica, t-ul este mai mic iar sig mai mare dect n cazul experienei anterioare i ca atare am obinut acest rezultat final.

S-ar putea să vă placă și