Sunteți pe pagina 1din 137

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI

CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 1

www.cristitatu.ro
www.cristitatu.ro
cristitatu@mk.ase.ro
cristitatu@mk.ase.ro
facebook.com/tatuci
www.facebook.com/tatuci
ro.linkedin.com/cristitatu
Scurtă prezentare

Cristian Tatu
Lector Universitar
Doctor in Marketing, MBA, PMP

Absolvent al Facultății de Marketing,


Academia de Studii Economice din
București, promoția 2006.

În Departamentul de Marketing
din 2008 (sala 1406).

Doctorat în Marketing (2011)


MBA uOttawa (2016)
www.cristitatu.ro
Discipline: Analiza informațiilor de marketing,
cristitatu@mk.ase.ro Cercetări de marketing,
0721.227.397 Marketing Intelligence Systems (MIS)
ro.linkedin.com/cristitatu Cybermarketing.
facebook.com/tatuci “It’s hard to beat a person who never gives up!”
Babe Ruth

01
Obiectivele disciplinei

Disciplina urmărește să familiarizeze studenții cu principalele


metode, tehnici și instrumente utilizate în procesul prelucrării,
analizei și interpretării datelor de marketing obținute în urma
cercetărilor de piață.

La sfârșitul semestrului studenții vor fi capabili să:

 creeze baze de date specifice cercetărilor cantitative;


 pregătească datele pentru procesul de analiză;
 codifice răspunsurile deschise;
 investigheze tendința centrală și caracterizarea variației;
 analizeze legătura dintre variabile;
 întocmească un raport de cercetare și să îl prezinte;
 stăpânească aplicația IBM SPSS Statistics.

02
Mituri despre (această) disciplină
 Presupune memorarea și utilizarea formulelor statistice;
 Este nevoie de cunoștințe avansate IT, chiar și ceva programare;
 Disciplina este utilă doar celor care se specializează în cercetări de piață;
 Cele mai multe organizații nu au buget pentru cercetări de piață
 Cercetările de piață pot fi realizate doar cu software specializat și foarte
costisitor pentru organizație;
 Proiectul de semestru este foarte dificil și necesită mult timp;
 Nu se găsesc materiale tip suport de curs/seminar;
 Numărul restanțierilor este foarte mare;
 Cadrele didactice sunt foarte severe;
 Șansele de a face așa ceva la locul de muncă sunt minime;
 Disciplina este imposibilă pentru cei fără studii superioare economice;
 Proiectul de poate găsi pe internet;
 Se poate promova fără punctaj în seminar;
 Ș.(m.)a.
03
Informații generale
Durată curs: 14 săptămâni (pur teoretic)
Suport de curs:
Cercetări de marketing
Iacob Cătoiu (coord)
Editura Uranus, București 2002
Punctaj:
Examen curs: 50 puncte
Studiu de caz: 10 puncte
Test seminar: 20 puncte
Proiect individual de semestru:
Raport de cercetare: 10 puncte
Prezentare raport: 10 puncte
Prezență curs+seminar 0 puncte
TOTAL: 100 puncte

04
Structură curs
S1. 02 octombrie Curs introductiv
S2. 09 octombrie Fundamentele analizei datelor
S3. 16 octombrie Proiectarea cercetărilor cantitative
S4. 23 octombrie Introducerea și codificarea datelor
S5. 30 octombrie Prelucrarea datelor
S6. 06 noiembrie Analiza univariată
S7. 13 noiembrie Analiza bivariată
S8. 20 noiembrie Analiza multivariată
S9. 27 noiembrie Regresia liniară multiplă
S10. 04 decembrie Analiza cluster
S11. 11 decembrie Alte metode statistice utilizare în SPSS
S12. 18 decembrie Conceperea și prezentarea raportului de cercetare
----------->>> VACANȚĂ DE IARNĂ (23 decembrie ‘17 – 7 ianuarie ‘18<<<----------
S13. 08 ianuarie Strategii în alegerea metodelor de analiză
S14. 15 ianuarie Probă de verificare
05
Structură seminar
S1. 02 octombrie Seminar introductiv, stabilire termene, organizare
S2. 09 octombrie Cercetarea de piață ca proces
S3. 16 octombrie Proiectarea chestionarului, tipuri de întrebări
S4. 23 octombrie Măsurarea fenomenelor, tipuri de scale
S5. 30 octombrie Studiu de caz cu predare la sfârșitul orei (echipă de 2)
S6. 06 noiembrie Definirea structurii bazei de date, introducerea datelor
S7. 13 noiembrie Prelucrarea datelor
S8. 20 noiembrie Analiza univariată
S9. 27 noiembrie Analiza bivariată
S10. 04 decembrie Test practic pe calculator în cadrul seminarului
S11. 11 decembrie Regresia liniară multiplă
S12. 18 decembrie Analiza cluster
----------->>> VACANȚĂ DE IARNĂ (23 decembrie ‘17 – 7 ianuarie ‘18<<<----------
S13. 08 ianuarie Utilizarea aplicațiilor Microsoft Office în cercetare
S14. 15 ianuarie Comunicarea rezultatelor, Q&A
06
Bibliografie opțională
Analiza datelor in psihologie. Teorie si practica cu SPSS Statistical analysis with excel for dummies
Popa, D. Joseph Schmuller
Ed. Polirom, 2008 Wiley Publishing Inc., 2010

Introducere in SPSS pentru psihologie Data Analysis and Decision Making with Microsoft
Howitt, D. si Cramer, D. Excel
Ed. Polirom, 2006 Christian Albright
South-Western/Cengage Learning, 2009
SPSS for beginers
Vijay Gupta Statistics for people who (think they) hate statistics :
Ed. VJBooks Inc., 1999 Excel 2007 edition...
Salkind Neil
SPSS for dummies, 2nd edition Thousand Oaks : SAGE, 2010
Arthur Griffith
Wiley Publishing Inc., 2010 Practical And Clear Graduate Statistics In Excel - The
Excel Statistical Master
The SPSS Book: a guide to the statistical package Mark Harmon
for the social sciences Ed. Excel Master Series, 2009
Matthew Zagumny
Writers Club Press, 2001

07
Webgrafie
Manualul IBM SPSS Statistics Tutoriale Youtube
(căutați “IBM SPSS Statistics 22 Documentation”) (căutați “How to Use SPSS Mike’s SAS Tutorials” )

Realizare cercetări online gratuit


(PollDaddy, Survey Nuts, Survey Planet, SurveyMonkey…)

Tutoriale Youtube – using spreedsheets for data analysis


(Microsoft Excel prin modulul Data Analysis, OpenOffice Calc…)

Statistical Analysis Handbook - (c) by Dr M J de Smith


(disponibil gratuit pe http://www.statsref.com)

08
Folosim online.ase.ro pentru …

Încărcarea proiectelor Anunțarea studiilor de caz


Comunicarea punctajelor + feedback Actualizarea calendarului cu activități
Distribuire materiale suport Schimb de mesaje
Încărcarea materialului lucrat în seminar Întrebări și răspunsuri

09
Aplicații utilizate

Microsoft Office IBM SPSS Statistics

10
Aplicații utilizate

Microsoft Office
 Programe utilizate: Excel, Word, Power Point
 Versiuni folosite: 2003 sau mai noi
 Disponibile gratuit pentru studenți la
departamentul rețele sau online

IBM SPSS Statistics


 Cea mai recentă versiune: IBM SPSS Statistics 25
 Versiuni acceptate: SPSS 16 sau mai noi
 Versiunea de evaluare pentru 14 zile este
disponibilă pentru descărcare
 În curând disponibil și pentru studenții ASE cu
valabilitate extinsă de 12 luni în cadrul
IBM Academic Initiative

11
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza datelor de


marketing utilizând SPSS
Titular: lect.univ.dr. Cristi TATU
Lect. Univ. Dr. Cristi TATU MBA

Cursul numărul 2

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
(De ce) sunt necesare cercetările de piață?
• Identificarea clienților potențiali;
• O mai bună înțelegere a actualilor clienți;
• Stabilirea unor ținte realiste/realizabile;
• Dezvoltarea unor strategii de piață eficiente;
• Analiza și rezolvarea unor probleme existente;
• Stabilirea potențialului de dezvoltare a
organizației;
• Identificarea unor noi oportunități de afaceri;
• Susținerea unor planuri/proiecte;
• Supravegherea pieței și anticiparea
schimbărilor majore (previziuni ale evoluției
celor mai importanți indicatori);
• Folosirea datelor recente din piață pentru
îmbunătățirea relației cu partenerii de afaceri;
• Ș.a.
01
Adevărat sau fals?
• Cercetările cantitative de piață sunt costisitoare;
• Realizarea unei cercetări cantitative de piață
durează foarte mult timp;
• În realizarea unei cercetări sunt este implicată
o echipă foarte mare;
• Pentru realizarea unei cercetări cantitative de piață
este nevoie de echipamente și aplicații software foarte scumpe;
• Nu oricine poate realiza o cercetare cantitativă, este nevoie de
serviciile unei firme specializate;
• Cercetările cantitative online nu sunt recomandabile;
• Pentru reprezentativitate este suficient un eșantion mare;
• Operatorii de interviu și PC nu au nevoie de pregătire;
• Rata de răspuns în cazul unei cercetări cantitative este sub 10%;
• Raportul de cercetare are doar rol consultativ.

02
Etapele unei cercetări
Definirea Definirea
Setului de Problemei
Recomandări Decizionale
Alegerea
Elaborarea Instrumentului
Concluziilor de Culegere a
10 1 Datelor
9 Etapele 2
Analiza Realizării Unei Definirea
8 3 Eșantionului
Datelor Cercetări de
7 Piață
4
6 5 Realizarea
Prelucrarea Cercetării
Datelor Pilot
Ajustarea
Colectarea Instrumentului
Datelor și
Metodologiei

03
Problema decizională
• Problema decizională reprezintă situația care
constituie o problemă reală pentru decident sau o
ocazie cu potențial favorabil pe care acesta dorește să
o cunoască mai bine în vederea valorificării;

• Fără o corectă definire a problemei decizionale


obținem cel mai probabil un răspuns corect la o
întrebare greșită;
• Utilizând principiul iceberg-ului 90% din problemă
sunt necunoscute și deseori omise; efectele
(simptomele) înșelătoare ascund de multe ori sursa
unei probleme profunde;
• Un audit de marketing este deseori utilizat atunci când
beneficiarul nu poate furniza suficiente informații
pentru definirea corectă a problemei decizionale:
04
Scopul cercetării
• Scopul cercetării se stabilește în funcție de
problema decizională cu care se confruntă
beneficiarul (ce se dorește să se obțină) și a
tipurilor de decizii care se doresc a fi fundamentate
prin intermediul rezultatelor acesteia;

• Scopul cercetării derivă din problema decizională


așa cum este ea formulată de către
decident/beneficiar;
• În stabilirea scopului se va ține cont întotdeauna
de profilul beneficiarului, informațiile căutate și
modul în care acestea vor fi utilizate ulterior;
• Anterior determinării scopului cercetării este
recomandată parcurgerea datelor disponibile din
surse secundare;
05
Stabilirea obiectivelor
• Utilizând tehnica ”divide et impera” scopul este
împărțit în obiectivele cercetării prin precizarea la
nivel operațional a informațiilor necesare pentru
rezolvarea
problemei decizionale respectiv atingerea scopului;
• Utilizați sistemul SMART în stabilirea obiectivelor
Specific – indivizibilitatea sa în obiective mai
simple (cine, ce, când, unde, care, de ce)
Măsurabil – scala și valorile așteptate
(cât, ce valoare)
Accesibil – să poată fi atins
Relevant – să contribuie la rezolvarea problemei
Temporizat – limita de timp (până când)
• Dacă numărul de obiective este foarte mare (>20) este
recomandabilă divizarea în mai multe cercetări;
06
Ipotezele cercetării
• Ipotezele cercetării sunt estimări pentru obiectivele
stabilite realizate pe baza informațiilor disponibile
anterior demarării cercetării de piață;
• În elaborarea acestora se ține cont de informațiile de
care beneficiarul dispune și de modul în care acesta ar
fi dispus să procedeze pe baza experienței sale;
• Prin confruntarea concluziilor, formulate la sfârșitul
cercetării de piață, cu ipotezele elaborate înaintea
începerii acesteia poate fi evidențiată valoarea
cercetării ca diferența dintre ceea ce beneficiarul ar fi
făcut în lipsa cercetării și în urma acesteia;
• În cazul în care există șanse mari de confirmare
aproape integrală a ipotezelor cercetătorul va extinde
setul de obiective îmbunătățind astfel valoarea
cercetării pentru beneficiar.
07
Surse de informare
• Date secundare: informații relevante pentru tema investigată
publicate pe baza unor date culese anterior de către
organizație (interne) sau de către o altă entitate (externe);

• Date primare: date culese pentru prima dată prin intermediul


unor instrumente de cercetare de către cercetător pentru a
rezolva o problemă decizională specifică a beneficiarului;

• Datorită implicațiilor investigării surselor primare de date o


etapă esențială în procesul proiectării unei cercetări de piață
este investigarea surselor secundare puse la dispoziție de
către beneficiar cât și identificate de către cercetător
• În acest fel este drastic îmbunătățită eficiența instrumentului
de cercetare cu accent pe timpul limitat avut la dispoziție
pentru interogarea respondenților.

08
Surse de informare
Date primare Date secundare

 Actualitate  Cost redus


Avantaje  Personalizare  Disponibilitate instant
 Control  Analiza deja făcută
 Pot genera avantaje  Datele sunt testate
concurențiale

 Cost ridicat  Vechimea datelor


 Consumatoare de  Concurenții au acces
Dezavantaje timp la fel de ușor la ele
 Necesită pregătire de  Greu de verificat
specialitate seriozitatea anchetei
 Pot fi voit eronate
09
Valoarea cercetării
Pentru evaluarea contribuției rezultatelor cercetării la
procesul decizional se va ține cont de:

• Importanța deciziei pentru organizație;


• Gradul de risc și incertitudine în care se va lua decizia;
• Influența rezultatelor cercetării asupra luării deciziei;
• Acuratețe (măsura în care este descrisă corect
realitatea);
• Actualitate (prospețimea informațiilor);
• Suficiență (volum suficient de date pentru adoptarea
deciziei);
• Disponibilitate (existența datelor necesare pe piață);
• Relevanța (pertinența și aplicabilitatea informației
pentru problema decizională prezentată);
• Ș.a.
10
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 3

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Chestionarul este…

• Instrument de culegere a datelor;


• Interfața bi-direcțională dintre
cercetător și respondent;
• Ghid de conversație structurat pentru
operatorul de interviu;
• Standard de culegere și notare a
răspunsurilor;
• Factor care motivează respondentul și
obține cooperarea acestuia;
• Instrument de validare a răspunsurilor
înregistrare;
• Filtru pentru respondenții;
• Sinteza modului în care respondentul
abordează tema investigată;

01
Calitățile unui chestionar bun
• Ordinea logică a întrebărilor (de la general
la specific);
• Limbajul și scalele corespunzătoare
specificului respondenților (acolo unde
este cazul văr fi folosite forme echivalente);
• Echilibru între scalele metrice (mai dificile)
și cele nemetrice;
• Timpul necesar completării sub 10 minute;
• Etichete sugestive pentru variantele
predefinite;
• Existența regulilor de completare acolo
unde este cazul;
• Ușurința și rapiditatea completării;
• Capacitatea de a motiva și atrage interesul
respondenților;
01
Etapele proiectării unui chestionar

 Stabilirea informațiilor dorite (Scop-Obiective-Variabile);


 Segmentarea și definirea respondenților țintă;
 Alegerea modului de obținere a informațiilor (cine, când ,unde, cum);
 Împărțirea variabilelor identificate în critice, importante, opționale și
facultative pentru atingerea scopului și eliminarea variabilelor
redundante;
 Stabilirea formei întrebărilor (tip întrebare, scală), editarea enunțului
și a variantelor de răspuns (unde este cazul);
 Stabilirea unei structuri și ordonarea întrebărilor;
 Pretestarea chestionarului (timp, limbaj, scale, aspect);
 Îmbunătățirea setului de întrebări și finalizarea chestionarului.

01
Structura chestionarului

• Fraza introductivă (scopul cercetării,


modul de utilizare a datelor,
identitatea operatorului și a
organizației pe care o reprezintă,
teaser-ul anchetei)
• Întrebări filtru (acolo unde este cazul);
• Întrebări de
deschidere/motivaționale/de încălzire;
• Întrebări generale/de reamintire pe
subiectul investigat;
• Întrebări specifice;
• Întrebări critice;
• Întrebări socio-demografice/de
identificare și caracterizare;

01
Aspectul chestionarului

 Utilizați cât mai puține coli (o coală A4 față-verso este ideal);


 Utilizați chestionare perforate în mape în locul foilor libere/capsate;
 Exprimarea scurtă, clară, accesibilă este de preferat;
 Evitați structurile tabelare/aspectul tip declarație de venit;
 Urmăriți un aspect aerisit, curat;
 Utilizați fonturi ”prietenoase”, culori, etichete grafice (simboluri);
 Semnalizați câmpurile de răspuns a.î. să fie evidente;
 Apelați la instrucțiuni de completare acolo unde este cazul;
 Evitați situațiile în care respondentul simte că este testat/evaluat;
 Nu abuzați de scalele metrice care consumă respondentul;
 Evitați jargonul sau termenii de specialitate și prescurtările;
 Evitați dubla negație și limbajul ambiguu;
 Nu conduceți către un anumit răspund prin intermediul enunțului;
 Evitați referințele către alte întrebări.

01
Pre-testarea chestionarului

Obiectivele acestei activități sunt:


• Testarea limbajului (ușurința înțelegerii
enunțului și variantelor);
• Testarea ordinii logice a întrebărilor,
fluența parcurgerii;
• Testarea ușurinței de utilizare a scalelor;
• Testarea vitezei de răspuns per total și pe
fiecare întrebare;
• Testarea necesității introducerii unor
întrebări suplimentare sau variante de
răspuns sau a eliminării unora existente;
• Testarea reacției respondenților la fiecare
întrebare (este considerată a fi invazivă,
prea dificilă, ș.a.).

01
Răspuns predefinit sau deschis?
Răspuns deschis Răspuns predefinit
Libertate pt. respondent Ușurință în înregistrarea
Rapiditate răspuns răspunsului
Rată mică de non-răspunsuri Codificare implicită
Avantaje Ușurință în înțelegerea Inexistența răspunsului
enunțului invalid
Simplitate chestionar
Influențare minimă a
respondentului

Timp mult necesar codificării Conducere către un anumit


Rată mare de abatere de la răspuns
Dezavantaje subiectul întrebării Timp mai mult necesar citirii
Număr mare de răspunsuri enunțului
invalide

01
Scale nemetrice
Scala nominală

Care este animalul dvs. preferat? (răspuns unic)


o cal;
o oaie;
o vacă;
o porc;
o Alt animal.

Care sunt animalele dvs. preferate? (răspuns multiplu)


 cal;
 oaie;
 vacă;
 porc;
 găină.
01
Scale nemetrice
Scala ordinală

Ordonați într-un clasament de 5 locuri următoarele animale în


funcție de preferințele dvs.:

Locul 1 Locul 2 Locul 3 Locul 4


Cal o o o o
Oaie o o o o
Vacă o o o o
Găină o o o o

Pe scala ordinală nu avem informații despre cât de


sus este locul I sau care este diferența dintre locul
I și locul II. Cele 4 animale pot fi pe poziții aproximativ
egale sau foarte puternic departajate.
01
Scale metrice
Scala interval/cardinală

Care dintre următoarele animale este preferatul dvs.?


Excelentă Foarte bună Bună Așa și așa Proastă
Cal o o o o o
Oaie o o o o o

Scala proporțională

În trecutul dvs. câte animale din următoarele


specii au aparținut familie din care faceți parte?

Cal ______ Oaie ______


Vacă ______ Găină ______

01
Scale de măsurare
Scale comparative - metoda comparațiilor perechi
(cu sau fără diferență de preț)

Alegeți din fiecare pereche Cât ați fi dispus să plătiți


animalul preferat în suplimentar pentru un kg din
gastronomie: carnea preferată?

Cal o–o Oaie _____ lei


Porc o–o Cal _____ lei
Oaie o–o Porc _____ lei
Vită o–o Oaie _____ lei
Porc o–o Vită _____ lei
Vită o–o Cal _____ lei
Scale de măsurare
Scale comparative - scala cu sumă constantă
(cu sau fără preț/pondere estimativă)

Împărțiți 100 de puncte Dacă bugetul săptămânal pentru carne


între următoarele este de 200 lei împărțiți suma pe
animale: următoarele categorii?

Cal _____ puncte Cal (35lei/kg) _____ lei


Porc _____ puncte Porc (20lei/kg) _____ lei
Oaie _____ puncte Oaie (30lei/kg) _____ lei
Vită _____ puncte Vită (35lei/kg) _____ lei
Pui (15lei/kg) _____ lei
Scale de măsurare
Scale noncomparative - scale liniare continue
Este posibil ca în ultimele 6 luni să fi mâncat carne de cal.
Ce părere aveți despre acest sortiment?
Favorabilă Nefavorabilă

0 10 20 30 40 50 60 70 80 90 100

Scale noncomparative - scale liniare etichetate


Foarte Favorabilă Oarecum Nici Oarecum Nefavorabilă Foarte
favorabilă favorabilă nici nefavorabilă nefavorabilă
Scale de măsurare
Scale non-comparative - scala semantică
Este posibil ca în ultimele 6 luni să fi mâncat carne de cal.
Ce părere aveți despre acest sortiment?

Nefavorabilă
Favorabilă

Foarte Destul Ușor Nici-nici Ușor Destul de Foarte


Fav. de Fav. Fav. Nefav. Nefav. Nefav.

Scale non-comparative – diferențiala semantică


Este posibil ca în ultimele 6 luni să fi mâncat carne de cal.
Ce părere aveți despre acest sortiment?

Favorabilă Nefavorabilă
Scale de măsurare
Scale non-comparative - scala lui Likert
Acord Acord Nici/ Dezacord Dezacord
total nici total
Mezelurile conțin carne de cal
Carnea de cal este bună
Calul nu este comestibil

Scale non-comparative – scala lui Stapel


Este posibil ca în ultimele 6 luni să fi mâncat carne de cal.
Ce părere aveți despre acest sortiment?

Favorabilă Nefavorabilă
-5 -4 -3 -2 -1 +1 +2 +3 +4 +5
Scale cu etichete personalizate
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelor datelorde de
marketing
marketingutilizândutilizândSPSS SPSS
Lect. Univ. Dr. CristiCristi
Titular: lect.univ.dr. TATU
TATU MBA PMP

Cursul numărul 4

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Cum definim greșit structura BD?
În definirea unei baze de date cele mai des întâlnite greșeli sunt:
 Introducerea datelor într-o bază de date neformatată sau o foaie de calcul
tabelar fără cap de tabel;
 Codificarea variantelor de răspuns folosind litere (a,b,c…);
 Introducerea datelor în formă necodificată urmând ca apoi să fie utilizată
funcția search&replace (motivul: din coduri nu se înțelege nimic);
 Codificarea variantelor de răspuns începând cu valoarea 0 (zero);
 Codificarea întrebărilor ”cu răspuns predefinit multiplu” într-o singură
variabilă;
 Definirea tuturor variabilelor într-un format
numeric sau șir de caractere generos care să
poată înmagazina orice cantitate de date;
 Definirea tuturor variabilelor de
tip șir de caractere;
 Utilizarea tipurilor de date
specifice doar anumitor aplicații.
01
Cum greșim la introducerea datelor?

Odată definită structura bazei de date nu de puține ori apar erori în


introducerea chestionarelor completate în baza de date cum ar fi:
 Lipsa introducerii unui cod care să facă diferența dintre un câmp gol,
un non-răspuns sau un răspuns imposibil de utilizat;
 Corectarea răspunsurilor considerate necorespunzătoare, care nu se
încadrează în tiparul așteptat;
 Codificarea la introducere a răspunsurilor deschise/de completare;
 Ajustarea scalelor metrice completate greșit (ex: scala cu sumă
constantă cu suma diferită de 100 de puncte);
 Completarea de către operator a non-răspunsurilor;
 Înlocuirea unui răspuns deschis de completare cu alegerea unei
variante predefinite dacă par a fi similare;
 Anularea răspunsurilor ce par greșite (ex: o extremă de scală) și
introducerea acestora ca non-răspuns;

02
De la chestionar la baza de date

Pentru a putea fi analizate, răspunsurile primite de la respondenți vor fi


stocate într-o bază de date digitală a cu următoarele proprietăți:
 Structura bazei de date va reflecta întrebările din chestionar; în cazul
unei cercetări online răspunsurile sunt înregistrare direct într-o bază
de date cu structura corespunzătoare gata codificate;
 Baza de date va permite înregistrarea completă și corectă a
informației din chestionar fără a fi nevoie de prelucrarea acesteia;
 Răspunsurile vor fi introduse în baza de date exact ca în chestionar,
fără ”corecturi”, ”îmbunătățiri” sau alte modificări;
 Se va alege un format de bază de date universal, recunoscut de cât
mai multe aplicații (csv, xls, dbf, ș.a.);
 Valoarea de pornire a câmpurilor va fi ”NULL” (evitați ”0”) ;
 Baza de date va avea un câmp index (automat) unic;
 Baza de date va primi răspunsurile în format codificat.

03
Principiile bazelor de date
 Baza de date este formată din:
• Setul de variabile care definesc structura bazei de date (coloane);
• Înregistrările/cazurile ce conțin totalitatea răspunsurilor primite de
la fiecare respondent în parte printr-un anumit chestionar (linii);
 Când se dorește modificarea bazei de date se va realiza întotdeauna o
copie de siguranță a acesteia;
 Variabilele native (care stochează răspunsurile neprelucrate nu vor fi
niciodată suprascrise/editate/modificate;
 Pe fiecare chestionar introdus în baza de date se va nota numărul unic
de înregistrare/ordine din baza (indexul automat);
 Răspunsul întrebărilor cu variante predefinite vor fi introduse sub
formă codificată (șirul de caractere substituit cu valoare numerică
unică);
 Numele fiecărei variabile va fi ales astfel încât să faciliteze identificarea
întrebării aferente în chestionar (ex: Q1).
04
SPSS – înregistrări în baza de date

05
SPSS – structura bazei de date

06
Codificarea răspunsurilor
1. Întrebările cu variantă predefinită de răspuns
(răspuns unic) I1. Animal preferat:
 Variantele de răspuns vor primi coduri începând o Câine; 1
cu valoarea ”1” pentru primul răspuns din set o Pisică; 2
(seturi fără ordonare) sau pentru cel mai mic o Vulpe; 3
răspuns (seturi interval sau în succesiune logică); o Cal. 4
 Valoarea ”0” va fi evitată, aceasta reprezintă
originea în cadrul scalelor metrice proporționale; I2. Vârstă:
 Marcarea întrebărilor care au fost o Sub 18 ani; 1
evitate/refuzate de către respondent se va face o 18-25 ani; 2
folosind codul 99; o 26-35 ani; 3
 Răspunsurile eronate, imposibil de descifrat sau o Peste 35 ani. 4
confuze vor fi marcate utilizând codul 95;
 Sub nicio formă nu for fi introduse alte coduri
decât cele convenite sau șiruri de caractere.
07
Codificarea răspunsurilor
2. Întrebările cu răspuns deschis numeric
I3. Vârstă în ani
 Răspunsurile primite la acest tip de întrebări
împliniți:
sunt introduse în baza de date exact așa cum
……………….
apar în chestionar;
 În cazul în care din neglijența operatorului,
I4. Acordați o
greșeala respondentului sau neincluderea
notă de la 1 la
filtrelor numerice în chestionarul virtual
10 pentru
răspunsurile includ altceva decât o singură
produsul X:
valoare numerică acestea vor fi corectate;
……………….
 Dacă răspunsul nu poate fi corectat (ex: vârsta
sub formă de interval sau expresii fără caracter
I5. Numărul
metric) întrebarea va fi tratată drept non-
copiilor minori
răspuns;
din familie:
…………………

08
Codificarea răspunsurilor
3. Întrebările cu răspuns deschis alfa-numeric
I6. Animalul
- Pasul 1: se identifică toate variantele unice de
preferat:
răspuns prin parcurgerea bazei de date pe
……………..
variabila selectată și se alocă coduri unice
(atenție la duplicate absolute sau relative);
I7. Prenumele
- Pasul 2: se cuantifică apariția fiecărei variante
dumneavoastră:
unice identificate în formă identică sau foarte
……………….
asemănătoare;
- Pasul 3: se creează o nouă variabilă (!!!) care va
I8. Culoarea
stoca răspunsurile în formă codificată;
preferată
- Pasul 4: în variabila nou creată vor fi introduse
o verde
codurile aferente răspunsurilor unice
o roșu
identificate; pentru câmpurile text de
o albastru
completare (vezi întrebarea cu răspuns unic) va fi
o altă culoare
completat setul inițial de variante predefinite.
……………..
09
Codificarea răspunsurilor
4. Bateriile de întrebări cu răspunsuri dihotomice
I9. Animalele
(întrebări cu răspuns predefinit multiplu)
preferate:
 Câine;
 Aceste întrebări sunt doar o formă particulară de
 Pisică;
formatare a întrebărilor dihotomice (răspuns
 Cal;
unic din 2 variante posibile);
 Papagal.
 Fiecărei valori din setul predefinit îi va
corespunde o variabilă distinctă care primește
I10. Este câinele
codul 1 când câmpul este bifat și 2 când nu este
unul dintre
bifat (valoarea predefinită a bazei de date este
animalele dvs.
”NULL”);
preferate?
 Se aplică regulile aferente întrebărilor cu răspuns
o Da; 1
predefinit unic.
o Nu. 2

10
Codificarea răspunsurilor
5. Bateriile de întrebări cu răspunsuri multihotomice (scale Likert, ș.a.)
 Aceste întrebări sunt doar o formă particulară de formatare a
întrebărilor cu răspuns predefinit unic care au un enunț similar sau
identic;
 Fiecărui element investigat îi corespunde o variabilă distinctă;
 Se aplică individual regulile specifice întrebărilor cu răspuns predefinit
unic;
I11. Cât de mult vă plac următoarele animale I12. Cât de mult vă
plac câinii?
Foarte Mult Nici/nici Puțin Foarte
mult puțin o Foarte puțin; 1
Câine o o o o o o Puțin; 2
Pisică o o o o o o Nici/nici; 3
Cal o o o o o o Mult; 4
Papagal o o o o o o Foarte mult. 5
11
Codificarea răspunsurilor
6. Bateriile de întrebări cu deschise I13. Împărțiți 100
de puncte între
 Aceste întrebări sunt doar o formă următoarele
particulară de formatare a întrebărilor cu animale:
răspuns deschis ce au un enunț comun; Câine ……..
 Fiecărui câmp de completare îi va Pisică ……..
corespunde o variabilă distinctă; Cal ……..
 Se aplică regulile specifice tipului de Papagal ……..
întrebare cu răspuns deschis aferent.
I14. Enumerați 3
culori care vă plac:
a) ………………..
b) ………………..
c) ………………..

12
Variabilele native și cele artificiale

 Variabila nativă corespunde unei întrebări existente în chestionar și


memorează răspunsul primit de la respondent fără nicio modificare;
 Aceste variabile primesc coduri care să reflecte întrebarea sau bateria
de întrebări din care fac parte (ex: Q1, Q4_1, Q4_2, Q6_text);
 Variabilele native nu se modifică, nu se suprascriu, nu se șterg;
 Variabila artificială este creată de către cercetător pentru a memora
date ce nu se regăsesc în chestionar cum ar fi:
• Forme prelucrate ale variabilelor native (unități de măsură
schimbare, scale modificare, ș.a.);
• Scoruri multi-variabilă (scor de performanță, medii ponderate
pentru scala lui Likert, ș.a.);
• Numărul/codul unic de identificare a chestionarului fizic;
• încadrarea înregistrării într-o anumită categorie;
• Diverse observații cu privire la acea înregistrare (cod operator
interviu, cod operator PC, constatări, ș.a.).
13
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 5

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Prelucrarea datelor. De ce?

 Respondenții nu sunt întotdeauna serioși/motivați;


 Operatorii de interviu pot nota greșit răspunsurile;
 Cei care introduc datele în sistemul informatic sunt și ei oameni;
 Chestionarul este optimizat pentru viteza completării;
 Întotdeauna va fi utilizat sistemul de măsură cunoscut respondentului;
 Unele modele de analiză a datelor solicită anumite scale;
 Uneori precizia scalelor proporțională nu este necesară;
 Dacă testarea prototipului chestionarului a fost omisă sau incorect
realizată;
 Utilizarea unei aplicații intermediare pentru colectarea/digitalizarea
datelor poate oferi surprize;
 Beneficiarul cercetării poate solicita baza de date într-un anumit format
specific.

01
Prelucrarea datelor-ce facem mai exact

• Concatenarea și divizarea bazei de date;


• Eliminarea înregistrărilor necorespunzătoare;
• Identificarea și eliminarea înregistrărilor duble;
• Eliminarea variantelor de răspuns cu frecvență zero;
• Sortarea bazei de date, definirea variabilei unice de
indexare;
• Identificarea și corectarea răspunsurilor incorecte;
• Marcarea non-răspunsurilor;
• Utilizarea generatoarelor numerice automate;
• Schimbarea unității de măsură;
• Calcularea unui scor ponderat multi-variabilă;
• Transformare din scală metrică în scală nemetrică;
• Transformare din scală proporțională în scală interval;
• Schimbarea codificării răspunsurilor;

02
Concatenarea/divizarea B.D.

Cel mai frecvent bazele de date provenite de la operatori diferiți sunt


concatenate prin adăugarea de variabile, în acest caz structura acestora
este identică.

În cazul cercetărilor longitudinale pe eșantion constant concatenarea


bazelor de date se face prin adăugarea de variabile, în acest caz
componența eșantionului este aproximativ identică.

Divizarea bazei de date se face atunci când se dorește:


 Oferirea unor mostre cu un număr finit aleatoriu de înregistrări sau
variabile;
 Selectarea înregistrărilor care corespund unui anumit filtru;
 Izolarea unui anumit set de variabile din baza de date;
 Pentru expedierea spre codificare a variabilelor alfanumerice.

03
Eliminarea înreg. necorespunzătoare

O anumită înregistrare este declarată necorespunzătoare și eliminată din


baza de date atunci când:
 Datele socio-demografice nu corespund profilului convenit al
respondenților;
 O mare parte a întrebărilor din chestionar sunt non-răspunsuri;
 Condițiile de selecție (filtrul) nu au fost respectate;
 Respondentul a abandonat interviul indiferent de motiv;
 Răspunsurile înregistrate sunt contradictorii (variabilele cu investigare
multiplă oferă rezultate contrastante);
 Întrebările aferente variabilelor critice figurează ca non-răspunsuri;
 Se observă o predilecție a răspunsurilor pentru o anumită extremă a
scalelor de măsurare.

04
Eliminarea înregistrărilor duble

Este posibil ca un chestionar să fie introdus de două ori însă acest lucru
este foarte puțin probabil. Înregistrările duble sunt rareori identice.

O înregistrare poate fi considerată dublă dacă:


 Datele de identificare ale respondentului sunt identice (nume,
prenume, ș.a.);
 Mai mult de 80% dintre răspunsuri sunt identice;
 Răspunsurile întrebărilor deschise sunt identice;
 Datele unice prin definiție sunt identice (numărul de telefon, adresa de
email);
 Există succesiuni mai mari de 30 variabile cu răspuns identic.

05
Eliminarea variantelor cu frecventă 0

De cele mai multe ori existența variantelor de răspuns cu frecvență zero


reprezintă o consecință a inexistenței unei cercetări instrumentale precum
și a lipsei unei cercetări exploratorii anterior conceperii acestuia.

Variantele de răspuns din seturile predefinite cu frecvență de răspuns zero


sunt eliminate din codificarea bazei de date ulterior finalizării introducerii
tuturor chestionarelor.

În urma eliminării acestora codurile celorlalte variante din set rămân


neschimbate (sub nicio formă nu vor fi ajustate prin alunecare).

Păstrarea acestora în baza de date generează efecte estetice neplăcute în


raportul de cercetare precum și încărcarea inutilă a structurilor tabelare și
formelor de exprimare grafică.

06
Sortarea bazei de date

O condiție esențială pentru buna funcționare a unei baze de date este


existența unei variabile index, care să conțină, pentru fiecare înregistrare,
o valoare (preferabil numerică) unică.

Cel mai des aceasta va lua forma unui contor de introducere în baza de
date care va fi trecut și pe chestionarele fizice (acolo unde este cazul).

Orice bază de date va avea înregistrările sortate, cel puțin în primă fază, pe
baza variabilei index, aceasta fiind varianta de referință pentru ordinea
înregistrărilor.

Sortarea înregistrărilor nu afectează rezultatele procesării ulterioare a


variabilelor sau cele ale analizei datelor.

07
Corectarea răspunsurilor incorecte

Nu toate răspunsurile incorecte pot fi recuperate. De cele mai multe ori


unica soluție este marcarea acestora ca non-răspuns.

Cele mai des întâlnite situații se încadrează în următoarele cazuri:


 Răspunsul aferent câmpului deschis text nu se încadrează în enunț;
 Scalele metrice de tipul scalei cu sumă constantă nu respectă pragurile
convenite (în acest caz suma variantelor nu este 100);
 Valorile oferite nu au sens în unitatea de măsură solicitată;
 Răspunsurile sunt evazive, confuze sau contradictorii;
 Răspunsurile sunt incomplete (ex: 2 elemente din 3 solicitate);
 Sunt selectate mai multe variante din setul cu răspuns predefinit unic;
 Sunt poziționate mai multe elemente pe același loc (metoda ordonării
rangurilor);
 Este adăugată o variantă suplimentară fără ca aceasta să fie solicitată.

08
Marcarea non-răspunsurilor

Non-răspunsul primește prin convenție o valoare numerică unică valabilă


pentru toate variabilele din baza de date. Această valoare este astfel
selectată încât să nu poată corespunde unei variante de răspuns valide (de
exemplu codul 99 pentru non-răspuns și codul 95 pentru nu știu/răspuns
incorect).

Non-răspunsul este reprezentat de manifestarea voinței respondentului


(refuzul completării) sau lipsa unui răspuns în cazul întrebărilor/
variabilelor cu răspuns predefinit unic sau răspuns deschis exclusiv.

Varianta nu știu sau înregistrarea incorectă a răspunsului reprezintă un


viciu de procedură sau o problemă în proiectarea corespunzătoare a
chestionarului.

09
Scorul multi-variabilă și u.m.

SPSS permite transformarea unei variabile existente sau conceperea unei


noi variabile pe baza unei formule matematice care poate conține una sau
mai multe variabile existente, ponderi, funcții aritmetice, ș.a.

Procesarea se face înregistrare cu înregistrare, respectiv pentru fiecare caz


în parte variabila țintă va primi valoarea calculată pe baza formulei
definite.

Cu ajutorul acestei funcții poate fi modificat conținutul unei variabile doar


pe baza unei formule de calcul (ex: schimbarea unității de măsură).

Este recomandat ca fiecare procesare să fie memorată într-o variabilă


nouă, evitând suprascrierea variabilelor existente.

10
Schimbarea codificării variabilelor

Uneori este necesară modificarea codificării variantelor predefinite de


răspuns iar simpla schimbare a acestora din structura bazei de date nu este
suficientă.

Din structura bazei de date putem modifica doar etichetele alocate


codurilor aferente variantelor de răspuns.

SPSS oferă posibilitatea înlocuirii codurilor aferente variantelor de răspuns


cod vechi-cod nou pentru fiecare înregistrare fără erorile specifice utilizării
mecanismului clasic search&replace specific foilor de calcul tabelar.

De asemenea este posibilă în acest proces eliminarea codurilor cu


frecvență de răspuns zero precum și concatenarea a două sau mai multe
coduri vechi într-un singur cod nou.

11
Scală metrică -> scală nemetrică

Atunci când precizia specifică scalelor metrice nu este necesară, când


modelul de analiză solicită scala nominală sau transformarea face ca
raportarea să fie mai aproape de cerințele beneficiarului este posibilă
transformarea scalei proporționale în orice tip de scală inferioară.

SPSS permite înlocuirea răspunsurilor aflate într-un anumit interval


numeric cu un cod unic (ex: de la minim la 35 codul 1, 35-55 codul 2 și 55-
maxim codul 3 aferente etichetelor tânăr, matur și bătrân).

Uneori răspunsurile primite pe scala proporțională sunt inutilizabile în


această formă datorită concentrării excesive sau a distribuției uniforme iar
transformarea într-o scală inferioară reprezintă unica soluție de recuperare
a variabilei.

12
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 6

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Analiza datelor

Analiza datelor reprezintă un proces complex și sistematic de aplicare a


tehnicilor statistico-matematice, în scopul extragerii din baza de date
constituită a tuturor informațiilor necesare procesului decizional.

Metodele de analiză pot fi grupate după:


 Tipul de scală utilizat (nominal, ordinal, interval, proporțional);
 Numărul eșantioanelor cercetate (unul sau mai multe);
 Natura relațiilor dintre eșantioanele cercetate(dependente sau nu);
 Numărul variabilelor considerate o dată (una, două sau mai multe);
 Ș.a.
01
Analiza datelor

Obiectivele procesului de analiză a datelor includ fără a se limita la :


 Determinarea tendinței centrale;
 Caracterizarea variației;
 Măsurarea gradului de asociere;
 Realizarea unor estimări și previziuni;
 Evaluarea diferențelor dintre variabile/grupuri de variabile;
 Evidențierea legăturilor cauzale dintre variabile;
 Ș.a.

02
Tendința centrală

Tipuri de scale Valoarea Mediana Media Media


modală aritmetica geometrică
Nominală x - - -
Ordinală x x - -
Interval x x x -
Proporțională* x x x x

*foarte rar utilizată în cercetările de marketing

03
Tendința centrală

Valoarea modală reprezintă cea mai mare frecvență înregistrată (varianta


de răspuns cea mai populară). Există posibilitatea înregistrării aceleiași
frecvențe maxime pentru 2 sau mai multe variante de răspuns.

În cazul variabilelor măsurate pe scală metrică proporțională numărul


foarte mare de variante unice de răspuns poate genera o valoare modală cu
o distribuție de frecvențe relativă subunitară (sub 1%). Tot în acest caz
frecvența maximă se poate înregistra pe un număr foarte mare de variante
de răspuns.

04
Tendința centrală

Mediana reprezintă valoarea deasupra și dedesubtul căreia se situează


aproximativ 50% dintre respondenți (cazurile observate). Determinarea
poziției medianei este îngreunată în cazul întrebărilor cu un număr mic de
variante predefinite de răspuns.

Similar pot fi determinate percentilele care împart numărul de observații


(respondenți alocați pe varianta unică de răspuns în:
 4 (quartile);
 10 (decile);
 100 (centile);
 Alte variante particulare definite de utilizator.

05
Tendința centrală

Media aritmetică reprezintă indicatorul calculat prin raportul dintre suma


valorilor înregistrate și numărul de observații din eșantionul investigat.
Acest indicator este specific scalelor metrice.

În cazul scalelor ponderate (likert, diferențiala semantică) numărul de


observații înregistrate este ponderat (1 - 7 pentru diferențiala semantică,
-2 - +2 pentru scala lui Likert, ș.a.).

În cazul scalelor interval numărul observațiilor va fi ponderat cu mijlocul


intervalului.
06
Caracterizarea variației
Tipuri de scale Nominala Ordinală Interval Proporțională
Distribuția de x x x x
frecvențe*
Percentile - x x x
Amplitudinea - x x x
variației
Abaterea medie - - x x
Varianța - - x x
Abaterea - - x x
Standard

* Distribuția de frecvențe poate fi exprimată în formă absolută (număr respondenți) sau relativă (procente din total
eșantion/răspunsuri valide).

07
Caracterizarea variației
Distribuția de frecvențe reflectă fiecare variantă unică de răspuns
înregistrată și numărul de respondenți/observații pentru fiecare variantă
de răspuns în parte în formă:
 Absolută (număr de respondenți);
 Relativă (număr respondenți raportat la total eșantion și/sau total
răspunsuri valide pentru variabila respectivă);
 Relativă cumulată (suma tuturor răspunsurilor de la prima variantă de
răspuns până la varianta în caz).

Este foarte dificila de folosit pentru scalele metrice proporționale, când


numărul de variante unice de răspuns este foarte mare.

08
Caracterizarea variației
Amplitudinea variației reflectă diferența dintre observația cu valoarea cea
mai mare și observația cu valoarea cea mai mică (amplitudine absolută
Maxim-Minim) sau raportul dintre amplitudinea absolută și media
aritmetică (amplitudine relativă).

Abaterea medie este calculată prin media aritmetică a diferenței dintre


fiecare observație în parte și media aritmetică a tuturor observațiilor.

Varianță reprezintă media aritmetică a pătratelor abaterilor individuale de


la media calculată. Prin calcularea radicalului pozitiv din varianță obținem
abaterea standard.
Amplitudinea variației
Abatere individuală

0 X min X mediu Xi X MAX


09
Măsurarea gradului de asociere
Analiza bivariată presupune măsurarea gradului de asociere a două
variabile sub aspectul:
 Direcției (naturii): legătură directă sau indirectă;
 Intensității: legătură inexistentă, slabă, medie, puternică, perfectă;
 Semnificației statistice: reprezentativă, nereprezentativă (confirmarea
sau infirmarea existenței unei legături).

În funcție de scală utilizată pentru măsurarea celor două variabile folosim


următoarele metode:
1. Variabile nominale: tabele de contingență, coeficientul de corelație r
phi, testul neparametric hi pătrat/testul probabilității exacte a lui
Fisher, coeficientul de contingență;
2. Variabile ordinale: coeficientul lui Spearman, coeficientul Z al
semnificației legăturii, coeficientul lui Goodman și Krusdal;
3. Variabile metrice: coeficientul r al lui Pearson (coeficientul de
corelație), coeficientul Z.
10
Măsurarea gradului de asociere
Coeficientul de corelație returnează valori cuprinse în intervalul (+1) – (-1) *
și indică:
1. Direcția legăturii
 Legătură directă: valori pozitive
 Legătură inversă: valori negative
2. Intensitatea legăturii**
 Legătură foarte slabă***: 0,00<=||<=0,20
 Legătură slabă: 0,21<=||<=0,40
 Legătură medie: 0,41<=||<=0,60
 Legătură puternică: 0,61<=||<=0,80
 Legătură foarte puternică****: 0,81<=||<=1,00

* valorile +1, -1 și 0 nu vor fi observate, acestea sunt doar repere;


** indicatorul este afectat de legea numerelor mari (număr mare de observări);
*** legătura poate fi pur accidentală;
**** valoare ce poate fi semnul unei alegeri sau formulări greșite a variabilelor;

11
Posibile probleme
Alegerea perechilor de variabile în vederea analizei gradului de asociere se
va avea în vedere ca:
 Variabilele selectate să nu reprezinte forme diferite de exprimare a
aceluiași fenomen;
 Să nu existe o a treia variabilă care să le influențeze puternic pe
amândouă;
 Variabilele selectate să fie indivizibile;
 Cele două variabile să fie exprimate la nivel operațional foarte clar (să
nu existe erori în măsurare;
 Să existe un număr suficient de mare de cazuri valide înregistrate;
 Datele să nu prezinte grad de concentrare ridicat;
 Variabilele să aibă un număr relativ mare de variante unice de răspuns
cu frecvență relativă supraunitară;
 Variabilele sunt măsurate pe aceiași scală (nativ sau prin conversie la
tipul inferior ca precizie de măsurare).

12
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 7

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Analiza multivariată a datelor

Analiza multivariată a datelor presupune utilizarea unui grup de metode


statistico-matematice cu ajutorul cărora pot fi cercetare simultan legăturile
de asociere existente între trei sau mai multe variabile.

Alegerea metodei corespunzătoare dintre multitudinea de opțiuni


disponibile se va face ținând cont de:
 Natura legăturilor dintre variabile (cauzale sau de asociere);
 Numărul de variabile dependente (pentru relațiile de dependență);
 Capacitatea de măsurare a scalei (metrică sau nemetrică).

01
Analiza multivariată a datelor
Legături cauzale Legături de asociere
(studierea dependențelor) (studierea interdependențelor)
O variabilă Mai multe variabile
dependentă dependente
Măsurată Măsurată Măsurate Măsurate Măsurate în Măsurate în
în în în în scală nemetrică scală metrică
scală scală scală scală
nemetrică metrică nemetrică metrică
Analiza discriminantului liniar

Analiza structurilor latente


Analiza multivariată

Scalarea nemetrică
multidimensională

multidimensională
Analiza grupurilor
Regresia multiplă

Analiza factorială
Analiza canonică

Scalarea metrică
a variației
multiplu

02
Regresia multiplă
Regresia liniară explică și previzionează variația variabilei dependente în
funcție de covarianța ei cu două sau mai multe variabile independente.
Permite definirea unei funcții de minimizare a diferenței dintre valorile reale
și cele estimate ale variabilei dependente.
Variabilele independente vor fi introduse în model în trepte (în funcție de
capacitatea lor de a explica variabila dependentă) sau simultan.
Estimarea parametrilor fiecărui factor este realizată cu ajutorul metodei
celor mai mici pătrate pentru un număr mai mare de trei parametri.

Vol.Vânzări = 182,45 + 51,21 * Nr.Pers.V + 19,45 * Sup.Mag – 15,21 * Nr.Conc


const. pv1 vi1 pv2 vi2 pv2 vi3

03
Analiza discriminantului liniar multiplu
Estimează relația dintre o variabilă dependentă di sau multi-hotomică și mai
multe variabile independente metrice (ale cărei stări se cunosc la început).
Urmărește delimitarea stărilor variabilei dependente a.î. să fie cât mai
omogene în interior și cât mai eterogene una față de celelalte și permite:
 Definirea contribuția fiecărei variabile explicative la delimitarea stărilor;
 Identificarea celor mai bune combinații de variabile explicative pentru
definirea fiecărei stări în parte;
 Stabilirea de proceduri pentru repartizarea componentelor noi care nu au
făcut parte din eșantionul inițial;
 Identificarea existenței unor diferențe semnificative între profilul stărilor
stabilite/convenite inițial;
 Conceperea de hărți perceptuale.

04
Analiza Canonică
Studiază legătura liniară dintre un grup de variabile dependente și unul de
variabile independente ambele măsurate pe scale metrice sau nemetrice
determinând:
 direcția intensitatea și semnificația corelației dintre cele 2 grupuri;
 Identificarea combinațiilor liniare care maximizează corelația între seturi:
 Explicarea și previzionarea variației setului de variabile dependente;
 Contribuția relativă a fiecărei variabile independente la asocierea grupurilor

Numărul maxim al funcțiilor canonice este egal cu cel al variabilelor din grupul
cel mai mic.

Analiza canonică sintetizează un număr foarte mare de corelații.

05
Analiza multivariată a variației
Cuprinde un set de metode aparținând statisticii inferențiale/deductive
(proiectări factoriale, pătrate latine, pătrate greco-latine) ce permit analiza
efectelor variației mai multor variabile independente (factori) asupra
variabilelor dependente, ambele măsurate în scală metrică.

06
Analiza factorială
Cuprinde un set de metode statistice multivariate (metoda componentelor
principale, criteriul varimax, criteriul quartimax, metoda rotației exelor) care
urmăresc investigarea legăturilor de interdependență dintre mai multe
variabile care sunt caracteristice unui anumit fenomen prin crearea unui
nucleu de factori.

Pe principiul divid-et-impera metoda urmărește:


- identificarea factori de influență latenți aflați în format simplu sau compus
(analiza factorială de tip R);
- Combinarea/condensarea componentelor (analiza factorială de tip Q);
- Identificarea variabilelor inițiale care conțin setul restrâns de factori unici;
- Analiza acestora prin regresie, corelație sau discriminant liniar multiplu.

07
Analiza grupurilor
Grup de metode statistice multivariate de clasificare a componentelor unei
mulțimi eterogene în grupuri omogene pe baza unui anumit criteriu. Anterior
se folosește analiza factorială pentru reducerea numărului de factori.

Metoda excelează în domeniul segmentării pieței

Grupurile sunt realizate prin


1. Divizarea mulțimii inițiale în grupuri omogene;
2. Identificarea componentelor cu specificitate puternică din mulțime și
adăugarea succesivă de componente adiționale la acestea pe baza criteriului
stabilit;
3. Prin procedee de ierarhizare (rețea de tip arboreșcent);
4. În mod reticular (rețea de factori interconectați de tip neuronal).

08
Scalarea multidimensională
Proces care reprezintă fenomenele analizate sub forma unor puncte într-un
spațiu multidimensional ale cărui dimensiuni sunt interpretare ca atribute
utilizate în diferențierea acestor fenomene.

Prelucrează date cu privire la modul în care respondneții percep asemănările și


deosebirile dintre elementele investigate (obiecte, fenomene, ș.a.) prin
intermediul unor algoritmi specializați (TORSCA, INDSCAL, M-D-SCAL)
construind un spațiu perceptual în care vor fi proiectate elementele investigate
conform percepției respondenților.

În funcție de tipul de scală în care sunt reprezentate variabilele putem avea


scalare metrică multidimensională sau scalare nemetrică multidimensională.

09
Analiza structurilor latente
Combină extragerea și definirea factorilor latenți cu clasificarea eficientă a
respondenților în grupuri omogene prin intermediul explicării variațiilor și
asociațiilor identificate în modul de a răspunde.

Tehnicile specifice au la bază anumite presupuneri care formează criteriile de


definire a grupurilor.

10
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 8

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Raportul de cercetare

Raportul de cercetare reprezintă o declarație scrisă și o prezentare orală a


celor mai importante rezultate ale cercetării, a unor concluzii sau
recomandări, adresate unei audiențe specifice.

Funcțiile raportului de cercetare:


 Structurarea și organizarea în mod unitar a datelor inițiale, metodologiei
și rezultatelor;
 Comunicarea rezultatelor către beneficiarul cercetării;
 Eficientizarea procesului decizional prin eliminarea riscului.

01
Raportul de cercetare

În conceperea raportului de cercetare se va ține cont de:


 Specificul beneficiarului (pregătirea, timpul, poziția);
 Structura echipei care va lua parte la prezentarea raportului (audiența);
 Tipul pieței investigate;
 Tipul cercetării și metodologia utilizată;
 Valoarea cercetării;
 Problema decizională, scopul și obiectivele stabilite;
 Spațiul in care va avea loc susținerea.

02
Raportul de cercetare

Cerințe pentru formularea raportului scris:

 Să fie bine structurat (succesiune logică și marcare explicită);


 Să fie concis dar complet (succint dar să acopere obiectivele propuse);
 Să fie accesibil (în limbajul specific beneficiarului);
 Să fie atractiv (să pună accent pe rezolvarea problemei decizionale);
 Să fie obiectiv (chiar dacă contrazic ipotezele beneficiarului);
 Să fie clar (să fie evitate situațiile confuze sau prea general definite).

03
Tipologia rapoartelor de cercetare

Tipuri de rapoarte de cercetare:


• Raportul primar (schița raportului de cercetare, pt. uz intern);
• Raportul pentru publicații (sub formă de articol pentru presă);
• Raportul tehnic (destinat specialiștilor în domeniul marketingului);
• Raportul intermediar (raport mai puțin detaliat pentru urmărirea
progresului cercetării care va fi realizată pe un interval mai lung);
• Raportul popular (raport generic, superficial, accesibil, destinat
persoanelor cu interes redus și capacitate de înțelegere mai mică);
• Raportul final (raport complet, cu valoare contractuală).

04
Formatul raportului de cercetare
1. Pagina de titlu (titlul cercetării, beneficiar, cercetător, data);
2. Scrisoarea de înaintare (transmiterea oficială a sa către beneficiar);
3. Scrisoarea de autorizare (autorizarea cercetării, obiectivele convenite,
termeni contractuali);
4. Cuprinsul (structura raportului de cercetare, maxim diviziuni ordin III);
5. Rezumatul (sinteza raportului de cercetare);
6. Corpul raportului:
 Introducerea;
 Metodologia;
 Rezultatele;
 Limitele cercetării;
 Concluzii și recomandări.
7. Anexe (materiale la care se face referire în corpul raportului);
8. Bibliografie (sursele de informații utilizate).

05
Aspectul raportului de cercetare

Din punct de vedere grafic sunt importante următoarele elemente:


 Formatarea generală a documentului;
 Cuprinsul și structura raportului;
 Fontul și formatarea textului;
 Sublinierea elementelor importante;
 Paleta de culori agreată;
 Structurile tabelare;
 Reprezentarea grafică a datelor;
 Imagini și alte elemente.

06
Structurile tabelare
Elemente obligatorii pentru prezentarea tabelară a rezultatelor:
 Numerotarea continuă sau structurală prin cifre arabe (în anexe va
exista o listă a tabelelor);
 Titlu scurt, clar și sintetic în partea superioară;
 Subiectul și predicatul în capul de linii și coloane;
 Sursa datelor în colțul din stânga jos (doar pentru date secundare);
 Notă de subsol explicativă (opțional) după tabel înaintea sursei datelor
(de multe ori cu indici).

07
Graficele
Elemente obligatorii pentru prezentarea grafică a rezultatelor:
 Numerotarea continuă sau structurală prin cifre arabe (în anexe va
exista o listă a graficelor);
 Titlu scurt, clar și sintetic în partea inferioară a graficului;
 Legenda pentru sistemul de axe, culori/texturi utilizate, ș.a.;
 Sursa datelor în colțul din stânga jos (doar pentru date secundare);
 Notă de subsol explicativă (mai rar, doar pentru grafice mai complexe)
după grafic înaintea sursei datelor (de multe ori cu indici).

08
Tipuri de grafice
 Diagramă liniară
 Diagramă stratificată
 Cercul de structură (pie)
 Diagrame prin benzi
sau coloane (bar)
 Pătratul de structură
(sumarized bar)
 Histograma
 Hartă perceptuală
 Matrice de poziționare

09
Prezentarea orală
Prezentarea orală urmărește comunicarea verbală a celor mai importante
rezultate ale cercetării, concluziilor și recomandărilor, în vederea diminuării
eventualelor neclarități ce pot să apară în înțelegerea raportului extins.

Beneficiile prezentării orale;


 Asigură o comunicare interactivă cu beneficiarul;
 Transmitere mai bună a recomandărilor;
 Prezentare superioară cu accent pe valoarea cercetării;
 Posibilitatea solicitării informațiilor suplimentare;
 Top managementul se orientează după rezumat și prezentare orală;
 Crearea curiozității și interesului față de raportul extins;
 Permite utilizarea unui suport multimedia;
 Reunește specialiștii furnizorului de cercetare și pe cei ai beneficiarului;
 Poate pune bazele unei colaborări viitoare.

10
Prezentarea orală
Elaborarea prezentări orale:
 profilul/specificul audienței (gradul de informare asupra temei cercetate,
implicarea în procesele decizionale, cunoștințele din domeniul
marketingului și analizei datelor, timpul avut la dispoziție);
 Cele mai sensibile puncte ale problemei decizionale pentru beneficiar;
 Obiectivele ascunse (surpriza cercetătorului);
 Evitarea rezultatelor previzionate prin ipoteze sau a variabilelor cu erori
în măsurare/distribuție;
 Se vor folosi elemente grafice și valori numerice procentuale rotunjite;
 Raportul de extins de cercetare va fi distribuit anterior pentru a permite
beneficiarului să îl cerceteze și să formuleze întrebări;
 Locația în care are lor prezentarea și echipamentele disponibile;
 Expunerea va fi liberă, dinamică evitându-se lectura;
 Se va urmări contactul vizual cu audiența iar prezentarea va fi alterată
pentru a lămuri situațiile neclare;
11
Prezentarea orală
Elaborarea prezentări orale (continuare…)
 Atunci când este posibil va fi aleasă o persoană cu talent oratoric și
experiență în susțineri publice pentru prezentarea orală;
 Limbajul ales trebuie să fie clar (sub nicio formă poetic), eficient și va fi
evitat vocabularul tehnic (marketing și cercetări);
 Se va lăsa spațiu pentru lămuriri suplimentare după fiecare cadru;
 Tonul va fi unul neutru cu urcări pentru subliniere și atenționare;
 Rezultatele favorabile sunt apreciate însă cele nefavorabile aduc valoarea
cea mai ridicată (nu le evitați);
 Se va folosi suport multimedia (succesiune de cadre) însă conținutul
acestuia nu va fi foarte detaliat (audiența va citi cadrul proiectat și nu va
mai asculta prezentarea) și se vor evita animațiile/clipurile video sau
fonturile foarte mici pentru a putea fi ușor vizualizate;
 Se va transmite câte o idee odată către audiență în ordine logică;
 Se va lansa invitația pentru întrebări și comunicare ulterioară.
12
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 9

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Previziuni de marketing
Previziunile de marketing reprezintă estimări ale nivelurilor variabilelor
endogene sau exogene pentru perioadele viitoare realizate pe baza
examinării trecutului acestora și a identificării unui tipar repetitiv în
evoluția lor.

Pe baza acestor estimări se stabilesc performanțele anticipate ale


organizației și linia strategică necesară optimizării activității acesteia pe
termen mediu și lung.

Alocarea eficientă a resurselor organizației pe orizonturi diferite de timp și


activitățile de programare depind în foarte mare măsură de acuratețea
previziunilor .

01
Previziuni de marketing
Acuratețea previziunilor este determinată de:
 Specificitatea pieței;
 Contextul realizării previziunilor;
 Orizontul de timp avut în vedere (1-5 ani sau peste 5 ani);
 Ciclicitatea fenomenului investigat;
 Disponibilitatea datelor cu caracter istoric;
 Numărul și tipul factorilor de influență considerați;
 Nivelul de formalizare (cantitativ/calitativ);
 Gradul de precizie dorit;
 Intervalul de timp în care trebuie realizate previziunile;
 Importanța previziunii pentru factorii decizionali;
 Gradul de subiectivitate din datele istorice disponibile;
 Suprafața geografică considerată (regional, național, internațional).

02
Clasificarea metodelor de previziune
1. Metode cantitative
Se folosesc atunci când:
 Există informații istorice despre variabila în cauza cantitative sau
cuantificabile;
 Este susținută ipoteza constanței configurației (variabila va avea o evoluție
similară celei din trecut, ciclicitate).
Pe baza relației dintre variabila considerată și timp sau alte variabile se va
alege metoda corespunzătoare.
În funcție de specificul teoriei statistice utilizate avem:
 Metode informale (extrapolează valorile viitoare ale variabilei (nivel,
variații ciclice sezoniere, tendință) pe bază empirică utilizând istoricul
acesteia dar suferă de acuratețe redusă);
 Metode formale (extrapolează valorile viitoare prin folosirea unor metode
standardizate optimizate pentru minimizarea erorii de previzionare).
03
Clasificarea metodelor de previziune
După tipul modelelor cantitative utilizate metodele cantitative de previzionare
pot fi:
 Metode de analiză a seriilor dinamice (endogene): se bazează pe analiza
evoluției în trecut a variabilei și/sau a erorilor de previziune pentru
descoperirea configurației specifice a seriei dinamice fără a considera în
mod explicit factorii de influență; există 4 tipuri de configurații de bază:
 configurație orizontală (staționară în jurul unei medii);
 configurație tendință (trend, creștere/descreștere pe termen lung);
 configurație sezonieră (fluctuații determinate de factori sezonieri);
 configurație ciclică (variabilă pe lungime si amplitudine pe orizonturi
mai mari de timp).
 Metode cauzale (exogene): presupun existența unei legături cauză-efect și
se elaborează previziunea pe baza acesteia presupunând că relația
identificată rămâne constantă.

04
Metode cantitative de previziune
1. Metode bazate pe analiza seriilor dinamice (nu sunt riguroase statistico-
matematic dar sunt flexibile, ușor de utilizat, ieftine cu precizie acceptabilă)
 Metode naive (se bazează pe cele mai recente date și indicele de
sezonalitate);
 Metoda modificării procentuale (pe baza unui indice de modificare anuală
pe baze sezoniere);
 Metoda modificării procentuale mobile (se utilizează mediile mobile ale
schimbărilor procentuale);
 Metoda mediilor mobile (folosește valorile medii pentru un număr fix de
date istorice și previzionează etapa viitoare pe baza mediilor celei mai
recente observări);
 Metoda nivelării exponențiale (Brown, Holt sau Winter);
 Metode de descompunere a seriilor dinamice (funcție de tendință,
sezonalitate și ciclicitate plus eroarea aleatoare);
 Metode autoregresive.
05
Metode cantitative de previziune
2. Metode cauzale
Mult mai riguroase, cu complexitate ridicată și precizie sporită de previzionare
au la bază considerarea explicită a relației cauză-efect între variabila
previzionată și un număr de variabile independente.

Metoda regresiei (multiple) presupune utilizarea unei ecuații de regresie ai


cărei parametrii pentru variabilele independente sunt stabiliți pe baza seriilor
de timp și necesită realizarea preliminară a estimărilor pentru toate variabilele
independente.

Metode de tip gravitațional presupun estimarea parametrilor prin aproximări


succesive (nu prin metode statistice) pe baza unei ecuații de regresie, și
excelează în domeniul serviciilor.

06
Metode calitative de previziune
Suplimentează previziunile cantitative pentru confirmarea rezultatelor și
îmbogățirea informațiilor oferite. În condițiile unui mediu turbulent sunt mai
precise decât metodele cantitative, acestea din urmă bazându-se pe o evoluție
predictivă, cu hazard redus dar depind în foarte mare măsură de experiența
cercetătorului.

 Tehnica Delphi (realizarea unui consens în eșantionul de specialiști care


evaluează independent și anonim variabila previzionată);
 Analogiile (compararea prezentului cu situații istorice);
 Metoda PERT-derivat (previziunea optimistă, pesimistă și probabilă);
 Metoda bazată pe teoria utilităților;
 Teoria deciziilor (clasică sau bayesiana);
 Estimările de grup (atingerea unui consens prin interacțiunea experților);
 Previziunile dinamice ale cotei de piață (metoda lanțurilor Markov).

07
Și în sfârșit…despre examen
Suport de curs:
Iacob Cătoiu (coord) Cercetări de marketing. Tratat, Editura Uranus 2009

Capitolul 05. Măsurarea fenomenelor de marketing


Capitolul 19. Analiza univariată a datelor în cercetările de marketing
Capitolul 20. Modalități de analiză bivariată
Capitolul 21. Tehnici de analiză multivariată

Data susținerii examenului: miercuri 7 (anul 2) și 8 (anul 3) mai 2014


Sala: 2203, 2201, 0602

Tip examinare: 20 întrebări grilă + 3 întrebări deschise

Timp alocat: 40 de minute

08
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Vă mulțumesc pentru atenție!

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 11

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Utilizarea SPSS Syntax. De ce?
• Permite realizarea unui volum mare de activități
cu efort minim și în timp record;
• Ușurează semnificativ munca în cazul cercetărilor
longitudinale și atunci când suntem nevoiți să
realizăm raportări intermediare;
• Nu sunt necesare cunoștințe de programare;
• Codul SPSS Syntax este ușor de citit și intuitiv;
• SPSS generează automat codul aferent fiecărei comenzi realizate prin
interfața vizuală (atât pentru prelucrare cât și pentru analiză);
• Codul generat de SPSS poate fi editat în totalitate prin schimbarea
variabilelor țintă și a parametrilor;
• Utilizatorii cu experiență limitată pot progresa gradual de la copy-paste
către introducerea manuală a comenzilor;
• Editorul Syntax ajută utilizatorul prin intermediul funcției auto-
complete;
01
Command Syntax Reference
Acest ghid este inclus in kitul de instalare al SPSS și conține toate comenzile
Syntax grupate după scopul acestora în:
• Import de date;
• Salvare și export date;
• Adaptare date în format SPSS;
• Definirea datelor;
• Transformarea datelor;
• Editarea proprietăților documentului;
• Transformarea fișierului;
• Structuri logice de programare;
• Utilități de programare și generale;
• Operații cu structuri tabelare;
2502 pagini
• Afișarea rezultatelor;
• Generarea Graficelor;
• Serii de timp.
02
Command Syntax Reference
Suplimentar codul Syntax permite utilizarea modulelor suplimentare
precum:
• Statistics Base;
• Advanced Statistics;
• Regression;
• Custom Tables;
• Decision Trees;
• Categories;
• Complex Samples;
• Neural Networks;
• Forecasting
• Conjoint Analysis;
• Bootstrapping;
• Missiong Values
• Data Preparations.
03
Primii pași
• În cadrul cercetării pilot, odată e structura bazei de date este finalizată,
realizați de prelucrare și analiză a datelor pe date fictive (valori
introduce folosind generatorul de numere);
• Verificați rezultatele generate în fereastra Output și asigurați-vă că
acestea sunt într-o formă satisfăcătoare;
• Creați un document text în care salvați codul sintaxă generat de către
SPSS în fereastra output pe structura obiectivelor urmărite;
• Copiați din fișierul respectiv grupul de comenzi dorit în fereastra
”Syntax Editor” (File/New/Syntax);
• Selectați grupul de comenzi dorit și lansați în execuție apăsând butonul
RUN din panoul superior cu instrumente;

04
Principii de funcționare
• Începutul liniilor cu comentarii va fi marcat cu ”*” iar sfârșitul cu ”.”
(textul va fi afișat cu caractere de culoare gri);
• Comentariile la sfârșit de linie vor fi precedate de”/*” și încheiate cu ”.”
• Atunci când vor fi analizate mai multe variabile similare în același timp
codul acestora va fi separat printr-un caracter spațiu;
• SPSS este ”case sensitive”, nu folosiți majuscule;
• Nu folosiți indentații (stații libere la început de linie);
• Momentan diacriticele nu sunt acceptate;
• Fiecare comandă va începe pe o linie nouă de la capăt de rând și poate
continua pe câte rânduri este nevoie până la întâlnirea caracterului ”.”;
• Pentru a rula o comandă aceasta trebuie în prealabil selectată iar apoi
apăsat butonul săgeată verde Run (Ctrl+R);
• Fișierele sintaxă vor avea extensia .sps și pot fi editate utilizând orice
editor text/web (notepad, notepad++...);

08
Comprimarea comenzilor
• Prescurtați comenzile generate automat (”V1 to v10”, ”all”);
descriptives variables=v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11
descriptives variables =v1 TO v24
v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24
/statistics=mean stddev min max.
/statistics=mean stddev min max.

• Comanda, lista de variabile și parametri pot fi pe aceiași linie;


descriptives variables =v1 TO v24 /statistics=mean stddev min max.

• În lipsa parametrilor suplimentari este folosită configurația de bază;


descriptives variables =v1 TO v24.

• Odată cu acumularea experienței puteți omite cuvintele opționale;


descriptives v1 TO v24.

• SPSS este optimizat pentru utilizarea comenzilor abreviate;


des 1 TO v24.
09
Principii de funcționare (programare)

01
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Disciplina: Analiza
Analizadatelordatelorde de
marketing
marketingutilizând
utilizândSPSS SPSS
Lect. Univ. Dr.Cristi
Titular: lect.univ.dr. TATU
Cristi TATU MBA

Cursul numărul 12

www.cristitatu.ro
cristitatu@mk.ase.ro
www.facebook.com/tatuci
Python și SPSS
Limbajul de programare Python a fost integrat in SPSS începând cu
versiunea 14 pentru automatizarea proceselor de prelucrare și analiză a
datelor.

Python este un limbaj de programare dinamic high-level, printre cele mai


importante limbaje de programare utilizate în prezent. Proiectat inițial la
începutul anilor 1980 a început să fie folosit 10 ani mai târziu iar filozofia sa
se bazează pe următoarele valori:

• Codul frumos este preferabil celui urât;


• Codul explicit este preferabil celui implicit;
• Simplitatea codului este preferabilă complexității nejustificate;
• Codul complex este preferabil celui complicat;
• Codul ușor de citit este preferabil celui criptic.

01
Give Python a Chance! It’s harmeless.
Comenzi Python pentru SPSS

01
De ce Python?
• Este printre cele mai importante limbaje de programare utilizate în
acest moment;
• Utilizatorii nu au nevoie de experiență în programare pentru utilizarea
comenzilor de bază și redactarea de secvențe scurte;
• Este disponibil sub licență Open Source;
• Este dezvoltat în permanență de către comunitate;
• Este un limbaj intuitiv și foarte ușor de învățat (comparabil cu Visual
Basic for Applications utilizat de MS Office pentru macro);
• Permite editarea de secvențe de cod scurte precum și a unor programe
cu un grad ridicat de complexitate (inaccesibil sintaxei SPSS);
• Este ușor de integrat în alte aplicații;
• Nu implică costuri suplimentare pentru utilizatori;
• Utilizatorii au acces gratuit către nenumărate surse de informare și
exemple disponibile online;

03
De ce este utilizat în SPSS?
• Automatizarea proceselor repetitive de analiză și prelucrare a datelor;
• Analiză instant în cazul cercetărilor longitudinale pentru raportarea
intermediară;
• Analiză instant în momentul finalizării colectării de date pe baza
scriptului proiectat în faza de planificare;
• Permite cercetătorilor să dezvolte instrumente de prelucrare și analiză
suplimentare inexistente in SPSS;
• Permite integrarea interogărilor MySQL pentru baze de date online și
locale, fișiere Excel;
• Permite salvarea/utilizarea unor modele de analiză personalizate dificil
de realizat prin interfața SPSS;

04
Cum poate fi utilizat?
1. Copy-Paste: sintaxa din fereastra Output a SPSS rezultată în urma unei
acțiuni realizate prin intermediul interfeței utilizator poate fi copiată,
editată și rulată din nou;
2. Editarea propriei sintaxe: odată cu acumularea experienței utilizatorii își
pot scrie propria sintaxă similară celei generate automat de SPSS;
3. Editarea propriilor funcții: seturile de comenzi utilizate frecvent pot fi
salvate sub forma unor funcții personalizate ce primesc anumiți
parametrii (nume de variabile, indicatori solicitați...);
4. Editarea propriului modul de cod: utilizatorii experimentați care au
cunoștințe de bază în programare pot scrie propriul modul în cos Python
(fără a mai depinde de sintaxa SPSS);
5. Crearea de ferestre de dialog și instrumente proprii: nivelul superior
rezervat celor cu aptitudini de programare și experiență în domeniu.

05
Programare Python v.s Python Scripting
Programare Python Script Python
(utilizată în principal pentru (utilizat în principal pentru
editare date și analiză) modificarea obiectelor din
fereastra Output a SPSS)

• Liniile cod sunt interpretate • Obiectele existente in


de modulul Python; fereastra Output sunt editate
• Interfața SPSS este utilizată prin setul de proprietăți
pentru interogarea bazei de definite pentru acestea;
date și afișare rezultate; • SPSS este folosit ca interfață
• Python generează comenzi în in/out;
sintaxa SPSS;

06
Integrare Python Scripting în SPSS

07
Principii de funcționare (programare)
• Codul Python va fi integrat între “begin program.” și ”end program.”
pentru a fi separat de sintaxa SPSS;
• Comentariile sunt precedate de caracterul ”#”;
• Interpretorul de cod Python este ”fully case sensitive” (!!!);
• Spațierea de la început de rând face parte din cod;
• Caracterul Backslash ”\” este caracter rezervat;
• Finalul comenzilor este marcat prin ”.”; în absența acestuia limbajul
presupune că finalul comenzii este la sfârșitul linei;

08
Principii de funcționare

01
#Step 1: Generate a master accessory list from the union of all sets of accessory codes of each record

ifile = open(‘JM_Family.txt’,’r’) #create a file object for the actual dataset(the report)
reportread = csv.reader(ifile, delimiter = ‘t‘) #create a reader object from the file object
acclookup = []
for row in reportread:
if reportread.line_num >1: #excluding the header row

#Pieces all the values of the variable (second column in the dataset and indexed to 1) and make the #result a big list

acclookup.extend(row[1].split(“, “))
acclookup = (list(set(acclookup))) #remove duplicates
acclookup.sort()

#Step 2: Create dummy variables and populate with 0 and 1 from acclookup and write the result to the file

ofile = open(‘accw.txt’,’w’) #create a file object for writing the result


reportwriter = csv.writer(ofile) #create a writer object
ifile = open(‘JM_Family.txt’,’r’)
reportread = csv.reader(ifile, delimiter = ‘t’)
for row in reportread: #for each row in the read tab delimited file
if reportread.line_num == 1:
row.extend(acclookup)
reportwriter.writerow(row) #write column headers to the file
else:
accdummy = [0] * len(acclookup)
acclist = row[1].split(“, “) #read the 2nd column(2nd column is indexed to 1) and turn it into a list
n = len(acclist) #count how many items (accessory codes) there are in each list
for i in range(n):
pacdum = acclookup.index(acclist[i])
accdummy[pacdum] = 1 #write the dummy values ( 1 for occurrence and 0 for nonoccurrence)
row.extend(accdummy)
reportwriter.writerow(row)
ofile.close()
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Vă mulțumesc pentru atenție!

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci