Sunteți pe pagina 1din 15

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI

CATEDRA DE MARKETING

Analiza datelor de
marketing utilizând SPSS
Lect. Univ. Dr. Cristi TATU MBA PMP

Cursul numărul 4

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci
Cum definim greșit structura BD?
În definirea unei baze de date cele mai des întâlnite greșeli sunt:
 Introducerea datelor într-o bază de date neformatată sau o foaie de calcul
tabelar fără cap de tabel;
 Codificarea variantelor de răspuns folosind litere (a,b,c…);
 Introducerea datelor în formă necodificată urmând ca apoi să fie utilizată
funcția search&replace (motivul: din coduri nu se înțelege nimic);
 Codificarea variantelor de răspuns începând cu valoarea 0 (zero);
 Codificarea întrebărilor ”cu răspuns predefinit multiplu” într-o singură
variabilă;
 Definirea tuturor variabilelor într-un format
numeric sau șir de caractere generos care să
poată înmagazina orice cantitate de date;
 Definirea tuturor variabilelor de
tip șir de caractere;
 Utilizarea tipurilor de date
specifice doar anumitor aplicații.
01
Cum greșim la introducerea datelor?

Odată definită structura bazei de date nu de puține ori apar erori în


introducerea chestionarelor completate în baza de date cum ar fi:
 Lipsa introducerii unui cod care să facă diferența dintre un câmp gol,
un non-răspuns sau un răspuns imposibil de utilizat;
 Corectarea răspunsurilor considerate necorespunzătoare, care nu se
încadrează în tiparul așteptat;
 Codificarea la introducere a răspunsurilor deschise/de completare;
 Ajustarea scalelor metrice completate greșit (ex: scala cu sumă
constantă cu suma diferită de 100 de puncte);
 Completarea de către operator a non-răspunsurilor;
 Înlocuirea unui răspuns deschis de completare cu alegerea unei
variante predefinite dacă par a fi similare;
 Anularea răspunsurilor ce par greșite (ex: o extremă de scală) și
introducerea acestora ca non-răspuns;

02
De la chestionar la baza de date

Pentru a putea fi analizate, răspunsurile primite de la respondenți vor fi


stocate într-o bază de date digitală a cu următoarele proprietăți:
 Structura bazei de date va reflecta întrebările din chestionar; în cazul
unei cercetări online răspunsurile sunt înregistrare direct într-o bază
de date cu structura corespunzătoare gata codificate;
 Baza de date va permite înregistrarea completă și corectă a
informației din chestionar fără a fi nevoie de prelucrarea acesteia;
 Răspunsurile vor fi introduse în baza de date exact ca în chestionar,
fără ”corecturi”, ”îmbunătățiri” sau alte modificări;
 Se va alege un format de bază de date universal, recunoscut de cât
mai multe aplicații (csv, xls, dbf, ș.a.);
 Valoarea de pornire a câmpurilor va fi ”NULL” (evitați ”0”) ;
 Baza de date va avea un câmp index (automat) unic;
 Baza de date va primi răspunsurile în format codificat.

03
Principiile bazelor de date
 Baza de date este formată din:
• Setul de variabile care definesc structura bazei de date (coloane);
• Înregistrările/cazurile ce conțin totalitatea răspunsurilor primite de
la fiecare respondent în parte printr-un anumit chestionar (linii);
 Când se dorește modificarea bazei de date se va realiza întotdeauna o
copie de siguranță a acesteia;
 Variabilele native (care stochează răspunsurile neprelucrate nu vor fi
niciodată suprascrise/editate/modificate;
 Pe fiecare chestionar introdus în baza de date se va nota numărul unic
de înregistrare/ordine din baza (indexul automat);
 Răspunsul întrebărilor cu variante predefinite vor fi introduse sub
formă codificată (șirul de caractere substituit cu valoare numerică
unică);
 Numele fiecărei variabile va fi ales astfel încât să faciliteze identificarea
întrebării aferente în chestionar (ex: Q1).
04
SPSS – înregistrări în baza de date

05
SPSS – structura bazei de date

06
Codificarea răspunsurilor
1. Întrebările cu variantă predefinită de răspuns
(răspuns unic) I1. Animal preferat:
 Variantele de răspuns vor primi coduri începând o Câine; 1
cu valoarea ”1” pentru primul răspuns din set o Pisică; 2
(seturi fără ordonare) sau pentru cel mai mic o Vulpe; 3
răspuns (seturi interval sau în succesiune logică); o Cal. 4
 Valoarea ”0” va fi evitată, aceasta reprezintă
originea în cadrul scalelor metrice proporționale; I2. Vârstă:
 Marcarea întrebărilor care au fost o Sub 18 ani; 1
evitate/refuzate de către respondent se va face o 18-25 ani; 2
folosind codul 99; o 26-35 ani; 3
 Răspunsurile eronate, imposibil de descifrat sau o Peste 35 ani. 4
confuze vor fi marcate utilizând codul 95;
 Sub nicio formă nu for fi introduse alte coduri
decât cele convenite sau șiruri de caractere.
07
Codificarea răspunsurilor
2. Întrebările cu răspuns deschis numeric
I3. Vârstă în ani
 Răspunsurile primite la acest tip de întrebări
împliniți:
sunt introduse în baza de date exact așa cum
……………….
apar în chestionar;
 În cazul în care din neglijența operatorului,
I4. Acordați o
greșeala respondentului sau neincluderea
notă de la 1 la
filtrelor numerice în chestionarul virtual
10 pentru
răspunsurile includ altceva decât o singură
produsul X:
valoare numerică acestea vor fi corectate;
……………….
 Dacă răspunsul nu poate fi corectat (ex: vârsta
sub formă de interval sau expresii fără caracter
I5. Numărul
metric) întrebarea va fi tratată drept non-
copiilor minori
răspuns;
din familie:
…………………

08
Codificarea răspunsurilor
3. Întrebările cu răspuns deschis alfa-numeric
- Pasul 1: se identifică toate variantele unice de I6. Animalul
preferat:
răspuns prin parcurgerea bazei de date pe
……………..
variabila selectată și se alocă coduri unice
(atenție la duplicate absolute sau relative);
- Pasul 2: se cuantifică apariția fiecărei variante I7. Prenumele
dumneavoastră:
unice identificate în formă identică sau foarte
……………….
asemănătoare;
- Pasul 3: se creează o nouă variabilă (!!!) care va
I8. Culoarea
stoca răspunsurile în formă codificată;
- Pasul 4: în variabila nou creată vor fi introduse preferată
o verde
codurile aferente răspunsurilor unice
o roșu
identificate; pentru câmpurile text de
o albastru
completare (vezi întrebarea cu răspuns unic) va fi
o altă culoare
completat setul inițial de variante predefinite.
……………..
09
Codificarea răspunsurilor
4. Bateriile de întrebări cu răspunsuri dihotomice
I9. Animalele
(întrebări cu răspuns predefinit multiplu)
preferate:
 Câine;
 Aceste întrebări sunt doar o formă particulară de
 Pisică;
formatare a întrebărilor dihotomice (răspuns
 Cal;
unic din 2 variante posibile);
 Papagal.
 Fiecărei valori din setul predefinit îi va
corespunde o variabilă distinctă care primește
I10. Este câinele
codul 1 când câmpul este bifat și 2 când nu este
unul dintre
bifat (valoarea predefinită a bazei de date este
animalele dvs.
”NULL”);
preferate?
 Se aplică regulile aferente întrebărilor cu răspuns o Da; 1
predefinit unic. o Nu. 2

10
Codificarea răspunsurilor
5. Bateriile de întrebări cu răspunsuri multihotomice (scale Likert, ș.a.)
 Aceste întrebări sunt doar o formă particulară de formatare a
întrebărilor cu răspuns predefinit unic care au un enunț similar sau
identic;
 Fiecărui element investigat îi corespunde o variabilă distinctă;
 Se aplică individual regulile specifice întrebărilor cu răspuns predefinit
unic;
I11. Cât de mult vă plac următoarele animale I12. Cât de mult vă
plac câinii?
Foarte Mult Nici/nici Puțin Foarte
mult puțin o Foarte puțin; 1
Câine o o o o o o Puțin; 2
Pisică o o o o o o Nici/nici; 3
Cal o o o o o o Mult; 4
Papagal o o o o o o Foarte mult. 5
11
Codificarea răspunsurilor
6. Bateriile de întrebări cu deschise I13. Împărțiți 100
de puncte între
 Aceste întrebări sunt doar o formă următoarele
particulară de formatare a întrebărilor cu animale:
răspuns deschis ce au un enunț comun; Câine ……..
 Fiecărui câmp de completare îi va Pisică ……..
corespunde o variabilă distinctă; Cal ……..
 Se aplică regulile specifice tipului de Papagal ……..
întrebare cu răspuns deschis aferent.
I14. Enumerați 3
culori care vă plac:
a) ………………..
b) ………………..
c) ………………..

12
Variabilele native și cele artificiale

 Variabila nativă corespunde unei întrebări existente în chestionar și


memorează răspunsul primit de la respondent fără nicio modificare;
 Aceste variabile primesc coduri care să reflecte întrebarea sau bateria
de întrebări din care fac parte (ex: Q1, Q4_1, Q4_2, Q6_text);
 Variabilele native nu se modifică, nu se suprascriu, nu se șterg;
 Variabila artificială este creată de către cercetător pentru a memora
date ce nu se regăsesc în chestionar cum ar fi:
• Forme prelucrate ale variabilelor native (unități de măsură
schimbare, scale modificare, ș.a.);
• Scoruri multi-variabilă (scor de performanță, medii ponderate
pentru scala lui Likert, ș.a.);
• Numărul/codul unic de identificare a chestionarului fizic;
• încadrarea înregistrării într-o anumită categorie;
• Diverse observații cu privire la acea înregistrare (cod operator
interviu, cod operator PC, constatări, ș.a.).
13
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Vă mulțumesc pentru atenție!

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci

S-ar putea să vă placă și