Sunteți pe pagina 1din 9

Analiza datelor de marketing

Recodificarea răspunsurilor aferente unei variabile

O altă procedură deosebit de populară este ”Recode”, aceasta oferind


posibilitatea transformării din valoare în valoare, și sau din interval în valoare.
Există două variante ale acestei proceduri, recodificarea într-o variabilă nouă și în
aceiași variabilă (prin suprascrierea valorilor).

În continuare prezentăm varianta recodificării într-o variabilă nouă datorită


faptului că suprascrierea unei variabile existente nu este recomandată, în special în
cazul variabilelor de intrare. Excepție fac cazurile în care constatăm drept greșită
prelucrarea anterioare si dorim corectarea valorilor.

Figura 126. Selectarea variabilei ce va fi recodificată

Principiul de funcționare este unul destul de simplu, în prima fereastră


selectăm variabila ce urmează a fi procesată și introducem codul și eticheta
variabilei noi care va stoca rezultatele procesării. Atenție! Nu putem finaliza
acțiunea dacă nu apăsăm butonul ”Change” din partea dreaptă a ferestrei pentru a
completa perechea ”Numeric Variable – Output Variable” din lista aflată în zona
centrală a ferestrei.

Regulile de transformare vor fi definite într-o fereastră separată pe care o


accesăm apăsând butonul ”Old and New Values” din partea de jos a ferestrei.
Analiza datelor de marketing

Această fereastră ne permite introducerea valorilor vechi în jumătatea stângă a sa și


a valorii noi în partea din dreapta sus.

Figura 127. Definirea regulilor de transformare

Avem astfel posibilitatea transformării din valoare în valoare sau din interval
în valoare. După definirea valorilor vechi și noi pentru fiecare pereche în parte vom
apăsa butonul ”Add” pentru trecerea acesteia în lista ”Old-New” din partea dreaptă
a ferestrei.

Cele mai frecvente utilizări ale acestei proceduri sunt:


▪ Transformarea unei variabile metrice într-o variabilă nemetrică;
▪ Schimbarea codurilor variatelor predefinite de răspuns pentru variabilele
nominale sau ordinale;
▪ Codificarea întrebărilor cu răspuns unic (transformarea ”Value-Value” poate
transforma dintr-un șir de caractere într-o valoare numerică cu condiția ca
variabila donator să fie de tip șir de caractere);

Variabila rezultantă, ”Output Variable” va fi întotdeauna de tip numeric,


indiferent de tipul de date al variabilei donatoare. Transformarea va fi realizată doar
pentru perechile definite, orice altă valoare sau plajă de valori neacoperite vor fi
ignorate.
Și funcția ”Recode” permite utilizarea unei condiții de aplicare ce poate fi
definită apăsând butonul ”If” din partea de jos a ferestrei.
Analiza datelor de marketing

Transformarea în ranguri a variabilelor metrice

Atunci când forma pe care o are variabila metrică nu este una satisfăcătoare
sau atunci când un anumit model de analiză a datelor solicită în mod explicit
transformarea valorilor în ranguri avem la dispoziția procedura din meniul
”Transform/Rank Cases”.

Figura 128. Selectarea variabilelor pentru atribuirea rangurilor

Pentru variabila selectată, procedura va oferi ranguri pentru fiecare valoare


unică înregistrată pe coloana aferentă ei. Prin apăsarea butonului ”Rank Types”
putem selecta modalitatea de atribuire a rangului, cele mai populare fiind rangul
crescător ”Rank” și percentilele ”Ntiles”.

Figura 129: Selectarea tipului de valoare pentru rang


Analiza datelor de marketing

Figura 130. Abordarea valorilor egale

Atunci când avem aceiași valoare pe două sau mai multe înregistrări avem la
dispoziție 4 alternative pentru gestionarea situație prin accesarea ferestrei ”Ties”.
Cel mai frecvent se apelează la utilizarea unei valori medii sau atribuirea de ranguri
secvențiale.

Prin rularea procedurii va fi generată o nouă variabilă în baza de date ca va


avea drept cod numele variabilei selectate precedat de litera R. Aceasta va fi
definită automat ca variabilă numerică cu 9 caractere și 3 zecimale, intervenția
utilizatorului fiind necesară.

Înlocuirea non-răspunsurilor

Fie că este vorba de refuzul anumitor respondenți a răspunde la anumite


întrebări sau oferirea unor răspunsuri invalide ce nu pot fi utilizate existența non-
răspunsurilor în cadrul bazei de date este un fenomen comun și destul de des
întâlnit.

Figura 131: Înlocuirea non-răspunsurilor


Analiza datelor de marketing

Atunci când procedurile de analiză a datelor sunt sensibile la existența


acestor non-răspunsuri (nu acceptă să ruleze până la remedierea problemei sau nu
garantează pentru corectitudinea rezultatelor) avem la dispoziție procedura de
acoperire a acestora ce poate fi accesată prin intermediul meniului
”Transform/Replace Missing Values”.

Pentru a evita compromiterea variabilei originale din baza de date rezultatele


procesării vor fi memorate într-o nouă variabilă ce folosește codul variabilei
selectate completat de sufixul ”_1”. Avem posibilitatea de a edita acest cod în
câmpul ”Name” urmând să apăsăm butonul ”Change” pentru a utiliza noul cod.

Generarea de valori aleatorii

Generarea de valori aleatorii este deosebit de utilă în demersul de analiză a


datelor în special atunci când lucrăm cu teste parametrice ce au nevoie de serii
aleatorii normal distribuite.

Figura 132. Generarea valorilor aleatorii pe o distribuție normală

Pentru a face acest lucru accesăm meniul ”Transform/Compute” unde vom


utiliza funcția ”Random Numbers” în varianta ”Rv.Normal”. În exemplul de mai
Analiza datelor de marketing

jos vom genera o serie de valori aleatorii cu media de 50 și abaterea medie pătratică
10 ce respectă o distribuție normală.

Selectarea generatorului de numere aleatorii ce va fi utilizat de către


aplicație, indiferent de procedura de lucru utilizată, se face prin accesarea meniului
”Transform/Random Number Generator”.
Analiza datelor de marketing

Gruparea vizuală a valorilor pe baza histogramei

Procedura ”Visual Binning” permite gruparea valorilor variabilelor metrice


sau ordinale în grupuri având ca element vizual de referință histograma aferentă
variabilei selectate ”Current Variable”.

Figura 133. Fereastra ”Visual Binning”

Principiul de funcționare nu este deloc unul complicat, definim codul și


eticheta variabilei noi ”Binned Variable” și apoi apăsăm butonul ”Make Cut
Points” pentru a defini numărul valorilor de secționare (ce delimitează intervalele),
poziția primei valori de secționare sau dimensiunea intervalelor egale. În momentul
în care definim oricare două din cele trei elemente enunțate mai sus cea de-a treia
este definită automat pe baza primelor două.

În fereastra noastră valorile de secționare sunt reprezentate prin intermediul


liniilor verticale ale căror poziție poate fi modificată prin deplasarea cursorului
către stânga sau dreapta menținând apăsat butonul dreapta al mouse-ului.

În tabelul de sub histogramă putem edita etichetele aferente fiecărui interval


definit prin valorile de segmentare, codurile acestora fiind alocate în mod automat
începând cu valoarea 1 pentru intervalul cu valori minime.

Această modalitate vizuală de împărțire a unei variabile continue în intervale


egale sau inegale pe baza poziționării valorilor de segmentare pe histograma
Analiza datelor de marketing

variabilei este deosebită pentru simplul fapt că ne permite să profităm de graficul


distribuției pentru a izola anumite grupuri de valori mai mult sau mai puțin
populare în fiecare interval.

Există și o variantă automatizată a acestui proces, ”Optimal Binning”, care


realizează această divizarea a unei variabile continue în intervale folosind ca ghid o
variabilă nominală foarte asemănătoare cu rezultatul final dorit al procesului. Există
posibilitatea salvării parametrilor de divizare pentru a fi utilizate cu alte ocazii (alte
variabile din baza de date sau cu ocazia altor analize).

Atribuirea rangurilor

În situația în care ne confruntăm cu variabile metrice care nu au un număr


suficient de mare de variante unice de răspuns sau acestea nu sunt distribuite
corespunzător se impune necesitatea transformării acestora în ranguri. Procedura
”Rank Cases” din meniul ”transform” este ideală în acest caz.

Valorile unice înregistrate pe variabila analizată sunt ordonate (crescător sau


descrescător) pentru ca apoi variabila nou creată să primească un număr de ordine
(rang) în locul valorilor continue.

Figura 134. Fereastra ”Rank Cases”

Avem posibilitatea de a începe numerotarea rangurilor începând cu scorul


corespunzător valorii maxime sau minime deși de cele mai multe ori rangul 1
aparține valorii celei mai mici (cea mai apropiată de originea scalei).

Putem organiza rangurile în subgrupuri prin selectarea uneia sau mai multor
variabile de grupare în câmpul ”by”, rangurile fiind în acest caz definite pentru
fiecare grup în parte.
Analiza datelor de marketing

În cazul în care intenționăm să utilizăm o metodă de analiză care nu


tolerează existența non-răspunsurilor suntem nevoiți să găsim o soluție de eliminare
a acestor valori lipsă care să nu presupună eliminarea completă înregistrărilor
respective dar care în același timp să aibă un impact cât mai mic asupra rezultatelor
cercetării (să nu reprezinte o potențială sursă de erori).

În meniul ”transform” găsim o procedură deosebit de utilă, ”replace missing


values” care ne ajută cu completarea valorilor lipsă utilizând un număr de cinci
alternative de calcul:
▪ Valoarea medie a variabilei, ”series mean”;
▪ Media valorilor învecinate, ”mean of nearby points”;
▪ Mediana valorilor învecinate, ”median of nearby points”;
▪ Interpolare liniară;
▪ Trend liniar ”linear trend at point”.

Pentru variantele de utilizare a mediei și medianei valorilor învecinate avem


posibilitatea definirii numărului de valori ce vor fi luate în considerare în mod
simetric de o parte și cealaltă a poziției valorii lipsă.

Atribuirea de ponderi cazurilor

Prin accesarea meniului ”Data/Weight Cases” putem atribui fiecărei


înregistrări o pondere egală cu valoarea variabilei de frecvență de pe linia
respectivă. Unele proceduri de lucru pot ignora ponderile cazurilor dar pentru
siguranța analizei este important să dezactivăm aceste ponderi prin selectarea ”Do
Not Weight Cases”.

Figura 135. Atribuirea de ponderi cazurilor

S-ar putea să vă placă și