Sunteți pe pagina 1din 4

AACPI, Data mining, 2022 Conf. Univ.

dr Maer Matei Monica

Pași parcurși pentru a construi experimentul conjoint cu ajutorului mediului


statistic R

Întrebarea la care urmărește să răspundă aplicaţia dezvoltată în cadrul acestui capitol este
următoarea: Care este contribuția atributelor ce definesc o cafea la decizia finală a unui
consumator?
Pentru aplicarea acestei analize a fost elaborat un chestionar astfel încât să simuleze procesul de
alegere a cafelei, respondenții primind sarcina de a alege dintre diferite profile de cafea. Au fost
utilizate cinci atribute pentru a defini produsul analizat, fiecare fiind reprezentat ca o variabilă
categorială cu 2 nivele astfel:
• Recipient: plastic/carton
• Lapte: da/nu
• Automat: da/nu
• Preț mai mare de 5 lei: da/nu
• Râjnită: da/nu
Prima caracteristică (Recipient) indică dacă băutura este servită în recipient de plastic sau de
carton. Dacă al doilea atribut (Lapte) va primi eticheta “da” atunci produsul conţine lapte. A treia
caracteristică este introdusă cu scopul de a investiga preferinţele consumatorilor privind modul de
preparare al cafelei. Cele două variante propuse sunt: cafea preparată de un automat de cafea sau
preparată în cadrul unei cafenele de către o persoană. Variabila preţ este construită ca o variabilă
categorială cu 2 nivele şi va arată în ce măsură consumatorii sunt dispuşi să plătească mai mult de
5 lei pentru o cafea. Ultima caracteristică (Râjnită), va reflecta cât de important este ca băutura
cumparată să fie preparată din cafea râjnită, alternativa fiind produsele instant.
Pentru implementarea unei soluții care să răspundă la această întrebare am folosit biblioteca
support.CE din mediul statistic R (Aizaki, 2012). Pașii parcuși în acest proces pot fi sintetizați
astfel:
- Generarea setului complet de profile în care fiecare atribut este descris de două nivele.
Numărul total de profile posibile rezultate din combinații ale nivelelelor luate de cele 5
atribute este de 32.
- Au fost extrase aleator 6 de profile dintre cele 32 de profile posibile.
- A fost generată matricea experimentului. Aceasta constă în şase sarcini. Fiecare sarcină
constă în alegerea profilului preferat din două alternative. Există două metode de
generare a matricii: ”metoda rotirii” şi metoda „mix and match”. Prima se bazează pe
următorul raţionament: vom avea o “urnă”cu profile care va fi folosită pentru a extrage
aleator prima alternativă din fiecare întrebare/sarcină. Acestea provin dintr-un vector
de profile ortogonal. A doua alternativă a fiecărei sarcini se obține adăugând o
constantă (în cazul nostru 1) la fiecare nivel al atributelor din prima alternativă. În
cadrul celei de a doua metode de generare a matricii experimentului conjoint, se
populează și a două „urnă” prin aceeași metodă de adăugare a unei constante. În acest
AACPI, Data mining, 2022 Conf. Univ.dr Maer Matei Monica

caz, o pereche de profile ce va constitui o sarcină din cadrul unui bloc, se va obține
extrăgând aleator un profil din prima urnă și unul din cea ce-a doua. În cadrul aplicaţiei
descrise în acest capitol a fost utilizată a doua metodă.
- Transformarea acestei matrici în chestionar.

Question 1
alt.1 alt.2
Recipient "carton" "plastic"
Lapte "nu" "nu"
Automat "nu" "da"
Pretpeste5 "nu" "nu"
Rajnita "nu" "nu"

Question 2
alt.1 alt.2
Recipient "plastic" "carton"
Lapte "nu" "da"
Automat "da" "nu"
Pretpeste5 "da" "nu"
Rajnita "nu" "da"

Question 3
alt.1 alt.2
Recipient "carton" "carton"
Lapte "da" "nu"
Automat "da" "da"
Pretpeste5 "nu" "da"
Rajnita "da" "da"

Question 4
alt.1 alt.2
Recipient "carton" "plastic"
Lapte "da" "nu"
Automat "nu" "nu"
Pretpeste5 "da" "da"
Rajnita "da" "nu"

Question 5
alt.1 alt.2
Recipient "plastic" "plastic"
Lapte "da" "da"
Automat "nu" "da"
Pretpeste5 "nu" "da"
Rajnita "nu" "da"

Question 6
alt.1 alt.2
Recipient "plastic" "carton"
Lapte "nu" "da"
Automat "nu" "da"
Pretpeste5 "nu" "da"
Rajnita "da" "nu"

Figura 5.1 Sarcinile respondenţilor


Experimentul descris aici conţine un singur bloc, ceea ce înseamnă că toţi respondenţii au primit
aceleaşi sarcini. Prima întrebare solicită respondentului să evalueze următoarele două profilele:
AACPI, Data mining, 2022 Conf. Univ.dr Maer Matei Monica

- Alternativa 1 - recipient de carton, fără lapte, preparat la o cafenea, preţ care nu


depăşeşte 5 lei, preparată din alte ingrediente decât cafea râjnită
- Alternativa 2- recipient de plastic, fără lapte, achiziţionată de la un automat, preţ sub
pragul de 5 lei, preparată din alte ingrediente decât cafea râjnită.
Pentru a continua analiza de tip conjoint informaţiile conţinute în matricile generate anterior vor
fi completate cu o matrice a răspunsurilor de forma:

Figura 5.2 Matricea răspunsurilor


În această matrice pe fiecare rând vom avea alegerile făcute de fiecare respondent. De exemplu,
din prima linie a matricii extragem următoarele informații: individul identificat cu codul 1 a primit
întrebările din blocul 1, la prima întrebare a ales profilul 1, la a doua întrebare a ales profilul 1, la
întrebarea trei a preferat alternativa a doua. Pentru a putea estima utilitățile asociate fiecărui atribut
informațiile oferite de cele două matrici se combină sub forma unei matrici care va constitui
argumentul funcției care estimează modelul logit condiționat.

Figura 5.3 Setul de date pe care se estimează logit condiționat

În cadrul acestei matrici unui respondent i se alocă un număr de linii egal cu produsul dintre
numărul de întrebări din blocul repartizat acestui și numărul de alternative din cadrul unei întrebări.
În studiul nostru, fiecărui respondent îi sunt asociate 12 linii. În consecință matricea completă va
avea 6000 de linii. Sunt două variabile noi specifice acestei matrici: variabila RES și variabila
STR.
RES este o variabilă care indică dacă respondentul a ales profilul prezentat pe linia respectivă.
Variabila STR este o combinație între codul de identificare al respondentului și numărul întrebării
plasate pe linia respectivă. Coloanele 7-11 reprezintă atributele care caracterizează fiecare profil.
AACPI, Data mining, 2022 Conf. Univ.dr Maer Matei Monica

Pentru acestea am utilizat următoarea codificare: 1 – dacă recipientul este din carton, 0 - dacă
recipientul este din plastic, 1 - cafeaua este fară lapte, 0 - cafeaua este cu lapte, 1 – cafeaua nu
este de la automat, 0 - cafeaua este de la automat, 1 – preț sunt 5 lei, 0 - preț peste 5 lei, 1 –
produse instant, 0 - cafea râjnită.

Dimensiunea redusă a eșantionului corelată cu structura răspunsurilor și a matricii profilelor au


făcut ca modelul construit să nu permită estimarea coeficienților pentru variabila pret.
Tabel 5.1 Coeficienţii modelului logit condiţionat

Această analiză a avut ca scop identificarea acelor atribute importante pentru consumatorii de cafea
și a nivelelor acestora care aduc o utilitate mai mare. În condiţiile în care coeficienţii estimaţi ar fi
semnificativi statistic, o astfel de analiză ar conduce la următoarele concluzii:
- Șansele ca o cafea fără lapte să fie selectată sunt cu 58% mai mici decat sansele ca o cafea
cu lapte să fie selectată.
- Șansele ca un consumator să aleagă o cafea care este preparată la o cafenea sunt cu 60%
mai mari decât șansele unei cafele de la automat
- Șansele ca o cafea în recipient de carton să fie selectată sunt cu 48% mai mari decât în
cazul recipientului de plastic.
- Respondenții preferă cafeaua cu lapte, preparată manual, în recipient de carton.
- În ceea ce privește ultima caracterstică privind conţinutul băuturii, coeficientul estimat nu
este semnificativ statistic, p-value fiind de 0.911, foarte mare față de valoarea lui p-value
asociat celorlalte variabile. Acest rezultat sugerează că această caracteristică nu
influenţează decizia consumatorilor. Însă este posibil ca valoarea nesemnificativă a acestui
atribut să fie o consecinţă a faptului ordinea în care apar atributele în sarcinile din
chestionar nu a fost schimbată de la o întrebare la alta. Se apelează la astfel de procedee
pentru a ţine respondentul cât mai activ, evitând automatismele.

Referinţe
Aizaki, H. (2012). Basic functions for supporting an implementation of choice experiments in R. Journal
of statistical software, 50, 1-24.

S-ar putea să vă placă și