Sunteți pe pagina 1din 4

Cursul 12 Cercetări de mk.

/MK II

Analiza datelor în cercetările de marketing


(măsurarea asocierii dintre două variabile)

1.Introducere

După numărul de variabile, există trei situaţii:


-cu o variabilă
-cu două variabile
-cu trei sau mai multe variabile.

Pentru o variabilă, nu se poate vorbi de asociere propriu-zisă, ci de un


test de semnificaţie statistică.
Cel mai cunoscut test din această categorie este testul (hipătrat)
pentru o variabilă.

Pentru două variabile, măsurarea gradului de asociere se face prin


intermediul testelor de semnificaţie statistică şi a coeficienţilor de asociere.

TESTELE DE SEMNIFICAŢIE STATISTICĂ au rolul de a determina


existenţa asocierii între variabile, asociere care să nu fie datorată hazardului
(întâmplării).
Altfel spus, ARATĂ DACĂ EXISTĂ ASOCIERE.

COEFICIENŢII DE ASOCIERE sunt mărimi abstracte, fără unitate de


măsură, care exprimă intensitatea asocierii, iar uneori şi sensul asocierii.
Totodată, există posibilitatea calculării, în aceeaşi situaţie, a mai multor
coeficienţi de asociere. Altfel spus, diferă interpretarea lor.
Altfel spus, ARATĂ INTENSITATEA ASOCIERII (ARATĂ CÂT DE
MARE ESTE ASOCIEREA).

Măsurarea asocierii dintre 2 variabile poate fi realizată cu ajutorul:


-testelor de semnificaţie statistică, între care foarte cunoscut este testul
(“hipătrat”) pentru două variabile
-coeficienţilor de asociere bazaţi pe :
Φ (“fi”)
V (al lui Cramer)
C (al lui Pearson)

Există și alte teste de semnificaţie statistică și alți coeficienţi de


asociere.
Testul hipătrat și coeficienții de asociere bazaţi pe hipătrat sunt însă
uşor de înţeles şi uşor de aplicat.
1
2. Testul hipătrat pentru două variabile

Pe baza tabelelor de frecvenţă încrucişată, se poate aplica testul hipătrat


 ) pentru două variabile.

Sensul aplicării testului  este determinarea existenţei unei asocieri clare


între două variabile, asociere care să nu fie datorată întâmplării.
Testul  pentru două variabile se poate aplica în următoarele CONDIŢII:
-frecvenţele reale şi aşteptate să nu aibă valori prea mici (adică să fie de
minim 5 unități; dacă valorile sunt sub 5, se pot aduna unele rânduri sau
coloane);
-eşantionul să includă cel puţin 40 de unități.

Etapele aplicării testului  pentru 2 variabile sunt:


a). Determinarea valorii lui calculat
b). Căutarea valorii lui teoretic
c) Formularea ipotezei nule
d). Verificarea ipotezei nule.

a). Determinarea valorii lui calculat, cu formula:

unde:
Rij=frecvenţele rezultate din sondaj (reale);
Aij=frecvenţele teoretice (aşteptate)
r= nr. de rânduri ale tabelului;
k = nr. de coloane ale tabelului.
Frecvenţele teoretice (Aij) se calculează ca proporţii, considerând că
proporţiile calculate pe liniile tabelului sunt aceleaşi şi în subeşantioanele
aflate pe coloane, în tabel.

b). Căutarea valorii lui teoretic, (în tabele cu valoarea lui hipătrat
teoretic) pentru (r-1) (k-1) grade de libertate şi o probabilitate de garantare a
rezultatului de cel puţin 95%, unde r este numărul de rânduri, iar k numărul de
coloane ale tabelului de contingenţă.
Gradele de libertate reflectă mărimea tabelelor (numărul de linii şi de
coloane), care pot fi diferite de la o situaţie la alta.

c) Formularea ipotezei nule, conform căreia NU EXISTĂ O ASOCIERE


CLARĂ ÎNTRE CELE DOUĂ VARIABILE STUDIATE (a doua variabilă nu o
influenţează pe prima).

2
d). Verificarea ipotezei nule.
Ipoteza nulă SE ACCEPTĂ dacă calculat2teoretic, pentru un (r-1) (k-1)
grade de libertate şi o probabilitate de garantare a rezultatului de cel puţin 95%,
unde r este numărul de rânduri, iar k numărul de coloane ale tabelului de
contingenţă.
Dacă ipoteza nulă se acceptă, nu există o asociere clară între cele
două variabile studiate.
Ipoteza nulă SE RESPINGE dacă 2calculat2tabelat (teoretic), ceea ce
înseamnă că există o asociere clară între cele două variabile studiate.

Observaţie: cu ajutorul valorii lui 2calculat se poate studia şi


segmentarea pieţei (stabilirea ordinii criteriilor de segmentare).

3. Coeficienţii de asociere bazaţi pe hipătrat

Între cei mai folosiţi coeficienţi de asociere bazaţi pe valoarea


calculată a lui 2 sunt:
-coeficientul Φ (“fi”)
-coeficientul V al lui Cramer
-coeficientul de contingenţă (C) al lui Karl Pearson.

Coeficientul
unde n este mărimea eşantionului.
Aplicarea acestui coeficient se poate face doar dacă tabelul are fix 2
rânduri şi 2 coloane. Φ are valoarea între 0 şi 1.

Coeficientul V al lui Cramer:


unde s=min (r, k), adică minimul între numărul de rânduri şi de coloane ale
tabelului.
Condiţia este ca tabelul să aibă mai mult de 2 rânduri sau 2 coloane.
Coeficientul V are valoarea tot între 0 şi 1.

Coeficientul de contingenţă (C) al lui Karl Pearson:

Coeficientul de contingenţă (C) ridică unele probleme în interpretare:


a)valoarea lui C nu este niciodată 1, ca în cazul altor coeficienţi de corelaţie. Ca
urmare, coeficientul C este mai greu de interpretat în ceea ce priveşte limita
superioară.
b)Când tabelul este mai voluminos (peste 8-10 coloane), C tinde spre 1; de
3
aceea, se recomandă mai ales pentru tabele de mari dimensiuni (peste 8-
10 coloane).
Tabelul nr. 1.
Coeficienţi de asociere bazaţi pe

Nr. Coeficientul Condiţii de aplicare Limitele Interpretare


crt. (caracteristicile coeficientului
tabelului de
contingenţă)
2 linii şi 2 coloane. 0 Φ 1 Φ =0 lipsa asocierii
1.
Φ =asociere perfectă
Mai mult de 2 V 1 V=0 lipsa asocierii
rânduri sau V=1 asociere perfectă
2.
coloane în tabel.
Se recomandă mai 0C1 C=0 lipsa asocierii
3. ales pentru tabele C asociere puternică
de mari dimensiuni (C tinde spre 1)
(peste 8-10
coloane)

Interpretarea tuturor celor 3 coeficienţi se face împreună cu


interpretarea rezultatului testului 2 pentru două variabile, ale cărui
concluzii le confirmă.
Altfel spus, aplicaţiile care cer calcularea coeficientului de asociere
au 2 cerinţe:
a) testul pentru două variabile
b) coeficientul de asociere.

În toate situaţiile se pot calcula doi dintre aceşti trei coeficienţi, primii
doi (Φ şi V) excluzându-se reciproc.
În interpretarea coeficientului de contingenţă (C), trebuie ţinut seama de
limitele că acesta nu atinge niciodată valoarea 1 la limita sa superioară, spre
deosebire de ceilalţi doi coeficienţi de asociere.

OBSERVAȚIE: VEZI SEMINAR (aplicații).

Analiza datelor pentru trei sau mai multe variabile: sunt necesare
programe speciale de analiză a datelor.

S-ar putea să vă placă și