Sunteți pe pagina 1din 8

MODALITI DE ANALIZ BIVARIAT

ANALIZA GRADULUI DE ASOCIERE

n cercetrile de marketing, de obicei, analiza univariat prin considerarea separat a variabilelor, ca cea prezentat mai sus, reprezint doar nceputul. Un obiectiv important n procesul de analiz l reprezint n continuare analiza bivariat, care presupune aspectul: direciei (naturii); intensitii; semnificaiei statistice. msurarea gradului de asociere a dou variabile sub

Acest obiectiv se realizeaz cu ajutorul a diferite metode, funcie de tipul de scal utilizat pentru msurarea datelor. Dup ce n sptmna trecut am prezentat modul de analiz al asocierilor n cazul n care variabilele sunt msurate pe scala ordinal, n aceast sptmn vom continua prezentarea analizei bivariate a asocierilor, continund cu variabilele msurate pe scalele ordinale.

Variabilele ordinale
Msurarea gradului de asociere ntre dou variabile msurate cu ajutorul scalelor ordinale este mai plin de semnificaii deoarece, n afara relaiei de echivalen presupus de o scal nominal, tipul de scal ordinal permite i ordonarea alternativelor cercetate pentru fiecare variabil considerat. n cazul variabilelor de tip ordinal se poate face afirmaia c acestea variaz concomitent ntr-o anumit direcie, care poate fi pozitiv (variaia ambelor variabile se realizeaz n acelai sens) sau negativ (variaia celor dou variabile are loc n sensuri diferite).

Relaiile de asociere pot fi analizate sub forma relaiilor dintre rangurile alternativelor considerate pentru cele dou variabile, fie sub forma relaiilor dintre variabilele de tip ordinal. Considernd prima modalitate de cercetare a variabilelor considerate, sub forma relaiilor dintre ranguri, s considerm urmtorul exemplu: 15 companii de turism A, B, C, D, E, F, G, H, I, J, K, L, M, N, O ocup locurile 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 i respectiv 15 n ceea ce privete profitabilitatea realizat la sfritul anului i locurile 2, 4, 1, 5, 3, 7, 6, 9, 8, 11, 12, 10, 14, 15 i respectiv 13 n ceea ce privete gradul de ocupare a locurilor de cazare. Pentru msurarea gradului de asociere dintre rangurile deinute de cele 15 companii n privina profitabilitii, pe de o parte i a gradului de ocupare a locurilor de cazare pe de alt parte, se poate utiliza coeficientul lui Spearman de corelaie a rangurilor, . Formula de calcul a acestuia este urmtoarea:
= 1
6 Di2 n(n 1)
i =1 2 n

unde: - reprezint coeficientul de corelaie a rangurilor al lui Spearman; Di - diferena ntre cele dou ranguri deinute de compania i; n - mrimea eantionului (numrul de companii). Calculele necesare pentru aplicarea acestei formule sunt prezentate n tabelul nr.1. Tabelul 1. Rangurile deinute de cele 15 companii de turism cuprinse n eantionul cercetat Rangul deinut n ceea ce privete Compania Profitabilitatea A B 1 2 Gradul de ocupare 2 4 1 2 1 4 Di
Di2

C D E F G H I J K L M N O

3 4 5 6 7 8 9 10 11 12 13 14 15

1 5 3 7 6 9 8 11 12 10 14 15 13

2 1 2 1 1 1 1 1 1 2 1 1 2

4 1 4 1 1 1 1 1 1 4 1 1 4

Folosind datele din tabelul nr. 20.3 rezult c:


= 1
6 30 = 0,94 15(15 2 1)

tiut fiind faptul c poate lua valori ntre 1 (acesta indic o corelaie invers perfect) i +1 (corelaie pozitiv perfect), iar zero reprezint lipsa total de asociere dintre cele dou variabile, n exemplul considerat se poate afirma c ntre cele dou variabile, profitabilitatea companiilor de turism i gradul de ocupare a locurilor de cazare, exist o corelaie direct i foarte intens. Pentru a testa gradul de semnificaie statistic a coeficientului de corelaie obinut (testul se poate realiza numai dac n>10) se formuleaz ipoteza nul: H0: pentru populaia statistic cercetat =0 i ipoteza alternativ H1: pentru populaia statistic cercetat 0. Dintr-un tabel statistic al repartiiei normale, pentru un nivel de ncredere de 0,99 (sau 0,94), valoarea coeficientului Z (coeficientul care corespunde probabilitii cu care se garanteaz rezultatele) este de 2,58. Pentru determinarea valorii calculate Zc se folosete urmtoarea formul: 3

Zc =

-0
1 n 1

0,94 = 3,54 1 14

tiind c dac - Zteoretic Zc Zteoretic, - se accept ipoteza nul H0 ,iar n caz contrar se accept ipoteza alternativ H1, n exemplul considerat concluzia este c se accept H1, adic valoarea coeficientului de corelaie a rangurilor n populaia statistic cercetat difer n mod semnificativ de zero. Dac se impune a doua modalitate de cercetare a relaiilor de asociere, sub forma relaiilor dintre variabilele de tip ordinal i dac n cercetarea relaiilor dintre ranguri mai multe alternative sunt la egalitate, atunci se apeleaz la coeficientul al lui Goodman i Kruskal. Cu prilejul unei expoziii culinare, s presupunem c se organizeaz i degustarea de ctre un eantion de 300 de persoane a unui preparat culinar dietetic, culegndu-se informaii privitoare la inteniile acestora de a consuma n viitor preparatul respectiv (inteniile sunt prezentate pe cinci niveluri, de la categoria 1 sigur va cumpra, la categoria 5 sigur nu va cumpra). Pornind de la datele culese, se urmrete, printre altele, dac exist sau nu o corelaie ntre inteniile de cumprare ale produsului culinar dietetic testat i vrst. Pentru realizarea acestui obiectiv, datele se organizeaz n tabelul urmtor: Tabelul 2. Repartizarea inteniilor de cumprare n funcie de vrst Categorie de vrst 1 (sub 20 ani) 2 (20 40 ani) 3 (40 50 ani) 4 (peste 50 ani) 1 5 10 20 35 Inteniile de cumprare 2 10 10 15 25 3 15 15 15 20 4 20 20 10 5 5 25 20 5 1

Chiar fr a calcula un coeficient care s sintetizeze gradul de asociere dintre cele dou variabile, din simpla analiz a tabelului nr.20.4 rezult c ntre inteniile de cumprare i vrst pare s fie o corelaie invers, n sensul c, cu ct persoanele avanseaz n vrst, inteniile de cumprare a produsului culinar dietetic sunt mai pronunate. 4

Calculul coeficientului al lui Goodman i Kruskal se face folosind urmtoarea formul:


P-Q P+Q

unde: P i Q sunt valori calculate, dup cum se arat mai jos. Pentru a obine valoarea lui P se ncepe prin a nmuli frecvena din colul din stnga-sus cu suma frecvenelor aflate mai jos cu un rnd i la dreapta; astfel: 5 (10+15+20+20+15+15+10+5+25+20+5+1) = 805 Apoi, procesul continu n acelai mod, considernd frecvena de sus a celei de-a doua coloane: deci 10 (15+20+20+15+10+5+20+5+1) = 1110. n continuare, se consider frecvena de sus a coloanei a treia i anume: 15 (20+20+10+5+5+1) = 915 n sfrit, n cazul frecvenei de sus a coloanei a patra rezult: 20 (20+5+1) = 520 Mai departe, se consider frecvenele situate pe rndul doi i trei, respectiv: 10 (15+15+10+5+25+20+5+1) = 960 10 (15+10+5+20+5+1) = 560 15 (10+5+5+1) = 315 20 (5+1) = 120 20 (25+20+5+1) = 1020 15 (20+5+1) = 390 15 (5+1) = 90 10 (1) = 10 nsumnd toate produsele obinute mai sus se obine P = 6815. Pentru calculul lui Q se procedeaz dup aceeai regul ncepndu-se din colul din dreapta-sus i mergnd de la dreapta spre stnga. Dup efectuarea tuturor calculelor rezult Q = 20800. n aceste condiii =
6815 - 20800 = - 0,50 6815 + 20800

Cunoscnd c poate lua valori n intervalul 1 i +1, ca i n cazul lui , n exemplul considerat se poate face afirmaia c ntre inteniile de cumprare ale produsului culinar dietetic testat i vrst exist o corelaie invers destul de intens.

Variabilele parametrice
n cazul scalelor metrice (interval sau proporionale) se tie c este posibil i msurarea distanelor dintre alternative, ceea ce mbogete mult cantitatea i calitatea informaiei ce se poate obine. De data aceasta direcia (natura), intensitatea i semnificaia statistic a gradului de asociere dintre dou variabile are la baz coeficientul de corelaie al lui Pearson, r, ndeobte cunoscut sub denumirea de coeficient de corelaie. Acesta permite s se stabileasc i mrimea modificrii unei variabile,ca urmare a modificrii altei variable, indiferent de unitile folosite pentru msurarea lor. Calculul coeficientului de corelaie, are la baz, n afar de cerina ca pentru msurare s se fi utilizat scale metrice i urmtoarele presupuneri referitoare la natura datelor folosite: variabilele considerate sunt conceptualizate ca fiind continue; repartiia tuturor valorilor fiecrei variabile este normal; distribuia comun a valorilor celor dou variabile considerate, trebuie s evidenieze o legtur liniar i dispersii egale ale tuturor valorilor variabilelor. S presupunem c se urmrete s se stabileasc dac exist o corelaie ntre modificarea venitului naional n ultimii 6 ani ntr-o ar oarecare i circulaia turistic intern din ara respectiv (cheltuielile pentru turism ale populaiei). n tabelul nr.20.5 se prezint indicii cu baz fix ai celor dou variabile considerate n cei 6 ani i calculele necesare pentru determinarea lui r. Avnd la dispoziie datele tabelului nr.3, pentru calculul coeficientului de corelaie se folosete urmtoarea formul: 6

r=

n XY - X Y
n x ( X ) n Y ( Y )
2 2 2 2

r=

1045,32 = 0,99 6 76776.08 458058.24 6 66430.26 398161 1045,330481 =

6 71351,02 - 676,8 631

Tabelul 3. Evoluia venitului naional i a cheltuielilor pentru turism ale populaiei Venitul naional (X) 100,0 105,4 110,6 115,6 120,4 124,8 X = 676,8 N=6 (X) = 458058,24
2

Cheltuieli pentru turism (Y) 100,0 102,2 104,3 106,3 108,2 110,0 Y=631,0 (Y) = 398161
2

Anul

X2

Y2

XY

1 2 3 4 5 6

10000,00 11109,16 12232,36 13363,36 14496,16 15575,04 X2= 76776,08

10000,00 10444,84 10878,49 11299,69 11707,24 12100,00

10000,00 10771,88 11535,58 12288,28 13027,28 13728,00

Y2=66430,2 XY= 6 71351,02

tiind c, la fel ca n cazul coeficientului de corelaie a rangului i r poate lua valori ntre -1 i +1, n exemplul considerat se poate afirma c cele dou variabile, venitul naional i circulaia turistic intern sunt foarte strns corelate, iar asocierea este pozitiv. Dac r, coeficientul de corelaie, se ridic la ptrat rezult coeficientul de determinare, r2=0,98, care indic proporia variaiei explicate a uneia din variabile (98 %) de ctre cealalt variabil. De data aceasta este posibil compararea a doi coeficieni de determinare i evidenierea diferenei dintre ei n ceea ce privete variaia explicat. Pentru a testa gradul de semnificaie statistic a coeficientului de corelaie obinut (testul se poate realiza pentru orice mrime a eantionului) se formuleaz ipoteza nul. H0: pentru populaia statistic cercetat r=0 i ipoteza alternativ 7

H1: pentru populaia statistic cercetat r0. Din tabelul statistic al repartiiei normale, pentru un nivel de ncredere de 0,99, valoarea coeficientului Z (coeficientul care corespunde probabilitii cu care se garanteaz rezultatele) este de 2,58. Pentru determinarea valorii calculate Zc se folosete urmtoarea formul:
1+ r 1,1513 + log10 -0 1 - r = 4,58 Zc = 1 n3

Cunoscnd c dac - Zteoretic Zc Zteoretic, se accept ipoteza nul H0, iar n caz contrar se accept ipoteza alternativ H1, n exemplul considerat concluzia este c se accept H1, adic valoarea coeficientului de corelaie n populaia statistic cercetat difer n mod semnificativ de zero.

S-ar putea să vă placă și