Sunteți pe pagina 1din 33

CAP.

10 ANALIZA DATELOR DE MARKETING



10.1 Criteriile alegerii metodelor de analiz a datelor de marketing

Dup obinerea i pregtirea datelor primare urmeaz procesul de analiz a
acestora.
Analiza datelor de marketing este un proces complex ce presupune
parcurgerea unor etape succesive de aprofundare a cercetrii, care necesit
utilizarea unui instrumentar tiinific adecvat.
Alegerea corect a metodelor de analiz a datelor impune luarea n
considerare, simultan, a trei aspecte, i anume:
a. a numrului de variabile care trebuie analizate simultan: atunci cnd se
are n vedere o singur variabil vor fi utilizate metode specifice analizei
univariate, cnd sunt dou variabile se va face apel la metodele analizei
bivariate, iar atunci cnd sunt mai multe variabile vor fi utilizate
metodele analizei multivariate;
b. a ceea ce se dorete ca tip de analiz, adic fie o analiz la nivelul
eantionului avut n vedere, fie o caracterizare a populaiei care a fcut
obiectul cercetrii. n prima situaie se va realiza o descriere a
eantionului prin intermediul statisticii descriptive, iar n a doua situaie
se vor utiliza metodele statisticii infereniale;
c. a tipurilor de scale utilizate n msurarea variabilelor cercetrii.
Variabilele calitative, i, respectiv, variabilele metrice, impun , fiecare n
parte, anumite metode statistice de prelucrare a datelor primare.



10.2 Analiza preliminar a datelor de marketing

Cea mai simpl procedur de analiz este aceea cnd se are n vedere
statistica descriptiv n cazul unei singure variabile i a unui singur eantion.
[17, 107-119] Aceasta nseamn o prelucrare a datelor obinute din rspunsurile
date la fiecare din ntrebrile eantionului. n funcie de scala folosit n msurarea
datelor, vor fi utilizate, ca un prim nivel de aprofundare a investigaiei, urmtoarele
metode de analiz univariat:

o dac variabila a fost msurat cu scala nominal, descrierea acesteia se va
realiza calculnd frecvenele absolute i relative (inclusiv procentele) pe
categorii, incluse ntr-un tabel, i stabilind apoi modulul;
o dac variabila a fost msurat cu scala ordinal, analiza acesteia va
consta n realizarea unei ordonri pe baza scorurilor medii, i apoi
stabilirea medianei sau a intervalului median;
o dac variabila a fost msurat cu scala interval, se va determina media
aritmetic, dispersia (variana) i abaterea standard; pot fi utilizate i
metodele anterioare specifice variabilelor calitative;
o variabila msurat cu scala proporional, va oferi, n plus, fa de
metodele menionate anterior, i calculul mediei geometrice sau a celei
armonice. Rezult din menionrile deja fcute c o scal mai evoluat
permite utilizarea statisticii descriptive specifice scalelor anterioare.

Un al doilea nivel de aprofundare a investigaiei datelor de marketing este
acela care presupune punerea n corelaie a unei variabile cu o alt variabil.
Aceast analiz a legturii dintre dou variabile, care este o expresie a analizei
bivariate, se poate face avnd n vedere dou situaii, i anume:
- ca o analiz a unei legturi posibile ntre o variabil, respectiv o
ntrebare, i o alt variabil, respectiv o alt ntrebare, alta dect o
variabil de caracterizare a subiecilor;
- ca o analiz a unei legturi posibile ntre o variabil a cercetrii i o
variabil de caracterizare a subiecilor (sex, educaie, venituri, profesie,
stare civil etc.)

Pentru evidenierea acestor legturi, ca statistic descriptiv, se poate utiliza
metoda tabelrii ncruciate . Ea const n dispunerea n cadrul unor tabele a
datelor aferente celor dou variabile, pe grupuri, categorii sau clase cu scopul de a
face comparaii. Aceste tabele se mai numesc tabele de contingen n msura n
care cuprind totalurile pe rnduri i pe coloane, datele respective fiind exprimate,
fie ca mrimi absolute, fie ca mrimi procentuale.
O alt metod de evideniere a legturii dintre dou variabile msurate
metric, este ceea ce se numete harta evalurilor sau analiza cadranelor. n acest
caz se realizeaz evaluarea caracteristicilor cercetate sub forma mediilor, n cazul
fiecrei variabile n parte, i apoi se face amplasarea acestora ntr-unul din cele
patru cadrane pe care le are acest instrument de msur. Amplasarea unei
caracteristici ntr-un punct desemnat de cele dou medii, n interiorul unui cadran,
ofer informaii despre modul de evaluare a acesteia de ctre subieci.
Pentru a sesiza mai uor rezultatele obinute n cazul acestei analize
preliminarii, ca statistic a eantionului, pot fi utilizate reprezentrile grafice.
Acestea sunt adecvate tipurilor de analiz i se obin cel mai lesnicios de ctre
calculator, ca de altfel i prelucrarea statistic menionat anterior.
n prezent sunt o serie de programe specializate de prelucrare a datelor de
marketing ce acoper practic toate metodele de analiz statistic a datelor de
marketing. n acest sens, unul din cele mai performante pachete de programe este
SPSS sub diferitele sale variante: SPSS 7.5, SPSS 8.5 for Windows, SPSSX etc.
Alte pachete de programe mai sunt: SAS, SYSTAT, MINITAB, EDUSTAT,
STATPAK.
Sunt i o serie de programe de genul Spreadsheet Pakages precum LOTUS 1-
2-3, QUATTRO PRO sau EXCEL (97 sau 2000) care sunt utile managementului
bazelor de date i care au ncorporate unele programe pentru analiza descriptiv,
analiza pe baz de grafice i o analiz statistic limitat. Deosebit de important este
faptul c programul SPSS, spre exemplu, poate prelua i apoi prelucra datele
introduse n programele EXCEL.

10.3 Testarea ipotezelor cercetrii.

Cercetrile descriptive i cercetrile cauzale, bazate pe eantioane
probabilistice, reprezentative, impun cunoaterea variabilelor cercetrii la nivelul
populaiei cercetate. Aceast cunoatere necesit realizarea inferenei sau
extrapolrii rezultatelor obinute n cadrul statisticii descriptive asupra populaiei
din care a provenit eantionul. Statistica inferenial permite deci estimarea
parametrilor populaiei cu o anumit eroare i cu un anumit nivel de ncredere sau
probabilitate. De asemenea, ea permite testarea ipotezelor statistice ale cercetrii,
msurarea intensitii legturii dintre variabile, compararea diferenelor existente
ntre parametrii provenii de la diferite grupuri sau populaii. Logica inferenei
statistice se sprijin pe testele statistice.
Testele statistice, foarte numeroase, pot fi clasificate pornind de la mai multe
criterii. Cele mai importante trei criterii sunt:
criteriul parametric i neparametric. El are n vedere dac variabilele
cercetate au o distribuie normal sau un alt tip de distribuie, cunoscut sau
necunoscut precum i modul de msurare i mrimea eantionului. Un test este
parametric dac observrile provin de la populaii distribuite normal n raport
cu un parametru sau altul, dac populaiile avute n vedere au aceeai varian,
dac datele sunt msurate metric (interval sau proporional) i dac eantionul
este suficient de mare (n>30). Un test este neparametric dac distribuia
populaiei este alta dect cea normal sau nu poate fi cunoscut, dac variabilele
sunt msurate cu orice tip de scal i dac eantionul are o mrime mic (n<30);
criteriul numrului de eantioane. Se pune deci problema dac datele care fac
obiectul analizei provin de la un singur eantion sau de la mai multe eantioane.
Atunci cnd provin de la dou sau mai multe eantioane trebuie cunoscut dac
eantioanele respective sunt independente sau dependente (sau perechi).
Eantioanele sunt independente atunci cnd fiecare reprezint un grup distinct
de indivizi iar datele provin de la fiecare grup n parte. Eantioanele sunt
perechi (dependente) atunci cnd se are n vedere un singur grup de la care se
obin date n momente diferite de timp. Acest ultim tip de eantioane se
utilizeaz n cazul experimentelor de marketing, cnd de la aceleai grup se
obin date nainte i dup realizarea experimentului respectiv;
criteriul unilateral sau bilateral. n cazul unui test unilateral ipoteza nul are
n vedere o inegalitate a crui sens se anticipeaz. Spre exemplu, pornind de la
valorile observate, se caut s se afle dac o valoare care msoar un parametru
al populaiei este mai mare dect o alt valoare prag predeterminat, plasat la
una din extremitile curbei de distribuie. n acest sens, va fi un test unilateral
stnga sau un test unilateral dreapta. n cazul unui test bilateral ipoteza nul are
n vedere dou regiuni de respingere, adic se urmreste s se cunoasc dac o
valoare observat este mai mic sau mai mare comparativ cu o valoare ce
definete dou praguri de acceptare -respingere plasate la cele dou extremiti
ale curbei de distribuie.

10.3.1 Testarea ipotezelor cercetrii n condiiile unei repartiii
normale.

Sunt dou modaliti de testare a ipotezei nule:

- prin utilizarea intervalului de ncredere;
- prin determinarea raportului critic.

Utilizarea intervalului de ncredere.
n cazul unui test bilateral ipotezele sunt:

H
0
: =
0

H
1
:
0

Dac se are n vedere un test unilateral, ipotezele vor fi:

H
0
: =
0

H
1
: >
0
n cazul testului unilateral dreapta sau
H
1
: <
0
n cazul unui test unilateral stnga

unde reprezint media real a populaiei pentru variabila avut n vedere,
iar
0
reprezint media populaiei conform ipotezei nule pe care am stabilit-o.
n cazul n care se va accepta un nivel de semnificaie = 0,05, iar n > 30,
valoarea z n cazul unui test bilateral, aa cum se identific ea din tabelul
distribuiei normale (distribuia z) va fi 1,96. Considernd cunoscut abaterea
standard a populaiei, , se determin abaterea standard de la medie, adic
n
x
o
o = . Ca urmare, intervalul de ncredere va fi:

x x
o o + s s 96 , 1 96 , 1
0 0


n aceste condiii, dac media rezultat din eantion se afl n interiorul
celor dou valori care definesc limita inferioar i limita superioar a intervalului
de ncredere, inclusiv acestea, atunci ipoteza nul se accept. Dac media rezultat
din eantion este mai mare dect limita superioar sau mai mic dect limita
inferioar, atunci ipoteza nul se respinge i, ca atare, se accept ipoteza
alternativ.
n cazul unui test unilateral dreapta ipoteza nul se accept dac media
rezultat din eantion are o valoare mai mic dect limita superioar a intervalului.
Dac ea este mai mare atunci ipoteza nul se respinge. n cazul unui test unilateral
stnga ipoteza nul se accept dac media rezultat din eantion este mai mare
dect limita inferioar a intervalului de ncredere; dac va fi mai mic ipoteza nul
se respinge i se accept ipoteza alternativ. De precizat c n cazul testelor
unilaterale valoarea lui z este 1,64, ceea ce evident, va genera alte valori pentru
cele dou limite ale intervalului, comparativ cu cele ale unui test bilateral.
De cele mai multe ori nu se cunoate abaterea standard a populaiei pentru
parametrul i variabila avute n vedere. Ca atare se va estima prin abaterea
standard a eantionului, s. n aceast situaie abaterea standard de la medie a
populaiei se va estima prin abaterea standard de la medie a eantionului. Deci,
n
s
S
x x
= = o

Aceasta nseamn c intervalul de ncredere se va determina astfel:

x x
S S + s s 96 . 1 96 , 1
0 0



n cazul n care avem o mrime redus a eantionului, se va utiliza
distribuia t n vederea determinrii intervalului de ncredere. Valoarea 1,96 de
mai sus va fi nlocuit cu valoarea lui t corespunztoare unui test bilateral sau cu
valoarea lui t corespunztoare unui test unilateral, identificat n tabelul distribuiei
t n funcie de numrul gradelor de libertate i nivelul de semnificaie ales. Regula
de acceptare sau respingere a ipotezei nule rmne aceeai.
Determinarea raportului critic. n acest caz, dac avem n vedere un test
bilateral, unde:

H
0
: =
0

H
1
:
0


Valoarea raportului critic n cazul distribuiei z i a distribuiei t, n condiiile
n care se are n vedere estimarea abaterii standard de la medie a populaiei

se va
stabili astfel:

x
obs
S
x
z
0
.

=
iar
x
obs
S
x
t
0
.

=


n cazul n care se accept = 0,05, regula de decizie se va formula astfel n
cazul testului bilateral:
Dac z
obs
z
c.l.
, unde z
c.l.
reprezint valoarea lui z din tabelul distribuiei
normale n funcie de nivelul de ncredere ales (c.l.), atunci se accept ipoteza nul.
Dac z
obs
> z
c.l.
ipoteza nul se va respinge. Aceasta nseamn c la nivelul de
semnificaie menionat mai sus, n cazul unui test bilateral, ipoteza nul se va
accepta dac z
obs
va fi mai mic sau egal cu 1,96 i se va respinge dac va fi mai
mare dect 1,96. Dac z
obs
va avea valoare negativ, atunci ipotezza nul se va
accepta dac aceasta va fi mai mare dect 1,96 i se va respinge dac va fi mai
mic dect 1,96. Cu alte cuvinte, ipoteza nul se va accepta dac z
obs
se va situa
ntre 1,96 i +1,96, inclusiv, i se va respinge dac se va situa n afara acestor
valori.
n cazul testelor unilaterale, regula de decizie privind ipoteza nul va fi:
n cazul unui test unilateral dreapta se accept ipoteza nul dac z
obs
este
mai mic dect 1,96 i se respinge dac este mai mare;
n cazul unui test unilateral stnga, ipoteza nul se accept dac z
obs
este
mai mare dect 1,96 i se respinge dac este mai mic.
n situaia n care eantionul este mic, se va utiliza raportul critic pe baza
distribuiei t. Ca atare, valorile t
obs
vor fi comparate cu valorile t din tabelul
distribuiei t avnd n vedere nivelul de semnificaie ales i numrul gradelor de
libertate. Regulile de decizie privind ipoteza nul vorfi similare cu cele ale
distribuiei z, aa cum s-a menionat mai sus.
Dac parametrul cercetat este un procent, metodologia cercetrii este
identic ca cea prezentat mai sus.n esen se parcurg urmtoarele etape:
Se formuleaz ipotezele:

H
0
: =
0

H
1
:
0
n cazul unui test bilateral sau
H
1
: >
0
n cazul unui test unilateral dreapta sau
H
1
: <
0
n cazul unui test unilateral stnga

Intervalul de ncredere ce poate fi utilizat pentru testare n situaia cea mai
frecvent cnd se opteaz pentru = 0,05 i pentru un test bilateral, va fi:

p p
o t t o t + s s 96 , 1 96 . 1
0 0

Deoarece abaterea standard a populaiei n cazul procentelor
p
practic nu
poate fi cunoscut, se opteaz pentru o estimaie a acesteia S
P
, care se determin
astfel:

( )
n
S
p
0 0
100 t t
=

Deci, n relaia intervalului de ncredere de mai sus, valoarea
p
va fi
nlocuit cu valoarea S
p
.
Regula de decizie privind ipoteza nul, n contextul menionat mai sus, va fi:
dac procentul rezultat din eantion, notat cu p, se va situa ntre 1,96 i +1,96,
inclusiv, se accept ipoteza nul. Dac p va fi mai mare dect +1,96 sau mai mic
dect 1.96, atunci se respinge ipoteza nul i se accept ipoteza alternativ. n
mod similar, ca n cazul parametrului medie, se va lua o decizie cu privire la
ipoteza alternativ, n cazul testelor unilaterale ca i n cazul distribuiei t.
Metoda cea mai lesnicioas de testare a ipotezelor, ca i n cazul mediei, este
determinarea raportului critic. n cazul procentelor, n situaia distribuiei z sau t,
raportul critic se determin astfel:


P
obs
S
p
z
0
t
=

p
obs
S
p
t
0
t
=

unde:
p = procentul din eantion

0
= procentul presupus din cadrul populaiei
S
p
= estimarea abaterii standard a procentelor

Deciziile privind ipoteza nul sunt idenntice cu cele stabilite n cazul
mediilor. Astfel, dac testul este bilateral, n cazul distribuiei z, ipoteza nul se va
accepta dac valoarea z
obs
va fi mai mic dect valoarea lui z din cadrul tabelului
distribuiei normale standardizate avnd n vedere nivelul de semnificaie ales. Se
va respinge ipoteza nul i se va accepta ipoteza alternativ dac dac z
obs
va fi mai
mare dect valoarea lui z din tabelul distribuiei z. Se va proceda corespunztor n
cazul testelor unilaterale sau n situaia distribuiei t.

10.4 Analiza bivariat. Teste pentru compararea diferenelor dintre
medii i a diferenelor dintre procente.

Aceste teste au ca obiect cunoaterea deosebirilor, deci a diferenelor de
atitudine, de comportament, de caracteristici, dintre indivizii care compun dou
grupuri care pot fi independente sau perechi. Testul unei diferene reprezint o
cercetare a ipotezei care indic c dou sau mai multe grupuri difer sub aspectul
mrimii unei variabile exprimat ca medie sau ca procent.
Tipurile de teste privind diferenele dintre dou grupuri se difereniaz n
raport cu modalitile de msurare a variabilei cercetate i n raport cu tipul
grupurilor (independente sau perechi). Aceste teste pot fi parametrice i
neparametrice.

10.4.1 Teste parametrice de comparare a diferenelor.

Teste de comparare a dou medii
a) Testul z i testul t de comparare a mediilor a dou eantioane
independente. Se formuleaz ipoteza nul i se opteaz pentru una
din cele trei forme ale ipotezei alternative:

H
0
:
1
=
2
H
1
:
1

2
H
1
:
1
>
2
H
1
:
1
<
2

Se determin raportul critic:


( ) ( )
2 1 2 1
2 1 2 1 2 1
.
x x x x
x x x x
C R

=

=
o o



deoarece
1
-
2
= 0 cnd H
0
este adevrat. n relaia de mai sus
2 1
i x x
reprezint valorile medii ale primului i ale celui de al doilea eantion iar
2 1
x x
o este
abaterea standard comun a diferenelor mediilor.
Dac abaterile standard
1
i
2
sunt cunoscute iar n
1
i n
2
arat mrimea
celor dou eantioane, atunci:


2
2
2
1
2
1
2 1
n n
x x
o o
o + =


Dac abaterile standard nu sunt cunoscute, atunci abaterea standard a
diferenelor mediilor se aproximeaz prin:


2
2
2
1
2
1
2 1

n
s
n
s
x x
+ =

o


unde s
1
i s
2
sunt abaterile standard calculate pe baza primului i respectiv,
celui de al doilea eantion; sau dispersiile celor dou eantioane, aa cum figureaz
ele sub radicalul de mai sus.
Dac optm pentru un nivel de semnificaie = 0,05 i pentru un test
bilateral, atunci valorile z care vor delimita regiunea de acceptare-respingere a
ipotezei nule vor fi 1,96 i +1,96. Regula de decizie va fi:

- se accept H
0
dac valoarea raportului critic se va situa ntre 1,96 i
+1,96 inclusiv;
- se repige H
0
dac RC < -1,96 sau dac RC > 1,96.

n situaia n care cele dou eantioane independente sunt de dimensiuni
reduse (n
1
< 30 , n
2
<30) se va folosi distribuia t n ipoteza c cele dou
eantioane provin de la populaii repartizate normal i n ipoteza c varianele celor
dou populaii sunt egale. n acest caz raportul critic va fi:


2 1
2 1
x x
obs
x x
t

=
o

Deoarece este puin probabil s fie cunoscut abaterea standard comun a
diferenelor mediilor, se va realiza estimarea acesteia pe baza relaiilor de mai jos:

2 1
1 1

2 1
n n
Sc
x x
+ =

o
unde

( ) ( )
2
1 1
2 1
2
2
2 1
2
1
+
+
=
n n
n s n s
Sc


Regula de decizie va fi:

- se respinge ipoteza nul dac t
obs
> t
; df
din tabelul distribuiei t;
- se accept ipoteza nul dac t
obs
t
; df


b).Testarea diferenelor ntre medii n cazul eantioanelor perechi.
n acest caz exist observri realizate n dou momente de timp provenite de
la membrii aceluiai grup. Spre exemplu, performanele sub forma unui scor
mediu, pentru un grup de persoane care au urmat o form de perfecionare,
realizate nainte i dup parcurgerea acesteia.
Realizarea testului presupune:
- formularea ipotezei nule care arat inexistena unei diferene ntre
performanele atinse nainte de parcurgerea pregtirii respective i cele
obinute dup : H
0
:
1
=
2
iar H
1
:
1

2
;
- stabilirea diferenei d
i
dintre cele dou scoruri corespunztoare fiecrui
cuplu de observri din cele n existente;
- calculul mediei i a dispersiei diferenelor:

n
d
d
n
i
i
=
=
1

( )
1
1
2
2

=

=
n
d d
s
n
i
i
d

- determinarea abaterii standard a diferenelor, s
d
, ca radical din dispersie;
- calculul raportului critic pe baza relaiei:

( )
n
s
d
n
s
d
RC
d d
=

=
2 1


- stabilirea regulii de decizie privind ipoteza nul:

o se accept ipoteza nul dac valoarea raportului critic determinat
n contextul distribuiei z sau t este mai mic dect valoarea
teoretic din tabelul distribuiei respective;
o se respinge ipoteza nul dac valoarea RC este mai mare.

Testarea diferenelor dintre dou procente
De la dou populaii independente, deci de la dou eantioane, pot rezulta
dou procente a celor care opteaz pentru ceva. Se pune problema de a cunoate
dac ntre cele dou populaii se manifest diferene semnificative n cazul
variabilei studiate.
Testul necesit urmtoarele determinri:

a)stabilirea ipotezei nule i a uneia din ipotezele alternative posibile:

H
0
:
1
=
2

H
1
:
1

2

H
1
:
1
>
2

H
1
:
1
<
2

b) determinarea raportului critic:

( ) ( )
2 1 2 1
2 1 2 1 2 1
p p p p
p p p p
RC

=

=
o o
t t


deoarece :
1

2
= 0
unde: p
1
= procentul din eantionul grupului 1
p
2
= procentul din eantionul grupului 2

1
-
2
= procentul presupus al populaiei 1 minus procentul presupus al
populaiei 2
2 1
p p
o = abaterea standard a diferenelor dintre procente

Deoarece practic nu avem cum s cunoatem abaterea standard a diferenelor
dintre procente, raportul critic se va stabili pe baza estimrii acesteia pornind de la
datele din eantioane, folosind relaia:


|
|
.
|

\
|
+ = =

2 1
1 1

2 1 2 1
n n
q p S
p p p p
o


unde: p = estimarea comun a procentului de succes la nivelul celor dou
eantioane
( ) p q = 100 arat estimarea comun a procentului de insucces la
nivelul celor dou eantioane
n
1
, n
2
, = mrimea eantionului pentru grupul 1 i pentru grupul 2

Pentru a calcula estimatorul comun p se folosete relaia:


2 1
2 2 1 1
n n
p n p n
p
+
+
=


Regula de decizie privind ipoteza nul se adopt n funcie de nivelul de
semnificaie ales, n funcie de tipul distribuiei (z sau t) i tipul ipotezei
alternative, dup regulile menionate deja. Astfel, dac se merge pe un test
bilateral, n condiiile distribuiei z, ipoteza nul se va accepta dac valoarea
raportului critic se va ncadra ntre limita pozitiv i cea negativ a valorilor
teoretice ale lui z n funcie de nivelul de semnificaie ales. Ipoteza nul se va
respinge dac valoarea raportului critic va fi mai mic dect limita negativ sau
mai mare dect limita pozitiv a valorilor critice z.




10.4.2 Teste neparametrice de comparare a diferenelor

Sunt situaii cnd populaia nu este distribuit normal iar datele sunt
msurate nominal i ordinal. Ca urmare se impune folosirea testelor neparametrice.
Cele mai importante sunt:

testul _2 ( hi ptrat)

El se folosete pentru testarea semnificaiei statistice a distribuiei
frecvenelor care se pot exprima ca mrimi absolute sau procentuale. Testarea
ipotezei nule presupune compararea frecvenelor observate, aa cum rezult ele
din rspunsurile date de subieci, cu frecvenele ateptate, adic cu frecvenele
care au la baz o teorie despre distribuia populaiei, sau anumite proporii pe care
le presupunem conform ipotezei nule.Testul _2 impune parcurgerea urmtoarelor
etape:

- formularea ipotezei nule i a ipotezei alternative; ipoteza nul presupune
c ntre frecvenele observate i cele ateptate nu exist diferene
semnificative. Ipoteza alternativ afirm c exist diferene semnificative
ntre frecvenele respective;
- stabilirea nivelului de semnificaie o ;
- dispunerea ntr-un tabel de contingen a frecvenelor observate;
- calcularea frecvenelor teoretice ateptate presupunnd c ipoteza nul ar
fi adevrat.Frecvenele ateptate, notate cu E
ij,
se determin pornind de
la frecvenele observate astfel:


( ) ( )
general total
j coloana total i linia total
=
ij
E


- determinarea valorii critice _2
calc.



( )

= =

=
r
i
c
j
ij
ij ij
calc
E
E O
1 1
2
2
_


unde: O
ij
= frecvena observat n celula ij
E
ij
= frecvena ateptat n celula ij
- stabilirea regulii de decizie privind ipoteza nul. Aceasta presupune
compararea valorii _2
calc.
cu valoarea teoretic _2
o; df
din tabelul
repartiiei _2 avnd n vedere nivelul de semnificaie ales i numru
gradelor de libertate calculat astfel: (r-1)(c-1).Regula de decizie va fi:


- se accept H
0
dac _2
calc.
s _2
o; df

- se respinge H
0
i se accept H
1
dac _2
calc.
> _2
o; df


Testul Wilcoxon (sau testul semnului i al rangului)

Se folosete pentru compararea mrimii diferenelor dintre dou ordonri
care pot proveni fie de la dou eantioane independente , fie de la dou eantioane
dependente.
Aplicarea testului o vom exemplifica lund n considerare un experiment
care presupune dou eantioane dependente, adic un grup de persoane, relativ
mic, (n<30) de la care se obin date nainte i dup experiment. Datele sunt
msurate cu o scal ordinal, la nivelul fiecrei persoane obinndu-se un scor
nainte i dup realizarea experimentului, care figureaz ntr-un tabel.
Ipoteza nul i ipoteza alternativ le formulm astfel:

H
0
:
1
=
2
H
1
:
1
=
2

Conform ipotezei nule rezult c la nivelul grupului respectiv experimentul
nu a avut nici un efect. Ipoteza nul indic existena unei deosebiri semnificative
ntre performanele existente nainte de experiment i cele obinute dup
experiment.(
1
i
2
indic la nivelul grupului media performanelor, adic media
scorurilor ninte i dup experiment).
Pornind de la scorurile realizate de fiecare membru al grupului, se stabilesc
semnele i diferenele absolute dintre fiecare pereche de observri. Dac dou
evaluri sunt identice, ele se exclud din analiz. Pornind apoi de la mrimea
abolut a diferenelor, se realizeaz o ordonare a acestora atribuind rangul 1 celei
mai mici diferene, rangul 2 diferenei imediat superioare .a.m.d.. Dac sunt dou
sau mai multe perechi egale ale diferenelor, atunci se determin un nivel mediu al
scorului care exprim ordinea.Presupunem c diferenei abolute 6 i revenea rangul
3 n condiiile n care mai exist o diferen absolut 6 creia ar trebui s-i revin
rangul 4. Ca atare, rangul 3 + rangul 4 = 3,5 . Valoarea 3,5 va indica ordinea,
rangul, pentru fiecare din cele dou diferene egale. n final se face o repartizare a
rangurilor n funcie de semnul avut (pozitiv, negativ) i apoi se realizeaz suma
rangurilor pozitive, T
P
, i suma rangurilor negative, T
n
.
Se va stabili valoarea T
calc.
ca fiind valoarea cea mai mic dintre valorile T
P

i T
n
. S presupunem c T
calc
are valoarea lui T
n
.
n testul Wilcoxon valoarea obinut T
calc
se va compara cu valoarea T
n; o
aa
cum se afl ea n tabelul special al valorilor critice T, ale testului Wilcoxon, avnd
n vedere numrul de perechi, n, nivelul de semnificaie i tipul testului (bilateral
sau unilateral)
Regula de decizie cu privire la ipoteza nul va fi:


- se accept ipoteza nul dac T
calc
> T
n;o

- se respinge ipoteza nul i se accept ipoteza alternativ dac T
calc
s T
n;o


Cnd mrimea eantionului este mai mare, adic n > 30, atunci distribuia de
eantionare este aproximativ normal i n acest caz testul va avea la baz valorile
z. Raportul critic se calculeaz pe baza urmtoarei relaii:


( )
( )( )
24
1 2 1
4
1
+ +
+

=
n n n
n n
T
z
calc

unde:

( )
4
1 +
=
n n
T
reprezint media valorilor T iar radicalul de la numitor
arat abaterea standard a valorilor T, o
T
.
Valoarea raportului critic, z
calc
se compar cu valoarea teoretic a lui z i se
adopt decizia care se impune.

Testul Mann Whitney (testul U)

Acest test parametric permite compararea diferenelor n situaia n care
populaiile respective nu sunt distribuite normal i nu sunt egale sub aspectul
varianelor.
Specificul testului Mann Whitney este acela c valorilor cantitative (iniial
msurate metric) corespunztoare celor dou grupuri independente, li se asociaz
ranguri i se ajunge astfel la o variabil ordinal cu mai multe modaliti. Spre
exemplu, se urmrete compararea vnzrilor realizate de dou grupuri
independente de vnztoare care desfac aceleai produse ntr-un mare magazin
universal. Unul din aceste grupuri se deosebete de cellalt prin faptul c a urmat
un curs special de pregtire. Se dorete a se afla dac volumul vnzrilor realizate
ntr-un anumit interval de timp de acest grup se difereniaz semnificativ de
vnzrile celuilalt grup. Ca urmare, ipoteza nul se enun astfel: H
0
:
1
=
2
,
adic media vnzrilor unui grup nu se deosebete de media vnzrilor celuilalt
grup. Ipoteza alternativ, H
1
:
1
=
0
presupune existena unor deosebiri eseniale
ntre cele dou grupuri sub aspectul performanelor n munc.
Testul implic parcurgerea urmtoarelor etape:
alegerea nivelului de semnificaie o ;
ordonarea n sens cresctor a vnzrilor realizate de fiecare membru al
celor dou grupuri i acordarea fiecrei sume a unui numr de ordine
cresctor ncepnd cu 1.
calcularea valorilor R
1
i R
2
care reprezint suma numerelor de ordine
aprinnd fiecrui grup.
determinarea valorilor U
1
i U
2
pe baza urmtoarelor relaii:

( ) ( )
2
2 2
2 1 2 1
1 1
2 1 1
2
1

2
1
R
n n
n n U R
n n
n n U
+
+ =
+
+ =


stabilirea valorii U care va fi testat, U
calc
, ca valoarea minim dintre U
1

i U
2
; U
calc
= min (U
1
, U
2
)
testul U se difereniaz n raport cu mrimea fiecruia din cele dou
eantioane n parte. Sunt trei situaii posibile:

- cnd n
1
i n
2
< 9;
- cnd n
1
este cuprins ntre 1 20 iar n
2
> 9;
- cnd n
1
i n
2
sunt suficieni de mari pentru ca valorile U s fie
distribuite normal.

Regula de decizie privind ipoteza nul se difereniaz n raport cu
fiecare din situaiile menionate mai sus astfel:

Cnd n
1
i n
2
< 9 ; din tabelele speciale ale distribuiei U se identific
probabilitatea realizrii valorii U
calc
n raport cu mrimea lui n
1
i n
2
.
Presupunem c aceasta este p. Regula de decizie va fi:

se accept ipoteza nul dac: 2p > o , adic dac probabilitatea p din
tabel, dublat, este mai mare dect nivelul de semnificaie;
se respinge ipoteza nul i se accept ipoteza alternativ dac 2p s o.

Cnd n
1
este cuprins ntre 1 i 20 iar n
2
este mai mare sau egal cu 9,
pn la maximum 20. n acest caz tabelele pentru testul U vor indica valori
critice ale lui U avnd n vedere diferitele nivele de semnificaie care
corespund unui test bilateral sau unilateral. Dup determinarea valorilor R
1

i R
2
, a valorilor U
1
i U
2
i a valorii U
calc
, conform metodologiei
anterioare, se procedeaz astfel:

se identific din tabel valoarea U
o
n funcie de nivelul de semnificaie
corespunztor testului bilateral sau unilateral;
se adopt regula de decizie: se accept ipoteza nul dac U
calc
> Uo ; se
respinge ipoteza nul dac U
calc
s U
o
.

Cnd valorile U sunt distribuite normal, cnd n
1
i n
2
sunt suficieni de
mari, se va utiliza disrtibuia z i se va calcula raportul critic avnd n
vedere U
calc
, media i abaterea standard a valorilor U.
Media distribuiei U , notat cu
U
se determin astfel:


2
sau
2
2 1 2 1
n n U U
U U

=
+
=

Estimarea abaterii standard U se determin pe baza relaiei:


( )
12
1

2 1 2 1
+ +
=
n n n n
U
o


Raportul critic va fi:


U
U calc
U
U
z
o

=

Regula de decizie va fi:

se accept ipoteza nul dac z
U
s z
o
se respinge ipoteza nul i se accept ipoteza alternativ dac z
U
> z
o

Testul Kolmogorov Smirnov

Se utilizeaz n cazul eantioanelor independente cnd se au n vedere
variabile ordinale ce au puine modaliti.El se aplic fie cu scopul comparrii
repartiiei rspunsurilor observate cu o repartiie definit apriori, n cazul a dou
eantioane independente de aceeai mrime, fie cu scopul comparrii rspunsurilor
provenite de la dou eantioane independente de mrimi diferite.
Dac vom lua n considerare eantioane independete de mrimi diferite,
pentru acestea se calculeaz frecvenele relative cumulate F
1
(k) i F
2
(k) unde k
reprezint o modalitate a variabilei ordinale. Notm cu n
1
i n
2
mrimile celor dou
eantioane. Prin intermediul testului se urmrete s se verifice statistic dac exist
diferene ntre repartiiile celor dou eantioane. Ipotezele se enun astfel:
H
0
: diferena maxim ntre cele dou frecvene cumulate este zero;
H
1
: diferena maxim ntre cele dou frecvene cumulate este diferit de
zero

Testul presupune identificarea diferenei maxime, cu mrimea absolut cea
mai mare, dintre diferenele frecvenelor cumulate aferente fiecrui nivel al
variabilei ordinale cercetate. Deci,

D
calc
= max , F
1
(k) F
2
(k) ,
k
Valorile D
calc
, pentru un test bilateral,

se compar cu valoarea teoretic
cupris n tabelul repartiiei Kolmogorov Smirnov, avnd n vedere un nivel de
semnificaie o i mrimea celor dou eantioane .De reinut c n cazul unui test
unilateral intervine repartiia _2.
Valorile teoretice pentru D n cazul a dou eantioane independente de
mrimi diferite i pentru o = 0,05, se determin pe baza relaiei:


2 1
2 1
36 , 1
n n
n n
D

+
=


Regula de decizie va fi:
- se accept H
0
dac D
calc
s D
critic

- se respinge H
0
i se accept H
1
dac D
calc
> D
critic


Dac vom avea n vedere o scal ordinal cu o structur a rspunsurilor
predeterminat, corespunztoare unei perioade anterioare, putem s aflm, pe baza
unor observaii ulterioare provenite de la un eantion de aceeai mrime ca cel
anterior, n ce msur acestea se difereniaz de cele iniiale. Metodologia de
determinare a lui D
calc
este aceeai ca cea anterioar. n privina valorilor critice,
acestea se afl ntr-un tabel special unde n funcie de nivelul de semnificaie i de
mrimea eantionului se indic sau se pot calcula aceste valori. Calculul se face
numai atunci cnd mrimea eantionului depete 35. La un nivel de semnificaie
o = 0,05 relaia de calcul a valorii critice este:

n
D
critic
36 , 1
=


Regula de decizie se stabilete ca n situaia anterioar.

Analiza varianei
Reprezint o metod care presupune existena relaiei cauz efect dintr-o
variabil dependent msurat metric i una sau dou variabile independente
msurate nominal, cu mai multe modaliti de manifestare fiecare. Se dorete a se
cunoate efectul, sau n ce msur modificarea unei variabile sau a celor dou
variabile independente influeneaz variabila dependent.

Analiza varianei avnd n vedere o singur variabil independent. Ea
presupune repartizarea varianei totale a variabilei dependente (spre
exemplu, vnzrile unui produs) pe dou tipuri de variane:

a) varian atribuit influenei varianelor, sau nivelurilor variabilei
independente, denumit i efect de tratament, concretizat n deviaiile
mediei nivelurilor fa de media general;
b) varian datorat unor factori necunoscui, care arat deviaii n interiorul
nivelelor;

Ca urmare, modelul de analiz a varianei n cazul unei singure variabile
independente se prezint astfel:
ij j ij
e C y y + + =

unde:
y
ij
= valoarea lui y pentru observarea i aparinnd modalitii j (j =
1c) (i = 1.n
j
)
y
= media general a variabilei dependente y pe care o explicm
C
j
= efectul nivelului j al variabilei independente
E
ij
= valoarea aleatoare, necunoscut (eroarea) corespunztoare
observrii i aparinnd nivelului j

Varianele se determin prin metoda celor mai mici ptrate, astfel nct :
Suma ptratelor varianei totale este egal cu suma ptratelor varianei n interiorul
nivelelor plus suma ptratelor varianei ntre nivele, deci,
SST = SS n niv. + SS ntre niv.
n condiiile n care variabila independent, presupunem, are trei modaliti
sau nivele, (presupunem trei forme de preuri) ipoteza nul consider c cele trei
medii corespunztoare fiecrui nivel sunt egale: H
0
:
3 2 1
y y y = =

Ipoteza alternativ presupune existena unor diferene semnificative ntre
aceste medii, ceea ce denot influena exercitat de fiecare form de pre asupra
volumului vnzrilor. Deci, H
1
:
3 2 1
y y y = =
.
Testarea ipotezei nule se realizeaz prin intermediul testului F.
Determinrile care se fac pe baza celor menionate mai sus se regsesc ntr-
un tabel ANOVA:

Tabel 6.3. ANOVA cu o singur variabil

Tipul
varianei
Suma ptratelor Grade de
libertate
Media sumei
ptratelor
F
calc

ntre
nivele
SS ntre nivele:

=
|
.
|

\
|

c
j
j j
y y n
1
2


c-1
MS ntre niv =
1
niv. ntre
c
SS


niv. n
niv. ntre
MS
MS
F
calc
=
n
interiorul
nivelelor
SS n nivele:
( )

= =

j
n
i
c
j
j ij
y y
1 1
2


n-c
MS n nivele =
c n
SS

nivele n


____
Total SST:

= =
|
.
|

\
|

j
n
i
c
j
ij
y y
1 1
2


n-1

____

____

F
calc
se va compara cu valoarea critic a lui F
o;df
din tabelul distribuiei F,
avnd n vedere nivelul de semnificaie stabilit i numrul gradelor de libertate
pentru numrtor (c-1) i pentru numitor (n-c).
Regula de decizie va fi:

- se accept ipoteza nul dac: F
calc
s F
o;df.

- Se respinge ipoteza nul i se admite H
1
dac: F
calc
> F
o; df.


Analiza varianei avnd n vedere dou variabile
Pornind de la exemplul anterior, presupunem c pe lng cele trei variante de
preuri se ia n considerare i o a doua variabil care are dou variante de
reclam.n acest caz, modelul liniar aditiv pentru o observare se prezint sub dou
ipostaze dup cum cele dou variabile independente se afl sau nu se afl n
raporturi de interaciune:
a) Dou variabile explicative care se afl n interaciune:
ijk ij j i ijk
e I C R y y + + + + =

b) Dou variabile explicative care nu se afl n raporturi de interaciune:
R j i ijk
V C R y y + + + =

unde:
y
ijk
= valoarea variabilei dependete pentru observarea k din eantionul cu n
j

nivele ale rndurilor (i = 1...n
j
) i cu c nivele ale coloanelor (j = 1.....c)
y = media general a variabilei dependente
R
i
= efectul mediu al nivelului i al variabilei de pe rnduri
|
.
|

\
|
y y
i
C
j
= efectul mediu al nivelului j al variabilei de pe coloane
|
.
|

\
|
y y
j
I
ij
= efectul mediu de interaciune reyultat din nivelul i al variabilei de pe
rnduri i nivelul j al variabilei de pe coloane
|
.
|

\
|
+ y y y y
j i ij


unde: ij
y
= media variabilei dependente la nivelul i al variabilei de pe
rnduri i nivelul j al variabilei de pe coloane
V
r
= (I
ij
+ e
ijk
) = valoarea rezidual n cazul variabilelor fr interaciune
E
ijk
= eroarea n cazul variabilelor cu interaciune

Pornind de la modelul ANOVA cu dou variabile, pe baza metodei celor mai
mici ptrate, pot fi determinate componentele sumei ptratelor abaterilor totale
astfel:
a. n cazul a dou variabile care interacioneaz: suma total a ptratului
abaterilor = suma ptratic a abaterilor de pe rnduri + suma ptratic a
abterlor de pe coloane + suma ptratic a abaterilor de interaciune +
suma ptratic a erorii; deci,

SST = SSC + SSR + SSI + SSE

b. n cazul a dou variabile care nu interacioneaz:

SST = SSC + SSR + SSV
r


Fiecare sum din cele de mai sus se determin astfel:


= = =
|
.
|

\
|
=
r
i
c
j
n
k
ijk
ij
y y SST
1 1 1
2



= = = =
|
.
|

\
|
=
|
.
|

\
|
=
r
i
c
j
n
k
c
j
j j j
ij
y y n y y SSC
1 1 1
2
1
2



= = = =
|
.
|

\
|
=
|
.
|

\
|
=
r
i
c
j
r
i
i i
n
k
i
y y n y y SSR
ij
1 1 1
2
2
1



= = =
|
.
|

\
|
+ =
r
i
c
j
n
k
j i ijk R
ij
y y y y SSV
1 1 1
2



= = = = =
|
.
|

\
|
+ =
|
.
|

\
|
+ =
r
i
c
j
n
k
r
i
c
j
j i ij ij j i ij
ij
y y y y n y y y y SSI
1 1 1 1 1
2 2

( )

= = =
=
r
i
c
j
n
k
ij ijk
ij
y y SSE
1 1 1
2


unde notaiile folosite au urmtoarele semnificaii:

y
ijk
= valoarea variabilei dependente pentru observarea k din eantionul cu r
nivele ale rndurilor (i = 1....r) i cu c nivele ale coloanelor (j = 1...c)
y = media general a variabilei dependente
j
y = media nivelului j a variabilei independente de pe coloane
i
y = media nivelului i a variabilei independente de pe rnduri
ij
y = media variabilei dependente pentru nivelul i al variabilei de pe rnduri i
nivelul j al variabilei de pe coloane (media unei celule)
n
j
= numrul de observri corespunztoare coloanei j
n
i
= numrul total de observri corespunztor rndului i
n
ij
= numrul de observri dintr-o celul
c = numrul coloanelor (modalitii j)
r = numrul rndurilor (modalitii i)
n = numrul total al observaiilor

Dup realizarea determinrilor menionate mai sus, rezultatele pot fi sintetizate
n urmtoarele dou tabele n funcie de relaiile care se manifest ntre cele dou
variabile independente:

Tabel 6.4. ANOVA cu dou variabile fr interaciune

Tipul Suma Grade de Media sumei F
calc
varianei ptratelor libertate ptratelor


De pe
coloane

SSC

c-1

1
=
c
SSC
MSC


r
MSV
MSC



De pe rnduri

SSR

r-1


1
=
r
SSR
MSR

r
MSV
MSR


Valoare
Rezidual


SSV
r


n-r-c+1
1 +
=
c r n
SSV
MSV
r
r

Total SST

n-1

Testul de semnificaie statistic are n vedere fiecare variabil n parte. Deci,
se va formula cte o ipotez nul i o ipotez alternativ pentru variabila de pe
coloane i pentru cea de pe rnduri.
Pentru variabila de pe coloane:
H
0
= mediile
j
y sunt egale
H
1
= mediile
j
y sunt diferite
Regula de decizie : se accept ipoteza nul dac F
calc
s F
o; df
; se respinge
ipoteza nul dac F
calc
> F
o; df.

Pentru variabila de pe rnduri:
H
0
: mediile
i
y sunt egale
H
1
: mediile
i
y sunt diferite
Regula de decizie se adopt ca n cazul variabilei anterioare.

Tabel 6.5. ANOVA cu dou variabile aflate n interaciune

Tipul
varianei

Suma
ptratelor
Grade de
libertate
Media ptratelor F
calc
De pe coloane


SSC

c-1
1
=
c
SSC
MSC

MSE
MSC


De pe rnduri

SSR r-1



1
=
r
SSR
MSR
MSE
MSR

De
interaciune



SSI

(r-1)(c-1) sau
rc-c-r+1

1 +
=
r c rc
SSI
MSI


MSE
MSI


Eroarea



SSE

n-rc

rc n
SSE
MSE

=

___
Total

SST n-1 ___ ___

Testarea ipotezelor se face distinct, pentru variabila de pe coloane, pentru
variabila de pe rnduri i pentru efectul de interaciune. Formularea ipotezelor i
luarea deciziilor privind situaia ipotezei nule se realizeaz dup procedura
menionat mai nainte.

10.5 Analiza bivariat. Msurarea asocierii dintre variabile

Msurarea i testarea gradului de asociere dintre variabile se realizeaz prin
intermediul unor metode statistice, fiecare dintre acestea avnd n vedere
modalitile de msurare a variabilelor, natura eantioanelor i numrul acestora.
Studierea asocierii dintre dou variabile are n vedere:
de a pune n eviden printr-un test, existena unei asocieri, adic a unei
legturi mai mult sau mai puin puternice;
de a msura intensitatea legturii;
de a cunoate direcia de evoluie a variabilelor respective (variaii n
acelai sens sau n sens contrar.

10.5.1 Msurarea asocierii ntre variabile nominale:

a. Coeficientul de contingen C. Se determin pe baza relaiei:


n
C
+
=
2
2
_
_

unde:
C = coeficientul de contingen
_2 = valoarea calculat a lui _2 n cayul celor variabile nominale
n = mrimea eantionului sau numrul total de observaii.

Cu ct C este mai mare, cu att mai puternic este legtura dintre variabile.
Cnd C = 0 se manifest o situaie de independen, variabilele nefiind legate ntre
ele (n acest caz _2 = 0 ).
Mrimea coeficientului de contingen este o funcie a numrului de celule
din tabelul de contingen i acesta niciodat nu poate atinge valoarea maxim
egal cu 1, chiar dac ntre variabile ar fi o asociere perfect. Valoarea limit a lui
_2 este egal cu n(k-1), unde k reprezint numru de modaliti sub care se
manifest variabila independent. Valoarea maxim a lui C va fi deci,
k
k 1

Spre exemplu, valoarea maxim a lui C va fi 0,707 pentru un tabel 2x2,
0,816 pentru un tabel 3x3, 0,866 pentru un tabel 4x4 etc. Pentru a aprecia gradul de
intensita te a legturii, valoarea calculat a lui C se va compara cu nivelul su
maxim ce poate fi atins.

b. Coeficientul T al lui Ciuprov.

Acest coeficient are n vedere numrul de grade de libertate existente ntr-un
tabel de contingen. Astfel, pentru un tabel cu r linii i c coloane, numrul
gradelor de libertate va fi df = (r-1)(c-1). El se determin astfel:

df n
T
2
_
=

Acest coeficient nu poate atinge valoarea 1 dect pentru tabelele care au un
numr egal de rnduri i coloane. El este comparabil numai pentru tabele de
aceeai talie.



c. Coeficientul V al lui Cramer.

Dac se va nota cu t = min [(r-1), (c-1)], atunci,

nt
V
2
_
=
Acest coeficient poate atinge valoarea 1 n funcie de dimensiunile tabelului.

10.5.2 Msurarea asocierii ntre variabile nominale binare.

n situaia n care avem dou variabile nominale dichotomice (binare)
dispuse n cadrul unui tabel 2 x 2 de forma:

x
y a b
c d

Putem determina gradul lor de asociere prin intermediul coeficientului phi |
sau prin intermediul coeficientului Q a lui Yule.
Coeficientul | este indicat, ndeosebi, pentru tabele de mici dimensiuni, tip
2x2 sau cnd una din dimensiuni este 2. Relaia de calcul este:

( )( )( )( ) c a d b d c b a
bc ad
+ + + +

= u


Acest coeficient poate avea valori cuprinse ntre 1 i +1.Valoarea 1 va
exista numai atunci cnd una din digonale va fi nul, adic a = d = 0 sau b = c = 0.
Valorile apropiate de 1 sau +1 indic o asociere ntre cele dou variabile, n timp
ce valorile apropiate de zero arat inexistena legturii dintre variabile.
Semnificaia statistic a coeficientului | se determin folosind repartiia _2 , pe
baza relaiei: _2 = n|2.

Coeficientul Q a lui Yule. Relaia de calcul este:


bc ad
bc ad
Q
+

=


Acest coeficient ia valori cuprinse ntre 1 i +1
Se impune a preciza c cei doi coeficieni prezentai mai sus reprezint
metode neparametrice de msurare a intensitii legturii dintre variabile ce
exprim aspecte de ordin calitativ.

10.5.3 Asocierea ntre variabile ordinale

n acest caz se pune problema de a determina dac ntre dou grupuri
independente care fac o ordonare a unor obiecte avnd n vedere un anumit criteriu
(preferina spre exemplu), exist o asociere. Pentru aceasta se pot utiliza doi
coeficieni: coeficientul de corelaie a rangurilor a lui Spearman (r
s
) i coeficientul
de corelaie a rangurilor a lui Kendall, t (tau) care i ei sunt modaliti
neparametrice de msurare a asocierii.

Coeficientul de corelaie a rangurilor a lui Spearman se determin
astfel:

n n
d
r
n
i
i
s

=

=
3
1
2
6
1


unde: d
i
= diferena rangurilor observate ntre cele dou ordonri (clasificri)
n = numrul de elemente de clasificat.

Coeficientul de corelaie a rangurilor variaz ntre 1 i +1. Atunci cnd
exist o asociere pozitiv perfect, el este +1; cnd asocierea este negativ,
perfect, el este 1; cnd este zero ntre cele dou ordonri nu exist nici o relaie.
O testare a semnificaiei statistice a coeficientului r
s
cnd n < 30 se poate
face pe baza relaiei:
2
1
2
r
n r
r
s
s


= '


care reprezint o distribuie Student (t) cu n-2 grade de libertate. H
0
presupune c
s
r = 0. Se accept ipoteza nul dac

s
r s t
o; df
i se respinge dac va fi mai mare.
n cazul n care n > 30 se utilizeaz statistica aferent unui raport critic pe
baza distribuiei z:


1
1
1
=

= = ' ' n r
n
r r
r
s
s
r
s
s
s
o


Se pleac de la H
0
: r
s
= o i H
1
= 0, de la un nivel de semnificaie ales, i de
la tipul respectiv de test (bilateral sau unilateral). Regula de decizie n cazul unui
test bilateral va fi: se accept ipoteza nul dac
s
r ' ' s z
o
sau dac
s
r ' ' > - z
o
.

Coeficientul t (tau) de corelare a rangurilor a lui Kendall
n esen, construirea coeficientului de corelare se bazeaz pe aflarea
numrului de puncte discordante i a celor concordante dintre perechile de
observri.
Dou observri sunt concordante dac x
i
< x
j
i, n acelai timp, dac y
i
< y
j

. Ele sunt discordante dac x
i
< x
j
, dar n schimb, y
i
> y
j
. Dac vom nota:
d
ij
= 1 cnd i i j sunt concordante i
d
ij
= -1 cnd i i j sunt discordante, atunci:

= =
=
n
i
n
j
ij
d Q
1 1


Relaia pe baza creia se calculeaz coeficientul de corelaie a rangurilor a
lui Kendall este:


( ) 1
2

=
n n
Q
t


Acest coeficient poate avea valori ntre 1 i +1.

10.5.4 Msurarea asocierii ntre variabile metrice

Msurarea intensitii dependenei liniare dintre dou variabile cantitative se
poate realiza prin intermediul coeficientului de corelaie a lui Karl Pearson,
denumit frecvent, coeficient de corelaie. El exprim covariaia dintre dou
variabile msurate metric i are valori cuprise ntre 1 i +1. Relaia de calcul este
urmtoarea:

( )( )
( ) ( )

= =
=


=
n
i
n
i
i i
n
i
i i
y y x x
y y x x
r
1 1
2 2
1


Valoarea absolut a coeficientului de corelaie exprim fora sau intensitatea
asocierii liniare dintre variabila x i variabila y. Semnul coeficientului reflect
sensul de corelare: valorile pozitive corespund variaiilor deacelai sens, valorile
negative indic variaii de sens contrar.
n practic, n funcie de nivelul atins de coeficientul de corelaie, intesitatea
legturii dintre cele dou variabile se apreciaz astfel:

0 s r < 0,2 nu exist o legtur semnificativ;
0,2 s r < 0,5 exist o legtur slab;
0,5 s r < 0,75 exist o legtur de intensitate medie;
0,75 s r < 0,95 exist o legtur puternic;
0,95 s r < 1,00 exist o legtur perfect (funcional).

Testul pentru coeficientul de corelaie, n ipoteza n care cele dou variabile
sunt distribuite normal, ipoteza nul indic lipsa legturii, r = 0, iar numrul de
observaii este mai mic ca 30, se face utiliznd relaia:


2
1
2
r
n r
t
r


=


Pentru nivelul de semnificaie ales, pentru tipul de test i pentru n-2 grade de
libertate, se adopt regula de decizie cunoscut: dac t
r
s t
o; df
se accept ipoteza
nul; dac este mai mare se va respinge.

10.5.5 Testele de asociere n cazul eantioanelor perechi

Aceste teste se refer la msurarea inferenei unei variabile independente
asupra asupra unei variabile dependente, avnd n vedere dou sau mai multe
eantioane perechi. Ele se folosesc n activitatea de experimentare sau atunci cnd
datele provin de la paneluri.
Cele mai importante teste de evideniere a asocierii n cazul a dou
eantioane perechi sunt: testul Mc. Nemar cnd variabila dependent este ordinal,
testul Wilcoxon i testul semnului cnd variabila dependent este ordinal, testul t
n cazul variabilelor metrice. Atunci cnd este vorba de mai multe eantioane
perechi, testele care se pot utiliza sunt: testul Q a lui Cochran, cnd variabila
dependent este nominal, testul lui Friedman i extensia testului medianei n cazul
cnd variabila dependent este ordinal, analiza varianei i covarianei n cazul
unei variabile dependente metrice.

10.6 Analiza multivariat.

Metodele de analiz multivariat ne ofer posibilitatea s cunoatem efectele
simultane a mai mult de dou variabile independente asupra uneia sau mai multor
variabile dependente.
Metodele statistice de analiz multivariat, n funcie de raporturile care pot
exista ntre variabila sau variabilele dependente i variabilele independente, pot fi
grupate n dou mari categorii: [14, p.137 ]

a. metode de analiz a dependenelor
b. metode de analiz a interdependenelor

Fr a analiza pe larg coninutul acestor metode, deoarece natura i
complexitatea lor depesc cadrul acestei lucrri, vom prezenta n cele ce urmeaz
numai elementele principiale care le definesc.

a. Metodele de analiz a dependenelor explic sau prevd evoluia uneia
sau mai multor variabile dependente pe baza a trei sau mai multor variabile
independente. Aceste metode analizeaz deci raporturi de dependen: cum
variabila sau variabilele dependente depind de variabilele independente. Spre
exemplu, cum evoluia vnzrilor depinde de variabile precum: pre, reclam,
ambalaj, venituri etc.
Metodele de analiz a dependenelor se clasific att n funcie de numrul
variabilelor aflate n raporturi de dependen ct i n funcie de modalitile de
msurare a acestor variabile. Cele mai importante metode sunt:
atunci cnd exist o singur variabil dependent, dac aceasta este
msurat metric, se utilizeaz analiza de regresie multipl; dac este
msurat nemetric, se face apel la analiza discriminrii;
dac sunt mai multe variabile dependente, msurate metric, se aplic
analiza varianei multivariate, iar msurate nemetric, se recurge la analiza
conjoint;
cnd sunt numeroase variabile aflate n raporturi de independen i
dependen, msurate metric sau nemetric, se face apel la analiza
canonic.

Analiza de regresie. Aceast metod descrie prin intermediul unui model
relaia dintre o variabil dependent i una sau mai multe variabile independente.
Cnd relaia are n vedere o singur variabil, se manifest regresia simpl, cnd
sunt mai multe variabile independente, se manifest regresia multipl.
Regresia simpl este o funcie liniar de tipul:


e x y + + =
1 0
| |


unde: |
0
i |
1
sunt cei doi parametrii ai regresiei care urmeaz a fi
determinai
x = variabila independent ce se presupune cunoscut
e = o valoare aleatoare (eroare) ce exprim influena unor factori
neobservai, dar prezeni n variabila y.

Modelul regresiei liniare multiple se prezint astfel:


i ik k i i i
e x x x y + + + + + = | | | |
2 2 1 1 0


unde: |
0
= interceptul (o constant)
|
1
.....|
k
= cei k parametrii ai modelului
x
i1
, x
i2
,......x
ik
= variabile independente cu valori cunoscute
e
i
= o variabil aleatoare care nsumeaz influena unor variabile
independente externe (necunoscute) necuprinse n model cu efectele
corespunztoare asupra variabilei dependente (erorile).

Analiza discriminrii are ca obiect studierea relaiilor dintre o variabil
dependent, msurat nominal, care presupune deci existena a dou sau mai
multor grupuri disjuncte, i un ansamblu de variabile independente, explicative,
msurate interval sau proporional. Gruparea subiecilor n dou sau mai multe
grupuri mutual exclusive rezult deci din modalitile pe care le are variabila
nominal. n funcie de valorile variabilelor explicative se adopt o regul de
decizie privind apartenena indivizilor la o anumit clas.[29, p.695-698]

Analiza multivariat a varianei. Analiza varianiei, (ANOVA) care a fost
abordat anterior, se poate extinde n mai multe direcii:

a explicrii mai multor variabile dependente msurate metric, avnd n
vedere mai multe variabile independente calitative; n acest caz vorbim
despre analiza multivariat a varianei (MANOVA)
a analizei efectelor variabilelor independente msurate metric i calitativ
asupra unei variabile dependente msurat metric; n acest caz avem n
vedere analiza covarianei ( ANCOVA)
a analizei efectelor mai multor variabile independente msurate mixt
(metric i calitativ) asupra mai multor variabile dependente msurate
metric; n acest caz se poate vorbi despre analiza multivariat a
covarianei (MANCOVA)

Analiza conjoint. Obiectivul general al analizei conjoint este acela de a
explica preferinele consumatorilor pentru diferite produse prin caracteristicile sau
atributele acelor produse. Rolul specific al analizei conjoint este acela de a studia
structura opiunii sau alegerii, adic modul n care atributele produsului sunt
percepute de ctre consumator i se combin pentru a determina preferina sa
global. Obiectivul principal este acela de a descompune utilitatea global a unui
produs (a unui obiect sau a unei oferte) cu scopul de a calcula utilitile pariale ale
atributelor.[25, p. 72-74]

Analiza canonic. n esen, analiza canonic reprezint o metod de
studiere a legturilor dintre dou ansambluri de variabile. Cnd n indivizi sunt
descrii prin dou mulimi de variabile se caut examinarea corelaiilor existente
ntre aceste dou mulimi cu scopul de a ti dac ele msoar sau nu aceleai
proprieti.[31, p.92]

b. Metodele de analiz a interdependenelor. Aceast categorie de metode
are menirea de a da un neles unui set de variabile sau de a grupa ntr-un anumit
mod variabilele. Aceste metode sunt utilizate n identificarea segmentelor de pia
sau a grupurilor care sunt cele mai profitabile pentru o firm. n funcie de modul
de msurare a variabilelor, metodele de analiz a interdependenelor se pot
clasifica astfel:
cnd variabilele sunt msurate metric: analiza n componente principale,
clasificarea (analiza grupurilor) i analiza corespondenelor;
cnd variabilele sunt msurate nemetric: scalarea multidimensional
nemetric.

Analiza n componente principale. Aceast metod are n vedere o
restructurare a variabilelor astfel nct un numr mic de variabile s poat
explica o parte important a informaiei generat de un numr foarte mare de
variabile. Analiza n componente principale const deci n identificarea, pornind de
la un ansamblu de variabile, a unui numr foarte mic de factori care pot sintetiza
cea mai mare parte a informaiei totale cuprinse n variabilele iniiale. Pentru a
extrage factorii dintr-un ansamblu de variabile, se pot utiliza dou proceduri de
calcul, numite: analiza n componente principale i analiza factorial clasic.
Analiza n componente principale presupune c factorii sunt exprimai sub
forma unor combinaii liniare de variabile ( dup cum i variabilele se pot exprima
sub forma combinaiilor liniare de factori).[31, p.76-79 ]
Analiza factorial clasic are n vedere faptul c fiecare variabil se
compune din dou pri: una care reprezint o combinaie liniar de factori comuni
i alta care reprezint eroarea.

Clasificarea (taxonomia) sau analiza grupurilor. Este o metod ce are n
vedere gruparea indivizilor, caracterizai printr-o serie de atribute, ntr-un numr
restrns de clase omogene. Gruparea este efectuat astfel nct s se satisfac
simultan dou cerine: clasele constituite (grupurile) s fie ct mai omogene, adic
indivizii care le vor compune s fie ct mai asemntori (similari), iar diferenele
dintre clase s fie ct mai pronunate, adic indivizii aparinnd unor clase diferite
s fie ct mai deosebii.[23, p.630-631]

Analiza corespondenelor. Obiectivul de baz al analizei corespondenelor
l reprezint studierea simultan a liniilor i coloanelor unui tabel de contingen cu
scopul de a pune n eviden legturile sau corespondenele ntre cele dou
ansambluri de variabile. Sunt dou modaliti principale de realizare a analizei
corespondenelor:

analiza legturilor ntre cele dou variabile a cror observri le regsim
ntr-un tabel de contingen;
analiza legturilor existente ntre un ansamblu de variabile (tipuri de
rspunsuri ale subiecilor) i un alt ansamblu de variabile calitative cu
mai multe modaliti.

Pe lng principalele metode de analiz prezentate anterior, ncepnd cu cele
univariate i terminnd cu cele multivariate, cercetarea de marketing face apel i la
alte metode, unele din ele deosebit de complexe, iar altele de dat recent, cum ar
fi, spre exemplu, analiza variabilelor latente sau neoservabile sau modelele
structurale care au ca scop estimarea relaiilor de cauzalitate dintre variabile.
Asimilarea acestor metode poate face obiectul unor cursuri post-universitare, iar
aplicarea lor n cadrul unor cercetri complexe necesit, de cele mai multe ori, o
colaborare ntre specialitii din domeniul marketingului cu cei din domeniile
statisticii, informaticii, sociologiei, psihologiei i a altor tiine care se interfereaz
cu marketingul.

S-ar putea să vă placă și