Sunteți pe pagina 1din 18

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI

CATEDRA DE MARKETING

Analiza datelor de
marketing utilizând SPSS
Lect. Univ. Dr. Cristi TATU MBA

Cursul numărul 7

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci
Teste statistice parametrice
pentru date cantitative
Simpla existență a scalelor metrice nu ne permite însă întotdeauna
utilizarea testelor statistice parametrice pentru datele cantitative.

Uneori variabilele care au origine unică și unitate de măsură (condiții care


definesc scala metrică) nu au un număr unic de răspunsuri suficient de
mare și, prin urmare, suntem nevoiți să apelăm la testele neparametrice
prin conversia valorilor la ranguri sau transformarea variabilei din scală
proporțională în interval sau ordinală.

01
Teste statistice parametrice
pentru date cantitative
Atunci când avem acces la date referitoare la media populației, suficient de
actuale și bine definite, ne putem permite compararea acestora cu datele
culese de la respondenți prin intermediul testului z (sau testul t) pentru
eșantioane independente.

Semnificația statistică a noțiunii populație nu face referire în mod exclusiv


la o colecție de indivizi, ci mai degrabă la totalitatea valorilor posibile care
descriu o anumită caracteristică (psihologică, biologică sau de altă natură).

Datorită dificultăților întâmpinate în găsirea datelor referitoare la media


populației, testul este utilizat mult mai frecvent în practică pentru
evidențierea diferențelor dintre două categorii de respondenți
definite/separate pe baza unei variabile dihotomice de stare (apartenența
la un grup sau nu).

02
Teste statistice parametrice
pentru date cantitative
Denumirea de variabilă dependentă provine de la faptul că dorim să testăm
în ce măsură variabila de scindare a grupului investigat în două eșantioane
influențează evoluția acesteia.

Variabila independentă este practic factorul de influență al cărui impact


dorim să îl măsurăm. În cazul scindării grupului investigat pe baza unei
variabile independente, eșantioanele astfel rezultate se numesc eșantioane
independente deoarece sunt constituite din subiecți diferiți (un anumit
respondent nu poate face parte din ambele eșantioane).

Ipoteza nulă (statistică, H0) constă în presupunerea că variabila


independentă nu influențează în mod semnificativ evoluția variabilei
dependente, iar ipoteza cercetării (H1) susține existența diferenței
semnificative între cele două grupuri datorită factorului de influență.

03
Teste statistice parametrice
pentru date cantitative
Pentru a calcula valoarea testului z avem nevoie de valoarea diferenței
dintre cele două eșantioane cercetate, media populației (de diferențe ale
mediilor) și abaterea standard a acesteia. Odată calculată, această valoare
va fi comparată cu valoarea tabelară pentru a vedea probabilitatea
obținerii unei diferențe mai mari pe baza unei selecții strict aleatorii.

Valoarea calculată a testului t trebuie să fie cel puțin egală sau mai mare
decât cea teoretică/critică pentru a putea fi respinsă ipoteza nulă și
acceptată ipoteza cercetării.

Valoarea testului t nu este relevantă, ci probabilitatea asocierii acesteia.


Valoarea calculată a indicatorului ne indică de câte ori este mai mare
diferența dintre mediile comparate și eroarea standard estimată a acelei
diferențe.

04
Teste statistice parametrice
pentru date cantitative
Atunci când eșantioanele nu sunt suficient de mari, ne vom aștepta la erori
considerabile în estimarea dispersiei populației pe baza dispersiei
eșantionului investigat și vom apela la testul t pentru dispersii diferite
(inegale) sau pentru dispersii egale (dispersie cumulată).

Datorită faptului varianta pentru dispersii diferite că nu urmează cu


exactitate distribuția t, utilitatea sa este controversată și vom folosi
dispersii egale care utilizează dispersia cumulată a celor două eșantioane,
fapt deosebit de util atunci când cele două dispersii nu diferă semnificativ.

Considerarea împreună a celor două dispersii ca o singură estimare a


dispersiei populației reușește să corecteze inconvenientul mai sus amintit

05
Teste statistice parametrice
pentru date cantitative
Datorită faptului că magnitudinea diferenței dintre medii poate fi mică,
chiar dacă probabilitatea asociată valorii t este foarte mică pentru
aprecierea importanței diferenței dintre mediile grupurilor investigate,
avem nevoie de informații suplimentare.

Această mărime a efectului pentru testul t aferent eșantioanelor


independente este indicată de coeficientul d a lui Cohen. Cu cât valoarea
indicelui de mărime a efectului este mai mare, cu atât diferența dintre
medii este mai importantă.

06
Teste statistice parametrice
pentru date cantitative
Atunci când suntem nevoiți să evaluăm importanța diferenței dintre
mediile a trei sau mai multe grupe utilizăm analiza de varianță (ANOVA –
Analysis Of Variance), o extensie a logicii testului t.

Variabilele independente se numesc factori (de influență), iar valorile


categoriale pe care acestea le pot lua se numesc niveluri.
Cele mai populare variante ale metodei sunt:
 ANOVA unifactorială (simplă/cu o singură cale/one way), atunci când
avem o variabilă dependentă (scală metrică interval sau proporțională)
măsurată pentru trei sau mai multe valori ale unei variabile
independente nominale;
 ANOVA multifactorială, atunci când avem o singură variabilă
dependentă, dar două sau mai multe variabile independente (factori)
măsurate pe scală nemetrică (nominală sau ordinală).

07
Teste statistice parametrice
pentru date cantitative
Ipoteza nulă (H0) specifică ANOVA presupune că grupele analizate provin
din aceeași populație, prin urmare mediile aferente lor sunt egale, iar
distribuțiile suprapuse, caz în care diferențele dintre mediile lor sunt doar o
variație firească a distribuției de eșantionare.

Cu cât sunt mai diferite una față de cealaltă, cu atât distribuția lor are o
varianță mai mare. Ipoteza cercetării (H1) susține că grupurile sunt diferite
provenind din populații distincte.

O valoare scăzută a acestui raportului dintre dispersia valorilor individuale


la nivelul populației ipotezei nule și dispersia mediilor anxietății grupurilor
cercetate confirmă ipoteza nulă (eșantioanele fac parte din aceeași
populație), iar o valoare ridicată infirmă ipoteza nulă.

08
Teste statistice parametrice
pentru date cantitative
Ipoteza nulă (H0) specifică ANOVA presupune că grupele analizate provin
din aceeași populație, prin urmare mediile aferente lor sunt egale, iar
distribuțiile suprapuse, caz în care diferențele dintre mediile lor sunt doar o
variație firească a distribuției de eșantionare.

Cu cât sunt mai diferite una față de cealaltă, cu atât distribuția lor are o
varianță mai mare. Ipoteza cercetării (H1) susține că grupurile sunt diferite
provenind din populații distincte.

O valoare scăzută a acestui raportului dintre dispersia valorilor individuale


la nivelul populației ipotezei nule și dispersia mediilor anxietății grupurilor
cercetate confirmă ipoteza nulă (eșantioanele fac parte din aceeași
populație), iar o valoare ridicată infirmă ipoteza nulă.

09
Teste statistice parametrice
pentru date cantitative
Neavând acces la datele necesare pentru calcularea dispersiei aferente
populației menționate în ipoteza nulă, aceasta va fi stimată prin media
dispersiei grupurilor investigate (dispersie intragrup).

Dispersia mediilor grupurilor investigate ne indică cât de împrăștiate sunt


mediile eșantioanelor investigate (dispersie intergrup).

Raportul acestor două dispersii se numește raport F și este responsabil cu


indicarea valorii testului ANOVA unifactorial. Cu cât valoarea acestuia este
mai mare, împrăștierea grupurilor comparate este și ea mai mare, iar
diferența lor este una semnificativă, diferită de o variație pur
întâmplătoare.

10
Teste statistice parametrice
pentru date cantitative
Testul ANOVA oferă o imagine generală a variației mediilor grupurilor
investigate fără a identifica sursa acesteia sau variațiile mediilor tuturor
perechilor posibile formate din grupurile investigate.

Pentru situația în care dorim să aflăm cum diferă grupurile între ele și în ce
sens, vom efectua o serie de comparații multiple pe baza unuia dintre
testele statistice posthoc (Scheffe, Tukey sau Bonferoni) ulterior efectuării
testului ANOVA, atunci când testul F raportează un rezultat semnificativ.

Aceste teste se interpretează similar testului t pentru diferența mediilor


unor eșantioane necorelate. Finalitatea este luarea măsurilor disponibile
pentru diminuarea excesului de eroare.

11
Teste statistice parametrice
pentru date cantitative
În situația în care suntem nevoiți să comparăm două sau mai multe valori
măsurate pe exact aceiași subiecți utilizăm testul t pentru diferența dintre
mediile a două eșantioane dependente.

Utilizarea acestui test se recomandă atunci când:


 măsurăm o anumită caracteristică înaintea unei condiții și după
acțiunea acesteia (before and after);
 măsurăm o serie de variabile concomitent pe aceiași subiecți (within
subjects);
 atunci când nu putem testa caracteristica pe aceiași subiecți (acțiunea
condiției durează ani de zile) și găsim un al doilea respondent ca
substitut pentru evaluarea secundară (matched pair design).

12
Teste statistice parametrice
pentru date cantitative
Variabila independentă va fi una de tip nominal, dihotomică
(înainte/după), iar cea dependentă va fi măsurată pe o scală metrică
interval sau proporțională.

Măsurătorile de dinainte și de după acțiunea condiției se vor face în același


fel, pe același instrument, în aceiași unitate de măsură pentru a permite
efectuarea calculului direct al diferenței.

Datorită faptului că cele două eșantioane (cel intervievat înainte și cel


intervievat după) sunt formate din aceiași indivizi, ele sunt considerate
dependente (corelate).

13
Teste statistice parametrice
pentru date cantitative
În formularea ipotezei nule ne bazăm pe faptul că, în cazul unei manifestări
fără impact a condiției, diferențele pozitive s-ar neutraliza cu cele negative
generând o medie a diferențelor nulă (egală cu zero). Această ipoteză
statistică presupune că media diferențelor este egală cu zero (manifestarea
condiției nu a avut niciun impact).

Pentru confirmarea ipotezei de cercetare, testul t trebuie să demonstreze


existența unei valori a mediei diferențelor calculate pe eșantionul cercetat
suficient de departe de valoarea zero pentru respingerea ipotezei nule.

Mărimea efectului este aflată prin calcularea indicelui de mărime a


efectului d a lui Cohen. Semnul indicelui nu are importanță existând 3 stări:
efect mic (0,2-0,5), efect mediu (0,5-0,8 și efect mare (0,8-1,0).

14
Teste statistice parametrice
pentru date cantitative
În situația în care dorim să aflăm dacă există o legătură între variația
valorilor a două variabile diferite măsurate pe același eșantion, mai exact a
gradului de asociere dintre acestea două, vom utiliza coeficientul de
corelație lineară a lui Pearson (r). Pentru relațiile nonlineare putem efectua
anumite transformări care să aducă variația sub formă liniară (logaritmare,
extragerea radicalului etc.).

Coeficientul de corelație liniară a lui Pearson poate utiliza două variabile


măsurate în unități de măsură diferite (dar ambele pe scală proporțională),
deoarece transformă valorile ambelor variabile în scoruri standard.

Coeficientul r a lui Pearson se raportează la o distribuție teoretică derivată


din distribuția t. Dacă valoarea calculată este mai mare sau egală cu cea
critică reluată din tabel, ipoteza nulă poate fi respinsă, iar coeficientul de
corelație considerat reprezentativ.
15
Teste statistice parametrice
pentru date cantitative
Având în vedere faptul că coeficientul r al lui Pearson oferă rezultatele pe o
scală ordinală pentru a putea compara valorile obținute pentru mai mulți
coeficienți folosim coeficientul de determinare (r2).

Cu ajutorul acestuia putem spune cât la sută din variația unei variabile este
determinată de variația celeilalte (cele două variabile au în comun x% din
variația care le caracterizează).

Limitele de încredere se află în jurul punctului de estimare (valoarea


calculată a lui r) la care se adaugă și se scade valoare lui r critic înmulțită cu
eroarea standard a estimării. O variantă simplificată este utilizarea
tabelului Fisher de transformare în Z a valorilor lui r.

16
ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI
CATEDRA DE MARKETING

Vă mulțumesc pentru atenție!

www.cristitatu.ro
cristi@cristitatu.ro
www.facebook.com/tatuci

S-ar putea să vă placă și