Documente Academic
Documente Profesional
Documente Cultură
80% dintre colegi s neleag cnd se aplic testele neparametrice 70% dintre colegi s neleag cnd se aplic urmtoarele categorii de teste: One Sample Tests 2 Independent Samples Tests k Independent Samples Tests 2 Related Samples Tests k Related Samples Tests
65% dintre colegi s tie s tie s deruleze procedurile pentru a obine un Output corect pentru toate testele predate. 45% dintre colegi s tie s analizeze rezultatele prezentate n tabele 35% dintre colegi s tie s interpreteze rezultatele concret obinute
Introducere
n funcie de ipotezele formulate, de tipul variabilei/variabilelor considerate, de volumul populaiei/populaiilor i de informaiile disponibile asupra acestora, pot fi aplicate fie teste parametrice, fie teste neparametrice. Testele neparametrice presupun testarea ipotezelor statistice fr a cere specificarea formei parametrice a distribuiei populaiilor comparate i folosesc variabile nominale i/sau ordinale. Testele neparametrice nu sunt la fel de puternice/exacte ca i testele parametrice n descoperirea relaiilor semnificative. Adic au o posibilitate mai mare de a accepta o ipotez fals sau de a respinge o ipotez adevrat. Ele compar mai degrab mediana dect media, i ca rezultat, dac datele au outlieri, influena lor este eliminat. SPSS d posibilitatea de a alege ntre dou sau trei teste pentru fiecare tip de eantion.
Variabila vparinti-reprezint veniturile lunare oferite de prini Variabila timp_lib in timpul liber iti permiti sa faci ceea ce iti place cel mai mult?
Precizare: pentru toate variabilele ferestrele Column, Missing value i Type vor arta la fel, aceleai opiuni bifate (column width = 8, Text Alignment Center, bifat opiunea No missing Value i tipul datelor este numeric cu 0 decimale).
2.
Baza de date cuprinde 60 de nregistrri, adic 60 de respondeni din care 29 de sex masculin i 31 de sex feminin. Cei 60 de subieci au fost supui unei cercetri concretizat prin aplicarea unui chestionar. Variabilele rezultate n urma aplicrii chestionarului vor fi introduse n SPSS astfel: din meniul Data Define variables, procedur pe care o vom respecta pentru definirea tuturor variabilelor. Variabila sex se refer la sexul subiecilor
Precizare: pentru toate variabilele ferestrele Column, Missing value i Type vor arta la fel, aceleai opiuni bifate (column width = 8, Text Alignment Center, bifat opiunea No missing Value i tipul datelor este numeric cu 0 decimale). Variabila grup este variabila de grupare a subiecilor (30 din ei fac parte din grupul de control i 30 fac parte din grupul experimental.)
Variabila stare starea de sntate de subiecilor dup aplicarea tratamentului real respectiv tratamentul fictiv
10
Variabila satisf1, satisf2 satisfacia fa de nivelul salariului primit (n dou momente diferite, nainte i dup modificarea salariilor)
11
12
Variabila fumat_1, fumat_2, fumat_3 dac sunt sau nu fumtori, ntrebare adresat n 3 momente diferite (nainte de campania mpotriva fumatului, imediat dup, i dup 6 luni de la campanie)
Atunci cnd testul are mai mult de dou rnduri i dou coloane i oricare dintre frecvene este mai mic dect 1 sau mai mult de 20% dintre frecvene sunt mai mici dect 5.
Testul se aplic pentru testarea ipotezelor cu privire la variabile nominale sau variabile ordinale, fie ca test de ajustare, fie ca test de independen. Ca i test de independen Hi-ptrat este folosit atunci cnd vrei s examinezi legtura dintre dou variabile categoriale. De exemplu vrem s vedem dac ntre variabilele : timp_lib (n timpul liber i permii s faci ceea ce i place cel mai mult?) i reg_taxe (regimul n care urmai cursurile FEAA), exist o relaie de dependen. Pentru aceasta folosim testul Hi-ptrat. Ipoteze de lucru: 0 1 Ipoteza nul H0: ntre regimul n care studenii seciei de Marketing Ipoteza alternativ H1: ntre regimul n care studenii seciei de urmeaz cursurile FEAA i timpul liber exist o relaie de dependen. Marketing urmeaz cursurile FEAA i timpul liber nu exist o relaie de dependen.
14
Din caseta cu variabile se selecteaz i se mut variabilele reg_taxe n caseta Row(s), iar timp_lib n caseta Column(s). Apoi se deschide caseta Statistics de unde se selecteaz testul Chi-square Continue.
15
Se deschide apoi
16
Interpretare: Case Processing Summary arat informaii despre numrul i procentajul de cazuri valide i lips. Numrul de cazuri lips este n funcie de variabilele folosite n procedur. n acest tabel nu avem nici un caz lips. Crosstabulation arat numrul de cazuri i procentul din fiecare variabil grupate pe categorii. Sunt utile pentru a nsuma variabilele cu un numr limitat de categorii. 17
Hi-ptrat testeaz ipoteza conform creia variabilele care apar pe rndurile i coloanele Crosstabelului sunt independente iar Output-ul Chi-Square conine: o valoarea testului 2=0.267 o gradele de libertate (r-1)*(c-1), unde r=numrul de rnduri, c=numrul de coloane. Adic : (2-1)*(2-1)=1, de aceea 2 (1)=0.267 o n al treilea rnd probabilitatea : dac sig >0.05 atunci nu este semnificativ iar dac sig<0.05 atunci rezultatul este semnificativ. n cazul nostru sig>0.05 indic faptul c ntre cele dou variabile nu exist o relaie de dependen. Dei Hi-ptrat arat dac exist o relaie, nu arat intensitatea sau direcia relaiei.
Testul Hi-ptrat de ajustare aranjeaz n tabel o variabil n categorii i calculeaz un calcul statistic Hi-ptrat. Acest test compar frecvenele observate i cele ateptate din fiecare categorie pentru a testa fie dac toate categoriile conin aceeai proporie a valorilor fie dac fiecare categorie conine o proporie a valorilor precizat de utilizator. Statistics calculeaz: media, abaterea standard, minimul i maximul, quartilele, numrul i procentajul nregistrrilor lips i a celor prezente, numrul de nregistrri observate i numrul ateptat de nregistrri, calcule statistice i reziduale, i statistici Hi-ptrat. Date- se folosesc variabile categoriale numerice (nivel ordinal sau nominal al masurtorii). Pentru a converti variabilele alfanumerice n variabile numerice, se folosete procedura Automatic Recode, disponibil n meniul Transform. Calea : AnalyzeNonparametric TestsChi-square. Fiecare variabil produce un test separat. Opional, se poate da click pe Options pentru calcule statistice, quartile i controlul tratrii datelor lips.
18
Intervalul ateptat. Implicit, fiecare valoare distinct a variabilei este definit ca o categorie. Pentru a stabili un interval n care se ncadreaz categoriile, click Use specified range i se introduce numrul ntreg pentru limitele inferioare i superioare. Categoriile sunt stabilite pentru fiecare valoare ntreag ce aparine respectivului interval iar nregistrrile ce se afl n afara limitelor sunt excluse. De exemplu, dac se specific o limit inferioar a valorii de 1 i o limit superioar de 4, doar valorile ntregi de la 1 la 4 sunt folosite pentru testul Hi-ptrat. Valorile ateptate. Implicit, toate categoriile au valori ateptate egale. Categoriile pot avea proporii ateptate specificate de utilizator. Se selecteaz Values, se introduce o valoare mai mare de 0 pentru fiecare categorie a variabilei testate i se d clik Add. De fiecare dat cnd se adaug o valoare, aceasta apare n partea de jos a listei de valori. Ordinea valorilor este important; ea corespunde ordonrii cresctoare a valorilor din categoriile variabilei testate. Prima valoare din list corespunde celei mai mici valori din grupul variabilei testate, iar ultima valoare corespunde celei mai mari valori. Elementele din lista de valori sunt nsumate iar apoi fiecare valoare este divizat prin aceast sum pentru a calcula proporia ateptat a nregistrrilor din categoria corespunztoare. De exemplu, o list a valorilor de 3, 4, 5, 4 precizeaz proporiile ateptate specifice de 3/16, 4/16, 5/16 i 4/16.
Opiunile testului Hi-ptrat Statistics. Se pot alege una sau amndou din urmatoarele calcule statistice : Descriptive afieaz media, abaterea standard, minimul, maximul i numrul de nregistrri lips.
19
Valori lips controleaz valorile lips. 0 lips. 1 Exclude cases listwise (excluderea nregistrrilor din list)nregistrrile cu valori lips sunt excluse din toate analizele. Particulariti ale testului Hi-ptrat Note de subsol Pentru a ascunde nota de subsol a tabelului rezultat, se d dublu click pe fereastr, se selecteaz nota de subsol i apoi se alege Hide din meniul View. Pentru a face nota de subsol din nou vizibil se selecteaz din nou ViewShow All Footnotes. Frecvena ateptat i cea observat Tabelul frecvenelor arat numrul real observat de cazuri i numrul ateptat de cazuri, bazat pe presupunerea c diferitele categorii apar n proporii egale. SPSS permite specificarea valorilor inegale ateptate, dac exist motive care presupun c unele categorii apar mai des dect altele. Coloana Residual arat diferenele dintre valorile observate i cele ateptate (teoretice). Valorile absolute mari pentru Residuals arat c valorile observate sunt foarte diferite de cele ateptate. De exemplu dorim s verificm dac categoriile variabilei st_act (starea actual cu privire la timpul liber) au aceeai pondere. Ipoteze de lucru: Ipoteza nul H0: fiecare categorie a variabilei st_act are aceeai pondere. Ipoteza alternativ H1: categoriile variabilei st_act au ponderi diferite. 20 Exclude cases test-by-test (excluderea nregistrrilor test cu test)- cnd sunt precizate cteva teste, fiecare test este evaluat separat pentru valorile
Pentru
aceasta
se
aplic
testul
Hi-ptrat
care
presupune
urmtorul
demers:AnalyzeNonparametric TestsChi-square.
Dup deschiderea ferestrei Chi-Square Test selectm variabila st_act i o mutm n zona Test Variable List. n zona Expected Range alegem Get from data, considernd categoriile definite pentru variabila st_act (starea actual cu privire la timpul liber). n zona Expected Values, alegem ipoteza All categories equal (toate categoriile egale).
21
Apoi
cases test-by-test Continue de unde revenim n fereastra Chi-Square Test i selectm OK.
22
Interpretare: Starea actual cu privire la timpul liber listeaz numrul de cazuri (observate i ateptate) din fiecare categorie a variabilei analizate. n cazul nostru Expected N arat c numrul de cazuri ateptate are aceeai frecven pentru toate categoriile, respectiv 10. Residuals listeaz diferenele dintre frecvena observat i cea ateptat i identific categoriile care variaz de la distribuia teoretic. De exemplu cea mai mare diferen 23
pozitiv aparine categoriei n general m descurc dei am avut mici probleme. Df indic numrul de grade de libertate calculat ca numrul de categorii minus 1 (6-1=5). Valori mai mici de 0.05 ale Asymp. Sig. indic faptul c distribuia observat nu urmrete distribuia teoretic i deci categoriile nu apar cu aceeai frecven. Notele de subsol 0% au frecvene mai mici de 5 i frecvena minim ateptat este 10 (distribuia teoretic) indic faptul c variabilele ndeplinesc condiiile necesare aplicrii testului (mai puin de 20% din celule au frecvena mai mic dect 1).
24
Pentru
obine
un
test
binomial
-alegei
din
meniu :
Analyze
Nonparametric TestsBinomial- selectai una sau mai multe variabile numerice care vor fi testate. Opional, putei da click pe Options pentru statisticile descriptive, quartile i controlul tratrii datelor lips. De exemplu dorim s verificm dac proporia celor dou categorii ale variabilei reg_taxe (regimul n care urmai cursurile FEAA : cu tax, fr tax) difer semnificativ n cadrul specializrii Marketing fa de raportul cu tax/fr tax n cadrul tuturor specealizrilor FEAA anul 4, respectiv 60/40%. Ipoteze de lucru : 2 3 Ipoteza nul H0: proporia n cadrul specializrii Marketing este de 60% Ipoteza alternativ H1: proporia n cadrul specializrii Marketing difer studeni cu tax i 40% studeni fr tax. de 60% pentru studenii cu tax i 40% pentru studenii fr tax. Pentru aceasta urmm demersul AnalyzeNonparametric Tests
Binomial. Dup deschiderea ferestrei Binomial Test selectm variabila reg_taxe i o mutm n zona Test Variable List.
25
n zona Define Dichotomy alegem Get from data, adic cele dou valori ale variabilei (1 pentru tax i 2 pentru fr tax) sunt definite n foaia Variable View. n zona de editare Test Proportion precizm valoarea dorit, respectiv 60% pentru categoria cu tax (care este prima categorie menionat). Butonul de comand OK declaneaz obinerea urmtorului Output :
Interpretare : Category arat cele dou categorii luate n considerarea ale varabilei reg_taxe respectiv cu tax i fr tax N arat numrul de cazuri pentru fiecare categorie Observed Prop. Identific proporiile observate pentru fiecare categorie Test Prop. Arat proporia teoretic stabilit de noi pentru prima categorie, aici proporia teoretic pentru studenii cu tax este de 60%, iar pentru cei fr tax este de 40%. Testul compar valorile observate (0.5) cu cele teoretice (0.6) Valorea Asymp. Sig. (sig>0.05) arat c distribuia observat nu difer de cea teoretic, deci cu o ncredere de cadrul specializrii Marketing Nota de subsol a spune c ipoteza alternativ (H1) este: proporia cazurilor pentru prima categorie este mai mic dect 0.6 Nota de subsol b arat c testul se bazeaz pe aproximarea Z (valoarea testului Z). 26 95% putem afirma c proporia din cadrul tuturor speacilizrilor FEAA se pstreaz i n
27
Runs. Dup apariia csuei de dialog Runs Tests selectm variabila reg_taxe (regimul n care urmai cursurile FEAA), apoi n zona Cut Point bifm csua Median i dm OK.
Interpretare: Pentru median testul clasific valorile ca fiind peste i sub valoarea 1.50
28
Cases <Test Value arat numrul de cazuri mai mici dect valoarea luat n considerare, respectiv mediana (1.50) i este de 30
Cases >=Test Value arat numrul de cazuri mai mai mari sau egale cu mediana Total Cases arat numrul total de cazuri Number of Runs arat 32 de serii de observaii identificate Z care se compar cu cel tabelar Asymp. Sig. : valoarea mai mare dect 0.05 arat c eantionul a fost ales aleator (datele sunt ordonate aleator) Nota de subsol arat faptul c punctul de divizare luat n considerare easte mediana.
Pentru a obine un test K-S pentru un eantion - alegei din meniu : AnalyzeNonparametric Tests1-Sample K-S - selectai una sau mai multe variabile numerice pe care dorii s le testai. Fiecare variabil produce un nou test. Opional, putei da click pe Options pentru calcule statistice descriptive, quartile i controlul tratrii valorilor lips. Exemplu. Testul Kolmogorov-Smirnov pentru un eantion poate fi folosit pentru a testa dac o variabil , s spunem vparinti (venitul oferit de prini), este distribuit normal. Ipoteze de lucru : 2 3 Ipoteza nul H0: venitul oferit de prini urmeaz o distribuie normal. Ipoteza alternativ H1: venitul oferit de prini nu urmeaz o distribuie
normal. Pentru aceasta se urmez calea :AnalyzeNonparametric Tests1Sample K-S. Dup apariia ferestrei One Sample Kolmogorov Smirnov Test trecem variabila vparinti n zona Test Variable List iar n zona Test Distribution bifm csua Normal (pentru a o compara cu distribuia normal) iar apoi dm OK.
30
Interpretare : 0 1 2 3 Parametrii distribuiei teoretice sunt estimai din datele observate Absolute indic cea mai mare diferen absolut dintre diferena dintre Kolmogorov-Smirnov Z este comparat cu valoarea tabelar a testului Valoarea Sig mai mare dect 0.05 indic faptul c distribuia observat (media i abaterea) distribuia teoretic cumulativ i cea observat.
este normal ceea ce nseamn c veniturile oferite de prini urmresc o distribuie normal i deci pot fi aplicate testele parametrice asupra variabilei.
31
32
ipoteza nul H0 : nu exist diferene semnificative ntre nivelul salariilor primite de persoanele de sex masculin i nivelul salariilor primite de ctre persoanele de sex feminin.
Ipoteza alternativ H1: exist diferene semnificative ntre nivelul salariilor primite de persoanele de sex masculin i nivelul salariilor primite de ctre persoanele de sex feminin.
Pentru derularea procedurii de testare: Analyze / Nonparametric Tests / 2Independent Samples. Vom obine urmtoarea fereastr:
Vom alege variabila salariu curent i o trecem n Test Variable List i variabila de grupare sex. Definim variabila de grupare prin: click Define Groups, grup1: 1 i grup 2:2. Click Continue, apoi click OK pentru a derula procedura de testare. Obinem urmtorul output: 33
Primul tabel, Ranks: N numrul de respondeni de sex masculin (29), de sex feminin (31) i numrul total de subieci (60) Mean Rank media rangurilor Sum of Ranks suma rangurilor. Dac cele dou variabile nu difer atunci suma rangurilor diferenelor pozitive va fi aproximativ egal cu suma rangurilor diferenelor negative. Suma rangurilor pentru valoarea diferenial cea mai mic (n aceast situaie numrul diferenelor negative este cel mai mic, adic 3) va fi folosit n calcularea testului Wilcoxon. Interpretare al doilea tabel, Test Statistics ne arat : Valoarea U a testului Mann Whitney Valoarea W a testului Wilcoxon 34
Concluzie: Putem afirma, cu un risc de eroare de 5% c nu exist diferene semnificative ntre nivelul salariilor pimite de persoanele de sex masculin i nivelul salariilor primite de persoanele de sex feminin.
35
Vom alege variabila salariu curent i o trecem n Test Variable List i variabila de grupare sex. Definim variabila de grupare prin: click Define groups, grup1: 1 i grup 2:2. Click Continue, apoi click OK pentru a derula procedura de testare. Obinem urmtorul output:
36
Primul tabel, Frequencies arat numrul de persoane de sex masculin din eantionul studiat (n cazul nostru 29) i numrul de persoane de sex feminin din eantionul studiat (n cazul nostru 31). Interpretare al doilea tabel, Test Statistics ne arat un sig = ,980, deci < ,05. Putem afirma, cu un risc de eroare de 5% c nu exist diferene semnificative ntre nivelul salariilor pimite de persoanele de sex masculin i nivelul salariilor primite de persoanele de sex feminin.
37
Exemplu: Dorim s aflm dac starea de sntate a respondenilor crora li se aplic un tratament real difer fa de starea de sntate a respondenilor crora li se aplic un tratament fictiv. Pentru aceast testare, vom mpri eantionul n dou grupuri diferite; grup 1 respondenii crora li se aplic tratamentul real i grup 2 respondenii crora li se aplic tratamentul fictiv.
Ipoteze de lucru: Ipoteza nul H0: exist diferene semnificative n ceea ce privete starea de sntate a respondenilor din cele dou grupuri, de control i experimental (cele dou grupuri vor fi influenate diferit i n sens opus ) Ipoteza alternativ H1: nu exist diferene semnificative n ceea ce privete starea de sntate a respondenilor din cele dou grupuri, de control i experimental Derularea procedurii de testare: Analyze / Nonparametric Tests / 2 independent Samples. Vom obine urmtoarea fereastr:
Vom alege variabila stare i o trecem n Test Variable List i variabila de grupare grup. Definim variabila de grupare prin: click Define range, grup1:
38
1 i grup 2:2. Click Continue, apoi click OK pentru a derula procedura de testare. Obinem urmtorul output:
Interpretare tabel Frequencies: N- numrul de respondeni care fac parte din grupul de control (30) i numrul de respondeni care fac parte din grupul experimental (30) i numrul total de respondeni (30) Interpretare tabel Test Statistics: Observed control grup span : distana observat din interiorul grupului de control este 31 n cazul nostru. Dac aceasta se apropie ca valoare
39
de numrul total de respondeni, atunci raspunsurile date de cele dou grupuri difer. Nu se ntmpl i n cazul nostru. Sig = ,000 < ,05: indic faptul c nu exist diferene semnificative ntre rspunsurile date de cele dou grupuri, de control i cel experimental. Dei au fost supuse unor tratamente diferite (unul real i unul fictiv) rezultatul a fost aproximativ acelai pentru ambele grupuri. Deoarece span-ul este o diferen ntre valori extreme, testul Moese elimin outlierii (valori neobinuite), astfel Outliers trimmed for each end (outlierii eliminai de la fiecare capt) = 1 Timmed Control Grup Span se refer la distana din grupul de control dup ce a fost fcut eliminarea outlierilor 31 Al doilea sig din tabel = ,000 < ,05, deci nu exist diferene semnificative ntre rspunsurile date de cele dou grupuri, de control i cel experimental. Dei au fost supuse unor tratamente diferite (unul real i unul fictiv) rezultatul a fost aproximativ acelai pentru ambele grupuri. SPAN = Rangul (celei mai mari valori a grupului de control) Rangul (celei mai mici valori din grupul de control) + 1
Exemplu : Dorim s testm dac exist diferene semnificative ntre nivelul salariilor primite de ctre persoanele de sex masculin i nivelul salariilor primite de ctre persoanele de sex feminin.
Ipoteze de lucru: ipoteza nul H0 : nu exist diferene semnificative ntre nivelul salariilor primite de persoanele de sex masculin i nivelul salariilor primite de ctre persoanele de sex feminin. Ipoteza alternativ H1: exist diferene semnificative ntre nivelul salariilor primite de persoanele de sex masculin i nivelul salariilor primite de ctre persoanele de sex feminin. Pentru derularea procedurii de testare: Analyze / Nonparametric Tests / 2Independent Samples. Vom obine urmtoarea fereastr:
41
Vom alege variabila salariu curent i o trecem n Test Variable List i variabila de grupare sex. Definim variabila de grupare prin: click Define range, grup1: 1 i grup 2:2. Click Continue, apoi click OK pentru a derula procedura de testare. Obinem urmtorul output:
Primul tabel, Frequencies arat numrul de persoane de sex masculin din eantionul studiat (n cazul nostru 29) i numrul de persoane de sex feminin din eantionul studiat (n cazul nostru 31). Al doilea tabel, Test Statistics: Number of runs numrul de secvene de valori din acelai grup: minimum este de 13 runs i maximum este de 51 runs Z, valoarea calculat care se compar cu Z tabelar pentru a putea interpreta. Sig nivelul de semnificaie, sig =1,000 < ,05.
42
Concluzie: Putem afirma, cu un risc de eroare de 5% c nu exist diferene ntre semnificative ntre nivelul salariilor pimite de persoanele de sex masculin i nivelul salariilor primite de persoanele de sex feminin.
43
Variabila frecvena n lcaurile religioase se va trece n Test Variable List i variabila de grupare rel_tip se va trece n Grouping Variable. Click Continue, apoi click OK pentru a derula procedura de testare. Vei obine apoi Output-ul:
Interpretare: N - identific distribuia cazurilor n grupuri. Mean Ranks - listeaz media rangului pentru fiecare grup. Dac grupurile nu difer ntre ele, media rangurilor va fi aproximativ aceeai pentru toate grupurile Dup cum se observ i pentru cazul nostru mediile rangurilor difer, deci am putea trage concluzia ca grupurile difer ntre ele.
44
Asymp Sig (tabelul Test Statistics). Nivelul de semnificaie. Acesta este nivelul de probabilitate dat constatrilor curente. Nivelul de semnificaie i spune cercettorului dac diferena dintre medii este semnificativ. Dac aceast cifr este sub criteriile 0.05 atunci constatarea este semnificativ. Dac aceast cifr este peste atunci constatarea nu este semnificativ. 0.05
n exemplul nostru, sig < 0.05, deci exist diferene semnificative ntre grupurile studiate.
eantion din 60 de persoane, 29 de sex masculin i 31 de sex feminin care au fost chestionai cu privire la nivelul salariilor primite. Ipoteze de lucru: Ipoteza nul H0: eantioanele provin din aceeai populaie (medianele sunt aceleai) Ipoteza alternativ H1: eantioanele provin din populaii diferite (medianele sunt diferite) Procedura de derulare: Analyze/ Nonparametric Tests / k Independent Samples. n urma derulrii procedurii vom obine urmtoarea fereastr:
Variabila salariul curent este trecut n lista Test Variable Lists, iar variabila Sex este trecut n Grouping Variable. Click pe Define Range pentru a defini variabila de grupare Sex.
46
Click Continue, apoi Click OK pentru a derula procedura de testare i obinem outputul:
Din tabelul Frequencies avem: 0 Numrul de persoane de sex masculin care au nivelul salariului mai mare dect valoarea medianei 14, i care au nivelul salariului mai mic dect valoarea medianei - 15 1 Numrul de persoane de sex feminin care au nivelul salariului mai mare dect valoarea medianei 13, i care au nivelul salariului mai mic dect valoarea medianei 18 Din acest tabel observm c nu exist mari diferene ntre numrul de persoane de sex feminin i cele de sex masculin care au nivelul salariului mai mare sau mai mic dect valoarea medianei.
Din tabelul Test Statistics, avem: N numrul total de respondeni din care este format eantionul 60 Median valoarea medianei 340 47
Chi-square valoarea hi ptrat care se compar cu cel tabelar care i corespunde unui risc = 5% i grade de libertate 1. Df grade de libertate Sig > ,05 se accept ipoteza nul H0 care spune c nu exist diferene semnificative ntre nivelul salariilor persoanelor de sex feminin i cele de sex masculin.
Concluzie: Putem afirma cu un risc de eroare de 5% c nu exist diferene semnificative ntre salariile primite de persoanele de sex feminin i cele de sex masculin.
Exemplu : Testm un eantion de 60 de persoane. Dorim s aflm dac exist vreo legtur ntre frecvena n lcaurile de rugciune i ct de religioase sunt persoanele chestionate. Ipoteze de lucru : 0 1 Ipoteza nul H0 : nu exist nici o legtur ntre frecvena n locurile de Ipoteza alternativ H1 : exist legtur ntre frecvena n locurile de rugciune i intensitatea credinei rugciune i intensitatea credinei
48
Derularea
procedurii
de
testare :
AnalyzeNonparametric Independent
Testsk Tests.
Alegem variabila rel_tip (intensitatea credinei) pe care o trecem n Test Variable List i variabila de grupare frecv_1 (frecvena n lcaurile de rugciune). Click pe Define Range pentru a defini variabila de grupare. Minimum = 1, Maximum = 5. Click Continue, apoi Click OK. Vom obine urmtorul Output :
49
Interpretare tabel : Number of levels - numrul de nivele pe care l are variabila de grupare. n cazul nostru = 5 (niciodata, rar, lunar, sptmnal, mai des de o dat pe sptmn) N numrul de nregistrri = 60 n cazul nostru Sig nivelul de semnificaie. n cazul nostru sig > ,05, deci se accept ipoteza alternativ. Cu un risc de eroare de 5% putem afirma c exist o legtur ntre intensitatea credinei i fercvena n lcaurile de rugciune. Adic, cu ct persoanele sunt mai religioase, cu att vor frecventa mai des lcaurile de rugciune.
Testul Wilcoxon este o alternativ neparametric a testului t pentru pentru eantioane dependente. Acest test detecteaz diferenele ntre distribuiile a dou eantioane dependente. Testul Wilcoxon se folosete atunci cnd se msoar aceeai variabil continu n dou ocazii diferite chestionnd 50
aceeai respondeni i nu se dorete ca distribuia continu s fie tratat ca fiind parametric. n timp ce testul t pentru eantioane dependente se bazeaz pe examinarea faptului dac exist diferene semnificative ntre media nregistrrilor, testul Wilcoxon, deoarece datele sunt clasificate, se bazeaz pe studierea diferenelor semnificative ntre mediile rangurilor. Pentru a derula testul Wilcoxon pentru eantioane dependente click n Baza de date: AnalyzeNonparametric Tests2 Related Samples
n urma acestui demers va rezulta fereastra Two Related-Samples Tests. Se aleg variabilele sal_prim i sal_cur din lista de variabile i se trec n Test Pair(s) List. Se bifeaz testul Wilcoxon din Test Type, apoi se d OK pentru a derula procedura.
51
Calcularea valorii testului Wilcoxon presupune: b) calcularea diferenelor de scoruri/valori c) ordonarea valorilor absolute a diferenelor de scoruri d) aflarea mediei rangurilor pentru toate nregistrrile cu diferene de scoruri negative i media rangurilor pentru nregistrrile ce au diferene de scoruri pozitive. Ipotezele de lucru: Ipoteza nul H0 : nu exist diferene semnificative ntre variabila salariul de nceput i variabila salariul curent. Ipoteza alternativ H1: exist diferene semnificative ntre variabila salariul de nceput i variabila salariul curent. n urma derulrii procedurii se va obine urmtorul Output:
52
Total - arat numrul total de nregistrri Negative Ranks se refer la acele nregistrri pentru care valoarea celei de-a doua variabil (salariul curent) este mai mare dect valoarea primei variabile (salariul de nceput).
Positive Ranks se refer la acele nregistrri pentru care valoarea primei variabile (salariul de nceput) este mai mare dect valoarea celei de-a doua variabil (salariul curent).
Ties conine numrul de nregistrri pentru care valorile celor dou variabile sunt egale (salariul de nceput = salariul curent).
Mean Rank media rangurilor Sum of Ranks suma rangurilor. Dac cele dou variabile nu difer atunci suma rangurilor diferenelor pozitive va fi aproximativ egal cu suma rangurilor diferenelor negative. Suma rangurilor pentru valoarea diferenial cea mai mic (n aceast situaie numrul diferenelor negative este cel mai mic, adic 3) va fi folosit n calcularea testului Wilcoxon.
53
Z reprezint standardizarea sumei rangurilor corespunztoare celei mai puin frecvente diferene (n acest caz diferenele negative). Acest Z calculat se compar cu valoarea Z teoretic care poate fi luat din tabelul de valori Z Wilcoxon.
Asymp. Sig (2-tailed) reprezint nivelul de semnificaie. Daca lum un nivel de semnificaie de ,05 putem avea dou situaii: o Sig < ,05 atunci cele dou variabile difer n distribuii (se respinge ipoteza nul H0) o Sig > ,05 atunci nu exist diferene n distribuiile celor dou variabile. (se respinge ipoteza nul i se accept ipoteza alternativ H1)
Concluzie: n cazul nostru sig = .000, deci < ,05 exist diferene semnificative ntre distribuiile celor dou variabile (salariul de nceput i salariul curent) , cu un nivel de risc = 5%.
Testul Sign
Testul sign este o procedur utilizat pentru dou eantioane dependente pentru a testa ipoteza c cele dou variabile au distribuii asemntoare. Testul clasific toate diferenele dintre dou variabile n trei categorii: 0 Diferene negative: valorile rimei variabile sunt mai mici dect valorile din ce-a de-a doua variabil
54
1 2
Diferene pozitive: valorile primei variabile sunt mai mari dect valorile Ties: valorile primei variabile sunt aceleai cu valorile celei de-a doua
celei de-a doua variabil variabil Dac cele dou variabile urmeaz distribuii asemntoare, numrul de diferene pozitive sau negative nu va fi diferit n mod semnificativ (va fi acelai). Pentru a derula testul Sign pentru eantioane dependente click n Baza de date: Analyze/ Nonparametric Tests/ 2Related Samples
n urma acestui demers va rezulta fereastra Two Related-Samples Tests. Se aleg variabilele sal_prim i sal_cur din lista de variabile i se trec n Test Pair(s) List. Se bifeaz testul Sign din Test Type, apoi se d OK pentru a derula procedura.
55
Ipotezele de lucru: ipoteza nul H0 : nu exist diferene semnificative ntre variabila salariul de nceput i variabila salariul curent. Ipoteza alternativ H1: exist diferene semnificative ntre variabila salariul de nceput i variabila salariul curent. n urma derulrii procedurii se va obine urmtorul Output:
56
Negative Ranks se refer la acele nregistrri pentru care valoarea celei de-a doua variabil (salariul curent)este mai mare dect valoarea primei variabile (salariul de nceput).
Positive Ranks se refer la acele nregistrri pentru care valoarea primei variabile (salariul de nceput)este mai mare dect valoarea celei de-a doua variabil (salariul curent)
Ties conine numrul de nregistrri pentru care valorile celor dou variabile sunt egale (salariul de nceput = salariul curent).
Asymp. Sig (2-tailed) reprezint nivelul de semnificaie. Daca lum un nivel de semnificaie de ,05 putem avea dou situaii: o Sig < ,05 atunci cele dou variabile difer n distribuii (se respinge ipoteza nul H0) o Sig > ,05 atunci nu exist diferene n distribuiile celor dou variabile. (se respinge ipoteza nul i se accept ipoteza alternativ H1)
n cazul nostru sig = ,000, deci < ,05 exist diferene semnificative ntre distribuiile celor dou variabile (salariul de nceput i salariul curent) , cu un nivel de risc = 5%.
57
Testul McNemar
McNemar este un test pentru dou eantioane dependente
Testul
dicotomice. El testeaz schimbrile n rspunsuri folosind distribuia hi ptrat. Acest test este folosit de obicei n situaii repetitive, n care rspunsul fiecrui subiect este solicitat de dou ori, o dat nainte i o dat dup producerea unui eveniment specific. Testul McNemar determin dac rata iniial a rspunsurilor (naintea producerii evenimentului) este egal cu rata final a rspunsurilor (dup producerea evenimentului). Acest test este folositor pentru a detecta schimbrile n rata rspunsurilor datorit interveniei. Exemplu : Presupunem c avem un eantion de 60 de salariai. Acetia au fost chestionai pentru a afla dac sunt sau nu fumtori. Dup aplicarea acestui chestionar firma a desfurat aciuni intensive de combatere a consumului de igri (afie, prezentri, pliante, etc.). Dup 6 luni, acelai eantion a fost supus unui al doilea chestionar cu privire la consumul de igri. Ceea ce dorim s aflm prin aplicarea testului McNemar este dac exist sau nu diferene de comportament ntre momentul de dinainte i de dup aciunile de combatere a cosumului de igri. Ipotezele de lucru : ipoteza nul H0 : nu exist diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte i dup aciunile desfurate pentru combaterea consumului de igri Ipoteza alternativ H1: exist diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte i dup aciunile desfurate pentru combaterea consumului de igri Pentru a derula testul McNemar pentru eantioane dependente click n Baza de date: Analyze/ Nonparametric Tests/ 2Related Samples 58
n urma acestui demers va rezulta fereastra Two Related-Samples Tests. Se aleg variabilele fumat_1 i fumat_2 din lista de variabile i se trec n Test Pair(s) List. Se bifeaz testul McNemar din Test Type, apoi se d OK pentru a derula procedura.
59
Interpretare 1: Pentru dou variabile binare sunt posibile patru combinaii ale categoriilor. Acest tabel arat numrul de cazuri pentru fiecare combinaie a categoriilor. Diagonala tabelului include cazuri care au aceeai rspunsuri pentru ambele variabile. Datele care nu sunt pe diagonal se refer la cazurile care au rspunsuri diferite pentru cele dou variabile. Pentru exemplul nostru: 0 1 2 3 Sunt 0 persoane care au trecut de la nefumtor la fumtor Doar 12 persoane din cele care au rspuns iniial c sunt fumtoare au 24 din persoanele care au precizat ca sunt fumtoare au declarat 24 de persoane care au precizat c sunt nefumtoare au rspuns
rmas fumtoare i dup aciunea desfurat ulterior c sunt nefumtoare ulterior c sunt nefumtoare. Alt tabel care apare n Output:
60
Interpretare 2: N numrul total de respondeni Sig - reprezint nivelul de semnificaie. Daca lum un nivel de semnificaie de ,05 putem avea dou situaii: o Sig < ,05 atunci exist diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte i dup aciunile desfurate pentru combaterea consumului de igri (se respinge ipoteza nul H0) o Sig > ,05 atunci nu exist diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte i dup aciunile desfurate pentru combaterea consumului de igri (se respinge ipoteza nul i se accept ipoteza alternativ H1) n cazul nostru sig = ,000, deci < ,05 exist diferene semnificative diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte i dup aciunile desfurate pentru combaterea consumului de igri, cu un nivel de risc = 5%.
3
Dac
Testul Homogeneity
datele folosite sunt categoriale, se folosete testul marginal
homogeneity. Acesta este o extensie a testului McNemar de la rspunsuri binare la rspunsuri categoriale. El testeaz schimbrile n rspunsuri 61
folosind distribuia Hi-ptrat i este folositor pentru a detecta schimbrile n rspunsuri datorate unei intervenii. Acest test este accesibil numai dup instalarea programului Exact Tests. Exemplu : Presupunem c avem un eantion de 60 de salariai. Acetia au fost chestionai pentru a afla dac sunt sau nu satisfcui de salariul primit. Dup aplicarea acestui chestionar firma a modificat salariile . Dup modificarea salariilor, acelai eantion a fost supus unui al doilea chestionar cu privire la satisfacia cu privire la salariul primit. Ceea ce dorim s aflm prin aplicarea testului homogeneity este dac exist sau nu diferene de opinie ntre momentul de dinainte i de dup modificarea salariilor. Ipotezele de lucru : Ipoteza nul H0 : nu exist diferene semnificative ntre
rspunsurile salariailor n cele dou momente nainte i dup modificarea salariilor Ipoteza alternativ H1: exist diferene semnificative ntre rspunsurile salariailor n cele dou momente nainte i dup modificarea salariilor. Pentru a derula testul Homogeneity pentru eantioane dependente click n Baza de date: AnalyzeNonparametric Tests2 Related Samples
62
n urma acestui demers va rezulta fereastra Two Related-Samples Tests. Se aleg variabilele satisf1i satisf2 din lista de variabile i se trec n Test Pair(s) List. Se bifeaz testul Homogeneity din Test Type, apoi se d OK pentru a derula procedura.
63
Interpretare: Distinct values numrul de categorii pe care le au variabilele. n cazul nostru sunt 5 niveluri ale variabilelor satisf1 i satisf2. Sig < ,05, deci distribuiile celor dou variabile difer (se respinge ipoteza nul H0). Gradul de satisfacie al salariailor chestionai cu privire la salariile primite se schimb semnificativ n momentul modificrii salariilor.
n tabelul Crosstabulation sunt illustrate mai clar diferenele ce exist n rspunsurile respondenilor n cele dou momente diferite, nainte i dup modificarea salariilor. Dac se compar totalul de rspunsuri pe fiecare 64
categorie a variabilei i n cele dou momente diferite se observ c difer, deci distribuiile nu sunt omogene.
Pentru aceasta se urmeaz calea:AnalyzeNonparametric TestsK Related Samples. Dup deschiderea ferestrei Tests for Several Related Samples trecem variabilele frecv_1, frecv_2, frecv_3 n zona Test Variables iar n zona Test Type bifm csua corespunztoare testului Friedman i selectm butonul de comand OK.
66
Interpretare: 0 Ranks:valorile variabilei sunt clasificate pentru fiecare caz n parte iar tabelul listeaz media rangurilor pentru fiecare variabil. Ranguri mici corespund pentru valori mici ale variabilelor. n acest exemplu frecvena n locaurile religioase la prima aplicare a chestionarului difer semnificativ fa de a doua i a treia aplicare. 1 Test Statistics listeaz rezultatele testului Friedman. N indic numrul de cazuri valide, Chi-Square reprezint valoarea testului Hi-ptrat, care se compar cu cea tabelar, df indic numrul de grade de libertate, iar sig<0.05 indic faptul c cel puin una din variabile difer de celelalte. De aceea concluzionm c exist o diferen semnificativ.
67
De exemplu vrem s aflm dac frecvena salariailor n lcaurile religioase s-a schimbat de-a lungul unei perioade de timp de 1 an. Salariaii au fost chestionai de trei ori n acest interval, la o distan de 6 luni. Ipotezele de lucru : Ipoteza nul H0 : nu exist diferene semnificative ntre rspunsurile salariailor n trei momente diferite la o distan de 6 luni unele fa de altele Ipoteza alternativ H1: exist diferene semnificative ntre rspunsurile salariailor n cele trei momente diferite la o distan de 6 luni unele de altele. Pentru aceasta se urmeaz calea: AnalyzeNonparametric TestsK Related Samples. Dup deschiderea ferestrei Tests for Several Related Samples trecem variabilele frecv_1, frecv_2, frecv_3 n zona Test Variables iar n zona Test Type bifm csua corespunztoare testului Kendalls i selectm butonul de comand OK.
68
Interpretare: 2 Ranks:valorile variabilei sunt clasificate pentru fiecare caz n parte iar
tabelul listeaz media rangurilor pentru fiecare variabil. Ranguri mici corespund pentru valori mici ale variabilelor. n acest exemplu frecvena n locaurile religioase la prima aplicare a chestionarului difer semnificativ fa de a doua i a treia aplicare. 3 Test Statistics listeaz rezultatele testului Kendalls. N indic numrul de cazuri valide, valoarea coeficientului Kendalls W indic o concordan sczut (are valori apropiate de 0), Chi-Square reprezint valoarea testului Hi-ptrat, care se compar cu cea tabelar, df indic numrul de grade de libertate (3-1=2), iar sig<0.05 indic faptul c cel puin una din variabile difer de celelalte.
chestionar firma a desfurat aciuni intensive de combatere a consumului de igri (afie, prezentri, pliante, etc.). imediat dup terminareaa aciunii (dup 6 luni), acelai eantion a fost supus unui al doilea chestionar cu privire la consumul de igri. Iar dup nc 6 luni de la terminarea programului au fost testai a treia oar. Ceea ce dorim s aflm prin aplicarea testului Cochrans Q este dac aciunile de combatere a consumului de igri au avut efect i pe termen mediu, nu numai scurt, adic dac exist sau nu diferene de comportament ntre momentul de dinainte, imediat dup i la 6 luni dup aciunile de combatere a cosumului de igri.
rspunsurile slariailor n cele trei momente nainte, imediat dup i la o distan de 6 luni dup aciunile desfurate pentru combaterea consumului de igri Ipoteza alternativ H1: exist diferene semnificative ntre rspunsurile slariailor n cele dou momente nainte, imediat dup i la o distan de 6 luni dup aciunile desfurate pentru combaterea consumului de igri Pentru a ajunge la rezultat se urmeaz calea: AnalyzeNonparametric TestsK Related Samples. Dup deschiderea ferestrei Tests for Several Related Samples trecem variabilele fumat_1, fumat_2, fumat_3 n zona Test Variable i bifm csua corespunztoare testului Cochrans Q. Fiind variabile dichotomice nu bifm nimic n caseta Statistics. Selectm apoi butonul de comand OK.
70
Output-ul aprut conine: 0 Tabelul Frequencies care conine numrul de cazuri din fiecare categorie pentru fiecare variabil. Coloana 1 aparine primei categorii (da), iar coloana 2 aparine celei de-a doua categorii (nu). Aceste numrri indic de exemplu o migraie masiv a persoanelor fumtoare ctre cele nefumtoare dup primele 6 luni 1 Test Statistics conine numrul de cazuri valide (N), valoarea testului Cochrans Q i gradele de libertate (df) pentru a putea compara cu valoarea tabelar i valoare Sig care n cazul nostru indic faptul c cel puin una dintre variabile difer de celelalte, cu un nivel de risc de 5%.
71
Bibliografie
Ussers Guide for SPSS 9.0 Application Guide for SPSS 9.0 Jaba Elisabeta, Grama Ana Analiz Statistic cu SPSS sub Windows, Polirom, 2004
73