Sunteți pe pagina 1din 22

Tema: Statistica nonparametrica (neparametrica) Exista mai multe metode nonparametrice, cele mai ntlnite fiind: tehnica lui

2 (Chi patrat); testul U a lui Mann-Whitney (echivalentul testului parametric t independent); testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent); testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, nsa datele sunt convertite n ranguri); testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate).
03.12.2013 statistica sociala

Tehnica lui Chi Ptrat 2 Se aplica atunci cnd rezultatele sunt clasificate n functie de gen, vrsta, nivel de pregatire, grupuri de tratament sau orice alta masura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.
Numarul salii
1 Observat (O) Probabil (E) 24 30 2 34 30 3 22 30 4 40 30 Total 120 120

03.12.2013

statistica sociala

Formula de calcul 2 (Chi Ptrat):

Unde: O = frecventa observata; E =frecventa probabila (teoretica, expectata).

03.12.2013

statistica sociala

Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelul . Deoarece n cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3. Valoarea lui c 2 de 7, 19 este mai mica dect cea din tabel la 3 df. Se observa ca la un prag de semnificatie p <.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative ntre cele patru banci nu poate fi eliminata, iar Alex nu este ntemeiat sa creada ca o sala i aduce mai mult ghinion dect o alta. Observatii: gradele de libertate se stabilesc n functie de numarul de alternative existente minus unu; frecventa teoretica se stabileste mpartind numarul total de date la numarul de alternative; daca exista anumite informatii prealabile care sa ateste o anumita distributie a datelor atunci principiul amintit anterior cade. Spre exemplu daca frecventa probabila de aparitie a nevrozei ntr-un grup este de 20 %, atunci frecventa teoretica se obtine stabilind ct nseamna 20% din totalul de date prezentate. De multe ori o problema implica doua sau mai multe categorii de evenimente si doua au mai multe grupe. Un exemplu ar fi analizarea rezultatelor la un chestionar de atitudine n care sunt precizate mai multe raspunsuri (de acord, abtinere, dezacord) si doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este numita tabel de contingenta. Exemplu: n urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane religioase si al unui alt grup de persoane nereligioase la urmatoarea ntrebare: "Sunteti de 03.12.2013 statistica sociala acord ca tinerii sa faca dragoste nainte de casatorie?"

O tabela 3 x 2 de contingenta a raspunsurilor

03.12.2013

statistica sociala

n exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze rationale sau alte surse de informatii. n tabelul de contingenta valorile probabile se calculeaza din frecventele efectiv aparute fata de totalul raspunsurilor. De exemplu, numarul total de subiecti care au fost de acord cu afirmatia este de 144. Deoarece n total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au fost de acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta ntre grupul persoanelor religioase si non-religioase (ipoteza nula), atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250 =80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica).

X 2 se calculeaza n acelasi mod si n acest exemplu

03.12.2013

statistica sociala

Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul de rnduri (n acest caz doua, religios vs. ateu) iar c numarul de coloane (n acest caz trei, de acord, abtinere, dezacord). Astfel, df = (2-1) (3-1) = 2. Cautnd n tabelul de semnificatii la df = 2, observam ca c 2 ar avea valoarea 9, 21 la un p <.01. Valoarea obtinuta a lui hi patrat de 79,29 este categoric semnificativa. Aceasta ne spune ca ipoteza nula trebuie respinsa. Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente semnificative se calculeaza rezidul standardizat (R). Formula sa este:

03.12.2013

statistica sociala

Aceasta formula este aplicata n cadrul fiecarei situatii. Daca rezidul standardizat este mai mare dect 2 (n valoare absoluta, indiferent de semn) putem considera ca acel element a adus un rol important n obtinerea unui c 2 semnificativ. n cazul de fata att valorile din dreptul sintagmei "de acord" ct si cele din dreptul sintagmei "dezacord" au iesit relevante. Nu se observa nsa diferente semnificative ntre cele doua grupe n ce priveste alternativa "nu stiu". Restrictiile de utlizare a testului c 2 Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze asupra populatiei ca cele parametrice, exista totusi o serie de restrictii si n utilizarea acestui tip de teste. Observatiile trebuie sa fie independente si categoriile formate trebuie sa se excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si de alegerea unui singur raspuns la ntrebare. De obicei, testul hi patrat nu se poate aplica pentru esantioane mici. Frecventa probabila (teoretica) pentru orice casuta nu trebuie sa fie mai mica de unu. Mai mult, unii statisticieni pretind ca nu mai mult de 20% din casute sa aiba valori teoretice ale frecventelor mai mici de cinci. O tactica ntlnita n astfel de situatii este sa se combine sasutele adiacente, marind valoarea frecventei teoretice. Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei corectii, denumita corectia Yates pentru continuitate. Aceasta opereaza o scadere de 0,5 din diferenta dintre frecventele observate si cele teoretice (expectate, probabile) nainte de a o ridica la patrat:

03.12.2013

statistica sociala

03.12.2013

statistica sociala

O alta limitare impusa tabelei de contingenta de tip 2 x 2 este ca numarul total (N) sa fie cel putin 20; Frecventa probabila (teoretica) sa fie stabilita a priori, fie ca probabilitate de aparitie egala, fie utiliznd date existente. Nu trebuie sa i se permita cercetatorului sa se uite pe datele obtinute si apoi sa "scoata din mneca" o distributie teoretica care sa se potriveasca cu ipoteza. Concluzii n ce priveste utilizarea lui c 2: Se utilizeaza atunci cnd avem de analizat date nominale (calitative); Se poate calcula rezidul standardizat specific fiecarei casute pentru a diferentia care elemente au contribuit mai mult la obtinerea unui c 2 semnificativ; Testul de omogenitate c 2 are menirea de a distinge daca exista diferente semnificative ntre distributia teoretica (expectata) si distributia reala (observata) obtinuta.
03.12.2013 statistica sociala

Testul U al lui Mann-Whitney


Este analog testului parametric t independent, fiind una din cele mai puternice probe neparametrice. Poate fi utilizat att cu esantioane mici de subiecti, ct si cu esantioane mari si necesita numai masuratori de tip rang sau cnd nu ndeplinim conditiile aplicarii testului t independent. Acest test opereaza cu numere ordinale. Exista doua modalitati de calculare a acestui test n functie de marimea esantioanelor (n1 si n2 mai mici de 20 de persoane, respectiv, n1, n2 mai mari de 20).

Testul U a lui Mann-Whitney pentru N< 20 Exemplu: Un psiholog social este interesat sa afle daca exista diferente ntre doua categorii de femei (angajate, respectiv casnice) n ce priveste atitudinea lor asupra miscarii feministe. Pasi n rezolvarea problemei:

03.12.2013

statistica sociala

Stabilirea ipotezei: Cercetatorul afirma exista o diferenta semnificativa ntre cele doua grupe. Se stabileste si pragul de semnificatie de 0,05. Ipoteza de lucru poate fi luata n considerare numai dupa respingerea ipotezei nule. Pentru a respinge ipoteza nula, se trece la calcularea lui U lundu-se n considerare att tendintele centrale ct si cele dispersionale. Se calculeaza U1 si U2 pentru fiecare dintre grupe. Iata raspunsurile date de cele doua categorii.

03.12.2013

statistica sociala

prima grupa; S R2=suma rangurilor din Unde: n1= numarul de subiecti din prima grupa; n2= numarul de subiecti din a doua grupa; S R1=suma rangurilor din a doua grupa. Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. n acest caz U1 este 27, iar U2 73. Se alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe diagonala tinnd cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este U=27 pentru p<.05. Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel. n problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza nula este respinsa. Exista asadar o diferenta semnificativa n ce priveste atitudinea femeilor din cele doua grupe.
03.12.2013 statistica sociala

Unde: n1= numarul de subiecti din prima grupa; n2= numarul de subiecti din a doua grupa; S R1=suma rangurilor din prima grupa; S R2=suma rangurilor din a doua grupa. Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. n acest caz U1 este 27, iar U2 73. Se alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe diagonala tinnd cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este U=27 pentru p<.05. Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel. n problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza nula este respinsa. Exista asadar o diferenta semnificativa n ce priveste atitudinea femeilor din cele doua grupe.

03.12.2013

statistica sociala

n aceasta situatie se consulta z n tabel si se urmareste daca valoarea obtinuta este mai mare dect cea din tabel. Daca z obtinut este mai mare dect z din tabel (la un prag de semnificatie de minim 0,05) atunci ipoteza nula este respinsa si se demonstreaza ca exista o diferenta reala, semnificativa ntre cele doua grupe.

Testul TeWilcoxon al rangurilor pereche


Exista studii comparative ntre doua grupe dependente (corelate) care nu ndeplinesc conditiile parametrice. n astfel de situatii trebuie aplicat acest test care are aceleasi principii cu testul t dependent. Prin testul Wilcoxon se determina marimea diferentelor dintre rezultate (spre exemplu nainte si dupa o actiune), ordonate dupa rang. Exemplu: Un psihopedagog special este interesat de efectul unor sedinte de consiliere asupra comportamentului agresiv la copiii cu dificultati de nvatare. Alege un numar de 12 subiecti pe care i testeaza nainte si dupa aceste sedinte. Rezultatele sunt prezentate n tabel.

03.12.2013

statistica sociala

Pasii de calculare a acestui test sunt urmatorii:


Determinarea diferentelor (coloana patru) prin scaderea rezultatelor "post" din "pre". Unele diferente sunt pozitive si altele negative. n cazul n care diferenta este zero cazul respectiv este exclus din analiza ulterioara deoarece nu are nici o influenta. Nu este neaparat necesar ca diferenta sa fie calculata scaznd post-testul din pre-test. Exista situatii cnd acest fapt se inverseaza, adica se scade pre-testul din post-test. Depinde de ceea ce doreste studiul respectiv, sa reduca niste simptome defavorbaile (reducerea agresivitatii) sau sa mbunatateasca situatia (cresterea stimei de sine). Ordonarea rezultatelor dupa rang indiferent de semn (coloana a cincea). Se ncepe cu cea mai mica diferenta (valoarea zero este exclusa si nu intra n calcul). Atribuirea semnului corespunzator n fata rangurilor (coloana 6) n functie de rezultatul obtinut n coloana diferentelor. Determinarea rangurilor cu semn negativ si introducerea lor n coloana a saptea. Aceste ranguri sunt apoi adunate si rezultatul se noteaza cu T. Testarea valorii lui T pentru semnificatie. Se consulta direct valoarea lui T din tabel. Rezultatele a caror diferenta a fost zero sunt excluse, astfel ca daca am avea 15 subiecti dintre care doua rezultate au fost identice nainte si dupa testare ne vom uita n tabel n dreptul lui n=13. n problema de fata nsa, toate rezulatele au fost validate ca urmare vom consulta tabelul n dreptul lui n=12 si a pragului de semnificatie stabilit anterior, adica minim 0,05. Se observa ca valoarea lui T trebuie sa fie egala sau mai mica de 14 pentru a putea elimina ipoteza nula la un prag de 0,05. Cum rezultatul obtinut a fost T=4, se poate spune ca acele sedinte de consiliere au condus la o 03.12.2013 statistica sociala scadere semnificativa statistic a comportamentului agresiv.

Testul ANOVA Kruskal-Wallis al rangurilor


Este un test nonparametric utilizat cnd exista mai mult de doua grupe independente. Este comparabil cu o ANOVA simpla din statistica parametrica. Pentru analiza, datele sunt convertite n ranguri. Exemplu: Un cercetator este interesat de diferentele care exista n ce priveste exercitarea unui comportament autoritar la trei grupe de dascali ( scoala primara; gimnaziu, respectiv liceu). n acest caz exista 17 subiecti mpartiti n 3 grupe (6;5;6). Iata rezultatele obtinute la scala de evaluare a autoritarismului n comportament:
Date: Scala de Evaluare a Autoritarismului Dascali ciclu primar(1) Scor 52 46 62 48 Rang 4 1 9 2 Dascali ciclu gimnazial(2) Scor 66 49 64 53 Rang 13 3 11 5 Dascali ciclu liceal(3) Scor 63 65 58 70 Rang 10 12 8 15

57
54

7
6

68

14

71
73

16
17

03.12.2013

statistica sociala

Acordarea de ranguri n functie de rezultatele obtinute la masurarea autoritarismului. Se acorda rangul 1 rezultatului care indica cel mai mic grad de autoritarism indiferent de grupa de provenienta. n caz de egalitate se acorda ranguri egale dupa metoda ntlnita si n cazul celorlalte teste neparametrice. nsumarea rangurilor pentru fiecare grupa. Daca ipoteza nula ar fi adevarata atunci ar trebui sa obtinem suma rangurilor unei grupe asemanatoare ca valoare pentru toate grupele. Testarea semnificatiei diferentelor dintre grupe prin testul ANOVA K-W simbolizat cu H, iata formula:

Pasi n rezolvarea problemei

Unde N= totalul rezultatelor; (S Ri) / ni = raportul dintre suma rangurilor ridicata la patrat al unei grupe si numarul de subiecti din grupa respectiva; S [(S Ri) / ni] = Suma raporturilor obtinute la toate grupele; ni= este numarul de rezultate din fiecare grupa.
03.12.2013

H=7,86.

statistica sociala

Cnd sunt mai multi de 5 subiecti n fiecare grupa se testeaza valoarea lui H prin consultarea lui c 2 la df (grade de libertate) = k 1 (unde K este numarul de grupe). Daca sunt 5 sau mai putini subiecti n fiecare grupa se utilizeaza o tabela speciala. Daca exista un numar mare de ranguri egale (peste 25%) se opereaza o corectie a lui H. n cazul de fata, deoarece avem doar o singura grupa care nu are mai mult de 5 subiecti si doua care ndeplinid conditia amintita, vom proceda la consultarea lui c 2 din tabel. Se observa ca valoarea lui hi patrat la nivelul de ncredere de 0,05 pentru 2 df (3 grupe minus unu) este de 5,99, ca urmare rezultatul obtinut de noi (7,86) este mai mare. Astfel, ipoteza nula este respinsa si putem afirma ca exista o diferenta semnificativa n ce priveste gradul de autoritarism n functie de ciclul scolar la care profeseaza dascalii supusi studiului. Pentru a aprofunda demersul statistic, putem analiza care grup este responsabil pentru aparitia acestor diferente. Avem doi subpasi de realizat n acest sens: Tehnica Bonferoni prin care dorim sa pastram nivelul de analiza (alfa) constant. Pentru aceasta trebuie mpartit a (0,05) la numarul de grupe ale studiului. n acest caz la trei, rezultnd un a = 0,017. Se consulta n tabel aceasta valoare, cautnd valoarea z si se observa ca pentru acest procent este specificat un z =2,39. Aceasta va fi nmultit cu eroarea standard a diferentei dintre doua esantioane. Al doilea subpas consta n calcularea acestor erori medii a diferentelor dupa formula: Unde: N = numarul total de subiecti; n = numarul de subiecti din grupele care se compara. Pentru cele trei comparatii ale noastre, eroarea standard a diferentei este: profesori elementara 03.12.2013 statisticaversus sociala profesori gimnaziu

profesori elementara versus profesori liceu

profesori gimnaziu versus profesori liceu idem a. 7.Se stabileste un interval de ncredere pentru fiecare comparatie n parte. El este egal cu diferenta mediei dintre grupuri plus sau minus valoarea lui z pentru a de 0,017, adica 2,39*SE al fiecarei grupe. Astfel: a) intervalul pentru grupele de elementara versus gimnaziu 9,204,83 +/- 2,39*3,05 = 4,37+/-7,28 = [-2,91; 11,65] b) intervalul pentru grupele de elementara versus liceu 13 4,83 +/- 2,39*2,91 = 8,17 +/- 6,95 = [1,22; 15,12] c) intervalul pentru grupele de gimnaziu versus liceu 13 9,20 +/- 2,39*3,05 = 3,80 +/- 7,28 = [-3,48; 11,08] O comparatie este semnificativa statistic daca intervalul obtinut nu include valoarea zero. Din comparatiile efectuate diferentele semnificative apar doar ntre grupa de dascali de la ciclul primar si cei de la ciclul liceal (intervalul obtinut nu include si cifra zero). Putem concluziona ca exista o diferenta semnificativa n ce priveste nivelul de autoritarism exercitat de profesori ntre cei din ciclul primar si cei din ciclul liceal, cei din urma fiind mai autoritari. Observatie Att testul ANOVA Kruskal-Wallis ct si a testul U a lui MannWhitney sunt tehnici ce utilizeaza date ordinale, existnd posibilitatea unor ranguri egale. Daca acest numar de ranguri egale este preastatistica mare (peste 30%) nu se recomanda 03.12.2013 sociala utilizarea lor.

Testul Friedman ANOVA biunivoc al rangurilor Testul este analog tehnicii ANOVA cu masuratori repetate din statistica parametrica. Rezultatele sunt ordonate pe ranguri si se utilizeaza hi patrat ca test de semnificatie. Exemplu: Un grup de 12 subiecti au fost supusi unei metode de nvatare a limbilor straine folosind tehnici sofrologice. Au fost testati de 3 ori: naintea aplicarii metodei, la o luna si la trei luni de la nceperea experimentului. Au fost obtinute rezultatele:

EVALUARE
S 1 2 3 A 16,0 11,6 18,1 B 15,7 10,9 18,0 C 15,2 11,5 17,6 R(A) 3 3 3

RANGURI
R(B) 2 1 2 R(C) 1 2 1

4
5 6 7 8 9 10 11 12

16,3
12,0 12,5 9,3 18,8 19,2 22,3 20,7

16,8
13,1 12,2 8,8 17,5 19,7 22,8 20,3 23,7

17,0
12,8 12,3 9,0 18,0 19,7 21,6 19,6 24,4

1
1 3 3 3 1 2 3

2
3 1 1 1 2,5 3 2

3
2 2 2 2 2,5 1 1

03.12.2013

Suma rangurilor:

24,1

statistica sociala

28

21,5

22,5

Pasi n rezolvarea problemei: Cele trei rezultate pentru fiecare subiect sunt convertite n rangul corespunzator de la unu la trei n functie de rezultatul obtinut. Spre exemplu, subiectul 1 a obtinut cele mai putine erori la cea de a treia evaluare si primeste rangul unu, apoi rangul doi pentru evaluarea din mijloc si rangul trei pentru evaluarea initiala n care a savrsit cele mai multe erori. n caz de egalitate de ranguri se procedeaza conform uzantelor clasice pentru ranguri egale. Rangurile din fiecare coloana sunt apoi nsumate. n cadrul ipotezei nule, aceste sume ar trebui sa fie aproximativ egale, adica sa nu existe diferente semnificative ntre evaluari. Calcularea lui hi patrat pentru ANOVA dublu Friedman prin ranguri la un grad de libertate df=k-1, unde k se refera la numarul de masuratori efectuate n acest caz 3. Formula este urmatoarea:
Unde: N este numarul de subiecti (n acest caz 12); K este numarul de evaluari (n acest caz 3); (S R) se obtine prin adunarea rangurilor din fiecare coloana n parte si apoi ridicarea lor la patrat (n cazul de fata avem 28 la patrat pentru prima evaluare; 21,5 la patrat pentru cea de a doua evaluare si 22,5 la patrat pentru cea de a treia evaluare. S (S R)2 se obtine adunnd rezultatele amintite n rndul precedent (n cazul de fata 1752,5). 4. Astfel se obtine un hi patrat = 1,46. Consultam acest rezultat n tabelul lui hi patrat la un p mai mic de 0,05 cu doua grade de libertate (k-1) si observam ca este trecuta valoarea de 5,99. Rezultatul obtinut de noi este mai mic dect valoarea din tabel, ca urmare nu exista diferente semnificative ntre rezultatele obtinute n cele trei evaluari. Cnd esantioanele sunt prea mici N<10 si k=3 sau N<5 si k=4 se va utiliza un alt tabel, special, pentru a compara valorile lui hi patrat.

03.12.2013

Bibliografie: Metode statistice aplicate in stiinte sociale, Traian Rotariu, Polirom Iasi 1999. Metodologie psihologica si analiza datelor, Ioan Radu, statistica sociala Cluj-Napoca, editura sincron 1993. Internet www.statisticasociala.tripod.com

S-ar putea să vă placă și