Documente Academic
Documente Profesional
Documente Cultură
2 (Chi patrat); testul U a lui Mann-Whitney (echivalentul testului parametric t independent); testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent); testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, nsa datele sunt convertite n ranguri); testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate).
03.12.2013 statistica sociala
Tehnica lui Chi Ptrat 2 Se aplica atunci cnd rezultatele sunt clasificate n functie de gen, vrsta, nivel de pregatire, grupuri de tratament sau orice alta masura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.
Numarul salii
1 Observat (O) Probabil (E) 24 30 2 34 30 3 22 30 4 40 30 Total 120 120
03.12.2013
statistica sociala
03.12.2013
statistica sociala
Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelul . Deoarece n cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3. Valoarea lui c 2 de 7, 19 este mai mica dect cea din tabel la 3 df. Se observa ca la un prag de semnificatie p <.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative ntre cele patru banci nu poate fi eliminata, iar Alex nu este ntemeiat sa creada ca o sala i aduce mai mult ghinion dect o alta. Observatii: gradele de libertate se stabilesc n functie de numarul de alternative existente minus unu; frecventa teoretica se stabileste mpartind numarul total de date la numarul de alternative; daca exista anumite informatii prealabile care sa ateste o anumita distributie a datelor atunci principiul amintit anterior cade. Spre exemplu daca frecventa probabila de aparitie a nevrozei ntr-un grup este de 20 %, atunci frecventa teoretica se obtine stabilind ct nseamna 20% din totalul de date prezentate. De multe ori o problema implica doua sau mai multe categorii de evenimente si doua au mai multe grupe. Un exemplu ar fi analizarea rezultatelor la un chestionar de atitudine n care sunt precizate mai multe raspunsuri (de acord, abtinere, dezacord) si doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este numita tabel de contingenta. Exemplu: n urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane religioase si al unui alt grup de persoane nereligioase la urmatoarea ntrebare: "Sunteti de 03.12.2013 statistica sociala acord ca tinerii sa faca dragoste nainte de casatorie?"
03.12.2013
statistica sociala
n exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze rationale sau alte surse de informatii. n tabelul de contingenta valorile probabile se calculeaza din frecventele efectiv aparute fata de totalul raspunsurilor. De exemplu, numarul total de subiecti care au fost de acord cu afirmatia este de 144. Deoarece n total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au fost de acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta ntre grupul persoanelor religioase si non-religioase (ipoteza nula), atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250 =80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica).
03.12.2013
statistica sociala
Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul de rnduri (n acest caz doua, religios vs. ateu) iar c numarul de coloane (n acest caz trei, de acord, abtinere, dezacord). Astfel, df = (2-1) (3-1) = 2. Cautnd n tabelul de semnificatii la df = 2, observam ca c 2 ar avea valoarea 9, 21 la un p <.01. Valoarea obtinuta a lui hi patrat de 79,29 este categoric semnificativa. Aceasta ne spune ca ipoteza nula trebuie respinsa. Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente semnificative se calculeaza rezidul standardizat (R). Formula sa este:
03.12.2013
statistica sociala
Aceasta formula este aplicata n cadrul fiecarei situatii. Daca rezidul standardizat este mai mare dect 2 (n valoare absoluta, indiferent de semn) putem considera ca acel element a adus un rol important n obtinerea unui c 2 semnificativ. n cazul de fata att valorile din dreptul sintagmei "de acord" ct si cele din dreptul sintagmei "dezacord" au iesit relevante. Nu se observa nsa diferente semnificative ntre cele doua grupe n ce priveste alternativa "nu stiu". Restrictiile de utlizare a testului c 2 Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze asupra populatiei ca cele parametrice, exista totusi o serie de restrictii si n utilizarea acestui tip de teste. Observatiile trebuie sa fie independente si categoriile formate trebuie sa se excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si de alegerea unui singur raspuns la ntrebare. De obicei, testul hi patrat nu se poate aplica pentru esantioane mici. Frecventa probabila (teoretica) pentru orice casuta nu trebuie sa fie mai mica de unu. Mai mult, unii statisticieni pretind ca nu mai mult de 20% din casute sa aiba valori teoretice ale frecventelor mai mici de cinci. O tactica ntlnita n astfel de situatii este sa se combine sasutele adiacente, marind valoarea frecventei teoretice. Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei corectii, denumita corectia Yates pentru continuitate. Aceasta opereaza o scadere de 0,5 din diferenta dintre frecventele observate si cele teoretice (expectate, probabile) nainte de a o ridica la patrat:
03.12.2013
statistica sociala
03.12.2013
statistica sociala
O alta limitare impusa tabelei de contingenta de tip 2 x 2 este ca numarul total (N) sa fie cel putin 20; Frecventa probabila (teoretica) sa fie stabilita a priori, fie ca probabilitate de aparitie egala, fie utiliznd date existente. Nu trebuie sa i se permita cercetatorului sa se uite pe datele obtinute si apoi sa "scoata din mneca" o distributie teoretica care sa se potriveasca cu ipoteza. Concluzii n ce priveste utilizarea lui c 2: Se utilizeaza atunci cnd avem de analizat date nominale (calitative); Se poate calcula rezidul standardizat specific fiecarei casute pentru a diferentia care elemente au contribuit mai mult la obtinerea unui c 2 semnificativ; Testul de omogenitate c 2 are menirea de a distinge daca exista diferente semnificative ntre distributia teoretica (expectata) si distributia reala (observata) obtinuta.
03.12.2013 statistica sociala
Testul U a lui Mann-Whitney pentru N< 20 Exemplu: Un psiholog social este interesat sa afle daca exista diferente ntre doua categorii de femei (angajate, respectiv casnice) n ce priveste atitudinea lor asupra miscarii feministe. Pasi n rezolvarea problemei:
03.12.2013
statistica sociala
Stabilirea ipotezei: Cercetatorul afirma exista o diferenta semnificativa ntre cele doua grupe. Se stabileste si pragul de semnificatie de 0,05. Ipoteza de lucru poate fi luata n considerare numai dupa respingerea ipotezei nule. Pentru a respinge ipoteza nula, se trece la calcularea lui U lundu-se n considerare att tendintele centrale ct si cele dispersionale. Se calculeaza U1 si U2 pentru fiecare dintre grupe. Iata raspunsurile date de cele doua categorii.
03.12.2013
statistica sociala
prima grupa; S R2=suma rangurilor din Unde: n1= numarul de subiecti din prima grupa; n2= numarul de subiecti din a doua grupa; S R1=suma rangurilor din a doua grupa. Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. n acest caz U1 este 27, iar U2 73. Se alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe diagonala tinnd cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este U=27 pentru p<.05. Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel. n problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza nula este respinsa. Exista asadar o diferenta semnificativa n ce priveste atitudinea femeilor din cele doua grupe.
03.12.2013 statistica sociala
Unde: n1= numarul de subiecti din prima grupa; n2= numarul de subiecti din a doua grupa; S R1=suma rangurilor din prima grupa; S R2=suma rangurilor din a doua grupa. Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. n acest caz U1 este 27, iar U2 73. Se alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe diagonala tinnd cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este U=27 pentru p<.05. Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel. n problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza nula este respinsa. Exista asadar o diferenta semnificativa n ce priveste atitudinea femeilor din cele doua grupe.
03.12.2013
statistica sociala
n aceasta situatie se consulta z n tabel si se urmareste daca valoarea obtinuta este mai mare dect cea din tabel. Daca z obtinut este mai mare dect z din tabel (la un prag de semnificatie de minim 0,05) atunci ipoteza nula este respinsa si se demonstreaza ca exista o diferenta reala, semnificativa ntre cele doua grupe.
03.12.2013
statistica sociala
57
54
7
6
68
14
71
73
16
17
03.12.2013
statistica sociala
Acordarea de ranguri n functie de rezultatele obtinute la masurarea autoritarismului. Se acorda rangul 1 rezultatului care indica cel mai mic grad de autoritarism indiferent de grupa de provenienta. n caz de egalitate se acorda ranguri egale dupa metoda ntlnita si n cazul celorlalte teste neparametrice. nsumarea rangurilor pentru fiecare grupa. Daca ipoteza nula ar fi adevarata atunci ar trebui sa obtinem suma rangurilor unei grupe asemanatoare ca valoare pentru toate grupele. Testarea semnificatiei diferentelor dintre grupe prin testul ANOVA K-W simbolizat cu H, iata formula:
Unde N= totalul rezultatelor; (S Ri) / ni = raportul dintre suma rangurilor ridicata la patrat al unei grupe si numarul de subiecti din grupa respectiva; S [(S Ri) / ni] = Suma raporturilor obtinute la toate grupele; ni= este numarul de rezultate din fiecare grupa.
03.12.2013
H=7,86.
statistica sociala
Cnd sunt mai multi de 5 subiecti n fiecare grupa se testeaza valoarea lui H prin consultarea lui c 2 la df (grade de libertate) = k 1 (unde K este numarul de grupe). Daca sunt 5 sau mai putini subiecti n fiecare grupa se utilizeaza o tabela speciala. Daca exista un numar mare de ranguri egale (peste 25%) se opereaza o corectie a lui H. n cazul de fata, deoarece avem doar o singura grupa care nu are mai mult de 5 subiecti si doua care ndeplinid conditia amintita, vom proceda la consultarea lui c 2 din tabel. Se observa ca valoarea lui hi patrat la nivelul de ncredere de 0,05 pentru 2 df (3 grupe minus unu) este de 5,99, ca urmare rezultatul obtinut de noi (7,86) este mai mare. Astfel, ipoteza nula este respinsa si putem afirma ca exista o diferenta semnificativa n ce priveste gradul de autoritarism n functie de ciclul scolar la care profeseaza dascalii supusi studiului. Pentru a aprofunda demersul statistic, putem analiza care grup este responsabil pentru aparitia acestor diferente. Avem doi subpasi de realizat n acest sens: Tehnica Bonferoni prin care dorim sa pastram nivelul de analiza (alfa) constant. Pentru aceasta trebuie mpartit a (0,05) la numarul de grupe ale studiului. n acest caz la trei, rezultnd un a = 0,017. Se consulta n tabel aceasta valoare, cautnd valoarea z si se observa ca pentru acest procent este specificat un z =2,39. Aceasta va fi nmultit cu eroarea standard a diferentei dintre doua esantioane. Al doilea subpas consta n calcularea acestor erori medii a diferentelor dupa formula: Unde: N = numarul total de subiecti; n = numarul de subiecti din grupele care se compara. Pentru cele trei comparatii ale noastre, eroarea standard a diferentei este: profesori elementara 03.12.2013 statisticaversus sociala profesori gimnaziu
profesori gimnaziu versus profesori liceu idem a. 7.Se stabileste un interval de ncredere pentru fiecare comparatie n parte. El este egal cu diferenta mediei dintre grupuri plus sau minus valoarea lui z pentru a de 0,017, adica 2,39*SE al fiecarei grupe. Astfel: a) intervalul pentru grupele de elementara versus gimnaziu 9,204,83 +/- 2,39*3,05 = 4,37+/-7,28 = [-2,91; 11,65] b) intervalul pentru grupele de elementara versus liceu 13 4,83 +/- 2,39*2,91 = 8,17 +/- 6,95 = [1,22; 15,12] c) intervalul pentru grupele de gimnaziu versus liceu 13 9,20 +/- 2,39*3,05 = 3,80 +/- 7,28 = [-3,48; 11,08] O comparatie este semnificativa statistic daca intervalul obtinut nu include valoarea zero. Din comparatiile efectuate diferentele semnificative apar doar ntre grupa de dascali de la ciclul primar si cei de la ciclul liceal (intervalul obtinut nu include si cifra zero). Putem concluziona ca exista o diferenta semnificativa n ce priveste nivelul de autoritarism exercitat de profesori ntre cei din ciclul primar si cei din ciclul liceal, cei din urma fiind mai autoritari. Observatie Att testul ANOVA Kruskal-Wallis ct si a testul U a lui MannWhitney sunt tehnici ce utilizeaza date ordinale, existnd posibilitatea unor ranguri egale. Daca acest numar de ranguri egale este preastatistica mare (peste 30%) nu se recomanda 03.12.2013 sociala utilizarea lor.
Testul Friedman ANOVA biunivoc al rangurilor Testul este analog tehnicii ANOVA cu masuratori repetate din statistica parametrica. Rezultatele sunt ordonate pe ranguri si se utilizeaza hi patrat ca test de semnificatie. Exemplu: Un grup de 12 subiecti au fost supusi unei metode de nvatare a limbilor straine folosind tehnici sofrologice. Au fost testati de 3 ori: naintea aplicarii metodei, la o luna si la trei luni de la nceperea experimentului. Au fost obtinute rezultatele:
EVALUARE
S 1 2 3 A 16,0 11,6 18,1 B 15,7 10,9 18,0 C 15,2 11,5 17,6 R(A) 3 3 3
RANGURI
R(B) 2 1 2 R(C) 1 2 1
4
5 6 7 8 9 10 11 12
16,3
12,0 12,5 9,3 18,8 19,2 22,3 20,7
16,8
13,1 12,2 8,8 17,5 19,7 22,8 20,3 23,7
17,0
12,8 12,3 9,0 18,0 19,7 21,6 19,6 24,4
1
1 3 3 3 1 2 3
2
3 1 1 1 2,5 3 2
3
2 2 2 2 2,5 1 1
03.12.2013
Suma rangurilor:
24,1
statistica sociala
28
21,5
22,5
Pasi n rezolvarea problemei: Cele trei rezultate pentru fiecare subiect sunt convertite n rangul corespunzator de la unu la trei n functie de rezultatul obtinut. Spre exemplu, subiectul 1 a obtinut cele mai putine erori la cea de a treia evaluare si primeste rangul unu, apoi rangul doi pentru evaluarea din mijloc si rangul trei pentru evaluarea initiala n care a savrsit cele mai multe erori. n caz de egalitate de ranguri se procedeaza conform uzantelor clasice pentru ranguri egale. Rangurile din fiecare coloana sunt apoi nsumate. n cadrul ipotezei nule, aceste sume ar trebui sa fie aproximativ egale, adica sa nu existe diferente semnificative ntre evaluari. Calcularea lui hi patrat pentru ANOVA dublu Friedman prin ranguri la un grad de libertate df=k-1, unde k se refera la numarul de masuratori efectuate n acest caz 3. Formula este urmatoarea:
Unde: N este numarul de subiecti (n acest caz 12); K este numarul de evaluari (n acest caz 3); (S R) se obtine prin adunarea rangurilor din fiecare coloana n parte si apoi ridicarea lor la patrat (n cazul de fata avem 28 la patrat pentru prima evaluare; 21,5 la patrat pentru cea de a doua evaluare si 22,5 la patrat pentru cea de a treia evaluare. S (S R)2 se obtine adunnd rezultatele amintite n rndul precedent (n cazul de fata 1752,5). 4. Astfel se obtine un hi patrat = 1,46. Consultam acest rezultat n tabelul lui hi patrat la un p mai mic de 0,05 cu doua grade de libertate (k-1) si observam ca este trecuta valoarea de 5,99. Rezultatul obtinut de noi este mai mic dect valoarea din tabel, ca urmare nu exista diferente semnificative ntre rezultatele obtinute n cele trei evaluari. Cnd esantioanele sunt prea mici N<10 si k=3 sau N<5 si k=4 se va utiliza un alt tabel, special, pentru a compara valorile lui hi patrat.
03.12.2013
Bibliografie: Metode statistice aplicate in stiinte sociale, Traian Rotariu, Polirom Iasi 1999. Metodologie psihologica si analiza datelor, Ioan Radu, statistica sociala Cluj-Napoca, editura sincron 1993. Internet www.statisticasociala.tripod.com