Sunteți pe pagina 1din 3

Tema: Statistica nonparametrica (neparametrica) -Exista mai multe metode nonparametrice, cele mai ntlnite fiind:

tehnica lui 2 (Chi patrat); -testul U a lui Mann-Whitney (echivalentul testului parametric t independent); -testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent); -testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, nsa datele sunt convertite n ranguri); -testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate). Tehnica lui Chi Ptrat 2 Se aplica atunci cnd rezultatele sunt clasificate n functie de gen, vrsta, nivel de pregatire, grupuri de tratament sau orice alta masura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate. Numarul salii Observat (O) Probabil (E) 1 24 30 2 34 30 3 22 30 4 40 30 Total 120 120

Formula de calcul 2 (Chi Ptrat):

Unde: O = frecventa observata; E =frecventa probabila (teoretica, expectata).

Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelul . Deoarece n cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3. Valoarea lui c 2 de 7, 19 este mai mica dect cea din tabel la 3 df. Se observa ca la un prag de semnificatie p <.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative ntre cele patru banci nu poate fi eliminata, iar Alex nu este ntemeiat sa creada ca o sala i aduce mai mult ghinion dect o alta. Observatii: - gradele de libertate se stabilesc n functie de numarul de alternative existente minus unu; - frecventa teoretica se stabileste mpartind numarul total de date la numarul de alternative; - daca exista anumite informatii prealabile care sa ateste o anumita distributie a datelor atunci principiul amintit anterior cade. Spre exemplu daca frecventa probabila de aparitie a nevrozei ntr-un grup este de 20 %, atunci frecventa teoretica se obtine stabilind ct nseamna 20% din totalul de date prezentate. De multe ori o problema implica doua sau mai multe categorii de evenimente si doua au mai multe grupe. Un exemplu ar fi analizarea rezultatelor la un chestionar de atitudine n care sunt precizate mai multe raspunsuri (de acord, abtinere, dezacord) si doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este numita tabel de contingenta. Exemplu: n urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane religioase si al unui alt grup de persoane nereligioase la urmatoarea ntrebare: "Sunteti de acord ca tinerii sa faca dragoste nainte de casatorie?" O tabela 3 x 2 de contingenta a raspunsurilor

n exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze rationale sau alte surse de informatii. n tabelul de contingenta valorile probabile se calculeaza din frecventele efectiv aparute fata de totalul raspunsurilor. De exemplu, numarul total de subiecti care au fost de acord cu afirmatia este de 144. Deoarece n total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au fost de acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta ntre grupul persoanelor religioase si non-religioase (ipoteza nula), atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250 =80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica). X 2 se calculeaza n acelasi mod si n acest exemplu

Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul de rnduri (n acest caz doua, religios vs. ateu) iar c numarul de coloane (n acest caz trei, de acord, abtinere, dezacord). Astfel, df = (2-1) (3-1) = 2. Cautnd n tabelul de semnificatii la df = 2, observam ca c 2 ar avea valoarea 9, 21 la un p <.01. Valoarea obtinuta a lui hi patrat de 79,29 este categoric semnificativa. Aceasta ne spune ca ipoteza nula trebuie respinsa. Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente semnificative se calculeaza rezidul standardizat (R). Formula sa este:

Aceasta formula este aplicata n cadrul fiecarei situatii. Daca rezidul standardizat este mai mare dect 2 (n valoare absoluta, indiferent de semn) putem considera ca acel element a adus un rol important n obtinerea unui c 2 semnificativ. n cazul de fata att valorile din dreptul sintagmei "de acord" ct si cele din dreptul sintagmei "dezacord" au iesit relevante. Nu se observa nsa diferente semnificative ntre cele doua grupe n ce priveste alternativa "nu stiu". Restrictiile de utlizare a testului c 2 Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze asupra populatiei ca cele parametrice, exista totusi o serie de restrictii si n utilizarea acestui tip de teste. Observatiile trebuie sa fie independente si categoriile formate trebuie sa se excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si de alegerea unui singur raspuns la ntrebare. De obicei, testul hi patrat nu se poate aplica pentru esantioane mici. Frecventa probabila (teoretica) pentru orice casuta nu trebuie sa fie mai mica de unu. Mai mult, unii statisticieni pretind ca nu mai mult de 20% din casute sa aiba valori teoretice ale frecventelor mai mici de cinci. O tactica ntlnita n astfel de situatii este sa se combine sasutele adiacente, marind valoarea frecventei teoretice. Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei corectii, denumita corectia Yates pentru continuitate. Aceasta opereaza o scadere de 0,5 din diferenta dintre frecventele observate si cele teoretice (expectate, probabile) nainte de a o ridica la patrat:

O alta limitare impusa tabelei de contingenta de tip 2 x 2 este ca numarul total (N) sa fie cel putin 20; Frecventa probabila (teoretica) sa fie stabilita a priori, fie ca probabilitate de aparitie egala, fie utiliznd date

existente. Nu trebuie sa i se permita cercetatorului sa se uite pe datele obtinute si apoi sa "scoata din mneca" o distributie teoretica care sa se potriveasca cu ipoteza. Concluzii n ce priveste utilizarea lui c 2: Se utilizeaza atunci cnd avem de analizat date nominale (calitative); Se poate calcula rezidul standardizat specific fiecarei casute pentru a diferentia care elemente au contribuit mai mult la obtinerea unui c 2 semnificativ; Testul de omogenitate c 2 are menirea de a distinge daca exista diferente semnificative ntre distributia teoretica (expectata) si distributia reala (observata) obtinuta.

S-ar putea să vă placă și