Sunteți pe pagina 1din 5

Tehnici neparametrice de comparatie între grupuri

Tehnicile statistice parametrice pleaca de la o serie de conditii privind normalitatea si


omogenitatea dispersiei distributiei rezultatelor subiectilor. Când acestea nu sunt
îndeplinite sunt utilizate tehnicile neparametrice denumite si tehnici statistice
independente de distributia datelor.

Avantajele acestui tip de tehnici constau în diversitatea datelor care pot fi prelucrate
atât calitativ cât si cantitativ. Dezavantajul principal este puterea mai mica de a
detecta falsitatea unei ipoteze nule. Exista mai multe metode nonparametrice, cele mai
întâlnite fiind:

 tehnica lui  2 (hi patrat);

Tehnica lui  2
Se aplica atunci când rezultatele sunt clasificate în functie de gen, vârsta, nivel de
pregatire, grupuri de tratament sau orice alta masura nominala. Proba furnizeaza un
test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.

De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala îi poarta


ghinion atunci când are de sustinut un examen. El a tinut evidenta tuturor salilor în
care a dat examen. În total a sustinut 120 de examene în 4 sali diferite, adica în medie
30 de examene în fiecare sala.

Iata situatia reala (observata) si pe cea teoretica, pentru fi ecare sala în ce priveste examenele
luate cu note între 5 si 7 ("operationalizarea ghinionului")

Numarul salii
  1 2 3 4 Total
Observat (O) 24 34 22 40 120
Probabil (E) 30 30 30 30 120

Formula lui  2:

Unde: O = frecventa observata;

          E =frecventa probabila (teoretica, expectata).


Sala O-E (O – E) ² (O – E) ² / E
1 -6 36 1,20
2 +4 16 0,53
3 -8 64 2,13
4 +10 100 3,33

 2=7,19

Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din


tabelul  ². Deoarece în cazul de fata exista patru variante (4 sali), numarul de grade
de libertate este c-1, adica 3.

Valoarea lui  2 de 7, 19 este mai mica decât cea din tabel la 3 df. Se observa ca la un
prag de semnificatie p <.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu
exista diferente semnificative între cele patru banci nu poate fi eliminata, iar Ionut nu
este întemeiat sa creada ca o sala îi aduce mai mult ghinion decât o alta.

Observatii:

 gradele de libertate se stabilesc în functie de numarul de alternative existente


minus unu;

 frecventa teoretica se stabileste împartind numarul total de date la numarul de


alternative;

 daca exista anumite informatii prealabile care sa ateste o anumita distributie a


datelor atunci principiul amintit anterior cade. Spre exemplu daca frecventa
probabila de aparitie a nevrozei într-un grup este de 20 %, atunci frecventa
teoretica se obtine stabilind cât înseamna 20% din totalul de date prezentate.

De multe ori o problema implica doua sau mai multe categorii de evenimente si doua
au mai multe grupe. Un exemplu ar fi analizarea rezultatelor la un chestionar de
atitudine în care sunt precizate mai multe raspunsuri (de acord, abtinere, dezacord) si
doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este
numita tabel de contingenta.

Exemplu: În urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane


religioase si al unui alt grup de persoane nereligioase la urmatoarea întrebare: "Sunteti
de acord ca tinerii sa faca dragoste înainte de casatorie?"

O tabela 3 x 2 de contingenta a raspunsurilor.


  De acord Abtinere Dezacord Total
Religiosi 30 46 124 200

Observate (64) (56) (80) (200)

Probabile
Atei 114 80 56 250

Observate (80) (70) (100) (250)

Probabile
TOTAL 144 126 180 450

În exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze


rationale sau alte surse de informatii. În tabelul de contingenta valorile probabile se
calculeaza din frecventele efectiv aparute fata de totalul raspunsurilor. De exemplu,
numarul total de subiecti care au fost de acord cu afirmatia este de 144. Deoarece în
total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au
fost de acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista
nici o diferenta între grupul persoanelor religioase si non-religioase (ipoteza nula),
atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250 =80) sar trebui
sa fie de acord cu afirmatia (frecventa teoretica).

 2 se calculeaza în acelasi mod si în acest exemplu.

O-E E (O – E) ² (O – E) ² / E R (Rezidul
standardizat)
-34 64 1156 18,06 -4,25
34 80 1156 14,45 3,77
-10 56 100 1,79 -1,33
10 70 100 1,43 1,19
44 80 1936 24,20 4,88
-44 100 1936 19,36 -4,40

 2 = 79,29

Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul
de rânduri (în acest caz doua, religios vs. ateu) iar c numarul de coloane (în acest caz
trei, de acord, abtinere, dezacord). Astfel, df = (2-1) (3-1) = 2.

Cautând în tabelul de semnificatii la df = 2, observam ca  2 ar avea valoarea 9, 21 la


un p <.01. Valoarea obtinuta a lui hi patrat de 79,29 este categoric semnificativa.
Aceasta ne spune ca ipoteza nula trebuie respinsa.
Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente
semnificative se calculeaza rezidul standardizat (R). Formula sa este:

Aceasta formula este aplicata în cadrul fiecarei situatii. Daca rezidul standardizat este
mai mare decât 2 (în valoare absoluta, indiferent de semn) putem considera ca acel
element a adus un rol important în obtinerea unui  2 semnificativ. În cazul de fata
atât valorile din dreptul sintagmei "de acord" cât si cele din dreptul sintagmei
"dezacord" au iesit relevante. Nu se observa însa diferente semnificative între cele
doua grupe în ce priveste alternativa "nu stiu".

Restrictiile de utlizare a testului  2

si în utilizarea acestui tip de teste:

 Observatiile trebuie sa fie independente si categoriile formate trebuie sa se


excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si de alegerea
unui singur raspuns la întrebare.
 De obicei, testul hi patrat nu se poate aplica pentru esantioane mici. Frecventa
probabila (teoretica) pentru orice casuta nu trebuie sa fie mai mica de unu. Mai
mult, unii statisticieni pretind ca nu mai mult de 20% din casute sa aiba valori
teoretice ale frecventelor mai mici de cinci. O tactica întâlnita în astfel de
situatii este sa se combine casutele adiacente, marind valoarea frecventei
teoretice.
 Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei corectii,
denumita corectia Yates pentru continuitate. Aceasta opereaza o scadere de 0,5
din diferenta dintre frecventele observate si cele teoretice (expectate, probabile)
înainte de a o ridica la patrat:

 O alta limitare impusa tabelei de contingenta de tip 2 x 2 este ca numarul total


(N) sa fie cel putin 20;
 Frecventa probabila (teoretica) sa fie stabilita a priori, fie ca probabilitate de
aparitie egala, fie utilizând date existente. Nu trebuie sa i se permita
cercetatorului sa se uite pe datele obtinute si apoi sa "scoata din mâneca" o
distributie teoretica care sa se potriveasca cu ipoteza.
Concluzii în ce priveste utilizarea lui  2:

 Se utilizeaza atunci când avem de analizat date nominale (calitative);


 Se poate calcula rezidul standardizat specific fiecarei casute pentru a
diferentia care elemente au contribuit mai mult la obtinerea unui  2
semnificativ;
 Testul de omogenitate  2 are menirea de a distinge daca exista diferente
semnificative între distributia teoretica (expectata) si distributia reala
(observata) obtinuta.

S-ar putea să vă placă și