Sunteți pe pagina 1din 22

Tema: Statistica nonparametrica (neparametrica)

Exista mai multe metode nonparametrice, cele mai întâlnite


fiind:

tehnica lui χ 2 (Chi patrat);

testul U a lui Mann-Whitney (echivalentul testului parametric t


independent);

testul Wilcoxon al rangurilor pereche (echivalent ANOVA


masuratori repetate ori t dependent);

testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA


simpla, însa datele sunt convertite în ranguri);
testul Friedman ANOVA biunivoc al rangurilor (echivalent
ANOVA masuratori repetate).
04/03/24 statistica sociala
Tehnica lui Chi Pătrat χ2
Se aplica atunci când rezultatele sunt clasificate în
functie de gen, vârsta, nivel de pregatire, grupuri de
tratament sau orice alta masura nominala. Proba
furnizeaza un test statistic asupra semnificatiei
discrepantei dintre rezultatele observate si
asteptate.

Numarul salii
1 2 3 4 Total
Observat (O) 24 34 22 40 120
Probabil (E) 30 30 30 30 120

04/03/24 statistica sociala


Formula de calcul χ 2 (Chi Pătrat):

Unde: O = frecventa observata;


E =frecventa probabila
(teoretica, expectata).

04/03/24 statistica sociala


Valoarea obtinuta este interpretata prin compararea ei cu valoarea
corespondenta din tabelul χ ². Deoarece în cazul de fata exista patru
variante (4 sali), numarul de grade de libertate este c-1, adica 3.
Valoarea lui c 2 de 7, 19 este mai mica decât cea din tabel la 3 df. Se
observa ca la un prag de semnificatie p <.05, valoarea din tabel era de
7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative între
cele patru banci nu poate fi eliminata, iar Alex nu este întemeiat sa
creada ca o sala îi aduce mai mult ghinion decât o alta. Observatii:
gradele de libertate se stabilesc în functie de numarul de alternative
existente minus unu;
frecventa teoretica se stabileste împartind numarul total de date la
numarul de alternative;
daca exista anumite informatii prealabile care sa ateste o anumita
distributie a datelor atunci principiul amintit anterior cade. Spre
exemplu daca frecventa probabila de aparitie a nevrozei într-un grup
este de 20 %, atunci frecventa teoretica se obtine stabilind cât
înseamna 20% din totalul de date prezentate.
De multe ori o problema implica doua sau mai multe categorii de
evenimente si doua au mai multe grupe. Un exemplu ar fi analizarea
rezultatelor la un chestionar de atitudine în care sunt precizate mai
multe raspunsuri (de acord, abtinere, dezacord) si doua grupe de
subiecti (religiosi crestini, respectiv atei). Acest tip de clasificare este
numita tabel de contingenta. Exemplu: În urmatorul tabel sunt
cuprinse raspunsurile unui grup de persoane religioase si al unui alt
grup de persoane nereligioase la urmatoarea întrebare: "Sunteti de
04/03/24
acord statistica
ca tinerii sa faca dragoste înainte sociala
de casatorie?"
O tabela 3 x 2 de contingenta a raspunsurilor

04/03/24 statistica sociala


În exemplele anterioare frecventele probabile (teoretice) se determinau
din ipoteze rationale sau alte surse de informatii. În tabelul de
contingenta valorile probabile se calculeaza din frecventele efectiv
aparute fata de totalul raspunsurilor.
De exemplu, numarul total de subiecti care au fost de acord cu afirmatia
este de 144. Deoarece în total sunt 450 de subiecti care au raspuns la
chestionar, atunci procentul celor care au fost de acord cu afirmatia este
de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta
între grupul persoanelor religioase si non-religioase (ipoteza nula),
atunci 32% din religiosi (0,32 x 200 = 64) si 32% din atei (0,32 x 250
=80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica).

X 2 se calculeaza în acelasi mod si în acest exemplu

04/03/24 statistica sociala


Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r
este numarul de rânduri (în acest caz doua, religios vs. ateu) iar c numarul
de coloane (în acest caz trei, de acord, abtinere, dezacord). Astfel, df = (2-
1) (3-1) = 2. Cautând în tabelul de semnificatii la df = 2, observam ca c 2 ar
avea valoarea 9, 21 la un p <.01. Valoarea obtinuta a lui hi patrat de 79,29
este categoric semnificativa. Aceasta ne spune ca ipoteza nula trebuie
respinsa. Pentru a determina care categorie a adus contributii majore la
obtinerea unei diferente semnificative se calculeaza rezidul standardizat
(R). Formula sa este:

04/03/24 statistica sociala


Aceasta formula este aplicata în cadrul fiecarei situatii. Daca rezidul
standardizat este mai mare decât 2 (în valoare absoluta, indiferent de
semn) putem considera ca acel element a adus un rol important în
obtinerea unui c 2 semnificativ. În cazul de fata atât valorile din dreptul
sintagmei "de acord" cât si cele din dreptul sintagmei "dezacord" au iesit
relevante. Nu se observa însa diferente semnificative între cele doua grupe
în ce priveste alternativa "nu stiu". Restrictiile de utlizare a testului c 2
Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze
asupra populatiei ca cele parametrice, exista totusi o serie de restrictii si în
utilizarea acestui tip de teste.
Observatiile trebuie sa fie independente si categoriile formate trebuie sa se
excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si de
alegerea unui singur raspuns la întrebare.
De obicei, testul hi patrat nu se poate aplica pentru esantioane mici.
Frecventa probabila (teoretica) pentru orice casuta nu trebuie sa fie mai
mica de unu. Mai mult, unii statisticieni pretind ca nu mai mult de 20% din
casute sa aiba valori teoretice ale frecventelor mai mici de cinci. O tactica
întâlnita în astfel de situatii este sa se combine sasutele adiacente, marind
valoarea frecventei teoretice.
Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei
corectii, denumita corectia Yates pentru continuitate. Aceasta opereaza o
scadere de 0,5 din diferenta dintre frecventele observate si cele teoretice
(expectate, probabile) înainte de a o ridica la patrat:

04/03/24 statistica sociala


04/03/24 statistica sociala
O alta limitare impusa tabelei de contingenta de tip 2 x 2
este ca numarul total (N) sa fie cel putin 20;
Frecventa probabila (teoretica) sa fie stabilita a priori, fie
ca probabilitate de aparitie egala, fie utilizând date
existente. Nu trebuie sa i se permita cercetatorului sa se
uite pe datele obtinute si apoi sa "scoata din mâneca" o
distributie teoretica care sa se potriveasca cu ipoteza.
Concluzii în ce priveste utilizarea lui c 2:
Se utilizeaza atunci când avem de analizat date nominale
(calitative);
Se poate calcula rezidul standardizat specific fiecarei
casute pentru a diferentia care elemente au contribuit mai
mult la obtinerea unui c 2 semnificativ;
Testul de omogenitate c 2 are menirea de a distinge daca
exista diferente semnificative între distributia teoretica
(expectata) si distributia reala (observata) obtinuta.

04/03/24 statistica sociala


Testul U al lui Mann-Whitney
Este analog testului parametric t independent, fiind una din
cele mai puternice probe neparametrice. Poate fi utilizat atât
cu esantioane mici de subiecti, cât si cu esantioane mari si
necesita numai masuratori de tip rang sau când nu îndeplinim
conditiile aplicarii testului t independent. Acest test opereaza
cu numere ordinale. Exista doua modalitati de calculare a
acestui test în functie de marimea esantioanelor (n1 si n2 mai
mici de 20 de persoane, respectiv, n1, n2 mai mari de 20).

Testul U a lui Mann-Whitney pentru N< 20

Exemplu: Un psiholog social este interesat sa afle daca exista


diferente între doua categorii de femei (angajate, respectiv
casnice) în ce priveste atitudinea lor asupra miscarii
feministe. Pasi în rezolvarea problemei:

04/03/24 statistica sociala


Stabilirea ipotezei: Cercetatorul afirma exista o diferenta semnificativa între cele doua grupe.
Se stabileste si pragul de semnificatie de 0,05. Ipoteza de lucru poate fi luata în
considerare numai dupa respingerea ipotezei nule.
Pentru a respinge ipoteza nula, se trece la calcularea lui U luându-se în
considerare atât tendintele centrale cât si cele dispersionale. Se calculeaza U1 si
U2 pentru fiecare dintre grupe. Iata raspunsurile date de cele doua categorii.

04/03/24 statistica sociala


prima grupa;
S R2=suma rangurilor din Unde:
n1= numarul de subiecti din prima grupa;
n2= numarul de subiecti din a doua grupa;
S R1=suma rangurilor din a doua grupa.
Dupa calcularea celor doi U se alege acea valoarea absoluta mai
mica. În acest caz U1 este 27, iar U2 73.
Se alege prima valoare de 27 care devine generic U.
Urmatorul pas este consultarea din tabel a valorii lui U pe
diagonala tinând cont de n1=10 si n2=10 la un prag de 0,05.
Se observa ca valoarea corespunzatoare este U=27 pentru p<.05.
Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau
egal cu valoarea corespondenta din tabel. În problema data am
obtinut un U de 27 care este egal cu valoarea corespondenta din
tabel, ca urmare ipoteza nula este respinsa.
Exista asadar o diferenta semnificativa în ce priveste atitudinea
femeilor din cele doua grupe.

04/03/24 statistica sociala


Unde:
n1= numarul de subiecti din prima grupa;
n2= numarul de subiecti din a doua grupa;
S R1=suma rangurilor din prima grupa;
S R2=suma rangurilor din a doua grupa.
Dupa calcularea celor doi U se alege acea valoarea absoluta mai
mica. În acest caz U1 este 27, iar U2 73. Se alege prima valoare
de 27 care devine generic U.
Urmatorul pas este consultarea din tabel a valorii lui U pe
diagonala tinând cont de n1=10 si n2=10 la un prag de 0,05. Se
observa ca valoarea corespunzatoare este U=27 pentru p<.05.
Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic
sau egal cu valoarea corespondenta din tabel.
În problema data am obtinut un U de 27 care este egal cu
valoarea corespondenta din tabel, ca urmare ipoteza nula este
respinsa. Exista asadar o diferenta semnificativa în ce priveste
atitudinea femeilor din cele doua grupe.

04/03/24 statistica sociala


În aceasta situatie se consulta z în tabel si se urmareste daca
valoarea obtinuta este mai mare decât cea din tabel. Daca z
obtinut este mai mare decât z din tabel (la un prag de
semnificatie de minim 0,05) atunci ipoteza nula este respinsa
si se demonstreaza ca exista o diferenta reala, semnificativa
între cele doua grupe.

Testul TeWilcoxon al rangurilor pereche


Exista studii comparative între doua grupe dependente (corelate)
care nu îndeplinesc conditiile parametrice. În astfel de situatii trebuie
aplicat acest test care are aceleasi principii cu testul t dependent. Prin
testul Wilcoxon se determina marimea diferentelor dintre rezultate
(spre exemplu înainte si dupa o actiune), ordonate dupa rang.
Exemplu: Un psihopedagog special este interesat de efectul unor
sedinte de consiliere asupra comportamentului agresiv la copiii cu
dificultati de învatare. Alege un numar de 12 subiecti pe care îi
testeaza înainte si dupa aceste sedinte. Rezultatele sunt prezentate în
tabel.

04/03/24 statistica sociala


Pasii de calculare a acestui test sunt urmatorii:
Determinarea diferentelor (coloana patru) prin scaderea rezultatelor
"post" din "pre". Unele diferente sunt pozitive si altele negative. În
cazul în care diferenta este zero cazul respectiv este exclus din
analiza ulterioara deoarece nu are nici o influenta. Nu este neaparat
necesar ca diferenta sa fie calculata scazând post-testul din pre-test.
Exista situatii când acest fapt se inverseaza, adica se scade pre-testul
din post-test. Depinde de ceea ce doreste studiul respectiv, sa reduca
niste simptome defavorbaile (reducerea agresivitatii) sau sa
îmbunatateasca situatia (cresterea stimei de sine).
Ordonarea rezultatelor dupa rang indiferent de semn (coloana a
cincea). Se începe cu cea mai mica diferenta (valoarea zero este
exclusa si nu intra în calcul).
Atribuirea semnului corespunzator în fata rangurilor (coloana 6) în
functie de rezultatul obtinut în coloana diferentelor.
Determinarea rangurilor cu semn negativ si introducerea lor în
coloana a saptea. Aceste ranguri sunt apoi adunate si rezultatul se
noteaza cu T.
Testarea valorii lui T pentru semnificatie. Se consulta direct valoarea
lui T din tabel. Rezultatele a caror diferenta a fost zero sunt excluse,
astfel ca daca am avea 15 subiecti dintre care doua rezultate au fost
identice înainte si dupa testare ne vom uita în tabel în dreptul lui
n=13. În problema de fata însa, toate rezulatele au fost validate ca
urmare vom consulta tabelul în dreptul lui n=12 si a pragului de
semnificatie stabilit anterior, adica minim 0,05. Se observa ca
valoarea lui T trebuie sa fie egala sau mai mica de 14 pentru a putea
elimina ipoteza nula la un prag de 0,05. Cum rezultatul obtinut a fost
T=4, se poate spune ca acele sedinte de consiliere au condus la o
04/03/24 statistica
scadere semnificativa statistic sociala
a comportamentului agresiv.
Testul ANOVA Kruskal-Wallis al rangurilor

Este un test nonparametric utilizat când exista mai mult de


doua grupe independente. Este comparabil cu o ANOVA
simpla din statistica parametrica. Pentru analiza, datele sunt
convertite în ranguri. Exemplu: Un cercetator este interesat
de diferentele care exista în ce priveste exercitarea unui
comportament autoritar la trei grupe de dascali ( scoala
primara; gimnaziu, respectiv liceu). În acest caz exista 17
subiecti împartiti în 3 grupe (6;5;6). Iata rezultatele obtinute
la scala de evaluare a autoritarismului în comportament:
Date: Scala de Evaluare a Autoritarismului
Dascali – ciclu primar(1) Dascali – ciclu Dascali – ciclu liceal(3)
gimnazial(2)
Scor Rang Scor Rang Scor Rang
52 4 66 13 63 10
46 1 49 3 65 12
62 9 64 11 58 8
48 2 53 5 70 15
57 7 68 14 71 16
54 6 73 17

04/03/24 statistica sociala


Pasi în rezolvarea problemei
Acordarea de ranguri în functie de rezultatele obtinute la
masurarea autoritarismului. Se acorda rangul 1
rezultatului care indica cel mai mic grad de autoritarism
indiferent de grupa de provenienta. În caz de egalitate se
acorda ranguri egale dupa metoda întâlnita si în cazul
celorlalte teste neparametrice.
Însumarea rangurilor pentru fiecare grupa. Daca ipoteza
nula ar fi adevarata atunci ar trebui sa obtinem suma
rangurilor unei grupe asemanatoare ca valoare pentru
toate grupele.
Testarea semnificatiei diferentelor dintre grupe prin testul
ANOVA K-W simbolizat cu H, iata formula:

Unde N= totalul rezultatelor;


(S Ri)² / ni = raportul dintre suma rangurilor ridicata la
patrat al unei grupe si numarul de subiecti din grupa
respectiva;
S [(S Ri)² / ni] = Suma raporturilor obtinute la toate
grupele;
ni= este numarul de rezultate din fiecare grupa.

04/03/24 H=7,86. statistica sociala


Când sunt mai multi de 5 subiecti în fiecare grupa se testeaza valoarea
lui H prin consultarea lui c 2 la df (grade de libertate) = k –1 (unde K
este numarul de grupe). Daca sunt 5 sau mai putini subiecti în fiecare
grupa se utilizeaza o tabela speciala. Daca exista un numar mare de
ranguri egale (peste 25%) se opereaza o corectie a lui H. În cazul de
fata, deoarece avem doar o singura grupa care nu are mai mult de 5
subiecti si doua care îndeplinid conditia amintita, vom proceda la
consultarea lui c 2 din tabel. Se observa ca valoarea lui hi patrat la
nivelul de încredere de 0,05 pentru 2 df (3 grupe minus unu) este de
5,99, ca urmare rezultatul obtinut de noi (7,86) este mai mare. Astfel,
ipoteza nula este respinsa si putem afirma ca exista o diferenta
semnificativa în ce priveste gradul de autoritarism în functie de ciclul
scolar la care profeseaza dascalii supusi studiului.
Pentru a aprofunda demersul statistic, putem analiza care grup este
responsabil pentru aparitia acestor diferente. Avem doi subpasi de
realizat în acest sens:
Tehnica Bonferoni prin care dorim sa pastram nivelul de analiza (alfa)
constant. Pentru aceasta trebuie împartit a (0,05) la numarul de
grupe ale studiului. În acest caz la trei, rezultând un a = 0,017. Se
consulta în tabel aceasta valoare, cautând valoarea z si se observa ca
pentru acest procent este specificat un z =2,39. Aceasta va fi înmultit
cu eroarea standard a diferentei dintre doua esantioane.
Al doilea subpas consta în calcularea acestor erori medii a diferentelor
dupa formula:

Unde: N = numarul total de subiecti;


n = numarul de subiecti din grupele care se compara.
Pentru cele trei comparatii ale noastre, eroarea standard a
diferentei este:
profesori elementara versus profesori gimnaziu
04/03/24 statistica sociala
profesori elementara versus profesori liceu

profesori gimnaziu versus profesori liceu idem a.


7.Se stabileste un interval de încredere pentru fiecare
comparatie în parte. El este egal cu diferenta mediei dintre
grupuri plus sau minus valoarea lui z pentru a de 0,017,
adica 2,39*SE al fiecarei grupe. Astfel:
a) intervalul pentru grupele de elementara versus gimnaziu
9,20–4,83 +/- 2,39*3,05 = 4,37+/-7,28 = [-2,91; 11,65]
b) intervalul pentru grupele de elementara versus liceu
13 – 4,83 +/- 2,39*2,91 = 8,17 +/- 6,95 = [1,22; 15,12]
c) intervalul pentru grupele de gimnaziu versus liceu
13 – 9,20 +/- 2,39*3,05 = 3,80 +/- 7,28 = [-3,48; 11,08]
O comparatie este semnificativa statistic daca intervalul
obtinut nu include valoarea zero. Din comparatiile efectuate
diferentele semnificative apar doar între grupa de dascali de
la ciclul primar si cei de la ciclul liceal (intervalul obtinut nu
include si cifra zero). Putem concluziona ca exista o
diferenta semnificativa în ce priveste nivelul de autoritarism
exercitat de profesori între cei din ciclul primar si cei din
ciclul liceal, cei din urma fiind mai autoritari.
Observatie
Atât testul ANOVA Kruskal-Wallis cât si a testul U a lui Mann-
Whitney sunt tehnici ce utilizeaza date ordinale, existând
posibilitatea unor ranguri egale. Daca acest numar de
ranguri egale este prea mare (peste 30%) nu se recomanda
04/03/24 statistica sociala
utilizarea lor.
Testul Friedman ANOVA biunivoc al rangurilor
Testul este analog tehnicii ANOVA cu masuratori repetate
din statistica parametrica. Rezultatele sunt ordonate pe
ranguri si se utilizeaza hi patrat ca test de semnificatie.
Exemplu: Un grup de 12 subiecti au fost supusi unei metode
de învatare a limbilor straine folosind tehnici sofrologice. Au
fost testati de 3 ori: înaintea aplicarii metodei, la o luna si la
trei luni de la începerea experimentului. Au fost obtinute
rezultatele:

EVALUARE RANGURI
S A B C R(A) R(B) R(C)
1 16,0 15,7 15,2 3 2 1
2 11,6 10,9 11,5 3 1 2
3 18,1 18,0 17,6 3 2 1
4 16,3 16,8 17,0 1 2 3
5 12,0 13,1 12,8 1 3 2
6 12,5 12,2 12,3 3 1 2
7 9,3 8,8 9,0 3 1 2
8 18,8 17,5 18,0 3 1 2
9 19,2 19,7 19,7 1 2,5 2,5
10 22,3 22,8 21,6 2 3 1
11 20,7 20,3 19,6 3 2 1
12 24,1 23,7 24,4 2 1 3
04/03/24 statistica sociala
Suma rangurilor: 28 21,5 22,5
Pasi în rezolvarea problemei:
Cele trei rezultate pentru fiecare subiect sunt convertite în rangul corespunzator
de la unu la trei în functie de rezultatul obtinut. Spre exemplu, subiectul 1 a
obtinut cele mai putine erori la cea de a treia evaluare si primeste rangul unu, apoi
rangul doi pentru evaluarea din mijloc si rangul trei pentru evaluarea initiala în
care a savârsit cele mai multe erori. În caz de egalitate de ranguri se procedeaza
conform uzantelor clasice pentru ranguri egale.
Rangurile din fiecare coloana sunt apoi însumate. În cadrul ipotezei nule, aceste
sume ar trebui sa fie aproximativ egale, adica sa nu existe diferente semnificative
între evaluari.
Calcularea lui hi patrat pentru ANOVA dublu Friedman prin ranguri la un grad de
libertate df=k-1, unde k se refera la numarul de masuratori efectuate în acest caz
3. Formula este urmatoarea:
Unde: N este numarul de subiecti (în acest caz 12);
K este numarul de evaluari (în acest caz 3);
(S R)² se obtine prin adunarea rangurilor din fiecare coloana în parte si
apoi ridicarea lor la patrat (în cazul de fata avem 28 la patrat pentru prima
evaluare; 21,5 la patrat pentru cea de a doua evaluare si 22,5 la patrat
pentru cea de a treia evaluare.
S (S R)2 se obtine adunând rezultatele amintite în rândul precedent (în
cazul de fata 1752,5).
4. Astfel se obtine un hi patrat = 1,46. Consultam acest rezultat în tabelul
lui hi patrat la un p mai mic de 0,05 cu doua grade de libertate (k-1) si
observam ca este trecuta valoarea de 5,99. Rezultatul obtinut de noi este
mai mic decât valoarea din tabel, ca urmare nu exista diferente
semnificative între rezultatele obtinute în cele trei evaluari. Când
esantioanele sunt prea mici N<10 si k=3 sau N<5 si k=4 se va utiliza un alt
tabel, special, pentru a compara valorile lui hi patrat.

Bibliografie:
„Metode statistice aplicate in stiinte sociale”, Traian Rotariu,
Polirom Iasi 1999.
„Metodologie psihologica si analiza datelor”, Ioan Radu,
04/03/24 statistica sociala
Cluj-Napoca, editura sincron 1993.
„Internet” www.statisticasociala.tripod.com

S-ar putea să vă placă și