Documente Academic
Documente Profesional
Documente Cultură
Avantajele acestui tip de tehnici constau în diversitatea datelor care pot fi prelucrate atât calitativ cât si
cantitativ. Dezavantajul principal este puterea mai mica de a detecta falsitatea unei ipoteze nule. Exista mai
multe metode nonparametrice, cele mai întâlnite fiind:
Tehnica lui c 2
Se aplica atunci când rezultatele sunt clasificate în functie de gen, vârsta, nivel de pregatire, grupuri de
tratament sau orice alta masura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei
dintre rezultatele observate si asteptate.
De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala îi poarta ghinion atunci când are de
sustinut un examen. El a tinut evidenta tuturor salilor în care a dat examen. În total a sustinut 120 de
examene în 4 sali diferite, adica în medie 30 de examene în fiecare sala.
Iata situatia reala (observata) si pe cea teoretica, pentru fiecare sala în ce priveste examenele luate cu note
între 5 si 7 ("operationalizarea ghinionului")
Numarul salii
1 2 3 4 Total
Observat (O) 24 34 22 40 120
Probabil (E) 30 30 30 30 120
Formula lui c 2:
Sala O-E (O – E) ² (O – E) ² / E
1 -6 36 1,20
2 +4 16 0,53
3 -8 64 2,13
4 +10 100 3,33
c 2=7,19
Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelul c ². Deoarece în
cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3.
statisticasociala.tripod.com/non_par.htm 1/11
15.10.2019 Tehnicile nonparametrice
Valoarea lui c 2 de 7, 19 este mai mica decât cea din tabel la 3 df. Se observa ca la un prag de semnificatie p
<.05, valoarea din tabel era de 7, 82. Astfel, ipoteza nula, ca nu exista diferente semnificative între cele patru
banci nu poate fi eliminata, iar Ionut nu este întemeiat sa creada ca o sala îi aduce mai mult ghinion decât o
alta.
Observatii:
daca exista anumite informatii prealabile care sa ateste o anumita distributie a datelor atunci principiul
amintit anterior cade. Spre exemplu daca frecventa probabila de aparitie a nevrozei într-un grup este de
20 %, atunci frecventa teoretica se obtine stabilind cât înseamna 20% din totalul de date prezentate.
De multe ori o problema implica doua sau mai multe categorii de evenimente si doua au mai multe grupe. Un
exemplu ar fi analizarea rezultatelor la un chestionar de atitudine în care sunt precizate mai multe raspunsuri
(de acord, abtinere, dezacord) si doua grupe de subiecti (religiosi crestini, respectiv atei). Acest tip de
clasificare este numita tabel de contingenta.
Exemplu: În urmatorul tabel sunt cuprinse raspunsurile unui grup de persoane religioase si al unui alt grup de
persoane nereligioase la urmatoarea întrebare: "Sunteti de acord ca tinerii sa faca dragoste înainte de
casatorie?"
Probabile
Atei 114 80 56 250
Probabile
TOTAL 144 126 180 450
În exemplele anterioare frecventele probabile (teoretice) se determinau din ipoteze rationale sau alte surse de
informatii. În tabelul de contingenta valorile probabile se calculeaza din frecventele efectiv aparute fata de
totalul raspunsurilor. De exemplu, numarul total de subiecti care au fost de acord cu afirmatia este de 144.
Deoarece în total sunt 450 de subiecti care au raspuns la chestionar, atunci procentul celor care au fost de
acord cu afirmatia este de 144/450, adica 32% din grup. Astfel, daca nu exista nici o diferenta între grupul
persoanelor religioase si non-religioase (ipoteza nula), atunci 32% din religiosi (0,32 x 200 = 64) si 32% din
atei (0,32 x 250 =80) sar trebui sa fie de acord cu afirmatia (frecventa teoretica).
c 2 = 79,29
statisticasociala.tripod.com/non_par.htm 2/11
15.10.2019 Tehnicile nonparametrice
Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este numarul de rânduri (în acest
caz doua, religios vs. ateu) iar c numarul de coloane (în acest caz trei, de acord, abtinere, dezacord). Astfel,
df = (2-1) (3-1) = 2.
Pentru a determina care categorie a adus contributii majore la obtinerea unei diferente semnificative se
calculeaza rezidul standardizat (R). Formula sa este:
Aceasta formula este aplicata în cadrul fiecarei situatii. Daca rezidul standardizat este mai mare decât 2 (în
valoare absoluta, indiferent de semn) putem considera ca acel element a adus un rol important în obtinerea
unui c 2 semnificativ. În cazul de fata atât valorile din dreptul sintagmei "de acord" cât si cele din dreptul
sintagmei "dezacord" au iesit relevante. Nu se observa însa diferente semnificative între cele doua grupe în
ce priveste alternativa "nu stiu".
Desi am afirmat ca testele neparametrice nu necesita aceleasi ipoteze asupra populatiei ca cele parametrice,
exista totusi o serie de restrictii si în utilizarea acestui tip de teste.
Observatiile trebuie sa fie independente si categoriile formate trebuie sa se excluda reciproc. Este
vorba de eliminarea raspunsurilor multiple si de alegerea unui singur raspuns la întrebare.
De obicei, testul hi patrat nu se poate aplica pentru esantioane mici. Frecventa probabila (teoretica)
pentru orice casuta nu trebuie sa fie mai mica de unu. Mai mult, unii statisticieni pretind ca nu mai
mult de 20% din casute sa aiba valori teoretice ale frecventelor mai mici de cinci. O tactica întâlnita în
astfel de situatii este sa se combine sasutele adiacente, marind valoarea frecventei teoretice.
Pentru tabelele de contingenta de tip 2 x 2 este necesara aplicarea unei corectii, denumita corectia
Yates pentru continuitate. Aceasta opereaza o scadere de 0,5 din diferenta dintre frecventele observate
si cele teoretice (expectate, probabile) înainte de a o ridica la patrat:
O alta limitare impusa tabelei de contingenta de tip 2 x 2 este ca numarul total (N) sa fie cel putin 20;
Frecventa probabila (teoretica) sa fie stabilita a priori, fie ca probabilitate de aparitie egala, fie
utilizând date existente. Nu trebuie sa i se permita cercetatorului sa se uite pe datele obtinute si apoi sa
"scoata din mâneca" o distributie teoretica care sa se potriveasca cu ipoteza.
Exista doua modalitati de calculare a acestui test în functie de marimea esantioanelor (n1 si n2 mai mici de
20 de persoane, respectiv, n1, n2 mai mari de 20).
Exemplu: Un psiholog social este interesat sa afle daca exista diferente între doua categorii de femei
(angajate, respectiv casnice) în ce priveste atitudinea lor asupra miscarii feministe.
1. Stabilirea ipotezei: Cercetatorul afirma exista o diferenta semnificativa între cele doua grupe. Se
stabileste si pragul de semnificatie de 0,05. Ipoteza de lucru poate fi luata în considerare numai dupa
respingerea ipotezei nule.
2. Pentru a respinge ipoteza nula, se trece la calcularea lui U luându-se în considerare atât tendintele
centrale cât si cele dispersionale. Se calculeaza U1 si U2 pentru fiecare dintre grupe. Iata raspunsurile
date de cele doua categorii.
S R1=128 S R2=82
Unde:
Dupa calcularea celor doi U se alege acea valoarea absoluta mai mica. În acest caz U1 este 27, iar U2 73. Se
alege prima valoare de 27 care devine generic U. Urmatorul pas este consultarea din tabel a valorii lui U pe
diagonala tinând cont de n1=10 si n2=10 la un prag de 0,05. Se observa ca valoarea corespunzatoare este
U=27 pentru p<.05.
Pentru a respinge ipoteza nula U obtinut trebuie sa fie mai mic sau egal cu valoarea corespondenta din tabel.
În problema data am obtinut un U de 27 care este egal cu valoarea corespondenta din tabel, ca urmare ipoteza
statisticasociala.tripod.com/non_par.htm 4/11
15.10.2019 Tehnicile nonparametrice
nula este respinsa. Exista asadar o diferenta semnificativa în ce priveste atitudinea femeilor din cele doua
grupe.
In acest caz, exista o procedura usor diferita de calcularea a lui U. Pasii sunt urmatorii:
1. Aflarea rangului fiecarui rezultat pentru ambele grupe. Se atribuie rangul 1 celui mai bun rezultat
indiferent de grupa, si rangul ultim N (n1+n2) celui mai slab rezultat indiferent de grupa din care face
parte acel subiect. În caz de rezultate egale se acorda o medie a rangurilor aflate la egalitate. De
exemplu, daca doua persoane au un rezultat identic si ocupa rangurile 5 si 6, vom trece în tabel rangul
5,5 iar urmatorul rang acordat va fi 7. Daca trei persoane au acelasi rezultat, ocupând locurile 9, 10 si
11, le acordam la toate rangul 10, iar urmatorul rang diponibil va fi 12.
3. Calcularea lui U, mai întâi prin stabilirea lui U1 si U2. Cel mai mic rezultat (în valoarea absoluta) este
considerat a fi U.
Pâna aici se observa ca se realizeaza acelasi demers matematic în aflarea lui U. Din acest moment însa,
intervine un pas suplimentar.
4. Determinarea probabilitatii. Daca anterior aceasta a fost realizata prin compararea lui U obtinut cu
valorile corespunzatoare din tabel, acum se trece la calcularea lui z si consultarea acestuia în tabela de
valori. Formula lui z este:
În aceasta situatie se consulta z în tabel si se urmareste daca valoarea obtinuta este mai mare decât cea din
tabel. Daca z obtinut este mai mare decât z din tabel (la un prag de semnificatie de minim 0,05) atunci
ipoteza nula este respinsa si se demonstreaza ca exista o diferenta reala, semnificativa între cele doua grupe.
Exemplu: Un psihopedagog special este interesat de efectul unor sedinte de consiliere asupra
comportamentului agresiv la copiii cu dificultati de învatare. Alege un numar de 12 subiecti pe care îi
testeaza înainte si dupa aceste sedinte. Rezultatele sunt prezentate în tabel.
9 36 30 6 5 5
10 29 27 2 2 2
11 33 22 11 9 9
12 45 36 9 8 8
T=4
1. Determinarea diferentelor (coloana patru) prin scaderea rezultatelor "post" din "pre". Unele diferente
sunt pozitive si altele negative. În cazul în care diferenta este zero cazul respectiv este exclus din
analiza ulterioara deoarece nu are nici o influenta. Nu este neaparat necesar ca diferenta sa fie calculata
scazând post-testul din pre-test. Exista situatii când acest fapt se inverseaza, adica se scade pre-testul
din post-test. Depinde de ceea ce doreste studiul respectiv, sa reduca niste simptome defavorbaile
(reducerea agresivitatii) sau sa îmbunatateasca situatia (cresterea stimei de sine).
2. Ordonarea rezultatelor dupa rang indiferent de semn (coloana a cincea). Se începe cu cea mai mica
diferenta (valoarea zero este exclusa si nu intra în calcul).
4. Determinarea rangurilor cu semn negativ si introducerea lor în coloana a saptea. Aceste ranguri sunt
apoi adunate si rezultatul se noteaza cu T.
5. Testarea valorii lui T pentru semnificatie. Se consulta direct valoarea lui T din tabel. Rezultatele a
caror diferenta a fost zero sunt excluse, astfel ca daca am avea 15 subiecti dintre care doua rezultate au
fost identice înainte si dupa testare ne vom uita în tabel în dreptul lui n=13. În problema de fata însa,
toate rezulatele au fost validate ca urmare vom consulta tabelul în dreptul lui n=12 si a pragului de
semnificatie stabilit anterior, adica minim 0,05. Se observa ca valoarea lui T trebuie sa fie egala sau
mai mica de 14 pentru a putea elimina ipoteza nula la un prag de 0,05. Cum rezultatul obtinut a fost
T=4, se poate spune ca acele sedinte de consiliere au condus la o scadere semnificativa statistic a
comportamentului agresiv.
Exemplu: Un cercetator este interesat de diferentele care exista în ce priveste exercitarea unui comportament
autoritar la trei grupe de dascali ( scoala primara; gimnaziu, respectiv liceu). În acest caz exista 17 subiecti
împartiti în 3 grupe (6;5;6).
2. Însumarea rangurilor pentru fiecare grupa. Daca ipoteza nula ar fi adevarata atunci ar trebui sa obtinem
suma rangurilor unei grupe asemanatoare ca valoare pentru toate grupele.
3. Testarea semnificatiei diferentelor dintre grupe prin testul ANOVA K-W simbolizat cu H, iata formula:
(S Ri)² / ni = raportul dintre suma rangurilor ridicata la patrat al unei grupe si numarul de subiecti
din grupa respectiva;
4. Efectuarea calculelor:
H=7,86.
5. Când sunt mai multi de 5 subiecti în fiecare grupa se testeaza valoarea lui H prin consultarea lui c 2 la
df (grade de libertate) = k –1 (unde K este numarul de grupe). Daca sunt 5 sau mai putini subiecti în
fiecare grupa se utilizeaza o tabela speciala. Daca exista un numar mare de ranguri egale (peste 25%)
se opereaza o corectie a lui H. În cazul de fata, deoarece avem doar o singura grupa care nu are mai
mult de 5 subiecti si doua care îndeplinid conditia amintita, vom proceda la consultarea lui c 2 din
tabel. Se observa ca valoarea lui hi patrat la nivelul de încredere de 0,05 pentru 2 df (3 grupe minus
unu) este de 5,99, ca urmare rezultatul obtinut de noi (7,86) este mai mare. Astfel, ipoteza nula este
respinsa si putem afirma ca exista o diferenta semnificativa în ce priveste gradul de autoritarism în
functie de ciclul scolar la care profeseaza dascalii supusi studiului.
6. Pentru a aprofunda demersul statistic, putem analiza care grup este responsabil pentru aparitia acestor
diferente. Avem doi subpasi de realizat în acest sens:
Tehnica Bonferoni prin care dorim sa pastram nivelul de analiza (alfa) constant. Pentru aceasta trebuie
împartit a (0,05) la numarul de grupe ale studiului. În acest caz la trei, rezultând un a = 0,017. Se
consulta în tabel aceasta valoare, cautând valoarea z si se observa ca pentru acest procent este
specificat un z =2,39. Aceasta va fi înmultit cu eroarea standard a diferentei dintre doua esantioane.
Al doilea subpas consta în calcularea acestor erori medii a diferentelor dupa formula:
Pentru cele trei comparatii ale noastre, eroarea standard a diferentei este:
idem a.
7.Se stabileste un interval de încredere pentru fiecare comparatie în parte. El este egal cu diferenta mediei
dintre grupuri plus sau minus valoarea lui z pentru a de 0,017, adica 2,39*SE al fiecarei grupe. Astfel:
O comparatie este semnificativa statistic daca intervalul obtinut nu include valoarea zero. Din comparatiile
efectuate diferentele semnificative apar doar între grupa de dascali de la ciclul primar si cei de la ciclul liceal
(intervalul obtinut nu include si cifra zero). Putem concluziona ca exista o diferenta semnificativa în ce
priveste nivelul de autoritarism exercitat de profesori între cei din ciclul primar si cei din ciclul liceal, cei din
urma fiind mai autoritari.
Observatie
Atât testul ANOVA Kruskal-Wallis cât si a testul U a lui Mann-Whitney sunt tehnici ce utilizeaza date
ordinale, existând posibilitatea unor ranguri egale. Daca acest numar de ranguri egale este prea mare (peste
30%) nu se recomanda utilizarea lor.
Exemplu: Un grup de 12 subiecti au fost supusi unei metode de învatare a limbilor straine folosind tehnici
sofrologice. Au fost testati de 3 ori: înaintea aplicarii metodei, la o luna si la trei luni de la începerea
experimentului. Au fost obtinute rezultatele:
EVALUARE RANGURI
S A B C R(A) R(B) R(C)
1 16,0 15,7 15,2 3 2 1
statisticasociala.tripod.com/non_par.htm 8/11
15.10.2019 Tehnicile nonparametrice
2 11,6 10,9 11,5 3 1 2
3 18,1 18,0 17,6 3 2 1
4 16,3 16,8 17,0 1 2 3
5 12,0 13,1 12,8 1 3 2
6 12,5 12,2 12,3 3 1 2
7 9,3 8,8 9,0 3 1 2
8 18,8 17,5 18,0 3 1 2
9 19,2 19,7 19,7 1 2,5 2,5
10 22,3 22,8 21,6 2 3 1
11 20,7 20,3 19,6 3 2 1
12 24,1 23,7 24,4 2 1 3
1. Cele trei rezultate pentru fiecare subiect sunt convertite în rangul corespunzator de la unu la trei în
functie de rezultatul obtinut. Spre exemplu, subiectul 1 a obtinut cele mai putine erori la cea de a treia
evaluare si primeste rangul unu, apoi rangul doi pentru evaluarea din mijloc si rangul trei pentru
evaluarea initiala în care a savârsit cele mai multe erori. În caz de egalitate de ranguri se procedeaza
conform uzantelor clasice pentru ranguri egale.
2. Rangurile din fiecare coloana sunt apoi însumate. În cadrul ipotezei nule, aceste sume ar trebui sa fie
aproximativ egale, adica sa nu existe diferente semnificative între evaluari.
3. Calcularea lui hi patrat pentru ANOVA dublu Friedman prin ranguri la un grad de libertate df=k-1,
unde k se refera la numarul de masuratori efectuate în acest caz 3. Formula este urmatoarea:
(S R)² se obtine prin adunarea rangurilor din fiecare coloana în parte si apoi ridicarea lor la patrat (în cazul
de fata avem 28 la patrat pentru prima evaluare; 21,5 la patrat pentru cea de a doua evaluare si 22,5 la patrat
pentru cea de a treia evaluare.
S (S R)2 se obtine adunând rezultatele amintite în rândul precedent (în cazul de fata 1752,5).
4. Astfel se obtine un hi patrat = 1,46. Consultam acest rezultat în tabelul lui hi patrat la un p mai mic de 0,05
cu doua grade de libertate (k-1) si observam ca este trecuta valoarea de 5,99. Rezultatul obtinut de noi este
mai mic decât valoarea din tabel, ca urmare nu exista diferente semnificative între rezultatele obtinute în cele
trei evaluari. Când esantioanele sunt prea mici N<10 si k=3 sau N<5 si k=4 se va utiliza un alt tabel, special,
pentru a compara valorile lui hi patrat.
Grupe independente:
statisticasociala.tripod.com/non_par.htm 9/11
15.10.2019 Tehnicile nonparametrice
Grupe dependente:
PROBLEME
1. O statistica efectuata la nivel international releva urmatoarea distributie a copiilor cu cerinte educative
speciale:
a. Exista diferente semnificative între cele trei tari în ce priveste tipul de scolarizare a copiilor cu CES?
b. La ce nivel se situeaza aceste diferente?
a. Exista diferente semnificative între diferitele tipuri de tulburari si serviciile educative oferite?
b. La ce nivel se situeaza aceste diferente?
3. Un psihopedagog primeste sarcina de a urmarii evolutia a 15 elevi din clasa I cu deficit intelectual usor în
ce priveste rezultatele scolare. Sase elevi sunt integrati în scoala normala(X), ceilalti 9 fiind elevii unei scoli
speciale(Y). Divizarea pe cele doua grupe s-a facut aleator. La sfârsitul anului scolar s-au înregistrat
urmatoarele rezultate (medii generale):
X 6,12 7,24 6,99 5,84 6,45 6,80
Y 7,10 5,88 7,60 7,80 8,00 7,54 7,72 6,11 6,50
a. Sunt în vreun fel afectate performantele scolare ale copiilor integrati în clase normale?
b. Interpretati rezultatele obtinute.
4.Pornind de la problema 3, adaugati o a treia grupa de 9 subiecti care formeaza împreuna o clasa
speciala, dar în cadrul unei scoli normale.
statisticasociala.tripod.com/non_par.htm 10/11
15.10.2019 Tehnicile nonparametrice
5.Un psihopedagog vrea sa studieze influenta emotivitatii în aparitia bâlbâielii. El crede ca aceasta
emotivitate are un rol activator, stimulând SNC si implicit aparitia bâlbâielii. Subiectii (N=6) au fost
împartiti aleator în doua grupe. Mai întâi au fost pusi sa interpreteze o poezie în fata clasei fara public,
iar apoi au recitat aceiasi poezie cu toti colegii de fata. Rezultatele obtinute au fost:
I – 15; 12; 17; 11; 14; 7, respectiv II – 14; 14; 18; 15; 17; 9
1. Subiecti A B C D E F G H
Înainte 9 10 6 7 11 6 6 6
Dupa 5 6 5 5 6 4 7 5
Stabiliti daca exista un efect de reducere a greselilor, asa cum se astepta psihopedagogul.
7.Un experiment încearca sa lamureasca efectul testosteronului asupra tendintei de dominare masurata
prin minute de altercatii verbale. Au fost observati un numar de 14 subiecti din care 7 au primit o doza
de testosteron, iar ceilalti 7 au constituit grupul de control. Analizati daca exista vreo diferenta
semnificativa, asa cum se asteapta sa gaseasca experimentatorul în favoarea grupului experimental.
8.Pornind de la aceeasi idee prezentata în problema nr.8, o alta persoana propune un alt model
experimental cu o singura grupa de subiecti (N=9), care sunt testati de 5 ori: înainte de administrarea
testosteronului; la o ora dupa administrare; la 12 ore dupa; la un interval de o zi; si la un interval de 5
zile. S-au obtinut urmatoarele rezultate:
Stabiliti daca exista diferente semnificative între cele 5 momente în ce priveste nivelul agresivitatii.
statisticasociala.tripod.com/non_par.htm 11/11