Sunteți pe pagina 1din 8

METODE NEPARAMETRICE SAU DE DISTRIBUTIE

DEFINITIE: Metodele statistice neparametrice sunt acele metode ce


se aplicaîn cazul în care prelucrarea datelor nu depinde de forma
distribuţiei.

Ele sunt valabile si în cazul unor eşantioane mai mici care permit
ipoteza unei distribuţii normale în collective mai largi.Aceleaşi procedee
de lucru devin utilizabile şi pentru ansambluri mai numeroase de date
(eşantioane mari) când pierderea de informaţie este neglijabilă, iar
calculele se simplifică foarte mult.

În lucrarea de faţă se prezintă trei metode neparmetrice si anume:

1.Proba medianei;

2.Testul U;

3.Probleme de comparaţie (Proba semnelor).

Când vrem să apreciem efectul unei experienţe sau, îngeneral,


influenţa unui factor bine precizat pot să apară două situaţii: a) grupe
sau calse independente si b) grupe sau eşantioane perechi.Pentru
comparea a două grupe (eşantioane) independente ne folosim de proba
medianei şi de testul U, iar pentru compararea a două eşantioane-
perechi aplicăm proba semnelor.

• Metodele neparametrice sau de distributie libera in cadrul unei


analize statistice,testeaza ipoteza nula sau determina limitele de
incredere pentru esantioane sau populatii fara a tine cont de
distribututia populatiei.
• Necesita cateva presupuneri asupra distibutiilor esantioanelor si
populatiei supuse studiului, dar acestea sunt mult mai usoare in
comparatie cu conditiile de validitate ale testului chi patrat sau ale
testului t.

• Sunt folosite pentru a analiza esantioane sau populatii ce nu se


distribuie normal sau aproximativ normal si pentru care testele
parametrice sunt nepotrivite.
• Sunt folosite pentru a analiza esantioane sau populatii pentru
care parametrii, cum ar fi valoarea medie sau deviatia
standard sunt nereale sau nu pot fi determinate.

• Pot fi folosite in locul testelor parametrice pentru a analiza


populatii ce urmeaza distributia normala sau aproximativ
normala, dar testele neparametrice, operand de cele mai
multe ori nu cu valori masurabile ci cu rangurile valorilor, au o
putere mult mai mica.

TIPURI DE TESTE

• Testul Wilcoxon al sumei rangurilor este un test pentru date


neperechi sau imperechiate si este o alternativa a testului t
pentru esantioane perechi.

• Testul Wilcoxon pentru doua esantioane este un test pentru


date neimperechiate si este o alternativa a testului t pentru
esantioane independente.

• Testul U Mann- Whitney conduce la rezultate echivalente cu


testul Wilcoxon pentru doua esantioane.

• Testul exact Fisher se aplica pentru tabelele de contingenta


de tip 2x2 in aceleasi conditii ca testul chi patrat, dar cand
frecventele asteptate sunt mai mici decat 5.

1. PROBA MEDIANEI
Când ansamblul de date obţinute in urma unei experienţe
prezintă aspectul unei distribuţii evident asimetrice, nu are sens să
calculăm mediile; în acest caz calculăm medianele şi le supunem
pe acestea comparaţiei.
Mediana (med) este valoarea situată la mijlocul şirului
ordonat; localizarea ei se face cu formula: (N+1)/2.
De exemplu, la sfârşitul unei cercetări (experiment
psihopedagogic) la două clase A şi B dăm o lucrare de control şi se
consemnează numărul de erori comise de fiecare subiect.
Grupa A

X 0 1 2 3 4 5 6 7 8 9
f 3 6 3 1 0 2 3 1 0 1
X= NR DE GRESELI f =20 elevi
Grupa B

X 0 1 2 3 4 5 6 7 8 9
f 2 1 1 1 3 3 1 1 2 1
X= NR DE GRESELI f =16 elevi
La grupa A mediana este 2, la grupa B mediana este 4,5. Se pune
întrebarea dacă diferenţa între cele două mediane este
semnificativă sau nu.
Presupunând că factorul cuprins în cercetare nu are un
efect semnificativ, deci că cele două mediane ar fi, de fapt, egale
(ipoteza nulă), am putea considera cele două grupe ca eşantioane
extrase la întâmplare din aceeaşi colectivitate. Această colectivitate
presupusă ar fi caracterizată de mediana celor 36 de valori
(mediana teoretică).
Punem laolaltă datele provenite de la cele două grupe, A şi B,
formând astfel o singură distribuţie a rezultatelor (gr A + gr B). Vom
avea:

X 0 1 2 3 4 5 6 7 8 9
f 5 7 4 2 3 5 4 2 2 2
Mediana noii distribuţii se află pe locul 18,5 adică este
egală cu 3,5.
Referindu-ne la grupa A vom vedea că aceasta prezintă 13 subiecţi
sau cazuri situate sub mediana teoretică si 7 cazuri deasupra ei. În
schimb, in grupa B există 5 cazuri sub mediana calculată în ideea
ipotezei nule şi 11 deasupra.Evident, in cazul nostru vor fi cotaţi mai
bine elevii cu mai puţine greşeli, lacare numarul de erori este
inferior medianei teoretice (3,5).
Intocmim un tabel cu 4 coloane
Nr erori

Inferior Superior Total


medianei medianei
Grupa A a 13 b 7 20 elevi
Grupa B c 5 d 11 16 elevi
Total 18 18 36 (T)

2. COMPARAREA A DOUA ESANTIOANE INDEPENDENTE

TESTUL U (Mann - Whitney)

• Cand se compara grupe sau clase de elevi diferite dupa schema:


clasa experimentala (Ce) si clasa de control (Cc) atunci este indicat
sa utilizam tehnica testului U preconizata de Mann si Whitney.
Metoda se preteaza destul de bine la datele numerice rezultate din
atribuirea de puncte, clasificari, note etc.
• Testul U constituie una dintre cele mai puternice metode
neparametrice. Acesta tine cont de rangul fiecarui rezultat in
clasificarea generala si serveste la testarea ipotezei nule (Ho)
potrivit carei cele doua grupe (esantioane) independente sunt
extrase la intamplare din aceeasi colectivitate.
• Pentru a calcula R1şi respectiv R2pentru fiecare notă se va
face produsul dintre efectivul care a obţinut nota (în cadrul
fiecărei clase) şi rangul afectat acestei note.
• Totalul rangurilor (R1+R2) trebuie să fie egal cu N(N+1)/2, în
care N este egal cu N1+N2. Pentru testul ipotezei nule se
poate utiliza fie R1fie R2; sunt de preferat datele referitoare la
grupa mai puţin numeroasă.Pentru uşurarea calculelor se va
determina de la început suma rangurilor (R) numai la unul din
eşantioanele date (la cel mai restrâns)
• Aplicarea metodei prezentate impune restricţia ca numărul
rangurilor egale la diferite note să nu fie prea mare.
3. PROBA SEMNELOR
Se aplică în compararea eşantioanelor perechi.În cazul
acesta raţionăm asupra diferentelor d, obţinute între valorile
perechi. Dacă distribuţia acestor diferenţe este normală sau
aproape normală, se aplică testul t; dacă nu este normală este
indicată proba semnelor.
Proba semnelor devine utilizabilă şi în alte situaţii. De multe
ori, în cadrul experimentelor din domeniul educaţiei nu reuşim
să evaluăm numeric-cantitativ rezultatele, putem însă preciza
sensul modificărilor survenite în urma măsurilor adoptate. Cu
alte cuvinte, putem stabili la la câţi elevi s-au înregistrat efecte
pozitive (îmbunătaţire, progrese), la câţi este vorba de efecte
nule (rămâneri pe loc) si la câţi s-au constatat efecte negative
(regrese). Aşadar, nu ajungem să determinăm mărimea
diferenţelor create de încercarea întreprinsă, ci arătăm numai
sensul lor, întocmind apoi balanţa „plusurilor” şi „minusurilor”,
şi în acest caz utilizăm proba semnelor, dacă experienţa
cuprinde bineînteles acelaşi colectiv evaluat în două etape
diferite (eşantioane corelate).
Se disting două situaţii:
a)când N<25
b)când N>25.
Ipoteza nulă este aceeaşi în ambele situaţii. Dacă notam cu
xrezultatele iniţiale (pretest) şi cu x’cele finale (posttest)
obţinute de acelaşi subiect, diferenţele x’-x pot fi pozitive, nule
sau negative. Diferenţele nule nu ne interesează în proba
semnelor. Raţionamentul se referă la diferenţele pozitive (+) şi
la cele negative (-).
Se presupune, în cadrul ipotezei nule (H0), că şansele sunt
egale de a avea diferenţe pozitive, respectiv negative. Cu alte
cuvinte, potrivit ipotezei nule proporţia „plusurilor” este sensibil
egală cu proporţia „minusurilor”. În practică, proporţia lor
diferă; întrebarea este dacă diferenţa este concludentă pentru
a infirma ipoteza nulă.
a) Când N<25, proba semnelor se aplică utilizându-se
un tabel special, în care se indică numărul de + sau
de –corespunzător pragului de semnificaţie de .05 sau
.01.
Ipoteza nulă, fiind egalitatea proporţiilor de semne + şi –,
nu ne putem a s u m ariscul de a o elimina decât de la un a
n u m i tnumărcritic de semne + sau –din grupa
experimentală, număra cărui apariţie prin simplă întâmplare
corespunde unei probabilităţireduse, inferioare unui prag
ales de noi (de obicei .05 şi .01). Tabelul cuprinde valorile
critice ale lui spentru proba semnelor, sfiind numărulde
semne mai puţin frecvente. (vezi tabelul cu valorile
corespunzătoarediferitelor praguri de semnificaţie pentru
proba semnelor
Exemplu:
12 subiecţi sunt invitaţi să aleagă între două obiecte sau
două activitati A şi B. Se presupune că A va fi preferat lui B.
Se pune întrebarea: ipoteza este verificată sau nu?
Preferinţele sunt următoarele:
Subiecti 1 2 3 4 5 6 7 8 9 10 11 12
Preferinte A A B A 0 A A 0 A A A A

După cum se vede, subiecţii 5 şi 8 nu s-au puut decide


(situaţiile de indecizie fiind marcate cu 0). Să rezumăm
datele într-un tabel:
A<B A=B A>B
Prefera B Prefera A
(semnul - ) (semnul +)
1 2 9
De regulă se elimină situaţiile de indecizie, respectiv
diferenţele nule şi raţionăm în continuare numai asupra celor
10 cazuri (N=10).
Având un semn –si nouă semne + se vede imediat că
semnele mai puţin frecvente sunt semnele –. Să urmărim
dacă acestea depăşesc valoarea critică. Ne referim la tabelul
cu valorile pentru proba semnelor din care facem un extras:
Observăm că pentru N=10, la pragul de p=.05, tabelul ne
indică, pentru svaloarea 1.
În consecinţă, ne putem asuma riscul de a afirma că A este
preferat lui B în chip semnificativ. Riscul de a fi contrazişi este
de 5% ceea ce, practic, este foarte mic. Deosebirea în
preferinţe este, deci, semnificativă.

b) Când N>25 Proba semnelor se poate aplica în


două feluri.

Exemplu: Într-o experienţă de educaţie morală, efectuată cu 32 de


copii, s-a înregistrat la incheierea perioadei de activitate urmatoarea
situaţie: progrese în modul de comportare la 23 de copii, regrese la
4 copii şi situaţie staţionară la 5 copii. Deci: (primul mod de
rezolvare)
Semnul - 0 +
4 5 23
Eliminăm cazurile staţionare şi obţinem:
- + T
4 23 27
Semnele mai puţin frecvente sunt semnele –. Consultăm apoi
tabelul valorilor critice ale lui spentru N=27.
CORELATIA

• Daca ambele variabile (x si y) sunt cantitative si aleatoare, atunci


relatia statistica dintre ele apartine domeniului corelatiei si un scop
aici este sa se indice gradul de asociere sau de legatura intre cele
2 variabile. Asociatia este deci reciproca si nu intr-un singur sens
ca in cazul regresiei.
• Corelatia este indicata prin coeficientul de corelatie.(r)

• Coeficientul de corelatie simpla numit coeficientul de corelatie


Pearson este folosit pentru a indica gradul asocierii liniare intre 2
variabile, asocierea fiind reciproca.
• Coeficientul de corelatie variaza intre -1 si +1, inclusiv:
- Cand se apropie de -1 modificarea unei variabile este puternic
asociata cu inversul modificarii liniare a celeilalte variabile
- Cand coeficientul de corelatie este egal cu 0, inseamna ca nu
exista asociatie intre modificarile celor 2 variabile.
- Cand coeficientul de corelatie se apropie de +1, imseamna ca
modificarea unei variabile este foarte puternic asociata cu
modificarea liniara directa a celeilalte variabile.

• Un coeficient de corelatie poate fi calculat corect numai cand


datele ambelor variabile se refera la esantioane si fiecare este ales
independent.
• Un coeficient de corelatie poate fi apropiat de ±1, deci ne va indica
o corelatie puternica, dar ea poate fi nesemnificativa din cauza
volumului mic a esantionului studiat.
• Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca
observatiile a 2 variabile se pot corela foarte bine fara sa avem
motive logice si stiintifice ca una dintre variabile poate fi cauza
celeilalte.

S-ar putea să vă placă și