Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Suport de curs
METODOLOGIA CERCETĂRII
PSIHOPEDAGOGICE
Cluj-Napoca, 2017
2
Metodologia cercetării psihopedagogice
I. Informatii generale: Date de identificare a cursului
Date de contact ale titularului de curs Date de identificare curs si contact tutori
Nume : Conf.univ.dr. Adrian Roşan Numele cursului: Metodologia cercetării
psihopedagogice
Birou: Str. Sindicatelor nr.7, camera 23 Codul cursului: PLR2303
Telefon: +40-264-598.814 int.6100 Anul II, semestrul 3.
Fax: +40-264-598.814 Tipul cursului: obligatoriu
E-mail: a_roşan@yahoo.com Pagina web a cursului:
Consultaţii: Tutore: lector dr. Adrian Roşan
marti 12-14 Adresa email: a_roşan @yahoo.com
a) Obiective
La finalul cursului studenţii vor dobândi cunoştinţe privind :
Noţiuni fundamentale ale statisticii psihologice şi psihopedagogice (măsurare,
variabile statistice, indicatori statistici)
Raţionamentul testării ipotezelor statistice (teorema limitei centrale, ipoteze statistice,
decizia statistică, erori statistice, mărimea efectului şi puterea testelor )
Teste statistice de semnificaţie pentru relaţia dintre variabile (testul z pentru un
eşantion, testele t, testul de corelaţie, analiza de varianţă unifactorială, teste
neparametrice echivalente;
Analiza distribuţiilor statistice
Ilustrarea grafica a distributiilor statistice
Analiza semnificatiei relatiilor dintre variabilele unei cercetari psihopedagogice bazate
pe date statistice
Utilizarea indicatorilor statistici (tendinta centrala, imprastiere, forma)
Aplicarea procedurilor statistice pentru testarea semnificatiei relaţiei dintre variabile
Interpretarea rezultatelor testelor statistice de semnificatie
3
b) Conţinut
4
Concepte cheie: distribuţie, distribuţie simetrică, distribuţie asimetrică
Seminar: Analiza distribuţiei
Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Iasi: Editura Polirom.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Cluj Napoca: Editura Sincron.
Capitolele 3,4,5,9,11 si 14
Lungu, Ovidiu (2001). Ghid introductiv pentru SPSS 10.0. Iasi: Seria Psihologie
Experimentala si Aplicata.
http://statisticasociala.tripod
Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 47- 60
5
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 33-79
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 61-82
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod
6
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 144 -152
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321
Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
7
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 285-384
Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 125-133
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 304-321
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag 134-142
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321
8
1.4. Formatul şi tipul activităţilor implicate de curs
Suportul de curs este structurat pe module, fiecare modul abordând mai multe teme.
Parcurgerea acestora va presupune muncă individuală, dar şi întâlniri faţă în faţă (activităţi
asistate şi consultaţii). Consultaţiile, inclusiv prin e-mail sau accesarea platfomri ID, trimis
tutorilor sau responsabilului de curs, pentru care prezenţa este facultativă, reprezintă un sprijin
direct acordat din partea titularului si a tutorilor. Pe durata acestora vom recurge la prezentări
ale informatiilor aferente fiecarui modul dar mai cu seama vor fi oferite, folosind mijloace
auditive şi vizuale, explicaţii alternative, răspunsuri directe la întrebările pe care ni le veţi
adresa. În ceea ce priveşte activitatea individuală, aceasta o veţi gestiona dumneavoastra si se
va concretiza in parcurgerea tuturor materilelor bibliografice obligatorii, rezolvarea lucrarilor
de verificare si a proiectului de semestru. Reperele de timp si implicit perioadele de rezolvare
ale fiecărei activităţi (lucrări de verificare, proiect etc) sunt monitorizate prin intermediul
calendarului disciplinei. Modalitatea de notare şi, respectiv, ponderea acestor activităţi
obligatorii, în nota finală sunt precizate în secţiunea politica de evaluare şi notare precum şi în
cadrul fiecărui modul.Pe scurt, având în vedere particularităţile învăţământului la distanţă dar
şi reglementările interne ale CFCID al UBB parcurgerea şi promovarea acestei discipline
presupune antrenarea studenţilor în următoarele tipuri de activităţi:
a. consultaţii – pe parcursul semestrului vor fi organizate două întâlniri de consultaţii faţă în
faţă; prezenţa la aceste întâlniri este facultativă;
b. realizarea unui proiect de semestru cu o temă şi un set de sarcini anunţate cu cel puţin 30
de zile înaintea datei de depunere a acesteia.
c. forumul de discuţii – acesta va fi monitorizat de echipa de tutori şi supervizat de titularul
disciplinei.
1.5. Materiale bibliografice obligatorii
În suportul de curs, la finele fiecarui modul sunt precizate atât referinţele biblografice
obligatorii, cât şi cele facultative.
Bibliografie obligatorie
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Clocotici, Valentin, Stan, Aurel (2000). Statistica aplicata în psihologie, Editura Polirom, Iasi
Marginean, Ioan (2000). Proiectarea cercetarii sociologice, Editura Polirom, Iasi
9
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu
Sava, Florin (2000). Caiet de seminar pentru statistica sociala, Tipografia Universitatii de
Vest din Timisoara.
Publication Manual of the APA (2005)
Linkuri utile în aprofundarea conţinutului cursului:
http://it.stlawu.edu
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod
10
1.8. Politica de evaluare şi notare
Modalitatea de evaluare (stabilirea notei finale de semestru):
- răspunsurile la examen 40% (4p)
- testarea periodică prin 2 test paper 20% (1p)
- evaluarea prin lucrări de verificare 40% (4p)
Evaluarea finală se compune din însumarea evaluărilor la testările periodice (de regulă
două pe parcursul unui semestru), la activităţile de seminar şi la examen.
Testările periodice sunt evaluate cu 2 puncte în total si constau in liste de întrebări
deschise, care solicită un răspuns scurt şi concis.
Activitatea la lucrările de verificare este evaluată cu 4 puncte si se bazează pe
următoarele criterii: corectitudinea lucrărilor de verificare, aplicaţii SPSS şi evaluari
periodice.
Examenul de semestru se cotează cu 4 puncte, este scris şi se bazează pe o listă de
întrebări deschise (în jur de 20), care solicită răspunsuri scurte şi precise.
Studenţii primesc după examen lista răspunsurilor corecte şi astfel pot să evalueze
calitatea propriilor răspunsuri. Numărul de răspunsuri corecte este convertit într-un punctaj
(maxim 4 p).
1.9. Elemente de deontologie academică
Se vor avea în vedere următoarele detalii de natură organizatorică.
Prezenţa la ore : nu se pune prezenţa nici la orele de curs, nici la cele de seminar. Cei care
absentează nu vor putea acumula punctele ce pot fi obţinute în urma evaluării pe parcurs.
Modalităţi de recuperare: în cazul în care unul din cursuri nu va fi ţinut, se va recupera la o
dată ulterioară, fixată în acord cu studenţii.
Studenţii care vor fi prinşi copiind la examen vor fi scoşi afară din examen şi vor fi notaţi cu
unu.
Studenţii au dreptul să depună contestaţii dacă consideră că au fost nedreptăţiţi la examen.
Contestaţiile pot fi depuse în maximum 48 de ore de la afişarea notelor la secretariatul
facultăţii. Nota finală la disciplina respectivă este cea obţinută în urma contestaţiei.
11
Titularul cursului si echipa de tutori îşi exprima disponibilitatea, în limita constrângerilor
tehnice si de timp, de a adapta conţinutul şi metodelor de transmitere a informaţiilor precum şi
modalităţile de evaluare (examen oral, examen on line etc) în funcţie de tipul dizabilităţii
cursantului. Altfel spus, avem în vedere, ca o prioritate, facilitarea accesului egal al tuturor
cursanţilor la activităţile didactice si de evaluare.
12
Modul 1
Curs 1
13
Din examinarea imediată a acestor date nu rezultă nimic precis, întrucât diferitele
valori se înşiruiesc la întîmplare şi variază oarecum dezordonat.
Dacă recurgem la analiza datelor putem constata că anumite valori se repetă şi că
seria de date cuprinde valori între 32 şi 71; deci există cel mult 40 de valori (rezultate) diferite
pentru că 71-32+1=40.
Dacă încercăm să ordonăm datele obţinute am putea trece într-o coloană valorile
diferite în ordine crescândă, iar în dreptul fiecărei valori să notăm prin bare transversale de
câte ori se repetă fiecare valoare în şirul iniţial de date. Numărâd barele trasate determinăm
frecvenţa(f) a fiecărei valori. Un astfel de procedeu nu este indicat în exemplu de faţă, întrucât
el se aplică atunci când distanţa dintre valorile extreme -adică întinderea variaţiei- este mică.
În exemplul nostru întrucât întinderea (amplitudinea) variaţiei este destul de mare (între 32 şi
71) se impune gruparea valorilor în clase care să cuprindă mai multe valori.
Procedeul de grupare a datelor în clase presupune următorii paşi:
1. Căutăm mai întâi valorile extreme ale şirului de date pe care le marcăm cu câte un
asterisc; efectuăm apoi diferenţa xmax - xmin la care adăugăm 1 şi obţinem câte valori diferite sunt
posibile să fie cuprinse în acest interval (71-32+1=40).
2. Stabilim numărul de clase, precizând intervalul de grupare (i) adică câte valori vor fi
cuprinse în fiecare clasă. În mod practic numărul claselor nu trebuie să depăşească 20, iar când
întinderea variaţiei nu este prea mare, numărul claselor poate să coboare sub 10. La alegerea
intervalului de grupare trebuie avut în vedere faptul că, dacă, se aleg intervale prea mici,
gruparea datelor scoate în evidenţă aspectele de amănunt, care pun în umbră tendinţa de
ansamblu a fenomenului studiat. Iar gruparea bazată pe intervale de grupare prea mari atenuează
iregularităţile distribuţiei rezultatelor şi poate duce la estomparea manifestării specifice a
fenomenului studiat. Pentru a alege un interval optim vom ţine seama de aspectele oferite de
analiza calitativă a modului de manifestare a fenomenului studiat.
În exemplu de mai sus ne putem gândi la 10 clase. Pentru a găsi intervalul de grupe
împărţim valoarea întinderii variaţiei la 10 (40:10=4) şi vom afla că intervalul de grupare va fi
egal cu 4, astfel că vom grupa succesiv cîte 4 valori în fiecare clasă (32-35; 36-39 etc.) şi vom
obţine 10 clase deoarece 40:4=10 (vezi tabela numărul 1).
În cazul în care intervalul de grupare obţinut, pornind de la un număr de clase fixat are o
valoare zecimală, vom proceda la rotunjirea acestuia şi, în consecinţă, la lărgirea şirului de valori
cu câteva unităţi în sus sau în jos, având grijă să nu obţinem clase marginale care să aibă
frecvenţa zero.
14
3. În urma grupării datelor, presupunem că toate valorile care aparţin unei clase se
centrează în valoarea centrală (Xk) care se obţine prin adunarea extremelor fiecărui interval şi le
împărţim la doi (vezi tabela numărul 1).
4. Stabilim apoi câte valori (rezultate) din şirul iniţial de date se încadrează în fiecare
clasă, stabilind astfel frecvenţa (f) corespunzătoare fiecărui interval. Dacă însumăm apoi
frecvenţele stabilite pentru fiecare interval obţinem pe N (efectivul total de date sau de subiecţi).
TABEL NR. 1.
Gruparea datelor în clase şi stabilirea frecvenţei
Determinarea
x xk f
frecvenţei(f)
32-35 33,5 1
36-39 37,5 4
40-43 41,5 8
44-47 45,5 11
48-51 49,5 13
52-55 53,5 14
56-59 57,5 11
60-63 61,5 7
64-67 65,5 4
68-71 69,5 1
i=4 N=74
În tabela nr. 1 datele brute sunt grupate în două coloane: coloana valorilor lui x şi
coloana frecvenţelor (f), obţinând ceea ce se numeşte o distribuţie statistică sau o serie de
variaţie.
15
Curs 2
Prezentarea datelor sub formă de tabele
Rezultatele primare, după ce au fost grupate, pot fi prezentate în tabele care uşurează
desprinderea aspectelor esenţiale. Modul de realizare a tabelelor depinde de obiectivele
cercetării şi de aspectele care trebuie evidenţiate.
În cercetarea psihopedagogică adeseori se impune întocmirea de tabele comparative. În
cazul în care grupele studiate nu au efective egale se impune transcrierea în procente a
frecvenţelor absolute stabilite. Pentru transcrierea în procente procedeul este simplu. Efectivul
total al grupei(N) se consideră 100% şi se utilizează regula de trei simplă.
În exemplul anterior (Vezi tabela nr. 1) N=74, iar frecvenţele absolute sunt 1, 4, 8, 11, 13, 14,
11, 7, 4, 1 pe care le putem transcrie în procentele corespunzătoare astfel:
Totalizând procentele obţinute la un grup, trebuie să obţinem 100% sau o cifră foarte
apropiată.
Exprimarea procentuală este preferată în multe cercetări psihopedagogice întrucât
reuşita unor experienţe şcolare se apreciază adeseori după răspunsurile corecte înregistrate în
post-test. În aceste cazuri se determină procentul de exactitate.
Pentru ilustrare, să presupunem următorul exemplu:
Într-o cercetare în care s-a urmărit eficienţa unei noi metodologii în predarea fizicii
au fost cuprinse două clase cu efective diferite : clasa de experienţă cu un efectiv de 35 de
16
elevi şi clasa de control cu un efectiv de 41 de elevi. La încheierea experimentului la ambele
clase s-a dat o probă de control ce comportă 15 răspunsuri corecte.
Verificându-se lucrările de control s-au consemnat răspunsurile exacte, erorile şi
omisiunile.
Pentru a evidenţia eficienţa noii metodologii se calculează procentul de exactitate (E)
întrucât acesta ia în considerare atât răspunsurile exacte (Re), cât şi răspunsurile greşite şi
omisiunile
Procentul de exactitate:
Re
E 100
Rmax
O dată cunoscut procentul de exactitate (E), diferenţa până la 100% o constituie
răspunsurile greşite şi omisiunile.
TABEL NR. 2.
Numărul răspunsurilor corecte obţinute de clasa de control şi de experienţă
de experienţă 35 490
de control 41 492
Este evident că cifrele absolute (490, 492) nu pot fi comparabile, întrucât efectivele
celor două clase nu sunt identice. Se impune exprimarea procentuală, deci calculul procentului
de exactitate pentru fiecare clasă.Pentru a putea calcula procentul de exactitate avem nevoie de a
stabili numărul de răspunsuri maxim (Rmax) care se obţine prin înmulţirea efectivului fiecărei
clase cu numărul maxim de răspunsuri pe care îl putea da un elev (15 răspunsuri)
Deci, procentul de exactitate pentru cele două clase se calculează astfel:
Pentru clasa de experienta:
490 490
E 100 100 93,3%
35 15 525
Pentru clasa de control :
17
492 492
E 100 100 80%
41 15 615
Eficienţa noi metodologii aplicate se apreciază prin compararea procentului de
exactitate obţinut de clasa de experienţă cu cel al clasei de control.
Din prezentarea datelor sub formă de tabelă distingem că orice tabelă trebuie să aibă un
număr care se înscrie deasupra tabelei în partea dreaptă şi un titlu care redă în mod concis
conţinutul şi care se înscrie deasupra tabelei.
De asemenea, orice tabelă cuprinde coloane şi linii. Fiecare linie şi fiecare coloană va
avea un titlu care trebuie să fie o explicaţie concisă a datelor, care se înscrie în capul coloanei, iar
pentru linii în prima coloană din stânga.
Coloanele se pot subdivide în subcoloane.
Coloanele şi rândurile pot avea la sfârşit un total. Însumările pe coloane şi pe linii se
efectuează numai pentru date de acelaşi fel.
Curs 3
Tipuri de distribuţii
18
Fig. 1. Histograma, poligonul şi curba frecvenţelor
19
Fig. 2. Distribuţie simetrică
20
Fig. 4. Distribuţie în formă de i
21
Fig. 6. Distribuţie bimodală
În cazul în care rezultatele obţinute sunt grupate doar în câteva categorii sau procente se folosesc
diagramele de comparaţie (fig.7) sau diagramele de structură (fig.8).
22
Modul II
Curs 4 Măsuri ale tendinţei centrale
Indicii prin care se determină în mod curent tendinţa centrala a rezultatelor sunt media,
mediana şi modulul.
Media pe care o notăm cu m, nu este altceva decât suma datelor numerice obţinute,
împărţită la numărul acestora.
23
T
Ştiind că: m , putem calcula media:
N
T 3803
m 51,39 .
N 74
Metoda a doua de calcul a mediei uşurează foarte mult calculele cu cifre mai mari,
deoarece presupune o operaţie de "codare" în care distingem o serie de paşi.
După ce am ordonat şi grupat datele alegem o medie de lucru pe care o notăm cu mo
care este de regulă valoarea de la mijlocul şirului de valori sau valoarea centrală a clasei centrale.
Când oscilăm între două valori apropiate, preferăm valoarea căreia îi corespunde frecvenţa cea
mai mare.
În exemplul ales mai sus, şi al cărui date sunt reluate în tabela 4, media de lucru (mo)
este 53,5, pe care o marcăm, incluzând-o într-un chenar (vezi tabela nr. 4).
TABEL NR. 4.
Calcularea datelor necesare aflării mediei prin metoda a II-a
x xk f u fu
32-35 33,5 1 -5 -5
36-39 37,5 4 -4 -16
40-43 41,5 8 -3 -24
44-47 45,5 11 -2 -22
48-51 49,5 13 -1 -13 (-80)
52-55 53,5 m0 14 0 0
56-59 57,5 11 1 11
60-63 61,5 7 2 14
64-67 65,5 4 3 12
68-71 69,5 1 4 4 (41)
i=4 N=74 fu=θ=(-80)+(41)= -39
În continuare adăugăm tabelului o nouă coloană pentru valorile codate pe care le notăm cu u.
Se trece de la variabila iniţală x la o nouă variabilă u gratie formulei de transformare:
x m0
u . Practic, se înlocuiesc valorile iniţiale x cu abaterile acestora de la media de lucru (x-
i
24
m0) simplificate cu i(intervalul de grupare). Se poate verifica acest mod de a proceda în tabela nr.
xk mo
4, în care este calculat pentru fiecare interval câtul
i
În continuare se lucrează cu valorile codate µ. Pentru diferenţiere vom nota cu mx
media valorilor iniţiale x şi cu mu media valorilor codate.
fu
Vom determina mu pe baza formulei: mu , pentru ca în final să revenim la
N
calculul mediei valorilor lui x pe baza formulei mx m0 imu .
Pentru calculul Σfu pe care o notăm cu θ(teta) pentru a putea fi deosebită de T, vom
deschide o nouă coloană fu (vezi tabela 4) în care vom înscrie produsele fu , respectând regula
semnelor la înmulţire şi apoi vom efectua suma algebrică a produselor fu (vezi tabela 4).
În exemplu ales, mu va fi egală cu:
39
mu 0,527, iar mx va fi egală cu
N 74
53,5+4(-0,527)=53,5-2,11=51,39
De notat este faptul că mu poate fi uneori un număr negativ, dacă θ este negativ. În
cazul acesta produsul i.mu va fi negativ şi în consecinţă îl vom scădea din mo pentru a afla
valoarea mediei mx.
Media evidenţiază tendinţa centrală a rezultatelor eşantionului studiat, făcând posibilă
compararea între grupe (eşantioane).
Mediana este un alt indice al tendinţei centrale, care se utilizează mai ales în cazul
distribuţiilor asimetrice.
Pentru a găsi valoarea medianei care se notează cu med.- trebuie, în cazuri mai simple,
să aranjăm toate datele în ordine crescândă sau descrescândă.
Mediana fiind valoarea care împarte şirul de valori în două grupe egale, ca număr, se
situează deci la mijlocul şirului de valori. Pentru a găsi care este valoarea medianei, trebuie să
calculăm mai întâi locul medianei sau rangul pe care îl ocupă mediana în şirul ordonat cu
N 1
ajutorul formulei: .
2
Când valorile constituie un număr fără soţ, mediana va corespunde determinantei din
mijloc.
25
De exemplu, în seria de valori: 6,6,7,8,8,9,9,9,9,10,11, locul medianei va fi:
N 1 11 1
6 , iar valoarea va fi 9, întrucât aceasta este pe locul al şaselea în şirul ordonat.
2 2
Dacă valorile ordonate sunt în număr cu soţ de exemplu: 5,6, 6,7,8,9,9,10,10,11,
10 1
mediana se va situa pe locul 5.5 . Căutând în şirul de valori valoarea situată pe locul 5,5
2
vom constata că ea se găseşte între două valori consecutive 8 şi 9. În consecinţă, pentru a afla
89
valoarea medianei vom face media celor două valori şi deci mediana va fi egală cu 8.5
2
Modulul este valoarea care se repetă cel mai des într-un şir de rezultate, adică valoarea
cu frecvenţa cea mai mare.
De exemplu, în seria de rezultate 6,7,8,8,9,9,9,9,10,11, modulul este 9, întrucât este
valoarea cu frecvenţa cea mai mare.
Ca indice al tendinţei centrale, modulul este foarte aproximativ şi se ia în considerare
mai ales la o primă inspecţie a rezultatelor.
În cazul distribuţiilor simetrice modulul, mediana şi media coincid sau prezintă valori
foarte apropiate şi, deci, în acest caz, se recomandă calculul mediei pentru a exprima tendinţa
centrală.
Media (sau oricare altă măsură a tendinţei centrale) singură nu este adecvată şi nici
suficientă pentru a caracteriza un grup, o clasă, un eşantion, întrucât se impune pentru
formarea unei imagini corecte şi cunoaşterea modului cum se repartizează diferitele rezultate
în jurul valorii centrale pentru a evidenţia gradul de diferenţe individuale în interiorul
grupului. De exemplu, două distribuţii statistice (vezi fig. 9) pot avea aceeaşi medie, dar pot fi
foarte diferite sub aspectul variabilităţii, respectiv al omogenităţii. În acest context se pune
problema de a calcula indicatorii prin intermediul cărora se poate exprima variaţia datelor în jurul
mediei pentru a completa imaginea acesteia. Aceşti indicatori sunt: dispersia sau variaţia şi
abaterea standard, care ne dau informaţii asupra probabilităţii grupului studiat.
26
Fig. 9. Distribuţii statistice
27
Dispersia sau variaţia se notează cu σ sau cu s şi are ca formulă de definiţie:
x m
2
σ =s =
2 2
,
N 1
în care (x-m) reprezintă abaterea fiecărei valori de la media calculată, iar N este efectivul grupei
de măsurători.
Abaterea standard sau abaterea tip se notează cu σ sau cu s şi nu este altceva decât
rădăcina patrată din valoarea dispersiei:
σ=s= 2
Deci pentru a afla abaterea standard trebuie să calculăm mai întâi dispersia. Indicile
de dispersie cel mai exact şi mai des utilizat este abaterea standard, întrucât are avantajul de a fi
exprimat în aceleaşi unităţi ca şi datele iniţiale şi permite să se analizeze mai corect gradul de
varibilitate al grupului studiat. Abaterea standard, întrucât nu cuprinde radicalul în expresia ei
algebrică se pretează mai uşor la calculele teoretice.
Dacă analizăm formula de definiţie a dispersiei constatăm că numai expresia de la
numărător, adică suma patratelor abaterilor de la medie ridică probleme de calcul.Pe scurt
această expresie este denumită suma patratelor.
Pentru determinarea sumei patratelor nu se utilizează expresia de definiţie Σ(x-m)2
,deoarece comportă calcule laborioase. Pentru uşurarea calculelor formula de definiţie este
transformată într-o formulă convenabilă de calcul şi deci:
x2 T 2
Σ(x-m)2 = ,
N
în care notaţiile sunt deja cunoscute. Σx2 reprezintă totalul patratelor celor N rezultate din grupul
iniţial de date. Efectuând înlocuirile în cadrul formulei de definiţie a dispersiei aceasta devine
astfel:
T2
x2
2 N
N 1
Având datele grupate, pentru determinarea dispersiei ne vom referi din nou la cele două
metode utilizate pentru calculul mediei.
28
Prima metodă ilustrată la calculul mediei (vezi tabela 3), ne-a condus la determinarea
lui T prin însumarea produselor fx (fxk), ştiind că Σfx=T sau Σfxk=T, pe care urmează să-l
ridicăm la pătrat. Pentru a avea toate datele cerute de formula de calcul a dispersiei ne rămâne să
calculăm doar Σx2 sau Σx2k. Pentru aceasta la tabela care a condus la determinarea lui T mai
adăugăm o coloană fx2 sau fx2k în care vom înscrie produsele fx.x sau după caz fxk.xk.
Pentru ilustrare să urmărim tabela nr. 5.
TABEL NR. 5.
Calcularea dispersiei prin prima metodă.
x xk f f.xk f.xk.xk
Însumând produsele înscrise în coloana fxk.xk vom obţine Σx2k sau după caz Σx2.
Acum avem toate datele cerute de formula de calcul a dispersiei şi deci:
38032
200058,5
74
2
63,221
74 1
În continuare extragem rădăcina pătrată din 2 şi obţinem abaterea standard:
63.221 7.95
29
Metoda aII-a simplifică destul de mult calculele datorită procesului de codare.
Utilizând această metodă ,pentru diferenţiere vom nota σx2 dispersia valorilor iniţiale x cu σu2
,dispersia valorilor codate care se determină pe baza formulei :
2
u2
u2 N
N 1
Pentru a ajunge la dispersia valorilor lui x(σx2)vom înmulţi în final cu i2 şi deci,
2
u
2
30
TABEL NR. 6.
Calcularea dispersiei prin metoda a II-a.
x xk f u f.u fu.u
32-35 33,5 1 -5 -5 25
52-55 53,5 14 0 0 0
56-59 57,5 11 1 11 11
60-63 61,5 7 2 14 28
64-67 65,5 4 3 12 36
Având toate datele putem efectua înlocuirile necesare în formulă şi vom obţine valoarea
dispersiei:
392
4 309
2
2 63,22 .
74
74 1
Pentru a obţine abaterea standard (σ) extragem rădăcina patrată deci:
63,22 7.95
În încheiere trebuie să precizăm că valorile caracteristice studiate (m, med, σ) nu se
determină pentru orice distribuţie statistică. Dacă distribuţia rezultatelor este simetrică se
determină m, σ2 şi σ; dacă distribuţia este asimetrică se determină mediana. Iar în cazul
distribuţiilor particulare în formă de i sau j etc, este bine să ne mulţumim cu un grafic.
31
Modul III
Curs 6 Studiul corelaţiei
32
TABEL NR. 7.
Calculul coeficientului de corelaţie r în cazul când datele sunt negrupate.
Cotele la Notele la
Subiecţi proba de matematica x2 y2 xy
gândire (x) (y)
1 (RT) 10 6 100 36 60
2 (BI) 14 7 196 49 98
4 (CD) 17 5 289 25 85
7 (GP) 13 6 169 36 78
8 (BV) 16 6 256 36 96
159 73
1194
Deci: r 10 0.67
159
2
732
2615 561
10 10
Aplicarea acestui procedeu de calcul devine însă greoaie în cazul în care numărul
subiecţilor este mare şi datele obţinute sunt numeroase. În această situaţie vom recurge la
gruparea datelor si vom aplica un procedeu de calcul ce se bazează pe operaţia de codare.
33
În calculul corelaţiei avem două variabile (x şi y) şi în consecinţă vom avea ux şi uy. De
asemenea, vom nota Σux cu θ iar Σuy cu θ1. Efectuând înlocuirile putem constata ca formula de
calcul pentru r în cazul datelor grupate va fi următoarea:
1
u xu y
r N
2 1
2 2
u x2 u y
N N
Utilizarea acestui procedeu de calcul necesită aranjarea datelor într-un tabel (vezi
tabela nr. 8).
Pentru ilustrare să luăm următorul exemplu:
Să presupunem că dorim să urmărim care este gradul de legătură între notele obţinute
de 51 de elevi la matematică şi la fizică. Vom avea 2 variabile: notele de la matematică (x) şi
notele de la fizică(y).
În tabela nr.8 este redat modul de aranjare a datelor. Una din axe este atribuită
rezultatelor obţinute la matematică, iar cealaltă rezultatelor obţinute la fizică. Se poate observa că
intervalul de grupare este mai mare de 1, nu este necesar ca acesta să fie egal la ambele variabile.
34
TABEL NR. 8.
Aranjarea datelor pentru calculul coeficientului de corelatie r
Note mate 6
1 2 3 4 5 7 8 9 10 fy uy fuy fuy*uy
fizică (y) mo
10 1 1 2 3 6 18
9 2 2 1 5 2 10 20
8 1 3 3 2 1 10 1 10 10
mo7 5 4 5 3 17 0 0 0
6 1 3 3 1 1 9 -1 -9 9
5 1 3 1 5 -2 -10 20
4 1 1 1 3 -3 -9 27
3
2
1
fx 2 5 9 11 10 8 4 2 N 51 2 u 2 y 104
-
ux -3 -2 0 1 2 3 4
1
- -
fux -6 0 10 16 12 8 21
10 9
fux*ux 18 20 9 0 10 32 36 32 u 2 x 157
nux*uy 15 20 2 0 0 10 24 20 uxu y 91
-
6 2 0 3 8 9 12
1
9 12 0 0 0 4 12 8
6 3 0 -1 0 3
0 -2 -2
După ce s-au notat clasele pentru cele două variabile, luăm fiecare subiect cu notele
obţinute la cele două variabile (notele de la matematică şi notele de la fizică) şi trasăm câte o
bară în căsuţa corespunzătoare care se găseşte la intersecţia dintre notele de la cele două
variabile. După ce am introdus toţi subiecţii, se notează în fiecare căsuţă cifre corespunzătoare
numărului de bare trasate (În tabela 8 sunt trecute numai cifrele finale).
Pasul următor constă în completarea rubricilor fx şi fy, făcând suma frecvenţelor pe linii
(pentru fy) şi respectiv pe coloane (pentru fx), iar prin însumarea acestora obţinem N.
35
Trecem apoi la operaţia de codare. Pentru a se distinge de celelalte clase, clasele de la
mijlocul seriei se încadrează în chenar, şi cuprind media de lucru (mo). În tabela de calcul mai
adăugăm în dreapta şi dedesubtul acesteia câte 3 rubrici. În prima rubrică vom înscrie valorile
codate (ux şi uy); în dreptul claselor marcate cu chenar (sau a mediei de lucru) vom scrie zero,
apoi numărăm succesiv 1;2;3;4 …şi vom pune minus în dreptul tuturor valorilor mai mici decât
media de lucru.
În cea de a doua rubrică adăugată se înscriu produsele fux şi respectiv fuy, ţinând cont de
regula semnelor. Însumând algebric datele însrise în fiecare din aceste rubrici obţinem valoarea
lui şi 1 .
36
Dacă r 1 este vorba de o legătură funcţională liniară în sensul obişnuit al
cuvântului, y fiind exact determinat prin valoarea lui x.
37
M.M. 3 2,5 0,5 0,25
F.I 4,5 4 0,5 0,25
A.V. 4,5 6,5 -2,0 4,00
C.L. 6 8 -2,0 4,00
I.P. 7,5 6,5 1, 1,00
L.V. 7,5 9 -1,5 2,25
B.G. 9 5 4 16,00
M.D. 10 14 -4 16,00
U.I. 11 12 -1 1,00
O.G. 12 10 2 4,00
A.C. 13 13 0 0,00
P.I. 14 11 3 9,00
N=14 d 2 58
În tabela nr. 9 sunt trecute rezultatele obţinute în urma clasificării subiecţilor (elevilor)
în funcţie de rezultatele obţinute la matematică şi la fizică şi urmează să stabilim relaţia dintre
aceste rezultate pentru a stabili dacă există o corelaţie între rezultatele obţinute la cele două
obiecte de învăţământ.
Având datele aranjate în tabela nr. 9, putem efectua includerea lor în formula de calcul a
coeficientului de corelaţie ρ şi deci:
6 * 58
1 0.88
14142 1
Coeficientul de corelaţie obţinut este de 0,88 fapt explicabil prin diferenţa destul de
mică între rangurile obţinute de subiecţi în cele două clasificări, datorită unei legături directe
între rezultatele elevilor la cele două obiecte de studiu.
Ca şi r, coeficientul de corelaţie poate avea valori între –1 şi +1.
38
a fi socotit semnificativ. Deci coeficientul de corelaţie critic este cel mai mic coeficient de
corelaţie semnificativ. În acest senes există o tabelă specială (tabela nr. 10) în care sunt stabiliţi
coeficienţii de corelaţie critici pentru diferite praguri de semnificaţie şi pentru diferite valori ale
lui n (care semnifică numărul gradelor de libertate), şi unde n =N-2. Întrucât coeficienţii de
corelaţie pot fi şi negativi, tabela cuprinde valorile absolute ale coeficientului critic.
39
TABELA NR. 10.
Tabela valorilor semnificative pentru (r)
p.
P = .10 P = .05 P = .02 P = .01
n
3 .81 .88 .93 .96
4 .73 .81 .88 .92
5 .67 .75 .83 .87
6 .62 .71 .79 .83
7 .58 .67 .75 .80
8 .55 .63 .72 .76
9 .52 .60 .69 .73
10 .50 .58 .66 .71
11 .48 .55 .63 .68
12 .46 .53 .61 .66
13 .44 .51 .59 .64
14 .43 .50 .57 .62
15 .41 .48 .56 .61
16 .40 .47 .54 .59
17 .39 .46 .53 .58
18 .38 .44 .52 .56
19 .37 .43 .50 .55
20 .36 .42 .49 .54
25 .32 .38 .45 .49
30 .30 .35 .41 .45
35 .27 .32 .38 .42
40 .26 .30 .36 .39
45 .24 .29 .34 .37
50 .23 .27 .32 .35
60 .21 .25 .29 .32
70 .20 .23 .27 .30
80 .18 .22 .26 .28
90 .17 .21 .24 .27
100 .16 .19 .23 .25
40
coeficienţii de corelaţie minimi pentru diferitele praguri de semnificaţie (p = .10, p = .05, p = .02,
p = .01) corespunzător valorilor lui n.
În cel de al treilea exemplu = .88 putem spune că este foarte puternic semnificativ
întrucât la pragul de p = .01 coeficientul critic este .66, iar găsit de noi este mult mai mare şi
corespunde un p<.01 .
Temă:
1. În cadrul unui experiment efectuat la clasele a IV-a şi a VIII- s-a studiat atenţia în
funcţie de motivaţia activităţii de învăţare la elevi. În acest scop s-au utilizat trei probe:
- o probă de barare de vocale după testul Bourdon-Piéron;
- o probă de exerciţii de artmetică suficient de simple pentru a fi rezolvate cu uşurinţă
de toţi elevii (la clasa a VIII-a s-au dat exerciţii de algebră, de asemenea foarte
simple);
- o probă de compunere de cuvinte din trei litere. În toate caazurile s-a urmărit gradul
de concentrare psihică a elevilor.
Rezultatele obţinute la clasa a IV-a în cele trei probe, redate mai jos, s-au stabilit pe
baza unui punctaj unitar. Au fost examiaţi 41 de elevi (în fiecare rând sunt trecute rezultatele
obţinute de câte un elev).
41
(x) (y) (z)
8 5 3
7 9 8
6 7 5
9 3 4
8 8 5
7 4 5
7 8 3
9 9 7
8 9 4
12 9 10
5 10 9
8 6 7
1 9 3
8 7 7
4 6 7
8 6 3
8 8 7
9 7 5
5 6 7
8 8 7
4 8 6
7 6 7
6 8 8
9 8 4
7 7 7
7 6 7
8 10 7
6 7 3
9 10 7
6 4 4
6 7 7
3 6 8
8 6 7
6 7 7
5 7 5
4 8 8
8 8 4
8 4 6
8 5 5
9 9 6
5 3 4
(după B. Zörgö, T. Podaru şi V. Samu)
a) Să se studieze relaţiile dintre rezultatele obţinute la testul Bourdon – Piéron şi
celelalte aspecte cuprinse îîn experienţă.
b) Care este semnificaţia indicilor obţinuţi?
2. S-a urmărit în cadrul activităţilor practice în ce măsură frecvenţa ridicată a
operaţiilor de control se răsfrânge pozitiv asupra calităţii produsului finit. În acest scop, s-a
42
întocmit o clasificare a elevilor după frecvenţa controlului efectuat cu instrumente de măsură
şi o clasificare paralelă după calitatea produsului obţinut. Rezultatele sunt cuprinse în tabela
de mai jos.
43
În mod practic rezultatul unei cercetări poate fi sintetizat numeric în diferenţa dintre
medii. În legătură cu acest rezultat se confruntă două ipoteze: ipoteza specifică şi ipoteza nulă
(care este o ipoteză statistică).
În acest context, chiar dacă explicaţia ce decurge din ipoteza specifică ne apare
întemeiată, trebuie să ne asigurăm că ipoteza nulă este foarte puţin plauzibilă.
Pentru a dovedi justeţea ipotezei specifice, cercetătorul va admite în mod provizoriu
ipoteza nulă, deci diferenţele dintre medii să aibă loc numai pe baza „legilor întâmplării” şi să
determine probabilitatea (şansele) acesteia. Ştim că probabilitatea ia valori între 0 şi 1, iar
transcrisă în procente între 0 şi 100%. Dacă probabilitatea obţinerii rezultatului în baza ipotezei
nule este foarte mică (de exemplu, mai mică decât 0,05, ceea ce se scrie p <.05) atunci respingem
această ipoteză (nulă – a întâmplării) şi acordăm toată încrederea ipotezei specifice (inclusă în
cercetare). Dacă probabilitatea determinată conform ipotezei nule este mare (de exemplu p>.05,
putând merge până la 1), atunci admitem ipoteza nulă şi considerăm diferenţele obţinute ca
nesemnificative.
Prin urmare se acceptă ca semnificative acele rezultate care au şansele de a se produce
prin simpla întâmplare înt-un număr foarte mic de cazuri (sub 5% sau p<.05), întrucât riscul de a
greşi este mai mic de 5 % din cazuri.
Acesta este raţionamentul la care recurgem şi în cazul stabilirii semnificaţiei
diferenţelor dintre medii ca o problemă de comparaţie. În stabilirea semnificaţiei diferenţei între
două medii în funcţie de natura eşantioanelor (grupurilor de experienţă) avem două situaţii.
Pentru primul caz când numărul de măsurători (N) în fiecare eşantion este mai mare de
30 sau N1 + N2 > 60 pentru testarea ipotezei nule se utilizează raportul următor:
44
m1 m2
z
12 22
N1 N2
Dorim să cunoaştem dacă diferenţa dintre medii este semnificativă şi deci variabila
inclusă în experiment a dus la îmbunătăţirea rezultatelor.
Pentru a constata dacă cele două medii constatate diferă semnificativ, facem
raţionamentul care urmează.
Admitem pentru un moment ipoteza nulă şi stabilim care este probabilitatea de a fi
verificată. Cu alte cuvinte presupunem că diferenţa dintre cele două medii m1 şi m2 se
datoreşte întâmplării şi că nu există diferenţe reale între eşantioanele considerate. În limbaj
statistic înseamnă că cele două grupe constituie eşantioane întâmplătoare ale aceleaşi
colectivităţi.
Pentru a testa ipoteza nulă vom utiliza raportul z şi deci:
m1 m2 8,5 7,1
z 3,49
1 2
2 2 2,80 3,05
N1 N2 36 37
45
Valoarea lui z găsită de noi de 3,49 este mai mare decât 258 şi corespunde la un p<.01,
deci diferenţa între cele două medii este net semnificativă şi putem conchide că variabila inclusă
în experiment a determinat o îmbunătăţire semnificativă a rezultatelor întrucât ipoteza nulă este
infirmată.
Pentru cel de al doilea caz, când volumul datelor obţinute în fiecare eşantion (N) este
mai mic de 30 sau N1 + N2 < 60, în verificarea şanselor ipotezei nule se apeleză la testul t
utilizând formula:
m1 m2
t
1 1
S 2
N1 N 2
Pentru a obţine o estimare a dispersiei colectivităţii, care este notată în formulă cu S2, se
combină datele celor două eşantioane:
S
2 2
x m1 x m2
2
N1 N 2 2
Expresiile de la numărător ne sunt cunoscute de la calcularea dispersiei (sumele de
T2
pătrate Σ(x - m)2 = Σx2 – ) referitoare la cele două grupe sau eşantioane, iar N1 şi N2 sunt
N
efectivele celor două eşantioane.
Există o tabelă specială (întocmit de Student) în care figurează probabilităţile raportului
t corespunzător numărului „gradelor de libertate” care depinde de volumul eşantioanelor (vezi
46
TABELA NR. 11.
Tabela valorilor lui t
P
.10 .05 .02 .01
n
1 6,34 12,71 31,82 63,66
2 2,92 4,30 6,96 9,92
3 2,35 3,18 4,54 5,84
4 2,13 2,78 3,75 4,60
5 2,02 2,57 3,36 4,03
6 1,94 2,45 3,14 3,71
7 1,90 2,36 3,002 3,50
8 1,86 2,31 2,90 3,36
9 1,83 2,26 2,82 3,25
10 1,81 2,23 2,76 3,17
11 1,80 2,20 2,72 3,11
12 1,78 2,18 2,68 3,06
13 1,77 2,16 2,65 3,01
14 1,76 2,14 2,62 2,98
15 1,75 2,13 2,60 2,95
16 1,75 2,12 2,58 2,92
17 1,74 2,11 2,57 2,90
18 1,73 2,10 2,55 2,88
19 1,73 2,09 2,54 2,86
20 1,72 2,09 2,53 2,84
21 1,72 2,08 2,52 2,83
22 1,72 2,07 2,51 2,82
23 1,71 2,07 2,50 2,81
24 1,71 2,06 2,49 2,80
25 1,71 2,06 2,48 2,79
26 1,71 2,06 2,48 2,78
27 1,70 2,05 2,47 2,77
28 1,70 2,05 2,47 2,76
47
29 1,70 2,04 2,46 2,76
30 1,70 2,04 2,46 2,75
35 1,69 2,03 2,44 2,72
40 1,68 2,02 2,42 2,71
45 1,68 2,02 2,41 2,69
50 1,68 2,01 2,40 2,68
60 1,67 2,00 2,39 2,66
1,64 1,96 2,33 2,58
cu:
2 80,1 84,5
S 6,33
14 14 2
12,7 14,7 2
t 2,27
1 1 0,88
6,33
14 14
Această valoare a lui t de 2,27 o raportăm la tabela valorilor lui t. Pentru aceasta
calculăm pe n care este egal cu 14+14-2=26.
48
Căutăm în coloana lui n pe 26 şi apoi citim valoarea lui t şi observăm că la p = .05
aceasta este de 2,06 şi respectiv la p = .02 este de 2,48. Valoarea lui t calculată de noi de 2,27
este mai mare decât cea corespunzătoare lui p = .05 şi mai mică decât cea corespunzătoare lui p
= .02. Deci, putem spune că diferenţa dintre medii este semnificativă la p<.05 .
În general, dacă valoarea găsită prin calcul este mai mică decât valoarea lui t indicată în
tabel la pragul de p = .05, atunci admitem ipoteza nulă şi considerăm diferenţele obţinute în
experienţă ca nesemnificative. Dacă valoarea calculată de noi este mai mare decît valoarea lui t
de la p = .05, dar mai mică decât valoarea lui t la pragul p = .01, vom spune că diferenţa este
semnificativă la pragul p<.05, iar dacă valoarea găsită de noi este mai mare decât valoarea lui t
indicată în tabel pentru p = .01 atunci vom spune că diferenţa este semnificativă la pragul de
p<.01.
Efectul admiterii sau respingerii ipotezei nule se răsfrânge asupra ipotezei specifice,
astfel că admiterea ipotezei nule pune sub semnul întrebării ipoteza specifică; infirmarea ipotezei
nule consolidează ipoteza specifică.
49
TABEL NR. 12.
Calculul semnificaţiei diferenţei dintre medii
Notele la biologie
Subiecţii Semestrul II Semestrul I d d2
x' x
AC 9 7 2 4
DI 8 6 2 4
AD 7 5 2 4
VI 8 6 2 4
PI 6 5 1 1
CG 6 4 2 4
RN 5 5 0 0
MI 7 5 2 4
PC 8 5 3 9
MV 7 8 -1 1
GC 5 6 -1 1
ZI 9 7 2 4
N=12 Σd=16 Σd =40
2
md
t
d
N
50
T2
d 2
d2 N de unde d d
2
N 2
În exemplul nostru în tabelă (vezi tabela nr. 12) adăugăm coloana d2, şi însumând
datele înscrise în coloană obţinem Σd2=40.
162
40
d2 12 1,69 , de unde 1,69 1,3
12 1
d
Deci:
md 1,33
t 3,54
d 1,3
N 12
Căutăm în tabela lui t ţinând seama de faptul că în acest caz numărul gradelor de
51
10 8 5
9 5 3
8 2 2
7 - 1
X y x y x y x y x y
9 10 7 8 5 7 7 7 7 7
10 10 7 8 6 7 7 7 8 7
8 9 7 8 6 7 8 7 5 6
8 9 8 8 6 7 4 6 5 6
52
9 9 8 8 6 7 6 6 6 6
9 9 9 8 7 7 7 6 8 6
10 9 5 7 7 7 3 5 4 5
5 8 5 7 8 7 4 5 4 5
6 8 5 7 5 6 7 5 3 4
6 8 5 7 6 6 4 4 6 4
6 8
Se cere:
1. Care este probabilitatea ca un elev care a obţinut un anume rezultat la proba de
gândire logică să obţină acelaşi grad de rezultate şi la proba de matematică.
2. Să se studieze forma distribuţiei rezultatelor obţinute la proba de gândire logică.
3. O examinare ulterioară efectuată cu proba de gândire logică a unui subiect a dus la
obţinerea unei cote x. Ce predicţie se poate face cu privire la aceasta şi care este riscul de eroare.
4. Sistemul de cotare la cele două probe fiind acelaşi să se demonstreze dacă există
diferenţe semnificative între rezultatele obţinute la cele două probe.
Curs 9
Rezultatele unei experienţe se pot prezenta adeseori sub forma unei distribuţii de
frecvenţe. Dacă se consemnează reuşita sau nereuşita la o probă, ori se înregistrează atitudinea
adică două categorii. Dacă înscriem într-un tabel datele constatate la două grupe paralele,
Exemplu:
au consemnat răspunsurile corecte şi cele greşite. La clasa de experienţă s-au înregistrat 131
53
de răspunsuri corecte şi 32 greşite, iar la clasa de control, 120 de răspunsuri corecte şi 48
greşite. Efectivele celor două clase erau foarte apropiate, 30 de elevi, respectiv 32.
experienţă sunt semnificative sau nu? Cu alte cuvinte, problema este dacă metoda de lucru
încercată în prima clasă dă intr-adevăr rezultate mai bune sau nu? În ce măsură datele obţinute
se pot generaliza?
fo.
În legătură cu diferenţele care apar între cele două clase se pune întrebarea dacă sunt
extrase la întâmplare din aceeaşi colectivitate. Urmărim, cu alte cuvinte, dacă ipoteza aceleiaşi
în ambele eşantioane (diferenţa fiind nulă); adică, ar trebui să regăsim în cele două clase
54
În continuare, pentru fiecare număr găsit în mod practic, vom calcula numarul
Dacă din totalul de 331 (în cele două clase), numărul răspunsurilor corecte este 251,
331............................251
163............................ x
stabileşte uşor:
163 ∙251
=123,6
331
căsuţă din tabelă. Vom nota frecvenţele teoretice cu ft. Procedeul general prin care se obţine
un număr teoretic este următorul: înmulţim totalul rândului cu totalul coloanei şi împărţim
168 ∙80
=40,6
331
Pentru a compara frecvenţele teoretice (ft) cu cele observate (fo), ar trebui să ne bazăm
pe diferenţele dintre ele. Fiecare abatere de la valoarea teoretică tinde să contrazică ipoteza
nulă. Întrucât suma diferenţelor ar fi in mod necesar nulă, s-ar ajunge în impas. Şi atunci,
55
pentru a se face abstractie de semn, s-au luat pătratele acestor diferenţe, creându-se un simbol
(fo - ft)2
χ2 = Σ
ft
Observăm că în tabelul cu 4 căsuţe diferenţele (fo - ft) sunt egale, fapt care uşurează
calculele.
Valoarea obţinută prin calcul se raportează la valorile lui χ cuprinse într-un tabel
2
special. (Tabelul lui χ ) Acest tabel indică probabilitatea corespunzătoare diverselor valori ale
2
lui χ ţinând seama de numărul gradelor de libertate, care depinde de numărul de clase
2
(categorii) stabilite. În exemplul urmărit este vorba de 4 căsuţe. Numărul gradelor de libertate
se stabileşte după formula (r-1)(c-1), în care r este numărul de rânduri (linii) din tabel si c este
numărul coloanelor. În tabelul nostru avem 2 rânduri şi 2 coloane, deci r=2 şi c=2. Numărul
Citim în tabel valorile lui χ care corespund diverselor probabilităţi. Dacă valoarea
2
obţinută prin calcul este mai mică decât cea indicată în tabel pentru probabilitatea de .05,
56
atunci admitem ipoteza nulă şi considerăm diferenţele ca nesemnificative. Dacă valoarea
obţinută prin calcul este mai mare decât cea indicată în tabel pentru probabilitatea de .05,
respingem ipoteza nulă şi considerăm datele noastre semnificative. Dacă valoarea calculată
este superioară celei indicate pentru probabilitatea de .01, atunci vom considera diferenţele
puternic semnificative.
p
.10 .05 .01
n
1 2,71 3,84 6,64
Citim valoarea tabelară pentru p=.05 şi găsim 3,84. Valoarea calculată de noi (3,6)
fiind mai mică decât 3,84, vom admite ipoteza nulă şi vom considera diferenţele găsite în
experienţă ca nesemnificative.
Tabelul lui χ
2
p
.10 .05 .01
n
1 2,71 3,84 6,64
2 4,60 5,99 9,21
3 6,25 7,82 11,34
4 7,78 9,49 13,28
5 9,24 11,07 15,09
6 10,64 12,59 16.81
7 12,02 14,07 18,48
8 13,36 15,51 20,09
9 14,68 16,92 21,67
10 15,99 18,31 23,21
11 17,28 19,68 24,72
57
12 18,55 21,03 26,22
13 19,81 22,36 27,69
14 21,06 23,68 29,14
15 22,31 25,00 30,58
16 23,54 26,30 32,00
17 23,77 27,59 33,41
18 25,99 28,87 34,80
19 27,20 30,14 36,19
20 28,41 31,41 37,57
21 29,62 32,67 38,93
22 30,81 33,92 40,29
23 32,01 35,17 41,64
24 33,20 36,42 42,98
25 24,38 37,65 44,31
26 35,56 38,88 45,64
27 36,74 40,11 46,96
28 37,92 41,34 48,28
29 39,09 42,56 49,59
30 40,26 43,77 50,89
În cazul tabelului cu 4 căsuţe, cum este în exemplul dat, se poate determina valoarea
(ad – bc)2 T
χ2=
(a+b)(c+d)(a+c)(b+d)
Să luăm acum un exemplu care comportă trei modalităţi sau categorii în clasificarea
datelor.
58
Două grupe de şcoloari, A şi B, au urmat un program de activităţi practice. La grupa A
această activitate a avut loc sporadic. Proba practică prin care s-a încheiat experienţa a fost
identică la cele două grupe. S-a apreciat precizia dimensiunilor produsului finit, înregistrându-
se abaterile faţă de cerinţele prevăzute. Rezultatele comparative apar in tabelul de mai jos:
Abaterea (mm)
Grupa Total
0,0-0,2 0,2-0,5 0,5-1,0
a b c
A 63,5 20,0 16,5 100
d e f
B 33,7 18,3 48,0 100
dacă formarea deprinderilor de autocontrol asigură o precizie dimensională sensibil mai bună
căsuţe dispuse pe 2 rânduri şi 3 coloane. În diferite căsuţe sunt înscrise proporţiile sau
constatate sunt pur aleatoare. Verificăm, cu alte cuvinte, dacă ipoteza aceleiaşi colectivităţi
Bazându-ne pe totalurile marginale, putem estima proporţia abaterilor din primul interval (0,0-
59
În continuare, pentru fiecare număr găsit în mod practic vom calcula numărul
cunoscută.
Abaterea (mm)
Grupa Total
0,0-0,2 0,2-0,5 0,5-1,0
a
A 63,5 b 20,0 c 16,5 100
(48,6) (19,15) (32,25)
d e
B 33,7 18,3 f 48,0 100
(48,6) (19,15) (32,25)
Total 97,2 38,3 64,5 200 (T)
χ2 =Σ (fo – ft)
2
ft
60
Aşadar, în exemplul nostru χ = 23,42, iar n = 2.
2
p
.10 .05 .01
n
2 4,60 5,99 9,21
Observăm că valoarea tabelară este 5,99 pentru p= .05 şi 9,21 pentru p= .01. Valoarea
găsită prin calcul este 24,42, prin urmare este mai mare decât 9,21, pentru care p= .01. Vom
eşantioanele să fie destul de mari, iar frecvenţele înscrise în căsuţele tabelului să nu fie mai
mici decât 5 (de preferinţă, ar trebui să fie mai mari decât 10).
ipoteze. Se determină astfel dacă abaterea care se constată prin calcul este cuprinsă în limitele
Exemplu:
Unui grup de elevi (N=22) i se prezintă probleme directe şi inverse, în total câte 5
perechi de probleme de acest gen. La sfârşitul experienţei s-a constatat că din problemele
directe au fost rezolvate pe ansamblul grupului 90, în timp ce din cele inverse, abia 56.
Procentul problemelor rezolvate era de 81, 8 la cele directe şi de 50,9 la problemele inverse.
aceleaşi proporţii în rezolvarea celor două categorii de probleme. Or, proporţiile constatate
sunt diferite (81,8 % şi 50,9 %). Se pune întrebarea dacă diferenţa constatată este
61
semnificativă sau nu. Pentru a răspunde la această întrebare se vor compara efectivele
Totodată, criteriul χ poate servi pentru controlul independenţei a două însuşiri sau
2
grupe de rezultate. Raţionamentul se face în mod analog: presupunând că între cele două
însuşiri nu există nici o corelaţie (cele două fiind independente) ne aşteptăm la aceleaşi
proporţii în cele două grupe. Mergând pe această ipoteză se determină frecvenţele teoretice şi
apoi se calculează χ după procedeele arătate. Interpretarea se face în aceiaşi termeni: dacă
2
pentru valoarea calculată a lui χ găsim valori mari ale lui p (de exemplu p > .0,5) acceptăm
2
presupunerea făcută, iar dacă vom găsi valori mai mici ale lui p (de pildă p< .01) vom
conchide că există o anumită legătură (asociaţie) între cele două trăsături, fără să putem
preciza gradul acestei legături. Prin urmare, controlul independenţei poate fi considerat uneori
ca test de asociaţie sau omogenitate. Matematic, cele două sunt identice; ipotezele şi
care analiza calitativă a faptelor capătă prioritate. Valoarea datelor obţinute rezidă în
62
Modul V
Există situaţii experimentale în care pentru o variabilă avem informaţii complete, deci
datele (rezultatele) se prezintă ca o scară continuă de valori, iar pentru o a doua variabilă
cunoaştem doar că rezultatele se prezintă sub forma a două clase: superioară şi inferioară, deci
sunt dihotomizate.
Exemplu:
obţinem valorile pentru variabila x. După examen avem rezultatele (y) sub formă
dihotomizată: admisi; respinsi. În această situaţie urmărim să validăm testul (bateria de teste)
cu criteriu (reuşita).
Sau: dorim să urmărim pragul opţiunii pentru o secţie reală sau umanistă. În acest caz
putem să aplicăm un test sau o baterie de teste şi urmărim în paralel reuşita la o secţie
umanistă sau reală. Variabila x reprezintă rezultatele la test şi variabila y, reuşita la secţia
umanistă şi reală.
Sau: putem urmări în paralel timpul necesar pentru efectuarea unei probe şi numărul
de erori comise. Timpul este variabila continuă; numărul de erori poate fi dihotomizat (erori
m’-m” pq
r bis = x
σ y
63
→ în care m’ reprezintă media valorilor x pentru elementele clasei superioare (y>y0),
notează cu „z”, transformând al doilea termen al înmulţirii din formula de mai sus în (pq/z)
→ „σ” este abaterea standard a rezultatelor obţinute în cadrul variabilei continue (deci
Raportul pq/y se citeşte dintr-un tabel special luând ca reper fie pe „p” fie pe „q”. (vezi
anexa nr. 1)
m’-m”
r bis = x √pq
σ
Exemplu:
psihologic. Rezultatele la test au fost exprimate în cote de la 0 la 10 (x) iar cele de la concurs
în admişi-respinşi (y).
x
0 1 2 3 4 5 6 7 8 9 10 total
y
admişi 0 1 0 3 5 10 16 14 6 3 1 59
respinşi 1 2 4 7 13 12 9 4 2 0 0 54
64
total 1 3 4 10 18 22 25 18 8 3 1 113
→ calculăm mai întâi „p” care reprezintă proporţia elementelor din eşantionul
p = 59/113 = 0,52
q = 1- p = 1- 0,52 = 0,48.
→pq/y se citeşte din tabelul din anexa nr. 1. În acest caz se va lua valoarea lui p sau q
În cazul nostru vom citi din tabel valoarea raportului pq/y corespunzatoare lui q =
m' x f fx m" x f fx
0 0 0 0 1 0
1 1 1 1 2 2
2 0 0 2 4 8
3 3 9 3 7 21
4 5 20 4 13 52
5 10 50 5 12 60
6 16 96 6 9 54
65
7 14 98 7 4 28
8 6 48 8 2 16
9 3 27 9 0 0
10 1 10 10 0 0
m” = 241/54 = 4,46
→ apoi calculăm abaterea standard (σ) pentru întregul eşantion, în funcţie de valorile
la testul psihologic.
x f u fu fu∙u
0 1 -6 -6 36
1 3 -5 -15 75
2 4 -4 -16 64
3 10 -3 -30 90
4 18 -2 -36 72
5 22 -1 -22 -125 22
6 25 0 0 0
7 18 1 18 18
8 8 2 16 32
9 3 3 9 27
10 1 4 4 47 16
66
i2(Σu2-θ2/N) 12(452-782/113) 1(452-53,84) 398,16
σ=
2
= = = =3,55
N-1 113-1 112 112
m'-m” pq 6,08-4,46
r bis = x = x 0,63 = 0,86 x 0,63 = 0,54
σ y 1,89
Interpretarea
n = 113-2 = 111.
Valoarea lui r bis este semnificativă la un p < .01. Deci există o corelaţie foarte
semnificativă.
67
Curs 11
Coeficientul de corelaţie triserial (r tris)
Când intr-o cercetare o variabilă (y) ne apare sub forma unei clasificări trihotomice
(exp. buni – mijlocii – slabi) în timp ce cealaltă variabilă este continuă (exp. rezultatele la
testul psihologic), se utilizează pentru calcul coeficientul de corelaţie triserial care are ca
formulă:
m'-m” 1
r tris= x
y' y"
σ +
p' p"
în care m’ şi m” reprezintă mediile rezultatelor la variabila continuă (test psihologic
pentru cei buni si cei slabi); p’ si p”, proporţia de „buni” si respectiv „slabi”.
(- deci p’+ p” < 1)
y’ si y” sunt coordonatele curbei distribuţiei normale potrivit împărţirii în trei
Valorile rapoartelor y/p sunt date într-un tabel special (vezi anexa 1) pentru calculul
p’ y' y" p
”
68
Modul VI
Curs 12
1. Proba medianei;
2. Testul U;
unui factor bine precizat pot să apară două situaţii: a) grupe sau calse independente
1. Proba medianei
69
Când ansamblul de date obţinute in urma unei experienţe prezintă aspectul
unei distribuţii evident asimetrice, nu are sens să calculăm mediile; în acest caz
Gr. A
x 0 1 2 3 4 5 6 7 8 9 (numar de greşeli)
f 3 6 3 1 0 2 3 1 0 1 = 20 elevi
Gr. B
x 0 1 2 3 4 5 6 7 8 9 (numar de greşeli)
f 2 1 1 1 3 3 1 1 2 1 = 16 elevi
Se pune întrebarea dacă diferenţa între cele două mediane este semnificativă
sau nu.
deci că cele două mediane ar fi, de fapt, egale (ipoteza nulă), am putea considera cele
70
două grupe ca eşantioane extrase la întâmplare din aceeaşi colectivitate. Această
teoretică).
x 0 1 2 3 4 5 6 7 8 9
f 5 7 4 2 3 5 4 2 2 2 (N=36)
Mediana noii distribuţii se află pe locul 18,5 adică este egală cu 3,5.
cazuri situate sub mediana teoretică si 7 cazuri deasupra ei. În schimb, in grupa B
Evident, in cazul nostru vor fi cotaţi mai bine elevii cu mai puţine greşeli, la
Nr. erori
Inferior medianei Superior medianei Total
Grupa A a 13 b 7 20
Grupa B c 5 d 11 16
Total 18 18 36(T)
71
Rămânând în cadrul ipotezei nule admitem în mod provizoriu că proporţiile
pragul de p <.05 diferenţa observată între cele două mediane (adică între 2 şi 4,5)
Reperul care ne interesează este valoarea tabelară la pragul de p= .05, iar în cazul
nostru 3,84. Valoarea calculată (4,05) este mai mare, deci se poate nota cu p < .05.
dihotomică a datelor s-a impus cu uşurinţă. Este posibil insă să apară şi situaţii în
72
Gr. contr. x 3 4 5 6 7 8 9 10
N(f) 2 1 3 3 2 2 1 0 N=14
x 3 4 5 6 7 8 9 10
Gr. exp.
F(N) 1 0 2 1 3 1 3 2 N= 13
(clase) sunt reduse, recurgem la metodele neparametrice şi vom aplica proba medianei.
Mediana pentru grupa de control are valoarea de 6, iar pentru grupa experimentală
are valoarea 7.
Se pune întrebarea dacă diferenţa dintre cele două mediane este semnificativă sau
Gr. exp. + x 3 4 5 6 7 8 9 10
Gr. control f 3 1 5 4 5 3 4 2 N= 27
Deoarece în ambele grupe avem valori (cote) inferioare medianei teoretice, egale cu
Întrucât avem valori mici (mai mici de 5) în casuţe vom încerca o regrupare a datelor
în care valorile căsuţelor din mijloc vor fi adăugate fie căsuţelor din stânga fie căsuţelor din
dreapta.
73
Inferioare şi egale
Superioare medianei Total
medianei
Gr. exp. a 7 b 6 13
Gr. contr. c 11 d 3 14
Total 18 9 27 (T)
Superioare şi egale
Inferioare medianei Total
medianei
Gr. exp. a 4 b 9 13
Gr. contr. c 9 d 5 14
Total 13 14 27 (T)
Alegem tabelul care duce la un χ mai mic, în cazul nostru, primul tabel.
2
Întrucât avem efective mici, în căsuţe vom introduce corecţia lui Yates (adusă
T[(ad-bc) – T/2]2
χ2=
(a+b) (c+d) (a+c) (b+d)
27[(21-66) – 27/2]2
χ2= =3,13
13 x 14 x 18 x 9
74
Întrucât χ calculat corespunde unui p>.05, şansele ipotezei nule (H0) sunt mari, deci
2
ea nu poate fi infirmată.
75
Curs 13 Testul U
Testul U, preconizat de Mann şi Whitney, constituie una dintre cele mai puternice
testarea ipotezei nule (H0), potrivit careia două grupe (eşantioane) sunt extrase la întâmplare
Exemplu:
Clasa exp.(C e)
x 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N(f) 3 2 0 2 2 2 1 0 1 4 1 0 1 1 2 1 1 2 1 N=27
Clasa control (C c)
x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N(f) 3 5 3 2 3 1 0 0 1 0 0 0 2 1 1 1 1 2 0 1 0 N=27
utiliza metode parametrice în speţă testul t; întrucât întinderea variaţiei este destul de mare (de
celor două grupe în acelaşi ansamblu, trecând apoi la clasificarea notelor în ordinea crescândă
sau descrescândă.
76
2 1 1 1 1 1 1 1
Ce+ x 15 14 11 9 8 7 6 5 4 3 2 1 0
0 9 8 7 6 3 2 0
Cc
f 1 3 1 3 3 2 2 1 3 4 1 0 2 2 2 3 3 4 6 5 3
1 1 2 3 3 4 5
1 2 5 6 9 12 14 20 0 25 27 29 37 41
6 7 4 1 4 7 2
1 1 3 3 4 5
3 7 13 15 21 26 28 30 38 42
0 8 2 5 8 3
1 1 3 3 4 5
4 8 22 39 43
Ranguri 1 9 3 6 9 4
5
23 40 44
0
5
45
1
46
Nota maximă este 20 (aceasta în funcţie de rezultatele cu semnificaţia cea mai bună)
şi îi atribuim rangul 1, nota imediată este 19, consataăm ca 3 elevi au întrunit punctajul 19, îi
de ai sus în care apar consecutiv numerele de la 1 la 54, ultima valoare fiind egală cu N 1+N2
(27+27=54).
Admitem în continuare ipoteza nulă, considerând cele două clase de elevi ca selecţii
întâmplatoare din aceeaşi colectivitate şi în consecinţă notele lor nu diferă semnificativ. Dacă
ar fi aşa, suma rangurilor (R1) atribuite notelor obşinute în clasa experimentală trebuie să fie
efectivul care a obţinut nota (în cadrul fiecărei clase) şi rangul afectat acestei note. În tabelul
de mai jos este redat modul de calcul pentru exemplul ales de noi.
77
20 1 1 1 - 1 -
19 2 3 6 1 3 3
18 1 5 5 - 5 -
17 1 7 7 2 7 14
16 2 10 20 1 10 10
15 1 12,5 12,5 1 12,5 12,5
14 1 14,5 14,5 1 14,5 14,5
13 - 16 - 1 16 16
12 1 18 18 2 18 36
11 4 21,5 86 - 21,5 -
10 1 24 24 - 24 -
9 - -
8 1 25,5 25,5 1 25,5 25,5
7 2 27,5 55 - 27,5 -
6 2 29,5 59 - 29,5 -
5 2 32 64 1 32 32
4 - 35 - 3 35 105
3 2 38,5 77 2 38,5 77
2 3 43,5 130,5 3 43,5 130,5
1 - 49 - 5 49 245
0 - 53 - 3 53 159
R1=605,0 R2=880,0
Totalul rangurilor (R1+R2) trebuie să fie egal cu N(N+1)/2, în care N este egal cu
N1+N2. În exemplul nostru, R1+R2 este egal cu 54 x 55/2= 1485. Din tabel, dacă adunăm,
Pentru testul ipotezei nule se poate utiliza fie R1 fie R2; sunt de preferat datele
R1 - N1/2(N1+N2+1)
│z│=
√[N1N2/12 (N1+N2+1)]
78
care este variabila normală redusă. (Când utilizăm R2 la numărător apare N2/2.)
Pentru valoarea lui z găsită de noi vom afla p < .02. Se poate conchide că şansele
ipotezei nule de a se verifica sunt destul de mici (2%) Aşadar notele obţinute la clasa
metodei prezentate impune restricţia ca numărul rangurilor egale la diferite note să nu fie prea
mare.
La proba medianei această restricţie nu există. În consecinţă vom alege între proba
Întotdeauna testul U este preferat; când însă atribuirea rangurilor duce la prea multe
79
Curs 14 Proba semnelor
În cazul acesta raţionăm asupra diferentelor d, obţinute între valorile perechi. Dacă
distribuţia acestor diferenţe este normală sau aproape normală, se aplică testul t; dacă nu este
putem însă preciza sensul modificărilor survenite în urma măsurilor adoptate. Cu alte cuvinte,
putem stabili la la câţi elevi s-au înregistrat efecte pozitive (îmbunătaţire, progrese), la câţi
este vorba de efecte nule (rămâneri pe loc) si la câţi s-au constatat efecte negative (regrese).
întreprinsă, ci arătăm numai sensul lor, întocmind apoi balanţa „plusurilor” şi „minusurilor”,
şi în acest caz utilizăm proba semnelor, dacă experienţa cuprinde bineînteles acelaşi colectiv
a) când N<25
b) când N>25.
Ipoteza nulă este aceeaşi în ambele situaţii. Dacă notam cu x rezultatele iniţiale
(pretest) şi cu x’ cele finale (posttest) obţinute de acelaşi subiect, diferenţele x’-x pot fi
cadrul ipotezei nule (H0), că şansele sunt egale de a avea diferenţe pozitive, respectiv
negative. Cu alte cuvinte, potrivit ipotezei nule proporţia „plusurilor” este sensibil egală cu
80
proporţia „minusurilor”. În practică, proporţia lor diferă; întrebarea este dacă diferenţa este
indică numărul de + sau de – corespunzător pragului de semnificaţie de .05 sau .01. (vezi
riscul de a o elimina decât de la un anumit număr critic de semne + sau – din grupa
experimentală, număr a cărui apariţie prin simplă întâmplare corespunde unei probabilităţi
reduse, inferioare unui prag ales de noi (de obicei .05 şi .01). Tabelul cuprinde valorile critice
ale lui s pentru proba semnelor, s fiind numărul de semne mai puţin frecvente. (vezi tabelul
pagina 36)
Exemplu:
12 subiecţi sunt invitaţi să aleagă între două obiecte sau două activitati A şi B. Se
Se pune întrebarea: ipoteza este verificată sau nu? Preferinţele sunt următoarele:
Subiecţi 1 2 3 4 5 6 7 8 9 10 11 12
Preferinţe A A B A 0 A A 0 A A A A
După cum se vede, subiecţii 5 şi 8 nu s-au puut decide (situaţiile de indecizie fiind
marcate cu 0).
81
A<B A>B
(preferă B) A=B (preferă A)
Semnul - Semnul +
1 2 9
Având un semn – si nouă semne + se vede imediat că semnele mai puţin frecvente
sunt semnele –. Să urmărim dacă acestea depăşesc valoarea critică. Ne referim la tabelul cu
N p .05 .01
10 1 0
În consecinţă, ne putem asuma riscul de a afirma că A este preferat lui B în chip semnificativ.
Riscul de a fi contrazişi este de 5% ceea ce, practic, este foarte mic. Deosebirea în preferinţe
N p .05 .01
6-7 0 0
8 0 0
9-10-11 1 0
12-13-14 2 1
15-16 3 2
17 4 2
18-19 4 3
20 5 3
21-22 5 4
82
23 6 4
24 6 5
25 7 5
26-27 7 6
28 8 6
29 8 7
30-31 9 7
b) Când N>25
Deci:
Semnul - 0 +
4 5 23
- + T
4 23 27
Semnele mai puţin frecvente sunt semnele –. Consultăm apoi tabelul valorilor critice
N p .05 .01
27 7 6
83
Problema se poate rezolva şi utilizând variabila normală redusă (al doilea mod de
rezolvare) în care
s-N/2
z=
½ √N
În formulă s indică numărul de semne de un anumit fel (+ sau –), iar N indică totalul
semnelor reţinute.
(s ±0,5) - N/2
z=
½ √N
Dacă s indică numarul de semne mai frecvente, se scade 0,5 iar dacă indică semnele
mai puţin frecvente se adaugă 0,5. Prin urmare, daca s > N/2 se scade 0,5, dacă s < N/2 se
adaugă 0,5.
(4 +0,5) – 27/2 -9
z= = = - 3,46
½ √27 2,6
sau:
Întrucât valoarea găsită este mai mare decât 2,58 care este valoarea lui z
corespunzătoare la pragul lui p < .01 ne asumăm riscul că ipoteza nulă este infirmată.
PROBLEMA 1
84
Probele de control prin care s-a încheiat o experienţă didactică la două grupe
tabel cu 4 casuţe.
Rezultate:
PROBLEMA 2
încheierea experienţei au fost evaluate pe baza unui punctaj riguros de la 0 la 15, analog celui
aplicat la Olimpiadă.
Clasa A: 14, 8, 9, 11, 2, 9, 11, 15, 9, 7, 5, 11, 13, 6, 9, 10, 4, 7, 12, 6, 14, 11, 13.
Să se verifice dacă metoda încercată la clasa A a dus la rezultate sensibil mai bune
sau nu.
85
Indicaţie: după ordonarea datelor se aplică testul U, deoarece amplitudinea variaţiei
PROBLEMA 3
Fie o grupă G formată din 16 şcolari. S-a înregistrat timpul necesar pentru
Rezultatele apar înscrise în cele 2 coloane de cifre (I şi II). Elevii sunt notaţi de la A
la R.
Subiecţi I II
A 26 18
B 22 17
C 21 18
D 25 25
E 20 22
F 23 12
G 24 17
H 22 16
I 19 19
K 23 13
L 19 16
M 21 17
N 23 21
O 20 10
P 18 11
R 24 18
Evident, timpul de lucru scade. Se pune întrebarea dacă perioada de instruire a avut
86
ANEXA 1. Coeficientul de corelaţie biserial şi triserial
p p p
pq_ √pq_ y_ pq_ √pq_ y_ pq_ √pq_ y_
sau sau sau
y y p y y p y y p
q q q
0,350 0,6142 1,288 1,0583 0,401 0,6213 1,268 0,9644 0,451 0,6254 ,257 0,8779
0,351 0,6144 1,287 1,0564 0,402 0,6214 1,267 0,9623 0,452 0,6254 ,257 0,8762
0,352 0,6145 1,287 1,0544 0,403 0,6215 1,267 0,9605 0,453 0,6255 ,256 0,8746
0,353 0,6147 1,286 1,0525 0,404 0,6216 1,267 0,9587 0,454 0,6255 ,256 0,8729
0,354 0,6149 1,286 1,0506 0,405 0,6218 1,267 0,9570 0,455 0,6256 ,256 0,8712
0,355 0,6151 1,285 1,0487 0,406 0,6219 1,266 0,9552 0,456 0,6256 ,256 0,8695
0,356 0,6152 1,285 1,0468 0,407 0,6220 1,266 0,9534 0,457 0,6257 ,256 0,8679
0,357 0,6154 1,284 1,0449 0,408 0,6221 1,266 0,9517 0,458 0,6257 1,256 0,8662
0,358 0,6155 1,284 1,0430 0,409 0,6222 1,265 0,9499 0,459 0,6258 1,256 0,8646
0,359 0,6157 1,283 1,0411 0,410 0,6223 1,265 0,9482 0,460 0,6258 1,256 0,8629
0,360 0,6158 1.283 1,0392 0,411 0,6224 1,265 0,9464 0,461 0,6258 1,256 0,8612
0,361 0,6160 1,283 1,0373 0,412 0,6225 1,265 0,9446 0,462 0,6259 1,255 0,8596
0,362 0,6162 1,282 1 .0354 0,413 0,6225 1,264 0,9429 0,463 0,6259 1,255 0,8579
0,363 0,6163 1,282 1,0336 0,414 0,6226 1,264 0,9411 0,464 0,6260 1,255 0,8563
0,364 0,6165 1,281 1,0317 0,415 0,6227 1,264 0,9394 0,465 0,6260 1,255 0,8546
0,365 0,6166 1,281 1,0289 0,416 0,6228 1,264 0,9376 0,466 0,6260 1,255 0,8530
0,366 0,6168 1,280 1,0279 0,417 0,6229 1,263 0,9359 0,467 0,6261 1,255 0,8513
0,367 0,6169 1,280 1,0261 0,418 0,6230 1,263 0,9342 0,468 0,6261 1,255 0,8497
0,368 0,6171 1,280 1,0242 0,419 0,6231 1,263 0,9324 0,469 0,6261 1,255 0,8480
0,369 0,6172 1,279 1,0223 0,420 0,6233 1,263 0,9307 0,470 0,6262 1,255 0,8464
0,370 0,6174 1,279 1,0205 0,421 0,6233 1,262 0,9290 0,471 0,6262 1,255 0,8448
0,371 0,6175 1,278 1,0186 0,422 0,6234 1,262 0,9272 0,472 0,6262 1,254 0,8431
0,372 0.6177 1,278 1,0167 0,423 0,6234 1,262 0,9255 0,473 0,6263 1,254 0,8415
0,373 0,6178 1,278 1,0149 0,424 0,6235 1,262 0,9238 0,474 0,6263 1,254 0,8399
0,374 0,6179 1,277 1,0130 0,425 0,6236 1,261 0,9221 0,475 0,6263 1,254 0,8382
0,375 0,6181 1,277 1,0112 0,426 0,6237 1,261 0,9203 0,476 0,6263 1,254 0,8366
0,376 0,6182 1,276 1,0093 0,427 0,6238 1,261 0,9186 0,477 0,6264 1,254 0,8350
0,377 0,6184 1,276 1,0075 0,428 0,6239 1,261 0,9169 0,478 0,6264 1,254 0,8333
0,378 0,6185 1,276 1,0057 0,429 0,6239 1,261 0,9152 0,479 0,6264 1,254 0,8317
0,379 0,6186 1,275 1,0038 0,430 0,6240 1,260 0,9134 0,480 0,6264 1,254 0,8301
0,380 0,6188 1,275 1,0020 0,431 0,6241 1,260 0,9117 0,481 0,6265 1,254 0,8285
0,381 0,6189 1,274 1,0002 0,432 0,6242 1,260 0,9100 0,482 0,6265 1,254 0,8268
0,382 0,6190 1,274 0,9983 0,433 0,6242 1,260 0,9083 0,483 0,6265 1,254 0,8252
0,383 0,6192 1,274 0,9965 0,43" 0,6243 1,260 0,9066 0,484 0,6265 1,254 0,8236
0,384 0,6193 1,273 0,9947 0,435 0,6244 1,259 0,9049 0,485 0,6265 1,254 0,8220
0,385 0,6194 1,273 0,9929 0,436 0,6244 1,259 0,9032 0,486 0,6266 1,254 0,8204
0,386 0,6196 1,273 0,9910 0,437 0,6245 1,259 0,9015 0,487 ^6266 1,254 0,8188
0,387 0,6197 1,272 0,9892 0,438 0,6246 1,259 0,8998 0,488 0,6266 1,254 0,8171
0,388 0,6198 1,272 0,9874 0,439 0,6246 1,259 0,8981 0,489 0,6266 1,253 0,8155
0,389 0,6199 1,272 0,9856 0,440 0,6247 1,259 0,8964 0,490 0,6266 1,253 0,8139
0,390 0,6200 1,271 0,9838 0,441 0,6248 1,258 0,8947 0,410 0,6266 1,253 0,8123
0,391 0,6202 1,271 0,9820 0,442 0,6248 1,258 0,8930 0,492 0,6266 1,253 0,8107
0,392 0,6203 1,271 0,9802 0,443 0,6249 1,258 0,8913 0,493 0,6266 1,253 0,8091
0,393 0,6204 1,270 0,9784 0,444 0,6250 1,258 0,8896 0,494 0,6266 1,253 0,8075
0,394 0,6205 1,270 0,9766 0,445 0,6250 1,258 0,8880 0,495 0,6266 1,253 0,8059
0,395 0,6206 1,270 0,9748 0,446 0,6251 1,258 0,8863 0,496 0,6266 1,253. 0,8043
0,396 0,6208 1,269 0,9730 0,447 0,6251 1,257 0,8846 0,497 0,6266 1,253 0,8027
0,397 0,6209 1,269 0,9712 0,448 0,6252 1,257 0,8829 0,498 0,6267 1,253 0,8011
0,398 0,6210 1,269 0,9694 0,449 0,6253 1,257 0,8813 0,499 0,6267 1,253 0,7995
0,399 0,6211 1,268 0,9676 0,450 0,6253 1,257 0,8796 0,500 0,6267 1,253 0,7979
87
0,400 0,6212 1,268 0,9659
88
89