Sunteți pe pagina 1din 89

Universitatea Babeş-Bolyai Cluj-Napoca

Centrul de Formare Continuă, Învăţământ la Distanţă şi Frecvenţă Redusă

FACULTATEA DE PSIHOLOGIE ŞI ŞTIINŢE ALE EDUCAŢIEI


SPECIALIZAREA PSIHOPEDAGOGIE SPECIALĂ

Suport de curs

METODOLOGIA CERCETĂRII
PSIHOPEDAGOGICE

Prof. univ. dr. Adrian Roşan

Cluj-Napoca, 2017
2
Metodologia cercetării psihopedagogice
I. Informatii generale: Date de identificare a cursului

Date de contact ale titularului de curs Date de identificare curs si contact tutori
Nume : Conf.univ.dr. Adrian Roşan Numele cursului: Metodologia cercetării
psihopedagogice
Birou: Str. Sindicatelor nr.7, camera 23 Codul cursului: PLR2303
Telefon: +40-264-598.814 int.6100 Anul II, semestrul 3.
Fax: +40-264-598.814 Tipul cursului: obligatoriu
E-mail: a_roşan@yahoo.com Pagina web a cursului:
Consultaţii: Tutore: lector dr. Adrian Roşan
marti 12-14 Adresa email: a_roşan @yahoo.com

1.2. Condiţionări şi cunoştinţe prerechizite


Nu există condiţionări pentru înscrierea la acest curs. Este recomandată parcurgerea
temelor din cadrul disciplinei Metodologia psihopedagogică şi analiza datelor. În totalitatea
lor, aceste cunoştinţe prerechizite vor fi utile pentru achizitionarea cunoştintelor şi pentru
elaborarea lucrărilor de evaluare ce încheie fiecare modul, respectiv în promovarea
examenului de evaluare finală.
1.3. Descrierea cursului
Obiectivele cursului şi seminarului

a) Obiective
La finalul cursului studenţii vor dobândi cunoştinţe privind :
 Noţiuni fundamentale ale statisticii psihologice şi psihopedagogice (măsurare,
variabile statistice, indicatori statistici)
 Raţionamentul testării ipotezelor statistice (teorema limitei centrale, ipoteze statistice,
decizia statistică, erori statistice, mărimea efectului şi puterea testelor )
 Teste statistice de semnificaţie pentru relaţia dintre variabile (testul z pentru un
eşantion, testele t, testul de corelaţie, analiza de varianţă unifactorială, teste
neparametrice echivalente;
 Analiza distribuţiilor statistice
 Ilustrarea grafica a distributiilor statistice
 Analiza semnificatiei relatiilor dintre variabilele unei cercetari psihopedagogice bazate
pe date statistice
 Utilizarea indicatorilor statistici (tendinta centrala, imprastiere, forma)
 Aplicarea procedurilor statistice pentru testarea semnificatiei relaţiei dintre variabile
 Interpretarea rezultatelor testelor statistice de semnificatie

3
b) Conţinut

 Ordonarea şi gruparea datelor


 Prezentarea datelor sub formă de tabele
 Tipuri de distribuţii
 Măsuri ale tendinţei centrale
 Indicatori ai împrăştierii datelor (amplitudine, abatere standard, dispersie,
coeficient de variabilitate)
 Corelaţia
 Corelaţia rangurilor
 Tehnici parametrice t si z
Semnificaţia diferenţei dintre frecvenţe. Criteriul χ
2

 Coeficientul de corelaţie biserial (r bis)
 Coeficientul de corelaţie triserial
 Proba medianei
 Testul U
 Testul semnelor

1.3. Organizarea temelor în cadrul cursului


Cursul este structurat pe module de învăţare, existând 5 module în cadrul cărora sunt abordate
diferite teme care prezintă informaţii privind:
CURS I. Ordonarea şi gruparea datelor

Concepte cheie: şir de date, ordonare, grupare


Seminar: Observaţia, Experimentul Grile de observare sistematică
Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Iasi: Editura Polirom.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Cluj Napoca: Editura Sincron.
Capitolul 3

CURS II. Prezentarea datelor sub formă de tabele

Concepte cheie: tabele, diagrame, histograme


Seminar: Analiza unor cercetări psihopedagogice
Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Cluj Napoca: Editura Sincron.
Capitolele 3,4

CURS III. Tipuri de distribuţii

4
Concepte cheie: distribuţie, distribuţie simetrică, distribuţie asimetrică
Seminar: Analiza distribuţiei
Bibliografie:

Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Iasi: Editura Polirom.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Cluj Napoca: Editura Sincron.
Capitolele 3,4,5,9,11 si 14
Lungu, Ovidiu (2001). Ghid introductiv pentru SPSS 10.0. Iasi: Seria Psihologie
Experimentala si Aplicata.
http://statisticasociala.tripod

CURS IV. Măsuri ale tendinţei centrale

Concepte cheie: tendinţa centrală, media, mediana, modul


Seminar: Aplicaţii SPSS- media, mediana, modul
Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 1-29
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 40-47

CURS V. Indicatori ai împrăştierii datelor (amplitudine, abatere standard, dispersie,


coeficient de variabilitate)

Concepte cheie: amplitudine, abatere standard, dispersie, coeficient de variabilitate

Seminar : Coeficientul de variabilitate

Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 47- 60

CURS VI. Corelaţia

Concepte cheie: corelaţie, variabilă


Seminar: Aplicaţii SPSS-corelaţia Spearman, Pearson
Bibliografie:

5
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 33-79
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 61-82
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod

CURS VII. Corelaţia rangurilor

Concepte cheie: rang, corelaţie, Spearman


Seminar: Aplicaţii SPSS- testul t
Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 33-79
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 258-272
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod

CURS VIII. Tehnici de comparaţie t şi z

Concepte cheie: frecvenţe, variabile nominale, testul t, testul z

Seminar: Aplicaţii SPSS- probleme de comparaţie


Bibliografie:
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 83-99
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 273-282

CURS IX. Semnificaţia diferenţei dintre frecvenţe .Criteriul Chi-Square

Concepte cheie: Testul Chi-Square, Testul T


Seminar: Semnificaţia diferenţei dintre două mediii în cazul eşantioanelor perechi şi
eşantioanelor independente
Bibliografie:

6
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 144 -152
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod

CURS X. Coeficientul de corelaţie biserial (r bis)


Concepte cheie: Analiza de varianţă
Seminar: Analiza de varianţă- aplicaţii SPSS
Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca

CURS XI. Coeficientul de corelaţie triserial

Concepte cheie: studiu corelaţional, procedeu analitic de cercetare a corelaţiei


Seminar: Corelaţia Pearson - aplicaţii SPSS
Bibliografie:

Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321

CURS XII. Metode neparametrice. Proba medianei


Concepte cheie: metode neparametrice, mediana
Seminar: Aplicaţii SPSS- Proba medianei

Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.

7
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 285-384

CURS XIII. Testul U

Concepte cheie: ranguri, suma rangurilor, eşantioane independente


Seminar: Testul sumei rangurilor (Wilcoxon), Testul U, Testul Kruskal-Wallis

Bibliografie:
Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag. 125-133
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 304-321

CURS XIV – Testul semnelor


Concepte cheie: eşantioane perechi, ranguri,
Seminar: Testul semnului, Testul Friedmann
Bibliografie:

Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca, pag 134-142
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu, pag. 314-321

Nivelul de înţelegere şi utilitatea informatiilor prezentate în fiecare modul vor fi


optimizate, dacă în timpul parcurgerii suportului de curs, vor fi consultate sursele
bibliografice recomandate. De altfel, rezolvarea tuturor lucrărilor de verificare impune, cel
puţin, parcurgerea referinţelor obligatorii, menţionate la finele fiecărui modul. În situaţia în
care materialele bibliografice nu vor putea fi accesate, se recomandă contactarea tutorilor
disciplinei.

8
1.4. Formatul şi tipul activităţilor implicate de curs
Suportul de curs este structurat pe module, fiecare modul abordând mai multe teme.
Parcurgerea acestora va presupune muncă individuală, dar şi întâlniri faţă în faţă (activităţi
asistate şi consultaţii). Consultaţiile, inclusiv prin e-mail sau accesarea platfomri ID, trimis
tutorilor sau responsabilului de curs, pentru care prezenţa este facultativă, reprezintă un sprijin
direct acordat din partea titularului si a tutorilor. Pe durata acestora vom recurge la prezentări
ale informatiilor aferente fiecarui modul dar mai cu seama vor fi oferite, folosind mijloace
auditive şi vizuale, explicaţii alternative, răspunsuri directe la întrebările pe care ni le veţi
adresa. În ceea ce priveşte activitatea individuală, aceasta o veţi gestiona dumneavoastra si se
va concretiza in parcurgerea tuturor materilelor bibliografice obligatorii, rezolvarea lucrarilor
de verificare si a proiectului de semestru. Reperele de timp si implicit perioadele de rezolvare
ale fiecărei activităţi (lucrări de verificare, proiect etc) sunt monitorizate prin intermediul
calendarului disciplinei. Modalitatea de notare şi, respectiv, ponderea acestor activităţi
obligatorii, în nota finală sunt precizate în secţiunea politica de evaluare şi notare precum şi în
cadrul fiecărui modul.Pe scurt, având în vedere particularităţile învăţământului la distanţă dar
şi reglementările interne ale CFCID al UBB parcurgerea şi promovarea acestei discipline
presupune antrenarea studenţilor în următoarele tipuri de activităţi:
a. consultaţii – pe parcursul semestrului vor fi organizate două întâlniri de consultaţii faţă în
faţă; prezenţa la aceste întâlniri este facultativă;
b. realizarea unui proiect de semestru cu o temă şi un set de sarcini anunţate cu cel puţin 30
de zile înaintea datei de depunere a acesteia.
c. forumul de discuţii – acesta va fi monitorizat de echipa de tutori şi supervizat de titularul
disciplinei.
1.5. Materiale bibliografice obligatorii
În suportul de curs, la finele fiecarui modul sunt precizate atât referinţele biblografice
obligatorii, cât şi cele facultative.
Bibliografie obligatorie

Rotariu, Traian, Badescu Gabriel, Culic, Irina, Mezei, Elemer si Muresan, Cornelia (1999).
Metode statistice aplicate în stiintele sociale. Editura Polirom, Iasi.
Radu, Ioan, Miclea, Mircea, Albu, Monica, Nemes, Sofia, Moldovan, Olga, Szamoskozi,
Stefan (1993). Metodologie psihologica si analiza datelor. Editura Sincron, Cluj-Napoca,
Capitolele 3,4,5,9,11 si 14
Pah, Iulian (2004). Introducere în SPSS, Editura Eikon, Cluj-Napoca
Clocotici, Valentin, Stan, Aurel (2000). Statistica aplicata în psihologie, Editura Polirom, Iasi
Marginean, Ioan (2000). Proiectarea cercetarii sociologice, Editura Polirom, Iasi

9
Luduşan, Nicolae, Voiculescu Florea (1997). Măsurarea şi analiza staistică în ştiinţele
educaţiei, Editura Imago, Sibiu
Sava, Florin (2000). Caiet de seminar pentru statistica sociala, Tipografia Universitatii de
Vest din Timisoara.
Publication Manual of the APA (2005)
Linkuri utile în aprofundarea conţinutului cursului:
http://it.stlawu.edu
http://davidmlane.com
http://faculty.chass.ncsu.edu
http://statisticasociala.tripod

Notă : toate materialele bibliografice pot fi găsite la Biblioteca Facultăţii de Psihologie şi


Ştiinţele Educaţiei şi la biblioteca catedrei de Psihopedagogie Specială, str. Sindicatelor nr. 7,
cam. 25

1.6. Materiale şi instrumente necesare pentru curs


Optimizarea secvenţelor de formare reclamă accesul studentilor la următoarele resurse:
- retroproiector
- folii retroproiector
- laptop
-computere
- videoproiector
- materiale xeroxate pentru activităţi seminar
-programul SPSS-8.0

1.7. Calendar al cursului


Pe parcursul semestrului V, în care se studiaza disciplina de faţă, sunt programate întâlniri
faţă în faţă (consultaţii) cu toţi studenţii; ele sunt destinate soluţionării, nemediate, a oricăror
nelămuriri privind conţinutul sau a celor privind sarcinile individuale. Pentru prima întâlnire
se recomandă lectura atentă a primelor trei module; la cea de a doua se discută ultimele trei
module şi se realizează o secvenţă recapitulativă pentru pregătirea examenului final. De
asemenea în cadrul celor două întâlniri, studenţii au posibilitatea de solicita titularului şi/sau
tutorilor sprijin pentru rezolvarea anumitor lucrări de verificare sau a proiectului de semestru,
în cazul în care prezintă dificultăţi. Pentru a valorifica maximal timpul alocat celor două
întâlniri studenţii sunt atenţionaţi asupra necesităţii suplimentării lecturii din suportul de curs
cu parcurgerea obligatorie a cel puţin a uneia dintre sursele bibliografice de referinţă. Datele
celor doua întâlniri sunt precizate în calendarul sintetic al disciplinei. În acelaşi calendar se
regăsesc şi termenele la care trebuie transmise/depuse lucrările de verificare aferente fiecărui
modul precum şi dat limita pentru depunerea proiectului de semestru.

10
1.8. Politica de evaluare şi notare
Modalitatea de evaluare (stabilirea notei finale de semestru):
- răspunsurile la examen 40% (4p)
- testarea periodică prin 2 test paper 20% (1p)
- evaluarea prin lucrări de verificare 40% (4p)

 Evaluarea finală se compune din însumarea evaluărilor la testările periodice (de regulă
două pe parcursul unui semestru), la activităţile de seminar şi la examen.
 Testările periodice sunt evaluate cu 2 puncte în total si constau in liste de întrebări
deschise, care solicită un răspuns scurt şi concis.
 Activitatea la lucrările de verificare este evaluată cu 4 puncte si se bazează pe
următoarele criterii: corectitudinea lucrărilor de verificare, aplicaţii SPSS şi evaluari
periodice.
 Examenul de semestru se cotează cu 4 puncte, este scris şi se bazează pe o listă de
întrebări deschise (în jur de 20), care solicită răspunsuri scurte şi precise.
 Studenţii primesc după examen lista răspunsurilor corecte şi astfel pot să evalueze
calitatea propriilor răspunsuri. Numărul de răspunsuri corecte este convertit într-un punctaj
(maxim 4 p).
1.9. Elemente de deontologie academică
Se vor avea în vedere următoarele detalii de natură organizatorică.
Prezenţa la ore : nu se pune prezenţa nici la orele de curs, nici la cele de seminar. Cei care
absentează nu vor putea acumula punctele ce pot fi obţinute în urma evaluării pe parcurs.
Modalităţi de recuperare: în cazul în care unul din cursuri nu va fi ţinut, se va recupera la o
dată ulterioară, fixată în acord cu studenţii.
Studenţii care vor fi prinşi copiind la examen vor fi scoşi afară din examen şi vor fi notaţi cu
unu.
Studenţii au dreptul să depună contestaţii dacă consideră că au fost nedreptăţiţi la examen.
Contestaţiile pot fi depuse în maximum 48 de ore de la afişarea notelor la secretariatul
facultăţii. Nota finală la disciplina respectivă este cea obţinută în urma contestaţiei.

Metode de predare-învăţare: prelegerea, învăţarea prin cooperare, exreciţiul, aplicaţii SPSS

1.10. Studenţi cu dizabilităţi:

11
Titularul cursului si echipa de tutori îşi exprima disponibilitatea, în limita constrângerilor
tehnice si de timp, de a adapta conţinutul şi metodelor de transmitere a informaţiilor precum şi
modalităţile de evaluare (examen oral, examen on line etc) în funcţie de tipul dizabilităţii
cursantului. Altfel spus, avem în vedere, ca o prioritate, facilitarea accesului egal al tuturor
cursanţilor la activităţile didactice si de evaluare.

1.11. Strategii de studiu recomandate:


Date fiind caracteristicile învăţământului la distanţă, se recomandă studenţilor o planificare
riguroasă a secvenţelor de studiu individual, coroborată cu secvenţe de dialog, mediate de
reţeaua net, cu tutorii si respectiv titularul de disciplina. Lectura fiecărui modul şi rezolvarea
la timp a lucrărilor de evaluare garantează nivele înalte de înţelegere a conţinutului tematic şi
totodată sporesc şansele promovării cu succes a acestei discipline.

12
Modul 1
Curs 1

1. Ordonarea şi gruparea datelor.


Datele obţinute în urma aplicării diferitelor metode în cercetarea psihopedagogică se
prezintă în cele mai multe cazuri în formă cantitativă, numerică, care se pretează la o tratare
statistică.
Rezultatele obţinute în urma aplicării diferitelor metode în cercetarea psihopedagogică
pot fi exprimate cantitativ pe baza operaţiei de numărare. Aşa de exemplu, putem număra şi
stabili numărul răspunsurilor exacte, numărul erorilor, numărul repetitilor necesare pentru
reţinerea unui material, numărul răspunsurilor afirmative sau negative etc.
Exprimate numeric, rezultatele obţinute, apar ca valori diferite ale unei mărimi. În
termeni mai generali putem vorbi de mărimi care iau anumite valori, mai precis de variabile
pe care le putem nota cu x, y.
Cercetarea psihopedagogică se efectuează, în general, pe grupe de subiecţi, cuprinzând
în aria investigaţiei colective sau clase întregi de elevi. Alteori, în cercetarea pedagogică se
practică un grup de măsurări asupra aceleaşi persoane, efectuând un număr de înregistrări
succesive.
Rezultatele obţinute se prezintă sub forma unui volum de date, adeseori disparate, şi
deci cuprinderea şi examinarea acestora este greu de realizat. În acest context se impune
ordonarea şi gruparea datelor, prezentarea lor într-o formă condensată.
De exemplu, rezultatele obţinute prin numărarea răspunsurilor corecte date de fiecare
din cei 74 de subiecţi examinaţi cu un test de cunoştinţe au fost următoarele:
36 48 50 61 45 60 52 46
51 37 58 71 53 67 59 63
48 52 49 52 58 32 62 43
53 54 38 55 57 44 56 42
45 53 60 54 54 55 66
48 45 57 39 40 65 41
53 49 56 61 56 62 40
46 46 44 50 51 48 57
52 55 59 64 41 58 43
47 51 47 49 50 42 44

13
Din examinarea imediată a acestor date nu rezultă nimic precis, întrucât diferitele
valori se înşiruiesc la întîmplare şi variază oarecum dezordonat.
Dacă recurgem la analiza datelor putem constata că anumite valori se repetă şi că
seria de date cuprinde valori între 32 şi 71; deci există cel mult 40 de valori (rezultate) diferite
pentru că 71-32+1=40.
Dacă încercăm să ordonăm datele obţinute am putea trece într-o coloană valorile
diferite în ordine crescândă, iar în dreptul fiecărei valori să notăm prin bare transversale de
câte ori se repetă fiecare valoare în şirul iniţial de date. Numărâd barele trasate determinăm
frecvenţa(f) a fiecărei valori. Un astfel de procedeu nu este indicat în exemplu de faţă, întrucât
el se aplică atunci când distanţa dintre valorile extreme -adică întinderea variaţiei- este mică.
În exemplul nostru întrucât întinderea (amplitudinea) variaţiei este destul de mare (între 32 şi
71) se impune gruparea valorilor în clase care să cuprindă mai multe valori.
Procedeul de grupare a datelor în clase presupune următorii paşi:
1. Căutăm mai întâi valorile extreme ale şirului de date pe care le marcăm cu câte un
asterisc; efectuăm apoi diferenţa xmax - xmin la care adăugăm 1 şi obţinem câte valori diferite sunt
posibile să fie cuprinse în acest interval (71-32+1=40).
2. Stabilim numărul de clase, precizând intervalul de grupare (i) adică câte valori vor fi
cuprinse în fiecare clasă. În mod practic numărul claselor nu trebuie să depăşească 20, iar când
întinderea variaţiei nu este prea mare, numărul claselor poate să coboare sub 10. La alegerea
intervalului de grupare trebuie avut în vedere faptul că, dacă, se aleg intervale prea mici,
gruparea datelor scoate în evidenţă aspectele de amănunt, care pun în umbră tendinţa de
ansamblu a fenomenului studiat. Iar gruparea bazată pe intervale de grupare prea mari atenuează
iregularităţile distribuţiei rezultatelor şi poate duce la estomparea manifestării specifice a
fenomenului studiat. Pentru a alege un interval optim vom ţine seama de aspectele oferite de
analiza calitativă a modului de manifestare a fenomenului studiat.
În exemplu de mai sus ne putem gândi la 10 clase. Pentru a găsi intervalul de grupe
împărţim valoarea întinderii variaţiei la 10 (40:10=4) şi vom afla că intervalul de grupare va fi
egal cu 4, astfel că vom grupa succesiv cîte 4 valori în fiecare clasă (32-35; 36-39 etc.) şi vom
obţine 10 clase deoarece 40:4=10 (vezi tabela numărul 1).
În cazul în care intervalul de grupare obţinut, pornind de la un număr de clase fixat are o
valoare zecimală, vom proceda la rotunjirea acestuia şi, în consecinţă, la lărgirea şirului de valori
cu câteva unităţi în sus sau în jos, având grijă să nu obţinem clase marginale care să aibă
frecvenţa zero.

14
3. În urma grupării datelor, presupunem că toate valorile care aparţin unei clase se
centrează în valoarea centrală (Xk) care se obţine prin adunarea extremelor fiecărui interval şi le
împărţim la doi (vezi tabela numărul 1).
4. Stabilim apoi câte valori (rezultate) din şirul iniţial de date se încadrează în fiecare
clasă, stabilind astfel frecvenţa (f) corespunzătoare fiecărui interval. Dacă însumăm apoi
frecvenţele stabilite pentru fiecare interval obţinem pe N (efectivul total de date sau de subiecţi).
TABEL NR. 1.
Gruparea datelor în clase şi stabilirea frecvenţei
Determinarea
x xk f
frecvenţei(f)
32-35 33,5 1
36-39 37,5 4
40-43 41,5 8
44-47 45,5 11
48-51 49,5 13
52-55 53,5 14
56-59 57,5 11
60-63 61,5 7
64-67 65,5 4
68-71 69,5 1
i=4 N=74

În tabela nr. 1 datele brute sunt grupate în două coloane: coloana valorilor lui x şi
coloana frecvenţelor (f), obţinând ceea ce se numeşte o distribuţie statistică sau o serie de
variaţie.

15
Curs 2
Prezentarea datelor sub formă de tabele

Rezultatele primare, după ce au fost grupate, pot fi prezentate în tabele care uşurează
desprinderea aspectelor esenţiale. Modul de realizare a tabelelor depinde de obiectivele
cercetării şi de aspectele care trebuie evidenţiate.
În cercetarea psihopedagogică adeseori se impune întocmirea de tabele comparative. În
cazul în care grupele studiate nu au efective egale se impune transcrierea în procente a
frecvenţelor absolute stabilite. Pentru transcrierea în procente procedeul este simplu. Efectivul
total al grupei(N) se consideră 100% şi se utilizează regula de trei simplă.
În exemplul anterior (Vezi tabela nr. 1) N=74, iar frecvenţele absolute sunt 1, 4, 8, 11, 13, 14,
11, 7, 4, 1 pe care le putem transcrie în procentele corespunzătoare astfel:

dacă 74 reprezintă 100%


atunci 1.............x
_______________________
1100
x  1,35%
74

daca 74 reprezintă 100%


atunci 4.............x
_______________________
4  100
x  5,40% ş.a.m.d
74

Totalizând procentele obţinute la un grup, trebuie să obţinem 100% sau o cifră foarte
apropiată.
Exprimarea procentuală este preferată în multe cercetări psihopedagogice întrucât
reuşita unor experienţe şcolare se apreciază adeseori după răspunsurile corecte înregistrate în
post-test. În aceste cazuri se determină procentul de exactitate.
Pentru ilustrare, să presupunem următorul exemplu:
Într-o cercetare în care s-a urmărit eficienţa unei noi metodologii în predarea fizicii
au fost cuprinse două clase cu efective diferite : clasa de experienţă cu un efectiv de 35 de

16
elevi şi clasa de control cu un efectiv de 41 de elevi. La încheierea experimentului la ambele
clase s-a dat o probă de control ce comportă 15 răspunsuri corecte.
Verificându-se lucrările de control s-au consemnat răspunsurile exacte, erorile şi
omisiunile.
Pentru a evidenţia eficienţa noii metodologii se calculează procentul de exactitate (E)
întrucât acesta ia în considerare atât răspunsurile exacte (Re), cât şi răspunsurile greşite şi
omisiunile
Procentul de exactitate:
Re
E  100
Rmax
O dată cunoscut procentul de exactitate (E), diferenţa până la 100% o constituie
răspunsurile greşite şi omisiunile.

În exemplul presupus, rezultatele au fost următoarele (vezi tabela nr. 2):

TABEL NR. 2.
Numărul răspunsurilor corecte obţinute de clasa de control şi de experienţă

Clasa Nr. de elevi Răspunsuri corecte

de experienţă 35 490

de control 41 492

Este evident că cifrele absolute (490, 492) nu pot fi comparabile, întrucât efectivele
celor două clase nu sunt identice. Se impune exprimarea procentuală, deci calculul procentului
de exactitate pentru fiecare clasă.Pentru a putea calcula procentul de exactitate avem nevoie de a
stabili numărul de răspunsuri maxim (Rmax) care se obţine prin înmulţirea efectivului fiecărei
clase cu numărul maxim de răspunsuri pe care îl putea da un elev (15 răspunsuri)
Deci, procentul de exactitate pentru cele două clase se calculează astfel:
Pentru clasa de experienta:
490 490
E 100   100  93,3%
35  15 525
Pentru clasa de control :

17
492 492
E  100  100  80%
41 15 615
Eficienţa noi metodologii aplicate se apreciază prin compararea procentului de
exactitate obţinut de clasa de experienţă cu cel al clasei de control.
Din prezentarea datelor sub formă de tabelă distingem că orice tabelă trebuie să aibă un
număr care se înscrie deasupra tabelei în partea dreaptă şi un titlu care redă în mod concis
conţinutul şi care se înscrie deasupra tabelei.
De asemenea, orice tabelă cuprinde coloane şi linii. Fiecare linie şi fiecare coloană va
avea un titlu care trebuie să fie o explicaţie concisă a datelor, care se înscrie în capul coloanei, iar
pentru linii în prima coloană din stânga.
Coloanele se pot subdivide în subcoloane.
Coloanele şi rândurile pot avea la sfârşit un total. Însumările pe coloane şi pe linii se
efectuează numai pentru date de acelaşi fel.

Curs 3
Tipuri de distribuţii

Prezentarea grafică a rezultatelor permite o examinare intuitivă a acestora şi înlesneşte


efectuarea de comparaţii prin suprapunerea mai multor curbe în cadrul aceleaşi figuri.
Având datele sistematizate în tabelă urmează să precizăm forma distribuţiei servindu-ne
de reprezentarea grafică.
Graficul de bază îl constituie histograma.
Pentru ilustrarea efectuării histogramei ne referim la datele din tabela nr 1.
Pe axa absciselor(x) marcăm 10 intervale contigue egale, întrucât avem10 clase pe care
le notăm în dreptul fiecărui interval (vezi fig.1).
Pe ordonată (y) marcăm 14 diviziuni corespunzătoare frecvenţei celei mai mari.
Pe fiecare din intervalele marcate pe abscisă construim dreptunghiuri cu înalţimea
proporţională frecvenţelor din distribuţie şi obţinem histograma. Dacă unim mijlocul bazelor
superioare prin segmente de dreaptă obţinem poligonul frecvenţelor. Prin punctele determinate
pentru trasarea liniei poligonale se poate figura şi o curbă care să treacă prin punctele respective
sau aproape de ele obţinând curba frecvenţelor sau curba distribuţiei (vezi fig.1)

18
Fig. 1. Histograma, poligonul şi curba frecvenţelor

Poligonul şi curba frecvenţelor indică forma distribuţiei studiate şi permit compararea


grafică a mai multor serii paralele trasate pe acelaşi grafic prin utilizarea de linii diferit trasate
sau colorate diferit.
Fiecare grafic se numerotează şi poartă un titlu notat sub figură (vezi fig.1).
Sub titlul graficului sau în spaţiul gol de la marginea figurii se înscrie legenda care
explică ce reprezintă semnele convenţionale utilizate în realizarea figurii.
Reprezentarea grafică a datelor rezultate din investigaţiile psihopedagogice ne poate
conduce la obţinerea unor distribuţii simetrice (normale) sau a unora asimetrice.
Distribuţiile simetrice se caracterizează prin aceea că valorile frecvenţelor situate de
o parte şi de alta a clasei cu frecvenţa cea mai mare sunt egale sau diferă foarte puţin între ele
(fig. 2).

19
Fig. 2. Distribuţie simetrică

În cazul în care nu se respectă simetria distribuirii frecvenţelor avem distribuţii


asimetrice (vezi fig. 3,4,5).

Fig. 3. Distribuţii asimetrice deplasate stânga sau dreapta

20
Fig. 4. Distribuţie în formă de i

Fig. 5. Distribuţie în formă de j

În cazuri particulare putem întâlni şi distribuţii în care frecvenţele sunt polarizate în


două grupe despărţite de clase cu frecvenţă mică. Este vorba de o distribuţie bimodală (fig. 6.)
care sugerează ipoteza existenţei a doi factori diferiţi sau două grupe diferite.

21
Fig. 6. Distribuţie bimodală
În cazul în care rezultatele obţinute sunt grupate doar în câteva categorii sau procente se folosesc
diagramele de comparaţie (fig.7) sau diagramele de structură (fig.8).

Fig. 7. Diagramă de structură

Fig. 8. Diagramă de comparaţie


Temă: rezultatele unei lucrări de control prin care s-a încheiat o experienţă au fost
exprimate în note. Datele obţinute au fost următoarele: 5, 7, 10, 4, 7, 7, 3, 9, 8, 6, 7, 8, 7, 4, 9, 10,
7, 5, 7, 6, 9, 6, 8, 6, 9, 8, 3, 7, 8, 5, 7, 6, 8, 7, 6, 8, 7, 6, (N= 38).
a) Să se efectueze ordonarea şi gruparea datelor.
b) Să se întocmească histograma şi poligonul frecvenţelor.

22
Modul II
Curs 4 Măsuri ale tendinţei centrale

Indicii prin care se determină în mod curent tendinţa centrala a rezultatelor sunt media,
mediana şi modulul.
Media pe care o notăm cu m, nu este altceva decât suma datelor numerice obţinute,
împărţită la numărul acestora.

Formula de definiţie a mediei este: m 


x , în care Σ înseamnă "sumă de", x
N
reprezintă valorile sau rezultatele individuale, iar N constituie efectivul grupei supusă
studiului.
Întrucât N ne este dat, urmează să stabilim procedee de calcul pentru Σx pe care o
notăm cu T (total).
În cazul în care volumul datelor este este mic pentru a-l calcula pe T facem o simplă
adunare. În cazul în care volumul datelor mare, iar datele sunt grupate putem utiliza doua
metode de calcul pentru determinarea lui T:
Prima metoda- presupune o distribuţie statistică ca cea din tabela nr. 3:
TABELA NR. 3.
Calcularea datelor necesare aflării mediei prin metoda I
x xk f f·xk
32-35 33,5 1 33,5
36-39 37,5 4 150,0
40-43 41,5 8 332,0
44-47 45,5 11 500,5
48-51 49,5 13 643,5
52-55 53,5 14 749,0
56-59 57,5 11 632,5
60-63 61,5 7 430,5
64-67 65,5 4 262,0
68-71 69,5 1 69,5
i=4 N=74 T=3803,0
Pentru calcularea lui T, pe lângă coloana valorilor lui x, xk şi f, vom adăuga coloana
cu produsele f·xk..Prin însumarea produselor înscrise în coloana f·xk obţinem valoarea lui T.

23
T
Ştiind că: m  , putem calcula media:
N
T 3803
m   51,39 .
N 74

Metoda a doua de calcul a mediei uşurează foarte mult calculele cu cifre mai mari,
deoarece presupune o operaţie de "codare" în care distingem o serie de paşi.
După ce am ordonat şi grupat datele alegem o medie de lucru pe care o notăm cu mo
care este de regulă valoarea de la mijlocul şirului de valori sau valoarea centrală a clasei centrale.
Când oscilăm între două valori apropiate, preferăm valoarea căreia îi corespunde frecvenţa cea
mai mare.
În exemplul ales mai sus, şi al cărui date sunt reluate în tabela 4, media de lucru (mo)
este 53,5, pe care o marcăm, incluzând-o într-un chenar (vezi tabela nr. 4).
TABEL NR. 4.
Calcularea datelor necesare aflării mediei prin metoda a II-a
x xk f u fu
32-35 33,5 1 -5 -5
36-39 37,5 4 -4 -16
40-43 41,5 8 -3 -24
44-47 45,5 11 -2 -22
48-51 49,5 13 -1 -13 (-80)
52-55 53,5 m0 14 0 0
56-59 57,5 11 1 11
60-63 61,5 7 2 14
64-67 65,5 4 3 12
68-71 69,5 1 4 4 (41)
i=4 N=74  fu=θ=(-80)+(41)= -39

În continuare adăugăm tabelului o nouă coloană pentru valorile codate pe care le notăm cu u.
Se trece de la variabila iniţală x la o nouă variabilă u gratie formulei de transformare:
x  m0
u . Practic, se înlocuiesc valorile iniţiale x cu abaterile acestora de la media de lucru (x-
i

24
m0) simplificate cu i(intervalul de grupare). Se poate verifica acest mod de a proceda în tabela nr.
xk  mo
4, în care este calculat pentru fiecare interval câtul
i
În continuare se lucrează cu valorile codate µ. Pentru diferenţiere vom nota cu mx
media valorilor iniţiale x şi cu mu media valorilor codate.
 fu
Vom determina mu pe baza formulei: mu  , pentru ca în final să revenim la
N
calculul mediei valorilor lui x pe baza formulei mx  m0  imu .
Pentru calculul Σfu pe care o notăm cu θ(teta) pentru a putea fi deosebită de T, vom
deschide o nouă coloană fu (vezi tabela 4) în care vom înscrie produsele fu , respectând regula
semnelor la înmulţire şi apoi vom efectua suma algebrică a produselor fu (vezi tabela 4).
În exemplu ales, mu va fi egală cu:
  39
mu    0,527, iar mx va fi egală cu
N 74
53,5+4(-0,527)=53,5-2,11=51,39
De notat este faptul că mu poate fi uneori un număr negativ, dacă θ este negativ. În
cazul acesta produsul i.mu va fi negativ şi în consecinţă îl vom scădea din mo pentru a afla
valoarea mediei mx.
Media evidenţiază tendinţa centrală a rezultatelor eşantionului studiat, făcând posibilă
compararea între grupe (eşantioane).

Mediana este un alt indice al tendinţei centrale, care se utilizează mai ales în cazul
distribuţiilor asimetrice.
Pentru a găsi valoarea medianei care se notează cu med.- trebuie, în cazuri mai simple,
să aranjăm toate datele în ordine crescândă sau descrescândă.
Mediana fiind valoarea care împarte şirul de valori în două grupe egale, ca număr, se
situează deci la mijlocul şirului de valori. Pentru a găsi care este valoarea medianei, trebuie să
calculăm mai întâi locul medianei sau rangul pe care îl ocupă mediana în şirul ordonat cu
N 1
ajutorul formulei: .
2
Când valorile constituie un număr fără soţ, mediana va corespunde determinantei din
mijloc.

25
De exemplu, în seria de valori: 6,6,7,8,8,9,9,9,9,10,11, locul medianei va fi:
N  1 11 1
  6 , iar valoarea va fi 9, întrucât aceasta este pe locul al şaselea în şirul ordonat.
2 2
Dacă valorile ordonate sunt în număr cu soţ de exemplu: 5,6, 6,7,8,9,9,10,10,11,
10  1
mediana se va situa pe locul  5.5 . Căutând în şirul de valori valoarea situată pe locul 5,5
2
vom constata că ea se găseşte între două valori consecutive 8 şi 9. În consecinţă, pentru a afla
89
valoarea medianei vom face media celor două valori şi deci mediana va fi egală cu  8.5
2

Modulul este valoarea care se repetă cel mai des într-un şir de rezultate, adică valoarea
cu frecvenţa cea mai mare.
De exemplu, în seria de rezultate 6,7,8,8,9,9,9,9,10,11, modulul este 9, întrucât este
valoarea cu frecvenţa cea mai mare.
Ca indice al tendinţei centrale, modulul este foarte aproximativ şi se ia în considerare
mai ales la o primă inspecţie a rezultatelor.
În cazul distribuţiilor simetrice modulul, mediana şi media coincid sau prezintă valori
foarte apropiate şi, deci, în acest caz, se recomandă calculul mediei pentru a exprima tendinţa
centrală.

Curs 5 Determinarea indicilor de dispersie sau variabilităţii faţă de tendinţa


centrală

Media (sau oricare altă măsură a tendinţei centrale) singură nu este adecvată şi nici
suficientă pentru a caracteriza un grup, o clasă, un eşantion, întrucât se impune pentru
formarea unei imagini corecte şi cunoaşterea modului cum se repartizează diferitele rezultate
în jurul valorii centrale pentru a evidenţia gradul de diferenţe individuale în interiorul
grupului. De exemplu, două distribuţii statistice (vezi fig. 9) pot avea aceeaşi medie, dar pot fi
foarte diferite sub aspectul variabilităţii, respectiv al omogenităţii. În acest context se pune
problema de a calcula indicatorii prin intermediul cărora se poate exprima variaţia datelor în jurul
mediei pentru a completa imaginea acesteia. Aceşti indicatori sunt: dispersia sau variaţia şi
abaterea standard, care ne dau informaţii asupra probabilităţii grupului studiat.

26
Fig. 9. Distribuţii statistice

27
Dispersia sau variaţia se notează cu σ sau cu s şi are ca formulă de definiţie:

 x  m 
2
σ =s =
2 2
,
N  1

în care (x-m) reprezintă abaterea fiecărei valori de la media calculată, iar N este efectivul grupei
de măsurători.

Abaterea standard sau abaterea tip se notează cu σ sau cu s şi nu este altceva decât
rădăcina patrată din valoarea dispersiei:

σ=s=  2

Deci pentru a afla abaterea standard trebuie să calculăm mai întâi dispersia. Indicile
de dispersie cel mai exact şi mai des utilizat este abaterea standard, întrucât are avantajul de a fi
exprimat în aceleaşi unităţi ca şi datele iniţiale şi permite să se analizeze mai corect gradul de
varibilitate al grupului studiat. Abaterea standard, întrucât nu cuprinde radicalul în expresia ei
algebrică se pretează mai uşor la calculele teoretice.
Dacă analizăm formula de definiţie a dispersiei constatăm că numai expresia de la
numărător, adică suma patratelor abaterilor de la medie ridică probleme de calcul.Pe scurt
această expresie este denumită suma patratelor.
Pentru determinarea sumei patratelor nu se utilizează expresia de definiţie Σ(x-m)2
,deoarece comportă calcule laborioase. Pentru uşurarea calculelor formula de definiţie este
transformată într-o formulă convenabilă de calcul şi deci:
 x2  T 2
Σ(x-m)2 = ,
N
în care notaţiile sunt deja cunoscute. Σx2 reprezintă totalul patratelor celor N rezultate din grupul
iniţial de date. Efectuând înlocuirile în cadrul formulei de definiţie a dispersiei aceasta devine
astfel:
T2
 x2 
2  N
N 1
Având datele grupate, pentru determinarea dispersiei ne vom referi din nou la cele două
metode utilizate pentru calculul mediei.

28
Prima metodă ilustrată la calculul mediei (vezi tabela 3), ne-a condus la determinarea
lui T prin însumarea produselor fx (fxk), ştiind că Σfx=T sau Σfxk=T, pe care urmează să-l
ridicăm la pătrat. Pentru a avea toate datele cerute de formula de calcul a dispersiei ne rămâne să
calculăm doar Σx2 sau Σx2k. Pentru aceasta la tabela care a condus la determinarea lui T mai
adăugăm o coloană fx2 sau fx2k în care vom înscrie produsele fx.x sau după caz fxk.xk.
Pentru ilustrare să urmărim tabela nr. 5.

TABEL NR. 5.
Calcularea dispersiei prin prima metodă.

x xk f f.xk f.xk.xk

32-35 33,5 1 33,5 1122,25

36-39 37,5 4 150,0 5625,00

40-43 41,5 8 332,0 13778,00

44-47 45,5 11 500,5 22772,75

48-51 49,5 13 643,5 31853,25

52-55 53,5 14 749,0 40071,50

56-59 57,5 11 632,5 36368,75

60-63 61,5 7 430,5 26465,75

64-67 65,5 4 262,0 17161,00

68-71 69,5 1 69,5 4830,25

i=4 N=74 T=3803 Σfxk2=200058,5

Însumând produsele înscrise în coloana fxk.xk vom obţine Σx2k sau după caz Σx2.
Acum avem toate datele cerute de formula de calcul a dispersiei şi deci:
 38032 
 200058,5  
 74 
 
2
 63,221
74  1
În continuare extragem rădăcina pătrată din  2 şi obţinem abaterea standard:

  63.221  7.95

29
Metoda aII-a simplifică destul de mult calculele datorită procesului de codare.
Utilizând această metodă ,pentru diferenţiere vom nota σx2 dispersia valorilor iniţiale x cu σu2
,dispersia valorilor codate care se determină pe baza formulei :
2
u2 
u2  N
N 1
Pentru a ajunge la dispersia valorilor lui x(σx2)vom înmulţi în final cu i2 şi deci,
2
u 
2

σx2 = i2.σu2 sau  X 2  i 2 N .


N 1
Reluând tabela de calcul întocmită pentru calcularea mediei (tabela 4), constatăm că în
tabelă avem deja calculată valoarea lui θ şi N şi ne rămâne să calculăm Σu2. Pentru aceasta mai
trebuie să adăugăm o nouă coloană fu.u în care vom înscrie produsele respective care prin
însumare ne dă Σu2. Pentru ilustrare să reluăm datele din tabela 4 şi să le înscriem în tabela nr. 6.
Temă: Fie distribuţia următoare:
x f
6-9 1
10-13 0
14-17 6 Să se calculeze media şi dispersia cu ajutorul celei de
18-21 8 a doua metode (a valorilor codate).
22-25 10
26-29 12
30-33 14
34-37 9
38-41 7
42-45 8
46-49 3
50-53 2

30
TABEL NR. 6.
Calcularea dispersiei prin metoda a II-a.

x xk f u f.u fu.u

32-35 33,5 1 -5 -5 25

36-39 37,5 4 -4 -16 64

40-43 41,5 8 -3 -24 72

44-47 45,5 11 -2 -22 44

48-51 49,5 13 -1 -13(-80) 13

52-55 53,5 14 0 0 0

56-59 57,5 11 1 11 11

60-63 61,5 7 2 14 28

64-67 65,5 4 3 12 36

68-71 69,5 1 4 4 (41) 16

i=4 N=74 θ= -39 Σu2=309

Având toate datele putem efectua înlocuirile necesare în formulă şi vom obţine valoarea
dispersiei:

 392 

4  309 
2

2     63,22 .
74
74  1
Pentru a obţine abaterea standard (σ) extragem rădăcina patrată deci:
  63,22  7.95
În încheiere trebuie să precizăm că valorile caracteristice studiate (m, med, σ) nu se
determină pentru orice distribuţie statistică. Dacă distribuţia rezultatelor este simetrică se
determină m, σ2 şi σ; dacă distribuţia este asimetrică se determină mediana. Iar în cazul
distribuţiilor particulare în formă de i sau j etc, este bine să ne mulţumim cu un grafic.

31
Modul III
Curs 6 Studiul corelaţiei

În cercetările psihopedagogice apare de multe ori necesitatea studierii relaţiilor care


există între două sau mai multe variabile.
Determinarea corelaţiei se efectuează luând în considerare de fiecare dată câte două
variabile. De exemplu dacă avem 3 variabile x, y şi z, vom calcula succesiv rxy; rxz; ryz.
În cercetările psihopedagogice rezultatele pot fi exprimate în date cantitative, sau sub
formă de ranguri sau poziţie într-o clasificare.
Cel mai frecvent se utilizează doi coeficienţii de corelaţie; coeficientul de corelaţie r
care se calculează pe baza rezultatelor cantitative individuale şi coeficientul de corelatie al
rangurilor ρ pentru rezultatele exprimate sub formă de ranguri.

Coeficientul de corelaţie r (Bravais Pearson) se determină utilizând următoarea formulă de


calcul:
TT1
 xy 
r N
 T  T 
2 2
  x 2     y 2  1 
 N  N 

Deci pentru determinarea valorii lui r trebuie să avem: x,y,x2,y2 şi xy şi în consecinţă


vom întocmi un tabel cu coloane pentru fiecare dintre acestea (vezi tabela 7). De exemplu:
S-au înregistrat în paralel notele obţinute de 10 elevi la o probă de gîndire logică şi
notele obţinute la matematică. Rezultatele sunt cele din tabela nr. 7.

32
TABEL NR. 7.
Calculul coeficientului de corelaţie r în cazul când datele sunt negrupate.

Cotele la Notele la
Subiecţi proba de matematica x2 y2 xy
gândire (x) (y)

1 (RT) 10 6 100 36 60

2 (BI) 14 7 196 49 98

3 (CV) 18 10 324 100 180

4 (CD) 17 5 289 25 85

5 (FL) 20 10 400 100 200

6 (MI) 15 7 225 49 105

7 (GP) 13 6 169 36 78

8 (BV) 16 6 256 36 96

9 (ZI) 20 9 400 81 180

10 (VG) 16 7 256 49 112

N=10 T=159 T1=73 Σx2=2615 Σy2=561 Σxy=1194

Având datele calculate putem efectua înlocuirile necesare şi calcula valoarea


coeficientului de corelaţie r.

159 73
1194
Deci: r 10  0.67
 159 
2
732 
 2615  561 
 10  10 

Aplicarea acestui procedeu de calcul devine însă greoaie în cazul în care numărul
subiecţilor este mare şi datele obţinute sunt numeroase. În această situaţie vom recurge la
gruparea datelor si vom aplica un procedeu de calcul ce se bazează pe operaţia de codare.

33
În calculul corelaţiei avem două variabile (x şi y) şi în consecinţă vom avea ux şi uy. De
asemenea, vom nota Σux cu θ iar Σuy cu θ1. Efectuând înlocuirile putem constata ca formula de
calcul pentru r în cazul datelor grupate va fi următoarea:

1
 u xu y 
r N
    2  1 
2 2
  u x2    u y 
 N   N 

Putem observa că rxy nu diferă de ruxu y decât prin notaţii.

Utilizarea acestui procedeu de calcul necesită aranjarea datelor într-un tabel (vezi
tabela nr. 8).
Pentru ilustrare să luăm următorul exemplu:
Să presupunem că dorim să urmărim care este gradul de legătură între notele obţinute
de 51 de elevi la matematică şi la fizică. Vom avea 2 variabile: notele de la matematică (x) şi
notele de la fizică(y).
În tabela nr.8 este redat modul de aranjare a datelor. Una din axe este atribuită
rezultatelor obţinute la matematică, iar cealaltă rezultatelor obţinute la fizică. Se poate observa că
intervalul de grupare este mai mare de 1, nu este necesar ca acesta să fie egal la ambele variabile.

34
TABEL NR. 8.
Aranjarea datelor pentru calculul coeficientului de corelatie r
Note mate 6
1 2 3 4 5 7 8 9 10 fy uy fuy fuy*uy
fizică (y) mo
10 1 1 2 3 6 18
9 2 2 1 5 2 10 20
8 1 3 3 2 1 10 1 10 10
mo7 5 4 5 3 17 0 0 0
6 1 3 3 1 1 9 -1 -9 9
5 1 3 1 5 -2 -10 20
4 1 1 1 3 -3 -9 27
3
2
1

fx 2 5 9 11 10 8 4 2 N  51   2  u 2 y  104

-
ux -3 -2 0 1 2 3 4
1
- -
fux -6 0 10 16 12 8   21
10 9

fux*ux 18 20 9 0 10 32 36 32  u 2 x  157

nux*uy 15 20 2 0 0 10 24 20  uxu y  91
-
6 2 0 3 8 9 12
1
9 12 0 0 0 4 12 8
6 3 0 -1 0 3
0 -2 -2

După ce s-au notat clasele pentru cele două variabile, luăm fiecare subiect cu notele
obţinute la cele două variabile (notele de la matematică şi notele de la fizică) şi trasăm câte o
bară în căsuţa corespunzătoare care se găseşte la intersecţia dintre notele de la cele două
variabile. După ce am introdus toţi subiecţii, se notează în fiecare căsuţă cifre corespunzătoare
numărului de bare trasate (În tabela 8 sunt trecute numai cifrele finale).
Pasul următor constă în completarea rubricilor fx şi fy, făcând suma frecvenţelor pe linii
(pentru fy) şi respectiv pe coloane (pentru fx), iar prin însumarea acestora obţinem N.

35
Trecem apoi la operaţia de codare. Pentru a se distinge de celelalte clase, clasele de la
mijlocul seriei se încadrează în chenar, şi cuprind media de lucru (mo). În tabela de calcul mai
adăugăm în dreapta şi dedesubtul acesteia câte 3 rubrici. În prima rubrică vom înscrie valorile
codate (ux şi uy); în dreptul claselor marcate cu chenar (sau a mediei de lucru) vom scrie zero,
apoi numărăm succesiv 1;2;3;4 …şi vom pune minus în dreptul tuturor valorilor mai mici decât
media de lucru.
În cea de a doua rubrică adăugată se înscriu produsele fux şi respectiv fuy, ţinând cont de
regula semnelor. Însumând algebric datele însrise în fiecare din aceste rubrici obţinem valoarea
lui  şi  1 .

Rubrica următoare cuprinde produsele f u x u y şi respectiv fuy*uy.Totalizând datele

înscrise în aceste rubrici se obţine  u 2 x şi respectiv  u 2 y .


La cele trei rubrici marginale, se mai adaugă dedesubtul tabelului o a patra rubrică (
linie) notată n·ux·uy. Cu n s-a notat numărul de subiecţi care figureayă în diferite căsuţe din
interiorul tabelului. Pentru calcularea produselor n·ux·uy se ia succesiv în considerare fiecare
coloană.În căsuţele în care există subiecţi se înmulţeşte numărul acestora cu ux şi uy
corespunzător, respectând regula semnelor şi înscriem produsele parţiale obţinute sub rubrica n
ux*uy pentru fiecare coloană. Însumând algebric produsele parţiale obţinute pentru fiecare
coloană aflăm valoarea n·ux·uy pe care o vom nota în căsuţa corespunzătoare n*ux*uy şi prin
însumarea acestora vom obţine  u x*uy.
După ce am efectuat toate calculele şi tabela de calcul a fost completată efectuăm
înlocuirile în formula de calcul a coeficientului de corelaţie:
21*  2
91 
Deci: r 51  0,74

157 
212 
104 
 22 

 51  51 

Putem conchide că, coeficientul de corelaţie obţinut indică o corelaţie ridicată, cunoscând că r
poate lua valori situate între –1 şi 1 trecând prin 0.
Dacă r este pozitiv, indică o corelaţie directă pozitivă şi deci, dacă una din variabile (x)
creşte, atunci şi cealaltă variabilă (y) va avea tendinţa medie de a creşte.
Când coeficientul de corelaţie este nul, se poate spune doar că variabilele x şi y sunt
necorelate.
Dacă r este negativ atunci y va avea tendinţa de a varia în medie în sens invers lui x. În
acest caz corelaţia este negativă, inversă.

36
Dacă r  1 este vorba de o legătură funcţională liniară în sensul obişnuit al
cuvântului, y fiind exact determinat prin valoarea lui x.

Curs 7 Corelaţia rangurilor (Spearman)


Se utilizează atunci când numărul cazurilor studiate este mic (mai mic de 30), şi în
mod deosebit în cazul când avem clasificarea subiecţilor prin ranguri.
Când efectivul subiecţilor (N) este mic înlocuim cotele obţinute prin ranguri, ordonând
subiecţii în raport de rezultatele obţinute. Dacă doi subiecţi au aceleaşi rezultate, se atribuie
fiecăruia un rang intermediar. De exemplu dacă doi subiecţi se situează pe locul 4 li se atribuie
rangul 4,5 care este intermediar între 4 şi 5.
Când rezultatele sunt exprimate prin ranguri ne bazăm pe clasificările realizate sub cele
două aspecte. Deci fiecare subiect va avea două ranguri în raport de locul pe care îl ocupă la cele
două probe aplicate. Diferenţele între rangurile obţinute de fiecare subiect în cele două clasificări
ne pot furniza o indicaţie asupra corelaţiei dintre cele două variabile întrucât în calculul
coeficientului de corelaţie al rangurilor    se iau în consideraţie diferenţele între cele două
ranguri atribuite fiecărui subiect, mai precis asupra pătratului acestor diferenţe.
Formula de calcul a coeficientului de corelţie al rangurilor este următoarea:
6d2
  1

N N 2 1 
În această formulă d reprezintă diferenţa de rang, iar N numărul subiecţilor.
Pentru calculul coeficientului de corelaţie  se întocmeşte o tabelă cu cinci coloane
(vezi tabela nr. 9) unde în prima coloană se enumeră subiecţii; în coloana a doua şi a treia se trec
rangurile obţinute de fiecare subiect în cele două clasificări (la cele două probe); în coloana a
patra se notează diferenţele între rangurile obţinute de fiecare subiect; iar în coloana a cincea se
calculează patratele diferenţelor, care prin însumare ne va da  d 2 .
TABELA NR. 9.
Calculul corelaţiei rangurilor

Clasificarea subiecţilor după:


Subiecţii
Notele la d d2
Notele la fizică
matematică
R.O. 1 1 0 0,00
I.V. 2 2,5 -0,5 0,25

37
M.M. 3 2,5 0,5 0,25
F.I 4,5 4 0,5 0,25
A.V. 4,5 6,5 -2,0 4,00
C.L. 6 8 -2,0 4,00
I.P. 7,5 6,5 1, 1,00
L.V. 7,5 9 -1,5 2,25
B.G. 9 5 4 16,00
M.D. 10 14 -4 16,00
U.I. 11 12 -1 1,00
O.G. 12 10 2 4,00
A.C. 13 13 0 0,00
P.I. 14 11 3 9,00
N=14  d 2  58

În tabela nr. 9 sunt trecute rezultatele obţinute în urma clasificării subiecţilor (elevilor)
în funcţie de rezultatele obţinute la matematică şi la fizică şi urmează să stabilim relaţia dintre
aceste rezultate pentru a stabili dacă există o corelaţie între rezultatele obţinute la cele două
obiecte de învăţământ.
Având datele aranjate în tabela nr. 9, putem efectua includerea lor în formula de calcul a
coeficientului de corelaţie ρ şi deci:
6 * 58
  1  0.88
14142  1
Coeficientul de corelaţie obţinut este de 0,88 fapt explicabil prin diferenţa destul de
mică între rangurile obţinute de subiecţi în cele două clasificări, datorită unei legături directe
între rezultatele elevilor la cele două obiecte de studiu.
Ca şi r, coeficientul de corelaţie  poate avea valori între –1 şi +1.

Semnificaţia unui coeficient de corelaţie


În practică se stabilesc coeficienţii de corelaţie ( r şi  ), plecând de la datele unor
eşantioane ; şi deci se pune întrebarea în ce măsură un coeficient de corelaţie găsit în mod
experimental permite să afirmăm existenţa unei corelaţii sau nu.
În acest scop se introduce coeficientul de corelaţie critic, care reprezintă valoarea
minimă ce trebuie să o ia un coeficient de corelaţie obţinut pe baza datelor experimentale pentru

38
a fi socotit semnificativ. Deci coeficientul de corelaţie critic este cel mai mic coeficient de
corelaţie semnificativ. În acest senes există o tabelă specială (tabela nr. 10) în care sunt stabiliţi
coeficienţii de corelaţie critici pentru diferite praguri de semnificaţie şi pentru diferite valori ale
lui n (care semnifică numărul gradelor de libertate), şi unde n =N-2. Întrucât coeficienţii de
corelaţie pot fi şi negativi, tabela cuprinde valorile absolute ale coeficientului critic.

39
TABELA NR. 10.
Tabela valorilor semnificative pentru (r)
p.
P = .10 P = .05 P = .02 P = .01
n
3 .81 .88 .93 .96
4 .73 .81 .88 .92
5 .67 .75 .83 .87
6 .62 .71 .79 .83
7 .58 .67 .75 .80
8 .55 .63 .72 .76
9 .52 .60 .69 .73
10 .50 .58 .66 .71
11 .48 .55 .63 .68
12 .46 .53 .61 .66
13 .44 .51 .59 .64
14 .43 .50 .57 .62
15 .41 .48 .56 .61
16 .40 .47 .54 .59
17 .39 .46 .53 .58
18 .38 .44 .52 .56
19 .37 .43 .50 .55
20 .36 .42 .49 .54
25 .32 .38 .45 .49
30 .30 .35 .41 .45
35 .27 .32 .38 .42
40 .26 .30 .36 .39
45 .24 .29 .34 .37
50 .23 .27 .32 .35
60 .21 .25 .29 .32
70 .20 .23 .27 .30
80 .18 .22 .26 .28
90 .17 .21 .24 .27
100 .16 .19 .23 .25

Reluând exemplele anterioare, s-au găsit coeficienţii de corelaţie: r = .67 la un N = 10;


r = .74 la un N = 51 şi  = .88 la un N = 14. (cu r şi  se notează coeficienţii eşantioanelor
studiate pentru a-i deosebi de cei ai colectivităţii generale)
Se pune întrebarea dacă aceşti coeficienţi indică o corelaţie reală sau nu, cu alte cuvinte,
dacă pot fi consideraţi semnificativi sau nu.
În practică s-au conturat anumite criterii pentru interpretarea coeficienţilor de corelaţie r
sau ρ. Dacă coeficientului de corelaţie îi corespunde un p = .05 se admite existenţa unei corelaţii
semnificative; dacă îi corespunde un p>.05 se apreciază că, corelaţia existentă este
nesemnificativă, dacă îi corespunde un p<.05 şi >.01 corelaţia este puternic semnificativă, iar
dacă îi corespunde un p<.01 corelaţia este foarte puternic semnificativă.
Pentru a constata dacă coeficienţii de corelaţie găsiţi exprimă existenţa unei corelaţii sau
nu, comparăm valorile găsite cu cele critice înscrise în tabela valorilor semnificative ale lui r, în
care prima coloană cuprinde diferite valori ale lui n = N-2, iar celelalte coloane indică

40
coeficienţii de corelaţie minimi pentru diferitele praguri de semnificaţie (p = .10, p = .05, p = .02,
p = .01) corespunzător valorilor lui n.

Revenind la primul exemplu în care r = .67 la un N = 10, deci n=N–2=10–2=8


citim în tabelă în dreptul lui n = 8, valorile semnificative ale lui r şi ne oprim la cifra cea mai
apropiată de coeficientul de corelaţie găsit de noi, şi constatăm că la p = .05 este valoarea de
.63 . Întrucât valoarea găsită de noi (.67) este mai mare decât cea corespunzătoare la p = .05
putem spune că îi corespunde un p<.05 şi deci corelaţia este puternic semnificativă.

În cazul celui de al celui de al doilea exemplu r = .74 la un N = 51, deci n = N – 2 = 51


– 2 = 49; căutăm în tabelă şi găsim la p = .01 coeficientul critic .37 în dreptul lui n = 45 şi .35 în
dreptul lui n = 50. Întrucât n = 49 nu figurează în tabelă ne vom opri la n = 50 deoarece este mai
aproape de n = 49 şi putem conchide că, coeficientul găsit de noi de .74 este foarte puternic
semnificativ la pragul de p<.01.

În cel de al treilea exemplu  = .88 putem spune că este foarte puternic semnificativ

întrucât la pragul de p = .01 coeficientul critic este .66, iar  găsit de noi este mult mai mare şi
corespunde un p<.01 .

Temă:
1. În cadrul unui experiment efectuat la clasele a IV-a şi a VIII- s-a studiat atenţia în
funcţie de motivaţia activităţii de învăţare la elevi. În acest scop s-au utilizat trei probe:
- o probă de barare de vocale după testul Bourdon-Piéron;
- o probă de exerciţii de artmetică suficient de simple pentru a fi rezolvate cu uşurinţă
de toţi elevii (la clasa a VIII-a s-au dat exerciţii de algebră, de asemenea foarte
simple);
- o probă de compunere de cuvinte din trei litere. În toate caazurile s-a urmărit gradul
de concentrare psihică a elevilor.
Rezultatele obţinute la clasa a IV-a în cele trei probe, redate mai jos, s-au stabilit pe
baza unui punctaj unitar. Au fost examiaţi 41 de elevi (în fiecare rând sunt trecute rezultatele
obţinute de câte un elev).

Punctaj în testul Rezultate la:


Bourdon-Piéron proba de aritmetică compunere de cuvânt

41
(x) (y) (z)
8 5 3
7 9 8
6 7 5
9 3 4
8 8 5
7 4 5
7 8 3
9 9 7
8 9 4
12 9 10
5 10 9
8 6 7
1 9 3
8 7 7
4 6 7
8 6 3
8 8 7
9 7 5
5 6 7
8 8 7
4 8 6
7 6 7
6 8 8
9 8 4
7 7 7
7 6 7
8 10 7
6 7 3
9 10 7
6 4 4
6 7 7
3 6 8
8 6 7
6 7 7
5 7 5
4 8 8
8 8 4
8 4 6
8 5 5
9 9 6
5 3 4
(după B. Zörgö, T. Podaru şi V. Samu)
a) Să se studieze relaţiile dintre rezultatele obţinute la testul Bourdon – Piéron şi
celelalte aspecte cuprinse îîn experienţă.
b) Care este semnificaţia indicilor obţinuţi?
2. S-a urmărit în cadrul activităţilor practice în ce măsură frecvenţa ridicată a
operaţiilor de control se răsfrânge pozitiv asupra calităţii produsului finit. În acest scop, s-a

42
întocmit o clasificare a elevilor după frecvenţa controlului efectuat cu instrumente de măsură
şi o clasificare paralelă după calitatea produsului obţinut. Rezultatele sunt cuprinse în tabela
de mai jos.

Subiecţi Clasificare după:


frecvenţa calitate
controlului
x y
A.L. 1 4
U.C. 2 2
M.G. 3 10
B.D. 4 5
C.I. 5.5 1
P.L. 5.5 3
M.L. 7 8.5
F.M. 8 8.5
O.I. 9 7
R.V. 10 6
N=10

a) Să se determine gradul de legătură dintre cele două aspecte studiate.


b) Să se verifice dacă valoarea găsită prin calcul indică o corelaţie semnificativă sau
nu.
Modul IV
Curs 8 Tehnicile de comparaţie t şi z

În cercetările pedagogice intervin în mod frecvent probleme de comparaţie. Astfel, se


compară între ele mediile obţinute într-o cercetare şi se pune întrebarea dacă diferenţele
constatate sunt sau nu semnificative. Raţionamentul care se impune presupune intervenţia
ipotezei nule.
Trebuie să admitem că întâmplarea poate interveni în desfăşurarea fenomenului
cercetat, deci rezultatele sunt afectate de un factor aleator (întâmplător). Deci, alături de ipoteza
specifică (HS), ce stă la baza cercetării şi care constituie ipoteza psihologică sau pedagogică, se
poate formula şi o altă ipoteză care să atribuie numai întâmplării tendinţele datelor obţinute.
Aceasta constituie ipoteza întâmplării sau ipoteza nulă (HO).

43
În mod practic rezultatul unei cercetări poate fi sintetizat numeric în diferenţa dintre
medii. În legătură cu acest rezultat se confruntă două ipoteze: ipoteza specifică şi ipoteza nulă
(care este o ipoteză statistică).
În acest context, chiar dacă explicaţia ce decurge din ipoteza specifică ne apare
întemeiată, trebuie să ne asigurăm că ipoteza nulă este foarte puţin plauzibilă.
Pentru a dovedi justeţea ipotezei specifice, cercetătorul va admite în mod provizoriu
ipoteza nulă, deci diferenţele dintre medii să aibă loc numai pe baza „legilor întâmplării” şi să
determine probabilitatea (şansele) acesteia. Ştim că probabilitatea ia valori între 0 şi 1, iar
transcrisă în procente între 0 şi 100%. Dacă probabilitatea obţinerii rezultatului în baza ipotezei
nule este foarte mică (de exemplu, mai mică decât 0,05, ceea ce se scrie p <.05) atunci respingem
această ipoteză (nulă – a întâmplării) şi acordăm toată încrederea ipotezei specifice (inclusă în
cercetare). Dacă probabilitatea determinată conform ipotezei nule este mare (de exemplu p>.05,
putând merge până la 1), atunci admitem ipoteza nulă şi considerăm diferenţele obţinute ca
nesemnificative.
Prin urmare se acceptă ca semnificative acele rezultate care au şansele de a se produce
prin simpla întâmplare înt-un număr foarte mic de cazuri (sub 5% sau p<.05), întrucât riscul de a
greşi este mai mic de 5 % din cazuri.
Acesta este raţionamentul la care recurgem şi în cazul stabilirii semnificaţiei
diferenţelor dintre medii ca o problemă de comparaţie. În stabilirea semnificaţiei diferenţei între
două medii în funcţie de natura eşantioanelor (grupurilor de experienţă) avem două situaţii.

a. Semnificaţia diferenţei între două medii în cazul eşantioanelor independente;


b. Semnificaţia diferenţei între două medii în cazul eşantioanelor perechi
(corelate).

a. Semnificaţia diferenţei între două medii în cazul eşantioanelor independente


Problemele de semnificaţie diferă în funcţie două situaţii:
1. Când numărul de măsuri (N) în fiecare eşantion este mai mare de 30 sau N1 + N2
> 60.
2. Când numărul de măsurări sau volumul eşantionului (N) este mai mic de 30 sau
suma măsurărilor (N1+N2 ) <60.

Pentru primul caz când numărul de măsurători (N) în fiecare eşantion este mai mare de
30 sau N1 + N2 > 60 pentru testarea ipotezei nule se utilizează raportul următor:

44
m1  m2
z 
 12  22

N1 N2

Cu m1 şi m2 ,  12 şi  2 2 se notează datele obţinute la cele două eşantioane incluse în


cercetare (se notează astfel pentru a putea fi diferenţiate de datele colectivităţii generale).
Calculând valoarea raportului de mai sus notat cu z, ne vom referi la proprietăţile
curbei distribuţiei normale şi vom reţine că dacă z > 1,96, atunci diferenţa dintre cele două
medii este semnificativă la pragul de p<.05; dacă z > 2,58, atunci diferenţa dintre medii este
semnificativă la pragul p<.01, iar dacă z<1,96 atunci ipoteza nulă nu va fi infirmată, iar
diferenţa dintre medii nu va fi concludentă pentru a proba justeţea ipotezei specifice .
Să presupunem că la încheierea unui experiment psihopedagogic am aplicat o probă de
control la clasa experimentală şi la clasa de control şi rezultatele au fost următoarele:

m1 = 8,5; N1 = 36;  12 = 2,80

m2 = 7,1; N2 = 37;  2 = 3,05


2

Dorim să cunoaştem dacă diferenţa dintre medii este semnificativă şi deci variabila
inclusă în experiment a dus la îmbunătăţirea rezultatelor.
Pentru a constata dacă cele două medii constatate diferă semnificativ, facem
raţionamentul care urmează.
Admitem pentru un moment ipoteza nulă şi stabilim care este probabilitatea de a fi
verificată. Cu alte cuvinte presupunem că diferenţa dintre cele două medii m1 şi m2 se
datoreşte întâmplării şi că nu există diferenţe reale între eşantioanele considerate. În limbaj
statistic înseamnă că cele două grupe constituie eşantioane întâmplătoare ale aceleaşi
colectivităţi.
Pentru a testa ipoteza nulă vom utiliza raportul z şi deci:

m1  m2 8,5  7,1
z    3,49
1 2
2 2 2,80 3,05
 
N1 N2 36 37

45
Valoarea lui z găsită de noi de 3,49 este mai mare decât 258 şi corespunde la un p<.01,
deci diferenţa între cele două medii este net semnificativă şi putem conchide că variabila inclusă
în experiment a determinat o îmbunătăţire semnificativă a rezultatelor întrucât ipoteza nulă este
infirmată.
Pentru cel de al doilea caz, când volumul datelor obţinute în fiecare eşantion (N) este
mai mic de 30 sau N1 + N2 < 60, în verificarea şanselor ipotezei nule se apeleză la testul t
utilizând formula:

m1  m2
t 
 1 1 
S 2   
 N1 N 2 

Pentru a obţine o estimare a dispersiei colectivităţii, care este notată în formulă cu S2, se
combină datele celor două eşantioane:

S 
2  2

 x  m1   x  m2 
2

N1  N 2  2
Expresiile de la numărător ne sunt cunoscute de la calcularea dispersiei (sumele de
T2
pătrate Σ(x - m)2 = Σx2 – ) referitoare la cele două grupe sau eşantioane, iar N1 şi N2 sunt
N
efectivele celor două eşantioane.
Există o tabelă specială (întocmit de Student) în care figurează probabilităţile raportului
t corespunzător numărului „gradelor de libertate” care depinde de volumul eşantioanelor (vezi

tabela nr. 11)

46
TABELA NR. 11.
Tabela valorilor lui t

P
.10 .05 .02 .01
n
1 6,34 12,71 31,82 63,66
2 2,92 4,30 6,96 9,92
3 2,35 3,18 4,54 5,84
4 2,13 2,78 3,75 4,60
5 2,02 2,57 3,36 4,03
6 1,94 2,45 3,14 3,71
7 1,90 2,36 3,002 3,50
8 1,86 2,31 2,90 3,36
9 1,83 2,26 2,82 3,25
10 1,81 2,23 2,76 3,17
11 1,80 2,20 2,72 3,11
12 1,78 2,18 2,68 3,06
13 1,77 2,16 2,65 3,01
14 1,76 2,14 2,62 2,98
15 1,75 2,13 2,60 2,95
16 1,75 2,12 2,58 2,92
17 1,74 2,11 2,57 2,90
18 1,73 2,10 2,55 2,88
19 1,73 2,09 2,54 2,86
20 1,72 2,09 2,53 2,84
21 1,72 2,08 2,52 2,83
22 1,72 2,07 2,51 2,82
23 1,71 2,07 2,50 2,81
24 1,71 2,06 2,49 2,80
25 1,71 2,06 2,48 2,79
26 1,71 2,06 2,48 2,78
27 1,70 2,05 2,47 2,77
28 1,70 2,05 2,47 2,76

47
29 1,70 2,04 2,46 2,76
30 1,70 2,04 2,46 2,75
35 1,69 2,03 2,44 2,72
40 1,68 2,02 2,42 2,71
45 1,68 2,02 2,41 2,69
50 1,68 2,01 2,40 2,68
60 1,67 2,00 2,39 2,66
1,64 1,96 2,33 2,58

Numărul „Gradelor de libertate”, notat cu n este egal cu N1 + N2 – 2.


Să presupunem că în urma unei cercetări în care am urmărit dacă eşalonarea repetiţiilor
este mai productivă decât concentrarea lor am obţinut următoarele rezultate:
 la grupa de experienţă care a învăţat prin repetiţii concentrate acestea au fost:
T2
m1 = 12,7; N1 = 14; Σ (x - m1 )2 = Σx2 – = 80,1
N
 la grupa care a învăţat prin repetiţii eşalonate rezultatele au fost:
T2
m2 = 14,7; N2 = 14; Σ (x- m2 )2 = Σx2 – = 84,5
N
Pentru a stabili dacă diferenţa dintre cele două medii este semnificativă sau nu calculăm
pe t .
2
Pentru a putea aplica formula lui t mai întâi trebuie să-l calculăm pe S care este egal

cu:
2 80,1  84,5
S   6,33
14  14  2

Având toate datele îl calculăm pe t

12,7  14,7 2
t    2,27
1 1 0,88
6,33  
 14 14 

Această valoare a lui t de 2,27 o raportăm la tabela valorilor lui t. Pentru aceasta
calculăm pe n care este egal cu 14+14-2=26.

48
Căutăm în coloana lui n pe 26 şi apoi citim valoarea lui t şi observăm că la p = .05
aceasta este de 2,06 şi respectiv la p = .02 este de 2,48. Valoarea lui t calculată de noi de 2,27
este mai mare decât cea corespunzătoare lui p = .05 şi mai mică decât cea corespunzătoare lui p
= .02. Deci, putem spune că diferenţa dintre medii este semnificativă la p<.05 .
În general, dacă valoarea găsită prin calcul este mai mică decât valoarea lui t indicată în
tabel la pragul de p = .05, atunci admitem ipoteza nulă şi considerăm diferenţele obţinute în
experienţă ca nesemnificative. Dacă valoarea calculată de noi este mai mare decît valoarea lui t
de la p = .05, dar mai mică decât valoarea lui t la pragul p = .01, vom spune că diferenţa este
semnificativă la pragul p<.05, iar dacă valoarea găsită de noi este mai mare decât valoarea lui t
indicată în tabel pentru p = .01 atunci vom spune că diferenţa este semnificativă la pragul de
p<.01.
Efectul admiterii sau respingerii ipotezei nule se răsfrânge asupra ipotezei specifice,
astfel că admiterea ipotezei nule pune sub semnul întrebării ipoteza specifică; infirmarea ipotezei
nule consolidează ipoteza specifică.

b. Semnificaţia diferenţei între două medii în cazul eşantioanelor perechi


În cazul în care elementele celor două eşantioane sunt asociate într-un anumit mod
două câte două, procedeul cel mai simplu constă în a raţiona asupra diferenţelor pe care le
prezintă fiecare pereche de date asociate. Diferenţa corespunzătoare fiecărei perechi de date x' –
x, o notăm cu d.
De exemplu: cu o grupă de 12 elevi s-a încercat la biologie în decursul semestrului al
II-lea al anului şcolar o nouă metodă de învăţare. S-au înregistrat notele elevilor la biologie la
începutul experimentului, adică cele obţinute la sfârşitul semestrului I şi apoi după aplicarea noii
metode, deci la sfârşitul semestrului al II-lea. Dorim să cunoaştem dacă noua metodă a dus la o
îmbunătăţire a rezultatelor şcolare.
Pentru a determina acest lucru vom întocmi o tabelă în care vom înscrie subiecţii,
rezultatele obţinute de fiecare subiect în cele două situaţii (semestrul I şi semestrul a II-lea) şi
vom calcula diferenţa dintre ele (vezi tabela nr. 12).

49
TABEL NR. 12.
Calculul semnificaţiei diferenţei dintre medii
Notele la biologie
Subiecţii Semestrul II Semestrul I d d2
x' x
AC 9 7 2 4
DI 8 6 2 4
AD 7 5 2 4
VI 8 6 2 4
PI 6 5 1 1
CG 6 4 2 4
RN 5 5 0 0
MI 7 5 2 4
PC 8 5 3 9
MV 7 8 -1 1
GC 5 6 -1 1
ZI 9 7 2 4
N=12 Σd=16 Σd =40
2

Se observă din tabelă că avem diferenţe nule, pozitive şi negative.


Formulăm ipoteza nulă, adică atribuim numai întâmplării diferenţele constatate. Dacă
s-ar datora numai întâmplării, aceste diferenţe ar fluctua în jurul lui zero, într-un sens sau altul,
iar media lor ar fi egală cu zero: md=0 (cu md notăm media diferenţelor).
T
Însumând algebric coloana d vom afla Σd = T, apoi făcând raportul , vom afla
N
media diferenţelor (md).
T 16
În exemplul de mai sus (vezi tabela nr. 12) md= = =1,33, deci md diferă de zero;
N 12
nu ştim dacă această diferenţă este suficient de mare pentru a fi considerată semnificativă sau nu.
Pentru aceasta se utilizează formula:

md
t 
d
N

Din această formulă cunoaştem md şi N, dar nu cunaştem σd (abaterea standard a


diferenţelor).
Tratăm diferenţele aşa cum am considerat înainte datele brute.
Calculăm mai întâi dispersia diferenţelor

50
T2
d  2

d2  N de unde  d   d
2

N 2
În exemplul nostru în tabelă (vezi tabela nr. 12) adăugăm coloana d2, şi însumând
datele înscrise în coloană obţinem Σd2=40.

Având toate datele putem calcula pe  d 2 şi  d .

162
40 
d2  12  1,69 , de unde   1,69  1,3
12  1
d

Deci:

md 1,33
t    3,54
d 1,3
N 12

Căutăm în tabela lui t ţinând seama de faptul că în acest caz numărul gradelor de

libertate (n) este egal cu N-1, deci în exemplul nostru n=12-1=11.


Căutând în tabela valorilor lui t găsim pentru 11 grade de libertate, la pragul p = .01
cifra 3,11. Valoarea calculată de noi de 3,54 este superioară numărului 3,11 şi corespunde unui
prag mai mic decât .01, deci ipoteza nulă este infirmată şi putem conchide că rezultatele
experimentului sunt semnificative, deci noua metodă aplicată a determinat o îmbunătăţire
semnificativă a rezultatelor.
Când N este destul de mare (N>60) putem raporta valoarea găsită la valorile de 1,96 ce
corespunde la un prag p = .05 şi de 2,58 care corespunde la p=.01.
Temă:
1. La încheierea unei experienţe s-a dat aceeaşi probă de control la două clase paralele
A şi B. Clasa A a fost clasă de experienţă. Rezultatele sunt consemnate în tabele de mai jos.
Distribuţia răspunsurilor corecte
Răspunsuri Clasa A Clasa B
Corecte (f) (f)
14 2 3
13 4 6
12 7 10
11 10 8

51
10 8 5
9 5 3
8 2 2
7 - 1

Ce concluzii se pot formula asupra factorului cuprins în experienţă din analiza


rezultatelor obţinute în post-test? Ce probă de semnificaţie se aplică în acest caz, ţinând seama
de efectivele celor două clase?
Înaintea unei experienţe şcolare, rezultatele la învăţătură la o grupă de elevi sunt date
în prima coloană din tabelă. După experienţă rezultatele aceloraşi elevi sunt cele consemnate
în coloana a doua, pentru fiecare elev în parte.
Elevi rezultate înainte rezultate după
A 4 5
B 8 7
C 7 9
D 10 10
E 5 4
F 8 6
G 7 5
H 7 8
K 6 8
L 5 7
M 9 10
N 8 9

Să se stabilească dacă factorul cuprins în experienţă aduce o îmbunătăţire


semnificativă a situaţiei şcolare sau nu?
Temă finală:
În cadrul unei cercetări, în care s-a urmărit relaţia care s-a urmărit relaţia care există
între rezultatele la matematică şi nivelul de dezvoltare al gândirii logice s-au alicat două probe
cu conţinut corespunzător. În urma aplicării probelor s-au consemnat următoarele date: (cu
“x” sunt notate rezultatele la proba de matematică şi cu “y” rezultatele la proba de gândire
logică ale fiecărui subiect).

X y x y x y x y x y
9 10 7 8 5 7 7 7 7 7
10 10 7 8 6 7 7 7 8 7
8 9 7 8 6 7 8 7 5 6
8 9 8 8 6 7 4 6 5 6

52
9 9 8 8 6 7 6 6 6 6
9 9 9 8 7 7 7 6 8 6
10 9 5 7 7 7 3 5 4 5
5 8 5 7 8 7 4 5 4 5
6 8 5 7 5 6 7 5 3 4
6 8 5 7 6 6 4 4 6 4
6 8

Se cere:
1. Care este probabilitatea ca un elev care a obţinut un anume rezultat la proba de
gândire logică să obţină acelaşi grad de rezultate şi la proba de matematică.
2. Să se studieze forma distribuţiei rezultatelor obţinute la proba de gândire logică.
3. O examinare ulterioară efectuată cu proba de gândire logică a unui subiect a dus la
obţinerea unei cote x. Ce predicţie se poate face cu privire la aceasta şi care este riscul de eroare.
4. Sistemul de cotare la cele două probe fiind acelaşi să se demonstreze dacă există
diferenţe semnificative între rezultatele obţinute la cele două probe.

Curs 9

Semnificaţia diferenţei între frecvenţe. Criteriul χ


2

Rezultatele unei experienţe se pot prezenta adeseori sub forma unei distribuţii de

frecvenţe. Dacă se consemnează reuşita sau nereuşita la o probă, ori se înregistrează atitudinea

pozitivă sau negativă faţă de un eveniment, se obţine o clasificare dihotomică a subiecţilor,

adică două categorii. Dacă înscriem într-un tabel datele constatate la două grupe paralele,

obţinem un tabel cu 4 căsuţe.

Exemplu:

Verificându-se lucrările de control prin care s-a încheiat un experiment la gramatică, s-

au consemnat răspunsurile corecte şi cele greşite. La clasa de experienţă s-au înregistrat 131

53
de răspunsuri corecte şi 32 greşite, iar la clasa de control, 120 de răspunsuri corecte şi 48

greşite. Efectivele celor două clase erau foarte apropiate, 30 de elevi, respectiv 32.

Întrebarea care se pune este următoarea: diferenţele constatate în favoarea clasei de

experienţă sunt semnificative sau nu? Cu alte cuvinte, problema este dacă metoda de lucru

încercată în prima clasă dă intr-adevăr rezultate mai bune sau nu? În ce măsură datele obţinute

se pot generaliza?

Vom cuprinde într-un tabel rezultatele menţionate, obţinând un tabel cu 4 căsuţe.

Datele înscrise in cele 4 căsuţe, a, b, c şi d, reprezintă frecvenţele observate pe care le notăm

fo.

Clasa de experienţă Clasa de control Total


a b
Răspunsuri corecte 251
131 120
c d
Răspunsuri greşite 80
32 48
Total 163 168 331(T)

În legătură cu diferenţele care apar între cele două clase se pune întrebarea dacă sunt

semnificative sau se datoresc întâmpării.

Formulăm ipoteza nulă, adică presupunem că grupele considerate sunt eşantioane

extrase la întâmplare din aceeaşi colectivitate. Urmărim, cu alte cuvinte, dacă ipoteza aceleiaşi

colectivitaţi pentru cele două eşantioane este admisibilă sau nu.

Acceptând pentru moment această ipoteză ar trebui să ne aşteptăm la aceleaşi proporţii

în ambele eşantioane (diferenţa fiind nulă); adică, ar trebui să regăsim în cele două clase

proporţiile existente în colectivitatea care le înglobează. Dar aceste proporţii ne sunt

necunoscute şi nu putem decât să le estimăm, plecând de la datele eşantioanelor considerate,

combinând aceste date.

În exemplul ales putem estima proporţia răspunsurilor corecte în colectivitatea

presupusă, bazându-ne pe totalurile marginale. Această estimare este 251/331.

54
În continuare, pentru fiecare număr găsit în mod practic, vom calcula numarul

„teoretic” corespunzător în cadrul ipotezei aceleiaşi colectivităţi.

În acest scop ne servim de regula de trei simplă.

Dacă din totalul de 331 (în cele două clase), numărul răspunsurilor corecte este 251,

atunci numai pentru clasa de experienţă care ar fi proporţia aşteptată?

331............................251

163............................ x

De aici, proporţia răspunsurilor corecte la care ne aşteptăm în clasa de experienţă se

stabileşte uşor:

163 ∙251
=123,6
331

Am stabilit astfel numărul teoretic pentru prima căsuţă (a).

Urmând acest procedeu determinăm frecvenţele (proporţiile) teoretice pentru fiecare

căsuţă din tabelă. Vom nota frecvenţele teoretice cu ft. Procedeul general prin care se obţine

un număr teoretic este următorul: înmulţim totalul rândului cu totalul coloanei şi împărţim

apoi la totalul general.

De exemplu, frecvenţa teoretică pentru căsuţa d va fi:

168 ∙80
=40,6
331

Cifrele teoretice obţinute se înscriu în căsuţele corespunzatoare, între paranteze.

Pentru a compara frecvenţele teoretice (ft) cu cele observate (fo), ar trebui să ne bazăm

pe diferenţele dintre ele. Fiecare abatere de la valoarea teoretică tinde să contrazică ipoteza

nulă. Întrucât suma diferenţelor ar fi in mod necesar nulă, s-ar ajunge în impas. Şi atunci,

55
pentru a se face abstractie de semn, s-au luat pătratele acestor diferenţe, creându-se un simbol

χ2 (hi pătrat) definit astfel:

(fo - ft)2
χ2 = Σ
ft

În exemplul nostru, calculul se face în felul următor:

(131-123,6)2 (120-127,4)2 (32-39,4)2 (48-40,6)2


χ2= + + +
123,6 127,4 39,4 40,6

Deci însumăm atâţia termeni câte căsuţe avem.

Efectuând calculele în exemplul ales vom avea:

54,76 54,76 54,76 54,76


χ=
2 + + + =3,6
123,6 127,4 39,4 40,6

Observăm că în tabelul cu 4 căsuţe diferenţele (fo - ft) sunt egale, fapt care uşurează

calculele.

Valoarea obţinută prin calcul se raportează la valorile lui χ cuprinse într-un tabel
2

special. (Tabelul lui χ ) Acest tabel indică probabilitatea corespunzătoare diverselor valori ale
2

lui χ ţinând seama de numărul gradelor de libertate, care depinde de numărul de clase
2

(categorii) stabilite. În exemplul urmărit este vorba de 4 căsuţe. Numărul gradelor de libertate

se stabileşte după formula (r-1)(c-1), în care r este numărul de rânduri (linii) din tabel si c este

numărul coloanelor. În tabelul nostru avem 2 rânduri şi 2 coloane, deci r=2 şi c=2. Numărul

gradelor de libertate, notat cu n, va fi: (2-1)(2-1) = 1.

Citim în tabel valorile lui χ care corespund diverselor probabilităţi. Dacă valoarea
2

obţinută prin calcul este mai mică decât cea indicată în tabel pentru probabilitatea de .05,

56
atunci admitem ipoteza nulă şi considerăm diferenţele ca nesemnificative. Dacă valoarea

obţinută prin calcul este mai mare decât cea indicată în tabel pentru probabilitatea de .05,

respingem ipoteza nulă şi considerăm datele noastre semnificative. Dacă valoarea calculată

este superioară celei indicate pentru probabilitatea de .01, atunci vom considera diferenţele

puternic semnificative.

În exemplul nostru, χ =3,60, iar n=1.


2

Facem un extras din tabelul lui χ :


2

p
.10 .05 .01
n
1 2,71 3,84 6,64

Citim valoarea tabelară pentru p=.05 şi găsim 3,84. Valoarea calculată de noi (3,6)

fiind mai mică decât 3,84, vom admite ipoteza nulă şi vom considera diferenţele găsite în

experienţă ca nesemnificative.

Tabelul lui χ
2

p
.10 .05 .01
n
1 2,71 3,84 6,64
2 4,60 5,99 9,21
3 6,25 7,82 11,34
4 7,78 9,49 13,28
5 9,24 11,07 15,09
6 10,64 12,59 16.81
7 12,02 14,07 18,48
8 13,36 15,51 20,09
9 14,68 16,92 21,67
10 15,99 18,31 23,21
11 17,28 19,68 24,72

57
12 18,55 21,03 26,22
13 19,81 22,36 27,69
14 21,06 23,68 29,14
15 22,31 25,00 30,58
16 23,54 26,30 32,00
17 23,77 27,59 33,41
18 25,99 28,87 34,80
19 27,20 30,14 36,19
20 28,41 31,41 37,57
21 29,62 32,67 38,93
22 30,81 33,92 40,29
23 32,01 35,17 41,64
24 33,20 36,42 42,98
25 24,38 37,65 44,31
26 35,56 38,88 45,64
27 36,74 40,11 46,96
28 37,92 41,34 48,28
29 39,09 42,56 49,59
30 40,26 43,77 50,89

În cazul tabelului cu 4 căsuţe, cum este în exemplul dat, se poate determina valoarea

lui χ numai pe baza frecvenţelor observate (fo), si anume:


2

(ad – bc)2 T
χ2=
(a+b)(c+d)(a+c)(b+d)

În această formulă, a, b, c, d sunt frecvenţele observate, T este totalul general, iar

numitorul este produsul de la cele 4 totaluri marginale.

Criteriul lui χ se poate generaliza la tabelele comportând un număr mai mare de


2

căsuţe, rămânând valabile aceleaşi procedee de lucru.

Să luăm acum un exemplu care comportă trei modalităţi sau categorii în clasificarea

datelor.

58
Două grupe de şcoloari, A şi B, au urmat un program de activităţi practice. La grupa A

s-a urmărit în mod sistematic formarea deprinderilor de autocontrol, în timp ce la grupa B

această activitate a avut loc sporadic. Proba practică prin care s-a încheiat experienţa a fost

identică la cele două grupe. S-a apreciat precizia dimensiunilor produsului finit, înregistrându-

se abaterile faţă de cerinţele prevăzute. Rezultatele comparative apar in tabelul de mai jos:

Abaterea (mm)
Grupa Total
0,0-0,2 0,2-0,5 0,5-1,0
a b c
A 63,5 20,0 16,5 100

d e f
B 33,7 18,3 48,0 100

Total 97,2 38,3 64,5 200 (T)

Se pune întrebarea dacă grupa A se detaşează semnificativ de grupa B; cu alte cuvinte,

dacă formarea deprinderilor de autocontrol asigură o precizie dimensională sensibil mai bună

decât în condiţii obişnuite?

Discuţia se referă la datele înscrise în căsuţele a, b, c, d, e, f, la care se adaugă

totalurile marginale efectuate orizontal şi vertical. Este vorba, propriu-zis, de un tabel cu 6

căsuţe dispuse pe 2 rânduri şi 3 coloane. În diferite căsuţe sunt înscrise proporţiile sau

frecvenţele observate pe care le notăm, ca şi în exemplul anterior, cu fo.

Enunţăm ipoteza nulă ca în exemplul anterior, adică presupunem că diferenţele

constatate sunt pur aleatoare. Verificăm, cu alte cuvinte, dacă ipoteza aceleiaşi colectivităţi

pentru cele două eşantioane este admisibilă sau nu.

Admiţând pentru moment această ipoteză, urmează să estimăm proporţiile

colectivităţii plecând de la datele eşantioanelor considerate.

Bazându-ne pe totalurile marginale, putem estima proporţia abaterilor din primul interval (0,0-

0,2) în colectivitatea presupusă. Această estimaţie este 97,2/200,0.

59
În continuare, pentru fiecare număr găsit în mod practic vom calcula numărul

„teoretic” corespunzător în cadrul ipotezei aceleiaşi colectivităţi, servindu-ne de regula

cunoscută.

De exemplu, frecvenţa teoretică pentru căsuţa e va fi:

100 x 38,3 38,3


= =19,15
200 2
Cifrele teoretice obţinute se scriu (în paranteză) în căsuţele corespunzătoare. Se obţine

astfel tabelul de mai jos:

Abaterea (mm)
Grupa Total
0,0-0,2 0,2-0,5 0,5-1,0
a
A 63,5 b 20,0 c 16,5 100
(48,6) (19,15) (32,25)
d e
B 33,7 18,3 f 48,0 100
(48,6) (19,15) (32,25)
Total 97,2 38,3 64,5 200 (T)

În continuare, ne servim de formula:

χ2 =Σ (fo – ft)
2

ft

Calculul se face în felul următor:

χ2= (63,5-48,6)2 (20,0-19,15)2 (16,5-32,25)2 (33,7-48,6)2 (18,3-19,15)2 (48,0-32,25)2


+ + + + +
48,6 19,15 32,25 48,6 19,15 32,25

Efectuând calculele vom avea:

χ2= 222,01 0,75 248,06 222,01 0,73 248,06


+ + + + + =24,42
48,6 19,15 32,25 48,6 19,15 32,25

Valoarea obţinută se raportează la valorile lui χ cuprinse în tabel. În exemplul urmărit


2

este vorba de 6 căsuţe; avem 2 rânduri şi 3 coloane, deci r= 2 şi c= 3. Numărul gradelor de

libertate (notat cu n sau ν) va fi: (2-1)(3-1) =1x2 = 2.

60
Aşadar, în exemplul nostru χ = 23,42, iar n = 2.
2

Facem un extras din tabelul lui χ .


2

p
.10 .05 .01
n
2 4,60 5,99 9,21

Observăm că valoarea tabelară este 5,99 pentru p= .05 şi 9,21 pentru p= .01. Valoarea

găsită prin calcul este 24,42, prin urmare este mai mare decât 9,21, pentru care p= .01. Vom

spune că diferenţele sunt semnificative la pragul de p<.01.

Formulele studiate se aplică îndeosebi în cazul eşantioanelor independente. Se cere ca

eşantioanele să fie destul de mari, iar frecvenţele înscrise în căsuţele tabelului să nu fie mai

mici decât 5 (de preferinţă, ar trebui să fie mai mari decât 10).

În general, criteriul lui χ se utilizează când se pune problema să se compare anumite


2

distribuţii de frecvenţe constatate, cu distribuţii „teoretice”, la care ne aşteptăm în baza unei

ipoteze. Se determină astfel dacă abaterea care se constată prin calcul este cuprinsă în limitele

fluctuaţiilor întâmplatoare sau, dimpotrivă, le depăşeste.

Se pot întâlni în această direcţie şi situaţii mai simple.

Exemplu:

Unui grup de elevi (N=22) i se prezintă probleme directe şi inverse, în total câte 5

perechi de probleme de acest gen. La sfârşitul experienţei s-a constatat că din problemele

directe au fost rezolvate pe ansamblul grupului 90, în timp ce din cele inverse, abia 56.

Procentul problemelor rezolvate era de 81, 8 la cele directe şi de 50,9 la problemele inverse.

Presupunând că diferenţele constatate ar fi pur aleatoare, ar trebui să ne aşteptăm la

aceleaşi proporţii în rezolvarea celor două categorii de probleme. Or, proporţiile constatate

sunt diferite (81,8 % şi 50,9 %). Se pune întrebarea dacă diferenţa constatată este

61
semnificativă sau nu. Pentru a răspunde la această întrebare se vor compara efectivele

observate cu cele teoretice („aşteptate”), servindu-ne de criteriul χ .


2

Totodată, criteriul χ poate servi pentru controlul independenţei a două însuşiri sau
2

grupe de rezultate. Raţionamentul se face în mod analog: presupunând că între cele două

însuşiri nu există nici o corelaţie (cele două fiind independente) ne aşteptăm la aceleaşi

proporţii în cele două grupe. Mergând pe această ipoteză se determină frecvenţele teoretice şi

apoi se calculează χ după procedeele arătate. Interpretarea se face în aceiaşi termeni: dacă
2

pentru valoarea calculată a lui χ găsim valori mari ale lui p (de exemplu p > .0,5) acceptăm
2

presupunerea făcută, iar dacă vom găsi valori mai mici ale lui p (de pildă p< .01) vom

conchide că există o anumită legătură (asociaţie) între cele două trăsături, fără să putem

preciza gradul acestei legături. Prin urmare, controlul independenţei poate fi considerat uneori

ca test de asociaţie sau omogenitate. Matematic, cele două sunt identice; ipotezele şi

interpretarea lui χ sunt diferite.


2

În încheiere sunt necesare unele observaţii cu caracter general.

Într-o investigaţie psihologică, prelucrarea statistică a datelor nu are o semnificaţie

independentă; ea se încadrează întotdeauna în procesul de elaborare logică a materialului în

care analiza calitativă a faptelor capătă prioritate. Valoarea datelor obţinute rezidă în

autenticitatea materialului de bază, în adevărul obiectiv al datelor iniţiale. Procedeele statistice

dezvăluie, fac explicite, informaţiile cuprinse în datele experimentale de la care pornim.

Aparatul matematic nu se poate substitui in fond ipotezei creatoare, el ajută cercetătorul în

organizarea experienţelor, în constituirea eşantioanelor, îi oferă elemente de analiză numerică

a distribuţiei obţinute, îi permite să verifice anumite ipoteze etc. În investigaţia psihologică

elementele de statistică matematică se împletesc la tot pasul cu observaţia fină, cu spiritul

analitic pătrunzător. Ceea ce caracterizează propriu-zis cercetarea în acest domeniu, este

tocmai îmbinarea originală, sinteza aptitudinilor arătate.

62
Modul V

Curs 10 Coeficientul de corelaţie biserial (r bis)

Există situaţii experimentale în care pentru o variabilă avem informaţii complete, deci

datele (rezultatele) se prezintă ca o scară continuă de valori, iar pentru o a doua variabilă

cunoaştem doar că rezultatele se prezintă sub forma a două clase: superioară şi inferioară, deci

sunt dihotomizate.

Exemplu:

Înaintea unui examen de admitere supunem candidaţii la o testare psihologică şi

obţinem valorile pentru variabila x. După examen avem rezultatele (y) sub formă

dihotomizată: admisi; respinsi. În această situaţie urmărim să validăm testul (bateria de teste)

cu criteriu (reuşita).

Sau: dorim să urmărim pragul opţiunii pentru o secţie reală sau umanistă. În acest caz

putem să aplicăm un test sau o baterie de teste şi urmărim în paralel reuşita la o secţie

umanistă sau reală. Variabila x reprezintă rezultatele la test şi variabila y, reuşita la secţia

umanistă şi reală.

Sau: putem urmări în paralel timpul necesar pentru efectuarea unei probe şi numărul

de erori comise. Timpul este variabila continuă; numărul de erori poate fi dihotomizat (erori

putine; erori multe).

În aceste situaţii se utilizează coeficientul de corelaţie biserial care este, de fapt, o

variantă a coeficientului de corelaţie „r” adaptată la astfel de situaţii (o variabilă continuă şi

una dihotomizată) şi care cere ca N să fie mai mare de 50.

Formula de calcul pentru r bis este:

m’-m” pq
r bis = x
σ y

63
→ în care m’ reprezintă media valorilor x pentru elementele clasei superioare (y>y0),

y0 fiind punctul de taietură al variabilei. (y0= jumătate din totalul subiecţilor)

În formulă, y este ordonata corespunzătoare punctului de separaţie (unii autori o

notează cu „z”, transformând al doilea termen al înmulţirii din formula de mai sus în (pq/z)

→ „σ” este abaterea standard a rezultatelor obţinute în cadrul variabilei continue (deci

a întregului lot de subiecţi).

Raportul pq/y se citeşte dintr-un tabel special luând ca reper fie pe „p” fie pe „q”. (vezi

anexa nr. 1)

„p”- proporţia celor din clasa superioară;

„q”- proporţia celor din clasa inferioară sau q = 1-p.

Când nu avem tabelul,

m’-m”
r bis = x √pq
σ

Exemplu:

La examenul de admitere în liceu s-a aplicat, în paralel cu probele de concurs, un test

psihologic. Rezultatele la test au fost exprimate în cote de la 0 la 10 (x) iar cele de la concurs

în admişi-respinşi (y).

Se pune întrebarea dacă examenul de concurs poate fi înlocuit cu testarea psihologică,

deci dacă testul este valid sau nu.

x
0 1 2 3 4 5 6 7 8 9 10 total
y

admişi 0 1 0 3 5 10 16 14 6 3 1 59

respinşi 1 2 4 7 13 12 9 4 2 0 0 54

64
total 1 3 4 10 18 22 25 18 8 3 1 113

→ calculăm mai întâi „p” care reprezintă proporţia elementelor din eşantionul

dihotomizat care se încadrează în clasa superioară:

p = 59/113 = 0,52

→ apoi calculăm pe „q” care reprezintă proporţia elementelor din eşantionul

dihotomizat care se încadrează în clasa inferioară:

q = 54/113 = 0,48 sau

q = 1- p = 1- 0,52 = 0,48.

→pq/y se citeşte din tabelul din anexa nr. 1. În acest caz se va lua valoarea lui p sau q

care este mai mică de 0,50. (aşa este conceput tabelul)

În cazul nostru vom citi din tabel valoarea raportului pq/y corespunzatoare lui q =

0,48, care este de ≈ 0,63.

→ apoi calculam pe m’ si pe m”:

m’ reprezintă media valorilor obţinute la test de către subiecţii admişi;

m” reprezintă media valorilor obţinute la test de către subiecţii respinşi.

m' x f fx m" x f fx

0 0 0 0 1 0

1 1 1 1 2 2

2 0 0 2 4 8

3 3 9 3 7 21

4 5 20 4 13 52

5 10 50 5 12 60

6 16 96 6 9 54

65
7 14 98 7 4 28

8 6 48 8 2 16

9 3 27 9 0 0

10 1 10 10 0 0

N=59 T=359 N=54 T=241

m' = 359/59 = 6,08

m” = 241/54 = 4,46

→ apoi calculăm abaterea standard (σ) pentru întregul eşantion, în funcţie de valorile

la testul psihologic.

x f u fu fu∙u

0 1 -6 -6 36

1 3 -5 -15 75

2 4 -4 -16 64

3 10 -3 -30 90

4 18 -2 -36 72

5 22 -1 -22 -125 22

6 25 0 0 0

7 18 1 18 18

8 8 2 16 32

9 3 3 9 27

10 1 4 4 47 16

i=1 N=113 θ = -78 Σu2 = 425

66
i2(Σu2-θ2/N) 12(452-782/113) 1(452-53,84) 398,16
σ=
2
= = = =3,55
N-1 113-1 112 112

σ = √σ2 = 1,89 √3,55 = 1,88 ≈ 1,89

Putem calcula pe r bis.

m'-m” pq 6,08-4,46
r bis = x = x 0,63 = 0,86 x 0,63 = 0,54
σ y 1,89

Interpretarea

n = 113-2 = 111.

Facem un extras din tabelul valorilor semnificative ale lui r:

p .10 .05 .01 p < .01


n
:
:
:
:
:
100 .16 .19 .25 .54

Valoarea lui r bis este semnificativă la un p < .01. Deci există o corelaţie foarte

semnificativă.

67
Curs 11
Coeficientul de corelaţie triserial (r tris)

Când intr-o cercetare o variabilă (y) ne apare sub forma unei clasificări trihotomice

(exp. buni – mijlocii – slabi) în timp ce cealaltă variabilă este continuă (exp. rezultatele la

testul psihologic), se utilizează pentru calcul coeficientul de corelaţie triserial care are ca

formulă:

m'-m” 1
r tris= x
y' y"
σ +
p' p"
în care m’ şi m” reprezintă mediile rezultatelor la variabila continuă (test psihologic
pentru cei buni si cei slabi); p’ si p”, proporţia de „buni” si respectiv „slabi”.
(- deci p’+ p” < 1)
y’ si y” sunt coordonatele curbei distribuţiei normale potrivit împărţirii în trei

categorii; σ este abaterea standard a distribuţiei complete a datelor (a rezultatelor la test).

Valorile rapoartelor y/p sunt date într-un tabel special (vezi anexa 1) pentru calculul

coeficientului de corelaţie triserial, luând ca reper pe „p” sau pe „q”.

p’ y' y" p

68
Modul VI

Curs 12

METODE STATISTICE NEPARAMETRICE

Metodele statistice neparametrice sunt acele metode ce se aplică în cazul în care


prelucrarea datelor nu depinde de forma distribuţiei.
Ele sunt valabile si în cazul unor eşantioane mai mici care permit ipoteza

unei distribuţii normale în collective mai largi.

Aceleaşi procedee de lucru devin utilizabile şi pentru ansambluri mai

numeroase de date (eşantioane mari) când pierderea de informaţie este neglijabilă,

iar calculele se simplifică foarte mult.

În lucrarea de faţă se prezintă trei metode neparmetrice si anume:

1. Proba medianei;

2. Testul U;

3. Probleme de comparaţie (Proba semnelor).

Când vrem să apreciem efectul unei experienţe sau, în general, influenţa

unui factor bine precizat pot să apară două situaţii: a) grupe sau calse independente

si b) grupe sau eşantioane perechi.

Pentru comparea a două grupe (eşantioane) independente ne folosim de

proba medianei şi de testul U, iar pentru compararea a două eşantioane-perechi

aplicăm proba semnelor.

1. Proba medianei

69
Când ansamblul de date obţinute in urma unei experienţe prezintă aspectul

unei distribuţii evident asimetrice, nu are sens să calculăm mediile; în acest caz

calculăm medianele şi le supunem pe acestea comparaţiei.

Mediana (med) este valoarea situată la mijlocul şirului ordonat; localizarea

ei se face cu formula: (N+1)/2.

De exemplu, la sfârşitul unei cercetări (experiment psihopedagogic) la două

clase A şi B dăm o lucrare de control şi se consemnează numărul de erori comise de

fiecare subiect. Ordonând simplu datele, obţinem:

Gr. A

x 0 1 2 3 4 5 6 7 8 9 (numar de greşeli)
f 3 6 3 1 0 2 3 1 0 1 = 20 elevi

Gr. B

x 0 1 2 3 4 5 6 7 8 9 (numar de greşeli)
f 2 1 1 1 3 3 1 1 2 1 = 16 elevi

Se poate vedea că histogramele întocmite nu sugerează ipoteza unei

distribuţii statistice normale (simetrice) în colectivitatea mai largă. În acest caz,

pentru compararea rezultatelor reţinem medianele. La grupa A mediana este 2, la

grupa B mediana este 4,5.

Se pune întrebarea dacă diferenţa între cele două mediane este semnificativă

sau nu.

Presupunând că factorul cuprins în cercetare nu are un efect semnificativ,

deci că cele două mediane ar fi, de fapt, egale (ipoteza nulă), am putea considera cele

70
două grupe ca eşantioane extrase la întâmplare din aceeaşi colectivitate. Această

colectivitate presupusă ar fi caracterizată de mediana celor 36 de valori (mediana

teoretică).

Punem laolaltă datele provenite de la cele două grupe, A şi B, formând astfel

o singură distribuţie a rezultatelor (gr A + gr B). Vom avea:

x 0 1 2 3 4 5 6 7 8 9
f 5 7 4 2 3 5 4 2 2 2 (N=36)

Mediana noii distribuţii se află pe locul 18,5 adică este egală cu 3,5.

Referindu-ne la grupa A vom vedea că aceasta prezintă 13 subiecţi sau

cazuri situate sub mediana teoretică si 7 cazuri deasupra ei. În schimb, in grupa B

există 5 cazuri sub mediana calculată în ideea ipotezei nule şi 11 deasupra.

Evident, in cazul nostru vor fi cotaţi mai bine elevii cu mai puţine greşeli, la

care numarul de erori este inferior medianei teoretice (3,5).

Putem întocmi un tabel cu 4 casuţe:

Nr. erori
Inferior medianei Superior medianei Total
Grupa A a 13 b 7 20
Grupa B c 5 d 11 16
Total 18 18 36(T)

În grupa A procentul de elevi situaţi sub mediană este: 13/20x100=65. În

grupa B acest procent este: 5/16x100=31,25.

71
Rămânând în cadrul ipotezei nule admitem în mod provizoriu că proporţiile

găsite nu sunt semnificativ diferite, că grupa A şi B provin din aceeaşi colectivitate.

Problema ne conduce la compararea frecvenţelor în cazul a două eşantioane

independente, ceea ce se tratează prin aplicarea criteriului χ .


2

Fiind vorba de un tabel cu 4 căsuţe se poate determina valoarea lui χ numai


2

pe baza frecvenţelor observate.

(ad-bc)2x T [(13 x 11) - (7 x 5)]2 x 36


χ2
= = = 4,05
(a+b) (c+d) (a+c) (b+d) 20 x 16 x 18 x 18

Situând valoarea gasită (4,05), în tabelul întocmit pentru χ putem conchide că la


2

pragul de p <.05 diferenţa observată între cele două mediane (adică între 2 şi 4,5)

este smnificativă, experienţa fiind deci concludentă.

Extras din tabelul lui χ :


2

n p .10 .05 .01

1 2,71 3,84 6,64

Reperul care ne interesează este valoarea tabelară la pragul de p= .05, iar în cazul

nostru 3,84. Valoarea calculată (4,05) este mai mare, deci se poate nota cu p < .05.

În exemplul analizat, odată ce am determinat mediana teoretică, clasificarea

dihotomică a datelor s-a impus cu uşurinţă. Este posibil insă să apară şi situaţii în

care există şi valori egale cu mediana teoretică.

Exemplu: Să presupunem că avem următoarele date:

72
Gr. contr. x 3 4 5 6 7 8 9 10
N(f) 2 1 3 3 2 2 1 0 N=14

x 3 4 5 6 7 8 9 10
Gr. exp.
F(N) 1 0 2 1 3 1 3 2 N= 13

Întrucât histogramele distribuţiilor sunt asimetrice şi efectivele celor două grupe

(clase) sunt reduse, recurgem la metodele neparametrice şi vom aplica proba medianei.

Mediana pentru grupa de control are valoarea de 6, iar pentru grupa experimentală

are valoarea 7.

Se pune întrebarea dacă diferenţa dintre cele două mediane este semnificativă sau

nu. (pentru estimare/extrapolare)

Admitem provizoriu ipoteza nulă (a aceleiaşi colectivitaţi) şi calculăm mediana

teoretică (sau a colectivitaţii formate din datele celor două grupe).

Gr. exp. + x 3 4 5 6 7 8 9 10
Gr. control f 3 1 5 4 5 3 4 2 N= 27

Locul medianei teoretice este (27+1)/2 = 14, iar valoarea ei este 7.

Deoarece în ambele grupe avem valori (cote) inferioare medianei teoretice, egale cu

mediana şi superioare acesteia, vom întocmi un tabel cu 6 căsuţe.

Inferioare medianei Egale medianei Superioare medianei Total


Gr. exp. 4 3 6 13
Gr. contr. 9 2 3 14
Total 13 5 9 27 (T)

Întrucât avem valori mici (mai mici de 5) în casuţe vom încerca o regrupare a datelor

în care valorile căsuţelor din mijloc vor fi adăugate fie căsuţelor din stânga fie căsuţelor din

dreapta.

73
Inferioare şi egale
Superioare medianei Total
medianei
Gr. exp. a 7 b 6 13
Gr. contr. c 11 d 3 14
Total 18 9 27 (T)

Superioare şi egale
Inferioare medianei Total
medianei
Gr. exp. a 4 b 9 13
Gr. contr. c 9 d 5 14
Total 13 14 27 (T)

Alegem tabelul care duce la un χ mai mic, în cazul nostru, primul tabel.
2

Dacă acesta ne va da un χ semnificativ, cu atât mai mult se va obţine acest lucru


2

utilizând tabelul al doilea.

Întrucât avem efective mici, în căsuţe vom introduce corecţia lui Yates (adusă

formulei lui χ in aceste situaţii) după care:


2

T[(ad-bc) – T/2]2
χ2=
(a+b) (c+d) (a+c) (b+d)

Înlocuind cu datele noastre vom avea:

27[(21-66) – 27/2]2
χ2= =3,13
13 x 14 x 18 x 9

74
Întrucât χ calculat corespunde unui p>.05, şansele ipotezei nule (H0) sunt mari, deci
2

ea nu poate fi infirmată.

Aşadar, rezultatul cercetării este neconcludent.

75
Curs 13 Testul U

Testul U, preconizat de Mann şi Whitney, constituie una dintre cele mai puternice

metode neparametrice, fiind oricând preferabil probei medianei.

Acesta ţine seama de rangul fiecărui rezultat în clasificarea generală şi serveşte la

testarea ipotezei nule (H0), potrivit careia două grupe (eşantioane) sunt extrase la întâmplare

din aceeaşi colectivitate.

Exemplu:

Într-o experienţă de instruire programată la clasa a VII-a, rezultatele finale apar

exprimate in note de la 0 la 20. Datele simplu ordonate au fost următoarele:

Clasa exp.(C e)

x 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N(f) 3 2 0 2 2 2 1 0 1 4 1 0 1 1 2 1 1 2 1 N=27

Clasa control (C c)

x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N(f) 3 5 3 2 3 1 0 0 1 0 0 0 2 1 1 1 1 2 0 1 0 N=27

Distribuţiile statistice nu ne sugerează ipoteza unor distribuţii normale, deci nu vom

utiliza metode parametrice în speţă testul t; întrucât întinderea variaţiei este destul de mare (de

la 0 la 20) este indicat testul U pentru evaluarea semnificaţiei rezultatelor.

Se procedează ca şi în cazul metodei precedente, în sensul că se combină rezultatele

celor două grupe în acelaşi ansamblu, trecând apoi la clasificarea notelor în ordinea crescândă

sau descrescândă.

În exemplul nostru vom lua ordinea descrescândă:

76
2 1 1 1 1 1 1 1
Ce+ x 15 14 11 9 8 7 6 5 4 3 2 1 0
0 9 8 7 6 3 2 0
Cc
f 1 3 1 3 3 2 2 1 3 4 1 0 2 2 2 3 3 4 6 5 3

Ranguri 1 12, 14, 1 1 21, 2 25, 27, 29, 3 3 38, 43, 4 5


1 3 5 7 0
medii 0 5 5 6 8 5 4 5 5 5 2 5 5 5 9 3

1 1 2 3 3 4 5
1 2 5 6 9 12 14 20 0 25 27 29 37 41
6 7 4 1 4 7 2
1 1 3 3 4 5
3 7 13 15 21 26 28 30 38 42
0 8 2 5 8 3
1 1 3 3 4 5
4 8 22 39 43
Ranguri 1 9 3 6 9 4
5
23 40 44
0
5
45
1
46

Nota maximă este 20 (aceasta în funcţie de rezultatele cu semnificaţia cea mai bună)

şi îi atribuim rangul 1, nota imediată este 19, consataăm ca 3 elevi au întrunit punctajul 19, îi

acordăm rangul mediu 3 şamd.

Pentru a nu greşi în atribuirea rangurilor, vom utiliza coloane de lucru ca în tabelul

de ai sus în care apar consecutiv numerele de la 1 la 54, ultima valoare fiind egală cu N 1+N2

(27+27=54).

Admitem în continuare ipoteza nulă, considerând cele două clase de elevi ca selecţii

întâmplatoare din aceeaşi colectivitate şi în consecinţă notele lor nu diferă semnificativ. Dacă

ar fi aşa, suma rangurilor (R1) atribuite notelor obşinute în clasa experimentală trebuie să fie

sensibil egala cu suma rangurilor (R2) din clasa de control.

Pentru a calcula R1 şi respectiv R2 pentru fiecare notă se va face produsul dintre

efectivul care a obţinut nota (în cadrul fiecărei clase) şi rangul afectat acestei note. În tabelul

de mai jos este redat modul de calcul pentru exemplul ales de noi.

Clasa experimentală Clasa de control


Note (x)
f Rang Produs f Rang Produs

77
20 1 1 1 - 1 -
19 2 3 6 1 3 3
18 1 5 5 - 5 -
17 1 7 7 2 7 14
16 2 10 20 1 10 10
15 1 12,5 12,5 1 12,5 12,5
14 1 14,5 14,5 1 14,5 14,5
13 - 16 - 1 16 16
12 1 18 18 2 18 36
11 4 21,5 86 - 21,5 -
10 1 24 24 - 24 -
9 - -
8 1 25,5 25,5 1 25,5 25,5
7 2 27,5 55 - 27,5 -
6 2 29,5 59 - 29,5 -
5 2 32 64 1 32 32
4 - 35 - 3 35 105
3 2 38,5 77 2 38,5 77
2 3 43,5 130,5 3 43,5 130,5
1 - 49 - 5 49 245
0 - 53 - 3 53 159
R1=605,0 R2=880,0
Totalul rangurilor (R1+R2) trebuie să fie egal cu N(N+1)/2, în care N este egal cu

N1+N2. În exemplul nostru, R1+R2 este egal cu 54 x 55/2= 1485. Din tabel, dacă adunăm,

obţinem: 605 +880 =1485. Această verificare este întotdeauna utilă.

Pentru testul ipotezei nule se poate utiliza fie R1 fie R2; sunt de preferat datele

referitoare la grupa mai puţin numeroasă.

Pentru uşurarea calculelor se va determina de la început suma rangurilor (R) numai

la unul din eşantioanele date (la cel mai restrâns).

Daca N1 şi N2 sunt mai mari decat 8 ne servim de variabila z

R1 - N1/2(N1+N2+1)
│z│=
√[N1N2/12 (N1+N2+1)]

78
care este variabila normală redusă. (Când utilizăm R2 la numărător apare N2/2.)

In exemplul nostru vom avea:

605- 27/2(27+27+1) 605-(13,55 x 55) -137,5


│z│= = = = -2,38
√[27x27/12 (27+27+1)] √729/12 x55 57,8

Luăm valoarea absolută deci 2,38, si ne referim la proprietăţile distribuţiei normale,

adică la cele 3 repere fixe date în extrsul de mai jos.

p .05 .02 .01


z 1,96 2,33 2,58

Pentru valoarea lui z găsită de noi vom afla p < .02. Se poate conchide că şansele

ipotezei nule de a se verifica sunt destul de mici (2%) Aşadar notele obţinute la clasa

experimentală se detaşează în mod semnificativ, ipoteza nulă este infirmată. Aplicarea

metodei prezentate impune restricţia ca numărul rangurilor egale la diferite note să nu fie prea

mare.

La proba medianei această restricţie nu există. În consecinţă vom alege între proba

medianei şi testul U în funcţie de criteriul indicat.

Întotdeauna testul U este preferat; când însă atribuirea rangurilor duce la prea multe

ranguri egale, vom utiliza proba medianei.

79
Curs 14 Proba semnelor

Se aplică în compararea eşantioanelor perechi.

În cazul acesta raţionăm asupra diferentelor d, obţinute între valorile perechi. Dacă

distribuţia acestor diferenţe este normală sau aproape normală, se aplică testul t; dacă nu este

normală este indicată proba semnelor.

Proba semnelor devine utilizabilă şi în alte situaţii. De multe ori, în cadrul

experimentelor din domeniul educaţiei nu reuşim să evaluăm numeric-cantitativ rezultatele,

putem însă preciza sensul modificărilor survenite în urma măsurilor adoptate. Cu alte cuvinte,

putem stabili la la câţi elevi s-au înregistrat efecte pozitive (îmbunătaţire, progrese), la câţi

este vorba de efecte nule (rămâneri pe loc) si la câţi s-au constatat efecte negative (regrese).

Aşadar, nu ajungem să determinăm mărimea diferenţelor create de încercarea

întreprinsă, ci arătăm numai sensul lor, întocmind apoi balanţa „plusurilor” şi „minusurilor”,

şi în acest caz utilizăm proba semnelor, dacă experienţa cuprinde bineînteles acelaşi colectiv

evaluat în două etape diferite (eşantioane corelate).

Se disting două situaţii:

a) când N<25

b) când N>25.

Ipoteza nulă este aceeaşi în ambele situaţii. Dacă notam cu x rezultatele iniţiale

(pretest) şi cu x’ cele finale (posttest) obţinute de acelaşi subiect, diferenţele x’-x pot fi

pozitive, nule sau negative. Diferenţele nule nu ne interesează în proba semnelor.

Raţionamentul se referă la diferenţele pozitive (+) şi la cele negative (-). Se presupune, în

cadrul ipotezei nule (H0), că şansele sunt egale de a avea diferenţe pozitive, respectiv

negative. Cu alte cuvinte, potrivit ipotezei nule proporţia „plusurilor” este sensibil egală cu

80
proporţia „minusurilor”. În practică, proporţia lor diferă; întrebarea este dacă diferenţa este

concludentă pentru a infirma ipoteza nulă.

a) Când N<25, proba semnelor se aplică utilizându-se un tabel special, în care se

indică numărul de + sau de – corespunzător pragului de semnificaţie de .05 sau .01. (vezi

tabelul de la pag. 36)

Ipoteza nulă, fiind egalitatea proporţiilor de semne + şi –, nu ne putem asuma

riscul de a o elimina decât de la un anumit număr critic de semne + sau – din grupa

experimentală, număr a cărui apariţie prin simplă întâmplare corespunde unei probabilităţi

reduse, inferioare unui prag ales de noi (de obicei .05 şi .01). Tabelul cuprinde valorile critice

ale lui s pentru proba semnelor, s fiind numărul de semne mai puţin frecvente. (vezi tabelul

cu valorile corespunzătoare diferitelor praguri de semnificaţie pentru proba semnelor –

pagina 36)

Exemplu:

12 subiecţi sunt invitaţi să aleagă între două obiecte sau două activitati A şi B. Se

presupune că A va fi preferat lui B.

Se pune întrebarea: ipoteza este verificată sau nu? Preferinţele sunt următoarele:

Subiecţi 1 2 3 4 5 6 7 8 9 10 11 12
Preferinţe A A B A 0 A A 0 A A A A

După cum se vede, subiecţii 5 şi 8 nu s-au puut decide (situaţiile de indecizie fiind

marcate cu 0).

Să rezumăm datele într-un tabel:

81
A<B A>B
(preferă B) A=B (preferă A)
Semnul - Semnul +

1 2 9

De regulă se elimină situaţiile de indecizie, respectiv diferenţele nule şi raţionăm în

continuare numai asupra celor 10 cazuri (N=10).

Având un semn – si nouă semne + se vede imediat că semnele mai puţin frecvente

sunt semnele –. Să urmărim dacă acestea depăşesc valoarea critică. Ne referim la tabelul cu

valorile pentru proba semnelor din care facem un extras:

N p .05 .01

10 1 0

Observăm că pentru N=10, la pragul de p=.05, tabelul ne indică, pentru s valoarea 1.

În consecinţă, ne putem asuma riscul de a afirma că A este preferat lui B în chip semnificativ.

Riscul de a fi contrazişi este de 5% ceea ce, practic, este foarte mic. Deosebirea în preferinţe

este, deci, semnificativă.

Tabelul valorilor critice pentru proba semnelor

N p .05 .01
6-7 0 0
8 0 0
9-10-11 1 0
12-13-14 2 1
15-16 3 2
17 4 2
18-19 4 3
20 5 3
21-22 5 4

82
23 6 4
24 6 5
25 7 5
26-27 7 6
28 8 6
29 8 7
30-31 9 7

b) Când N>25

Proba semnelor se poate aplica în două feluri.

Exemplu: Într-o experienţă de educaţie morală, efectuată cu 32 de copii, s-a

înregistrat la incheierea perioadei de activitate urmatoarea situaţie: progrese în modul de

comportare la 23 de copii, regrese la 4 copii şi situaţie staţionară la 5 copii.

Deci:

(primul mod de rezolvare)

Semnul - 0 +
4 5 23

Eliminăm cazurile staţionare şi obţinem:

- + T
4 23 27

Semnele mai puţin frecvente sunt semnele –. Consultăm apoi tabelul valorilor critice

ale lui s pentru N=27.

N p .05 .01
27 7 6

Întrucât valorii s = 4 îi corespunde un p < .01, se consideră experimentul ca fiind

concludent; riscul de a greşi respingând ipoteza nulă este de 1%.

Desigur că în aceste situaţii se impune analiza calitativă a rezultatelor.

83
Problema se poate rezolva şi utilizând variabila normală redusă (al doilea mod de

rezolvare) în care

s-N/2
z=
½ √N

În formulă s indică numărul de semne de un anumit fel (+ sau –), iar N indică totalul

semnelor reţinute.

Aplicând corecţia de continuitate, avem:

(s ±0,5) - N/2
z=
½ √N

Dacă s indică numarul de semne mai frecvente, se scade 0,5 iar dacă indică semnele

mai puţin frecvente se adaugă 0,5. Prin urmare, daca s > N/2 se scade 0,5, dacă s < N/2 se

adaugă 0,5.

În exemplul nostru, putem calcula pe z în două feluri:

(4 +0,5) – 27/2 -9
z= = = - 3,46
½ √27 2,6
sau:

(23 - 0,5) – 27/2 9


z= = = 3,46
½ √27 2,6

Corecţia de continuitate se face pentru a reduce valoarea lui z.

Întrucât valoarea găsită este mai mare decât 2,58 care este valoarea lui z

corespunzătoare la pragul lui p < .01 ne asumăm riscul că ipoteza nulă este infirmată.

Concluzia este aceeasi ca şi la prima variantă de calcul.

PROBLEME PENTRU A FI REZOLVATE:

PROBLEMA 1

84
Probele de control prin care s-a încheiat o experienţă didactică la două grupe

paralele, A şi B, au evidenţiat numarul de răspunsuri corecte în lucrările individuale. Grupa B

a fost grupa de control.

Rezultatele au fost următoarele:

Gr. A (exp): 10, 7, 9, 10, 12, 7, 10, 6, 9, 12, 10, 9, 10, 8, 9, 7

Gr. B (control): 7, 5, 11, 8, 9, 10, 8, 7, 5, 10, 6, 9, 8, 7

Să se verifice dacă metoda aplicată în grupa A aduce o îmbunătaţire semnificativă a

rezultatelor şcolare sau nu.

Indicaţie: După ordonarea datelor se va aplica proba medianei care va conduce la un

tabel cu 4 casuţe.

Rezultate:

Inf. medianei Sup. medianei


A 5 11
B 10 4

PROBLEMA 2

S-a efectuat o experienţă şcolară la două clase paralele A şi B. La clasa A s-a

încercat o metodă nouă de introducere a noţiunilor de aritmetică. Rezultatele înregistrate la

încheierea experienţei au fost evaluate pe baza unui punctaj riguros de la 0 la 15, analog celui

aplicat la Olimpiadă.

Rezultatele sunt următoarele:

Clasa A: 14, 8, 9, 11, 2, 9, 11, 15, 9, 7, 5, 11, 13, 6, 9, 10, 4, 7, 12, 6, 14, 11, 13.

Clasa B: 2, 6, 12, 8, 5, 0, 4, 10, 6, 4, 0, 3, 8, 2, 6, 7, 9, 4, 8, 7, 5.

Numerele notate redau punctajul obţinut de fiecare elev in parte.

Să se verifice dacă metoda încercată la clasa A a dus la rezultate sensibil mai bune

sau nu.

85
Indicaţie: după ordonarea datelor se aplică testul U, deoarece amplitudinea variaţiei

este destul de mare (intre 0 si 15).

PROBLEMA 3

Fie o grupă G formată din 16 şcolari. S-a înregistrat timpul necesar pentru

executarea unui produs la începutul perioadei de instruire practică si la încheierea acesteia.

Rezultatele apar înscrise în cele 2 coloane de cifre (I şi II). Elevii sunt notaţi de la A

la R.

Subiecţi I II
A 26 18
B 22 17
C 21 18
D 25 25
E 20 22
F 23 12
G 24 17
H 22 16
I 19 19
K 23 13
L 19 16
M 21 17
N 23 21
O 20 10
P 18 11
R 24 18

Evident, timpul de lucru scade. Se pune întrebarea dacă perioada de instruire a avut

efecte semnificative sau nu.

86
ANEXA 1. Coeficientul de corelaţie biserial şi triserial
p p p
pq_ √pq_ y_ pq_ √pq_ y_ pq_ √pq_ y_
sau sau sau
y y p y y p y y p
q q q
0,350 0,6142 1,288 1,0583 0,401 0,6213 1,268 0,9644 0,451 0,6254 ,257 0,8779
0,351 0,6144 1,287 1,0564 0,402 0,6214 1,267 0,9623 0,452 0,6254 ,257 0,8762
0,352 0,6145 1,287 1,0544 0,403 0,6215 1,267 0,9605 0,453 0,6255 ,256 0,8746
0,353 0,6147 1,286 1,0525 0,404 0,6216 1,267 0,9587 0,454 0,6255 ,256 0,8729
0,354 0,6149 1,286 1,0506 0,405 0,6218 1,267 0,9570 0,455 0,6256 ,256 0,8712
0,355 0,6151 1,285 1,0487 0,406 0,6219 1,266 0,9552 0,456 0,6256 ,256 0,8695
0,356 0,6152 1,285 1,0468 0,407 0,6220 1,266 0,9534 0,457 0,6257 ,256 0,8679
0,357 0,6154 1,284 1,0449 0,408 0,6221 1,266 0,9517 0,458 0,6257 1,256 0,8662
0,358 0,6155 1,284 1,0430 0,409 0,6222 1,265 0,9499 0,459 0,6258 1,256 0,8646
0,359 0,6157 1,283 1,0411 0,410 0,6223 1,265 0,9482 0,460 0,6258 1,256 0,8629
0,360 0,6158 1.283 1,0392 0,411 0,6224 1,265 0,9464 0,461 0,6258 1,256 0,8612
0,361 0,6160 1,283 1,0373 0,412 0,6225 1,265 0,9446 0,462 0,6259 1,255 0,8596
0,362 0,6162 1,282 1 .0354 0,413 0,6225 1,264 0,9429 0,463 0,6259 1,255 0,8579
0,363 0,6163 1,282 1,0336 0,414 0,6226 1,264 0,9411 0,464 0,6260 1,255 0,8563
0,364 0,6165 1,281 1,0317 0,415 0,6227 1,264 0,9394 0,465 0,6260 1,255 0,8546
0,365 0,6166 1,281 1,0289 0,416 0,6228 1,264 0,9376 0,466 0,6260 1,255 0,8530
0,366 0,6168 1,280 1,0279 0,417 0,6229 1,263 0,9359 0,467 0,6261 1,255 0,8513
0,367 0,6169 1,280 1,0261 0,418 0,6230 1,263 0,9342 0,468 0,6261 1,255 0,8497
0,368 0,6171 1,280 1,0242 0,419 0,6231 1,263 0,9324 0,469 0,6261 1,255 0,8480
0,369 0,6172 1,279 1,0223 0,420 0,6233 1,263 0,9307 0,470 0,6262 1,255 0,8464
0,370 0,6174 1,279 1,0205 0,421 0,6233 1,262 0,9290 0,471 0,6262 1,255 0,8448
0,371 0,6175 1,278 1,0186 0,422 0,6234 1,262 0,9272 0,472 0,6262 1,254 0,8431
0,372 0.6177 1,278 1,0167 0,423 0,6234 1,262 0,9255 0,473 0,6263 1,254 0,8415
0,373 0,6178 1,278 1,0149 0,424 0,6235 1,262 0,9238 0,474 0,6263 1,254 0,8399
0,374 0,6179 1,277 1,0130 0,425 0,6236 1,261 0,9221 0,475 0,6263 1,254 0,8382
0,375 0,6181 1,277 1,0112 0,426 0,6237 1,261 0,9203 0,476 0,6263 1,254 0,8366
0,376 0,6182 1,276 1,0093 0,427 0,6238 1,261 0,9186 0,477 0,6264 1,254 0,8350
0,377 0,6184 1,276 1,0075 0,428 0,6239 1,261 0,9169 0,478 0,6264 1,254 0,8333
0,378 0,6185 1,276 1,0057 0,429 0,6239 1,261 0,9152 0,479 0,6264 1,254 0,8317
0,379 0,6186 1,275 1,0038 0,430 0,6240 1,260 0,9134 0,480 0,6264 1,254 0,8301
0,380 0,6188 1,275 1,0020 0,431 0,6241 1,260 0,9117 0,481 0,6265 1,254 0,8285
0,381 0,6189 1,274 1,0002 0,432 0,6242 1,260 0,9100 0,482 0,6265 1,254 0,8268
0,382 0,6190 1,274 0,9983 0,433 0,6242 1,260 0,9083 0,483 0,6265 1,254 0,8252
0,383 0,6192 1,274 0,9965 0,43" 0,6243 1,260 0,9066 0,484 0,6265 1,254 0,8236
0,384 0,6193 1,273 0,9947 0,435 0,6244 1,259 0,9049 0,485 0,6265 1,254 0,8220
0,385 0,6194 1,273 0,9929 0,436 0,6244 1,259 0,9032 0,486 0,6266 1,254 0,8204
0,386 0,6196 1,273 0,9910 0,437 0,6245 1,259 0,9015 0,487 ^6266 1,254 0,8188
0,387 0,6197 1,272 0,9892 0,438 0,6246 1,259 0,8998 0,488 0,6266 1,254 0,8171
0,388 0,6198 1,272 0,9874 0,439 0,6246 1,259 0,8981 0,489 0,6266 1,253 0,8155
0,389 0,6199 1,272 0,9856 0,440 0,6247 1,259 0,8964 0,490 0,6266 1,253 0,8139
0,390 0,6200 1,271 0,9838 0,441 0,6248 1,258 0,8947 0,410 0,6266 1,253 0,8123
0,391 0,6202 1,271 0,9820 0,442 0,6248 1,258 0,8930 0,492 0,6266 1,253 0,8107
0,392 0,6203 1,271 0,9802 0,443 0,6249 1,258 0,8913 0,493 0,6266 1,253 0,8091
0,393 0,6204 1,270 0,9784 0,444 0,6250 1,258 0,8896 0,494 0,6266 1,253 0,8075
0,394 0,6205 1,270 0,9766 0,445 0,6250 1,258 0,8880 0,495 0,6266 1,253 0,8059
0,395 0,6206 1,270 0,9748 0,446 0,6251 1,258 0,8863 0,496 0,6266 1,253. 0,8043
0,396 0,6208 1,269 0,9730 0,447 0,6251 1,257 0,8846 0,497 0,6266 1,253 0,8027
0,397 0,6209 1,269 0,9712 0,448 0,6252 1,257 0,8829 0,498 0,6267 1,253 0,8011
0,398 0,6210 1,269 0,9694 0,449 0,6253 1,257 0,8813 0,499 0,6267 1,253 0,7995
0,399 0,6211 1,268 0,9676 0,450 0,6253 1,257 0,8796 0,500 0,6267 1,253 0,7979

87
0,400 0,6212 1,268 0,9659

88
89

S-ar putea să vă placă și