Documente Academic
Documente Profesional
Documente Cultură
1
CAP. I. CONSIDERAŢII GENERALE DESPRE CERCETAREA
ŞTIINŢIFICĂ
Conform DEX (on-line) gnoseologie este „teoria filosofică asupra capacităţii omului de a
cunoaşte realitatea şi de a ajunge la adevăr, teoria cunoaşterii”.
Aceeaşi sursă defineşte epistemologia ca „parte a gnoseologiei care studiază procesul
cunoaşterii aşa cum se desfăşoară în cadrul ştiinţelor, teorie a cunoaşterii ştiinţifice”.
Ronald F.King (Strategia cercetării, 2005, p.36) este de părere că în cazul cercetării „se pun
două întrebări critice : ce şi cum putem cunoaşte? Prima întrebare reprezintă ontologia, a doua
epistemologia”.
Termenii „a propune” şi „a dispune” sunt termenii care ar putea clarifica răspunsurile la
întrebările formulate.
În perspectivă ontologică, folosind termenii propuşi, întrebările se reformulează, se dezvoltă
astfel: Oare lumea ni se oferă, ni se propune spre înţelegere sau noi ne propunem înţelegerea ei?
În perspectivă epistemologică interogaţia este următoarea:
Oare lumea este cea care ne dictează atunci când ne evaluăm afirmaţiile, permiţând să
păstrăm partea adevărată şi să dispunem eliminarea a ceea ce este fals, sau criteriile de eliminare
sunt la discreţia evaluatorului?
În domeniul ştiinţelor sociale, spre deosebire de domeniul ştiinţelor exacte, unde disputa
asupra cunoaşterii ştiinţifice este mai puţin aprinsă, există câteva obiecţii serioase cu privire la
cercetare.
1) Societatea este un fenomen prea complex, deci judecăţile produse sunt fie irelevante,
fie banale.
2) Judecăţile de tip lege privind societatea nu pot prezenta interes, trăim într-un anumit
spaţiu şi timp deci ele nu pot fi veşnic adevărate. În ştiinţele exacte (fizică, chimie,
matematică) legile descoperite sunt veşnic valabile
3) Un observator nu obţine obiectivitate ştiinţifică deoarece atât observatorul cât şi
ceilalţi indivizi, membrii ai societăţii, trăiesc în acelaşi mediu uman.
4) Indivizii umani sunt imposibil de abordat din perspectiva obiectivităţii şi a constanţei
ştiinţifice, deoarece aceştia dispun de libertate şi voinţă, deci sunt schimbători.
Exemple:
1) Proiectul de cercetare are ca subiect evoluţia concepţiei despre educaţie în Antichitate.
Cercetarea se va face pe baza studiului bibliografiei (vezi cap. II).
Existăm într-o lume nestructurată. Demersul cognitiv este orientat în direcţia ordonării
fazelor, evenimentelor, a reacţiilor în scopul realizării unei cunoaşteri sistemice. Aceasta este scopul
teoriei.
Exemplu:
Rezultatele brute ale unui test docimologic sunt nesistematizabile. Teoria care poate
sistematiza rezultatele este statistica.
Metoda este modalitatea de a ajunge la o concluzie despre ipoteza cercetării.
Concluzia despre ipoteză poate fi:
1) adevărată sau falsă
2) deocamdată adevărată sau falsă
3) probabil adevărată sau falsă
TEMĂ
Alegeţi un subiect de cercetare în domeniul ştiinţelor educaţiei. Formulaţi ipoteza cercetării.
3
CAP. II. PRACTICA CERCETĂRII
Aşa cum am mai arătat (cap. I), ipoteza este un enunţ a cărui valoare de adevăr (adevărat sau
fals) este probabilă (în faza de început a cercetării). Cercetarea va dovedi exact valoarea de adevăr a
ipotezei.
Cea mai simplă ipoteză statuează că o variabilă X influenţează (cauzează sau declanşează)
variabila Y.
Ipoteza confirmată devine teorie dar şi practică. După stabilirea ipotezei urmează testarea şi
apoi valorificarea ei. Pe parcursul testării ipoteza poate suferi modificări.
Ipoteza specifică pleacă de la presupunerea că doar modificările ce se produc s-ar datora
modificărilor factorului X, aflat sub controlul cercetătorului.
Ipoteza nulă pleacă de la presupunerea că toate modificările ce se produc s-ar datora unor
factori întâmplători.
Respingerea ipotezei nule întăreşte ipoteza specifică.
Ipoteza nulă este o ipoteză statistică şi poate fi respinsă dacă probabilitatea factorilor aleatori
este sub 50%. În caz contrar ea poate fi admisă.
Admiterea sau respingerea ipotezei nule se poate face pe baza calculului unor indici de
semnificaţie stabiliţi prin „testul z” sau „testul t”.
În unele cercetări, numite cercetări descriptive, ipoteza nu trebuie formulată explicit.
4
2.4. Metodica cercetării
Interpretarea datelor este operaţia prin care se descifrează semnificaţia informaţiei obţinute
din datele colectate.
Prelucrarea datelor este în principal o operaţie statistică care are în vedere calcularea:
- valorilor centrale (media, mediana, modul)
- abaterile faţă de tendinţa centrală (abaterea centrală, abaterea standard, dispersia)
- coeficientul de corelaţie
Interpretarea şi prelucrarea datelor implică:
- operaţii logice (analiză, sinteză, comparaţie, abstractizare, generalizare)
- raţionamente (inductiv, deductiv)
- cultură psihopedagogică
2.6. Eşantionarea
5
Între EE şi EC, pe cât posibil, trebuie să existe o egalizare – omogenizare. Aceasta se obţine
prin:
- eşantionare corelată (fiecărui individ din EE îi corespunde un individ asemănător din
EC)
- stabilirea de sub-eşantioane şi compararea lor. Pe baza unui test iniţial, de exemplu se
stabilesc sub-eşantioane cu indivizi mediocri, buni şi foarte buni, atât în EE cât şi în EC
În final eşantioanele se compară între ele.
- controlul statistic constă în testarea prealabilă a celor două eşantioane, calcularea pe
baza datelor a tendinţei centrale şi a variabilităţii (gradul de la care media aritmetică este
semnificativă).
Cu cât diferenţele dintre indici sunt mai mici, cu atât eşantioanele sunt mai omogene şi
tendinţa ca factori necontrolaţi să intervină în experiment este mai redusă.
Schema următoare lămureşte modul cum pot fi citite rezultatele experimentului în cazul
celor două eşantioane EE şi EC.
Tab.1
Eşantion Variabila Experiment Variabila Diferenţe Nr. crt.
dependentă dependentă
EE Vd1 Vd1+f.e. Vd2 Vd2 -Vd1 1
EC Vd1 Vd1+0 Vd2 Vd2 -Vd1 2
Faza t1 t2 t3 - -
Diferenţele (1) respectiv (2) arată măsura în care starea variabile dependente Vd, după o
perioadă de timp se schimbă.
Mai mult, în cazul (1), diferenţa arată şi măsura în care factorul experimental şi-a făcut
efectul (sau nu).
Diferenţa dintre (1) şi (2) arată măsura în care factorul experimental şi-a făcut (sau nu)
efectul atunci când factorul experimental a intervenit în EE, dar nu a intervenit în EC.
6
Experimentele pot fi clasificate astfel:
- experimentul de laborator. Acesta se realizează într-un spaţiu special amenajat unde se
înlătură influenţa unor factori întâmplători.
- experimentul natural. Acesta se desfăşoară într-o ambianţă naturală, în procesul de
activitate.
Cercetarea corelaţională
TEMĂ
1) Imaginaţi o cercetare experimentală explicând ipotezele cercetării, variabilele şi modul în
care vă alegeţi eşantionul
2) Imaginaţi o cercetare corelaţională evidenţiind variabilele pentru care credeţi că veţi putea
demonstra că sunt în corelaţie.
Metoda observaţiei
7
Metoda anchetei
Metoda analizei produselor presupune analiza unor produse ale activităţii subiecţilor, cu
scopul descoperirii unor trăsături de personalitate.
Are acelaşi scop ca metoda analizei produselor dar ea are ca obiect de investigaţie rezultate
consemnate în documente oficiale.
Această metodă se aplică în situaţii individuale mai deosebite (elevi supradotaţi, delicvenţă,
întârziaţi mintali etc.). Ea înglobează un set de metode şi procedee diverse. Pe parcursul aplicării
metodei se întocmeşte câte o fişă pentru fiecare caz.
Metoda biografică
Metoda testelor
Testul este alcătuit dintr-o probă sau din mai multe probe care înregistrează prezenţa sau
absenţa unui fenomen psihic, comportament sau reacţie la stimul (I.Drăgan şi I. Nicola, 1995,
Cercetarea psihopedagogică).
Standardizarea testului presupune elaborarea unor reguli şi cerinţe privind administrarea
testului. Etalonarea constă în realizarea unei scări la care se raportează rezultatele testului.
Etalonarea se face pe un eşantion.
Calităţile ce se cer îndeplinite în cazul testului sunt:
- Fidelitatea. Aceasta reflectă gradul în care aplicarea testului în condiţii apropiate
conduce la rezultate apropiate.
- Validitatea testului indică gradul în care un test măsoară obiectivele pentru care a fost
construit.
Testele post fi clasificate după câteva criterii:
Clasificarea testelor după numărul de indivizi cărora le este aplicat:
- teste individuale
- teste de grupe
- teste combinate
8
Clasificarea testelor după conţinut:
- teste de cunoştinţe (docimologice)
- teste psihologice (de memorie, de imaginaţie, de atenţie etc.)
- teste de personalitate (inventare de personalitate)
Interpretarea datelor furnizate de teste trebuie făcute cu multă precauţie (mai ales în cazul
testelor psihologice şi de personalitate)
TEMĂ
1) Construiţi un test docimologic standardizat. Explicaţi cum se face etalonarea testului.
2) Elaboraţi un studiu de caz pentru un elev deosebit dintr-o clasă pe care o cunoaşteţi
9
CAP. III. ELEMENTE DE STATISTICĂ MATEMATICĂ
Înainte de aborda elementele statisticii matematice este bine să lămurim care sunt beneficiile
aduse de statistică, în cunoaştere, dar şi care sunt limitele cunoaşterii prin statistică.
Obiectul de studiu al statisticii este constituit din fenomenele de masă iar raţionamentul
folosit în mod deosebit este raţionamentul de tip inductiv.
Fenomenele de masă sunt fenomene atipice şi deosebit de complexe. Studiul lor este
important atât dintr-o perspectivă diagnostică cât mai ales din perspectivă prognostică.
Esenţa unui fenomen de masă poate fi cunoscută dacă se iau în considerare un număr mare
de cazuri individuale deoarece indivizii în aparenţă asemănători, au în fond, o multitudine de
trăsături distincte. Fenomenele de masă se caracterizează prin variabilitate.
Fenomenele de masă sunt deterministe de tip stohastic, care se produc în condiţii de
incertitudine.
Demersul uman de cunoaştere folosind statistica tinde, în condiţiile arătate despre
fenomenele statistice, să se raporteze la termenii de constanţă şi stabilitate necesari interpretării
fenomenelor statistice.
Acest lucru este posibil deoarece aceleaşi cauze care operează asupra sistemului studiat
determină permanent rezultatele ce variază continuu între limite bine stabilite şi care pot fi
determinate. În concluzie avem în obiectiv, prin studiul statistic, un sistem controlat de cauze, iar
rezultatele pun în evidenţă stabilitatea între anumite limite. Se spune astfel că procesul este într-o
stare de control statistic (W.E.Deming).
Legile statistice (stohastice) se manifestă sub formă de tendinţe şi sunt valabile pentru un
întreg ansamblu de unităţi.
Statistica se bazează pe principiile teoriei probabilităţilor, pe cerinţele legii numerelor mari,
formulată de J. Bernoulli. Legea numerelor mari afirmă că într-un număr suficient de mare de
cazuri individuale, influenţele factorilor individuali se compensează într-o astfel de manieră încât
determină o valoare tipică a întregului ansamblu.
Statistica abordează fenomenele de masă printr-un studiu cantitativ. În esenţă studiul
presupune următoarele etape:
- observarea statistică
- sistematizarea datelor primare
- prezentarea rezultatelor prelucrării primare sub formă de tabele , diagrame, grafică sau
indicatori
- interpretarea
În situaţia în care studiul statistic s-a făcut pe un eşantion şi nu pe întreaga populaţie,
urmează generalizarea printr-un raţionament inductiv, verificarea ipotezelor, formularea de predicţii
şi formularea concluziilor.
Dacă studiul statistic s-a făcut pe întreaga populaţie, după faza de interpretare se trece la
formularea concluziilor.
Încercând să concluzionăm şi să răspundem la întrebarea pusă la începutul paragrafului,
statistica îşi dovedeşte utilitatea în cercetare deoarece:
- porneşte de la date dispersate şi amorfe aducându-le la o formă ordonată
- studiul efectuat prin mijloace specifice asupra datelor ordonate, arată tendinţa în care se
dezvoltă fenomenul studiat, tendinţă ce poate fi de real folos în elaborarea prognozei.
Limitele analizei statistice se referă la:
- imposibilitatea de a ajunge la concluzii certe asupra unui individ al unei populaţii
pornind de la caracteristicile generale ale populaţiei studiate statistic.
10
- concluziile formulate în analizele statistice sunt doar probabile. Este drept că
probabilitatea poate să fie mai mare sau mai mică şi poate fi prevăzută sau chiar
influenţată.
- costurile mari ale unor cercetări statistice în cazul unor populaţii numeroase (cercetare
totală) sunt evitate prin eşantionare (cercetare selectivă) care prezintă o marjă de
nesiguranţă, atunci când interpretarea pe eşantion este generalizată la populaţia totală.
Cercetarea unui fenomen cu ajutorul metodelor statisticii se numeşte cercetare statistică sau
analiză statistică.
Mulţimea elementelor suspusă unei cercetări statistice se numeşte populaţie statistică sau
simplu, populaţia.
Elementele populaţiei statistice se numesc indivizi sau unităţi statistice.
Exemple:
1) Mulţimea locuitorilor unei regiuni pentru care se studiază cu metode statistice
fenomenul gripei virale poate fi o populaţie statistică.
2) Mulţimea pieselor produse într-un atelier pentru care se studiază fenomenul rebuturilor
poate fi o populaţie statistică, dacă studiul se face cu metodele statisticii
Exemple:
Caracteristica rezultatelor la teza de matematică (exprimată în note întregi) are mulţimea
observaţiilor {1,2,3,….,10}, o mulţime discretă.
Caracteristica înălţimea elevilor clasei a II-a (exprimată în metri) poate fi intervalul
[0,8;1,20].
Scala reprezintă instrumentul care permite exprimarea măsurii în care un individ posedă o
anumită caracteristică.
În principal există scala nominală, ordinală, scală de interval şi scală de raport.
11
Scala nominală este folosită pentru exprimarea unor variabile nominale.
Variabilele nominale determină împărţirea populaţiei statistice în clase disjuncte (fără
elemente comune) a căror reuniune este populaţia statistică întreagă.
Exemplu:
Într-o grupă cu 35 de studenţi se studiază caracteristica (calitativă) culoarea ochilor.
Rezultatele sunt cuprinse în tabelul alăturat:
Tab.2
Clasa Efective
C1 albaştri 5
C2 verzi 12
C3 căprui 8
Total 25
Scala nominală astfel construită are calitatea de a repartiza fiecare individ într-o singură
clasă şi de a nu lăsa nici un individ nerepartizat.
Reprezentarea grafică obişnuită în acest caz este histograma, prezentată mai jos.
12
12
10
8
8
Efective
5 C1 albastri
6
C2 verzi
4
C3 caprui
2
0
Clasa
Fig.1
Spaţiul M aferent scalei nominale nu prezintă nici o structură. Totuşi în M se admite
identitatea notată „=” sau neidentitatea notată „≠”. O altă reprezentare grafică posibilă a
caracteristicii date este camembertul . Se calculează, în procente, efectivele (frecvenţa) pentru
fiecare clasă, apoi, proporţional cu aceste procente, se desenează într-un cerc trei sectoare, câte unul
pentru fiecare clasă.
În cazul rezultatelor exprimate în scală nominală se poate desemna modul (clasa cu cei mai
mulţi indivizi, vezi paragraful următor). În exemplul considerat, modul, notat M0 este C2.
Scala ordinală împarte populaţia în clase care trebuie să satisfacă următoarele condiţii:
- oricare două clase sunt disjuncte
- reuniunea lor este populaţia întreagă
- clasele sunt ordonate (se va înţelege care este prima, a doua, a treia etc.)
Spaţiul M aferent scalei ordinale are structură de ordine.
Exemplu: (adaptat după S. Moscovici şi F. Buschini, 2007).
Nivelul de studiu al unei populaţii dintr-o întreprindere se prezintă astfel:
12
Tab.3
Nivelul de Cu mai Cu mai Cu liceu Cu Cu primul Cu al Cu al Total
studiu puţin de puţin de bacalau ciclu univ. doilea treilea
gimnaziu liceu reat ciclu univ ciclu univ
Efective
Frecvenţa C1 C2 C3 C4 C5 C6 C7
absolută 14 5 19 36 22 27 9 132
Procente 11 4 14 27 17 20 7 100
După cum se observă a doua linie a tabelului conţine frecvenţele cumulate. Logica cumulării
frecvenţelor este următoarea : dacă numărul indivizilor din clasa C6 este 27 şi a celor din clasa C7
este 9 (vezi tabelul 3) atunci evident că 27+9=36 indivizi au absolvit al doilea ciclu universitar etc.
Datele cuprinse în fiecare din cele două tabele pot fi reprezentate prin două histograme.
Scala de interval este folosită în cazul caracteristicilor cantitative. Punctul zero al scalei şi
unitatea de măsură pot fi alese arbitrar.
Exemple:
1) Măsurarea timpului se face pe o scală de interval în care punctul 0 este anul naşterii lui
Iisus Hristos. Punctul 0 nu este pentru toate popoarele acelaşi.
2) Temperatura se măsoară de asemenea pe o scală de interval cu precizarea că scala
Celsius, de exemplu, are punctul 0 ales ca nivel al temperaturii la care apa îngheaţă. Pe
scara Fahrenheit acelaşi fenomen fizic se întâmplă la 32o F, deci punctul 0 ocupă o altă
poziţie.
Datorită localizării arbitrare a punctului 0 suma a două valori precum şi raportul acestora nu
are sens. În schimb are sens distanţa dintre două valori (diferenţa) precum şi suma sau raportul
distanţelor. Spaţiul M aferent scalei de interval are structură de ordine.
Exemplu:
Dacă distanţa (în timp, diferenţa) dintre revoluţia burgheză (1848) şi insurecţia armată
(1944) este de 96 de ani iar distanţa (în timp) dintre insurecţia armată şi căderea comunismului
(1989) este de 45 de ani atunci distanţa între revoluţia burgheză (1848) şi căderea comunismului
13
(1989) este 141 ani. Se poate calcula ca diferenţă sau ca sumă de diferenţe 96+45=141, acestea fiind
operaţii cu sens pe o scală de intervale.
Distanţele în timp între evenimente pot fi comparate deoarece în M există o structură de
ordine.
Scala de raport se caracterizează prin alegerea punctului 0 (original) în mod natural. Acesta
semnifică absenţa totală a fenomenului studiat. Unitatea de măsură se alege arbitrar.
Această scală determină pe M o structură de ordine, dar şi o structură algebrică (corp
ordonat).
Pe această scară de raport au sens toate operaţiile valabile pe scala de interval. În plus are
sens suma şi raportul a două valori ale variabilei.
Exemplu:
Scala de notare este o scală de raport. Punctul 0 (de regulă 1) semnifică lipsa totală a
fenomenului studiat (cunoştinţe, competenţe, abilităţi etc.).
Calculul mediei notelor foloseşte o sumă, operaţie permisă de scala de raport.
În concluzie, pentru caracteristicile calitative se folosesc scala nominală şi scala ordinală iar
pentru cele cantitative scala de interval şi scala de raport. Cantitatea de informaţie oferită prin
folosirea scalelor creşte de la scala nominală (cu cea mai mică cantitate de informaţie) până la scala
de raport (cu cea mai mare cantitate de informaţie).
În afară de scalele amintite ştiinţele sociale mai folosesc şi alte tipuri, din care amintim,
scala de distanţă socială, scala Thurstone pentru măsurarea atitudinilor, scala Lickert.
Scala Lickert este o metodă simplă de colectare de informaţii. În construirea ei se pleacă de
la baterii de enunţuri pe care subiecţii trebuie să le evalueze. Enunţurile sunt redactate, de obicei în
manieră condiţională.
Exemplu:
Dacă un elev este prins copiind, el trebuie drastic pedepsit!
Urmează apoi completarea, de către fiecare individ aflat în populaţia statistică a unei matrici de
forma:
Tab.5
Aprobare totală Aprobare Nehotărât Dezaprobare Dezaprobare
totală
5 4 3 2 1
Dacă, de exemplu, bateria de enunţuri are 10 enunţuri (legate de tema copiatului, în sensul
exemplificat) cotate de la 1 la 5, scorul maxim poate fi 50 iar cel minim 10. Aşadar, există 41 de
nivele pe care se pot situa atitudinile indivizilor în raport cu copiatul.
Dacă majoritatea răspunsurilor înregistrează nivele ridicate înseamnă că populaţia statistică
este majoritar împotriva copiatului. Dacă din contră, majoritatea răspunsurilor sunt situate pe nivele
mici, înseamnă că populaţia statistică este tolerantă faţă de copiat.
Grupări de date
14
Exemplu:
1) Fie o clasă de 32 de elevi care se supune unei cercetări statistice după caracteristica
calitativă nivel de pregătire la matematică. Rezultatele unui test la matematică, obţinute
prin aplicarea scalei de interval (scala de notare) produce următoarele informaţii:
Tab. 6
Nr.crt. Numele elevului Nota
1 Abrudeanu I. 7
2 Bărbulescu A. 8
.. ……………………. …
.. ……………………. …
32 Vasilescu M. 5
Este evident, din tabelul 7 că nota 8a fost obţinută de 7 elevi, nota 9 de 4 elevi, nota 3 de 1
elev etc.
Gruparea datelor în acest mod se numeşte seria statistică grupată sau repartiţie.
Cu notaţiile deja acceptate, f(8)=7, f(9)=4, f(3)=1, şi în general f(x)=nx
nx (număr de indivizi) se numeşte frecvenţa absolută
n
Dacă N este numărul total de indivizi α = x se numeşte frecvenţă relativă (vezi scala
N
ordinală)
Alt exemplu:
2) Studiind tensiunea la un număr de 100 de arzătoare se obţine următoarea repartiţie
empirică:
Tab.8
Nr.crt. tensiune
1 134
2 133
3 136
… …
… …
100 148
Se cere scrierea repartiţiei statistice (exemplu adaptat după Reischer C., Sâmboau A, 1972)
Rezolvarea problemei o vom face în două etape. În prima etapă vom scrie valorile
tensiunilor începând de la cea mai mică 122, până la cea mai mare 148 având grijă să numărăm
unităţile statistice corespunzătoare fiecărei tensiuni. Se va obţine tabelul 9.
Tab.9.
Tensiune Nr. de arzătoare Tensiune Nr. de arzătoare
122 1 … …
123 2 … …
124 1 … …
125 1 146 2
… … 147 1
… … 148 2
15
Informaţia cuprinsă în tabelul 9 este incomodă, tabela este prea extinsă. Concatenăm
informaţia exprimând tensiunea pe intervale aşa cum se vede în tabelul 10.
Tab.10
Tensiune Nr.de
aprinzătoare
122-124 4
125-127 5
128-130 10
… …
… …
146-148 5
Total 100
Notă!
Evident, pentru simplificarea expunerii, tabelele nu conţin toate datele, pentru
detalii poate fi consultată sursa bibliografică citată.
Observaţie:
În situaţia în care gruparea datelor se face pe intervale, valoarea medie a capetelor
intervalului va reprezenta intervalul. Pe intervalul[122;124] valoarea medie este 123, pe intervalul
[125;127] valoarea medie este 126 etc. Valoarea medie astfel calculată, se numeşte valoare centrală
a intervalului.
Am amintit deja că seriile statistice pot fi reprezentate prin histograme dar şi folosind
camambertul. Adăugăm la aceste modalităţi de reprezentare grafică a seriilor statistice,
reprezentarea prin batoane şi prin poligonul frecvenţelor.
Pentru exemplificare folosim tabelul 7 pentru care construim o reprezentare în batoane.
Note Test
10
Frecventa absoluta
0
1 2 3 4 5 6 7 8 9 10
Nota
Fig. 2
Dacă punctele obţinute la capetele segmentelor (a batoanelor) se unesc, se obţine un poligon
numit poligonul frecvenţelor (absolute).
Note Test
Fig.3
10
Frecventa absoluta
0
1 2 3 4 5 6 7 8 9 10
Nota
16
Modificăm tabelul 7, înlocuind frecvenţele absolute cu frecvenţele relative.
Tab.11
Nota 1 2 3 4 5 6 7 8 9 10
Frecvenţa 0 0 0.062 0.156
relativă
Temă:
Completaţi tabelul 11 cu frecvenţele relative care nu au fost calculate. Reprezentaţi grafic
seria statistică din tabelul 11.
Indicaţie:
nx
Frecvenţa relativă se calculează cu formula α = . Pe axa verticală (0y) se ia o unitate de
N
măsură suficient de mare pentru a putea reprezenta frecvenţa relativă într-o manieră acceptabilă
x1 x 2 ... x N
Fie seria statistică unde xi reprezintă valorile caracteristice, iar ni
n1 n 2 ... n N
frecvenţele corespunzătoare.
x ⋅ n + x 2 ⋅ n2 + .... + x N ⋅ n N
Numărul x= 1 1 se numeşte media aritmetică. Suma
n1 + n2 + .... + n N
n1 + n2 +.... + nN = N
Exemplu:
1 2 3 4 5 6 7 8 9 10
Informaţiile din tabelul 7 se transcriu astfel:
. Media
0 0 1 2 5 2 9 7 4 2
0 *1 + 0 * 2 + 1 * 3 + 2 * 4 + 5 * 5 + 2 * 6 + 9 * 7 + 7 * 8 + 4 * 9 + 2 * 10
aritmetică este x = = 6,98
32
Observaţii:
Media aritmetică nu ne poate da în orice condiţii informaţii utile privind starea în care se
găseşte populaţia studiată. Uneori reprezentativitatea mediei este pusă la îndoială. Admitem, de
exemplu, că un elev a primit la o materie o notă de 2 şi una de 8 (media 5). Ce-mi spune această
medie? Dacă am renunţa la informaţia furnizată de ea am putea crede că elevul este slab pregătit
(nota 2) şi că nota 8 a fost un accident sau invers. Singura măsură corectă ar fi ca elevul să fie în
continuare ţinut sub observaţie, pentru a vedea care este nivelul său real de pregătire.
Problema reprezentativităţii mediei se poate rezolva fie prin înlăturarea notelor extreme, fie
prin gruparea notelor în clase omogene, fie prin calcularea coeficientului de variabilitate (vezi
paragraful următor). În toate situaţiile, o judecată pripită, făcută în baza mediei, ar putea duce la
concluzii greşite.
Admitem, de exemplu că un elev a înregistrat la o anumită materie notele
1,1,3,3,8,8,10,10,10. Media este 54:9=6
Dacă am neglija cele două note de 1(note extreme, considerând , de exemplu, că au fost
obţinute din cauze accidentale) media ar fi 52:7=7,17. dacă am grupa notele în clase omogene
{1,1},{3,3},{8,8},{10,10,10} şi am calcula media ca medie a mediei claselor am obţine
1+3+8+10:4=5,5.
17
Cu toate metodele de calculare a mediei folosite, dilema reprezentativităţii ei a rămas. O
singură concluzie se poate trage: „valoarea” elevului este undeva situată între 5,5 şi 7,17. vom relua
problema reprezentativităţii medie, folosind coeficientul de variabilitate.
Observaţie:
În cazul seriilor statistice reprezentate pe intervale, valoarea xi din formulă este valoarea
centrală a intervalului.
σ2 =
(x ) 2
( )
− x n1 + x 2 − x n2 + ... + x N − x n N
1
2
( ) 2
Exemple:
Reluăm repartiţia din tabelul 7. Mo=7 deoarece nota 7 corespunde celei mai mari frecvenţe
(9).
Pentru a înţelege modul în care se determină Me, scriem toate cele 32 de note astfel:
16 note 16 note
e
3 4 4 5 5 5 5 5 6 6 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 9 9 9 9 10 10
M
18
verificarea gradului de omogenitate a datelor. Această verificare se face prin măsurarea şi analiza
împrăştierii şi concentrării faţă de valorile centrale.
Noţiunea de împrăştiere, variaţie sau dispersare se leagă de o valoare centrală.
De exemplu, în cazul următoarelor două populaţii statistice, înregistrate prin valorile
caracteristicii
1) {2;2;2;10 ;18 ;18 ;18 } şi
2) {9;9;9;9;10 ;11 ;11 ;11 ;11 }
se observă următoarele:
- media şi mediana sunt egale
- seria a doua este mai omogenă (împrăştierea este mai mică faţă de valorile centrale)
Informaţiile furnizate de valorile centrale sunt deci mai de încredere pentru seria 2.
Înainte de a da recomandări ce pot fi urmate în cazul unor serii statistice neomogene, pentru
care putem culege informaţii despre tendinţele de dezvoltare ale fenomenelor cu probabilitate destul
de mică , să mai prezentăm o modalitate prin care putem admite sau respinge reprezentativitatea
mediei.
σ
Coeficientul CV x = ∗100 se numeşte coeficient de omogenitate sau de variaţie
x
(variabilitate). Coeficientul de variaţie permite comparea variabilităţii, iar valorile sale sunt situate
între 0 şi 100. Astfel, cu cât valorile sunt mai apropiate de 0, cu atât seria este mai omogenă. Practic
s-a stabilit că dacă CV este mai mare ca 35% colectivitatea este eterogenă.
Calculul şi analiza indicatorilor împrăştierii în jurul tendinţei centrale este util pentru
cunoaşterea fenomenelor de masă şi a tendinţei centrale, atât în cercetare cât şi în economie sau
societate.
Aplicaţie:
Revenim asupra seriei statistice cu valorile {1,1,3,3,8,8,10 ,10 ,10 } pentru calcularea
coeficientului de variabilitate.
Am stabilit că media x =6
Calculăm dispersia σ2 apoi abaterea medie pătratică σ.
2 * (1 − 6) 2 + 2 * (3 + 6) 2 + 2 * (8 − 6) 2 + 3 * (10 − 6) 2 2 * 25 + 2 * 9 + 2 * 4 + 3 * 16
σ2 = = = 13,77
9 9
σx = 13 ,77 = 3,71
σx 3,71
CV x = * 100 = * 100 = 0,618 * 100 = 61,8
x 6
CV fiind mai mare ca 35%, colectivitatea este eterogenă, deci media aritmetică nu este
reprezentativă.
De un real folos în studierea unui fenomen statistic sunt studiile referitoare la caracterizarea
asimetriei şi aplatizării curbei frecvenţelor.
Pe scurt, lucrurile se prezintă astfel: fenomenele normale (majoritatea) au repartiţia
reprezentată prin curba (clopotul) lui Gauss (fig. 4)
Fig.4
19
În această situaţie Mo, Me şi x se confundă.
O repartiţie asimetrică (oblică) poate avea una din următoarele reprezentări:
Fig. 5 Fig. 6
Fig. 5, de exemplu, spune că majoritatea indivizilor au rezultate sub medie ( Mo <x ) şi mai
precis, mai mult de jumătate din indivizi au rezultate sub medie ( Me < x ).
Temă:
Interpretaţi graficul din fig. 6
Leptokurtică Mezokurtică
Fig. 8
Fig. 7 Platikurtică
Fig. 9
20
Aplatizarea (boltirea) se poate determina folosind graficele sau prin calcularea unor
coeficienţi (coeficienţii lui Pearson sau a lui Fisher).
Analizele făcute până aici, au presupus studiul unei singure variabile, cu precizarea că
aceasta este unimodală (Mo este unic), fapt care, nu întotdeauna concordă cu realitatea.
În plus, într-o cercetare pot apărea mai multe variabile.
Considerăm variabila X şi variabila Y. Valorile variabilei X au fost sistematizate pe k
intervale, iar cele ale variabilei Y pe p intervale.
xij reprezintă valoarea xi a variabile X ce se găseşte în intervalul i dar se găseşte şi în
intervalul j al variabilei Y. Evident i ia valori de la 1 la k iar j de la 1 la p.
Se notează cu nij numărul indivizilor la care s-a înregistrat valoarea xij.
Acest mod de organizare a datelor va fi folosit în paragraful următor.
Tab.13
Statura
cm 153 156 159 162 165 168 171 174 177 180 Total
Picioare
cm
71 2 2 3 2 x x x x x x 9
74 1 1 9 7 2 1 x x x x 21
77 x 2 3 7 13 2 x x x x 27
80 x 1 x 2 4 11 4 x x x 22
83 x x x x x 1 4 3 x x 8
86 x x x x x 1 x 2 1 2 6
Total 3 6 15 18 19 16 8 5 1 2 93
În practică, după cum am mai arătat, unele variabile evoluează dependent de alte variabile.
Dacă notăm cu y o caracteristică dependentă şi cu x cea independentă relaţia între x şi y este
y=f(x)(legătură simplă).
În situaţia în care variabilele independente sunt mai multe x1,x2,….xn, relaţia de dependenţă
se scrie y=f(x1,x2,….xn) (legătură multiplă).
21
Dependenţa variabilelor poate fi directă (dacă x creşte, y creşte sau dacă x scade, y scade),
indirectă (dacă x creşte, y scade sau dacă x scade, y creşte), dar poate fi şi liniară (funcţia f amintită
mai sus este de tip liniar) sau neliniară (funcţia f este neliniară, exponenţială, de tip parabolă,
hiperbolă etc.).
Regresia exprimă modalitatea în care o variabilă(sau mai multe) influenţează altă variabilă şi
se exprimă în formă analitică.
Corelaţia exprimă gradul în care o variabilă (sau mai multe) influenţează alte variabile.
Studiul regresiei şi corelaţiei este foarte important în cercetare (şi nu numai) deoarece,
cercetătorul, studiind variaţia variabilei independente poate să prognozeze variaţia variabilei
dependente.
22
Pentru exemplificare folosim informaţiile furnizate de tab.13:
Tab.14
X Y
71 153-162
74 153-168
77 156-168
80 156-171
83 168-174
86 168-180
În coloana lui Y pentru fiecare valoare a lui X am scris valorile extreme pe care le ia Y. Cele
două coloane dovedesc că X şi Y se află în legătură directă.
Temă:
Folosind datele din tab.12 şi metoda seriilor paralele, studiaţi relaţia dintre cele două
variabile.
În situaţia în care datele supuse prelucrării statistice sunt numeroase, metodele elementare
pe care le-am prezentat nu pot fi aplicate.
Vom explica, în cele ce urmează, cum putem determina, folosind coeficientul de corelaţie şi
raportul de corelaţie legătura dintre două variabile.
Pentru început să ne imaginăm că cele două variabile au fost reprezentate prin puncte.
„Norul” de puncte poate fi aproximat printr-o dreaptă paralelă sau nu cu axa 0x. Ecuaţia
acestei drepte este y=ax+b. Se pune problema determinării coeficienţilor a şi b. O metodă simplă,
dar nu întotdeauna aplicabilă, este metoda centrelor de greutate. Dacă „norul” este format de 6
puncte necoliniare, atunci coordonatele centrului de greutate al unui prim triunghi format din 3
puncte poate fi determinat. La fel şi centrul de greutate a celui de-al doilea triunghi. Dreapta căutată
este dreapta ce trece prin cele centre de greutate şi coeficienţii a şi b se pot afla.
În cazul în care „norul” de puncte este numeros se poate folosi metoda celor mai mici
pătrate. Aceasta constă în exprimarea diferenţei dintre yi, ordonata punctului Ai (xi,yi) al norului şi
ordonata punctului de abscisă xi situat pe dreapta y=ax+b, astfel:
di=yi-(axi+b)
Pentru determinarea coeficienţilor a şi b se pune condiţia ca S=Σdi2 să fie minimă.
După efectuarea calculelor se obţine:
BE − CD B (CD − BE ) − E ( AC − B 2 )
a= şi b =
AC − B 2 C ( AC − B 2 )
unde A=Σxi2, B=Σxi, C=N, D=-Σxiyi, E=-Σyi iar F=Σyi2
Dependenţa a două variabile poate fi apreciată cu ajutorul măririi abaterii valorilor empirice
de tipul y, faţă de linia de regresie, adică, faţă de valorile teoretice (cele determinate de funcţia de
regresie) de tipul y*.
În cele ce urmează, vom aborda corelaţia liniară simplă.
Există două situaţii extreme:
1) panta dreptei de regresie este 0 (b=0), atunci variabilele nu sunt în legătură.
2) punctele corelogramei (reprezentare grafică) se găsesc pe dreapta de regresie,
deci valorile empirice de tip y coincid cu cele estimate de tip y*. în această
situaţie corelaţia este perfectă
3) situaţia intermediară este prezentată în fig.10
23
P(x,y) este un punct al corelogramei
Q(x, y ) S(x,y*)
y* se calculează ca valoare a funcţiei y=ax+b în abscisa x a punctului P. Din acest motiv vom nota
yx*.
Se observă că:
PQ=y- y şi reprezintă variaţia totală a lui y faţă de media sa y .
PS= y- yx* şi reprezintă variaţia neexplicată de regresie.
SQ= yx* - y şi reprezintă variaţia explicată de regresie.
R = 1−
∑ y−y( ) 2
Dacă cei doi indicatori nu sunt egali, legătura nu este liniară şi se poate folosi doar raportul
de corelaţie pentru care se impune determinarea funcţiei de corelaţie.
În practică, rezolvarea acestor probleme este simplificată, de utilizarea tehnicii de calcul.
BIBLIOGRAFIE
24
Andrei, T , 1995,Statistică. Teorie şi aplicaţii Ed. ALL
Bucureşti
Cucoş, Constantin, 2001, Pedagogia, Polirom, Iaşi
Drăgan ,I ,Nicola, I , 1995, Cercetarea psihopedagică,Ed.
Tipomur, Tg. Mureş
Enăchescu, C, 2005,Tratat de teoria cercetării, Ed.
Polirom,Iaşi
Isac-Maniu, A,Mituţ , C,2004, Statistica Ed. Universitară ,
Bucureşti
Moscovici, S, Buschini ,F, (coord.) 2007 ,Metodologia
ştiinţelor socioumane, Ed. Polirom,Iaşi
King ,R ,2005, Strategia cercetării ,Ed. Polirom,Iaşi
Silverman ,D ,Interpretarea datelor calitative , Ed.
Polirom,Iaşi
25