Sunteți pe pagina 1din 25

METODE DE CERCETARE

( elaborarea proiectelor, curs)

Lect. Univ. Dr Alexandru Blaga


Universitate de Vest „Vasile Goldiş” Arad

1
CAP. I. CONSIDERAŢII GENERALE DESPRE CERCETAREA
ŞTIINŢIFICĂ

1.1. Cercetarea din perspectivă gnoseologică

Conform DEX (on-line) gnoseologie este „teoria filosofică asupra capacităţii omului de a
cunoaşte realitatea şi de a ajunge la adevăr, teoria cunoaşterii”.
Aceeaşi sursă defineşte epistemologia ca „parte a gnoseologiei care studiază procesul
cunoaşterii aşa cum se desfăşoară în cadrul ştiinţelor, teorie a cunoaşterii ştiinţifice”.
Ronald F.King (Strategia cercetării, 2005, p.36) este de părere că în cazul cercetării „se pun
două întrebări critice : ce şi cum putem cunoaşte? Prima întrebare reprezintă ontologia, a doua
epistemologia”.
Termenii „a propune” şi „a dispune” sunt termenii care ar putea clarifica răspunsurile la
întrebările formulate.
În perspectivă ontologică, folosind termenii propuşi, întrebările se reformulează, se dezvoltă
astfel: Oare lumea ni se oferă, ni se propune spre înţelegere sau noi ne propunem înţelegerea ei?
În perspectivă epistemologică interogaţia este următoarea:
Oare lumea este cea care ne dictează atunci când ne evaluăm afirmaţiile, permiţând să
păstrăm partea adevărată şi să dispunem eliminarea a ceea ce este fals, sau criteriile de eliminare
sunt la discreţia evaluatorului?
În domeniul ştiinţelor sociale, spre deosebire de domeniul ştiinţelor exacte, unde disputa
asupra cunoaşterii ştiinţifice este mai puţin aprinsă, există câteva obiecţii serioase cu privire la
cercetare.
1) Societatea este un fenomen prea complex, deci judecăţile produse sunt fie irelevante,
fie banale.
2) Judecăţile de tip lege privind societatea nu pot prezenta interes, trăim într-un anumit
spaţiu şi timp deci ele nu pot fi veşnic adevărate. În ştiinţele exacte (fizică, chimie,
matematică) legile descoperite sunt veşnic valabile
3) Un observator nu obţine obiectivitate ştiinţifică deoarece atât observatorul cât şi
ceilalţi indivizi, membrii ai societăţii, trăiesc în acelaşi mediu uman.
4) Indivizii umani sunt imposibil de abordat din perspectiva obiectivităţii şi a constanţei
ştiinţifice, deoarece aceştia dispun de libertate şi voinţă, deci sunt schimbători.

Susţinătorii necesităţii cercetării în domeniul ştiinţelor sociale, afirmă că pentru ca aceasta să


fie utilă, trebuie îndeplinite câteva condiţii:
- cercetarea să fie empirică, să se bazeze pe observaţii şi experienţe în mediul social
- rezultatele cercetării să fie verificabile. Aceasta presupune posibilitatea aplicării de
probe care constituie modalităţi de a distinge adevărul de neadevăr, de fals
- cercetarea va trebui să fie ne-normativă, adică verificarea (demonstrarea) ipotezelor se
va face independent de preferinţele cercetătorului
- informaţiile obţinute în urma cercetării trebuie să fie transmisibile şi generale
- fenomenele cercetate vor fi prezentate în final în manieră cauzală
- rezultatele oricăror cercetări vor fi considerate provizorii. Demersul în cercetare va putea
fi reluat atunci când se va considera necesar.
Ştiinţa, în general, este nomologică, adică produce afirmaţii de forma:
„Pentru toţi X şi toţi Y, dacă condiţiile rămân neschimbate, dacă X….. atunci Y ….”. Afirmaţia este
uneori modificată, astfel: „Pentru toţi X>i şi toţi Y<j, dacă toate condiţiile rămân neschimbate, dacă
X….. atunci Y ….”
În sfera epistemologică a ştiinţelor contemporane, asistăm în ultimul timp, la o situaţie
contradictorie, aparent paradoxală: tendinţa de apropiere a ştiinţelor socio-umane de ştiinţele
naturii dar şi o delimitare tot mai accentuată a sferelor de cunoaştere.
2
• Prima tendinţă se explică prin unitatea lumii materiale în care are loc orice cercetare.
• A doua tendinţă se aplică pe fondul unităţii de ansamblu a ştiinţelor, unde se acumulează
tot mai multe deosebiri în detalii, ca efect al unor cercetări ştiinţifice particulare şi a unor
reflecţii filosofice de amploare.

După unii cercetători (Diltheiy, de exemplu) distincţia dintre ştiinţele socio-umane şi


ştiinţele naturii, are la bază diferenţa dintre explicaţie, proprie ştiinţelor naturii şi înţelegere,
proprie ştiinţelor socio-umane. Explicaţia vizează cauzele, iar înţelegerea, referindu-se la fenomen,
solicită un efort de intuiţie şi imaginaţie.

1.2. Subiect, teorie şi metodă în cercetare

Subiectul cercetării va trebui să aibă câteva calităţi:


- să fie important
- să fie relevant pentru lumea în care trăim (acum!)
- să cuprindă o aserţiune numită ipoteză urmată de argumentaţie
Ipoteza are forma tipică: „Dacă X …. atunci Y…..”

Exemple:
1) Proiectul de cercetare are ca subiect evoluţia concepţiei despre educaţie în Antichitate.
Cercetarea se va face pe baza studiului bibliografiei (vezi cap. II).

2) Proiectul de cercetare are ca subiect nemulţumirea educatorilor privind salarizarea în


învăţământul românesc.
O formulare a ipotezei ar putea fi următoarea:
Dacă salariile în învăţământ nu cresc, nemulţumirea educatorilor va creşte.
Formularea ipotezei poate fi dezvoltată prin precizarea unor detalii (categorii de personal
didactic determinate de vechime, învăţământ preuniversitar sau universitar, procente de creştere
etc.)

Existăm într-o lume nestructurată. Demersul cognitiv este orientat în direcţia ordonării
fazelor, evenimentelor, a reacţiilor în scopul realizării unei cunoaşteri sistemice. Aceasta este scopul
teoriei.

Exemplu:
Rezultatele brute ale unui test docimologic sunt nesistematizabile. Teoria care poate
sistematiza rezultatele este statistica.
Metoda este modalitatea de a ajunge la o concluzie despre ipoteza cercetării.
Concluzia despre ipoteză poate fi:
1) adevărată sau falsă
2) deocamdată adevărată sau falsă
3) probabil adevărată sau falsă

TEMĂ
Alegeţi un subiect de cercetare în domeniul ştiinţelor educaţiei. Formulaţi ipoteza cercetării.

3
CAP. II. PRACTICA CERCETĂRII

2.1. Alegerea temei (subiect) de cercetat

Criteriile care se vor avea în vedere la alegerea temei de cercetare sunt:


- experienţa personală şi pasiunea pentru un anumit domeniu
- extensia (volumul) temei să fie în concordanţă cu posibilităţile de abordare
- tema va propune remedierea unor neajunsuri

2.2. Tehnica documentării va satisface următoarele exigenţe:

- Înlăturarea unei bibliografii supraabundente sau din contră;


- Lectura pe care o face cercetătorul în vederea documentării va fi o lectură de calitate;
- Cercetătorul trebuie să fie un bun cunoscător al specialităţii dar şi un cunoscător a
disciplinelor de graniţă, ale domeniului;
- O bună cunoaştere a tehnicilor de clasificare a bibliotecii (catalog pe materii, catalog
alfabetic) se impune de asemenea;

După întocmirea listei bibliografice urmează studierea bibliografiei.


- Documentarea va fi selectivă şi va cuprinde lucrări de valoare, reprezentative pentru
domeniu;
- Documentarea se va face cu spirit critic, informaţia va fi trecută prin filtrul
cercetătorului;
- Documentarea va fi continuă. Ea se va desfăşura şi în timpul cercetării;
- Lectura cu caracter de documentare presupune citirea şi consemnarea celor citite;
- Citirea poate fi progresivă. O astfel de citire are ca scop parcurgerea rapidă a
informaţiei;
- Citirea poate fi exegetică. O astfel de citire are ca scop orientarea cu precădere spre
părţile mai dificil de înţeles;
- Documentarea se poate face direct pe sursă, prin folosirea unor semne convenţionale sau
se va face pe fişe bibliografice.

2.3. Ipoteza în cercetarea ştiinţifică

Aşa cum am mai arătat (cap. I), ipoteza este un enunţ a cărui valoare de adevăr (adevărat sau
fals) este probabilă (în faza de început a cercetării). Cercetarea va dovedi exact valoarea de adevăr a
ipotezei.
Cea mai simplă ipoteză statuează că o variabilă X influenţează (cauzează sau declanşează)
variabila Y.
Ipoteza confirmată devine teorie dar şi practică. După stabilirea ipotezei urmează testarea şi
apoi valorificarea ei. Pe parcursul testării ipoteza poate suferi modificări.
Ipoteza specifică pleacă de la presupunerea că doar modificările ce se produc s-ar datora
modificărilor factorului X, aflat sub controlul cercetătorului.
Ipoteza nulă pleacă de la presupunerea că toate modificările ce se produc s-ar datora unor
factori întâmplători.
Respingerea ipotezei nule întăreşte ipoteza specifică.
Ipoteza nulă este o ipoteză statistică şi poate fi respinsă dacă probabilitatea factorilor aleatori
este sub 50%. În caz contrar ea poate fi admisă.
Admiterea sau respingerea ipotezei nule se poate face pe baza calculului unor indici de
semnificaţie stabiliţi prin „testul z” sau „testul t”.
În unele cercetări, numite cercetări descriptive, ipoteza nu trebuie formulată explicit.

4
2.4. Metodica cercetării

Metodica cercetării include:


- stabilirea metodelor pentru recoltarea datelor, prelucrarea şi interpretarea lor
- stabilirea demersului logic (declarativ, inductiv)
- eşantionarea pentru cercetarea dar şi pentru grupul martor

Metodele folosite în cercetare sunt:


- observarea
- experimentarea
- teste
- anchetă (convorbiri, chestionare)
- studiul produselor
- studiul documentelor etc.
Complexitatea fenomenelor studiate, obligă cercetătorul la a lua în considerare mai multe
metode simultan.

2.5. Prelucrarea şi interpretarea datelor

Interpretarea datelor este operaţia prin care se descifrează semnificaţia informaţiei obţinute
din datele colectate.
Prelucrarea datelor este în principal o operaţie statistică care are în vedere calcularea:
- valorilor centrale (media, mediana, modul)
- abaterile faţă de tendinţa centrală (abaterea centrală, abaterea standard, dispersia)
- coeficientul de corelaţie
Interpretarea şi prelucrarea datelor implică:
- operaţii logice (analiză, sinteză, comparaţie, abstractizare, generalizare)
- raţionamente (inductiv, deductiv)
- cultură psihopedagogică

2.6. Eşantionarea

TEMĂ:De ce este nevoie de eşantionare ?


Arătaţi care sunt avantajele şi dezavantajele eşantionării

Extinderea concluziilor desprinse din eşantionare se cheamă estimare.


Eşantionarea este de mai multe tipuri:
- Eşantionarea simplă aleatoare: prin procedeul loteriei, sau alegerea celui de al n-lea
individ dintr-o populaţie ordonată aleator, sau tabele cu numere aleatoare etc.
- Eşantionarea stratificată. Populaţia statistică se împarte iniţial în straturi, se alege apoi
un eşantion din fiecare strat prin eşantionare simplă , aleatoare
- Eşantionare fixă (panels). Eşantionul este ales fie în mod aleator, fie stratificat. Din
timp în timp, se fac cercetări asupra eşantionului ales. Se studiază astfel tendinţa în timp
producerii fenomenului.
- Eşantionul experimental (E.E.), este cel asupra se acţionează cu ajutorul factorului
experimental.
- Eşantionul de control(martor) (E.C.) este eşantionul asupra căruia nu se acţionează în
timpul cercetării.
Uneori, în cercetare, se foloseşte tehnica „înainte şi după” ce are în vedere un singur
eşantion. Aici se fac măsurători înainte şi după introducerea factorului experimental.

5
Între EE şi EC, pe cât posibil, trebuie să existe o egalizare – omogenizare. Aceasta se obţine
prin:
- eşantionare corelată (fiecărui individ din EE îi corespunde un individ asemănător din
EC)
- stabilirea de sub-eşantioane şi compararea lor. Pe baza unui test iniţial, de exemplu se
stabilesc sub-eşantioane cu indivizi mediocri, buni şi foarte buni, atât în EE cât şi în EC
În final eşantioanele se compară între ele.
- controlul statistic constă în testarea prealabilă a celor două eşantioane, calcularea pe
baza datelor a tendinţei centrale şi a variabilităţii (gradul de la care media aritmetică este
semnificativă).
Cu cât diferenţele dintre indici sunt mai mici, cu atât eşantioanele sunt mai omogene şi
tendinţa ca factori necontrolaţi să intervină în experiment este mai redusă.

2.7. Metode de cercetare

Experimentul: După E. Planchard, (Cercetare în pedagogie, 1972, EDP) „metoda


experimentală constă, în primul rând, în introducerea sau suprimarea unuia sau a mai multor
factori, bine determinaţi într-o situaţie cunoscută, în vederea verificării rezultatului acestei
intervenţii”.
Variabilele care intervin în experiment sunt de mai multe tipuri:
- variabile independente
- variabile dependente
- variabile intermediare
Experimentul are câteva funcţii:
- gnoseologică sau de cunoaştere a unor aspecte noi
- praxiologică ce presupune modificare acţiunii, perfecţionarea ei
Fazele experimentului sunt următoarele:
- faza preliminară, în care se selectează eşantioanele, se cristalizează variabilele, se
precizează factorul experimental care încă nu intervine, se stabileşte strategia
experimentării.
- faza administrării factorului experimental
- faza înregistrării rezultatelor
Pentru a explica modul în care se desfăşoară o cercetare facem notaţiile:
t1,t2,t3 - fazele cercetării
Vd1 – variabila dependentă la începutul experimentului
Vd2 – variabila dependentă la sfârşitul experimentului
f.e. – factorul experimental

Schema următoare lămureşte modul cum pot fi citite rezultatele experimentului în cazul
celor două eşantioane EE şi EC.
Tab.1
Eşantion Variabila Experiment Variabila Diferenţe Nr. crt.
dependentă dependentă
EE Vd1 Vd1+f.e. Vd2 Vd2 -Vd1 1
EC Vd1 Vd1+0 Vd2 Vd2 -Vd1 2
Faza t1 t2 t3 - -
Diferenţele (1) respectiv (2) arată măsura în care starea variabile dependente Vd, după o
perioadă de timp se schimbă.
Mai mult, în cazul (1), diferenţa arată şi măsura în care factorul experimental şi-a făcut
efectul (sau nu).
Diferenţa dintre (1) şi (2) arată măsura în care factorul experimental şi-a făcut (sau nu)
efectul atunci când factorul experimental a intervenit în EE, dar nu a intervenit în EC.

6
Experimentele pot fi clasificate astfel:
- experimentul de laborator. Acesta se realizează într-un spaţiu special amenajat unde se
înlătură influenţa unor factori întâmplători.
- experimentul natural. Acesta se desfăşoară într-o ambianţă naturală, în procesul de
activitate.

Cercetarea corelaţională

În cazul cercetării experimentale cercetătorul intervine asupra variabilelor independente


studiind apoi efectele acestei intervenţii. În principal deci, experimentul presupune manipularea
conştientă a unor variabile.
Uneori cercetătorul nu poate manipula variabile.
În aceste cazuri se rezumă la a surprinde corelaţiile dintre variabile. Cercetarea corelaţională
este descriptivă.
În cazul experimentului variabila independentă influenţează variabila dependentă. În cazul
cercetării corelaţionale variabila independentă este asociată variabilei dependente şi o poate
influenţa.
Corelaţia este calculată cu formule speciale. Mărimea şi semnul (plus sau minus) ne indică
intensitatea şi direcţia ei.

TEMĂ
1) Imaginaţi o cercetare experimentală explicând ipotezele cercetării, variabilele şi modul în
care vă alegeţi eşantionul
2) Imaginaţi o cercetare corelaţională evidenţiind variabilele pentru care credeţi că veţi putea
demonstra că sunt în corelaţie.

Metoda observaţiei

Observaţia presupune urmărirea faptelor în desfăşurarea lor firească, naturală. Observatorul


nu intervine, el înregistrează doar, aşteptând producerea fenomenelor.
Cerinţele privind realizarea observaţiei sunt:
- elaborarea unui plan de observaţie (se pot imagina şi observaţii fără elaborarea prealabilă
a unui plan)
- consemnarea datelor observaţiei. În această situaţie se folosesc fişele de observaţie,
tehnică de înregistrare electronică.
- efectuarea observaţiilor , în condiţii variate, de acelaşi observator sau mai mulţi
observatori
- un observator străin poate altera rezultatele observării. Din acest motiv se recomandă ca
observatorul să fie integrat în fenomen.
Indicatorul observaţional sau empiric exprimă determinarea cantitativă a unei caracteristici
calitative. Se procedează astfel:
- se stabileşte obiectul investigaţiei
- se stabilesc clasele prin care se anticipează că obiectul investigaţiei s-ar putea manifesta.
Fiecărei clase i se asociază un indicator.
Indicatorii astfel stabiliţi se pot exprima numeric şi constituie informaţii cantitative despre
fenomen.
Operaţionalizarea indicatorilor presupune parcurgerea traseului dintre conţinuturile teoretice
specifice fenomenului de studiat şi aspectele empirice, practice ale aceluiaşi fenomen.

7
Metoda anchetei

În principal, metoda anchetei presupune un dialog între cercetători şi subiecţii cercetaţi.


Convorbirea este o formă de anchetă care de regulă se desfăşoară după un plan. Nu
înseamnă că cercetătorul nu se poate abate de la acest plan.
Chestionarul, o altă formă a metodei anchetei, se bazează pe întrebări care pot fi închise,
deschise sau cu răspunsuri formulate anterior.
Cele închise au 2 sau cel mult 3 variante de răspuns, cele deschise nu au variante de răspuns
iar cele cu răspunsuri formulate anterior au mai multe răspunsuri propuse.,mai mult de trei
răspunsuri propuse.

Metoda analizei produselor

Metoda analizei produselor presupune analiza unor produse ale activităţii subiecţilor, cu
scopul descoperirii unor trăsături de personalitate.

Metoda cercetării documentelor

Are acelaşi scop ca metoda analizei produselor dar ea are ca obiect de investigaţie rezultate
consemnate în documente oficiale.

Metoda cazului sau metoda clinică

Această metodă se aplică în situaţii individuale mai deosebite (elevi supradotaţi, delicvenţă,
întârziaţi mintali etc.). Ea înglobează un set de metode şi procedee diverse. Pe parcursul aplicării
metodei se întocmeşte câte o fişă pentru fiecare caz.

Metoda biografică

Este o variantă a metodei anterioare şi se foloseşte de regulă pentru personalităţi dezvoltate


peste medie (oameni de ştiinţă de notorietate, scriitori, artişti etc.)

Metoda testelor

Testul este alcătuit dintr-o probă sau din mai multe probe care înregistrează prezenţa sau
absenţa unui fenomen psihic, comportament sau reacţie la stimul (I.Drăgan şi I. Nicola, 1995,
Cercetarea psihopedagogică).
Standardizarea testului presupune elaborarea unor reguli şi cerinţe privind administrarea
testului. Etalonarea constă în realizarea unei scări la care se raportează rezultatele testului.
Etalonarea se face pe un eşantion.
Calităţile ce se cer îndeplinite în cazul testului sunt:
- Fidelitatea. Aceasta reflectă gradul în care aplicarea testului în condiţii apropiate
conduce la rezultate apropiate.
- Validitatea testului indică gradul în care un test măsoară obiectivele pentru care a fost
construit.
Testele post fi clasificate după câteva criterii:
Clasificarea testelor după numărul de indivizi cărora le este aplicat:
- teste individuale
- teste de grupe
- teste combinate

8
Clasificarea testelor după conţinut:
- teste de cunoştinţe (docimologice)
- teste psihologice (de memorie, de imaginaţie, de atenţie etc.)
- teste de personalitate (inventare de personalitate)

Interpretarea datelor furnizate de teste trebuie făcute cu multă precauţie (mai ales în cazul
testelor psihologice şi de personalitate)

TEMĂ
1) Construiţi un test docimologic standardizat. Explicaţi cum se face etalonarea testului.
2) Elaboraţi un studiu de caz pentru un elev deosebit dintr-o clasă pe care o cunoaşteţi

2.8. Sugestii privind valorificarea cercetării

Importanţa subiectului abordat, rezultatele obţinute în cercetare, determină hotărâtor modul


de comunicare şi valorificare a rezultatelor cercetării.
În cazul în care cercetarea produce efecte remarcabile în domeniul ştiinţific abordat,
rezultatele cercetării vor fi comunicate lumii ştiinţifice, sub forma unor lucrări ştiinţifice elaborate
în limbi de circulaţie mondială şi vor fi publicate în reviste de specialitate, prezentate în sesiuni
ştiinţifice sau editate în edituri de prestigiu.
Munca de cercetare presupune din partea cercetătorului realizarea, chiar pe parcursul
cercetării, a unor instrumente de lucru, evidenţierea unor rezultate parţiale, studiu bibliografic
însoţit de fişe şi alte activităţi asemănătoare. Acestea vor sta la baza redactării finale a rezultatelor
cercetării.
Structura lucrării finale depinde de importanţa acesteia, de mediul ştiinţific căruia i se
adresează, de planul de cercetare, personalitatea autorului cercetării etc.
Structura unei lucrări de gradul I, de exemplu, ar putea fi concepută astfel (după I.Drăgan şi
I. Nicola, 1995, Cercetarea psihopedagogică, p.33):
Partea întâi va cuprinde importanţa temei tratate şi motivarea alegerii acestei teme.
Partea a doua va aborda metodica cercetării unde vor fi enunţate ipotezele de lucru,
eşantionul ales, metodele utilizate, etapele cercetării, etc.
Partea a treia va cuprinde rezultatele cercetării, prelucrarea lor statistică, comentarii de
natură psihologică, pedagogică, socială, într-un cuvânt interpretarea rezultatelor.
Partea a patra va cuprinde concluziile şi propunerile pe care autorul le face în baza
rezultatelor cercetării.
Sfârşitul lucrării cuprinde de obicei anexe cu diferite rezultate şi bibliografia.
Referatul este o altă modalitate de valorificare a unei cercetări. Acesta va trebui să fie
concis, având în vedere că se susţine public, într-un interval de timp limitat.
Comunicarea ştiinţifică, ca formă de exprimare a rezultatelor cercetării, este destinată unui
public bun cunoscător al domeniului. Va fi concisă şi de regulă susţinerea sa va fi urmată de
dezbateri laudative sau critice, întrebări, intervenţii etc.
Comunicarea rezultatelor cercetării în formele amintite produce de multe ori discuţii aprinse,
dezvoltări argumentative favorabile sau nefavorabile. Toate acestea pot avea ca efect dezvoltarea
cercetării, un real câştig pentru cunoaşterea ştiinţifică.

9
CAP. III. ELEMENTE DE STATISTICĂ MATEMATICĂ

3.1. Ce ne poate oferi statistica

Înainte de aborda elementele statisticii matematice este bine să lămurim care sunt beneficiile
aduse de statistică, în cunoaştere, dar şi care sunt limitele cunoaşterii prin statistică.
Obiectul de studiu al statisticii este constituit din fenomenele de masă iar raţionamentul
folosit în mod deosebit este raţionamentul de tip inductiv.
Fenomenele de masă sunt fenomene atipice şi deosebit de complexe. Studiul lor este
important atât dintr-o perspectivă diagnostică cât mai ales din perspectivă prognostică.
Esenţa unui fenomen de masă poate fi cunoscută dacă se iau în considerare un număr mare
de cazuri individuale deoarece indivizii în aparenţă asemănători, au în fond, o multitudine de
trăsături distincte. Fenomenele de masă se caracterizează prin variabilitate.
Fenomenele de masă sunt deterministe de tip stohastic, care se produc în condiţii de
incertitudine.
Demersul uman de cunoaştere folosind statistica tinde, în condiţiile arătate despre
fenomenele statistice, să se raporteze la termenii de constanţă şi stabilitate necesari interpretării
fenomenelor statistice.
Acest lucru este posibil deoarece aceleaşi cauze care operează asupra sistemului studiat
determină permanent rezultatele ce variază continuu între limite bine stabilite şi care pot fi
determinate. În concluzie avem în obiectiv, prin studiul statistic, un sistem controlat de cauze, iar
rezultatele pun în evidenţă stabilitatea între anumite limite. Se spune astfel că procesul este într-o
stare de control statistic (W.E.Deming).
Legile statistice (stohastice) se manifestă sub formă de tendinţe şi sunt valabile pentru un
întreg ansamblu de unităţi.
Statistica se bazează pe principiile teoriei probabilităţilor, pe cerinţele legii numerelor mari,
formulată de J. Bernoulli. Legea numerelor mari afirmă că într-un număr suficient de mare de
cazuri individuale, influenţele factorilor individuali se compensează într-o astfel de manieră încât
determină o valoare tipică a întregului ansamblu.
Statistica abordează fenomenele de masă printr-un studiu cantitativ. În esenţă studiul
presupune următoarele etape:
- observarea statistică
- sistematizarea datelor primare
- prezentarea rezultatelor prelucrării primare sub formă de tabele , diagrame, grafică sau
indicatori
- interpretarea
În situaţia în care studiul statistic s-a făcut pe un eşantion şi nu pe întreaga populaţie,
urmează generalizarea printr-un raţionament inductiv, verificarea ipotezelor, formularea de predicţii
şi formularea concluziilor.
Dacă studiul statistic s-a făcut pe întreaga populaţie, după faza de interpretare se trece la
formularea concluziilor.
Încercând să concluzionăm şi să răspundem la întrebarea pusă la începutul paragrafului,
statistica îşi dovedeşte utilitatea în cercetare deoarece:
- porneşte de la date dispersate şi amorfe aducându-le la o formă ordonată
- studiul efectuat prin mijloace specifice asupra datelor ordonate, arată tendinţa în care se
dezvoltă fenomenul studiat, tendinţă ce poate fi de real folos în elaborarea prognozei.
Limitele analizei statistice se referă la:
- imposibilitatea de a ajunge la concluzii certe asupra unui individ al unei populaţii
pornind de la caracteristicile generale ale populaţiei studiate statistic.

10
- concluziile formulate în analizele statistice sunt doar probabile. Este drept că
probabilitatea poate să fie mai mare sau mai mică şi poate fi prevăzută sau chiar
influenţată.
- costurile mari ale unor cercetări statistice în cazul unor populaţii numeroase (cercetare
totală) sunt evitate prin eşantionare (cercetare selectivă) care prezintă o marjă de
nesiguranţă, atunci când interpretarea pe eşantion este generalizată la populaţia totală.

3.2. Noţiuni de bază ale statisticii

Cercetarea unui fenomen cu ajutorul metodelor statisticii se numeşte cercetare statistică sau
analiză statistică.
Mulţimea elementelor suspusă unei cercetări statistice se numeşte populaţie statistică sau
simplu, populaţia.
Elementele populaţiei statistice se numesc indivizi sau unităţi statistice.

Exemple:
1) Mulţimea locuitorilor unei regiuni pentru care se studiază cu metode statistice
fenomenul gripei virale poate fi o populaţie statistică.
2) Mulţimea pieselor produse într-un atelier pentru care se studiază fenomenul rebuturilor
poate fi o populaţie statistică, dacă studiul se face cu metodele statisticii

Caracteristica (statistică) sau variabila statistică desemnează însuşirea comună a indivizilor


care capătă valori sau accepţiuni diferite de la un individ la altul.
Exemple: sexul, vârsta, culoarea părului, ocupaţia, înălţimea, cifra de afaceri etc.

Caracteristicile calitative se exprimă prin cuvinte care reprezintă apartenenţa la o categorie.


Exemple: culoarea ochilor se exprimă prin cuvintele albaştrii, verzi, căprui

Caracteristicile cantitative sunt exprimate numeric.


Exemple: Înălţimea indivizilor este exprimată numeric în centimetri, metri, decimetri etc.
Vârsta indivizilor este exprimată numeric în ani, luni, zile etc.

Fiecare caracteristică (variabilă) este definită de mulţimea valorilor individuale (variante)


numită şi spaţiu al observaţiilor (notat cu M).
Spaţiul observaţiilor poate fi înzestrat cu o structură de ordine (mai mic, mai mare, egal), cu
o structură algebrică (adunare, înmulţire, cu proprietăţile caracteristice), cu o structură de ordine şi o
structură algebrică sau poate fi nestructurat (admite doar identitatea =, sau neidentitatea ≠).
Structura spaţiului observaţiilor depinde de scala folosită.
Spaţiul observaţiilor poate avea o mulţime finită sau infinită de elemente. Dacă spaţiul
observaţiilor este numeric (cazul caracteristicilor cantitative) acesta poate fi o mulţime discretă de
genul {1,2,3,4} sau una continuă, de tipul intervalului [1;100] care cuprinde toate numerele întregi,
raţionale şi iraţionale cuprinse între 1 şi 100.

Exemple:
Caracteristica rezultatelor la teza de matematică (exprimată în note întregi) are mulţimea
observaţiilor {1,2,3,….,10}, o mulţime discretă.
Caracteristica înălţimea elevilor clasei a II-a (exprimată în metri) poate fi intervalul
[0,8;1,20].

Scala reprezintă instrumentul care permite exprimarea măsurii în care un individ posedă o
anumită caracteristică.
În principal există scala nominală, ordinală, scală de interval şi scală de raport.

11
Scala nominală este folosită pentru exprimarea unor variabile nominale.
Variabilele nominale determină împărţirea populaţiei statistice în clase disjuncte (fără
elemente comune) a căror reuniune este populaţia statistică întreagă.
Exemplu:
Într-o grupă cu 35 de studenţi se studiază caracteristica (calitativă) culoarea ochilor.
Rezultatele sunt cuprinse în tabelul alăturat:
Tab.2
Clasa Efective
C1 albaştri 5
C2 verzi 12
C3 căprui 8
Total 25

Scala nominală astfel construită are calitatea de a repartiza fiecare individ într-o singură
clasă şi de a nu lăsa nici un individ nerepartizat.
Reprezentarea grafică obişnuită în acest caz este histograma, prezentată mai jos.

12
12
10
8
8
Efective

5 C1 albastri
6
C2 verzi
4
C3 caprui
2
0
Clasa

Fig.1
Spaţiul M aferent scalei nominale nu prezintă nici o structură. Totuşi în M se admite
identitatea notată „=” sau neidentitatea notată „≠”. O altă reprezentare grafică posibilă a
caracteristicii date este camembertul . Se calculează, în procente, efectivele (frecvenţa) pentru
fiecare clasă, apoi, proporţional cu aceste procente, se desenează într-un cerc trei sectoare, câte unul
pentru fiecare clasă.
În cazul rezultatelor exprimate în scală nominală se poate desemna modul (clasa cu cei mai
mulţi indivizi, vezi paragraful următor). În exemplul considerat, modul, notat M0 este C2.

Scala ordinală împarte populaţia în clase care trebuie să satisfacă următoarele condiţii:
- oricare două clase sunt disjuncte
- reuniunea lor este populaţia întreagă
- clasele sunt ordonate (se va înţelege care este prima, a doua, a treia etc.)
Spaţiul M aferent scalei ordinale are structură de ordine.
Exemplu: (adaptat după S. Moscovici şi F. Buschini, 2007).
Nivelul de studiu al unei populaţii dintr-o întreprindere se prezintă astfel:

12
Tab.3
Nivelul de Cu mai Cu mai Cu liceu Cu Cu primul Cu al Cu al Total
studiu puţin de puţin de bacalau ciclu univ. doilea treilea
gimnaziu liceu reat ciclu univ ciclu univ
Efective
Frecvenţa C1 C2 C3 C4 C5 C6 C7
absolută 14 5 19 36 22 27 9 132
Procente 11 4 14 27 17 20 7 100

Frecvenţa absolută reprezintă numărul de indivizi n ce au aceeaşi valoare a caracteristici. În


cazul abordat în tabel, acesta coincide cu numărul elementelor unei clase. Frecvenţa relativă este
valoarea raportului dintre n şi N (N,numărul total de indivizi ai populaţiei). Formula n/N *100
conduce la valoarea frecvenţei absolute exprimată în procente.
O scală ordinală are proprietatea de tranzitivitate, deci dacă clasa A≤B şi clasa B≤C atunci
clasa A≤C.
Interpretarea relaţiei de tranzitivitate în cazul exemplului considerat ar putea fi următoarea :
daca clasa A conţine indivizi mai puţin pregătiţi decât cei conţinuţi în clasa B şi clasa B conţine
indivizi mai puţin pregătiţi decât cei din clasa C, atunci indivizii clasei A sunt mai puţin pregătiţi
decât cei ai clasei C.
Modificăm tabelul iniţial în felul următor:
Tab.4
Nivelul de Cu mai puţin Cu mai Cu liceu Cu Cu un Cu al Cu al
studiu de gimnaziu puţin de bacalau ciclu univ. doilea treilea
liceu reat ciclu univ ciclu univ
Efective
Frecvenţa absolută C1 C2 C3 C4 C5 C6 C7
cumulată 132 118 113 94 58 36 9
Frecvenţă relativă 100 89 86 71 44 27 7
cumulată

După cum se observă a doua linie a tabelului conţine frecvenţele cumulate. Logica cumulării
frecvenţelor este următoarea : dacă numărul indivizilor din clasa C6 este 27 şi a celor din clasa C7
este 9 (vezi tabelul 3) atunci evident că 27+9=36 indivizi au absolvit al doilea ciclu universitar etc.
Datele cuprinse în fiecare din cele două tabele pot fi reprezentate prin două histograme.

Scala de interval este folosită în cazul caracteristicilor cantitative. Punctul zero al scalei şi
unitatea de măsură pot fi alese arbitrar.

Exemple:
1) Măsurarea timpului se face pe o scală de interval în care punctul 0 este anul naşterii lui
Iisus Hristos. Punctul 0 nu este pentru toate popoarele acelaşi.
2) Temperatura se măsoară de asemenea pe o scală de interval cu precizarea că scala
Celsius, de exemplu, are punctul 0 ales ca nivel al temperaturii la care apa îngheaţă. Pe
scara Fahrenheit acelaşi fenomen fizic se întâmplă la 32o F, deci punctul 0 ocupă o altă
poziţie.

Datorită localizării arbitrare a punctului 0 suma a două valori precum şi raportul acestora nu
are sens. În schimb are sens distanţa dintre două valori (diferenţa) precum şi suma sau raportul
distanţelor. Spaţiul M aferent scalei de interval are structură de ordine.

Exemplu:
Dacă distanţa (în timp, diferenţa) dintre revoluţia burgheză (1848) şi insurecţia armată
(1944) este de 96 de ani iar distanţa (în timp) dintre insurecţia armată şi căderea comunismului
(1989) este de 45 de ani atunci distanţa între revoluţia burgheză (1848) şi căderea comunismului

13
(1989) este 141 ani. Se poate calcula ca diferenţă sau ca sumă de diferenţe 96+45=141, acestea fiind
operaţii cu sens pe o scală de intervale.
Distanţele în timp între evenimente pot fi comparate deoarece în M există o structură de
ordine.

Scala de raport se caracterizează prin alegerea punctului 0 (original) în mod natural. Acesta
semnifică absenţa totală a fenomenului studiat. Unitatea de măsură se alege arbitrar.
Această scală determină pe M o structură de ordine, dar şi o structură algebrică (corp
ordonat).
Pe această scară de raport au sens toate operaţiile valabile pe scala de interval. În plus are
sens suma şi raportul a două valori ale variabilei.

Exemplu:
Scala de notare este o scală de raport. Punctul 0 (de regulă 1) semnifică lipsa totală a
fenomenului studiat (cunoştinţe, competenţe, abilităţi etc.).
Calculul mediei notelor foloseşte o sumă, operaţie permisă de scala de raport.

În concluzie, pentru caracteristicile calitative se folosesc scala nominală şi scala ordinală iar
pentru cele cantitative scala de interval şi scala de raport. Cantitatea de informaţie oferită prin
folosirea scalelor creşte de la scala nominală (cu cea mai mică cantitate de informaţie) până la scala
de raport (cu cea mai mare cantitate de informaţie).
În afară de scalele amintite ştiinţele sociale mai folosesc şi alte tipuri, din care amintim,
scala de distanţă socială, scala Thurstone pentru măsurarea atitudinilor, scala Lickert.
Scala Lickert este o metodă simplă de colectare de informaţii. În construirea ei se pleacă de
la baterii de enunţuri pe care subiecţii trebuie să le evalueze. Enunţurile sunt redactate, de obicei în
manieră condiţională.

Exemplu:
Dacă un elev este prins copiind, el trebuie drastic pedepsit!
Urmează apoi completarea, de către fiecare individ aflat în populaţia statistică a unei matrici de
forma:
Tab.5
Aprobare totală Aprobare Nehotărât Dezaprobare Dezaprobare
totală
5 4 3 2 1

Dacă, de exemplu, bateria de enunţuri are 10 enunţuri (legate de tema copiatului, în sensul
exemplificat) cotate de la 1 la 5, scorul maxim poate fi 50 iar cel minim 10. Aşadar, există 41 de
nivele pe care se pot situa atitudinile indivizilor în raport cu copiatul.
Dacă majoritatea răspunsurilor înregistrează nivele ridicate înseamnă că populaţia statistică
este majoritar împotriva copiatului. Dacă din contră, majoritatea răspunsurilor sunt situate pe nivele
mici, înseamnă că populaţia statistică este tolerantă faţă de copiat.

Grupări de date

Notăm cu P populaţia statistică studiată după o caracteristică f, calitativă sau cantitativă.


Prin măsurători (folosind diferite scale) fiecărui individ x din P i se poate ataşa o valoare a
caracteristicii f(x).

14
Exemplu:
1) Fie o clasă de 32 de elevi care se supune unei cercetări statistice după caracteristica
calitativă nivel de pregătire la matematică. Rezultatele unui test la matematică, obţinute
prin aplicarea scalei de interval (scala de notare) produce următoarele informaţii:
Tab. 6
Nr.crt. Numele elevului Nota
1 Abrudeanu I. 7
2 Bărbulescu A. 8
.. ……………………. …
.. ……………………. …
32 Vasilescu M. 5

Rezultatul cuprins în tabelul 6 se numeşte repartiţia empirică.


O reorganizare a informaţiei poate aduce mai multă claritate. Se procedează astfel:
Tab.7
Nota 1 2 3 4 5 6 7 8 9 10
Nr. indivizi 0 0 1 2 5 2 9 7 4 2

Este evident, din tabelul 7 că nota 8a fost obţinută de 7 elevi, nota 9 de 4 elevi, nota 3 de 1
elev etc.
Gruparea datelor în acest mod se numeşte seria statistică grupată sau repartiţie.
Cu notaţiile deja acceptate, f(8)=7, f(9)=4, f(3)=1, şi în general f(x)=nx
nx (număr de indivizi) se numeşte frecvenţa absolută
n
Dacă N este numărul total de indivizi α = x se numeşte frecvenţă relativă (vezi scala
N
ordinală)
Alt exemplu:
2) Studiind tensiunea la un număr de 100 de arzătoare se obţine următoarea repartiţie
empirică:
Tab.8
Nr.crt. tensiune
1 134
2 133
3 136
… …
… …
100 148
Se cere scrierea repartiţiei statistice (exemplu adaptat după Reischer C., Sâmboau A, 1972)
Rezolvarea problemei o vom face în două etape. În prima etapă vom scrie valorile
tensiunilor începând de la cea mai mică 122, până la cea mai mare 148 având grijă să numărăm
unităţile statistice corespunzătoare fiecărei tensiuni. Se va obţine tabelul 9.

Tab.9.
Tensiune Nr. de arzătoare Tensiune Nr. de arzătoare
122 1 … …
123 2 … …
124 1 … …
125 1 146 2
… … 147 1
… … 148 2

15
Informaţia cuprinsă în tabelul 9 este incomodă, tabela este prea extinsă. Concatenăm
informaţia exprimând tensiunea pe intervale aşa cum se vede în tabelul 10.
Tab.10
Tensiune Nr.de
aprinzătoare
122-124 4
125-127 5
128-130 10
… …
… …
146-148 5
Total 100

Notă!
Evident, pentru simplificarea expunerii, tabelele nu conţin toate datele, pentru
detalii poate fi consultată sursa bibliografică citată.
Observaţie:
În situaţia în care gruparea datelor se face pe intervale, valoarea medie a capetelor
intervalului va reprezenta intervalul. Pe intervalul[122;124] valoarea medie este 123, pe intervalul
[125;127] valoarea medie este 126 etc. Valoarea medie astfel calculată, se numeşte valoare centrală
a intervalului.

3.3 Reprezentarea grafică a seriilor statistice pentru o singură caracteristică

Am amintit deja că seriile statistice pot fi reprezentate prin histograme dar şi folosind
camambertul. Adăugăm la aceste modalităţi de reprezentare grafică a seriilor statistice,
reprezentarea prin batoane şi prin poligonul frecvenţelor.
Pentru exemplificare folosim tabelul 7 pentru care construim o reprezentare în batoane.
Note Test

10
Frecventa absoluta

0
1 2 3 4 5 6 7 8 9 10
Nota

Fig. 2
Dacă punctele obţinute la capetele segmentelor (a batoanelor) se unesc, se obţine un poligon
numit poligonul frecvenţelor (absolute).
Note Test
Fig.3
10
Frecventa absoluta

0
1 2 3 4 5 6 7 8 9 10
Nota

16
Modificăm tabelul 7, înlocuind frecvenţele absolute cu frecvenţele relative.

Tab.11
Nota 1 2 3 4 5 6 7 8 9 10
Frecvenţa 0 0 0.062 0.156
relativă

Temă:
Completaţi tabelul 11 cu frecvenţele relative care nu au fost calculate. Reprezentaţi grafic
seria statistică din tabelul 11.

Indicaţie:
nx
Frecvenţa relativă se calculează cu formula α = . Pe axa verticală (0y) se ia o unitate de
N
măsură suficient de mare pentru a putea reprezenta frecvenţa relativă într-o manieră acceptabilă

3.4. Valori caracteristice ale unei serii statistice

 x1 x 2 ... x N 
Fie seria statistică   unde xi reprezintă valorile caracteristice, iar ni
 n1 n 2 ... n N 
frecvenţele corespunzătoare.
x ⋅ n + x 2 ⋅ n2 + .... + x N ⋅ n N
Numărul x= 1 1 se numeşte media aritmetică. Suma
n1 + n2 + .... + n N
n1 + n2 +.... + nN = N

Exemplu:
1 2 3 4 5 6 7 8 9 10 
Informaţiile din tabelul 7 se transcriu astfel: 
 
 . Media
0 0 1 2 5 2 9 7 4 2 
0 *1 + 0 * 2 + 1 * 3 + 2 * 4 + 5 * 5 + 2 * 6 + 9 * 7 + 7 * 8 + 4 * 9 + 2 * 10
aritmetică este x = = 6,98
32
Observaţii:
Media aritmetică nu ne poate da în orice condiţii informaţii utile privind starea în care se
găseşte populaţia studiată. Uneori reprezentativitatea mediei este pusă la îndoială. Admitem, de
exemplu, că un elev a primit la o materie o notă de 2 şi una de 8 (media 5). Ce-mi spune această
medie? Dacă am renunţa la informaţia furnizată de ea am putea crede că elevul este slab pregătit
(nota 2) şi că nota 8 a fost un accident sau invers. Singura măsură corectă ar fi ca elevul să fie în
continuare ţinut sub observaţie, pentru a vedea care este nivelul său real de pregătire.

Problema reprezentativităţii mediei se poate rezolva fie prin înlăturarea notelor extreme, fie
prin gruparea notelor în clase omogene, fie prin calcularea coeficientului de variabilitate (vezi
paragraful următor). În toate situaţiile, o judecată pripită, făcută în baza mediei, ar putea duce la
concluzii greşite.
Admitem, de exemplu că un elev a înregistrat la o anumită materie notele
1,1,3,3,8,8,10,10,10. Media este 54:9=6
Dacă am neglija cele două note de 1(note extreme, considerând , de exemplu, că au fost
obţinute din cauze accidentale) media ar fi 52:7=7,17. dacă am grupa notele în clase omogene
{1,1},{3,3},{8,8},{10,10,10} şi am calcula media ca medie a mediei claselor am obţine
1+3+8+10:4=5,5.

17
Cu toate metodele de calculare a mediei folosite, dilema reprezentativităţii ei a rămas. O
singură concluzie se poate trage: „valoarea” elevului este undeva situată între 5,5 şi 7,17. vom relua
problema reprezentativităţii medie, folosind coeficientul de variabilitate.
Observaţie:
În cazul seriilor statistice reprezentate pe intervale, valoarea xi din formulă este valoarea
centrală a intervalului.

Dispersia se calculează pentru o serie statistică cu formula:

σ2 =
(x ) 2
( )
− x n1 + x 2 − x n2 + ... + x N − x n N
1
2
( ) 2

. Mărimea σ = σ 2 se numeşte abatere medie


N
pătratică.
Se numeşte modul sau moda (se notează Mo) unei serii statistice valoarea caracteristicii
căreia îi corespunde cea mai mare frecvenţă.
În situaţia în care caracteristica are valorile grupate pe intervale, modul este valoarea
centrală a intervalului căreia îi corespunde cea mai mare frecvenţă.
Se numeşte mediană (notată Me) a unei serii statistice, valoarea caracteristicii care împarte
populaţia în două părţi egale.

Exemple:
Reluăm repartiţia din tabelul 7. Mo=7 deoarece nota 7 corespunde celei mai mari frecvenţe
(9).
Pentru a înţelege modul în care se determină Me, scriem toate cele 32 de note astfel:
16 note 16 note
e

3 4 4 5 5 5 5 5 6 6 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 9 9 9 9 10 10
M

1 2note 5note 2note 9note 8note 4note 2note

Împărţind numărul total al elevilor la 2 obţinem 16, deci Me=7.

Pentru o serie statistică (a notelor, de exemplu) cu un număr impar de elemente:


3,3,4,4,5,7,9,9,10 (total 9), Me este 5 (50% din note se află în stânga valorii 5, 50%
la dreapta).
Uneori în cazul unui număr par de indivizi, Me se calculează ca o medie aritmetică a doi
5+7
termeni vecini astfel: 3,4,4,5,7,9,9,10 (total 8), Me = = 6.
2
Amplitudinea variaţiei sau împrăştierii (A) este diferenţa dintre ce mai mare şi cea mai mică
valoare înregistrată A = x max − x min .
Media ( x ), mediana (Me) şi modul (Mo) se numesc indici ai tendinţei central. Dispersia
(σ2), abaterea medie pătratică (σ) şi amplitudinea se numesc indici ai variabilităţii sau ai abaterii de
la tendinţa centrală.

3.5. Interpretarea datelor statistice

Fenomenele de masă pe care le studiază statistica sunt influenţate de o serie complexă de


factori.
Tendinţa ce se manifestă la nivelul populaţiei statistice, informaţie care interesează în mod
deosebit pe cercetător, este reflectată sintetic de medie, mediană, modul etc. cu condiţia ca aceşti
indicatori să fie reprezentativi şi stabili.
Valoarea medie, de exemplu, aşa cu am mai spus, nu este întotdeauna reprezentativă.
Reprezentativitatea creşte în situaţia în care datele folosite sunt omogene. Se impune deci

18
verificarea gradului de omogenitate a datelor. Această verificare se face prin măsurarea şi analiza
împrăştierii şi concentrării faţă de valorile centrale.
Noţiunea de împrăştiere, variaţie sau dispersare se leagă de o valoare centrală.
De exemplu, în cazul următoarelor două populaţii statistice, înregistrate prin valorile
caracteristicii
1) {2;2;2;10 ;18 ;18 ;18 } şi
2) {9;9;9;9;10 ;11 ;11 ;11 ;11 }
se observă următoarele:
- media şi mediana sunt egale
- seria a doua este mai omogenă (împrăştierea este mai mică faţă de valorile centrale)
Informaţiile furnizate de valorile centrale sunt deci mai de încredere pentru seria 2.

Înainte de a da recomandări ce pot fi urmate în cazul unor serii statistice neomogene, pentru
care putem culege informaţii despre tendinţele de dezvoltare ale fenomenelor cu probabilitate destul
de mică , să mai prezentăm o modalitate prin care putem admite sau respinge reprezentativitatea
mediei.
σ
Coeficientul CV x = ∗100 se numeşte coeficient de omogenitate sau de variaţie
x
(variabilitate). Coeficientul de variaţie permite comparea variabilităţii, iar valorile sale sunt situate
între 0 şi 100. Astfel, cu cât valorile sunt mai apropiate de 0, cu atât seria este mai omogenă. Practic
s-a stabilit că dacă CV este mai mare ca 35% colectivitatea este eterogenă.
Calculul şi analiza indicatorilor împrăştierii în jurul tendinţei centrale este util pentru
cunoaşterea fenomenelor de masă şi a tendinţei centrale, atât în cercetare cât şi în economie sau
societate.

Aplicaţie:
Revenim asupra seriei statistice cu valorile {1,1,3,3,8,8,10 ,10 ,10 } pentru calcularea
coeficientului de variabilitate.
Am stabilit că media x =6
Calculăm dispersia σ2 apoi abaterea medie pătratică σ.
2 * (1 − 6) 2 + 2 * (3 + 6) 2 + 2 * (8 − 6) 2 + 3 * (10 − 6) 2 2 * 25 + 2 * 9 + 2 * 4 + 3 * 16
σ2 = = = 13,77
9 9
σx = 13 ,77 = 3,71
σx 3,71
CV x = * 100 = * 100 = 0,618 * 100 = 61,8
x 6
CV fiind mai mare ca 35%, colectivitatea este eterogenă, deci media aritmetică nu este
reprezentativă.
De un real folos în studierea unui fenomen statistic sunt studiile referitoare la caracterizarea
asimetriei şi aplatizării curbei frecvenţelor.
Pe scurt, lucrurile se prezintă astfel: fenomenele normale (majoritatea) au repartiţia
reprezentată prin curba (clopotul) lui Gauss (fig. 4)

Fig.4

19
În această situaţie Mo, Me şi x se confundă.
O repartiţie asimetrică (oblică) poate avea una din următoarele reprezentări:

Fig. 5 Fig. 6

Fig. 5, de exemplu, spune că majoritatea indivizilor au rezultate sub medie ( Mo <x ) şi mai
precis, mai mult de jumătate din indivizi au rezultate sub medie ( Me < x ).

Temă:
Interpretaţi graficul din fig. 6

Reprezentarea grafică a seriilor statistice nu este un demers uşor de realizat. Asimetria


distribuţiilor statistice este dată (prin calcul, nu grafic) de coeficienţii lui Yule şi Kendall şi de cei ai
lui Pearson sau Fischer (vezi Isaia-Maniu Alexandru şi colab., 2004, Statistică).
O distribuţie este aplatizată dacă o mare variaţie a valorilor caracteristicii are drept
consecinţă o mică variaţie a frecvenţelor sau invers.
Indicatorii de exces sau kurtois (Kurtos=cocoşat, Platys=larg, Leptos=îngust în limba
greacă) se pot observa în figurile 7,8,9.

Leptokurtică Mezokurtică

Fig. 8

Fig. 7 Platikurtică

Fig. 9

20
Aplatizarea (boltirea) se poate determina folosind graficele sau prin calcularea unor
coeficienţi (coeficienţii lui Pearson sau a lui Fisher).
Analizele făcute până aici, au presupus studiul unei singure variabile, cu precizarea că
aceasta este unimodală (Mo este unic), fapt care, nu întotdeauna concordă cu realitatea.
În plus, într-o cercetare pot apărea mai multe variabile.
Considerăm variabila X şi variabila Y. Valorile variabilei X au fost sistematizate pe k
intervale, iar cele ale variabilei Y pe p intervale.
xij reprezintă valoarea xi a variabile X ce se găseşte în intervalul i dar se găseşte şi în
intervalul j al variabilei Y. Evident i ia valori de la 1 la k iar j de la 1 la p.
Se notează cu nij numărul indivizilor la care s-a înregistrat valoarea xij.
Acest mod de organizare a datelor va fi folosit în paragraful următor.

3.6. Regresie şi corelaţie statistică

Este uşor de observat că în practică, întâlnim variabile ce se influenţează reciproc. De


exemplu lungimea trunchiului şi lungimea picioarelor influenţează statura umană.
Măsurătorile brute pentru o populaţie adultă de bărbaţi din comuna Giuleşti, jud. Maramureş
formată din 93 de indivizi au fost trecute în două table cu dublă intrare, după sistemul descris în
ultima parte a paragrafului precedent. S-au obţinut următoarele rezultate (exemplu adaptat după
Reischer C., Sâmboau A, 1972):
Tab.12
Statura
cm 153 156 159 162 165 168 171 174 177 180 Total
Trunchi
cm
43 2 2 x 2 1 1 x x x x 8
46 1 4 10 9 9 3 2 x x 1 39
49 x x 5 6 8 12 4 3 1 x 39
52 x x x 1 1 x 2 2 x 1 7
Total 3 6 15 18 19 16 8 5 1 2 93

Tabelul 12 se citeşte astfel: 2 indivizi au lungime trunchiului de 43 cm şi statura 153 cm, 9


indivizi au lungimea trunchiului de 46 cm şi statura de 162 cm, un individ are lungimea trunchiului
de 52 cm şi statura de 180 cm etc.

Tab.13
Statura
cm 153 156 159 162 165 168 171 174 177 180 Total
Picioare
cm
71 2 2 3 2 x x x x x x 9
74 1 1 9 7 2 1 x x x x 21
77 x 2 3 7 13 2 x x x x 27
80 x 1 x 2 4 11 4 x x x 22
83 x x x x x 1 4 3 x x 8
86 x x x x x 1 x 2 1 2 6
Total 3 6 15 18 19 16 8 5 1 2 93

În practică, după cum am mai arătat, unele variabile evoluează dependent de alte variabile.
Dacă notăm cu y o caracteristică dependentă şi cu x cea independentă relaţia între x şi y este
y=f(x)(legătură simplă).
În situaţia în care variabilele independente sunt mai multe x1,x2,….xn, relaţia de dependenţă
se scrie y=f(x1,x2,….xn) (legătură multiplă).

21
Dependenţa variabilelor poate fi directă (dacă x creşte, y creşte sau dacă x scade, y scade),
indirectă (dacă x creşte, y scade sau dacă x scade, y creşte), dar poate fi şi liniară (funcţia f amintită
mai sus este de tip liniar) sau neliniară (funcţia f este neliniară, exponenţială, de tip parabolă,
hiperbolă etc.).
Regresia exprimă modalitatea în care o variabilă(sau mai multe) influenţează altă variabilă şi
se exprimă în formă analitică.
Corelaţia exprimă gradul în care o variabilă (sau mai multe) influenţează alte variabile.
Studiul regresiei şi corelaţiei este foarte important în cercetare (şi nu numai) deoarece,
cercetătorul, studiind variaţia variabilei independente poate să prognozeze variaţia variabilei
dependente.

Câteva metode elementare de caracterizare a corelaţiei

1) Metodele tabelelor de corelaţie.


Tabelul de corelaţie este un tabel cu dublă intrare care conţine gruparea unităţilor statistice
după cele două variabile (vezi tab. 12,13), din care una este independentă.
Dacă frecvenţele se concentrează în jurul diagonalei principale (stânga sus - dreapta jos)
atunci legătura este directă (ca în cazul tab. 12,13). Dacă frecvenţele se concentrează în jurul
diagonalei secundare (stânga jos – dreapta sus), legătura este inversă.
Dacă frecvenţele sunt distribuite astfel încât nu dovedesc nici o concentrare după diagonale,
legătura între variabile lipseşte.

2) Metoda seriilor paralele interdependente


Într-un sistem de axe se reprezintă toate punctele de coordonate (x,y), unde x este o valoare
a variabilei independente, iar y o valoare a variabilei dependente.
Dacă punctele se situează la întâmplare (putem considera că ele se grupează în jurul unei
drepte paralele cu 0x), între cele două variabile nu există legături semnificative.
Dacă punctele se situează în jurul unei drepte care nu este paralelă cu 0x, atunci între
variabile există o legătură. Mai exact, dacă dreapta în jurul căreia se situează punctele este
crescătoare, legătura este directă. În caz contrar legătura este inversă. Pentru exemplificare folosim
tabela 12, din care citim coordonatele punctelor. Ele sunt:
(43,153) (43,156) (43,162) (43,165) (43,168)
(46,153) (46,156) (46,159) (46,162) (46,165) (46,168) (46,171) (46,180)
(49,159) (49,162) (49,165) (49,168) (49,171) (49,174) (49,177)
(52,162) (52,165) (52,171) (52,174) (52,180)
Observaţie: La scrierea coordonatelor punctelor nu ţinem cont de frecvenţă.
Temă:
1. Reprezentaţi grafic punctele a căror coordonate au fost scrise, din tab.12 alegând
convenabil unităţile de măsură pe axe.
2. Folosind tab.13 faceţi reprezentarea grafică după modelul anterior.
Observaţie:
Atât în situaţia tab.12 cât şi a tab.13, „norul” de puncte reprezentat grafic se dispune
aproximativ după o dreaptă crescătoare. Ajungem la aceeaşi concluzie ca în cazul în care am aplicat
metoda tabelului de corelaţie.

Metoda seriilor paralele


Se ordonează valorile variabilei X (crescător sau descrescător). În paralel se ordonează
valorile corespunzătoare ale variabilei Y. Dacă variabila Y se ordonează (aproximativ) în acelaşi
mod în care s-a ordonat X (crescător sau descrescător), atunci între X şi Y există legătură directă,
dacă X şi Y sunt ordonate invers, (una crescătoare, alta descrescătoare) între variabile există o
legătură inversă.
Dacă variabila Y nu manifestă o tendinţă de ordonare între X şi Y nu există legătură.

22
Pentru exemplificare folosim informaţiile furnizate de tab.13:
Tab.14
X Y
71 153-162
74 153-168
77 156-168
80 156-171
83 168-174
86 168-180

În coloana lui Y pentru fiecare valoare a lui X am scris valorile extreme pe care le ia Y. Cele
două coloane dovedesc că X şi Y se află în legătură directă.

Temă:
Folosind datele din tab.12 şi metoda seriilor paralele, studiaţi relaţia dintre cele două
variabile.

În situaţia în care datele supuse prelucrării statistice sunt numeroase, metodele elementare
pe care le-am prezentat nu pot fi aplicate.
Vom explica, în cele ce urmează, cum putem determina, folosind coeficientul de corelaţie şi
raportul de corelaţie legătura dintre două variabile.
Pentru început să ne imaginăm că cele două variabile au fost reprezentate prin puncte.
„Norul” de puncte poate fi aproximat printr-o dreaptă paralelă sau nu cu axa 0x. Ecuaţia
acestei drepte este y=ax+b. Se pune problema determinării coeficienţilor a şi b. O metodă simplă,
dar nu întotdeauna aplicabilă, este metoda centrelor de greutate. Dacă „norul” este format de 6
puncte necoliniare, atunci coordonatele centrului de greutate al unui prim triunghi format din 3
puncte poate fi determinat. La fel şi centrul de greutate a celui de-al doilea triunghi. Dreapta căutată
este dreapta ce trece prin cele centre de greutate şi coeficienţii a şi b se pot afla.
În cazul în care „norul” de puncte este numeros se poate folosi metoda celor mai mici
pătrate. Aceasta constă în exprimarea diferenţei dintre yi, ordonata punctului Ai (xi,yi) al norului şi
ordonata punctului de abscisă xi situat pe dreapta y=ax+b, astfel:
di=yi-(axi+b)
Pentru determinarea coeficienţilor a şi b se pune condiţia ca S=Σdi2 să fie minimă.
După efectuarea calculelor se obţine:
BE − CD B (CD − BE ) − E ( AC − B 2 )
a= şi b =
AC − B 2 C ( AC − B 2 )
unde A=Σxi2, B=Σxi, C=N, D=-Σxiyi, E=-Σyi iar F=Σyi2

Dependenţa a două variabile poate fi apreciată cu ajutorul măririi abaterii valorilor empirice
de tipul y, faţă de linia de regresie, adică, faţă de valorile teoretice (cele determinate de funcţia de
regresie) de tipul y*.
În cele ce urmează, vom aborda corelaţia liniară simplă.
Există două situaţii extreme:
1) panta dreptei de regresie este 0 (b=0), atunci variabilele nu sunt în legătură.
2) punctele corelogramei (reprezentare grafică) se găsesc pe dreapta de regresie,
deci valorile empirice de tip y coincid cu cele estimate de tip y*. în această
situaţie corelaţia este perfectă
3) situaţia intermediară este prezentată în fig.10

23
P(x,y) este un punct al corelogramei
Q(x, y ) S(x,y*)
y* se calculează ca valoare a funcţiei y=ax+b în abscisa x a punctului P. Din acest motiv vom nota
yx*.
Se observă că:
PQ=y- y şi reprezintă variaţia totală a lui y faţă de media sa y .
PS= y- yx* şi reprezintă variaţia neexplicată de regresie.
SQ= yx* - y şi reprezintă variaţia explicată de regresie.

Calculele conduc la formula raportului de corelaţie R


∑( y − y *x )
2

R = 1−
∑ y−y( ) 2

şi la formula coeficientului de corelaţie rxy


∑( x − x )( y − y )
rxy =
Nσxσ y
Observaţii:
1. R 2 ∈[0,1] iar rxz ∈[ −1,1] . Valorile negative pe care le poate lua rxy semnifică că
legătura între variabile este o legătură inversă. Corelaţia este cu atât mai puternică cu cât r xy este mai
aproape de 1.

2. Coeficientul de corelaţie nu necesită determinarea, în prealabil, a funcţiei de regresie (care


se determină în cazul raportului de corelaţie)
3. Coeficientul de corelaţie se calculează doar în cazul legăturilor liniare.
4. Raportul de corelaţie se poate calcula în cazul oricărui tip de legătură. În situaţia legăturii
liniare R=rxy.

Dacă cei doi indicatori nu sunt egali, legătura nu este liniară şi se poate folosi doar raportul
de corelaţie pentru care se impune determinarea funcţiei de corelaţie.
În practică, rezolvarea acestor probleme este simplificată, de utilizarea tehnicii de calcul.

BIBLIOGRAFIE

24
Andrei, T , 1995,Statistică. Teorie şi aplicaţii Ed. ALL
Bucureşti
Cucoş, Constantin, 2001, Pedagogia, Polirom, Iaşi
Drăgan ,I ,Nicola, I , 1995, Cercetarea psihopedagică,Ed.
Tipomur, Tg. Mureş
Enăchescu, C, 2005,Tratat de teoria cercetării, Ed.
Polirom,Iaşi
Isac-Maniu, A,Mituţ , C,2004, Statistica Ed. Universitară ,
Bucureşti
Moscovici, S, Buschini ,F, (coord.) 2007 ,Metodologia
ştiinţelor socioumane, Ed. Polirom,Iaşi
King ,R ,2005, Strategia cercetării ,Ed. Polirom,Iaşi
Silverman ,D ,Interpretarea datelor calitative , Ed.
Polirom,Iaşi

25

S-ar putea să vă placă și