Sunteți pe pagina 1din 94

UNIVERSITATEA DE STUDII EUROPENE DIN MOLDOVA

FACULTATEA PSIHOLOGIE ȘI ASISTENȚĂ SOCIALĂ

METODOLOGIA CERCETĂRII PSIHOLOGICE ȘI


STATISTICA ÎN PSIHOLOGIE

texte de prelegeri
CICLUL II

CHIȘINĂU 2020

1
STATISTICĂ ÎN PSIHOLOGIE

„ Natura este tot ce i se oferă omului, cultura este tot ceea ce omul adaugă naturii”

Henri WALD

1. Obiectul disciplinei

Prezentarea, cunoaşterea şi însuşirea metodelor statistice utilizate în prelucrarea datelor


experimentale.

2. Desfăşurarea disciplinei

Curs 2 ore / săptămână


Laborator 1 oră laborator / săptămână

3. Programa analitică a cursului în semestrul I

Introducere în statistică--------------------------------------------------------------2 ore

Concepte fundamentale: date, informaţii, variabile, măsurare----------------4 ore

Mulţimi, funcţii, relaţii--------------------------------------------------------------2 ore

Noţiuni de teoria probabilităţilor--------------------------------------------------10 ore

 Evenimente, definiţia clasică a probabilităţii--------------------2 ore


 Scheme clasice de probabilitate-----------------------------------2 ore
 Probabilităţi condiţionate-------------------------------------------2 ore
 Variabile aleatoare---------------------------------------------------2 ore
 Legi clasice de repartiţie--------------------------------------------2 ore

Populaţie statistică-------------------------------------------------------------------2 ore

Pregătirea şi sistematizarea datelor------------------------------------------------2 ore

Statistică descriptivă-----------------------------------------------------------------6 ore

2
 Reprezentări grafice ale datelor statistice--------------------------2 ore
 Valori caracteristice ale unei serii statistice ----------------------4 ore

4. Programa analitică a laboratorului în semestrul I

 Prezentare generală a programelor Word, Excel, Power Point -------------2 ore

 Prezentare generală a programului SPSS. Definirea variabilelor,


introducerea datelor. Organizarea datelor pentru analiză --------------------2 ore

 Gruparea datelor sub formă de tabele şi realizarea de grafice folosind


programul SPSS -------------------------------------------------------------------2 ore

 Calcularea indicatorilor statistici descriptivi de bază folosind programul SPSS


---------------------------------------------------------------------------------------4 ore

 Aprecierea normalităţii unei distribuţii. Curba lui Gauss--------------------2 ore

 Prezentarea proiectului de cercetare--------------------------------------------2 ore

5. Bibliografie

 Barbu Gh., Statistică aplicată în Psihologie, Editura Universității din Pitești,


2010.
 Mihoc Gh., Micu N., Teoria Probabilităţilor şi Statistică Matematică, Editura
Didactică şi Pedagogică, Bucureşti, 1980.
 Drăghicescu I., Probabilităţi – Statistică – Psihologie - Investigaţie, Editura
I.N.I., Bucureşti, 2000.
 Gheorghiu D, Statistică pentru Psihologi,Editura Trei, Bucureşti, 2004.
 Popa M., Statistică pentru Psihologie. Teorie şi aplicaţii SPSS, Editura Polirom,
Bucureşti, 2008.
 Microsoft Office: Word, Excel, Power Point.

6. Evaluare

Prezenţă la curs----------------------------------------------------------------------------10%
Prezenţă şi activitate la laborator--------------------------------------------------------10%

3
Verificare pe parcurs----------------------------------------------------------------------30%
Temă de casă – proiect--------------------------------------------------------------------20%
Examen final-------------------------------------------------------------------------------30%

4
Cursul nr.1 Statistică în psihologie

Introducere în statistică

Definiţia statisticii
Una din definiţiile care pot fi găsite în Dicţionarul explicativ al limbii
române (DEX) pentru cuvântul statistică este ”evidenţă numerică
referitoare la diverse fenomene”.
O altă definiţie spune că statistica este o ramură a matematicii al cărui
obiect de studiu îl reprezintă elaborarea unor metode de analiză a unor
”fenomene de masă”, indiferent de natura acestora.
Statistica se ocupă cu colectarea, prelucrarea şi analiza datelor de
observaţie asupra unui proces sau fenomen, în vederea studierii acestuia.
Statistica matematică stabileşte fundamentele teoretice şi ştiinţifice ale
metodelor statistice, care, apoi sunt aplicate în diferite domenii.
În prezent, metodele statistice ocupă, practic, întregul spectru al ştiinţelor
contemporane.
Statistica operează cu reprezentări ale diferitelor aspecte ale realităţii şi
anume cu acelea care pot fi numărate, măsurate sau cuantificate.
Statistica oferă mijloace şi modele de cunoaştere a realităţii, căi prin care
se explorează necunoscutul şi se fac previziuni.

Statistica, instrument al metodei ştiinţifice în psihologie

Psihologia are ca obiect de studiu cunoaşterea omului sub diferite aspecte


ale comportamentului acestuia. Cum acestea sunt greu de cuantificat, iar
statistica lucrează cu numere, s-ar părea că cele două ştiinţe nu au nimic
în comun.
La prima vedere pare cel puţin ciudată legătura între statistică şi
psihologie. De a lungul timpului oamanii de ştiinţă au găsit această
legătură: mai întâi filozofii, apoi matematicienii.
Se pot distinge trei modalităţi ”neştiinţifice” de fundamentare a
cunoaşterii umane(Spata 2003):

5
 Tradiţionalismul sau argumentul autorităţii, care se bazează pe
adevăruri prestabilite. Cunoaşterea bazată pe autoritate decurge din
din supunerea necondiţionată faţă de exponentul autorităţii
respective, care poate fi savant, divinitate etc.
 Raţionalismul. Baza acestuia este deducţia. O teorie este adevărată
prin simplu fapt că este logică. Celebrul silogism antic: ”Toţi
oamenii sunt muritori. Socrates este om. Deci, Socrates este
muritor” este adevărat şi nu are nevoie de studiu pentru a fi
demonstrat.
Raţionamentul de tip deductiv nu este întotdeauna valabil deoarece
se bazează pe adevăruri care au condus în trecut la constituirea
principiului din care a decurs raţionamentul deductiv.
Principiul inductiv porneşte de la cazuri specifice pentru a obţine
concluzii generale.
 Bunul simţ sau experienţa. Se bazează pe observaţii sau experienţă
îndelungată, care îl fac credibil. De exemplu, am fi tentaţi să
apreciem că o persoană care suferă o criză într-un spaţiu public are
mai multe şanse să primească ajutor dacă este mai multă lume în
jur. În realitate, rezultatele unor cercetări ştiinţifice arată că în
astfel de situaţii are loc un fenomen de ”diminuare a
responsabilităţii”, iar ajutorul primit este mai puţin prompt decât
dacă în jur ar fi mai puţini oameni.

Modalităţile de cunoaştere prezentate mai sus sunt importante, dar nu


pot constitui argumente pentru enunţarea de concluzii generalizatoare.
Ele pot fi utilizate pentru ipoteze de cercetare, dar nu pot înlocui
demersul doveditor.
Societatea modernă este construită pe cuantificare numerică şi
interpretarea datelor de acelaşi tip, de la evaluarea ratei şomajului şi
calcularea indicelui de inflaţie până la studiile care estimează eficienţa
unui medicament sau a unei metode de psihoterapie.
În domeniul psihologiei, obiectivul fundamental al metodei ştiinţifice
este înţelegerea, explicarea şi predicţia comportamentului uman şi a
proceselor mintale. În acest proces, statistica pune la dispoziţie un set de

6
proceduri de calcul şi de raţionamente decizionale cu privire la
semnificaţia datelor de cercetare.
Rolul statisticii este de a conferi credibilitate datelor de observaţie, de a
confirma sau infirma ipoteze, ca urmare a prelucrării acestora.
Statistica nu exclude intuiţia cercetătorului, ci o supune unui control
critic pentru a o valida sau invalida.
De exemplu, să presupunem că un psihoterapeut intueşte că depresia
cronică a uneia dintre pacientele sale poate fi pusă în legătură cu
înălţimea mică a acesteia. În raport cu acest caz singular, el îşi poate
vesrifica intuiţia pri dialogul terapeutic, dar, dacă doreşte să probeze
faptul că în general femeile scunde sunt mai predispuse la depresie
cronică, va trebui să iniţieze un proces de cercetare. În cazul în care
rezultatele acestuia vor confirma intuiţia, devenită astfel ipoteză, atunci
demersul terapeutic adresat femeilor scunde cu manifestări depresive va
putea fi mai precis orientat pe una dintre sursele potenţiale ale tulburării.
Pentru psihologi, statistica este un set de metode şi tehnici matematice
de organizare şi prelucrare a datelor, cu scopul de a testa anumite ipoteze
şi a formula răspunsuri la anumite întrebări.
Utilizarea statisticii în psihologie este impusă de exigenţele metodei
ştiinţifice, ca tehnică de culegere, prelucrare şi interpretare a datelor.
În natură şi societate foarte multe cercetări se bazează pe concluzii
pornind de la unele colecţii de date ce necesită o analiză de tip statistic.
În domeniul psihologiei, obiectivul fundamental al metodei ştiinţifice este
înţelegerea, explicarea şi predicţia comportamentului uman şi a
proceselor mintale.
Statistica are rolul de a descrie, de a face predicţii şi de a conferi
credibilitate datelor de observaţie.
În multe situaţii, intuiţia poate deveni ipoteză, care trebuie verificată.
Metodele statistice se utilizează în cele mai diverse domenii: sociologie,
biologie, ecologie, medicină, economie, industrie, agricultură, economie,
administraţie etc.

7
Scurt istoric

Se spune că psihologia are un trecut îndelungat, dar o istorie scurtă.


Afirmaţia se referă la faptul că psihologia a apărut o dată cu începuturile
civilizaţiei umane, dar ştiinţific s-a dezvoltat în ultima vreme.
Utilizarea statisticii în psihologie datează după anii 50, datorită
facilităţilor oferite de mijloacele de calcul.
Statistica face parte din istoria psihologiei prin personalităţi ale
psihologiei care şi-au adus contribuţii importante prin introducerea
metodelor cantitative în psihologie şi în dezvoltarea analizei statistice.
Christian von Wolf (1679 – 1754), filosof german, a publicat, în anul
1732, lucrarea intitulată Psihologia empirică, iar în 1734 Psihologia
raţională, fiind considerat printre primii autori care au utilizat termenul
psihologie.
Wolf considera că filosofia poate avea claritate şi precizie numai prin
raţionament şi matematică, introducând un domeniu matematic al
psihologiei, numit psihometrie.
Erns Heinrich Weber (1801 -1878) şi Gustave Fechner(1801-1878)
publică în anul 1860 lucrarea Elemente der Psychophysik, considerată
actul de naştere al psihologiei moderne, cantitative şi experimentale.
Francis Galton (1882 – 1911)este considerat fondatorul psihometriei ca
ştiinţă a măsurării facultăţilor mintale şi al psihologiei diferenţiale,
domeniu al psihologiei orientat pe studiul diferenţei între oameni. În
domeniul statisticii, el a creat conceptele de regresie şi corelaţie.
Galton este considerat primul care a utilizat metodele statistice în studiul
diferenţelor umane şi al eredităţii inteligenţei.
Galton a introdus utilizarea chestionarelor şi a sondajelor pentru studii la
nivelul colectivităţilor umane.
Karl Pearson (1857 – 1936) a fundamentat calculul coeficientului de
corelaţie pentru date cantitative.
Pearson este unul dintre principalii promotori ai analizei statistice în
studiul comportamentului uman.
Pearson a dezvoltat statistica neparametrică chi-pătrat.
Charles Edward Spearman (1836 – 1945) autorul teoriei bifactoriale a
inteligenţei, care afirmă că întreaga funcţionalitate intelectuală este

8
susţinută de o aptitudine mintală generată, la care se adaugă aptitudini
specifice pentru diferite categorii de activităţi.
Spearman a dezvoltat analiza factorială, prin care se pune în evidenţă
gruparea variabilelor pe baza analizei de corelaţie.
Spearman a fost ales membru al Royal Society of London for the
Improvement of Natural Knowledge pentru aplicarea metodelor
matematice în analiza minţii umane şi pentru studiile originale asupra
corelaţiei în acest domeniu.
Raymond B. Cattell (1905 – 1988), psiholog anglo-american, a dezvoltat
teoria factorială a inteligenţei a lui Spearman. Mai mult, el a susţinut
utilizarea analizei factoriale în domeniul psihologiei pentru identificarea
şi fundamentarea constructelor psihologice.
Demn de remarcat este şi chestionarul 16PF(Sixteen Personality
Factors), unul dintre cele mai cunoscute teste de personalitate, care
include şi o scală de inteligenţă la cele cincisprezece de personalitate.
Ronald Aymer Fisher (1890 -1962) este cel care si-a adus o contribuţie
majoră la utilizarea statisticii în psihologie.
Fisher are contribuţii remarcabile în matematică, astronomie, biologie şi
genetică.
Fisher a manifestat un interes deosebit pentru studiul erorilor şi analizei
de varianţă, procedură foarte utilizată în statistica psihologică.
Se poate spune că psihologia face parte din categoria ştiinţelor care au
apărut mai târziu, dacă ţinem seama de faptul că a fost acceptată abia în a
doua jumătate a secolului al XIX ca ştiinţă de sine stătătoare.

Rolul statisticii în cercetarea psihologică


Pentru cercetarea psihologică, statistica este un set de metode şi tehnici
de prelucrarea datelor cu scopul de a răspunde la anumite întrebări şi testa
anumite ipoteze.
Pentru testarea ipotezelor se utilizează volume importante de date.
Pentru utilizarea datelor este necesară organizarea, prelucrarea şi analiza
rezultatelor.
Se spune că psihologia nu poate exista fără statistică. Pe de altă parte,
rolul statisticii este limitat.
Într-o cercetare psihologică distingem următoarele etape:

9
 Formularea problemei de cercetare
 Alegerea metodelor şi tehnicilor de cercetare
 Culegerea datelor necesare cercetării
 Organizarea şi prelucrarea datelor
 Analiza şi interpretarea rezultatelor.

Utilizarea statisticii în activitatea profesională a psihologilor

În prezent, statistica este unul dintre instrumentele de bază ale practicii


psihologice.
De ce este utilizată statistica în practica psihologică ? Iată câteva
argumente:
 Adeseori, în activitatea lor, psihologii au nevoie de evaluarea unor
caracteristici psihice, ceea ce se poate realiza cu ajutorul testelor
statistice.
 În orice studiu psihologic este importantă selecţia. Cu ajutorul
statisticii se fixează pragul de respingere şi se constituie scorurile
individuale pe baza cărora se ia decizia de selecţie.
 În orice studiu psihologic, care devine subiect de cercetare, nu se
pot trage concluzii fără utilizarea statisticii. De exemplu: „ există o
diferenţă între băieţi şi fete în studiul matematicii în ciclul primar ?”,
„există o legătură între accidentele rutiere făcute de tineri şi situaţia
materială a părinţilor ?” etc.
 În psihoterapia individuală, psihologii utilizează statistica pentru a
evalua eficienţa unei noi metode terapeutice, comparativ cu altă metodă
sau pentru identificarea unor condiţii care pot influenţa eficienţa
şedinţelor de terapie (ora la care se desfăşoară, durata, abordarea etc.)
 Cunoaşterea metodelor statistice îl ajută pe psiholog să înţeleagă
studii existente şi să-şi argumenteze ştiinţific studiile efectuate.
Aplicarea statisticii în diferite domenii a condus la o varietate de forme
aplicative: statistică economică, statistică sociologică, statistică medicală,
statistică psihologică, statistică ecologică etc.
În natură şi societate foarte multe cercetări se bazează pe concluzii
pornind de la unele colecţii de date ce necesită o analiză de tip statistic.

10
În domeniul psihologiei, obiectivul fundamental al metodei ştiinţifice este
înţelegerea, explicarea şi predicţia comportamentului uman şi a
proceselor mintale.
Statistica are rolul de a descrie, de a face predicţii şi de a conferi
credibilitate datelor de observaţie.
În multe situaţii, intuiţia poate deveni ipoteză, care trebuie verificată.
Exemplu. Un psihoterapeut intuieşte că depresia cronică a unuia dintre
pacienţii săi poate fi datorată singurătăţii. Dacă doreşte să probeze faptul
că în general bărbaţii singuri sunt mai predispuşi la depresie cronică, va
trebui să iniţieze o cercetare. În cazul în care rezultatele cercetării vor
confirma intuiţia care a devenit ipoteză, atunci demersul terapeutic
adresat bărbaţilor singuri cu manifestări depresive va fi mai precis
orientat pe una din sursele potenţiale ale tulburării.
Metodele statistice se utilizează în cele mai diverse domenii: sociologie,
biologie, ecologie, medicină, economie, industrie, agricultură, economie,
administraţie etc.

11
Cursurile nr.2+3 Statistică în psihologie

Gheorghe BARBU: „ Prietenul anevoie se cunoaşte „

Concepte fundamentale: date, informaţii, variabile şi măsurări

Date şi informaţii

Informaţia este o formulă care poate fi scrisă sau simbolizată, susceptibilă


de a aduce o cunoştinţă: încercând să o descriem sau să o explicăm, putem
spune că informaţia este un „ mesaj despre anumite lucruri sau evenimente
care au avut, au sau vor avea loc ”.
Datele sunt elemente constitutive ale informaţiei. Ele desemnează
evenimente primare, provenind din diferite surse, într-o formă
care nu permite luarea unor decizii.
În prelucrarea automată ne interesează datele din punct de vedere
sintactic, adică
din punct de vedere al reprezentării şi organizării lor. Din acest punct de
vedere,
datele apar ca o succesiune de simboluri sau caractere.
Distingem trei categorii de caractere:
 caractere alfabetice (literele alfabetului latin)
 caractere numerice (cifrele sistemului de numeraţie
zecimal)
 caractere speciale (semne de punctuaţie etc.)
In funcţie de caracterele utilizate, datele pot fi:
 alfabetice,
 numerice
 alfanumerice.
Datele au şi aspect semantic, ceea ce le conferă valoare cognitivă, o
valoare de mesaj care se transmite.
Observaţie. Între date şi informaţii există diferenţe:

12
 datele privesc evenimente primare, fiind colectate
din diferite situaţii sau diverse locuri,
neorganizate şi/sau neprelucrate într-o formă care
să stea la baza luării unor decizii;
 informaţiile sunt mesaje obţinute prin prelucrarea
datelor; aceste mesaje trebuie să fie concise,
actuale, complete şi clare, astfel încât să răspundă
cerinţelor informaţionale în scopul cărora au fost
preluate datele.
Cu alte cuvinte, pentru a deveni informaţii, datele trebuie prelucrate în
conformitate cu cerinţele informaţionale.
Datele se pot prelucra manual sau cu echipamente electronice de calcul,
de unde şi denumirea de prelucrare automată.
În vederea prelucrării, datele sunt codificate.
Cod: o combinaţie de simboluri.
Codul, în funcţie de natura simbolurilor care-1 compun, poate fi:
 numeric
 alfabetic
 alfanumeric.
Prelucrarea datelor, numită şi procesare, presupune totalitatea
transformărilor, ca formă şi conţinut a datelor.
Transformările se realizează în următoarele etape:
1. Identificarea surselor de unde se pot obţine datele
primare.
2. Culegerea şi pregătirea datelor primare, care presupune:
 Selectarea, care constă în alegerea acelor date
care prezintă interes.
 Organizarea/pregătirea datelor selectate.
 Codificarea, care constă în asocierea unor
simboluri numite cod.
3. Transmiterae/conversia, care constă în introducerea
datelor pe un suport de informaţie.

13
 Verificarea datelor din punct de vedere al formei,
conţinutului şi corectitudinii, folosind anumite chei de
control.
 Eliminarea eventualelor erori datorate culegerii,
pregătirii şi transmiterii lor.
 Stocarea datelor în vederea prelucărilor care
urmează.
4. Prelucrarea datelor în vederea obţinerii rezultatelor
necesare:
 Analiza, care constă în examinarea datelor în
vederea grupării lor în procesul de prelucrare.
 Sortarea, care constă ordonarea lor după anumite
criterii.
 Clasificarea, care constă în gruparea datelor după
caracteristici comune.
 Compararea, care constă în stabilirea
asemănărilor/deosebirilor dintre diferite grupuri de date.
 Sinteza, care constă în combinarea anumitor
grupări care să conducă la structuri noi organizate după
diferite caracteristici comune necesare prelucrării.
 Prelucrarea efectivă, care constă în efectuarea
operaţiilor aritmetice şi logice necesare obţinerii
rezultatelor.
5. Obţinerea rezultatelor, care trebuie să fie sub forma
cerută, direct utilizabilă.
6. Păstrarea datelor şi rezultatelor în vederea unor
prelucrări/utilizări ulterioare.

14
Variabilitate şi variabile în psihologie

În viaţa de toate zilele se întîlnesc la tot pasul mărimi ale căror valori se
schimbă sub influenţa diferiţilor factori.
Definiţie. Se numeşte variabilă, orice caracteristică a uni subiect sau
fenomen care poate lua două sau mai multe valori, în funcţie de diferiţi
factori.
Studiul conduitelor psihologice constituie un domeniu de mare
variabilitate.
În domeniul psihologic, variabilitatea poate fi :
 intraindividuală, ceaa ce înseamnă că aceeaşi persoană, în acelaşi
context, reacţionează diferit.
 interindividuală, ceea ce înseamnă că persoane diferite, în aceiaşi
situaţie, reacţionează diferit.
Prin extensie, se poate vorbi de variabilitate intragrup şi intergrup.
Prin urmare, pentru a studia comportamentul uman putem folosi
conceptele de variabilă şi măsurare, iar pentru prelucrarea datelor se pot
utiliza metode statistice.
În psihologie, pentru a studia un subiect sau un grup de subiecţi se
utilizează explorări sistematice şi explorări specifice.
Datele pe care le prelucrează un psiholog provin din metode de
investigaţie specifice: experiment, test, observaţie, chestionar, convorbire
psihologică, anchetă psihologică etc.
De exemplu, în psihologie, inteligenţa este o variabilă deoarece diferă de
la un individ la altul.
Tot în categoria variabilelor pot fi considerate atenţia, reflexele, timpul de
reacţie, anxietatea, vârsta, înălţimea, greutatea etc.
Cercetarea psihologică are ca obiectiv studierea variabilelor, cu scopul de
a explica diferitele caracteristici ale realităţii psihice şi comportamentului
uman.
De exemplu, conducătorii auto diferă în funcţie de respectarea regulilor
de circulaţie şi prezintă interes dacă tinerii sunt cei care le încalcă în cele
mai multe cazuri.
În această situaţie avem două variabile: respectarea regulilor de circulaţie
şi vârsta; ceea ce interesează este dacă una variază în raport cu cealaltă.

15
Din punct de vedere al observării, în psihologie, avem:
 variabile observate, care pot fi măsurate, cuantificate. De exemplu,
vârsta.
 variabile latente, care nu pot fi măsurate direct. Pentru a realiza o
cuantificare se utilizează anumiţi indicatori, ca de exemplu chestionare
cu diferite întrebări. Răspunsurilor la întrebări li se atribuie puncte. De
exemplu inteligenţa.
Din punct de vedere al legăturilor, avem:
 variabile dependente, măsurate cu scopul fundamentării unei
decizii.
 variabile independente, utilizate pentru a studia influenţa şi
efectele asupra variabilelor dependente.
Exemple:
1. Verificarea ipotezei că bărbaţii nefumători trăiesc mai mult decât
fumătorii. În acest exemplu, variabila dependentă este vârsta, iar
variabila independentă este statutul de fumător sau nefumător.
2. Ooboseala şi atenţia în conducerea unui automobil. Ţinând seama că
oboseala influenţează atenţia, atunci atenţia este variabila dependentă, iar
oboseala este variabila independentă.
Un alt tip este acela de variabilă categorială, atunci când valorile
acesteia descriu categorii.
Variabile categoriale pot fi:
 de tip nominal, sunt acele variabile care realizează o descriere, de
exemplu, genul (masculin, feminin), temperamentul etc.
 de tip ordinal, sunt acele variabile care indică o măsurare ordonată,
ca de exemplu, categoria 1 de vârstă (1-7 ani), 2 (8-15 ani) etc.
Din punct de vedere al valorilor pe care le poate lua:
 variabile continue, ceea ce înseamnă că pot lua un număr infinit de
valori, exprimat prin numere reale.
Exempu: greutatea.
 variabile discrete, ceea ce înseamnă că pot lua un număr finit de
valori, de regulă exprmat prin numere întregi.
Exemplu: numărul persoanelor dintr-o comunitate.

16
Măsurarea în psihologie

Stevens, în anul 1946, în lucrarea „On the theory of scale of


measurement” definea măsurarea ca fiind „atribuirea de valori numerice
obiectelor şi fenomenelor, în conformitate cu anumite reguli”.
Problema care se pune este că nu toate măsurările au caracter numeric.
Psihicul uman nu este de natură cantitativă, dar manifestările sale pot fi
cuantificate pentru a fi utilizate metode ştiinţifice care să permită o
analiză a comportamentului.
Pentru prelucrări statistice este nevoie de abordări cantitative în ceea ce
priveşte abilităţile şi caracteristicile psihologice: trăsături de
personalitate, opinii, atitudini, motivaţii, stări emoţionale etc.
Dacă se măsoară greutatea şi înălţimea unui grup de sportivi se vor
atribui nişte numere care înseamnă Kg şi respectiv centimetri.
Dacă se evaluează alte caracteristici precum culoarea ochilor,
apartenenţa religioasă etc. atunci putem asocia valori convenţionale
pentru fiecare: 1 pentu negru, 2 pentru căprui, 3 pentru albastru etc.
În cazul în care se studiază alte caracteristici precum inteligenţa, viteza
de recţie, stări emoţionale etc. este nevoie de alte unităţi de măsură şi de
o altă modalitate de atribuire a numerelor.
În timp ce înălţimea, greutatea etc sunt caracteristici fizice care se pot
măsura, trăsăturile de natură psihică precum inteligenţa, viteza de reacţie,
sociabilitatea etc. sunt constructe abstracte care descriu caracteristici ale
conduitei umane pentru care trebuie să găsim instrumente de măsură.
Caracteristicile de natură fizică pot fi măsurate direct, în timp ce
constructele de natură psihică nu pot fi măsurate decât prin manifestările
lor particulare.
Prin urmare, în ceea ce priveşte studierea comportamentului uman,
măsurarea este considerată ca un proces prin care varietatea infinită a
observaţiilor umane este redusă la o descriere sub formă numerică sau
simbolică, ceea ce presupune că reprezintă anumite regularităţi
semnificative la nivelul entităţilor observate.
În psihologie, entităţile supuse măsurării pot fi:
 cantitative, de natură fizică : indicatori fiziologici (înălţimea,
greutata etc.), vârsta, timpul de reacţie etc.

17
 calitative, constructe psihice (de exemplu: inteligenţa, opinia,
atitudini, motivaţia, stări emoţionale, sociabilitatea etc.
Principala caracteristică a constructelor psihologice este acceea că ele
reprezintă rezultatul unui proces de construcţie mintală prin care
psihologul descrie o anumită categorie de conduite sau reacţii psihice.
Constructele psihice (mintale) sunt modele, iar existenţa lor şi evaluarea
gradului de manifestare la diferite persoane se poate realiza cu procedee
statistice.
Din acest motiv, constructele psihice nu pot fi măsurate direct, ci numai
prin manifestările lor particulare.
De exemplu, sociabilitatea se manifestă prin numărul contactelor sociale
într-o anumită perioadă, prin disponibilitatea de a comunica, prin
numărul prietenilor, prin numărul convorbirilor telefonice etc.
Se observă că un construct psihic are mai mulţi indicatori, ceea ce
înseamnă că o evaluare cantitativă se poate realiza numai prin
identificarea indicatorilor care-l compun, urmată de cuantificarea
gradului de intensitate a acestora la nivelul persoanelor evaluate.
Considerăm exemplul constructului psihic sociabilitatea, care nu poate fi
măsurat direct; ca variabilă este latentă, iar indicatorii care o definesc
sunt variabile observate.
În cazul în care pentru evaluarea sociabilităţii se utilizează chestionarul,
variabilele observate sunt întrebările, iar variabila latentă este numărul
obţinut prin însumarea răspunsurilor.

Scale sau niveluri de măsurare


Statistica operează cu valori, numerice sau de altă natură, rezultate printn
măsurare directă sau observarea unui fenomen sau proces.
Valorile numerice obţinute în urma măsurării sau observării diferă unele
de altele , având semnificaţii diferite, în funcţie de măsurarea efectuată.
În funcţie de cantitaea de informaţie pe care o reprezintă valorile
obţinute în urma procesului de măsurare, se disting patru niveluri sau
scale, ordonate ierarhic, de la nivelul de măsurare cel mai redus până la
nivelul de măsurare cel mai ridicat.
Nivelul superior include criteriile nivelelor ierarhice inferioare.

18
Scala de tip nominal. Măsurarea pe scală nominală constă în organizarea
obiectelor supuse cercetării în diferite clase sau categorii. Valorile sau
simbolurile dintro clasă diferă între ele dar nu se compară dacă sunt mai
mici sau mai mari.
De exemplu, oamenii, după culoarea pielii pot fi clasificaţi în patru
categorii: albi, galbeni, mulatri şi negri. Culorile pot fi codificate cu A,
G, M, N sau cu numerle 1,2,3 şi respectiv 4. În această situaţie, valorile
respective sunt simboluri ale caracteristicii culoarea pielii, iar numărul 4
nu reprezintă nici mai mult nici mai puţin decât numărul 1.
Codificările de mai sus sun arbitrare, iar prin convenţie pot fi înlocuite
cu altele.
Variabilele măsurate pe scale nominale pun în evidenţă diferenţele
calitative şi nu pe cele cantitative.
Valorile de pe scala nominală pot fi:
 de identificare, utilizate pentru codificarea, culegerea, organizarea
şi prelucrarea datelor. Nu prezintă interes din punct de vedere statistic.
De exemplu, codul numeric personal se utilizează pentu identificarea
persoanei.
 categoriale, utilizate în repartizarea obiectelor supuse cercetării în
clase sau categorii în funcţie de caracteristici. De exemplu, genul
(masculin, feminin), pregătirea profesională (analfabet, şcoală generală,
liceu, licenţă, masterat, doctorat etc.), tipuri temperamentale etc. sunt
valori categoriale.
Valorile măsurate pe scala nominală sunt calitative, descriind categorii,
ceea ce înseamnă că nu li se pot aplica operaţii numerice.
Cu aceste valori pot efectua:
 operaţii descriptive, ca de exemplu numărare, procente etc.
 transformări privind gruparea sau rafinarea categoriilor pe care le
descriu.
De exemplu, apartenenţa religioasă cu patru categorii( catolic, ortodox,
musulman şi budist) poate fi fi grupată în două pe criteriul
creştinismului.
De asemenea, cele patru categorii temperamentale(sanguin, coleric,
flegmatic, melancolic) pot fi grupate în două, pe criteriul extraverte

19
(persoanele sanguine şi colerice) şi introverte (persoanele flegmatice şi
melancolice).
Reducerea sau rafinarea numărului de categori nominale se utilizează în
situaţia în care numărul categoriilor este foarte mare , fiind greu de
analizat sau cînd numărul de cazuri pentru unele categorii ete foarte mic
sau zero.
Scală de tip ordinal. Valorile de pe această scală pot fi comparate din
punct de vedere al locului pe care-l ocupă. Din acest punct de vedere au
o semnificaţie cantitativă, dar, în esenţă, ele sunt calitative.
De exemplu, dacă vorbim de seriozitatea unor persoane, codificată de la
1 la 5 (5 fiind nivelul celmai ridicat), valorile 1, 2, 3, 4, 5 exprimă doar
ordinea aprecierii şi nu măsura, Nu se poate spune că persoanele de pe
locul 5 sunt de cinci ori mai serioase decît cele de pe locul 1.
Scala de tip ordinal indică faptul că persoanele de pe locul 5 sunt mai
serioase decât persoanele de pe locul 4, fără a şti cu cât. Nu ştim dacă
diferenţa între 5 şi 4 este egală cu cea dintre 2 şi 1din punct de vedere al
seriozităţii.
În concluzie, valorile de tip ordinal ne indică o ierarhizare a valorilor
unor caracteristici sau preferinţe, fără a preciza care este „diferenţa de
cantitate” a caracteristicii măsurate.
Codificarea valorilor de tip ordinal trebuie să perimită ierarhizarea.
Valorile de tip ordinal au semnificaţie calitativă şi nu cantitativă.
Scală de tip interval. Variabilele de pe această scală, pe lângă informaţii
privind ordinea, oferă şi informaţii privind mărimea caracteristicii
măsurate.
Valorile de tip interval sunt cantitative, reprezentate pe un interval cu
diviziuni egale.
De exemplu, temperatura măsurată într-un număr de zile se exprimă în
grade reprezentate pe un interval, având subdiviziuni egale, din grad în
grad. Se poate aprecia că întro zi a fost mai cald sau mai frig decât în
cealaltă.
Un alt exemplu, coeficientul de inteligenţă măsurat în funcţie de numărul
de răspunsuri corecte la întrebările dintr-un chestionar: 30 de răspunsuri
corecte, 20, 15 ş.a.m.d.

20
Nu se poate emite ipoteza că persoanele care au dat 30 de răspunsuri
corecte sunt de două ori mai inteligente decât cele care au dat 15,
deoarece nu avem o valoare de referinţă faţă de care să facem
comparaţia.
Pentru persoanele care se ţin de mână intrun parc 20 de minute, respectiv
30 de minute, diferenţa de iubire nu este aceeaşi cu diferenţa între 30 şi
20 de minute.
Scală de tip raport. Valorile exprimate pe o asemenea scală, pe lângă
egalitatea intervalelor, se raportează la o valoare zero absolută. Nu se
admit valori mai mici decât zero.
Exemple: timpul, vîrsta, numărul de răspunsuri corecte sau greşite la un
chestionar etc.
Observaţie. Diferenţa între variabilă şi scală constă în aceea că variabila
se referă la o caracteristică supusă măsurării, iar scala la modalităţi de
măsurare şi reprezentare. În unele cazuri, aceeaşi caracteriszică poate fi
măsurată pe orice tip de scală.
De exemplu, atenţia poate fi exprimată pe o scală nominală(atent,
neatent), pe o scală ordinală (atenţie scăzută, medie, mare şi foarte mare)
sau pe o scală interval (intervale de timp corespunzătoare gradului de
atenţie).
Analog se poate exemplifica şi timpul de reacţie.
Când se vorbeşte de măsurarea unor caracteristici sau de valorile unei
variabile trebuie precizată şi scala.
Erori de măsurare
Măsurarea, fie cantitativă sau calitativă, se realizează asupra obiectelor,
fenomenelor sau proceselor studiate.
Coeficientul de inteligenţă exprimă o proprietate funcţională de natură
intelectuală a persoanei, iar frecvenţa cardiacă exprimă o proprietate
funcţională fiziologică a inimii.
Numerele care exprimă cele două proprietăţi funcţionale nu putem
afirma cu certitudine că sunt exacte.
Rezultatele testului de inteligenţă poate oferi o comparaţie între
personele testate, dar nu exprmă cu certitudine inteligenţa persoanelor
testate.

21
Valoarea măsurată pentru inteligenţă poate fi influenţată de caracteristici
psihice sau de alţi factori: modul de concepere a testului (avem garanţia
că este perfect?), caltatea mediului de testare (mobilier, condiţii
climatice, zgomot etc.), starea fiecărui individ (oboseală, emotivitatetc.)
şi altele.
Valoarea măsurată pentru frecvenţa cardiacă poate fi influenţată de
oboseală, efort fizic, emoţii, precizia aparatului etc.
Se spune că orice valoare rezultată dintro măsurare este compusă din
valoarea adevărată la care se adaugă o anumită eroare, a căror pondere
nu poate fi determinată cu exactitate.
Problema care se pune este să limităm cât se poate de mult eroarea.
Erorile în procesul de măsurare sunt de două feluri:
 erori aleatorii, datorate un factori întâplători. Ele pot
influenţa în sens pozitiv sau negativ măsurarea. În unele situaţii
erorile pozitive se compensează cu cele negative, ceea ce conduce
la o mai mare precizie a măsurării.
 erori sistematice afectează măsurarea întrun singur sens:
pozitiv sau negativ. De exempu măsurarea tensiunii arteriale la un
grup de persoane depinde de precizia aparatului, care produce
mereu valori mai mici sau mai mari decât valoarea reală.

22
Cursul nr.4 Statistică în psihologie

” Dă-i omului puterea şi-i vei vedea caracterul ”

Mulţimi, funcţii, relaţii

Noţiunea de mulţime este o noţiune primară. Ea nu se defineşte, ci se


ilustrează prin exemple:
 mulţimea numerelor naturale.
 mulţimea locuitorilor unei comune, oraş etc.
 mulţimea cărţilor dintr-o bibliotecă.
 mulţimea trăsăturilor care definesc personalitatea unui individ.
 M={a,b,c,d,k,p}.
 X={- 2, 0, 5, 10, 25, 35, 70, 99}.
O mulţime este formată din elemente. Fiecare element al unei mulţimi
trebuie să fie astfel încât să se poată afirma că aparţine sau nu mulţimii
respective.
O mulţime poate fi dată prin enumerarea elementelor din care este
constituită sau precizând proprietăţile pe care le au elementele sale.
De exemplu, b  M, 10  X, 25  M.
Definiţie. Mulţimea care nu conţine nici-un element se numeşte mulţime
vidă şi se notează cu  .
Definiţie. O mulţime care conţine un număr bine determinat de elemente
se numeşte mulţime finită.
Exemplu.
Definiţie. O mulţime care conţine un număr nedeterminat de elemente se
numeşte mulţime infinită.
Exemplu. Mulţimea punctelor dintr-un segment.
Definiţie. O mulţime infinită se numeşte numărabilă dacă elementele ei
pot fi numărate, ceeace înseamnă că ele pot fi puse în corespondenţă cu
mulţimea numerelor naturale. Altfel mulţimea este nenumărabilă.
Exemple.Mulţimea rotaţiilor pământului este numărabilă. Mulţimea
numerelor reale dintr-un interval este nenumărabilă.
Definiţie.Două mulţimi se numesc disjuncte dacă nu au nici-un element
comun. A  B   .

23
Dacă oricare ar fi elementul x  X , acesta aparţine şi mulţimii Y , atunci
spunem că mulţimea X este inclusă în mulţimea Y , ceea ce se scrie X  Y
. Se mai spune că X este o submulţime a lui Y sau o parte a lui Y .
Definiţie. Două mulţimi sunt egale dacă sunt formate din aceleaşi
elemente.
Fie M o mulţime şi A  M .
Definiţie. Se numeşte complementara mulţimi A faţă de M , mulţimea
elementelor din M care nu aparţin lui A , notată cu C M A  {x | x  M , x  A} .
Operaţii cu mulţimi: reuniunea, intersecţia, diferenţa.
Fie A şi B două mulţimi.
Reuniunea. A  B  {x | x  Asaux  B} mulţimea elementelor care aparţin cel
puţin uneia dintre cele două mulţimi.
Intersecţia. A  B  {x | x  Asix  B} mulţimea elementelor comune celor două
mulţimi.
Diferenţa. A  B  {x | x  Asix  B} mulţimea elementelor din A care nu
aparţin lui B .
Produs cartezian AxB  {( x, y ) | x  X , y  Y }

Relaţii

În funcţie de una sau mai multe caracteristici, populaţia statistică poate fi


împărţită în clase.
Din punct de vedere matematic, o populaţie statistică este o parte a unei
mulţimi E  { A1 , A2 ,...., An } , unde Ai (i  1,2,....., n) sunt submulţimi ale lui E şi
se numesc clase. Unităţile statistice care compun aceeaşi clasă sunt alese
pe baza unei relaţii R.
x y
R , de exemplu x şi y au aceeaţi înălţime ( x  Ai şi y  Ai ) .
Definiţie. O relaţie reflexivă, simetrică şi tranzitivă, se numeşte relaţie de
echivalenţă.
Fie M o mulţime şi R o relaţie definită pe această mulţime.
1. Reflexivă: x R x pentru orice x  M .
2. Simetrică : x R y şi y R x pentru oricare x, y  M .
3. Tranzitivă : x R y şi y R z avem x R z pentru oricare
x, y , z  M .
Exemplu. Considerăm un grup de persoane şi definim relaţia de prietenie.

24
Relaţia de echivalenţă definită pe o mulţime sau populaţie statistică
reprezintă caracteristica populaţiei.

Funcţii

Fie X şi Y două mulţimi oarecare, nevide.


O funcţie definită pe mulţimea X (domeniu) cu valori în Y (codomeniu),
notată f : X  Y asociază fiecărui element x  X o valoare (imagine)
y  f ( x)  Y , unic determinată.
Se observă că x  X este variabilă independentă, iar y  f ( x)  Y este
variabilă dependentă.
Noţiunile de relaţie şi funcţie se pot utiliza şi în psihologie, studiul
comportamentului presupune a se avea în vedere, pe de o parte relaţia cu
personalitatea subiectului, iar pe de altă parte relaţia cu diferiţi factori care
îl pot influenţa.
Relaţia cauzală este o relaţie de tip funcţional, evidenţiind în cadrul
procesului studiat care este variabila independentă şi care este variabila
dependentă. Într-o asemenea relaţie, variabila independentă devine
esenţială, deoarece diferitele schimbări ale acesteia conduc la schimbări
ale variabilei dependente.
Exemlu. Calitatea pregătirii tinerilor depinde de calitatea cadrelor
didactice.
Studiul comportamentului pune în evidenţă o relaţie de forma:
cauză  efect
ceea ce înseamnă că diferitele modificări ale comportamentului (efectele)
se datorează unor cauze.
Se observă că avem o relaţie funcţională, unde domeniul este cauza şi
codomeniul este efectul.
Cauza şi efectul pot fi variabile unidimensionale sau multidimensionale.
Distingem următoarele situaţii:
 o cauză  un efect
Performanţele unui student într-un domeniu sunt determinate (funcţie) de
volumul de muncă măsurat prin timpul afectat studiului în domeniu
respectiv.
 mai multe cauze  un singur efect

25
Performanţele unui sportiv sunt rezultatele activităţii depuse de cei care-l
pregătesc: antrenor, medic, psiholog.
 o singură cauză  mai multe efecte
Prin prestaţia sa, unprofesor poate determina pregătirea unui elev în plan
informativ şi formativ.
 mai multe cauze  mai multe efecte
Influenţa profesorilor care predau diferite discipline asupra diferitelor
componente ale personalităţii unui student.

Sisteme

Sistemul reprezintă un ansamblu de elemente (componente fizice sau


logice, legi, reguli etc.) interconectate, care funcţionează în comun pentru
realizarea unuia sau mai multor scopuri.
Elementul reprezintă o parte din sistem (un subansamblu sau o
componentă) capabilă să îndeplinească o anumită funcţiune în cadrul
sistemului.
O clasificare a sistemelor poate fi făcută astfel:
 sisteme deschise
 sisteme cu conexiune inversă.

Sistemul deschis este caracterizat de ieşiri care corespund intrărilor în


sistem, dar ieşirile sunt izolate de intrări şi nu au nici o influenţă asupra
acestora.
Într-un sistem deschis, rezultatele acţiunii trecute nu comandă acţiunea
viitoare. Sistemul nu observă şi nu reacţionează la propria-i performanţă.
Exemplu: Un automobil este un sistem deschis care singur nu se poate

Fig.1 Sistem deschis


Intrări I i
Sistem

conduce după drumul pe care l-a parcurs în trecut şi nici nu are o anumită
„ţintă”, direcţie, spre care să meargă în viitor. Un ceas este de asemenea

26
un sistem deschis; el nu-şi observă propria imprecizie pentru a şi-o
controla singur.

Sistemul cu conexiune inversă (cu reacţie sau feed-back) care este


denumit şi sistem închis este influenţat de propria-i comportare trecută.
La aceste sisteme ieşirile pot regla intrările. Un sistem cu conexiune
inversă funcţionează ca o buclă închisă care foloseşte rezultatele acţiunii
trecute ale sistemului pentru a comanda acţiunea viitoare.
Exemplu: Un ceas şi posesorul lui formează un sistem cu conexiune
inversă;
Informaţia
Decizie Acţiune Starea sistemului

F
iFig.2 Sistem cu conexiune inversă

când ora indicată de ceas este comparată cu ora exactă, care este luată ca
obiectiv, iar ceasul este potrivit pentru a elimina erorile.

Cursul nr.5 Statistică în psihologie

Evenimente. Definiţia clasică a probabilităţii

27
Câmp finit de evenimente

1.1 Experienţă, probă,eveniment

Definiţie. Se numeşte experienţă în teoria probabilităţilor, orice act


care poate fi repetat în condiţii date.
Definiţie. Probele sunt rezultatele posibile ale unei experienţe.
Experienţele pot avea un număr finit sau infinit de probe.
Definiţie. Se numeşte eveniment, orice situaţie legată de o
experienţă, despre care putem spune că s-a produs sau nu, după
efectuarea experienţei.
Evenimentele aleatoare se pot nota cu A, B, C...sau A 1 , A 2 ,...
Definiţie. Se numeşte experienţă aleatoare orice experienţă care
fiind repetată în aceleaşi condiţii conduce la rezultate diferite.
Probele unei experienţe se mai numesc şi cazuri posibile ale
experienţei.
Prin eveniment se întelege realizarea sau nerealizarea unei probe
(de exemplu, obţinerea feţei cu numărul 3 la aruncarea unui zar
constitue un eveniment).
Definiţie. Se numeşte eveniment aleator, un rezultat posibil al unei
experienţe aleatoare.
Exemplu. Să considerăm experienţa aruncării unui zar şi să
presupunem că ne punem întrebarea dacă vom obţine o faţă cu un
număr par de puncte. În acest caz, experienţa constă în aruncarea
zarului, proba este rezultatul care se obţine la sfârşitul experienţei,
iar evenimentul care ne interesează constă în apariţia unui număr
par de puncte.
Evenimentul se realizează dacă se obţine una din probele 2,4,6 şi
nu se realizează în caz contrar. De aici rezultă că evenimentul se
poate realize în trei probe.
Dacă în cazul aceleiaşi experienţe ne interesează apariţia feţei cu
un punct, suntem în prezenţa unui eveniment care se poate realiza
printr-o singură probă.

28
Definiţie. Evenimentul care poate fi realizat printr o singură probă,
se numeşte eveniment elementar.
Definiţie. Evenimentul care poate fi realizat prin două sau mai
multe probe se numeşte eveniment compus.
Definiţie. Se numeşte spaţiu de selecţie, mulţimea evenimentelor
elementare asociate experienţei respective.
Definiţie. Se numeşte eveniment sigur, notat cu  , evenimentul
care se realizează cu certitudine la fiecare efectuare a experienţei.
Definiţie. Se numeşte eveniment imposibil, notat cu  ,
evenimentul care nu se realizează la nici o efectuare a experienţei.
Exemple. La aruncarea unuizar, apariţia uneia din feţele 1,2,3,4,5,6
este evenimentul sigur, iar apariţia feţei cu un număr de şapte
puncte este evenimentul imposibil.
Extragerea unei bile de culoare albă dintr-o urnă cu bile albe este
evenimentul sigur, iar extragerea unei bile de culoare albă dintr-o
urnă cu bile negre este evenimentul imposibil.
Definiţie. Se numeşte evenimentul contrar evenimentului A şi se
notează cu A , evenimentul a cărui realizare constă în nerealizarea
lui A .
Exemple. Fie o urnă cu bile albe şi negre. Dacă notăm cu A
evenimentul care constă în extragerea unei bile albe, A este
evenimentul care constă în extragerea unei bile negre.
Realizarea unuia este echivalentă cu nerealizarea celuilalt.
Considerăm experienţa aruncării unui zar. Dacă notăm cu A
evenimentul care constă în apariţia unei feţe cu un număr par de
puncte, A este evenimentul care constă în apariţia feţei cu un
număr impar de puncte.
Evenimentul sigur constă în nerealizarea evenimentului imposibil
şi reciproc.

AA ,   A A , 

Definiţie. Două evenimente se numesc compatibile dacă se pot


realiza simultan, ceea ce înseamnă există cel puţin un rezultat care

29
favorizează pe fiecare din aceste evenimente. În caz contrar se
numesc incompatibile.
Exemplu. Să considerăm experienţa aruncării unui zar şi să notăm
cu A evenimentul care constă în apariţia feţei cu 1, 2, 3 puncte, iar
cu B evenimentul care constă în apariţia uneia din feţele 2, 3, 5.
Evenimentele A şi B sunt compatibile, deoarece dacă vom obţine
ca rezultat al experienţei faţa 2 sau 3, înseamnă că s-au realizat
ambele evenimente.
Observaţie. Evenimentele contrare sunt incompatibile.
În general, un număr finit de evenimente A1 , A2 ,....., An sunt
compatibile dacă se pot realiza simultan, ceea ce înseamnă că
există o probă care realizează fiecare din aceste evenimente. În caz
contrar, evenimentele A1 , A2 ,....., An sunt incompatibile.
Observaţie. Dacă evenimentele A1 , A2 ,....., An sunt compatibile două
câte două, nu înseamnă că ele sunt compatibile în totalitatea lor.
Exemplu. Considerăm experienţa aruncării unui zar cu următoarele
evenimente : A1 apariţia feţei cu un sau 2 puncte, A2 apariţia feţei
cu 2 sau 3 puncte, A3 apariţia feţei cu 3 sau 4 puncte. A1 este
compatibil cu A2 , A2 este comatibil cu A3 , dar nu sunt compatibile
în totalitatea lor.
Definiţie. Se spune că evenimentul A implică evenimentul B , dacă
B se realizează de fiecare dată când se realizează A . Se notează
A  B.
Exemple. Considerăm experienţa aruncării unui zar şi notăm cu A
evenimentul care constă în apariţia feţelor cu 2 sau 4 puncte, iar cu
B evenimentul care constă în apariţia feţei cu un număr par de
puncte. În acest caz A implică B .
Considerăm experienţa aruncării unui zar şi notăm cu C
evenimentul care constă în apariţia unui număr de puncte mai mic
decât 4, iar cu D evenimentul care constă în apariţia unei număr de
puncte mai mic sau egal cu 5, atunci C implică D.
Observaţie. Dacă A implică B şi B implică A , atunci A  B .
Orice eveniment implică evenimentul sigur.
Evenimentul imposibil implică orice eveniment.

30
Evenimentele pot fi reprezentate ca mulţimi, ceea ce înseamnă că
atunci când ne fixăm atenţia asupra unui eveniment, este vorba
despre o parte din mulţimea probelor experienţei.
Considerând experienţa aruncării unui zar şi notând cu A
evenimentul care constă în apariţia feţelor cu 1,2 sau 5 puncte,
identificăm acest eveniment cu mulţimea probelor care îl
realizează :
A  {1,2,5}
Evenimentul A este o submulţime a mulţimii {1,2,3,4,5,6} probelor
ataşate experienţei.

1.2. Operaţii cu evenimente.


Reuniunea. Fiind date două evenimente A şi B , numim reuniunea
lor, evenimentul care se realizează atunci când cel puţin unul din
evenimentele A , B se realizează. Notăm: A  B .
Intersecţa. Fiind date două evenimente A şi B , numim intersecţia
lor, evenimentul care se realizează atunci când evenimentele A , B
se realizează simultan. Notăm: A  B .
Observaţie. Două evenimente A , B sunt incompatibile dacă
A B  .
Observaţie. Operaţiile de reuniune şi intersecţie se extind pentru
orice număr finit de evenimente.
Fiind date n evenimente A1 , A2 ,...., An putem scrie:
n n
Ai  A1  A2  ....  An Ai  A1  A2  ....  An
i 1 , i 1

Diferenţa. Numim diferenţa evenimentelor A şi B , evenimentul


care constă în realizarea lui A şi nerealizarea lui B . Notăm:

A\ B  A B .
Fie E  {E1 , E 2 ,..., E n } mulţimea tuturor evenimentelor elementare
corespunzătoare unei experienţe.
{E1 }, {E 2 },............., {E n } ceea ce înseamnă C n1 evenimente
{E1 , E 2 }, {E1 , E3 },..........., {E n 1 , E n } ceea ce înseamnă C n2 evenimente
……………………………………………………………….

31
{E1 , E 2 ,....., E n } ceea ce înseamnă C nn evenimente
 1
Un câmp deevenimente conţine 1  C  C  .....  C nn  (1  1) n  2 n 1
n
2
n

evenimente, unde n este numărul evenimentelor elementare.


Definiţie. Se numeşte câmp finit de evenimente, perechea {E , K } ,
unde E este evenimentul sigur, iar K este familia tuturor
submulţimilor lui E , care satisface proprietăţile :
1) A  E , A  K , atunci A  K
Ai  K ,1  i  n n

2) Dacă , atunci i 1 Ai  K
3)   K .
Observaţie. Un câmp de evenimente este format din mulţimea
tuturor submulţimilor lui E , la care se adaugă E şi  .

Din definiţia de mai sus derivă câteva proprietăţi ale câmpului de


evenimente {E , K } , astfel :
1) E  K
n n
Ai ,1  i  n, Ai , Ai
2) Fiind date i 1 i 1 verifică legile lui De Morgan.
Ai  K ,1  i  n n

3) Dacă atunci i 1 Ai  K .
4) Fiind date A, B  K , atunci
A  A  A, A  A  A, A  B  B  A, A  B  B  A , iar relaţiile
A  B, A  B , A  B  B, A  B  A sunt echivalente.
5) Fiind date A, B  K atunci A  B  A  A  B
6) A  A, A  K
7)   A  A,   A  , A  K
8) Fiind date A, B, C  K au loc relaţiile :
A  ( B  C )  ( A  B)  C
A  ( B  C )  ( A  B)  C
A  ( B  C )  ( A  B)  ( A  C )
A  ( B  C )  ( A  B)  ( A  C )
9) Fiind date A, B  K au loc relaţiile :
A  B  A  ( B  A ), B  ( A  B)  ( A  B)
10) Fiind date A, B  K , relaţiile A  B  , A  B , B  A sunt
echivalente.

32
Câmp de probabilitate finit

Fie o experienţă cu n evenimente egal posibile (evenimentele


considerate au aceeaşi şansă de a se realiza) şi A un eveniment
oarecare ataşat experienţei, care se poate realiza prin m probe,
m  n.
Definiţie. Se numeşte probabilitatea evenimentului A , notată cu
P ( A) , numărul :

m nr. cazuri favorabile


P( A)  
n nr. cazuri posibile

Numărul P( A) reprezintă definiţia clasică a probabilităţii şi are


următoarele proprietăţi:
1) 0  P( A)  1
2) P()  0, P( E )  1
3) Dacă A  B   atunci P( A  B)  P( A)  P( B)
4) P( A )  1  P( A)
5) P( A  B)  P( A)  P( B)  P( A  B)

Cursul nr. 6 Statistică în psihologie

Schema lui Bernoulli

În urma efectuării unei experienţe poate să apară evenimentul A cu


probabilitatea p sau contrariul său cu probabilitatea q=1-p.
Se repetă experienţa de n ori în condiţii identice. Probabilitatea ca
în cele n experienţe evenimentul A să apară de k ori este
P (n, k )  C nk p k q n  k .

33
Exemplu. Se aruncă o pereche de zaruri de şase ori. Care este
probabilitatea ca exact de patru ori să obţinem un total de şapte
puncte ?
Rezolvare. În urma unei aruncări, 7 puncte pot să apară în 6 cazuri
din 36 posibile:
6 1 1 5
p  C 64 ( ) 4 ( ) 2
,
36 6 6 6
Exemplu. Se trunca o monedă de 6 ori. Care este probabilitatea să
apară de 4 ori prima faţă şi de 2 ori a doua faţă ?

Schema lui Bernoulli cu mai multe Stări

În urma efectuării unei experienţe pot apărea evenimentele


A1 , A2 ,....., As s
p1 , p 2 ,...., p s ,  p k  1.
cu probabilităţile k 1

Se repetă experienţa de n ori. Probabilitatea ca în cele n experienţe


evenimentele A1 , A2 ,....., As să apară respectiv de m1 , m2 ,...., ms ori este

n! s

cu 
P (n; m1 , m2 ,....., m s )  p1m1 p 2m2 ....... p sms mk  n.
m1!m2 !......m s ! k 1

Exemplu. Se aruncă un zar de 5 ori. Care este probabilitatea ca de


două ori să obţinem faţa cu un punct, de două ori faţa cu două
puncte şi o dată nici una din aceste două feţe ?

5! 1 2 1 2 2 5
P(n; n1 , n2 , n3 )  ( ) ( ) ( )
2!2!1! 6 6 3 324

Exemplu. Probabilităţile ca diametrul unei piese de maşină să fie


între limite mai mici, respectiv mai mari decât cele admisibile sunt
0.05 şi 0.10, iar probabilitatea ca diametrul unei piese să fie între
limite admisibile este de 0.85.
Din întreg lotul se extrag la întâmplare 100 piese. Care este
probabilitatea ca între piesele alese, 5 să fie cu diametrul mai mic,
iar 5 cu diametrul mai mare decât cel admis ?

34
100!
P(100;5;5;90)  (0.05) 5 (0.1) 5 (0.85) 90
5!5!90!

Schema lui Poisson

Se fac n experienţe independente. În urma experienţei de rang k


poate să apară evenimentul A cu probabilitatea p k sau A cu
probabilitatea q k  1  p k , k  1,2,....., n.
Probabilitatea ca în cele n experienţe evenimentul A să se realizeze
de m ori, cu m  n , este coeficientul lui x m din polinomul
p ( x)  ( p1 x  q1 )( p 2 x  q 2 ).....( p n x  q n )
unde pi  P( Ai ), qi  1  pi , i  1,2,..., n .

Exemplu. Se consideră urnele : U 1 (10a,4b),U 2 (5a,3b),U 3 (2a,6b) .


Care este probabilitatea ca lund la întâmplare câte o bilă din fiecare
urnă să obţinem 2 bile albe şi una neagră ?

Exemplu. Se experimentează 4 prototipuri de aparate, câte unul din


fiecare prototip. Probabilitatea ca un prototip să corespundă este
0.8, 0.7, 0.9 şi respectiv 0.85.
Se cere probabilitatea ca toate cele 4 aparate experimentate să
corespundă.

Schema bilei nerevenite

O urnă conţine a bile albe şi b bile negre. Din această urnă se se


extrag n bile fără a pune bila extrasă înapoi în urnă, n  a  b .
Probabilitatea ca  din bilele extrase să fie albe şi  negre
(    n) este dată de
C a C b
Pa ,b ( ,  ) 
C ab
Considerăm o urnă care conţine biele de m culori: a1 de culoare c1 ,
a 2 de culoare c 2 , …, a m de culoare c m . Se extrag n bile deodată sau

35
una câte una fără întoarcerea bilei extrasă din urnă. Probabilitatea
de a obţine  1 bile de culoare c1 ,  2 bile de culoare c2 , …,  m bile
de culoare cm ( 1   2  ....   m  n) este
2
C a11 C a2 ......C amm
  ......
C a1  a221...... amm

Exemplu. Într-un lot de 100 piese, 6 piese au defecte remediabile, 4


piese sunt rebuturi, iar restul sunt piese bune. Din acest lot au fost
luate la întâmplare 10 piese. Care este probabilitatea ca din aceste
piese 2 să aibă defecte remediabile, una să fie rebut şi 7 să fie
bune.
C 62 C 41C 907
Rezolvare. 10
C100 .

Cursul nr. 7 Statistică în psihologie

Probabilităţi condiţionate

Să considerăm experienţa aruncării uni zar şi să notăm cu A


evenimentul care constă în apariţia uneia din feţele 1,2,3, iar cu B
evenimentul care constă în apariţia uneia din feţele 2,3,4.
P(A)=P(B)=3/6=1/2
Ne propunem să evaluăm probabilitatea evenimentului B în ipoteza
că A s-a realizat. Această probabilitate o numim probabilitatea

36
evenimentului B condiţionată de A şi se notează cu PB ( A) sau
P(B/A).
În ipoteza că A s-a realizat, înseamnă că a apărut una din feţele
1,2,3; din aceste cazuri numai două sunt favorabile evenimentului
B: 2,3.
Rezultă P(B)=2/3.
Fie o experienţă cu un număr finit de cazuri egal posibile.
Notăm: n - numărul cazurilor egal posibile ale experienţei.
m - numărul cazurilor favorabile evenimentului A.
p - numărul cazurilor favorabile evenimentului B.
q - numărul cazurilor favorabile evenimentului A  B .
Atunci
m p q
P( A)  , P( B)  , P( B / A) 
n n m
Dar
q P( A  B)
P( B / A) 
q P( A)
 n
m m
n şi rezultă

Definiţie. Probabilitatea evenimentului A condiţionată de


evenimentul B , notată P( A / B) sau PB ( A) este dată de relaţia :
P( A  B) P( B)  0
P( A / B) 
dacă
P( B)
Definiţie. Două evenimente A şi B sunt independente dacă fiecare
dintre ele nu îşi modifică probabilitatea în funcţie de realizarea sau
nerealizarea celuilalt, ceea ce înseamnă că
P( A  B)  P( A) P( B)
În practică noţiunea de independenţă comportă două aspece.
În unele situaţii nu este cunoscută şi ea trebuie dovedită.
Exemplu.Se aruncă un zar o singură dată. Notăm:
A apariţia uneia din feţele cu 1,2,3 puncte.
B apariţia uneia din feţele cu 2,3,4,5 puncte.
Cele două evenimente sunt independente ?
P(A)=1/2 , P(B)=4/6=2/3
P(A şi B)=2/6=1/3

37
P(A şi B)=1/3=1/2.2/3=P(A)P(B)
Evenimentele A şi B sunt independente.
În cele mai multe cazuri, independenţa este necunoscută, ea
reieşind din context.
Exemplu.Să presupunem că se aruncă două zaruri, unul de culoare
albă, iar celălalt de culoare neagră. Considerăm evenimentele:
A aparişia feţei cu 4 puncte pe zarul alb;
B apariţia feţei cu 6 puncte pe zarul negru.
Evenimentele A şi B sunt independente.
Fie urnele U 1 şi U 2 , care conţin bile albe şi respectibv bile negre.
Notăm cu A evenimentul care constă în extragerea unei bile albe
din prima urnă, iar cu B evenimentul care constă în extragerea unei
bile negre din a doua urnă. Cele două evenimente sunt
independente.

Formule şi scheme clasice de probabilitate.

Formula înmulţirii probabilităţilor

Teoremă. Dacă A1 , A2 ,....., An sunt n evenimente astfel încât


probabilitatea realizării simultane este diferită de zero,
P( A1  A2  .....  An )  0 , atunci
P( A1  A2  .....  An )  P( A1 ) P( A2 / A1 ) P( A3 / A1  A2 )....P( An / A1  A2  ... An 1 )
Demonstraţie. Folosind probabilităţile condiţionate, avem:
P( A1 )  P( A1 )
P( A1  A2 )
P( A2 / A1 ) 
P( A1 )
P( A1  A2  A3 )
P( A3 / A1  A2 ) 
P( A1  A2 )
....................................................................
P( A1  A2  .....  An 1  An )
P( An / A1  A2  .....  An 1 ) 
P( A1  A2  ......  An 1 )
pe care înmulţindu-le membru cu membru se obţine formula de
mai sus.

38
Exemplu. O urnă conţine 4 bile albe şi 6 bile negre. Se cere
probabilitatea ca extrăgând de trei ori câte o bilă (fără a pune bila
extrasă înapoi), să obţinem la prima extragere o bilă albă, iar la
următoarele extrageri cîte o bilă neagră.
Rezolvare. Notăm cu A1 evenimentul ca la prima extragere să
obţinem o bilă albă şi cu A2 , A3 evenimentele ca la extragerea a
două, respectiv a treia, să obţinem o bilă neagră.
2 2 5
P( A1 )  P( A2 / A1 )  P( A3 / A1  A2 ) 
5 , 3 , 8

225 1
P( A1  A2  A3 )  
538 6

Exemplu.Se consideră o grupă formată din 10 fete şi 15 băieţi. Se


iau la întâmplare 3 copii. Care este probabilitatea ca primul copil
să fie o fată, al doilea şi al treilea copil să fie un băiat ?

Formula probabilităţii totale

Definiţie. O mulţime de evenimente formează un sistem complet


de evenimente dacă acestea sunt incompatibile două câte două şi
reuniunea lor este evenimentul sigur.
Teoremă. Dacă A1 , A2 ,....., An formează un sistem de evenimente,
atunci pentru orice eveniment A , avem :
P( A)  P( A1 ) P( A / A1 )  P( A2 ) P( A / A2 )  .....P( An ) P( A / An )
Demonstraţie. Din faptul că A1 , A2 ,....., An formează un sistem de
evenimente, rezultă că un eveniment A nu se poate realiza decât
împreună cu unul şi numai unul din evenimentele A1 , A2 ,....., An , ceea
ce înseamnă că
A  ( A  A1 )  ( A  A2 )  ......  ( A  An )
iar

39
P( A)  P( A  A1 )  P( A  A2 )  .......  P( A  An )
Conform regulii înmulţirii probabilităţilor, avem :
P( A  Ak )  P( Ak ) P( A / Ak )
care înlocuite mai sus, conduc la demonstrarea formulei.

Exemplu. Fie trei urne conţinând bile albe şi negre, după cum
urmează :
U 1 (3a,2n) , U 2 (6a,2n) , U 3 (3a,7 n)
Din una din aceste urne se extrage la întâmplare o bilă. Care este
probabilitatea ca bila extrasă să fie albă ?

Rezolvare. Notăm:
X evenimentul ca bila extrasă să fie albă.
A1 evenimentul ca bila extrasă să fie din urna U 1 .
A2 evenimentul ca bila extrasă să fie din urna U 2 .
A3 evenimentul ca bila extrasă să fie din urna U 3 .

1
P( A1 )  P( A2 )  P( A3 ) 
3
3 3 3
P( X / A1 )  P( X / A2 )  P( X / A3 ) 
5 , 4 , 10
11
P( X )  P( A1 ) P( X / A1 )  P( A2 ) P( X / A2 )  P( A3 ) P( X / A3 ) 
20

Formula lui Bayes

Teoremă. Dacă A1 , A2 ,....., An formează un sistem complet de


evenimente, atunci pentru orice eveniment A , avem :
P( Ai ) P( A / Ai )
P( Ai / A) 
P( A1 ) P( A / A1 )  P( A2 ) P( A / A2 )  .....  P( An ) P( A / An )
i  1,2,...., n
Demonstraţie. Aplicând formula înmulţirii probabilităţilor, se
obţine:
P( A  Ai )  P( A) P( Ai / A)
P( Ai  A)  P( Ai ) P( A / Ai )
De aici rezultă că

40
P( Ai ) P( A / Ai )
P( Ai / A) 
P( A)
Pentru calculul lui P( A) aplicăm formula probabilităţii totale:
P( A)  P( A1 ) P( A / A1 )  P( A2 ) P( A / A2 )  .....  P( An ) P( A / An )
şi înlocuind, se obţine:
P( Ai ) P( A / Ai )
P( Ai / A) 
P( A1 ) P( A / A1 )  P( A2 ) P( A / A2 )  ....  P( An ) P( A / An )
care se mai poate scrie
P( Ai ) P( A / Ai )
P( Ai / A)  n

 P( A ) P( A / A )
i 1
i i

Exemplu. Fie două urne care conţin bile albe şi negre:


U 1 (3a,2b),U 2 (2a,4n) . Din aceste urne s-a extras o bilă albă. Care este
probabilitatea ca bila să fi fost extrasă din prima urnă ?
Rezolvare. Notăm:
A1 evenimentul ca bila extrasă să fie din U 1 .
A2 evenimentul ca bila extrasă să fie din U 2 .
X evenimentul ca bila extrasă să fie albă.

P( X / A1 ) P( A1 )
P( A1 / X ) 
P( X / A1 ) P( A1 )  P( X / A2 ) P( A2 )

3 1 9
P( X / A1 )  P( X / A2 )  P( A1 / X ) 
5 , 3 , 14

41
Cursul nr. 8 Statistică în psihologie

Variabile aleatoare

Frecvent, în viaţa de toate zilele, întâlnim mărimi ale căror valori


se schimbă sub influenţa unor factori întâmplători.
De exemplu, numărul de puncte care apar la aruncarea unui zar,
numărul zilelor dintr-un an în care plouă, greutatea unui bob de
grâu luat dintr-o recoltă etc.
Definiţie. O mărime asociată unei experienţe aleatoare şi care ia
valori la întâmplare, în funcţie de rezultatul experienţei, se numeşte
variabilă aleatoare.
De aici se poate desprinde concluzia că o variabilă aleatoare
reprezintă o corespondenţă între mulţimea rezultatelor posibile ale
unei experienţe aleatoare şi mulţimea numerelor reale.

42
Definiţie. O variabilă aleatoare este o funcţie care asociază fiecărui
eveniment elementar (fiecărui eveniment al spaţiului de selecţie)
un număr real.
Definiţie. Fiind dat un câmp de probabilitate ( E , K , P) , funcţia
X : E  R, măsurabilă (  y  R : X 1 ( y )  E ) se numeşte variabilă
aleatoare.
Observaţie. Unele variabile aleatoare pot lua un număr finit de
valori, iar altele pot lua orice valoare dintrun interval.
Definiţie. O variabilă aleatoare este discretă dacă mulţimea
valorilor sale este o mulţime discretă (finită sau numărabilă).
Observaţie. Dacă mulţimea valorilor unei variabile aleatoare este
finită, variabila aleatoare se numeşte simplă.
Definiţie. Ovariabilă aleatoare este continuă dacă mulţimea
valorilor sale este o submulţime a lui R.

Variabile aleatoare discrete

Ţinând seama de faptul că valorile unei variabile aleatoare sunt


influenţate de cauze aleatoare, iar unele valori pot apărea mai des
decât altele, rezultă că o variabilă aleatoare este mult mai bine
precizată dacă se cunoaşte şi probabilitatea cu care este luată
fiecare valoare.
X  x1 ... x n  pi  P( X  xi )  0 () i  1, n n
   pi  1
:  p1 ... p n  , unde , şi i 1
sau
X  x1 ... x n ...  pi  P( X  xi )  0 () i  1 
   pi  1
:  p1 ... p n ...  , unde , şi i 1 .

Operaţii cu variabile aleatoare discrete


X  x1 ... x n  Y  y1 ... ym 
   
Fie :  p1 ... p n  ,
:  p1 ... p m 
două variabile aleatoare discrete
care iau o mulţime finită de valori şi o constantă a  R.
Suma şi produsul cu o constantă se prezintă astfel:

43
a X  a  x1 ... a  x n  aX  a  x1 ... a  x n 
   
:  p1 ... p n  , :  p1 ... p n 

Suma celor două variabile se calculează după cum urmează:


X  Y  x1  y1 ... x n  y m 
 
:  p11 ... p nm 
unde
pij  P( X  Y  xi  y j )  P[( X  xi )  (Y  y j )] m n

,
 p
i 1 j 1
ij 1

pij  pi P(Y  y j / X  xi )  q j P( X  xi / Y  y j )

Dacă variabilele aleatoare sunt independente, atunci

pij  P({ X  xi }  {Y  y j }) indep P( X  xi ) P(Y  y j )  p j q j


Produsul celor două două variabile are următoarea distribuţie:

XY  x1  y1 ... x n  y m 
 
:  p11 ... p nm 

unde pij au aceeaşi semnificaţie ca mai sus.


X  X n 1 X , n  2
n

Exemple.

1 0  1 0 
X 1 :   X 2 :  
Fie  p q ,  p q doua variabile aleatoare.

2 1 0 
X 1  X 2 :  2 
Suma este dată de p
2 pq q 2  deoarece

P( X 1  X 2  2)  P[( X 1  1)  ( X 2  1)]  P( X 1  1) P( X 2  1)  p 2

44
P( X 1  X 2  1)  P{[( X 1  1)  ( X 2  0)]  [( X 1  0)  ( X 2  1)]} 
 P( X 1  1) P( X 2  0)  ( P( X 1  0) P( X 2  1)  pq  qp  2 pq

P( X 1  X 2  0)  P[( X 1  0)  ( X 2  0)]  P( X 1  0)  P( X 2  0)  qq  q 2

1.1 1.0 0.1 0.0  1 0 


X 1 X 2 :   X 1 X 2 :  2 
Produsul este dat de  p. p p.q q. p q.q  sau p 2 pq  q 2 
deoarece
P( X 1 X 2  1)  P[( X 1  1)  ( X 2  1)]  P( X 1  1) P( X 2  1)  p 2

P( X 1 X 2  0)  P{[( X 1  1)  ( X 2  0)]  [( X 1  0)  ( X 2  1)]  [( X 1  0)  ( X 2  0)]} 


 P( X 1  1) P( X 2  0)  P( X 1  0) P( X 2  1)  P( X 1  0) P( X 2  0)  pq  qp  qq  2 pq  q 2

Independenţa variabilelor aleatoare

X  x1 ... x n  Y  y1 ... ym 
   
Fie :  p1 ... p n  ,
:  p1 ... p m 
două variabile aleatoare discrete
simple.
Definiţie. Variabilele aleatoare simple X , Y sunt independente dacă
evenimentele { X  xi },{Y  y j } sunt independente.
Observaţie. Cu alte cuvinte, două variabile aleatoare sunt
independente dacă probabilitatea ca una din variabile să ia o
anumită valoare nu depinde faptul că cealaltă a luat o altă valoare.
În cazul variabilelor aleatoare discrete care iau o mulţime
numărabilă de valori, distribuţia se prezintă astfel:

45
 x x 2 ..... x n ......  0  pi  1

X :  1  p i 1
 p1 p 2 .... p n ......  , , i 1

Observaţie. Operaţiile cu variabile discrete care iau o mulţime


numărabilă de valori se efectuează la fel ca operaţiile cu variabile
aleatoare simple.
X n
M [ X ]   xi p i
Media unei variabilei aleatoare discrete simple este i 1

.
Media unei variabilei aleatoare discrete X care ia o mulţime
 
M [ X ]   xi p i
dacă seria 
x p
numărabilă de valori este i 1 i 1
i i
este
absolut convergentă. Suma acestei serii este valoarea medie a
variabilei aleatoare X , notată cu M [ X ] .
Proprietăţi. Dacă X , Y sunt două variabile aleatoare simple, atunci
1. M (aX )  aM ( X ) , M (a  X )  a  M ( X ) , a  R

 ax ax 2 .....ax n   a  x1 a  x 2 ...a  x n 
aX :  1  a X :  
Se ştie că  p1 p 2 ...... p n  ,  p1 p 2 ........ p n 

n n
M (aX )   ai xi pi  a  pi xi  aM ( X )
i 1 i 1 ,
n n n
M ( a  X )   ( a  xi ) p i  a  p i   p i xi  a  M ( X )
i 1 i 1 i 1

2. a  M (X )  A,
unde a  inf X , A  sup X
Se observă că a  xi  A , se înmulţeşte cu pi şi se însumează după i
n n n a  M (X )  A
a  pi   xi pi  A pi
i 1 i 1 i 1 , ehivalent cu .
3. M ( X  Y )  M ( X )  M (Y )
X  x1 ... x n  Y  y1 ... y m 
   
Fie : p
 1 ... p n şi : q
 1 ... q m 

 x  y1 x1  y 2 ...x1  y m  ....x n  y m 
X  Y :  1 .
 p11 p12 ............. p1m ............. p nm 

46
pij  P( X  xi , Y  y j ) n m

,
p
i 1
ij  qj
,
p
j 1
ij  pi

M ( X  Y )   pij ( xi  y j )   xi pij   y j pij   xi pij   y j pij 


i, j i, j i, j i j j i

  xi  pij   y j  pij   xi pi   y j q j  M ( X )  M (Y )
i j j i i j

4. Dacă X ,Y
sunt independente
M ( XY )  M ( X ) M (Y ) , M ( X 1 X 2 ..... X n )  M ( X 1 ) M ( X 2 )....M ( X n )
Fie X , Y două variabile aleatoare independente şi produsul lor:
.
x y x1 y 2 .....x n y m 
XY :  1 1 
 p1 q1 p1 q 2 ..... p n q m 

M ( XY )   pi q j xi y j   pi q j xi y j   pi xi  q j y j  M ( X ) M (Y )
i, j i j i j

Definiţie. Se numeşte moment de ordinul k al variabilei aleatoare


X , numărul M k ( X )  M ( X k ) .

Dispersia variabilelor aleatoare discrete

Pentru caracterizarea unei variabile aleatoare, valoarea medie este,


în general, insuficientă. Două variabile aleatoare simple pot lua
acelaşi număr de valori şi pot avea aceeaşi medie, dar în timp ce
una ia valori apropiate de valoarea medie, cealaltă poate să ia
valori foarte depărtate de această medie.
Exemplu.
1 1    100 100  M [ X ]  0 M [Y ]  0
   
X :1 1 Y :1 1 
   
Fie 2 2 şi 2 2 , ,

De aici rezultă necesitatea introducerii unui indicator numeric,


care să măsoare gradul de împrăştiere a valorilor unei variabile
aleatoare în jurul valorii medii.

47
Dispersia unei variabile aleatoare discrete X este
n
D 2 ( X )   ( xi  M [ X ]) 2 pi  M [ X 2 ]  M 2 [ X ]
i 1

iar abaterea medie pătratică este D[ X ]  D 2 ( X ) .


Dispersia se mai notează şi calculează astfel:

 2  D 2 ( X )  M [( X  m) 2 ] unde m  M[X ]
Proprietăţi.
1. D 2 ( X )  M ( X 2 )  [ M ( X )]2
D 2 ( X )  M [( X  m) 2 ]  M ( X 2  2mX  m 2 )  M ( X 2 )  2mM ( X )  m 2  M ( X 2 )  [ M ( X )]2
2. Două variabile care diferă printr-o constantă au dispersii egale.
Dacă Y  X  a , a  R atunci D 2 (Y )  D 2 ( X ) .
D 2 (Y )  M {[(Y  M (Y )]2 }  M {[ X  a  ( M ( X )  a )]2 }  M {[ X  M ( X )]2 }  D 2 ( X )

3. , a R.
D 2 (aX )  a 2 D 2 ( X )

D 2 (aX )  M {[(aX  M (aX )]2 }  M {a 2 [ X  M ( X )]2 }  a 2 D 2 ( X )


4. Dispersia unei sume finite de variabile aleatoare independente
două câte două este egală cu suma dispersiilor variabilelor
considerate.
D 2 ( X 1  X 2  ....  X n )  D 2 ( X 1 )  D 2 ( X 2 )  .....  D 2 ( X n ) .

1 2 3 4 
X :  
Exemplu. Fie variabila aleatoare  0,3 0,1 0,4 0,2 
Să se calculeze M ( X ) , M ( X !) , M ( X 2 ) , D 2 ( X ) .
M ( X )  1.0,3  2.0,1  3.0,4  4.0,2  2,5
M ( X  1)  (1  1).0,3  (2  1).0,1  (3  1).0,4  (4  1).0,2  3,5
M ( X 2 )  12.0,3  2 2.0,1  3 2.0,4  4 2.0,2  7,5
D 2 ( X )  M ( X 2 )  [ M ( X )]2  7,5  6,25  1,25

Variabile aleatoarede tip continuu

48
Definiţie. Se numeşte lege de probabilitate, o corespondenţă între
valorile posibile ale unei variabile aleatoare şi probabilităţile
corespunzătoare.
În cazul variabilelor de tip continuu, legea de probabiltate este
corespondenţa dintre intervalele dreptei reale şi probabilităţile
corespunzătoare acelor intervale.
Definiţie. Se numeşte funcţie de repartiţie a variabilei aleatoare X ,
funcţia F : R → [0,1] , F ( x)  P( X  x) .
Funcţia de repartiţie se poate calcula pentru variabile de tip discret,
dar ea prezintă mare interes pentru variabile de tip continuu.
Exemplu.
Fie variabila aleatoare simplă:

1 2 0 x  1
  1 1  x  2
X :1 2 
  F (x)  
3 3 3
, 1 x  2
Proprietăţi.
1. Pentru orice variabilă aleatoare X şi a, b  R, (a  b)
P(a  X  b)  F (b)  F (a )
deoarece ( a  X  b)  ( X  b)  ( X  a ) ceea ce înseamnă că

P(a  X  b)  P( X  b)  P( X  a )  F (b)  F (a )

F () lim F ( x) F () lim F ( x) 1


2. = x = 0 şi = x  =
Evenimentul {X  }   este imposibil, iar { X  } este
evenimentul sigur, de unde rezultă că F ()  0 , F ()  1 .
3. F este continuă la stânga, ceea ce înseamnă că () x0  R,
lim F ( x)  F ( x0 )
x x0
x x0 )
4. F este nedescrescătoare pe R, ceea ce înseamnă că
() x1 , x 2  R, x1  x 2 rezultă că F ( x1 )  F ( x 2 ) .
Dacă x1  x2 rezultă că { X  x1}  { X  x2 } , ceea ce înseamnă că
P( X  x1 )  P( X  x 2 ) şi F ( x1 )  F ( x 2 ) .

49
Definiţie. Spunem că X are densitate de repartiţie sau densitate de
probabilitate, dacă există o funcţie f : R → [0, ) astfel
x
F ( x)   f (t )dt


unde F este funcţia de repartiţie a variabilei aleatoare X .


Definiţie. Funcţia f : R → R este densitate de repartiţie a
variabilei aleatoare X , dacă
a) f ( x)  0 , () x  R
f 

 f ( x) dx  1
b) este integrabilă pe R şi  .
Observaţii.
1) F ( x)  f ( x)
b

 f ( x) dx  F (b)  F (a)  P(a  X  b)


2) a
Exemplu.Să se determine constantele a, b, c  R astfel ca funcţia:

a x0

F ( x)   bx 2 0  x 1
c x 1

să fie densitate de repartiţie.
Exemplu. Fie X o variabilă aleatoare. Să se determine constanta
a
R astfel încât funcţia

a 2 x 3 x  [0,1]
 x  (1,2]
1
f ( x)   ax
altfel
2
0
să fie densitate de repartiţie.

Media şi dispersia unei variabile aleatoare de tip continuu

Fie X o variabilă aleatoare care ia valori în intervalul ( a, b) şi are


densitatea de repartiţie f (x) pe acest interval.

50
Definiţie. Se numeşte valoare medie a variabilei X , numărul
b
M ( X )   xf ( x)dx
a .
Observaţie. Definiţia se păstrează şi pentru a   , b   .
Proptietăţi.
1. Dacă X , Y sunt două variabile aleatoare de tip continuu,
atunci
M ( X  Y )  M ( X )  M (Y )
2. M (aX )  aM ( X ) a 
, R
3. Dacă X  Y atunci M ( X )  M (Y )
4. Dacă X , Y sunt variabile aleatoare independente, atunci
M ( XY )  M ( X ) M (Y )
Definiţie.Se numeşte dispersia variabilei aleatoare X , numărul

D 2 ( X )  M [( X  m) 2 ]
sau
 m  M (X )
D (X )   ( x  m) f ( x)dx
2 2

 unde .
Proprietăţi.
1. D 2 ( X )  0 oricare ar fi variabila aleatoare X . D2 (X )  0 dacă şi
numai dacă X  m .
2. D 2 ( X )  M ( X 2 )  [ M ( X )]2
D 2 ( X )  M [( X  m) 2 ]  M ( X 2  2mX  m 2 )  M ( X 2 )  2mM ( X )  m 2 
 M ( X 2 )  2m 2  m 2  M ( X 2 )  m 2  M ( X 2 )  [ M ( X )]2
3. D 2 (ax)  a 2 D 2 ( X ) a 
, R
4. Dacă variabilele aleatoare sunt independente două câte două,
atunci
D 2 ( X 1  X 2  .....  X n )  D 2 ( X 1 )  D 2 ( X 2 )  .....  D 2 ( X n )

51
Cursul nr. 9 Statistică în psihologie

Repartiţii clasice discrete

1. Repartiţia uniformă discretă pe {1,2,...., n} are tabloul de repartiţie


X  1 2 ... n 
 
: 1 / n 1 / n ... 1 / n 
Media variabilei X este
1 2 1 n(n  1) 1 n  1
M ( X )  1.  2.  ....  n.  n(1  2  ....  n) 
n n n = 2 n= 2 .
Pentru calculul dispersiei, vom folosi proprietatea
D 2 ( X )  M ( X 2 )  [ M ( X )]2 .
Variabila X 2 are tabloul de repartiţie
X2  12 2 2 ... n 2 
 
1 / n 1 / n ... 1 / n 
:  
de unde rezultă că media variabilei X este
1 2 1 1 (n  1)(2n  1)
M ( X 2 )  12.  2 2.  ....  n 2 .  (12  2 2  ....  n 2 ) 
n n n n 6
şi deci dispersia variabilei este X

52
D 2 ( X )  M ( X 2 )  [ M ( X )]2  (n 2  1) / 12
Exemplu. Considerăm experienţa aruncării unui zar. Fie X
variabila aleatoare asociată acestui experiment, reprezentând
număru de puncte obţinute în urma aruncării zarului. Tabloul se
prezintă astfel:

X  1 2 ... 6 
 
: 1 / 6 1 / 6 ... 1 / 6 

n p  (0,1) )
2. Repartiţia binomială de parametri  N* şi are tabloul
de repartiţie
X  k 
 k k n k 
:  C n p (1  p)  k 0,n
Media variabilei X este M ( X )  np(1  p  p)  np .
Pentru calculul dispersiei folosim tot proprietatea
D ( X )  M ( X )  [ M ( X )]
2 2 2
.
Variabila X 2
are tabloul de repartiţie
X2 k2 
 
 C k p k (1  p ) n  k 
: n  k  0, n
Dispersia variabilei X este
D 2 ( X )  n 2 p 2  np 2  np  n 2 p 2  np (1  p )
Exemplul 1. (Schema lui Bernoulli sau schema bilei cu revenire):
Fie o urnă cu bile albe şi bile negre. Se extrage pe rând câte o bilă,
apoi se pune la loc. Care este probabilitatea ca repetând procesul
de n ori, să se extragă k bile albe, ştiind că p este probabilitatea ca
la o extragere să se obţină bilă albă ( p se poate estima ca fiind
numărul bilelor albe/numărul total de bile).
Răspuns: C nk p k (1  p) nk
Exemplul 2. În urma efectuării unei experienţe, poate apare
evenimentul A cu probabilitatea p sau A cu probabilitatea 1  p .
Dacă se repetă experienţa de n ori în condiţii identice, care este
probabilitatea ca evenimentul A să apară de k ori.
Răspuns: C nk p k (1  p) nk

53
3. Repartiţia Poisson de parametru  0 are tabloul de repartiţie
X  k 
 k 
   e   
:  k!  k N
Media variabilei X este
M (X )   
k   k k k
 k e e  k e  k  e 
= k N k! = k 0
k! = k 1
k! = k 1
(k  1)! =

k 1 k '  k 1     k'
e     e 
k 1
(k  1)! k ' 0
k '!
Dar seria exponenţială se scrie
 k
 2 n 
1   ...   ... 
1! 2! n! = eλ,
k 0
k!
de unde rezultă că media variabilei aleatoare X este
 
M ( X )  e e  
Pentru calculul dispersiei folosim tot proprietatea
D ( X )  M ( X )  [ M ( X )]
2 2 2

Variabila X2 are tabloul de repartiţie


X 2
 k2 
 k 
  
 e 
:  k!  k N
de unde rezultă că media variabilei X2 este
k  
k k
2
M (X ) 
 k2   e e  k 2  e    (k 2  k  k ) 
= k N k! = k 1 k! = k 1
k! =
 k  k  k M (X )
  
e    k (k  1)  e  k  e  k (k  1)  k!
= k 1
k! + k 1
k! = k 2 + =
 k  k 2 k ' k  2  k'
  
e  (k  2)! e   2  (k  2)!  e   2 
= k 2 +λ= k 2 +λ k ' 0
k '! + λ=
= e λ e + λ = λ2 + λ.
–λ 2 λ

Revenind,
D 2 ( X )  M ( X 2 )  [ M ( X )]2 = λ2 + λ – λ2 = λ.

Observaţii.
1. Legea Poisson descrie spre exemplu repartiţia numărului de
aparitii ale unui eveniment oarecare într-un interval de timp, daca

54
este cunoscut numărul mediu de aparitii ale evenimentului în
unitatea de timp şi dacă momentele apariţiilor evenimentului sunt
independente.
2. Legea Poisson se mai numeşte şi “legea evenimentelor rare”:
presupunem că se efectuează n probe independente şi în fiecare
din aceste probe, A are probabilitatea de realizare p mică în raport
cu numărul n de apariţii ale probelor, care este mare; notând cu X
variabila aleatoare ce reprezintă numărul de apariţii a
evenimentului A în n probe, atunci X are repartiţie binomiala, cu
P( X  k )
= C nk p k (1  p) nk .
Notând np   rezultă n   / p  p  0,   ct
  ∞ şi trecând la limită după
n
în relaţia de mai sus se obţine
k  
lim C nk p k (1  p ) n  k  e
n k! .

3. În situaţiile în care se efectuează un număr mare de probe


asupra unui eveniment A de probabilitate p , aceeaşi în fiecare
probă, mică în comparaţie cu numărul probelor, numărul de apariţii
ale evenimentului A are repartitie Poisson.

4.2. Repartiţii clasice continue

1. Repartiţia uniformă pe ( a, b) are funcţia de densitate


f (x)  1 x  ( a, b)

b  a x  ( a, b)
= 0
Media variabilei aleatoare X ce are funcţia de densitate f (x) este
 ab
M (X )
 xf ( x) dx   xf ( x)dx
b 1
a x b  a dx 1 x2
b

R  2
ba 2
= = = = = a
Pentru calculul dispersiei folosim tot proprietatea
D ( X )  M ( X )  [ M ( X )] , unde
2 2 2

55
M (X 2 ) 2  b 2 1 b
x f ( x ) dx
  x
2
f ( x)dx a x ba
dx 1

x3
R
ba 3
= = = = a =
2 2
a  ab  b
3
şi deci
M (X 2 ) a 2  ab  b 2 ( a  b) 2 ( a  b) 2
= 3 – 4 = 12 .

m0 
4.Repartiţia normală (Gauss) de parametri şi R (X ~
N (m,  2 ) ) are funcţia de densitate
f (x)

( x m)2 m0 
1 2 2
e
=  2 , R
Media variabilei aleatoare X ce are funcţia de repartiţie f (x) este
M (X )  ( x  m) 2 y  ( x  m) / 
  xf ( x)dx 1
 
2 2

 xe dx
= = 2   =
y 2  
    y2 / 2 m  y2 / 2
1
 (y  m)e 2 dy 2  
 ye dy
2  
e dy
 2   = + =
  
  y2 / 2 m  y2 / 2   y2 / 2
2  
 ye dy
2  
e dy
2  
 (  e )' dy
= + == +

2m  y2 / 2
2
e dy
0 =
2  2m 2m 2m
 e  y / 2 2
I
2
I
2
I
2
=  + =0–0+ =
Dar
  
x2 / 2  y2 / 2 (x 2  y 2 ) / 2
e dx e dy  e dxdy
I·I = 0 ∙0 =00 ,
unde se face schimbarea de variabilă
 x  r cos t r  x 2  y 2
 
 x  r sin t  t  arctg y / x
=>

56
Jordanianul schimbării de variabile este
x x cos t  r sin t
J  r t sin t r cos t
y y
r t = =r
Deci
/ 2 /2    
r 2 / 2 r 2 / 2   er 2 / 2 
  re drdt  dt  re dr 2  
0 2
I·I = 0 0 = 0 ∙0 = ∙ =
De unde

I= 2
Revenind,
M (X ) m
2m 
= 2 = 2
Analog, dispersia variabilei aleatoare X este
2
D (X ) def  2 ( x  m) 2 y  ( x  m) / 
   ( x  m) f ( x)dx
1

2

2 2

 ( x  m) e dx
= 2  
y2 
  2 2  y2 / 2
1
 y e
2 2 2 dy  e
2  
y dy
=  2   = =
  
2  y2 / 2 2  y2 / 2 2  y2 / 2
2  
 y ( e )' dy  e
2  
e dy
2
= =  – =
00  2 2 2  2
2 2  y2 / 2 2 
 e dy I
= 2 = 2 = .
2
= + 2 0
Pentru m  0 şi   1 se spune că variabila aleatoare urmează legea
normală redusă N (0,1) , având densitatea de repartiţie
x2 x
1 
 ( x)  e 2

, R
2
Graficul repartiţiei normale reduse are următoarele proprietăţi:
 simetric faţă de axa ordonatelor;
 concav în intervalul (1,1) şi convex în afară;
 aria cuprinsă între grafic şi axa Ox este 1.

57
Funcţia de repartiţie a variabilei aleatoare normale reduse este
x x
1
 ( x)    (t )dt  e
t 2
dt
 2 

Pentru fiecare x , valoarea lui (x) este egală cu aria cuprinsă între
axa Ox, graficul lui  (x) şi dreapta y  x .
Repartiţia normală prezintă importanţă din următoarele motive:
 cele mai multe măsurători sunt repartizate aproximativ
normal;
 variabilele care un sunt repartizate normal pot fi supuse unor
transformări care conduc la variabile repartizate exact sau
aproximativ normal;
 în condiţii generale, sume de variabile repartizate sau nu
normal sunt aproximativ normal repartizate;
 legea normală reprezintă cazul limită al multor legi de
probabilitate.

5. Repartiţia  2 (hi-pătrat)

Variabila aleatoare X urmează repartiţia  2 cu n grade de libertate


dacă are funcţia de densitate de repartiţie dată de

0 daca x0
 1 n
 1 
x
f ( x)   n x2 e 2
 2 2 ( n ) daca x0
 2

 n x n  n n
1  1 1 1 1 n
x t
t
M (X )  n
2
e dx 
2
n
2 2 2
e dt  n
2 2
(  1)  n
n n n 2
2 ( ) 0
2
2 ( )
2 0
2 ( )
2
2 2 2
x
t
unde am notat 2 .

58
1 n x
1 1 
D2 (X )   x 2 e 2 dx  n  (n  2)n  n  2n
2 2
n
n
2 ( ) 0
2
2

6. Repartiţia Student

Variabila aleatoare X urmează repartiţia Student cu n grade de


libertate dacă are funcţia de densitate de repartiţie dată de

n 1 x
( ) n 1
2 x2 
f ( x)  (1  ) 2
n n
n ( )
2 , R

n 1
( )  n 1
2 x2  2
n 
M (X )  x(1  ) dx  0
n
n ( )
2
deoarece funcţia de sub integrală este impară.

59
Cursul nr. 10 Statistică în psihologie

Populaţie statistică

Statistica este una din ramurile moderne ale ştiinţei care se ocupă cu
gruparea, analiza şi interpretarea datelor referitoare la anumite
colectivităţi, fenomene, procese, etc. precum şi cu unele previziuni
privind producerea lor viitoare.

Definiţie. Se numeşte populaţie statistică orice mulţime (colectivitate)


care face obiectul unei analize statistice.

Exemple. Populaţie statistică poate fi:


1. Mulţimea locuitorilor unui oraş.
2. Comportamentul unei persoane (subiect) sau grup de persoane
(subiecţi) într-un interval de timp.
Într-un studiu privind timpul de reacţie pot fi vizate mai multe categorii
de populaţii: bicicliştii, motocicliştii, conducătorii auto, aviatorii etc.
Din punct de vedere al volumului, populaţia poate fi:

60
 finită (numărul unităţilor statistice fiind cunoscut) : numărul
locuitorilor dintr-o localitate, numărul persoanelor dintr-o firmă etc.
 infinită (numărul unităţilor statistice fiind necunoscut) : numărul
băuturilor de vodcă, numărul femeilor care fumează etc.
Elementele unei populaţii statistice se numesc unităţi statistice. În
psihologie, prin unităţi statistice înţelegem persoane, care se mai numesc
şi subiecţi.

Definiţie. Trăsătura comună tuturor elementelor unei populaţii statistice


se numeşte caracteristică.

Exemple.
1. Mulţimea studenţilor dintr-un an de studiu reprezintă o populaţie
statistică, fiecare student este o unitate statistică. Mediul de
provenienţă (urban, suburban, rural), sexul (masculin, feminin),
apartenenţa religioasă etc. constituie caracteristici.
2. Mulţimea nou născuţilor într-o anumită perioadă de timp dintr-o
anumită localtate formează o populaţie statistică, iar lungimea şi
greutatea constituie caracteristici.
Caracteristicile pot fi:
 cantitative, de exemplu: greutate, înălţime, vârstă sunt
caracteristici cantitative, deoarece pentru fiecare individ se
materializează printr-un număr;
 calitative, de exemplu : culoarea ochilor, culoarea pielii,
culoarea părului, preferinţe politice, apartenenţa confesională,
temperament, profesie, sex, aptitudini, talent, preferinţe artistice etc.
Utilizarea statisticii este foarte importantă în dezvoltarea unor metode
ştiinţifice adecvate de analiză şi decizie asupra unor situaţii despre care
avem date obţinute fie prin observare, fie prin măsurare.
Ideea de bază a statisticii este aceea a prelungirii (extrapolării)
concluziilor trase privind comportamentul unui subiect sau grup de
subiecţi (de obicei limitat) la nivelul întregii colectivităţii din care a
provine.
În cazul unor mari colectivităţi umane, un fenomen de masă nu poate fi
cunoscut, în ansamblul său, cercetând fiecare individ al acesteia. De

61
obicei, se selectează un anumit număr de indivizi pentru a fi studiate
caracteristicile care interesează, utilizând apoi metode adecvate care să
conducă la concluzii privind întreaga colectivitate.
Partea extrasă dintr-un întreg trebuie să fie o „copie micşorată” a
întregului, în sensul conservării la un anumit nivel al proprietăţilor de
bază ale acestuia, cu anumite toleranţe. Aceasta este inferenţa statistică.
Statistica – deşi este privită ca metodă de investigare a unor mari mulţimi
de date – este esenţială tocmai în acele situaţii în care din mulţimea
respectivă se extrag puţine elemente pentru a fi observate.
Statistica operează cu eşantioane extrase aleator din populaţiile supuse
investigării, cu scopul de a modela comportarea unei anumite
caracteristici a populaţiei respective.
Eşantioanele constau într-un anumit număr de unităţi statistice (subiecţi)
extrase dintr-o populaţie fie la întâmplare, fie pe principiul
reprezentativităţii.
Nici un eşantion nu poate fi o reprezentare perfectă a populaţiei din care a
fost extras. El reprezintă o estimare a populaţiei din care provine, cu o
anumită marjă de eroare.
Orice studiu statistic are două componente: obiectul şi scopul.

Obiectul poate fi orice colectivitate, proces, fenomen etc. care poate


furniza informaţii ce prezintă interes.

Scopul este determinat de interesul cunoaşterii anumitor caracteristici ale


colectivităţii, procesului, fenomenului studiat, a diferitelor sale
componente, dezvoltări sau evoluţii.

Exemplu. Într-o localitate, un studiu statistic are ca obiect prezenţa unor


substanţe poluante într-un interval de timp, iar scopul este acela de a pune
în evidenţă influenţa lor asupra stării de sănătate şi comportamentului
oamenilor care compun populaţia respectivă. etc.
În raport de obiectul studiului statistic, se disting patru tipuri de statistici:

 Statistici descriptive, al căror principal scop este descrierea


caracteristicilor unei mulţimi de date.

62
În urma observării unei colectivităţi care face obiectul unui studiu, se
obţine o mulţime de date. Rolul statisticii descriptive este de a colecta,
grupa şi sistematiza datele de observaţie.

Exemplu. Recensământul presupune colectarea, gruparea şi sistemetizarea


unui volum foarte mare de date.

 Statistici inferenţiale, care pe baza studiului realizat pe o parte a


unei colectivităţi, prin extrapolare, conduce la concluzii pentru întreaga
colectivitate.

Definiţie. Procedeul prin care se obţin date privind populaţia totală


pornind de la informaţii incomplete se numeşte inferenţă.
Exemplu. Frecvent se face sondarea opiniei publice privind diferite
evenimente. Colectivitatea fiind foarte mare, nu se poate afla opinia
fiecărei persoane, motiv pentru care se alege o colectivitate mică,
reprezentativă, care devine obiect de studiu în locul colectivităţii din care
provine. Concluziile obţinute sunt apoi extrapolate asupra întregii
colectivităţi.

 Sratistici corelaţionale, care stabilesc dacă există relaţii între două


mulţimi de observaţii.
Exemplu. Studiul comportamentului efectuat pe diferite comunităţi locale
evidenţiază faptul că între comportamentul lor şi apartenenţa la diferite
etnii există o anumită dependenţă.

 Statistici predictive, care pe baza unor metode şi procedee


specifice, utilizând informaţiile disponibile privind o populaţie, un
proces, un fenomen etc. se fac previziuni asupra evoluţiei viitoare.
Exemplu. Se fac observaţii privind studiul fenomenului infracţional:
determinare, manifestare perspective. Pe baza rezultatelor obţinute se
poat face predicţii privind evoluţia lui viitoare.
Într-o cercetare statistică distingem trei etape:
 culegerea şi înregistrarea datelor cu privire la fenomenul respectiv;
 prelucrarea datelor obţinute;

63
 analiza şi interpretarea rezultatelor obţinute în urma prelucrării.
Exemlu. Se face un referendum. Acesta presupune culegerea şi
înregistrarea datelor, prelucrarea lor, analiza şi interpretarea rezultatelor.

Selecţia

În cazul când datele sunt culese de la fiecare unitate statistică a unei


populaţii, atunci avem o enumerare completă.
Enumerarea completă este adeseori greu de practicat, ţinând seama de
costuri, timp şi probleme de organizare. Din aceste considerente se
practică selecţia.
Pentru a cunoaşte o anumită caracteristică a unei populaţii nu se
cercetează toate unităţile care o compun, ci numai un număr restrâns dintre
acestea.
Rezultatele cercetării statistice pe baza unor selecţii sunt afectate de erori,
care depind de modul în care se face selecţia.
Selecţia trebuie să îndeplinească condiţiile:
 să fie reprezentativă, ceea ce înseamnă că structura selecţiei
este identică cu a populaţiei respective sau diferă puţin de
aceasta;
 elementele alese să aibă egală probabilitate de a face parte
din selecţie;
 volumul de selecţie trebuie să fie mare;
 unităţile statistice care compun populaţia să fie cât mai
omogene.
Există domenii în care enumerarea completă este posibilă, dar din punct
de vedere teoretic şi practic, utilizarea cercetării selective prezintă
următoarele avantaje:
 cercetarea selectivă este mult mai operativă deoarece
scurtează timpul pentru culegerea şi prelucrarea datelor;
 costul şi problemele de organizarea selecţiei sunt
incomparabil mai mici;
 se poate face un studiu aprofundat asupra problemelor care
prezintă interes.

64
Cursul nr. 11 Statistică în psihologie

Prezentarea şi sistematizarea datelor

Planul de conducere a unei experienţe şi a unei culegeri de date


constituie un protocol. Prezentarea datelor conform unor
protocoale este justificată de specificul cercetării psihologice, în
care datele aparţin unor subiecţi supuşi unei forme de investigaţie.
Planul de experienţă reprezintă şi planul de culegere a datelor.
Noţiunea de protocol se aplică şi observaţiilor efectuate în cazul
unui studiu.
Protocolul datelor este un ansamblu de date structurate după un
anumit plan, care constituie planul de experienţă.
În practică se utilizează mai multe tipuri de protocoale.

Protocolul de structură “subiect-rezultat”.


În cadrul acestui protocol, fiecărui subiect şi al unui ansamblu de n
subiecţi, aflaţi în aceeaşi cercetare, îi corespunde o valoare, notată
cu xi a variabilei de măsurare.

65
Punctajul obţinut de un subiect la un test psihologic, ecologic etc.
se numeşte scor.

S X S X
s1 x1 1 15
s2 x2 2 10
3 25

sn xn 100 20

S – reprezintă subiecţii, iar x scorurile realizate de aceştia.


Tabelul de mai sus conţine frecvenţele absolute sau distribuţia
situaţiei considerate.
O altă organizare a tabelului se poate face astfel:

Nr.
X X
Subiecţi
s1 x1 15 2
s2 x2 10 5
25 3
sn xn

66
Se grupează după un anumit scor (punctaj) numărul subiecţilor
care l-au realizat.
Dacă se înlocuiesc frecvenţele absolute cu frecvenţele relative se
obţine tabelul:

X Frecvenţe
x1 f1

x2 f2

xn fn

Considerăm cazul când studiul respective se bazează pe răspunsuri


la mai mulţi itemi.
Exemplu. Un set de date rezultat în urma examinării a 12 subiecţi,
prin intermediul a 10 itemi (fiecare având 8 variante de răspuns la
alegere, dintre care numai una era corectă) poate fi prezentat în mai
multe variante.
Varianta 1. Rezultatele pot fi înregistrate global, luând în
considerare şi răspunsurile greşite.

Subiectul Răspunsuri corecte Răspunsuri greşite


1 6 4
2 8 2

67
3 9 1
4 6 4
5 5 5
6 3 7
7 5 5
8 8 2
9 4 6
10 7 3
11 2 8
12 3 7

Varianta 2. O altă modalitate de prezentare a datelor constă în


descompunerea rezultatelor studiului pe itemi. Valoarea 1 indică
rezolvarea unui item, iar 0 nerezolvarea lui. Prezentarea se face sub
forma unei matrice item-subiect. Numărul itemilor este trecut pe
linie (1, 2, … , 10), iar numărul subiecţilor pe coloană (1, 2, … ,
12).

Item Core Greş


1 2 3 4 5 6 7 8
Subiect ct it
1 1 1 0 1 1 0 1 0 5 3
2 0 1 0 1 1 0 1 0 4 4
3 1 0 1 1 1 0 1 1 6 2

68
4 1 1 1 0 1 1 1 0 6 2
5 0 1 1 1 0 1 0 1 5 3
6 1 1 0 1 1 1 0 1 6 2
7 1 1 1 1 1 1 0 1 6 2
8 1 0 0 0 1 0 1 0 3 5
9 1 1 1 1 1 1 1 1 10 0
10 1 0 0 1 0 1 1 1 5 5
11 1 1 0 1 0 1 1 1 6 2
12 1 0 1 1 1 0 1 1 6 2
Corect 10 8 6 10 9 7 9 8
Greşit 2 4 6 2 3 5 3 4

În ultimele două coloane sunt înregistrate totalurile răspunsurilor


corecte/greşite pentru fiecare subiect.
În ultimele două linii sunt înregistrate totalurile răspunsurilor
corecte/greşite pentru fiecare item.
O astfel de organizare a datelor pentru efectuarea diferitelor
operaţii specifice.

Varianta 3.

Item Co Gre
1 2 3 4 5 6 7 8 9 10
Subiect rect şit

69
1 8 2 3 8 1 3 5 1 1 5 5 5
2 8 2 3 7 7 4 5 1 6 5
3 8 2 3 8 7 4 5 2 7 5
4 8 2 3 8 7 4 4 5 6 9
5 8 2 4 5 6 3 2 4 7 6
6 7 3 5 4 4 2 1 5 1 7
7 8 2 3 6 7 4 2 8 5 3
8 8 4 3 8 7 4 5 1 7 6
9 8 4 3 8 7 4 5 1 7 6
10 8 2 3 8 8 7 4 5 7 6
11 8 2 3 7 5 3 7 8 7 6
12 8 3 3 7 5 2 8 2 3 5
Corect 11 8 10 3 2 1 5 7 6 4
Greşit 1 4 2 9 10 10 7 5 6 8
Variante
8 2 3 7 5 2 5 2 7 5
corecte

Spre deosebire de varianta anterioară în care răspunsurile erau


notate cu 0, 1, aici este scris numărul variantei de răspuns,
indiferent dacă este corect sau greşit. În acest fel se poate observa
proporţia diferitelor variante de răspuns în raport cu un număr total
al subiecţilor.
Ultima linie a tabelului conţine varianta corectă de răspuns.

70
Protocolul de structură “subiect – grup de apartenenţă”

Datele obţinute provin de la subiecţi aparţinând unor grupuri


diferite sau care s-au aflat în situaţii diferite, constituind serii
independente.

Subiect Grup Rezultat


S G X
S G X
s1 g1 x1 1 g1 15
s2 g2 x2 2 g2 10
s3 g3 x3 3 g3 25

sn gm xn 100 g100 12

n – nr. de subiecţi
m – nr. de grupuri
xi – scorul
Distribuţia frecvenţelor absolute în funcţie de rezultate (scoruri) şi
de grupuri.
Valori ale variabilei măsurate
Grupuri TOTAL
x1 x2 ... xn

g1 a11 a12 a1n t1

71
g2 a 21 a 22 a2n t2

g3

gm a m1 am2 a mn tm

Valori ale variabilei măsurate


Grupuri TOTAL
x1 x2 ... xn

g1 10 4 12 72
g2 7 8 3 65
g3

gm 9 15 7 52
TOTAL 42 45 38 285

Fiecare linie conţine distribuţia scorurilor unui grup după


variantele de răspuns. Fiecare coloană conţine distribuţia după
grupuri a subiecţilor care au obţinut acelaşi scor.
De exemplu, în grupul 1 există 10 subiecţi care au obţinut scorul
x1, în grupul gm există 9 subiecţi care au obţinut scorul x1.

Protocolul de structură “subiect – condiţie de investigaţie”.

72
Acest tip de protocol se realizează în cazul în care subiecţii
sunt supuşi la mai multe condiţii.
De exemplu, subiecţii răspund la mai multe întrebări la
începutul programului de lucru.
T
t1 t2
S
s1 x11 x12

s2 x 21 x 22

sn x p1 x p2

t1
T
S – subiecţi; t2
T are două modalităţi: t1 - la începutul
programului;
t2 - la sfârşitul programului

Acest tabel poate fi organizat astfel:

t2
T x
TOTAL
xa xb xk

t1 xa naa nab nak na1

xb nba nbb nbk nb1

73
xk nka nkb nkk nk1

n
TOTAL na 2 nb 2 nk 2

naa - desemnează numărul de subiecţi care au obţinut acelaşi scor


în ambele modalităţi ale factorului T ( t1 şi t 2 );
na1 - reprezintă numărul de subiecţi care în modalitatea t1 au
obţinut scorul xa ;

nb1 - reprezintă numărul de subiecţi care în modalitatea t2 au


obţinut scorul xb .

t2
T x
TOTAL
16 19 34
16 12 17 20 97
19 15 19 11 87
t1

34 19 22 24 104
TOTAL 110 112 216 540

74
Cursul nr. 12 Statistică în psihologie

Statistică descriptivă

Statistica descriptivă are ca obiect organizarea, sintetizarea şi descrierea


datelor de observaţie.
În psihologia aplicată se utilizează frecvent reprezentarea grafică pentru
analiza şi prezentarea datelor statistice.
Calculatoarele moderne oferă o multitudine de posibilităţi pentru
reprezentarea grafică a datelor statistice.

Reprezentarea grafică a datelor statistice

Reprezentarea datelor statistice se poate face prin:


 tabele statistice
 histograme
 poligoane de frecvenţe
 grafice de frecvenţe cumulate
 grafice circulare.
Tabelele statistice pot fi:
 simple, întocmite pe baza simplei centralizări a datelor statistice,
reprezentând populaţia negrupată;

75
 pe grupe, ce reprezintă populaţia despărţită în grupe omogene după
o singură caracteristică;
 combinate, ce reprezintă populaţia despărţită în grupe omogene
după două sau mai multe caractreristici.
Exemplu. Tabel statistic simplu. Se măsoară înălţimea unei populaţii
reprezentată de 100 studenţi şi se obţine:

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 9 9 9 9
0 2 5 8 0 3 4 5 7 0 2 3 5 8 0 4 7 9 0 2 5 7
4 5 7 2 7
1 2 2 2 3 3 6 6 4 0 1 5 6 2 2 1 1 1
0

Exemplu. Tabel statistic cu date grupate în clase. Se consideră intervale


de lungime egală pentru înălţime, care pot fi grupate astfel:

Clase de valori Frecvenţa


[150 – 155) 3
[155 - 160) 6
[160 - 165) 8
[165 - 170) 11
[170 - 175) 17
[175 - 180) 30
[180 - 185) 12
[185 - 190) 8
[190 - 195) 3
[195 - 200) 2

Exemplu. Tabel statistic combinat, cu date grupate după două


caracteristici.

Nota la psihologie Total

76
Nota la statistică 10 9 8 7 6 5 4 3 2 1
10 1 2 0 0 0 0 0 0 0 0 3
9 2 1 0 0 0 0 0 0 0 0 3
8 0 0 5 3 1 0 0 0 0 0 9
7 0 0 0 4 0 0 0 0 0 0 4
6 0 0 0 0 3 2 0 0 0 0 5
5 0 0 0 0 0 0 2 1 0 0 3
4 0 0 0 0 0 0 1 2 0 0 3
3 0 0 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 0 0
Total 3 3 5 7 4 2 3 3 0 0 30

Histograme.

Histograma reprezintă tot o formă de prezentare a datelor statistice, având


avantajul că oferă o imagine mai sugestivă a fenomenelor cercetate decât
tabelul.
Observaţiile (discrete sau continue) efectuate asupra unei caracteristici a
unei populaţii statistice se repartizează în subintervale ale intervalului
maxim de variaţie. numite clase de valori.
Definiţie. Se numesc clase de valori subintervalele intervalului maxim de
variaţie.
Clasele de valori sunt utile atunci când volumul de date este mare.
Clasele de valori au aceeaşi lungime, eventual cu excepţia ultimei clase.
Repartiţiile de frecvenţă se reprezintă grafic prin histograme sau
poligoane de frecvenţă
Histograma se construieşte astfel:
 pe axa absciselor se trec intervalele de valori,
respectându-se principiul că intervalele egale să fie
reprezentate prin distanţe egale;
 pe axa ordonatelor se construieşte scara frecvenţelor,
respectându-se principiul proporţionalităţii între
frecvenţe;

77
 din limitele fiecărui interval se ridică apoi câte o
perpendiculară pe axa absciselor, ale cărei extremităţi se
unesc printr-o linie, formând mai multe dreptunghiuri ale
căror suprafeţe sunt proporţionale cu frecvenţele
corespunzătoare intervalului respectiv.

Exemplu.

Poligonul frecvenţelor. Se utilizează tot în cazul grupării datelor pe clase


şi reprezintă o alternativă a histogramei; se construieşte astfel:
 pe axa absciselor se trec intervalele de valori,
respectându-se principiul că intervalele egale să fie
reprezentate prin distanţe egale;
 pe axa ordonatelor se construieşte scara frecvenţelor,
respectându-se principiul proporţionalităţii între
frecvenţe;
 în mijlocul fiecărui interval se ridică segmente verticale
perpendiculare pe axa absciselor, a căror lungime este
proporţională cu frecvenţele absolute ale claselor
corespunzătoare;
 extremităţile acestor segmente se unesc printr-o linie
poligonală.
Exemplu.

Grafice de frecvenţe cumulate

Prin frecvenţă cumulată se înţelege totalitatea valorilor care se însumează


de la valoarea cea mai mică la valoarea cea mai mare.
Pentru a obţine graficul de frecvenţe cumulate, pe axa absciselor se
reprezintă intervalele de valori, iar pe axa ordonatelor frecvenţa cumulată.
Se identifică punctele respective şi se unesc cu o curbă.
Exemplu. Se măsoară greutatea unui număr de 100 studenţi şi se cere
graficul frecvenţelor cumulate:

Greutatea Număr studenţi

78
45 - 50 3
50 - 55 5
55 - 60 6
60 - 65 9
65 - 70 12
70 - 75 14
75 - 80 18
80 - 85 15
85 - 90 8
90 - 95 6
95 - 100 4

1.00 *
0.96 *
0.90 *
Exemplu. 0.82 Considerăm seria statistică de mai sus:
(5,2);(7,1),(12,3);(14,1);(18,2);(20,3) şi o vom reprezenta prin clase de
0.67 printr-o histogramă.
valori şi apoi *

0.49 *

0.35 Clasa de valori Frecvenţa


*
5 - 10 3
0.23
10 - 15 *
4
15 - 20 2
0.14 20 - 25 * 3
0.08 *

0.03 *

45 50 55 60 65 70 75 80 85 90 95 100

79
3
4

2
3

5 10 15 20 25
5 10 15 20 25

Analog se poate construi poligonul frecvenţelor.

Diagrame(grafice) circulare. Se utilizează în situaţiile în care se doreşte


reprezentarea ponderii frecvenţei fiecărei clase de interval în raport cu
celelalte.

Statut nk %
Celibatar 20 20%
Căsătorit 55 55%
55% Divorţat 25 25%
55 55
55 55% Total 100

20 %

Cursul nr. 13+14 Statistică în psihologie

Valori caracteristice ale unei serii statistice

80
Fie P o populaţie şi notăm cu f o caracteristică a sa. Caracteristica f
asociază fiecărei unităţi statistice x din populaţia P o valoare f (x) ,
determinată în general prin măsurători.
Definiţie. Mulţimea {( x, f ( x)), x  P} ordonată după valorile lui x , se
numeşte repartiţie empirică a caracteristicii f pe populaţia P sau serie
statistică.
Definiţie. Numărul k reprezentând unităţile statistice (indivizii) din
x
mulţimea {x x  P, f ( x)  k} se numeşte frecvenţă absolută a lui şi se
notează cu nk .
Cu alte cuvinte, numărul indivizilor (unităţilor statistice) dintro populaţie
pentru care caracteristica ia o aceeaşi valoare se numeşte frecvenţă
absolută a valorii respective.
Observaţie. Numărul indivizilor (unităţilor statistice) dintro populaţie
pentru care caracteristica ia o aceeaşi valoare se mai numeşte şi scor.
Dacă valorile distincte ale caracteristicii sunt x1 , x2 ,...., xm , atunci
frecvenţele absolute se notează cu n1 , n2 ,...., nm şi reprezintă numărul
unităţilor statistice care corespund acelor valori.
Fie N numărul unităţilor statistice ale unei populaţii P şi n1 , n2 ,..., nm
m

frecvenţe absolute, atunci 


n N
. k 1
k

Frecvenţele absolute se pot reprezenta astfel:

Valorile caracteristicii x1 x2 . . . . xm

Frecvenţele absolute n1 n2 . . . . nm

Exemplu. Intr-o şcoală sunt 12 clase. Numărul fetelor din fiecare clasă
este de 5, 12, 20, 5, 12, 20, 18, 12, 14, 7, 20, 18.
În acest caz, populaţia statistică este reprezentată de cele 12 clase, iar
caracteristica de numărul fetelor
xk 5 7 12 14 18 20
nk 2 1 3 1 2 3

81
Mulţimea perechilor ( x k , nk ), constituie o serie statistică:
{(5,2), (7,1), (12,3), (14,1), (18,2), (20,3)} 6

, iar 
k 1
k
.
N n  12

Observaţie. Ca regulă generală, valorile x1 , x2 ,...., x p ale caracteristicii


respective se scriu în tabel în ordine crescătoare.
Definiţie. Se numeşte frecvenţă relativă a valorii xk , k  1,2,..., m numărul
nk
pk  , k  1,2,...., m
N .
0  pi  1 i  1,2,...., m m

m
nm n k

Se observă că , iar N

i 1
pi   k 
i 1 N
i 1
1

Pentru exemplul de mai sus, frecvenţele relative se scriu astfel:


2 1 3 13 2
p1  , p2  , p3  , p4  ,, p5  , p6 
12 12 12 12
12 12
n
100. k , k  1,2,...., m
Dacă se doreşte calculul procentual (%) se scrie: N .
Fie X o caracteristică a unei mulţimi, xk , k  1,2,..., m , valorile, iar
p k , k  1,2,...., m frecvenţele relative ale acesteia. Dacă în locul seriei
statistice {( x k , nk ), k  1,2,...., m} considerăm mulţimea perechilor
( x k , p k ), k  1,2,..., m , atunci repartiţia statistică a acestei caracteristicii X se
poate reprezenta astfel:

 x1 p1 
 
 x2 p2 
. . 
 
. . 
 
Caracteristica X . .  căreia i-
x p 
X:  m m
am ataşat această repartiţie
se numeşte variabilă
statistică, iar repartiţia ei se numeşte repartiţie sau distribuţie statistică.
Observaţiile asupra caracteristicii se grupează, de regulă, în clase de
valori.

82
Definiţie. Se numeşte frecvenţă absolută cumulată crescător a valorii
caracteristicii xk , suma tuturor valorilor caracteristicii mai mici sau egale
cu xk .
Exemplu.
Clase de valori Frecvenţa Frecv abs cumulată crescător
[150 – 155) 3 3
[155 - 160) 6 9
[160 - 165) 8 17
[165 - 170) 11 28
[170 - 175) 17 45
[175 - 180) 30 75
[180 - 185) 12 87
[185 - 190) 8 95
[190 - 195) 3 98
[195 - 200) 2 100

Definiţie. Se numeşte valoare centrală a unei clase [ xi , xi 1 ) media


xi  xi 1
m
aritmetică a extremităţilor acestei clase: . 2
Definiţie. Se numeşte medie aritmetică ponderată a unei caracteristici X
(variabilei statistice) numărul
m

x n  x 2 n2  ....  x m nm x n k k
x 1 1  k 1

n1  n2  ......  nm N
sau
m
x   xi p i
i 1
m

unde 
n N
k 1
k
reprezintă numărul unităţilor statistice ale populaţiei.
Exemplu. Fie distribuţia 3, 5, 8, 4, 6 atunci media
5

x i
358 46
x i 1
  5.20
N 5

83
Observaţie.Calculul mediei pentru o distribuţie de frecvenţe grupate se
face prin suma prodului dintre fiecare valoare şi frecvenţa ei, care apoi se
împarte la suma frecvenţelor.
Exemplu. Fie distribuţia 4, 6, 9, 4, 3, 6, 5, 6 atunci
k

x n i k
3 *1  4 * 2  5 *1  6 * 3  9 *1
m i 1

k
1 2 1 3 1
n
i 1
k

Exemplu.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 4
55 3
60 1
Total 30

5 x 20  2 x 23  6 x30  4 x35  5 x 42  4 x50  3 x55  1x60


x
30
Observaţie. În cazul în care valorile variabilei sunt grupate în clase,
calculul mediei se realizează cu ajutorul valorilor centrale ale claselor
respective.
Exemplu. Se măsoară înălţimea unui număr de 100 studenţi şi se obţine:
Clase de valori Frecvenţa abs ni Valori centrale xi pi xi p i
[150 – 155) 3 152.5 0.03 4.575
[155 - 160) 6 157.5 0.06 9.455
[160 - 165) 8 162.5
[165 - 170) 11 167.5
[170 - 175) 17 172.5
[175 - 180) 30 177.5
[180 - 185) 12 182.5
[185 - 190) 8 187.7 84
[190 - 195) 3 192.5
[195 - 200) 2 197.5 0.02 3.950
x  4.575  9.455  ....  3.950
Media geometrică. Dacă xk , k  1,2,..., m sunt valorile caracteristicii
respective, atunci media geometrică este dată de formula:
m g  m x1 x 2 ....x m
Media geometrică se utilizează în studii statistice în care valorile
anumitor caracteristici ale populaţiei sunt proporţionale cu volumul
acesteia.
Definiţie. Se numeşte modul sau moda unei serii statistice valoarea
caracteristicii căreia îi corespunde cea mai mare frecvenţă.
În cazul grupării caractristicii în clase de valori, modul este valoarea
centrală a clasei căreia îi corespunde cea mai mare frecvenţă.
Exemplu. Tabel 1
Clase de valori Frecvenţa Tabel 2
[150 – 155) 3 Statut nk

[155 - 160) 6 Celibatar 20


[160 - 165) 8 Căsătorit 55
[165 - 170) 11 Se Divorţat 25
[170 - 175) 17 observă Totalcă 100
[175 - 180) 30 frecvenţa cea
mai mare în Tabel 1 este în clasa
[180 - 185) 12
[175,180). Modul se calculează ca
[185 - 190) 8
medie aritmetică a limitelor
[190 - 195) 3
intervalului şi este egal cu 177.5.
[195 - 200) 2
În tabelul 2 modul este 55.
Cele două exemple ilustrează cazul unor populaţii unimodale.
În unele cazuri putem avea două valori şi avem populaţie bimodală sau
mai multe valori egale.
Exemplu.

Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent

85
P5 Adeseori
P6 Câteodată
P7 Câteodată
P8 Câteodată
P9 Niciodată

În acest caz modul este dat de Frecvent, având cele mai multe răspunsuri.
Observaţie. Modul poate fi utilizat în măsurarea tendinţei centrale pentru
variabile de tip nominal.
Exemplu. Considerăm următoarea serie statistică reprezentând volumul
vânzările de pantofi de damă întro zi, întrun magazin: (34,2), (35,4),
(36,9), (37,5), (38,8), (39, 11), (40,4), (41,3), (42,2).
Modul (măsura modală) numerelor de pantofi vândute este 39, iar
mediana este 38.
Media aritmetică nu este semnificativă în acest caz.
Definiţie. Se numeşte mediana unei serii statistice valoarea caracteristicii
care împarte volumul populaţiei în două părţi egale.
Observaţie. Pentru determinarea medianei se ordonează caracteristicile
crescător sau descrescător.
În cazul unui număr par de valori ale caracteristicii, mediana este media
valorilor de la mijloc ale caracteristicii.
În cazul unui număr impar de valori ale caracteristicii, mediana este
valoarea de la mijloc a caracteristicii.
Exemple.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 7
60 1
Total 30

86
Mediana este 35. Deci vârsta medie este 35. Avem 13 persoane cu vârsta
mai mică de 35 ani şi 13 cu vârsta mai mare de 35 ani.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 4
55 3
60 1
Total 30

[1, 2, 3, 4, 5, 6] Mediana este (35+42)/2=38.5


Avem 13 persoane cu vârsata mai mică de 38.5 ani şi 13 persoane cu
vârsta mai mare de 38.5 ani.
Mediana împarte volumul populaţiei în două părţi de volume egale.
Aceasta se mai poate obţine din frecvenţa absolută cumulată crescător.
100/2=50 ceea ce înseamnă că există 50 de valori mai mici decât 50 si 50
de valori mai mari decât 50.
Exemplu. Calculul medianei pentru nivel ordinal. Se face o cercetare
privind petrecerea timpului liber, fiind chestionate 9 persoane cărora li s-
a pus următoarea întrebare: „Cât de des aţi fost la operă în anul precedent
?”. Răspunsurile la această întrebare pot fi înregistrate pe o scală
ordinală, astfel: 1. Frecvent 2. Adeseori, 3. Câteodată, 4. Niciodată.

Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent
P5 Adeseori
P6 Câteodată
P7 Câteodată

87
P8 Câteodată
P9 Niciodată

Din cele 9 răspunsuri, al 5-lea este cel din mijloc si reprezintă mediana.
Considerăm tabelul
Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent
P5 Adeseori
P6 Câteodată
P7 Câteodată
P8 Câteodată
P9 Niciodată
P10 Niciodată

În această situaţie avem două cazuri de mijloc: Adeseori şi Câteodată,


ceea ce poate însemna că răspunsul median este Rar.
În concluzie 5 persoane merg la operă frecvent şi adeseori, iar celelalte 5
merg cîteodată sau nicodată.
Observaţie. Mediana poate fi determinată pentru valori pe scală de tip
ordinal, interval şi raport. Nu poate fi determinată pentru valori pe scală
nominală.
Utilizarea unuia sau altuia dintre aceşti indicatorii: medie, modul mediană
depinde de la caz la caz.
Pentru exemplificare, considerăm cazul notelor obţinute de studenţi la
examenul de statistică.
 Dacă toţi studenţii au obţinut aceeaşi notă la examen, atunci
aceasta este egală cu media aritmetică a notelor.
 Dacă notele nu sunt egale, atunci cei mai mulţi au obţinut notele
date de modul.
 Dacă notele nu sunt egale, jumătate au obţinut note mai mici decît
mediana, iar cealaltă jumătate mai mare decâtmediana.

88
Cuantile
În unele situaţii este nevoie să se introducă mărimi analoage medianei,
care împart mulţimea valorilor caracteristicii într-un anumit număr de
submulţimi cu proprietăţi analoage celor puse în evidenţă cu ajutorul
medianei.
Considerăm că mulţimea valorilor caracteristicii este divizată în m
submulţimi.
Definiţie. Se numesc cuantile numerele distincte c1 , c2 ,...., cm1 cu
proprietatea că împart numărul caracteristicilor în intervale astfel încât în
fiecare interval [ck , ck 1 ], k  1,2,..., m  2 valoarea frecventei absolute cumulat
crescătoare este aceiaşi.
Cuantila c1 se numeşte cuantilă mică, iar cm1 se numeşte cuantilă mare.
Pentru un număr par m=2k, cuantila ck coincide cu mediana.
Pentru m=4 cuantilele se numesc cuartile, pentru m=10 se numesc decile,
pentru m=100 se numesc procentile.

Exemplu.

Caracteristica xk Frecvenţa absolută nk Frecvenţă cumulată


crescătoare nk 
5 2 2
6 5 7
8 5 12
10 4 16
12 3 19
14 4 23
15 2 25
16 3 28
18 5 33
20 2 35
21 5 40
24 4 44

89
25 3 47
26 4 51
28 5 56
30 4 60

Pentru calculul cuantilelor se împarte populaţia în patru subintervale


egale, considerând fecvenţa absolută cumulată crescătoare 60/4=15.

Caracteristica xk Frecvenţa absolută nk Cumulată


crescătoare nk 
5 2 2
6 5 7
8 5 12
10 3 15
c1
10 1 16
12 3 19
14 4 23
15 2 25
16 3 28
18 2 30
c2
18 3 33
20 2 35
21 5 40
24 4 44
25 1 45
c3

90
25 2 47
26 4 51
28 5 56
30 4 60

Se obţin următoarele cuantile: c1  10, c2  18, c3  25


Observaţie. Cuantilele se utilizează în situaţiile în care este necesară
împărţirea populaţiei în mai multe subpopulaţii decât o face mediana.
Indicatorii introduşi mai sus se utilizează pentru a studia tendinţa
centrală a variabilelor statistice.
În diferitae studii statistice prezintă interes împrăştierea valorilor în raport
cu valorile centrale.
Amplitudinea
Fie X o variabilă statistică având seria {( xk , nk ), k  1,2,...., m} .
Definiţie. Se numeşte amplitudinea seriei statistice, diferenţa dintre cea
mai mică şi cea mai mare valoare a caracteristicii.
Fie xmax  max{x1 , x2 ,...., xm } şi xmin  min( x1 , x2 ,...., xm ) .
Amplitudinea A  xmax  xmin se mai numeşte şi amplitudine absolută.
Amplitudinea defineşte limitele intervalului în care se găsesc valorile
caracteristicii xi , i  1,2,....., m .
Amplitudinea prezintă dezavantajul că poate fi influenţată de o singură
valoare aflată la una dintre limitele intervalului, ceea ce face să fie
considerată un indicator imprecis al variabilităţii.
Amplitudine relativă. Pentru o comparaţie cu plaja reală de valori se
utilizează amplitudinea relativă, calculată cu formula:
A
R .100
x
Abaterea medie
Definiţie. Se numeşte abatere medie diferenţa dintre o anumită valoare şi
media caracteristicii respective.
Fie valorile caracteristicii X, xi , i  1,2,....., m şi media x , numerele
d i  xi  x , i  1,2,....m reprezintă abateri faţă de medie.
Abaterile d i  xi  x , i  1,2,..., m exprimă devierile valorilor xi , i  1,2,....., m faţă
de valoarea medie x .

91
m

Observaţie. Suma abaterilor în raport cu valoarea medie 


( xk  x )  0
k 1 .
Exemplu.
xi xi  x
6 6-5.5=0.5
7 7-5.5=1.5
3 3-5.5=-2.5
5 5-5.5=-0.5
4 4-5.5=-1.5
8 8-5.5=2.5
6 6

x
i 1
i  33  (x
i 1
i  x)  0

N=6
x =5.5

Indicatorul numeric media furnizează informaţii privind tendinţa generală


a (comportamentul) majorităţii elementelor (indivizilor) populaţiei
respective.
Media nu este un indicator suficient pentru a studia anumite procese şi
fenomene.
Din acest motiv este necesar să introducem un alt indicator numeric care
să măsoare gradul de împrăştiere a valorilor unei populaţii statistice în
jurul valorii medii.
De exemplu o medie aritmetică a numerelor 6, 7, 8 este 7. Aceiaşi medie
se obţine şi pentru numerle 2, 7, 12.
Exemplu. Considerăm vârstele a două populaţii: 18, 20, 22, 21, 19 şi 12,
28, 8, 32 , 20. În ambele cazuri media este 20.
Se observă că media este relevantă dacă vârstele sunt grupate în jurul lui
20 şi nerelevante în celălalt caz.
Un indicator important care furnizează informaţii despre eterogenitatea
sau varietatea valorilor unei caracteristici (distribuţia acestora) este
dispersia.

92
 xk  k  1,2,...., m
X :  
Definiţie. Se numeşte dispersie a variabilei statistice  pk 
m
 2   ( xk  x ) 2 pk
numărul k 1 .
Observaţie. Media indică o „concentrare” a valorilor, în timp ce dispersia
indică o împrăştiere a acestora în raport cu media.
Exemplu.
xi ni pi xi p i xi  x ( xi  x ) 2 ( xi  x ) 2 p i
8.36-8.38 8.37 5 0.05 -0.045 0.0020 0.00010
8.38-8.40 8.39 18 0.18 -0.025 0.0006 0.00010
8.40-8.42 8.41 35 0.35 -0.005 0 0
8.42-8.44 8.43 29 0.29 0.015 0.0002 0.00005
8.44-8.46 8.45 11 0.11 0.035 0.0012 0.00013
8.46-8.48 8.47 2 0.02 0.055 0.0030 0.00006
0.00044

x  8.4158  2  0.00044

Definiţie. Numărul se numeşte abatere medie pătratică.
Observaţie. Numărul  2 care reprezintă dispersia sau  care reprezintă
abaterea medie pătratică şi se calculează pentru întreaga populaţie, iar s 2
dispersia de selecţie sau s abaterea standard se calculează pentru
eşantion.
m m
 ( X i  m) 2
s2  i 1

N 1 unde este media.

xi xi  x ( xi  x ) 2
6 6-5.5= 0.5 0.25
7 7-5.5= 1.5 2.25
3 3-5.5=-2.5 6.25
5 5-5.5=-0.5 0.25
4 4-5.5=-1.5 2.25
8 8-5.5= 2.5 6.25
6 6

 xi  33
i 1
 (x
i 1
i  x ) 2  17.50

N=6

93
1 6
s2 
N 1  (x
i 1
i  x ) 2  3.50

x =5.5

Observaţie. Valorile x şi s2 se mai numesc media şi respectiv dispersia


de selecţie.

Coeficientul de variabilitate
Pentru a obţine informaţii privind omogenitatea unui eşantion, Pearson a
introdus coeficientul de variabilitate care se calculează astfel:
s
cv  .
x
Avem următoarele cazuri:
 Dacă cv  0.15 rezută că împrăştierea faţă de valoarea medie este
mică şi media este reprezentativă.
 Dacă 0.15  cv  0.30 rezultă o împrăştiere moderată, iar media poate
fi considerată ca având o reprezentativitate relativă.
 Dacă cv  0.30 media nu mai poate fi considerată reprezentativă.

94

S-ar putea să vă placă și