Documente Academic
Documente Profesional
Documente Cultură
texte de prelegeri
CICLUL II
CHIȘINĂU 2020
1
STATISTICĂ ÎN PSIHOLOGIE
„ Natura este tot ce i se oferă omului, cultura este tot ceea ce omul adaugă naturii”
Henri WALD
1. Obiectul disciplinei
2. Desfăşurarea disciplinei
2
Reprezentări grafice ale datelor statistice--------------------------2 ore
Valori caracteristice ale unei serii statistice ----------------------4 ore
5. Bibliografie
6. Evaluare
Prezenţă la curs----------------------------------------------------------------------------10%
Prezenţă şi activitate la laborator--------------------------------------------------------10%
3
Verificare pe parcurs----------------------------------------------------------------------30%
Temă de casă – proiect--------------------------------------------------------------------20%
Examen final-------------------------------------------------------------------------------30%
4
Cursul nr.1 Statistică în psihologie
Introducere în statistică
Definiţia statisticii
Una din definiţiile care pot fi găsite în Dicţionarul explicativ al limbii
române (DEX) pentru cuvântul statistică este ”evidenţă numerică
referitoare la diverse fenomene”.
O altă definiţie spune că statistica este o ramură a matematicii al cărui
obiect de studiu îl reprezintă elaborarea unor metode de analiză a unor
”fenomene de masă”, indiferent de natura acestora.
Statistica se ocupă cu colectarea, prelucrarea şi analiza datelor de
observaţie asupra unui proces sau fenomen, în vederea studierii acestuia.
Statistica matematică stabileşte fundamentele teoretice şi ştiinţifice ale
metodelor statistice, care, apoi sunt aplicate în diferite domenii.
În prezent, metodele statistice ocupă, practic, întregul spectru al ştiinţelor
contemporane.
Statistica operează cu reprezentări ale diferitelor aspecte ale realităţii şi
anume cu acelea care pot fi numărate, măsurate sau cuantificate.
Statistica oferă mijloace şi modele de cunoaştere a realităţii, căi prin care
se explorează necunoscutul şi se fac previziuni.
5
Tradiţionalismul sau argumentul autorităţii, care se bazează pe
adevăruri prestabilite. Cunoaşterea bazată pe autoritate decurge din
din supunerea necondiţionată faţă de exponentul autorităţii
respective, care poate fi savant, divinitate etc.
Raţionalismul. Baza acestuia este deducţia. O teorie este adevărată
prin simplu fapt că este logică. Celebrul silogism antic: ”Toţi
oamenii sunt muritori. Socrates este om. Deci, Socrates este
muritor” este adevărat şi nu are nevoie de studiu pentru a fi
demonstrat.
Raţionamentul de tip deductiv nu este întotdeauna valabil deoarece
se bazează pe adevăruri care au condus în trecut la constituirea
principiului din care a decurs raţionamentul deductiv.
Principiul inductiv porneşte de la cazuri specifice pentru a obţine
concluzii generale.
Bunul simţ sau experienţa. Se bazează pe observaţii sau experienţă
îndelungată, care îl fac credibil. De exemplu, am fi tentaţi să
apreciem că o persoană care suferă o criză într-un spaţiu public are
mai multe şanse să primească ajutor dacă este mai multă lume în
jur. În realitate, rezultatele unor cercetări ştiinţifice arată că în
astfel de situaţii are loc un fenomen de ”diminuare a
responsabilităţii”, iar ajutorul primit este mai puţin prompt decât
dacă în jur ar fi mai puţini oameni.
6
proceduri de calcul şi de raţionamente decizionale cu privire la
semnificaţia datelor de cercetare.
Rolul statisticii este de a conferi credibilitate datelor de observaţie, de a
confirma sau infirma ipoteze, ca urmare a prelucrării acestora.
Statistica nu exclude intuiţia cercetătorului, ci o supune unui control
critic pentru a o valida sau invalida.
De exemplu, să presupunem că un psihoterapeut intueşte că depresia
cronică a uneia dintre pacientele sale poate fi pusă în legătură cu
înălţimea mică a acesteia. În raport cu acest caz singular, el îşi poate
vesrifica intuiţia pri dialogul terapeutic, dar, dacă doreşte să probeze
faptul că în general femeile scunde sunt mai predispuse la depresie
cronică, va trebui să iniţieze un proces de cercetare. În cazul în care
rezultatele acestuia vor confirma intuiţia, devenită astfel ipoteză, atunci
demersul terapeutic adresat femeilor scunde cu manifestări depresive va
putea fi mai precis orientat pe una dintre sursele potenţiale ale tulburării.
Pentru psihologi, statistica este un set de metode şi tehnici matematice
de organizare şi prelucrare a datelor, cu scopul de a testa anumite ipoteze
şi a formula răspunsuri la anumite întrebări.
Utilizarea statisticii în psihologie este impusă de exigenţele metodei
ştiinţifice, ca tehnică de culegere, prelucrare şi interpretare a datelor.
În natură şi societate foarte multe cercetări se bazează pe concluzii
pornind de la unele colecţii de date ce necesită o analiză de tip statistic.
În domeniul psihologiei, obiectivul fundamental al metodei ştiinţifice este
înţelegerea, explicarea şi predicţia comportamentului uman şi a
proceselor mintale.
Statistica are rolul de a descrie, de a face predicţii şi de a conferi
credibilitate datelor de observaţie.
În multe situaţii, intuiţia poate deveni ipoteză, care trebuie verificată.
Metodele statistice se utilizează în cele mai diverse domenii: sociologie,
biologie, ecologie, medicină, economie, industrie, agricultură, economie,
administraţie etc.
7
Scurt istoric
8
susţinută de o aptitudine mintală generată, la care se adaugă aptitudini
specifice pentru diferite categorii de activităţi.
Spearman a dezvoltat analiza factorială, prin care se pune în evidenţă
gruparea variabilelor pe baza analizei de corelaţie.
Spearman a fost ales membru al Royal Society of London for the
Improvement of Natural Knowledge pentru aplicarea metodelor
matematice în analiza minţii umane şi pentru studiile originale asupra
corelaţiei în acest domeniu.
Raymond B. Cattell (1905 – 1988), psiholog anglo-american, a dezvoltat
teoria factorială a inteligenţei a lui Spearman. Mai mult, el a susţinut
utilizarea analizei factoriale în domeniul psihologiei pentru identificarea
şi fundamentarea constructelor psihologice.
Demn de remarcat este şi chestionarul 16PF(Sixteen Personality
Factors), unul dintre cele mai cunoscute teste de personalitate, care
include şi o scală de inteligenţă la cele cincisprezece de personalitate.
Ronald Aymer Fisher (1890 -1962) este cel care si-a adus o contribuţie
majoră la utilizarea statisticii în psihologie.
Fisher are contribuţii remarcabile în matematică, astronomie, biologie şi
genetică.
Fisher a manifestat un interes deosebit pentru studiul erorilor şi analizei
de varianţă, procedură foarte utilizată în statistica psihologică.
Se poate spune că psihologia face parte din categoria ştiinţelor care au
apărut mai târziu, dacă ţinem seama de faptul că a fost acceptată abia în a
doua jumătate a secolului al XIX ca ştiinţă de sine stătătoare.
9
Formularea problemei de cercetare
Alegerea metodelor şi tehnicilor de cercetare
Culegerea datelor necesare cercetării
Organizarea şi prelucrarea datelor
Analiza şi interpretarea rezultatelor.
10
În domeniul psihologiei, obiectivul fundamental al metodei ştiinţifice este
înţelegerea, explicarea şi predicţia comportamentului uman şi a
proceselor mintale.
Statistica are rolul de a descrie, de a face predicţii şi de a conferi
credibilitate datelor de observaţie.
În multe situaţii, intuiţia poate deveni ipoteză, care trebuie verificată.
Exemplu. Un psihoterapeut intuieşte că depresia cronică a unuia dintre
pacienţii săi poate fi datorată singurătăţii. Dacă doreşte să probeze faptul
că în general bărbaţii singuri sunt mai predispuşi la depresie cronică, va
trebui să iniţieze o cercetare. În cazul în care rezultatele cercetării vor
confirma intuiţia care a devenit ipoteză, atunci demersul terapeutic
adresat bărbaţilor singuri cu manifestări depresive va fi mai precis
orientat pe una din sursele potenţiale ale tulburării.
Metodele statistice se utilizează în cele mai diverse domenii: sociologie,
biologie, ecologie, medicină, economie, industrie, agricultură, economie,
administraţie etc.
11
Cursurile nr.2+3 Statistică în psihologie
Date şi informaţii
12
datele privesc evenimente primare, fiind colectate
din diferite situaţii sau diverse locuri,
neorganizate şi/sau neprelucrate într-o formă care
să stea la baza luării unor decizii;
informaţiile sunt mesaje obţinute prin prelucrarea
datelor; aceste mesaje trebuie să fie concise,
actuale, complete şi clare, astfel încât să răspundă
cerinţelor informaţionale în scopul cărora au fost
preluate datele.
Cu alte cuvinte, pentru a deveni informaţii, datele trebuie prelucrate în
conformitate cu cerinţele informaţionale.
Datele se pot prelucra manual sau cu echipamente electronice de calcul,
de unde şi denumirea de prelucrare automată.
În vederea prelucrării, datele sunt codificate.
Cod: o combinaţie de simboluri.
Codul, în funcţie de natura simbolurilor care-1 compun, poate fi:
numeric
alfabetic
alfanumeric.
Prelucrarea datelor, numită şi procesare, presupune totalitatea
transformărilor, ca formă şi conţinut a datelor.
Transformările se realizează în următoarele etape:
1. Identificarea surselor de unde se pot obţine datele
primare.
2. Culegerea şi pregătirea datelor primare, care presupune:
Selectarea, care constă în alegerea acelor date
care prezintă interes.
Organizarea/pregătirea datelor selectate.
Codificarea, care constă în asocierea unor
simboluri numite cod.
3. Transmiterae/conversia, care constă în introducerea
datelor pe un suport de informaţie.
13
Verificarea datelor din punct de vedere al formei,
conţinutului şi corectitudinii, folosind anumite chei de
control.
Eliminarea eventualelor erori datorate culegerii,
pregătirii şi transmiterii lor.
Stocarea datelor în vederea prelucărilor care
urmează.
4. Prelucrarea datelor în vederea obţinerii rezultatelor
necesare:
Analiza, care constă în examinarea datelor în
vederea grupării lor în procesul de prelucrare.
Sortarea, care constă ordonarea lor după anumite
criterii.
Clasificarea, care constă în gruparea datelor după
caracteristici comune.
Compararea, care constă în stabilirea
asemănărilor/deosebirilor dintre diferite grupuri de date.
Sinteza, care constă în combinarea anumitor
grupări care să conducă la structuri noi organizate după
diferite caracteristici comune necesare prelucrării.
Prelucrarea efectivă, care constă în efectuarea
operaţiilor aritmetice şi logice necesare obţinerii
rezultatelor.
5. Obţinerea rezultatelor, care trebuie să fie sub forma
cerută, direct utilizabilă.
6. Păstrarea datelor şi rezultatelor în vederea unor
prelucrări/utilizări ulterioare.
14
Variabilitate şi variabile în psihologie
În viaţa de toate zilele se întîlnesc la tot pasul mărimi ale căror valori se
schimbă sub influenţa diferiţilor factori.
Definiţie. Se numeşte variabilă, orice caracteristică a uni subiect sau
fenomen care poate lua două sau mai multe valori, în funcţie de diferiţi
factori.
Studiul conduitelor psihologice constituie un domeniu de mare
variabilitate.
În domeniul psihologic, variabilitatea poate fi :
intraindividuală, ceaa ce înseamnă că aceeaşi persoană, în acelaşi
context, reacţionează diferit.
interindividuală, ceea ce înseamnă că persoane diferite, în aceiaşi
situaţie, reacţionează diferit.
Prin extensie, se poate vorbi de variabilitate intragrup şi intergrup.
Prin urmare, pentru a studia comportamentul uman putem folosi
conceptele de variabilă şi măsurare, iar pentru prelucrarea datelor se pot
utiliza metode statistice.
În psihologie, pentru a studia un subiect sau un grup de subiecţi se
utilizează explorări sistematice şi explorări specifice.
Datele pe care le prelucrează un psiholog provin din metode de
investigaţie specifice: experiment, test, observaţie, chestionar, convorbire
psihologică, anchetă psihologică etc.
De exemplu, în psihologie, inteligenţa este o variabilă deoarece diferă de
la un individ la altul.
Tot în categoria variabilelor pot fi considerate atenţia, reflexele, timpul de
reacţie, anxietatea, vârsta, înălţimea, greutatea etc.
Cercetarea psihologică are ca obiectiv studierea variabilelor, cu scopul de
a explica diferitele caracteristici ale realităţii psihice şi comportamentului
uman.
De exemplu, conducătorii auto diferă în funcţie de respectarea regulilor
de circulaţie şi prezintă interes dacă tinerii sunt cei care le încalcă în cele
mai multe cazuri.
În această situaţie avem două variabile: respectarea regulilor de circulaţie
şi vârsta; ceea ce interesează este dacă una variază în raport cu cealaltă.
15
Din punct de vedere al observării, în psihologie, avem:
variabile observate, care pot fi măsurate, cuantificate. De exemplu,
vârsta.
variabile latente, care nu pot fi măsurate direct. Pentru a realiza o
cuantificare se utilizează anumiţi indicatori, ca de exemplu chestionare
cu diferite întrebări. Răspunsurilor la întrebări li se atribuie puncte. De
exemplu inteligenţa.
Din punct de vedere al legăturilor, avem:
variabile dependente, măsurate cu scopul fundamentării unei
decizii.
variabile independente, utilizate pentru a studia influenţa şi
efectele asupra variabilelor dependente.
Exemple:
1. Verificarea ipotezei că bărbaţii nefumători trăiesc mai mult decât
fumătorii. În acest exemplu, variabila dependentă este vârsta, iar
variabila independentă este statutul de fumător sau nefumător.
2. Ooboseala şi atenţia în conducerea unui automobil. Ţinând seama că
oboseala influenţează atenţia, atunci atenţia este variabila dependentă, iar
oboseala este variabila independentă.
Un alt tip este acela de variabilă categorială, atunci când valorile
acesteia descriu categorii.
Variabile categoriale pot fi:
de tip nominal, sunt acele variabile care realizează o descriere, de
exemplu, genul (masculin, feminin), temperamentul etc.
de tip ordinal, sunt acele variabile care indică o măsurare ordonată,
ca de exemplu, categoria 1 de vârstă (1-7 ani), 2 (8-15 ani) etc.
Din punct de vedere al valorilor pe care le poate lua:
variabile continue, ceea ce înseamnă că pot lua un număr infinit de
valori, exprimat prin numere reale.
Exempu: greutatea.
variabile discrete, ceea ce înseamnă că pot lua un număr finit de
valori, de regulă exprmat prin numere întregi.
Exemplu: numărul persoanelor dintr-o comunitate.
16
Măsurarea în psihologie
17
calitative, constructe psihice (de exemplu: inteligenţa, opinia,
atitudini, motivaţia, stări emoţionale, sociabilitatea etc.
Principala caracteristică a constructelor psihologice este acceea că ele
reprezintă rezultatul unui proces de construcţie mintală prin care
psihologul descrie o anumită categorie de conduite sau reacţii psihice.
Constructele psihice (mintale) sunt modele, iar existenţa lor şi evaluarea
gradului de manifestare la diferite persoane se poate realiza cu procedee
statistice.
Din acest motiv, constructele psihice nu pot fi măsurate direct, ci numai
prin manifestările lor particulare.
De exemplu, sociabilitatea se manifestă prin numărul contactelor sociale
într-o anumită perioadă, prin disponibilitatea de a comunica, prin
numărul prietenilor, prin numărul convorbirilor telefonice etc.
Se observă că un construct psihic are mai mulţi indicatori, ceea ce
înseamnă că o evaluare cantitativă se poate realiza numai prin
identificarea indicatorilor care-l compun, urmată de cuantificarea
gradului de intensitate a acestora la nivelul persoanelor evaluate.
Considerăm exemplul constructului psihic sociabilitatea, care nu poate fi
măsurat direct; ca variabilă este latentă, iar indicatorii care o definesc
sunt variabile observate.
În cazul în care pentru evaluarea sociabilităţii se utilizează chestionarul,
variabilele observate sunt întrebările, iar variabila latentă este numărul
obţinut prin însumarea răspunsurilor.
18
Scala de tip nominal. Măsurarea pe scală nominală constă în organizarea
obiectelor supuse cercetării în diferite clase sau categorii. Valorile sau
simbolurile dintro clasă diferă între ele dar nu se compară dacă sunt mai
mici sau mai mari.
De exemplu, oamenii, după culoarea pielii pot fi clasificaţi în patru
categorii: albi, galbeni, mulatri şi negri. Culorile pot fi codificate cu A,
G, M, N sau cu numerle 1,2,3 şi respectiv 4. În această situaţie, valorile
respective sunt simboluri ale caracteristicii culoarea pielii, iar numărul 4
nu reprezintă nici mai mult nici mai puţin decât numărul 1.
Codificările de mai sus sun arbitrare, iar prin convenţie pot fi înlocuite
cu altele.
Variabilele măsurate pe scale nominale pun în evidenţă diferenţele
calitative şi nu pe cele cantitative.
Valorile de pe scala nominală pot fi:
de identificare, utilizate pentru codificarea, culegerea, organizarea
şi prelucrarea datelor. Nu prezintă interes din punct de vedere statistic.
De exemplu, codul numeric personal se utilizează pentu identificarea
persoanei.
categoriale, utilizate în repartizarea obiectelor supuse cercetării în
clase sau categorii în funcţie de caracteristici. De exemplu, genul
(masculin, feminin), pregătirea profesională (analfabet, şcoală generală,
liceu, licenţă, masterat, doctorat etc.), tipuri temperamentale etc. sunt
valori categoriale.
Valorile măsurate pe scala nominală sunt calitative, descriind categorii,
ceea ce înseamnă că nu li se pot aplica operaţii numerice.
Cu aceste valori pot efectua:
operaţii descriptive, ca de exemplu numărare, procente etc.
transformări privind gruparea sau rafinarea categoriilor pe care le
descriu.
De exemplu, apartenenţa religioasă cu patru categorii( catolic, ortodox,
musulman şi budist) poate fi fi grupată în două pe criteriul
creştinismului.
De asemenea, cele patru categorii temperamentale(sanguin, coleric,
flegmatic, melancolic) pot fi grupate în două, pe criteriul extraverte
19
(persoanele sanguine şi colerice) şi introverte (persoanele flegmatice şi
melancolice).
Reducerea sau rafinarea numărului de categori nominale se utilizează în
situaţia în care numărul categoriilor este foarte mare , fiind greu de
analizat sau cînd numărul de cazuri pentru unele categorii ete foarte mic
sau zero.
Scală de tip ordinal. Valorile de pe această scală pot fi comparate din
punct de vedere al locului pe care-l ocupă. Din acest punct de vedere au
o semnificaţie cantitativă, dar, în esenţă, ele sunt calitative.
De exemplu, dacă vorbim de seriozitatea unor persoane, codificată de la
1 la 5 (5 fiind nivelul celmai ridicat), valorile 1, 2, 3, 4, 5 exprimă doar
ordinea aprecierii şi nu măsura, Nu se poate spune că persoanele de pe
locul 5 sunt de cinci ori mai serioase decît cele de pe locul 1.
Scala de tip ordinal indică faptul că persoanele de pe locul 5 sunt mai
serioase decât persoanele de pe locul 4, fără a şti cu cât. Nu ştim dacă
diferenţa între 5 şi 4 este egală cu cea dintre 2 şi 1din punct de vedere al
seriozităţii.
În concluzie, valorile de tip ordinal ne indică o ierarhizare a valorilor
unor caracteristici sau preferinţe, fără a preciza care este „diferenţa de
cantitate” a caracteristicii măsurate.
Codificarea valorilor de tip ordinal trebuie să perimită ierarhizarea.
Valorile de tip ordinal au semnificaţie calitativă şi nu cantitativă.
Scală de tip interval. Variabilele de pe această scală, pe lângă informaţii
privind ordinea, oferă şi informaţii privind mărimea caracteristicii
măsurate.
Valorile de tip interval sunt cantitative, reprezentate pe un interval cu
diviziuni egale.
De exemplu, temperatura măsurată într-un număr de zile se exprimă în
grade reprezentate pe un interval, având subdiviziuni egale, din grad în
grad. Se poate aprecia că întro zi a fost mai cald sau mai frig decât în
cealaltă.
Un alt exemplu, coeficientul de inteligenţă măsurat în funcţie de numărul
de răspunsuri corecte la întrebările dintr-un chestionar: 30 de răspunsuri
corecte, 20, 15 ş.a.m.d.
20
Nu se poate emite ipoteza că persoanele care au dat 30 de răspunsuri
corecte sunt de două ori mai inteligente decât cele care au dat 15,
deoarece nu avem o valoare de referinţă faţă de care să facem
comparaţia.
Pentru persoanele care se ţin de mână intrun parc 20 de minute, respectiv
30 de minute, diferenţa de iubire nu este aceeaşi cu diferenţa între 30 şi
20 de minute.
Scală de tip raport. Valorile exprimate pe o asemenea scală, pe lângă
egalitatea intervalelor, se raportează la o valoare zero absolută. Nu se
admit valori mai mici decât zero.
Exemple: timpul, vîrsta, numărul de răspunsuri corecte sau greşite la un
chestionar etc.
Observaţie. Diferenţa între variabilă şi scală constă în aceea că variabila
se referă la o caracteristică supusă măsurării, iar scala la modalităţi de
măsurare şi reprezentare. În unele cazuri, aceeaşi caracteriszică poate fi
măsurată pe orice tip de scală.
De exemplu, atenţia poate fi exprimată pe o scală nominală(atent,
neatent), pe o scală ordinală (atenţie scăzută, medie, mare şi foarte mare)
sau pe o scală interval (intervale de timp corespunzătoare gradului de
atenţie).
Analog se poate exemplifica şi timpul de reacţie.
Când se vorbeşte de măsurarea unor caracteristici sau de valorile unei
variabile trebuie precizată şi scala.
Erori de măsurare
Măsurarea, fie cantitativă sau calitativă, se realizează asupra obiectelor,
fenomenelor sau proceselor studiate.
Coeficientul de inteligenţă exprimă o proprietate funcţională de natură
intelectuală a persoanei, iar frecvenţa cardiacă exprimă o proprietate
funcţională fiziologică a inimii.
Numerele care exprimă cele două proprietăţi funcţionale nu putem
afirma cu certitudine că sunt exacte.
Rezultatele testului de inteligenţă poate oferi o comparaţie între
personele testate, dar nu exprmă cu certitudine inteligenţa persoanelor
testate.
21
Valoarea măsurată pentru inteligenţă poate fi influenţată de caracteristici
psihice sau de alţi factori: modul de concepere a testului (avem garanţia
că este perfect?), caltatea mediului de testare (mobilier, condiţii
climatice, zgomot etc.), starea fiecărui individ (oboseală, emotivitatetc.)
şi altele.
Valoarea măsurată pentru frecvenţa cardiacă poate fi influenţată de
oboseală, efort fizic, emoţii, precizia aparatului etc.
Se spune că orice valoare rezultată dintro măsurare este compusă din
valoarea adevărată la care se adaugă o anumită eroare, a căror pondere
nu poate fi determinată cu exactitate.
Problema care se pune este să limităm cât se poate de mult eroarea.
Erorile în procesul de măsurare sunt de două feluri:
erori aleatorii, datorate un factori întâplători. Ele pot
influenţa în sens pozitiv sau negativ măsurarea. În unele situaţii
erorile pozitive se compensează cu cele negative, ceea ce conduce
la o mai mare precizie a măsurării.
erori sistematice afectează măsurarea întrun singur sens:
pozitiv sau negativ. De exempu măsurarea tensiunii arteriale la un
grup de persoane depinde de precizia aparatului, care produce
mereu valori mai mici sau mai mari decât valoarea reală.
22
Cursul nr.4 Statistică în psihologie
23
Dacă oricare ar fi elementul x X , acesta aparţine şi mulţimii Y , atunci
spunem că mulţimea X este inclusă în mulţimea Y , ceea ce se scrie X Y
. Se mai spune că X este o submulţime a lui Y sau o parte a lui Y .
Definiţie. Două mulţimi sunt egale dacă sunt formate din aceleaşi
elemente.
Fie M o mulţime şi A M .
Definiţie. Se numeşte complementara mulţimi A faţă de M , mulţimea
elementelor din M care nu aparţin lui A , notată cu C M A {x | x M , x A} .
Operaţii cu mulţimi: reuniunea, intersecţia, diferenţa.
Fie A şi B două mulţimi.
Reuniunea. A B {x | x Asaux B} mulţimea elementelor care aparţin cel
puţin uneia dintre cele două mulţimi.
Intersecţia. A B {x | x Asix B} mulţimea elementelor comune celor două
mulţimi.
Diferenţa. A B {x | x Asix B} mulţimea elementelor din A care nu
aparţin lui B .
Produs cartezian AxB {( x, y ) | x X , y Y }
Relaţii
24
Relaţia de echivalenţă definită pe o mulţime sau populaţie statistică
reprezintă caracteristica populaţiei.
Funcţii
25
Performanţele unui sportiv sunt rezultatele activităţii depuse de cei care-l
pregătesc: antrenor, medic, psiholog.
o singură cauză mai multe efecte
Prin prestaţia sa, unprofesor poate determina pregătirea unui elev în plan
informativ şi formativ.
mai multe cauze mai multe efecte
Influenţa profesorilor care predau diferite discipline asupra diferitelor
componente ale personalităţii unui student.
Sisteme
conduce după drumul pe care l-a parcurs în trecut şi nici nu are o anumită
„ţintă”, direcţie, spre care să meargă în viitor. Un ceas este de asemenea
26
un sistem deschis; el nu-şi observă propria imprecizie pentru a şi-o
controla singur.
F
iFig.2 Sistem cu conexiune inversă
când ora indicată de ceas este comparată cu ora exactă, care este luată ca
obiectiv, iar ceasul este potrivit pentru a elimina erorile.
27
Câmp finit de evenimente
28
Definiţie. Evenimentul care poate fi realizat printr o singură probă,
se numeşte eveniment elementar.
Definiţie. Evenimentul care poate fi realizat prin două sau mai
multe probe se numeşte eveniment compus.
Definiţie. Se numeşte spaţiu de selecţie, mulţimea evenimentelor
elementare asociate experienţei respective.
Definiţie. Se numeşte eveniment sigur, notat cu , evenimentul
care se realizează cu certitudine la fiecare efectuare a experienţei.
Definiţie. Se numeşte eveniment imposibil, notat cu ,
evenimentul care nu se realizează la nici o efectuare a experienţei.
Exemple. La aruncarea unuizar, apariţia uneia din feţele 1,2,3,4,5,6
este evenimentul sigur, iar apariţia feţei cu un număr de şapte
puncte este evenimentul imposibil.
Extragerea unei bile de culoare albă dintr-o urnă cu bile albe este
evenimentul sigur, iar extragerea unei bile de culoare albă dintr-o
urnă cu bile negre este evenimentul imposibil.
Definiţie. Se numeşte evenimentul contrar evenimentului A şi se
notează cu A , evenimentul a cărui realizare constă în nerealizarea
lui A .
Exemple. Fie o urnă cu bile albe şi negre. Dacă notăm cu A
evenimentul care constă în extragerea unei bile albe, A este
evenimentul care constă în extragerea unei bile negre.
Realizarea unuia este echivalentă cu nerealizarea celuilalt.
Considerăm experienţa aruncării unui zar. Dacă notăm cu A
evenimentul care constă în apariţia unei feţe cu un număr par de
puncte, A este evenimentul care constă în apariţia feţei cu un
număr impar de puncte.
Evenimentul sigur constă în nerealizarea evenimentului imposibil
şi reciproc.
AA , A A ,
29
favorizează pe fiecare din aceste evenimente. În caz contrar se
numesc incompatibile.
Exemplu. Să considerăm experienţa aruncării unui zar şi să notăm
cu A evenimentul care constă în apariţia feţei cu 1, 2, 3 puncte, iar
cu B evenimentul care constă în apariţia uneia din feţele 2, 3, 5.
Evenimentele A şi B sunt compatibile, deoarece dacă vom obţine
ca rezultat al experienţei faţa 2 sau 3, înseamnă că s-au realizat
ambele evenimente.
Observaţie. Evenimentele contrare sunt incompatibile.
În general, un număr finit de evenimente A1 , A2 ,....., An sunt
compatibile dacă se pot realiza simultan, ceea ce înseamnă că
există o probă care realizează fiecare din aceste evenimente. În caz
contrar, evenimentele A1 , A2 ,....., An sunt incompatibile.
Observaţie. Dacă evenimentele A1 , A2 ,....., An sunt compatibile două
câte două, nu înseamnă că ele sunt compatibile în totalitatea lor.
Exemplu. Considerăm experienţa aruncării unui zar cu următoarele
evenimente : A1 apariţia feţei cu un sau 2 puncte, A2 apariţia feţei
cu 2 sau 3 puncte, A3 apariţia feţei cu 3 sau 4 puncte. A1 este
compatibil cu A2 , A2 este comatibil cu A3 , dar nu sunt compatibile
în totalitatea lor.
Definiţie. Se spune că evenimentul A implică evenimentul B , dacă
B se realizează de fiecare dată când se realizează A . Se notează
A B.
Exemple. Considerăm experienţa aruncării unui zar şi notăm cu A
evenimentul care constă în apariţia feţelor cu 2 sau 4 puncte, iar cu
B evenimentul care constă în apariţia feţei cu un număr par de
puncte. În acest caz A implică B .
Considerăm experienţa aruncării unui zar şi notăm cu C
evenimentul care constă în apariţia unui număr de puncte mai mic
decât 4, iar cu D evenimentul care constă în apariţia unei număr de
puncte mai mic sau egal cu 5, atunci C implică D.
Observaţie. Dacă A implică B şi B implică A , atunci A B .
Orice eveniment implică evenimentul sigur.
Evenimentul imposibil implică orice eveniment.
30
Evenimentele pot fi reprezentate ca mulţimi, ceea ce înseamnă că
atunci când ne fixăm atenţia asupra unui eveniment, este vorba
despre o parte din mulţimea probelor experienţei.
Considerând experienţa aruncării unui zar şi notând cu A
evenimentul care constă în apariţia feţelor cu 1,2 sau 5 puncte,
identificăm acest eveniment cu mulţimea probelor care îl
realizează :
A {1,2,5}
Evenimentul A este o submulţime a mulţimii {1,2,3,4,5,6} probelor
ataşate experienţei.
31
{E1 , E 2 ,....., E n } ceea ce înseamnă C nn evenimente
1
Un câmp deevenimente conţine 1 C C ..... C nn (1 1) n 2 n 1
n
2
n
2) Dacă , atunci i 1 Ai K
3) K .
Observaţie. Un câmp de evenimente este format din mulţimea
tuturor submulţimilor lui E , la care se adaugă E şi .
3) Dacă atunci i 1 Ai K .
4) Fiind date A, B K , atunci
A A A, A A A, A B B A, A B B A , iar relaţiile
A B, A B , A B B, A B A sunt echivalente.
5) Fiind date A, B K atunci A B A A B
6) A A, A K
7) A A, A , A K
8) Fiind date A, B, C K au loc relaţiile :
A ( B C ) ( A B) C
A ( B C ) ( A B) C
A ( B C ) ( A B) ( A C )
A ( B C ) ( A B) ( A C )
9) Fiind date A, B K au loc relaţiile :
A B A ( B A ), B ( A B) ( A B)
10) Fiind date A, B K , relaţiile A B , A B , B A sunt
echivalente.
32
Câmp de probabilitate finit
33
Exemplu. Se aruncă o pereche de zaruri de şase ori. Care este
probabilitatea ca exact de patru ori să obţinem un total de şapte
puncte ?
Rezolvare. În urma unei aruncări, 7 puncte pot să apară în 6 cazuri
din 36 posibile:
6 1 1 5
p C 64 ( ) 4 ( ) 2
,
36 6 6 6
Exemplu. Se trunca o monedă de 6 ori. Care este probabilitatea să
apară de 4 ori prima faţă şi de 2 ori a doua faţă ?
n! s
cu
P (n; m1 , m2 ,....., m s ) p1m1 p 2m2 ....... p sms mk n.
m1!m2 !......m s ! k 1
5! 1 2 1 2 2 5
P(n; n1 , n2 , n3 ) ( ) ( ) ( )
2!2!1! 6 6 3 324
34
100!
P(100;5;5;90) (0.05) 5 (0.1) 5 (0.85) 90
5!5!90!
35
una câte una fără întoarcerea bilei extrasă din urnă. Probabilitatea
de a obţine 1 bile de culoare c1 , 2 bile de culoare c2 , …, m bile
de culoare cm ( 1 2 .... m n) este
2
C a11 C a2 ......C amm
......
C a1 a221...... amm
Probabilităţi condiţionate
36
evenimentului B condiţionată de A şi se notează cu PB ( A) sau
P(B/A).
În ipoteza că A s-a realizat, înseamnă că a apărut una din feţele
1,2,3; din aceste cazuri numai două sunt favorabile evenimentului
B: 2,3.
Rezultă P(B)=2/3.
Fie o experienţă cu un număr finit de cazuri egal posibile.
Notăm: n - numărul cazurilor egal posibile ale experienţei.
m - numărul cazurilor favorabile evenimentului A.
p - numărul cazurilor favorabile evenimentului B.
q - numărul cazurilor favorabile evenimentului A B .
Atunci
m p q
P( A) , P( B) , P( B / A)
n n m
Dar
q P( A B)
P( B / A)
q P( A)
n
m m
n şi rezultă
37
P(A şi B)=1/3=1/2.2/3=P(A)P(B)
Evenimentele A şi B sunt independente.
În cele mai multe cazuri, independenţa este necunoscută, ea
reieşind din context.
Exemplu.Să presupunem că se aruncă două zaruri, unul de culoare
albă, iar celălalt de culoare neagră. Considerăm evenimentele:
A aparişia feţei cu 4 puncte pe zarul alb;
B apariţia feţei cu 6 puncte pe zarul negru.
Evenimentele A şi B sunt independente.
Fie urnele U 1 şi U 2 , care conţin bile albe şi respectibv bile negre.
Notăm cu A evenimentul care constă în extragerea unei bile albe
din prima urnă, iar cu B evenimentul care constă în extragerea unei
bile negre din a doua urnă. Cele două evenimente sunt
independente.
38
Exemplu. O urnă conţine 4 bile albe şi 6 bile negre. Se cere
probabilitatea ca extrăgând de trei ori câte o bilă (fără a pune bila
extrasă înapoi), să obţinem la prima extragere o bilă albă, iar la
următoarele extrageri cîte o bilă neagră.
Rezolvare. Notăm cu A1 evenimentul ca la prima extragere să
obţinem o bilă albă şi cu A2 , A3 evenimentele ca la extragerea a
două, respectiv a treia, să obţinem o bilă neagră.
2 2 5
P( A1 ) P( A2 / A1 ) P( A3 / A1 A2 )
5 , 3 , 8
225 1
P( A1 A2 A3 )
538 6
39
P( A) P( A A1 ) P( A A2 ) ....... P( A An )
Conform regulii înmulţirii probabilităţilor, avem :
P( A Ak ) P( Ak ) P( A / Ak )
care înlocuite mai sus, conduc la demonstrarea formulei.
Exemplu. Fie trei urne conţinând bile albe şi negre, după cum
urmează :
U 1 (3a,2n) , U 2 (6a,2n) , U 3 (3a,7 n)
Din una din aceste urne se extrage la întâmplare o bilă. Care este
probabilitatea ca bila extrasă să fie albă ?
Rezolvare. Notăm:
X evenimentul ca bila extrasă să fie albă.
A1 evenimentul ca bila extrasă să fie din urna U 1 .
A2 evenimentul ca bila extrasă să fie din urna U 2 .
A3 evenimentul ca bila extrasă să fie din urna U 3 .
1
P( A1 ) P( A2 ) P( A3 )
3
3 3 3
P( X / A1 ) P( X / A2 ) P( X / A3 )
5 , 4 , 10
11
P( X ) P( A1 ) P( X / A1 ) P( A2 ) P( X / A2 ) P( A3 ) P( X / A3 )
20
40
P( Ai ) P( A / Ai )
P( Ai / A)
P( A)
Pentru calculul lui P( A) aplicăm formula probabilităţii totale:
P( A) P( A1 ) P( A / A1 ) P( A2 ) P( A / A2 ) ..... P( An ) P( A / An )
şi înlocuind, se obţine:
P( Ai ) P( A / Ai )
P( Ai / A)
P( A1 ) P( A / A1 ) P( A2 ) P( A / A2 ) .... P( An ) P( A / An )
care se mai poate scrie
P( Ai ) P( A / Ai )
P( Ai / A) n
P( A ) P( A / A )
i 1
i i
P( X / A1 ) P( A1 )
P( A1 / X )
P( X / A1 ) P( A1 ) P( X / A2 ) P( A2 )
3 1 9
P( X / A1 ) P( X / A2 ) P( A1 / X )
5 , 3 , 14
41
Cursul nr. 8 Statistică în psihologie
Variabile aleatoare
42
Definiţie. O variabilă aleatoare este o funcţie care asociază fiecărui
eveniment elementar (fiecărui eveniment al spaţiului de selecţie)
un număr real.
Definiţie. Fiind dat un câmp de probabilitate ( E , K , P) , funcţia
X : E R, măsurabilă ( y R : X 1 ( y ) E ) se numeşte variabilă
aleatoare.
Observaţie. Unele variabile aleatoare pot lua un număr finit de
valori, iar altele pot lua orice valoare dintrun interval.
Definiţie. O variabilă aleatoare este discretă dacă mulţimea
valorilor sale este o mulţime discretă (finită sau numărabilă).
Observaţie. Dacă mulţimea valorilor unei variabile aleatoare este
finită, variabila aleatoare se numeşte simplă.
Definiţie. Ovariabilă aleatoare este continuă dacă mulţimea
valorilor sale este o submulţime a lui R.
43
a X a x1 ... a x n aX a x1 ... a x n
: p1 ... p n , : p1 ... p n
,
p
i 1 j 1
ij 1
pij pi P(Y y j / X xi ) q j P( X xi / Y y j )
XY x1 y1 ... x n y m
: p11 ... p nm
Exemple.
1 0 1 0
X 1 : X 2 :
Fie p q , p q doua variabile aleatoare.
2 1 0
X 1 X 2 : 2
Suma este dată de p
2 pq q 2 deoarece
P( X 1 X 2 2) P[( X 1 1) ( X 2 1)] P( X 1 1) P( X 2 1) p 2
44
P( X 1 X 2 1) P{[( X 1 1) ( X 2 0)] [( X 1 0) ( X 2 1)]}
P( X 1 1) P( X 2 0) ( P( X 1 0) P( X 2 1) pq qp 2 pq
P( X 1 X 2 0) P[( X 1 0) ( X 2 0)] P( X 1 0) P( X 2 0) qq q 2
X x1 ... x n Y y1 ... ym
Fie : p1 ... p n ,
: p1 ... p m
două variabile aleatoare discrete
simple.
Definiţie. Variabilele aleatoare simple X , Y sunt independente dacă
evenimentele { X xi },{Y y j } sunt independente.
Observaţie. Cu alte cuvinte, două variabile aleatoare sunt
independente dacă probabilitatea ca una din variabile să ia o
anumită valoare nu depinde faptul că cealaltă a luat o altă valoare.
În cazul variabilelor aleatoare discrete care iau o mulţime
numărabilă de valori, distribuţia se prezintă astfel:
45
x x 2 ..... x n ...... 0 pi 1
X : 1 p i 1
p1 p 2 .... p n ...... , , i 1
.
Media unei variabilei aleatoare discrete X care ia o mulţime
M [ X ] xi p i
dacă seria
x p
numărabilă de valori este i 1 i 1
i i
este
absolut convergentă. Suma acestei serii este valoarea medie a
variabilei aleatoare X , notată cu M [ X ] .
Proprietăţi. Dacă X , Y sunt două variabile aleatoare simple, atunci
1. M (aX ) aM ( X ) , M (a X ) a M ( X ) , a R
ax ax 2 .....ax n a x1 a x 2 ...a x n
aX : 1 a X :
Se ştie că p1 p 2 ...... p n , p1 p 2 ........ p n
n n
M (aX ) ai xi pi a pi xi aM ( X )
i 1 i 1 ,
n n n
M ( a X ) ( a xi ) p i a p i p i xi a M ( X )
i 1 i 1 i 1
2. a M (X ) A,
unde a inf X , A sup X
Se observă că a xi A , se înmulţeşte cu pi şi se însumează după i
n n n a M (X ) A
a pi xi pi A pi
i 1 i 1 i 1 , ehivalent cu .
3. M ( X Y ) M ( X ) M (Y )
X x1 ... x n Y y1 ... y m
Fie : p
1 ... p n şi : q
1 ... q m
x y1 x1 y 2 ...x1 y m ....x n y m
X Y : 1 .
p11 p12 ............. p1m ............. p nm
46
pij P( X xi , Y y j ) n m
,
p
i 1
ij qj
,
p
j 1
ij pi
xi pij y j pij xi pi y j q j M ( X ) M (Y )
i j j i i j
4. Dacă X ,Y
sunt independente
M ( XY ) M ( X ) M (Y ) , M ( X 1 X 2 ..... X n ) M ( X 1 ) M ( X 2 )....M ( X n )
Fie X , Y două variabile aleatoare independente şi produsul lor:
.
x y x1 y 2 .....x n y m
XY : 1 1
p1 q1 p1 q 2 ..... p n q m
M ( XY ) pi q j xi y j pi q j xi y j pi xi q j y j M ( X ) M (Y )
i, j i j i j
47
Dispersia unei variabile aleatoare discrete X este
n
D 2 ( X ) ( xi M [ X ]) 2 pi M [ X 2 ] M 2 [ X ]
i 1
2 D 2 ( X ) M [( X m) 2 ] unde m M[X ]
Proprietăţi.
1. D 2 ( X ) M ( X 2 ) [ M ( X )]2
D 2 ( X ) M [( X m) 2 ] M ( X 2 2mX m 2 ) M ( X 2 ) 2mM ( X ) m 2 M ( X 2 ) [ M ( X )]2
2. Două variabile care diferă printr-o constantă au dispersii egale.
Dacă Y X a , a R atunci D 2 (Y ) D 2 ( X ) .
D 2 (Y ) M {[(Y M (Y )]2 } M {[ X a ( M ( X ) a )]2 } M {[ X M ( X )]2 } D 2 ( X )
3. , a R.
D 2 (aX ) a 2 D 2 ( X )
1 2 3 4
X :
Exemplu. Fie variabila aleatoare 0,3 0,1 0,4 0,2
Să se calculeze M ( X ) , M ( X !) , M ( X 2 ) , D 2 ( X ) .
M ( X ) 1.0,3 2.0,1 3.0,4 4.0,2 2,5
M ( X 1) (1 1).0,3 (2 1).0,1 (3 1).0,4 (4 1).0,2 3,5
M ( X 2 ) 12.0,3 2 2.0,1 3 2.0,4 4 2.0,2 7,5
D 2 ( X ) M ( X 2 ) [ M ( X )]2 7,5 6,25 1,25
48
Definiţie. Se numeşte lege de probabilitate, o corespondenţă între
valorile posibile ale unei variabile aleatoare şi probabilităţile
corespunzătoare.
În cazul variabilelor de tip continuu, legea de probabiltate este
corespondenţa dintre intervalele dreptei reale şi probabilităţile
corespunzătoare acelor intervale.
Definiţie. Se numeşte funcţie de repartiţie a variabilei aleatoare X ,
funcţia F : R → [0,1] , F ( x) P( X x) .
Funcţia de repartiţie se poate calcula pentru variabile de tip discret,
dar ea prezintă mare interes pentru variabile de tip continuu.
Exemplu.
Fie variabila aleatoare simplă:
1 2 0 x 1
1 1 x 2
X :1 2
F (x)
3 3 3
, 1 x 2
Proprietăţi.
1. Pentru orice variabilă aleatoare X şi a, b R, (a b)
P(a X b) F (b) F (a )
deoarece ( a X b) ( X b) ( X a ) ceea ce înseamnă că
P(a X b) P( X b) P( X a ) F (b) F (a )
49
Definiţie. Spunem că X are densitate de repartiţie sau densitate de
probabilitate, dacă există o funcţie f : R → [0, ) astfel
x
F ( x) f (t )dt
f ( x) dx 1
b) este integrabilă pe R şi .
Observaţii.
1) F ( x) f ( x)
b
a x0
F ( x) bx 2 0 x 1
c x 1
să fie densitate de repartiţie.
Exemplu. Fie X o variabilă aleatoare. Să se determine constanta
a
R astfel încât funcţia
a 2 x 3 x [0,1]
x (1,2]
1
f ( x) ax
altfel
2
0
să fie densitate de repartiţie.
50
Definiţie. Se numeşte valoare medie a variabilei X , numărul
b
M ( X ) xf ( x)dx
a .
Observaţie. Definiţia se păstrează şi pentru a , b .
Proptietăţi.
1. Dacă X , Y sunt două variabile aleatoare de tip continuu,
atunci
M ( X Y ) M ( X ) M (Y )
2. M (aX ) aM ( X ) a
, R
3. Dacă X Y atunci M ( X ) M (Y )
4. Dacă X , Y sunt variabile aleatoare independente, atunci
M ( XY ) M ( X ) M (Y )
Definiţie.Se numeşte dispersia variabilei aleatoare X , numărul
D 2 ( X ) M [( X m) 2 ]
sau
m M (X )
D (X ) ( x m) f ( x)dx
2 2
unde .
Proprietăţi.
1. D 2 ( X ) 0 oricare ar fi variabila aleatoare X . D2 (X ) 0 dacă şi
numai dacă X m .
2. D 2 ( X ) M ( X 2 ) [ M ( X )]2
D 2 ( X ) M [( X m) 2 ] M ( X 2 2mX m 2 ) M ( X 2 ) 2mM ( X ) m 2
M ( X 2 ) 2m 2 m 2 M ( X 2 ) m 2 M ( X 2 ) [ M ( X )]2
3. D 2 (ax) a 2 D 2 ( X ) a
, R
4. Dacă variabilele aleatoare sunt independente două câte două,
atunci
D 2 ( X 1 X 2 ..... X n ) D 2 ( X 1 ) D 2 ( X 2 ) ..... D 2 ( X n )
51
Cursul nr. 9 Statistică în psihologie
52
D 2 ( X ) M ( X 2 ) [ M ( X )]2 (n 2 1) / 12
Exemplu. Considerăm experienţa aruncării unui zar. Fie X
variabila aleatoare asociată acestui experiment, reprezentând
număru de puncte obţinute în urma aruncării zarului. Tabloul se
prezintă astfel:
X 1 2 ... 6
: 1 / 6 1 / 6 ... 1 / 6
n p (0,1) )
2. Repartiţia binomială de parametri N* şi are tabloul
de repartiţie
X k
k k n k
: C n p (1 p) k 0,n
Media variabilei X este M ( X ) np(1 p p) np .
Pentru calculul dispersiei folosim tot proprietatea
D ( X ) M ( X ) [ M ( X )]
2 2 2
.
Variabila X 2
are tabloul de repartiţie
X2 k2
C k p k (1 p ) n k
: n k 0, n
Dispersia variabilei X este
D 2 ( X ) n 2 p 2 np 2 np n 2 p 2 np (1 p )
Exemplul 1. (Schema lui Bernoulli sau schema bilei cu revenire):
Fie o urnă cu bile albe şi bile negre. Se extrage pe rând câte o bilă,
apoi se pune la loc. Care este probabilitatea ca repetând procesul
de n ori, să se extragă k bile albe, ştiind că p este probabilitatea ca
la o extragere să se obţină bilă albă ( p se poate estima ca fiind
numărul bilelor albe/numărul total de bile).
Răspuns: C nk p k (1 p) nk
Exemplul 2. În urma efectuării unei experienţe, poate apare
evenimentul A cu probabilitatea p sau A cu probabilitatea 1 p .
Dacă se repetă experienţa de n ori în condiţii identice, care este
probabilitatea ca evenimentul A să apară de k ori.
Răspuns: C nk p k (1 p) nk
53
3. Repartiţia Poisson de parametru 0 are tabloul de repartiţie
X k
k
e
: k! k N
Media variabilei X este
M (X )
k k k k
k e e k e k e
= k N k! = k 0
k! = k 1
k! = k 1
(k 1)! =
k 1 k ' k 1 k'
e e
k 1
(k 1)! k ' 0
k '!
Dar seria exponenţială se scrie
k
2 n
1 ... ...
1! 2! n! = eλ,
k 0
k!
de unde rezultă că media variabilei aleatoare X este
M ( X ) e e
Pentru calculul dispersiei folosim tot proprietatea
D ( X ) M ( X ) [ M ( X )]
2 2 2
Revenind,
D 2 ( X ) M ( X 2 ) [ M ( X )]2 = λ2 + λ – λ2 = λ.
Observaţii.
1. Legea Poisson descrie spre exemplu repartiţia numărului de
aparitii ale unui eveniment oarecare într-un interval de timp, daca
54
este cunoscut numărul mediu de aparitii ale evenimentului în
unitatea de timp şi dacă momentele apariţiilor evenimentului sunt
independente.
2. Legea Poisson se mai numeşte şi “legea evenimentelor rare”:
presupunem că se efectuează n probe independente şi în fiecare
din aceste probe, A are probabilitatea de realizare p mică în raport
cu numărul n de apariţii ale probelor, care este mare; notând cu X
variabila aleatoare ce reprezintă numărul de apariţii a
evenimentului A în n probe, atunci X are repartiţie binomiala, cu
P( X k )
= C nk p k (1 p) nk .
Notând np rezultă n / p p 0, ct
∞ şi trecând la limită după
n
în relaţia de mai sus se obţine
k
lim C nk p k (1 p ) n k e
n k! .
R 2
ba 2
= = = = = a
Pentru calculul dispersiei folosim tot proprietatea
D ( X ) M ( X ) [ M ( X )] , unde
2 2 2
55
M (X 2 ) 2 b 2 1 b
x f ( x ) dx
x
2
f ( x)dx a x ba
dx 1
x3
R
ba 3
= = = = a =
2 2
a ab b
3
şi deci
M (X 2 ) a 2 ab b 2 ( a b) 2 ( a b) 2
= 3 – 4 = 12 .
m0
4.Repartiţia normală (Gauss) de parametri şi R (X ~
N (m, 2 ) ) are funcţia de densitate
f (x)
( x m)2 m0
1 2 2
e
= 2 , R
Media variabilei aleatoare X ce are funcţia de repartiţie f (x) este
M (X ) ( x m) 2 y ( x m) /
xf ( x)dx 1
2 2
xe dx
= = 2 =
y 2
y2 / 2 m y2 / 2
1
(y m)e 2 dy 2
ye dy
2
e dy
2 = + =
y2 / 2 m y2 / 2 y2 / 2
2
ye dy
2
e dy
2
( e )' dy
= + == +
2m y2 / 2
2
e dy
0 =
2 2m 2m 2m
e y / 2 2
I
2
I
2
I
2
= + =0–0+ =
Dar
x2 / 2 y2 / 2 (x 2 y 2 ) / 2
e dx e dy e dxdy
I·I = 0 ∙0 =00 ,
unde se face schimbarea de variabilă
x r cos t r x 2 y 2
x r sin t t arctg y / x
=>
56
Jordanianul schimbării de variabile este
x x cos t r sin t
J r t sin t r cos t
y y
r t = =r
Deci
/ 2 /2
r 2 / 2 r 2 / 2 er 2 / 2
re drdt dt re dr 2
0 2
I·I = 0 0 = 0 ∙0 = ∙ =
De unde
I= 2
Revenind,
M (X ) m
2m
= 2 = 2
Analog, dispersia variabilei aleatoare X este
2
D (X ) def 2 ( x m) 2 y ( x m) /
( x m) f ( x)dx
1
2
2 2
( x m) e dx
= 2
y2
2 2 y2 / 2
1
y e
2 2 2 dy e
2
y dy
= 2 = =
2 y2 / 2 2 y2 / 2 2 y2 / 2
2
y ( e )' dy e
2
e dy
2
= = – =
00 2 2 2 2
2 2 y2 / 2 2
e dy I
= 2 = 2 = .
2
= + 2 0
Pentru m 0 şi 1 se spune că variabila aleatoare urmează legea
normală redusă N (0,1) , având densitatea de repartiţie
x2 x
1
( x) e 2
, R
2
Graficul repartiţiei normale reduse are următoarele proprietăţi:
simetric faţă de axa ordonatelor;
concav în intervalul (1,1) şi convex în afară;
aria cuprinsă între grafic şi axa Ox este 1.
57
Funcţia de repartiţie a variabilei aleatoare normale reduse este
x x
1
( x) (t )dt e
t 2
dt
2
Pentru fiecare x , valoarea lui (x) este egală cu aria cuprinsă între
axa Ox, graficul lui (x) şi dreapta y x .
Repartiţia normală prezintă importanţă din următoarele motive:
cele mai multe măsurători sunt repartizate aproximativ
normal;
variabilele care un sunt repartizate normal pot fi supuse unor
transformări care conduc la variabile repartizate exact sau
aproximativ normal;
în condiţii generale, sume de variabile repartizate sau nu
normal sunt aproximativ normal repartizate;
legea normală reprezintă cazul limită al multor legi de
probabilitate.
5. Repartiţia 2 (hi-pătrat)
0 daca x0
1 n
1
x
f ( x) n x2 e 2
2 2 ( n ) daca x0
2
n x n n n
1 1 1 1 1 n
x t
t
M (X ) n
2
e dx
2
n
2 2 2
e dt n
2 2
( 1) n
n n n 2
2 ( ) 0
2
2 ( )
2 0
2 ( )
2
2 2 2
x
t
unde am notat 2 .
58
1 n x
1 1
D2 (X ) x 2 e 2 dx n (n 2)n n 2n
2 2
n
n
2 ( ) 0
2
2
6. Repartiţia Student
n 1 x
( ) n 1
2 x2
f ( x) (1 ) 2
n n
n ( )
2 , R
n 1
( ) n 1
2 x2 2
n
M (X ) x(1 ) dx 0
n
n ( )
2
deoarece funcţia de sub integrală este impară.
59
Cursul nr. 10 Statistică în psihologie
Populaţie statistică
Statistica este una din ramurile moderne ale ştiinţei care se ocupă cu
gruparea, analiza şi interpretarea datelor referitoare la anumite
colectivităţi, fenomene, procese, etc. precum şi cu unele previziuni
privind producerea lor viitoare.
60
finită (numărul unităţilor statistice fiind cunoscut) : numărul
locuitorilor dintr-o localitate, numărul persoanelor dintr-o firmă etc.
infinită (numărul unităţilor statistice fiind necunoscut) : numărul
băuturilor de vodcă, numărul femeilor care fumează etc.
Elementele unei populaţii statistice se numesc unităţi statistice. În
psihologie, prin unităţi statistice înţelegem persoane, care se mai numesc
şi subiecţi.
Exemple.
1. Mulţimea studenţilor dintr-un an de studiu reprezintă o populaţie
statistică, fiecare student este o unitate statistică. Mediul de
provenienţă (urban, suburban, rural), sexul (masculin, feminin),
apartenenţa religioasă etc. constituie caracteristici.
2. Mulţimea nou născuţilor într-o anumită perioadă de timp dintr-o
anumită localtate formează o populaţie statistică, iar lungimea şi
greutatea constituie caracteristici.
Caracteristicile pot fi:
cantitative, de exemplu: greutate, înălţime, vârstă sunt
caracteristici cantitative, deoarece pentru fiecare individ se
materializează printr-un număr;
calitative, de exemplu : culoarea ochilor, culoarea pielii,
culoarea părului, preferinţe politice, apartenenţa confesională,
temperament, profesie, sex, aptitudini, talent, preferinţe artistice etc.
Utilizarea statisticii este foarte importantă în dezvoltarea unor metode
ştiinţifice adecvate de analiză şi decizie asupra unor situaţii despre care
avem date obţinute fie prin observare, fie prin măsurare.
Ideea de bază a statisticii este aceea a prelungirii (extrapolării)
concluziilor trase privind comportamentul unui subiect sau grup de
subiecţi (de obicei limitat) la nivelul întregii colectivităţii din care a
provine.
În cazul unor mari colectivităţi umane, un fenomen de masă nu poate fi
cunoscut, în ansamblul său, cercetând fiecare individ al acesteia. De
61
obicei, se selectează un anumit număr de indivizi pentru a fi studiate
caracteristicile care interesează, utilizând apoi metode adecvate care să
conducă la concluzii privind întreaga colectivitate.
Partea extrasă dintr-un întreg trebuie să fie o „copie micşorată” a
întregului, în sensul conservării la un anumit nivel al proprietăţilor de
bază ale acestuia, cu anumite toleranţe. Aceasta este inferenţa statistică.
Statistica – deşi este privită ca metodă de investigare a unor mari mulţimi
de date – este esenţială tocmai în acele situaţii în care din mulţimea
respectivă se extrag puţine elemente pentru a fi observate.
Statistica operează cu eşantioane extrase aleator din populaţiile supuse
investigării, cu scopul de a modela comportarea unei anumite
caracteristici a populaţiei respective.
Eşantioanele constau într-un anumit număr de unităţi statistice (subiecţi)
extrase dintr-o populaţie fie la întâmplare, fie pe principiul
reprezentativităţii.
Nici un eşantion nu poate fi o reprezentare perfectă a populaţiei din care a
fost extras. El reprezintă o estimare a populaţiei din care provine, cu o
anumită marjă de eroare.
Orice studiu statistic are două componente: obiectul şi scopul.
62
În urma observării unei colectivităţi care face obiectul unui studiu, se
obţine o mulţime de date. Rolul statisticii descriptive este de a colecta,
grupa şi sistematiza datele de observaţie.
63
analiza şi interpretarea rezultatelor obţinute în urma prelucrării.
Exemlu. Se face un referendum. Acesta presupune culegerea şi
înregistrarea datelor, prelucrarea lor, analiza şi interpretarea rezultatelor.
Selecţia
64
Cursul nr. 11 Statistică în psihologie
65
Punctajul obţinut de un subiect la un test psihologic, ecologic etc.
se numeşte scor.
S X S X
s1 x1 1 15
s2 x2 2 10
3 25
sn xn 100 20
Nr.
X X
Subiecţi
s1 x1 15 2
s2 x2 10 5
25 3
sn xn
66
Se grupează după un anumit scor (punctaj) numărul subiecţilor
care l-au realizat.
Dacă se înlocuiesc frecvenţele absolute cu frecvenţele relative se
obţine tabelul:
X Frecvenţe
x1 f1
x2 f2
xn fn
67
3 9 1
4 6 4
5 5 5
6 3 7
7 5 5
8 8 2
9 4 6
10 7 3
11 2 8
12 3 7
68
4 1 1 1 0 1 1 1 0 6 2
5 0 1 1 1 0 1 0 1 5 3
6 1 1 0 1 1 1 0 1 6 2
7 1 1 1 1 1 1 0 1 6 2
8 1 0 0 0 1 0 1 0 3 5
9 1 1 1 1 1 1 1 1 10 0
10 1 0 0 1 0 1 1 1 5 5
11 1 1 0 1 0 1 1 1 6 2
12 1 0 1 1 1 0 1 1 6 2
Corect 10 8 6 10 9 7 9 8
Greşit 2 4 6 2 3 5 3 4
Varianta 3.
Item Co Gre
1 2 3 4 5 6 7 8 9 10
Subiect rect şit
69
1 8 2 3 8 1 3 5 1 1 5 5 5
2 8 2 3 7 7 4 5 1 6 5
3 8 2 3 8 7 4 5 2 7 5
4 8 2 3 8 7 4 4 5 6 9
5 8 2 4 5 6 3 2 4 7 6
6 7 3 5 4 4 2 1 5 1 7
7 8 2 3 6 7 4 2 8 5 3
8 8 4 3 8 7 4 5 1 7 6
9 8 4 3 8 7 4 5 1 7 6
10 8 2 3 8 8 7 4 5 7 6
11 8 2 3 7 5 3 7 8 7 6
12 8 3 3 7 5 2 8 2 3 5
Corect 11 8 10 3 2 1 5 7 6 4
Greşit 1 4 2 9 10 10 7 5 6 8
Variante
8 2 3 7 5 2 5 2 7 5
corecte
70
Protocolul de structură “subiect – grup de apartenenţă”
sn gm xn 100 g100 12
n – nr. de subiecţi
m – nr. de grupuri
xi – scorul
Distribuţia frecvenţelor absolute în funcţie de rezultate (scoruri) şi
de grupuri.
Valori ale variabilei măsurate
Grupuri TOTAL
x1 x2 ... xn
71
g2 a 21 a 22 a2n t2
g3
gm a m1 am2 a mn tm
g1 10 4 12 72
g2 7 8 3 65
g3
gm 9 15 7 52
TOTAL 42 45 38 285
72
Acest tip de protocol se realizează în cazul în care subiecţii
sunt supuşi la mai multe condiţii.
De exemplu, subiecţii răspund la mai multe întrebări la
începutul programului de lucru.
T
t1 t2
S
s1 x11 x12
s2 x 21 x 22
sn x p1 x p2
t1
T
S – subiecţi; t2
T are două modalităţi: t1 - la începutul
programului;
t2 - la sfârşitul programului
t2
T x
TOTAL
xa xb xk
73
xk nka nkb nkk nk1
n
TOTAL na 2 nb 2 nk 2
t2
T x
TOTAL
16 19 34
16 12 17 20 97
19 15 19 11 87
t1
34 19 22 24 104
TOTAL 110 112 216 540
74
Cursul nr. 12 Statistică în psihologie
Statistică descriptivă
75
pe grupe, ce reprezintă populaţia despărţită în grupe omogene după
o singură caracteristică;
combinate, ce reprezintă populaţia despărţită în grupe omogene
după două sau mai multe caractreristici.
Exemplu. Tabel statistic simplu. Se măsoară înălţimea unei populaţii
reprezentată de 100 studenţi şi se obţine:
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 9 9 9 9
0 2 5 8 0 3 4 5 7 0 2 3 5 8 0 4 7 9 0 2 5 7
4 5 7 2 7
1 2 2 2 3 3 6 6 4 0 1 5 6 2 2 1 1 1
0
76
Nota la statistică 10 9 8 7 6 5 4 3 2 1
10 1 2 0 0 0 0 0 0 0 0 3
9 2 1 0 0 0 0 0 0 0 0 3
8 0 0 5 3 1 0 0 0 0 0 9
7 0 0 0 4 0 0 0 0 0 0 4
6 0 0 0 0 3 2 0 0 0 0 5
5 0 0 0 0 0 0 2 1 0 0 3
4 0 0 0 0 0 0 1 2 0 0 3
3 0 0 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 0 0
Total 3 3 5 7 4 2 3 3 0 0 30
Histograme.
77
din limitele fiecărui interval se ridică apoi câte o
perpendiculară pe axa absciselor, ale cărei extremităţi se
unesc printr-o linie, formând mai multe dreptunghiuri ale
căror suprafeţe sunt proporţionale cu frecvenţele
corespunzătoare intervalului respectiv.
Exemplu.
78
45 - 50 3
50 - 55 5
55 - 60 6
60 - 65 9
65 - 70 12
70 - 75 14
75 - 80 18
80 - 85 15
85 - 90 8
90 - 95 6
95 - 100 4
1.00 *
0.96 *
0.90 *
Exemplu. 0.82 Considerăm seria statistică de mai sus:
(5,2);(7,1),(12,3);(14,1);(18,2);(20,3) şi o vom reprezenta prin clase de
0.67 printr-o histogramă.
valori şi apoi *
0.49 *
0.03 *
45 50 55 60 65 70 75 80 85 90 95 100
79
3
4
2
3
5 10 15 20 25
5 10 15 20 25
Statut nk %
Celibatar 20 20%
Căsătorit 55 55%
55% Divorţat 25 25%
55 55
55 55% Total 100
20 %
80
Fie P o populaţie şi notăm cu f o caracteristică a sa. Caracteristica f
asociază fiecărei unităţi statistice x din populaţia P o valoare f (x) ,
determinată în general prin măsurători.
Definiţie. Mulţimea {( x, f ( x)), x P} ordonată după valorile lui x , se
numeşte repartiţie empirică a caracteristicii f pe populaţia P sau serie
statistică.
Definiţie. Numărul k reprezentând unităţile statistice (indivizii) din
x
mulţimea {x x P, f ( x) k} se numeşte frecvenţă absolută a lui şi se
notează cu nk .
Cu alte cuvinte, numărul indivizilor (unităţilor statistice) dintro populaţie
pentru care caracteristica ia o aceeaşi valoare se numeşte frecvenţă
absolută a valorii respective.
Observaţie. Numărul indivizilor (unităţilor statistice) dintro populaţie
pentru care caracteristica ia o aceeaşi valoare se mai numeşte şi scor.
Dacă valorile distincte ale caracteristicii sunt x1 , x2 ,...., xm , atunci
frecvenţele absolute se notează cu n1 , n2 ,...., nm şi reprezintă numărul
unităţilor statistice care corespund acelor valori.
Fie N numărul unităţilor statistice ale unei populaţii P şi n1 , n2 ,..., nm
m
Valorile caracteristicii x1 x2 . . . . xm
Frecvenţele absolute n1 n2 . . . . nm
Exemplu. Intr-o şcoală sunt 12 clase. Numărul fetelor din fiecare clasă
este de 5, 12, 20, 5, 12, 20, 18, 12, 14, 7, 20, 18.
În acest caz, populaţia statistică este reprezentată de cele 12 clase, iar
caracteristica de numărul fetelor
xk 5 7 12 14 18 20
nk 2 1 3 1 2 3
81
Mulţimea perechilor ( x k , nk ), constituie o serie statistică:
{(5,2), (7,1), (12,3), (14,1), (18,2), (20,3)} 6
, iar
k 1
k
.
N n 12
m
nm n k
Se observă că , iar N
i 1
pi k
i 1 N
i 1
1
x1 p1
x2 p2
. .
. .
Caracteristica X . . căreia i-
x p
X: m m
am ataşat această repartiţie
se numeşte variabilă
statistică, iar repartiţia ei se numeşte repartiţie sau distribuţie statistică.
Observaţiile asupra caracteristicii se grupează, de regulă, în clase de
valori.
82
Definiţie. Se numeşte frecvenţă absolută cumulată crescător a valorii
caracteristicii xk , suma tuturor valorilor caracteristicii mai mici sau egale
cu xk .
Exemplu.
Clase de valori Frecvenţa Frecv abs cumulată crescător
[150 – 155) 3 3
[155 - 160) 6 9
[160 - 165) 8 17
[165 - 170) 11 28
[170 - 175) 17 45
[175 - 180) 30 75
[180 - 185) 12 87
[185 - 190) 8 95
[190 - 195) 3 98
[195 - 200) 2 100
x n x 2 n2 .... x m nm x n k k
x 1 1 k 1
n1 n2 ...... nm N
sau
m
x xi p i
i 1
m
unde
n N
k 1
k
reprezintă numărul unităţilor statistice ale populaţiei.
Exemplu. Fie distribuţia 3, 5, 8, 4, 6 atunci media
5
x i
358 46
x i 1
5.20
N 5
83
Observaţie.Calculul mediei pentru o distribuţie de frecvenţe grupate se
face prin suma prodului dintre fiecare valoare şi frecvenţa ei, care apoi se
împarte la suma frecvenţelor.
Exemplu. Fie distribuţia 4, 6, 9, 4, 3, 6, 5, 6 atunci
k
x n i k
3 *1 4 * 2 5 *1 6 * 3 9 *1
m i 1
k
1 2 1 3 1
n
i 1
k
Exemplu.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 4
55 3
60 1
Total 30
Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent
85
P5 Adeseori
P6 Câteodată
P7 Câteodată
P8 Câteodată
P9 Niciodată
În acest caz modul este dat de Frecvent, având cele mai multe răspunsuri.
Observaţie. Modul poate fi utilizat în măsurarea tendinţei centrale pentru
variabile de tip nominal.
Exemplu. Considerăm următoarea serie statistică reprezentând volumul
vânzările de pantofi de damă întro zi, întrun magazin: (34,2), (35,4),
(36,9), (37,5), (38,8), (39, 11), (40,4), (41,3), (42,2).
Modul (măsura modală) numerelor de pantofi vândute este 39, iar
mediana este 38.
Media aritmetică nu este semnificativă în acest caz.
Definiţie. Se numeşte mediana unei serii statistice valoarea caracteristicii
care împarte volumul populaţiei în două părţi egale.
Observaţie. Pentru determinarea medianei se ordonează caracteristicile
crescător sau descrescător.
În cazul unui număr par de valori ale caracteristicii, mediana este media
valorilor de la mijloc ale caracteristicii.
În cazul unui număr impar de valori ale caracteristicii, mediana este
valoarea de la mijloc a caracteristicii.
Exemple.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 7
60 1
Total 30
86
Mediana este 35. Deci vârsta medie este 35. Avem 13 persoane cu vârsta
mai mică de 35 ani şi 13 cu vârsta mai mare de 35 ani.
Vârsta Frecvenţa
20 5
23 2
30 6
35 4
42 5
50 4
55 3
60 1
Total 30
Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent
P5 Adeseori
P6 Câteodată
P7 Câteodată
87
P8 Câteodată
P9 Niciodată
Din cele 9 răspunsuri, al 5-lea este cel din mijloc si reprezintă mediana.
Considerăm tabelul
Persoana Răspunsul
P1 Frecvent
P2 Frecvent
P3 Frecvent
P4 Frecvent
P5 Adeseori
P6 Câteodată
P7 Câteodată
P8 Câteodată
P9 Niciodată
P10 Niciodată
88
Cuantile
În unele situaţii este nevoie să se introducă mărimi analoage medianei,
care împart mulţimea valorilor caracteristicii într-un anumit număr de
submulţimi cu proprietăţi analoage celor puse în evidenţă cu ajutorul
medianei.
Considerăm că mulţimea valorilor caracteristicii este divizată în m
submulţimi.
Definiţie. Se numesc cuantile numerele distincte c1 , c2 ,...., cm1 cu
proprietatea că împart numărul caracteristicilor în intervale astfel încât în
fiecare interval [ck , ck 1 ], k 1,2,..., m 2 valoarea frecventei absolute cumulat
crescătoare este aceiaşi.
Cuantila c1 se numeşte cuantilă mică, iar cm1 se numeşte cuantilă mare.
Pentru un număr par m=2k, cuantila ck coincide cu mediana.
Pentru m=4 cuantilele se numesc cuartile, pentru m=10 se numesc decile,
pentru m=100 se numesc procentile.
Exemplu.
89
25 3 47
26 4 51
28 5 56
30 4 60
90
25 2 47
26 4 51
28 5 56
30 4 60
91
m
x
i 1
i 33 (x
i 1
i x) 0
N=6
x =5.5
92
xk k 1,2,...., m
X :
Definiţie. Se numeşte dispersie a variabilei statistice pk
m
2 ( xk x ) 2 pk
numărul k 1 .
Observaţie. Media indică o „concentrare” a valorilor, în timp ce dispersia
indică o împrăştiere a acestora în raport cu media.
Exemplu.
xi ni pi xi p i xi x ( xi x ) 2 ( xi x ) 2 p i
8.36-8.38 8.37 5 0.05 -0.045 0.0020 0.00010
8.38-8.40 8.39 18 0.18 -0.025 0.0006 0.00010
8.40-8.42 8.41 35 0.35 -0.005 0 0
8.42-8.44 8.43 29 0.29 0.015 0.0002 0.00005
8.44-8.46 8.45 11 0.11 0.035 0.0012 0.00013
8.46-8.48 8.47 2 0.02 0.055 0.0030 0.00006
0.00044
x 8.4158 2 0.00044
Definiţie. Numărul se numeşte abatere medie pătratică.
Observaţie. Numărul 2 care reprezintă dispersia sau care reprezintă
abaterea medie pătratică şi se calculează pentru întreaga populaţie, iar s 2
dispersia de selecţie sau s abaterea standard se calculează pentru
eşantion.
m m
( X i m) 2
s2 i 1
xi xi x ( xi x ) 2
6 6-5.5= 0.5 0.25
7 7-5.5= 1.5 2.25
3 3-5.5=-2.5 6.25
5 5-5.5=-0.5 0.25
4 4-5.5=-1.5 2.25
8 8-5.5= 2.5 6.25
6 6
xi 33
i 1
(x
i 1
i x ) 2 17.50
N=6
93
1 6
s2
N 1 (x
i 1
i x ) 2 3.50
x =5.5
Coeficientul de variabilitate
Pentru a obţine informaţii privind omogenitatea unui eşantion, Pearson a
introdus coeficientul de variabilitate care se calculează astfel:
s
cv .
x
Avem următoarele cazuri:
Dacă cv 0.15 rezută că împrăştierea faţă de valoarea medie este
mică şi media este reprezentativă.
Dacă 0.15 cv 0.30 rezultă o împrăştiere moderată, iar media poate
fi considerată ca având o reprezentativitate relativă.
Dacă cv 0.30 media nu mai poate fi considerată reprezentativă.
94