Sunteți pe pagina 1din 3

univ.

2019-2020

Curs 11. Statistica psihologica I


Elemente de teoria probabilităţilor.
Calculul probabilităţilor pentru variabilele categoriale

Probabilitatea reprezintă şansa teoretică de apariţie a unui anumit eveniment.


Un eveniment reprezintă obţinerea unei anumite valori (modalităţi) a unei variabile.
Probabilitatea se notează cu „p” şi ia valori cuprinse între 0 (eveniment imposibil) şi 1
(eveniment sigur). Deşi corectă este exprimarea probabilităţii printr-un număr subunitar, ca şi
frecvenţă relativă raportată la unitate, mulţi preferă exprimarea procentuală. De exemplu, în loc
de „există o probabilitate de 0,5” se poate spune „există 50% şanse”.
Probabilităţile se calculează diferit în funcţie de scala pe care se măsoară variabilele
analizate:
 pentru variabilele categoriale, care au o variaţie discontinuă (discretă): probabilitatea se
determină ca raport între numărul cazurilor favorabile şi numărul cazurilor posibile;
 pentru variabilele numerice cu variaţie continuă (măsurate pe interval-raport),
probabilitatea este citită drept „arie” sub curba de distribuţie şi se determină prin
calcule complexe. Din fericire, există tabele statistice cu aceste probabilităţi deja
calculate (de exemplu, tabelul probabilităţilor de sub curba normală z – pe care îl vom
prezenta în cursul următor).
Vom prezenta în continuare cazul variabilelor categoriale, acesta fiind un bun prilej de
a explica o serie de concepte ţinând de teoria probabilităţilor.

Probabilităţi pentru variabile categoriale. Formula de calcul este cea prezentată anterior:
numãr cazuri favorabile
p=
numãr cazuri posibile

După cum se observă, se face un raport între mulţimea valorilor de un anumit tip („număr cazuri
favorabile”, adică frecvenţa absolută a unei categorii) şi totalitatea valorilor variabilei („număr de cazuri
posibile”, adică numărul total de cazuri – volumul eşantionului „N”).

Fie următorul exemplu: În sală sunt 20 de studenţi la psihologie. Dintre aceştia, 16 sunt fete. Şase
persoane din sală sunt căsătorite, toate fiind femei. Profesorul vrea să scoată la tablă un student. El aplică
în acest sens metoda „tragerii la sorţi”: scrie pe câte un bileţel de hârtie numele fiecărui student din sală,
amestecă „biletele” într-o „urnă” şi extrage unul dintre acestea. Studentul al carui nume este scris pe bilet
va iesi la tabla.
Vom răspunde la următoarele întrebări:
a) Cine are „şanse” mai mari de a ieşi la tablă, studentul X sau studentul Y?
„Şansele” sunt egale, fiind vorba de o extragere aleatorie. Fiecare student din sală are aceeaşi şansă de a fi
selectat – şi anume, egală cu 0,05 (1/20). Scris procentual, sansa este de 5%.
b) Care este probabilitatea ca la tablă să iasă un băiat?
p (B) = 4/20 = 0,2
c) Care este probabilitatea ca la tablă să iasă o fată?
p (F) = 16/20 = 0,8
Obs.: probabilităţile de la subpunctele b) şi c) se numesc probabilităţi complementare. Suma lor va fi
întotdeauna egală cu 1. Din acest motiv p (F) putea fi calculată şi altfel: p (F) = 1 - p (B) = 1 – 0,2 = 0,8
d) Care este probabilitatea ca la tablă să iasă un student la psihologie?

1
p = 20/20 = 1 (eveniment sigur)
e) Care este probabilitatea ca la tablă să iasă un elev de liceu?
p = 0/20 = 0 (eveniment imposibil)
f) Care este probabilitatea ca la tablă să iasă o femeie căsătorită?
p = 6/20 = 0,3
g) La „extragere” participă doar femeile. Care este acum probabilitatea de a fi selectată o persoană
căsătorită?
p = 6/16 = 0,375. Observăm faptul că am schimbat baza de raportare (16 în loc de 20).
h) Persoana selectată pentru a ieşi la tablă a fost Iulian. La ora următoare profesorul foloseşte din
nou metoda extragerii aleatorii pentru a scoate la tablă un student. Ce credeţi, cine are mai multe
şanse să iasă la tablă ora următoare – Iulian, Andrei (un alt baiat din sala) sau oricare dintre ei?
Varianta corectă este „oricare dintre ei”, deoarece rezultatul la a doua extragere nu are nicio
legătură cu rezultatul la prima extragere. Despre rezultatele la cele două extrageri se spune că sunt
evenimente independente.
Profesorul reface extragerea cu „urna completă” (bileţelul pe care a fost scris numele lui Iulian,
după prima extragere, a fost pus la loc în „urnă”); asta înseamnă că fiecare student (oricare student) are
şansa de p = 1/20 = 0,05 de a fi selectat.
i) Ne interesează acum probabilitatea ca un student oarecare (să spunem, Andrei) să fie selectat la
două extrageri succesive.
Acest lucru se determină folosind regula înmulţirii probabilităţilor pentru evenimente
independente: probabilitatea succesiunii unor astfel de evenimente este egală cu produsul probabilităţilor
pentru fiecare eveniment în parte.
Pentru exemplul nostru:
p = 0,05 * 0,05 = 0,0025
Scris procentual, sansa este de 0,25%.

Pragul critic şi riscul de eroare. Fie următorul exemplu: Un student, Mihai, susţine un examen de
restanţă. Profesorul a conceput pentru el o grilă cu cinci întrebări. Fiecare întrebare are două variante de
răspuns, a) şi b), una singură fiind corectă. Corectând lucrarea, profesorul constată că Mihai a răspuns
corect la toate cele cinci întrebări. El îşi aminteşte însă faptul că în timpul examenului Mihai se tot juca cu
o monedă. El se întreabă dacă nu cumva studentul său „a dat cu banul” (adică, de exemplu, a decis că
dacă la aruncarea banului va cădea „stema” să bifeze pe grilă varianta a), iar dacă va cădea „banul”,
varianta b) şi aşa, prin „jocul întâmplării”, a nimerit de fiecare dată (de cinci ori la rând) varianta corectă.
Dacă ar fi aşa, Mihai ar fi promovat examenul cu zece fără să fi învăţat nimic!
Probabilitatea ca acest lucru să se fi întâmplat se calculează astfel:
p (succesiune de cinci răspunsuri corecte)
= p(1) × p(2) × p(3) × p(4) × p(5) = 0,5 × 0,5 × 0,5 × 0,5 × 0,5 = 0,03125
Am aplicat regula înmulţirii probabilităţilor, evenimentele analizate (obţinerea unui răspuns
corect la o anumită întrebare) fiind independente şi având, fiecare, probabilitatea p = 1/2 = 0,5. Aceasta
este probabilitatea de a nimeri răspunsul corect la o aruncare a banului.
Există o probabilitate de aproximativ 0,03 ca Mihai să fi „ghicit” toate acele răspunsuri corecte.
Într-o exprimare procentuală, sunt doar 3% şanse ca Mihai să-şi fi obţinut nota doar „ghicind”
răspunsurile. Este mult, este puţin? Este o probabilitate suficient de mică pentru a-l convinge pe profesor
că Mihai nu a trişat?
Profesorul poate fi asemănat cu un cercetător. În funcţie de domeniul în care lucrează (de
exemplu, psihologie / construcţia de poduri), cercetătorul este dispus să îşi asume un risc de eroare mai
mic sau mai mare. Există totuşi o convenţie ca acest risc asumat să nu depăşească 5% (0,05)
Acest nivel al probabilităţii de 0,05 se numeşte prag critic şi se notează cu litera grecească afla
(α). Acesta este un concept foarte important pentru procesul decizional din aşa-numita statistică
inferenţială.

2
Complementar riscului de eroare este probabilitatea garantării rezultatelor (de exemplu,
pentru un prag de 0,05 probabilitatea garantării rezultatelor este p = 1 - α = 0,95).
Pentru exemplu nostru, dacă profesorul şi-ar fi fixat pragul de decizie la 0,05, el ar fi trebuit să
accepte faptul că rezultatul obţinut, p = 0,03 < 0,05, este unul puţin probabil. Va trebui să accepte
punctajul obţinut de Mihai ca nedatorându-se întâmplării – ci faptului că studentul a învăţat. Desigur,
problema se punea altfel dacă profesorul ar fi calculat probabilitatea de a fi promovat cu nota 6 (notă
echivalentă unei succesiuni de 3 răspunsuri corecte): p = 0,5 × 0,5 × 0,5 = 0,125 (12,5%). Sau daca ar fi
existat mai multe variante de raspuns la fiecare intrebare!
..........................................................................................................................................

Exercitii:

I. Într-un birou lucreaza 16 angajati. Jumatate dintre ei sunt femei. Zece dintre ei au studii superioare;
dintre acestia zece, sase sunt femei. Seful biroului vrea sa-l puna pe unul din angajatii sai sa rezolve o
sarcina urgenta, dar nu stie pe care. Se lasa in voia sortii si face si el o tragere la sorti, precum profesorul
din exemplul din curs.
Răspundeti la următoarele întrebări:
a) Care este sansa unui angajat oarecare (oricare din ei) de a fi selectat?
b) Care este probabilitatea de a fi selectata o femeie?
c) Calculati probabilitatea complementara celei de la pct. b)
d) Care este probabilitatea de a fi selectata o femeie cu studii superioare?
e) Care este probabilitatea de a fi selectat cineva care nu lucreaza in acel birou?
f) Daca astazi a fost selectata „Maria”, care este probabilitatea ca saptamana viitoare sa fie selectata
(presupunem ca seful iar aplica acest mecanism) tot Maria?
g) Sa spunem ca „Maria” a fost aleasa prin acest mecanism de 4 ori, patru sapatamani la rand! Ea
este foarte suparata pe sef si se intreaba daca nu cumva a „trisat” si pe toate biletelele nu a scris
altceva decat numele ei! Care este probabilitatea ca seful sa nu fi trisat, ci pur si simplu, prin jocul
intamplarii, Maria sa fi fost selectata patru saptamani la rand?

II. Raspundeti la urmatoarele intrebari teoretice:


1) Ce reprezinta probabilitatea unui eveniment?
2) Cum se determina probabilitatea pentru variabilele categoriale?
3) Pentru ce variabile probabilitatea se determina ca „arie” de sub o curba de distribuţie?
4) Cum se numeste acel nivel al probabilitatii (fixat de regula la 0,05) setat drept risc
maxim de eroare asumat intr-o cercetare / decizie din statistica?
5) Daca riscul setat al erorii este de 0,01, cu cat va fi egala probabilitatea garantării
rezultatelor?

S-ar putea să vă placă și