Sunteți pe pagina 1din 41

STATISTICĂ ĨN SPSS - CURS 8

26 APRILIE 2021

1
IMPORTANT

Cursul urmează structura din lucrarea “Statistics for


Business”, Anderson et. al, 2011, disponibilă la biblioteca
facultății.

2
STRUCTURA CURSULUI

Condiționare și independență

Probabilități marginale

Teorema Bayes

3
DE UNDE PORNIM?

În urna alăturată se află 6


bile albe și 4 bile negre

Extragem succesiv două


bile din urnă

Care este probabilitatea


caa doua bilă extrasă să
fie albă?

4
FIXĂM EVENIMENTELE:

A1: la prima extragere se obține bilă albă

A2: la a doua extragere se obține bilă albă

P(A1) = 6/10

P(A2) = ?

Răspunsuri posibile: 6/9, 5/9, sau 6/10


5
RĂSPUNSUL DEPINDE DE…

…ce se întâmplă cu prima bilă extrasă:

P(A2) = 6/10, dacă prima bilă extrasă a fost repusă


în urnă

P(A2) = 5/9, dacă prima bilă extrasă nu a fost repusă


în urnă și a fost albă

P(A2) = 6/9, dacă prima bilă extrasă nu a fost repusă


în urnă și a fost neagră
6
INDEPENDENȚĂ ȘI
CONDIȚIONARE
Dacă prima bilă este repusă în urnă:

evenimentele A1 și A2 sunt independente: realizarea sau


nerealizarea lui A1 nu are influență asupra șanselor de
realizare a lui A2

Dacă prima bilă nu este repusă în urnă:

evenimentele A1 și A2 sunt dependente: realizarea sau


nerealizarea lui A1 are influență asupra șanselor de realizare a
lui A2
7
PROBABILITATEA CONDIȚIONATĂ

Se notează P(A/B)

Înseamnă probabilitatea ca A să se realizeze,


știind că B s- a realizat

8
DEFINIȚIE ȘI FORMULĂ DE CALCUL

9
EXEMPLU:
 Experiment: Aruncarea unui zar

 Se cere probabilitatea apariției unui număr par, știind


că s-a obținut un număr de puncte mai mare decât 2

10
CUM GÂNDIM PROBLEMA?

A: la aruncarea zarului apare un număr par

B: la aruncarea zarului apare un număr mai mare decât 2

11
ILUSTRAREA GRAFICĂ

A: un număr par

4 3
2
6 5

B: un număr mai mare ca 2

Porțiunea comună (intersecția) celor două evenimente


12
EXPLICAȚII

Dacă am calcula P(A), am ști că sunt trei numere pare din șase
rezultate posibile la aruncarea zarului

Odată ce condiționăm realizarea lui A de B, restrângem


numărul de posibilități de la 6, la numărul de elemente ale
lui B - în acest caz, 4

Numărul de cazuri favorabile lui A în aceste condiții se


modifică: este ceea ce permite evenimentul deja realizat, B,
adică elementele din intersecția lui A cu B

În concluzie: P(A/B) = 2/4 (doar două numere pare sunt mai mari
decât 2 și doar patru numere sunt mai mari decât 2) 13
NE FOLOSEȘTE LA CEVA?

Context: un adăpost care găzduiește 473 de animale


este acuzat că susține mai mult adopția câinilor decât
adopția pisicilor și ca atare este în pericol de a fi dat în
judecată pentru discriminare

Întrebare: pe baza datelor existente, considerați că


acuzația se susține?

14
INFORMAȚIILE DE CARE
DISPUNEM

Câini Pisici Total

Adoptate 123 81 204

Neadoptate 168 101 269

291 182 473

15
FIXĂM EVENIMENTELE

C: animalul este un câine

P: animalul este o pisică

A: animalul este adoptat

N: animalul nu este adoptat

16
CUM GÂNDIM PROBLEMA

Dacă adopția nu ar fi în legătură cu tipul animalului, ar


trebui ca probabilitatea de adopție știind că animalul este
un câine să fie aceeași cu probabilitatea de adopție știind
că animalul este o pisică:

P(A/C) = P(A/P)

Pe baza datelor din tabel, calculăm probabilitățile


aferente
17
CE CORESPUNDE FIECĂREI POZIȚII?

C P Total

A P(A și C) P(A și P) P(A)

N P(N și C) P(N și P) P(N)

P(C) P(P)

18
LE SCRIEM EXPLICIT

Câini Pisici Total

Adoptat 123/473 81/473 204/473

Neadoptat 168/473 101/473 269/473

Total 291/473 182/473 473/473


19
ÎN FORMĂ FINALĂ

Câini Pisici Total

Adoptat 0.26 0.17 0.43

Neadoptat 0.36 0.21 0.57

Total 0.62 0.38 1


20
CALCULĂM ACUM PROBABILITĂȚILE
CONDIȚIONATE
Dacă animalul este un câine

P(A/C) = P(A și C)/P(C)

P(A/C) = 0.26/0.62

P(A/C) = 0.42

Dacă animalul este o pisică

P(A/P) = P(A șiP)/P(P)

P(A/P) = 0.17/0.38

P(A/P) = 0.45
21
CONCLUZII

Nu există diferențe mari între probabilitatea de adopție a


unui câine și a unei pisici

Mai mult, există o probabilitate un pic mai mare ca pisicile


să fie adoptate

Acuzația de tratament preferențial nu se susține.

22
OBSERVAȚIE IMPORTANTĂ

Chiar dacă din calcul ar fi rezultat că probabilitatea de adopție


a unui câine este mai mare decât probabilitatea de adopție a
unei pisici, nu ar fi fost suficient pentru a proba discriminarea.

Rezultatul ar fi pus în evidență existența unei diferențe și ar fi


cerut cercetări suplimentare.

Diferența ar fi putut fi rezultatul tratamentului preferențial, dar


ar fi putut fi explicată și prin alți factori, care trebuie luați în
calcul.
23
TEOREMA LUI BAYES

Ajută la ajustarea valorilor de probabilitate aferente realizării unui


eveniment

Exemplu: jucați table cu un prieten și porniți de la ipoteza că


probabilitatea să fie un jucător corect este maximă, 1

Observați că în mod repetat zarurile lui (la care ține foarte mult și nu
le împarte cu nimeni) arată 5 sau 6, cu o frecvență mai mare decât
cea normală

Începeți să credeți că nu este un jucător corect (ajustați probabilitatea


inițială, 1, în linie cu noile informații).
24
EXEMPLU

Lucrați cu doi furnizori de materii prime, care vă furnizează


o anume componentă

Primul furnizor vă livrează 40% dintre componente

Al doilea furnizor vă livrează 60% dintre componente

De obicei, 6% dintre componentele venite de la primul


furnizor sunt rebuturi și doar 2% dintre cele venite de la al
doilea furnizor.
25
PROBLEMA DE REZOLVAT

Întrebarea standard pentru aplicarea teoremei lui Bayes:

O componentă se dovedește a fi un rebut. Care este


probabilitatea să fi venit de la primul furnizor?

26
DISTRIBUȚIA INIȚIALĂ:

Pentru că primul furnizor livrează 40% dintre


componente, primul răspuns este că probabilitatea ca
rebutul să vină de la acest furnizor este aceeași cu
probabilitatea ca orice piesă din inventar să vină de acolo

Spunem că aceasta este probabilitatea a-priori (înainte să


aflăm alte informații) și este 0.4

27
INFORMAȚIA SUPLIMENTARĂ?

“De obicei, 6% dintre componentele venite de la primul


furnizor sunt rebuturi și doar 2% dintre cele venite de la al
doilea furnizor.”

Cum ne ajută asta?

28
FIXĂM EVENIMENTELE

F1: componenta vine de la primul furnizor

F2: componenta vine de la al doilea furnizor

B: componenta este bună

R: componenta este rebut

29
VALORILE DE PROBABILITATE
CUNOSCUTE

P(F1) = 0.4

P(F2) = 0.6

P(R/F1) = 0.06

P(R/F2) = 0.02

30
CE TREBUIE SĂ AFLĂM - ȘI CUM?

P(F1/R)

probabilitatea ca piesa să vină de la primul furnizor,


știind că este un rebut

31
Tabelul probabilitatilor
juxtapuse
F1 F2 Total

Total 0.4 0.6 1

P(R/F1) = 0.06
P(R/F1) = P(R si F1)/ P(F1)

P(R/F2) = 0.02
P(R/F2) = P(R si F2)/ P(F2)

P(F1/R) = ?
CE CUNOAȘTEM ȘI CE NU CUNOAȘTEM

Ce trebuie să aflăm: P(F1/R)

Cum scriem asta: P(F1/R) = P(F1 și R) / P(R) (1)

Ce știm acum: P(R/F1)

Cum mai scriem asta: P(R/F1) = P(R și F1) / P(F1) (2)

Înlocuim ceea ce cunoaștem: 0.06 = P(R și F1) / 0.4

Ce putem afla de aici: P(R și F1) = 0.06*0.4 = 0.024


33
CONTINUĂM CALCULUL

Am aflat că P(R și F1) = 0.024

În (1) avem P(F1 și R), care este același lucru

Mai avem de aflat P(R)

34
REBUTUL POATE VENI DE LA F1
SAU DE LA F2
R
F1 F2

R și F1 R și F2
35
CUM SCRIEM P(R)

P(R) = P(R și F1) + P(R șiF2)

Dar, din definiția probabilității condiționate obținem, prin


eliminarea numitorului:

P(R și F1) = P(F1) * P(R/F1)

P(R și F2) = P(F2) * P(R/F2)

36
ÎNLOCUIM ȘI CALCULĂM P(R)

P(R) = P(F1) * P(R/F1) + P(F2) * P(R/F2)

Înlocuim valorile pe care le cunoaștem deja:

P(R) = 0.4*0.06 + 0.6*0.02

P(R) = 0.036

37
CALCULUL FINAL

Revenim la formula (1) de pe slide-ul 32 și înlocuim valorile pe care le-am


aflat:

P(F1/R) = P(F1 și R) / P(R)

Am aflat că:

P(F1 și R) = 0.024

P(R) = 0.036

În concluzie:

P(F1/R) = 0.024/0.036 = 0.67 38


CONCLUZIE

După luarea în calcul a informației suplimentare,


putem spune că probabilitatea ca o piesă rebut să
provină de la primul furnizor este de 0.67, în loc
de 0.4 cât a fost inițial.

0.4 a fost probabilitatea a-priori

0.67 este probabilitatea a-posteriori


39
UN ALT MOD DE A SCRIE:

P(F1/R) = P(F1 și R)/ P(R) (1)

P(R/F1) = P(R și F1) / P(F1) (2)

Exprimăm P(R și F1) = P(F1) * P(R/F1) din a doua relație și


înlocuim în (1):

P(F1/R) = P(F1) * P(R/F1) / P(R)

Aceasta este Teorema lui Bayes


40
PE DATA VIITOARE!
41

S-ar putea să vă placă și