Sunteți pe pagina 1din 57

STATISTICĂ ȋn SPSS

CURS11–17 mai 2021

1
IMPORTANT

Cursul urmează structura din lucrarea


“Statistics for Business”, Anderson et. al,
2011, disponibilă la biblioteca facultății.

2
CONTINUARE CURS 10

• μ = 25000 h

• σ = 4000 h
Să presupunem că voi sunteți producători de telefoane mobile și
decideți că un smartphone în garanție trebuie să beneficieze de
service gratuit.

Ce număr de ore de funcționare trebuie să înscrieți pe


certificatul de garanție, astfel încât să nu acordați service
gratuit la mai mult de 10% dintre telefoanele pe care le
produceți?
3
Rezolvare:
Xi = ? P(X < Xi) = 0.1

Aria de sub aceasta curba ar trebui sa fie 0.1


z care corespunde acestei probabilitati este -1.28
(valorea este luata din tabel - z table)
Rezolvare:
z = -1.28
z = (x-μ)/σ

-1.28 = (xi -25000)/4000


xi = 25000 - 1.28*4000
xi = 19880 h

Dacă garanția este stabilită la 19880 de ore, vom avea o probabilitate de 0.10 ca
un smartphone sa nu reziste mai mult fără serviciul de intervenție.
=> 19880 ore de functionare trebuie să înscrieți pe certificatul de garanție,
astfel încât să nu acordați service gratuit la mai mult de 10% dintre telefoanele
pe care le produceți.
Orice altă garanție mai mare de 19880 de ore va crește probabilitatea ca un
smartphone să aibă nevoie de servicii și în consecință, proporția smartphone-
urilor care ar beneficia de reparatii pe cheltuiala producătorului.
Ne reamintim!
DISTRIBUȚIA BINOMIALĂ DEPROBABILITATE

 este o distribuție discretă de probabilitate

 este asociată unui experiment binomial:

n exprimente identice, independente

 două rezultate posibile la fiecare experiment: succes sau eșec

 P(success) = p,constant

 Variabila aleatorie este numărul de “succese” din n încercări


 x: 0,1,2,3,…,n
Aproximarea distribuției binomiale prin
distribuția normală

Când numărul de încercări devine mare, este dificilă evaluarea


funcției de probabilitate binomală de mână sau cu un
calculator.
! Ori de câte ori np > = 5 și n(1-p) > = 5, o distribuție
binomială poate fi aproximată printr-o distribuție normală.

Ne reamintim!
 Media: μ = np
 Abaterea standard: σ = sqrt( np(1-p) )
Exemplu:
Exemplu:

 Un grup de 10 studenti => n = 10 (esantionul)

 Probabilitatea ca fiecare student sa treaca examenul este de 0.9


=> p = 0.9

 Studentii trec examenul independent unul de celalalt


Ne reamintim formula:
f(x) = Cnx p x (1-p)n-x

Nr. studenti care promoveaza examenul Probabilitatea

0 < 0.000001

1 < 0.000001

2 < 0.000001

3 0.000008748

4 0.000137781

5 0.0014880348

6 0.011160261

7 0.057395628

8 0.1937102445

9 0.387420489

10 0.3486784401
Observati diferenta! (slide 8)
Exemplu:

Probabilitatea ca examenul să fie trecut de 5 până la 8 elevi?

P (5 =< X =< 8) = 0,264 (a se vedea tabelul anterior)

Insa…

 Dacă numărul de studenți este mai mare (ex: 100), calculul devine foarte
dificil

 Dacă numărul studenților crește, forma distribuției se schimbă


Daca numarul de studenti creste, atunci distributia
va arata ca una normala:
Exemplu:

Probabilitatea ca între 85 și 98 de studenți să promoveze examenul este greu de


calculat.

P(85 <= x <= 98) = f(85) + f(86) + f(87) + … + f(98)

85
f(85) = 𝐶100 0.985 (1 − 0.9)100−85
.
.
.
98
f(98) = 𝐶100 0.998 (1 − 0.9)100−98
Aplicarea distributiei normale

! O modalitate mai ușoară de a face același lucru este de a folosi distributia


normală in aproximarea distribuției binomiale.

! Dar trebuie tinut cont de un factor de corectie (pentru ca se “trece” de la o


variabila discreta la una continua):

 P(X = n)  P(n – 0.5 <= X <= n + 0.5)


 P(n1 <= X <= n2)  P(n1 - 0.5 <= X <= n2 + 0.5)
 P(X > n)  P(X >= n + 0.5)
 P(X ≤ n)  P(X < n + 0.5)
 P (X < n)  P(X <= n – 0.5)
 P(X ≥ n)  P(X >= n – 0.5)
Verificam daca sunt indeplinite conditiile:

np = 100 * 0.9 = 90 > 5


n(1-p) = 100 * 0.1 = 10 > 5

Parametrii:
 μ (media) = n*p = 100 * 0.9 = 90
 σ (abaterea standard) = √ 100 * 0.9 * (1-0.9) ) = 3
Exemplul 1
Care este probabilitatea ca cel putin 85 de studenti sa promoveze
examenul?

 P(x>=85) = ?

 P(x >= 85) se va “transforma” in P(x >= 85 - 0.5) = P(x >= 84.5)

 Zi = (84.5 – 90)/3 = - 1.833

 P(x >= 84.5) = P(z >= -1.833) = 1 – P(z < -1.833) = 1 – 0.03362 = 0.96638

Probabilitatea ca cel putin 85 de studenti sa promoveze examenul este de 0.96638.


Exemplul 2
Care este probabilitatea ca 98 de studenti sau mai putini sa promoveze
examenul?

 P(x<=98) = ?

 P(x <= 98) se va “transforma” in P(x <= 98 + 0.5) = P(x <= 98.5)

 Zi = (98.5 – 90)/3 = 2.833

 P(x <= 98.5) = P(z <= 2.833) = 0.99767

Probabilitatea ca 98 de studenti sau mai putini sa promoveze examenul este de 0.99767.


Exemplul 3
Care este probabilitatea ca între 85 și 98 de studenți să promoveze examenul?

 P(85<=x<=98) = ?

 P(85 <= x <= 98) se va “transforma” in P(85 – 0.5 <= x <= 98 + 0.5) = P(84.5 <= x
<= 98.5)

 Z2 = (98.5 – 90)/3 = 2.833; Z1 = (84.5 – 90)/3 = - 1.833

 P(84.5 <= x <= 98.5) = P(-1.833 <= z <= 2.833) = P(z <= 2.833) – P(z <= -1.83) =
0.99767 - 0.03362 = 0.96405
STRUCTURA CURSULUI DE AZI

 Estimatoripunctuali
 Intervaledeestimare(depredicţie, deîncredere)

20
ESTIMĂRI

Necesarepentruluareadeciziilor, atuncicândnuavemaccesla valoriexacte.

Adeseainevitabile. 

21
DE EXEMPLU:

 Estimăriautomate:dacăavețitimpsătraversațiatuncicandse apropieo
mașină.

 Estimăribazatepeexperiențaanterioară:timpul necesar pentruaajungela


facultate.

 De ceinformații aveținevoie,în fiecarecaz? 22


ÎN STATISTICĂ...

există două tipuri de estimatori ai populaţiei:

 Estimatoripunctuali

 Intervale de estimare sau de predicţie

23
ESTIMATORII PUNCTUALI

 Oestimarepunctualăreprezintăunnumărfolositpentrua estimaun
parametrunecunoscutal uneipopulații.

De exemplu: “Presedintele ANAT și al Asociației Litoral-Delta Dunării, Corina Martin,


estimează căpeste30.000 deturiști sevor afla pelitoral în minivacanța de1Mai.”
(Sursa: http://m.ziare.com/vacanta/peste-30-000-de-turisti-sunt-asteptati-pe-litoral-in-minivacanta-de-1- mai-
1223602, Data: 11 Martie2013)

24
INTERVALE DE ÎNCREDERE

 Intervalul de încredere asigură o plajă de valori între două limite


extreme, între care sepoate afla valoarea căutată.

Deexemplu:“Se estimează că între 20.000 și 40.000 de turiști se vor afla pe


litoral în minivacanța de 1Mai.”

25
Estimatori punctuali

• Media deselecție – pentru mediapopulației


• Proporția deselecție– pentru proporțiapopulației

26
I. ESTIMATORII PUNCTUALI

EXEMPLU:
 În fiecare săptămână,departamentuldevânzărial lanțului de
magazine A B C D selectează aleatoriu un eșantion de 35 de
magazinepentruaflanumărul decărțivândutesaptămânal.

27
I. ESTIMATORII PUNCTUALI

DATEEȘANTION: (bucăți)

101 100 110 93 105


105 98 102 110 112
97 97 107 112 93
93 112 106 98 97
114 97 100 97 99
103 110 102 94 100
100 106 98 103 28
99
I. ESTIMATORII PUNCTUALI

Valoareamedieanumăruluidecărți vândutesaptămânalde firma


respectivăestedatădemediadeselecţie:

X=3570 /35=102carti

29
I. ESTIMATORII PUNCTUALI

Folosind valoarea mediei de selecţie ca estimator, media


populaţieiμestede102cărțivândutesăptămânal.

30
II. INTERVALE DE ÎNCREDERE

 asigură o plajă de valori între două limite extreme, între


caresepoateaflavaloareacăutată.

31
1. Estimarea intervalului de încredere pentru
media unei populații – σ cunoscut
 Managerul unei firme doreşte să facă o estimare
(predicţie) asupra mediei de viaţă a bateriilor auto
produse de firma la care lucrează.
 Selectează un eşantion de 200 de baterii şi în
urma testelor efectuate, determină o medie de
viaţă de 36 de luni.
 Se cunoaşte abaterea standard a populaţiei ca
fiind 10 luni.
32
1. Estimarea intervalului de încredere pentru
media unei populații – σ cunoscut

Eroareamediestandard / abaterea standard de selecție este:


σ 10
σ𝑥 = 𝑛
= = 0,707
200

Am estimat astfelo duratămediedeviaţăauneibaterii cuprinsăîn


intervalul:
 ( 36 – 0,707 ; 36 + 0,707)
 (35,293 ; 36,707) 33
 Acest lucru este util dar insuficient pentru manager
 Să vedem ce facem dacă managerul vrea să calculăm
probabilitatea ca durata de viaţă a unei baterii să
aparţină intervalului determinat mai devreme:
(𝑥 −1∗σ𝑥 , 𝑥 +1 ∗σ𝑥 )
 saua intervalelor:
(𝑥 − 2∗σ𝑥 , 𝑥 + 2 ∗σ𝑥 )
(𝑥 − 3∗σ𝑥 , 𝑥 + 3 ∗σ𝑥 )
…șiașamaideparte.
34
Probabilitatea caunparametrual populaţiei să aparţinăunui
anumitinterval
 Ştim că pentru distribuţia normală porţiunea din arie
de sub curba normală este localizată între + şi – orice
număr de abateri standard faţă de medie.

 Putem aplica aceste proprietăţi valorii erorii standard


şi să facem estimări pentru problema cu bateriile.

35
Ne reamintim:

36
Vom spune că avem:
 Probabilitatea ca 0,955 din media de selecţie să fie la
2 erori standard faţă de medie, aşadar media
populaţiei este la + şi – 2 erori standard de 95,5% de
media de selecţie.

 Teoretic, dacă selectăm 1000 eşantioane dintr-o


anumită populaţie şi apoi construim un interval de +
şi - 2 erori standard faţă de medie pentru aceste
eşantioane, aproape 955 dintre aceste intervale vor
include media populaţiei. 37
În general avem:
 68,3% încredere că durata de viaţă a unei baterii aparţine
intervalului (𝑥 − 1∗σ𝑥 , 𝑥 + 1 ∗σ𝑥 )

 95,5% încredere că durata de viaţă a unei baterii aparţine


intervalului (𝑥 − 2∗σ𝑥 , 𝑥+ 2 ∗σ𝑥 )

 99,7% încredere că durata de viaţă a unei baterii aparţine


intervalului (𝑥 − 3∗σ𝑥 , 𝑥+ 3 ∗σ𝑥 )

38
Grade de încredere:
 În cazul intervalelor de predicţie (încredere), nu ne
putem mulţumi doar cu + şi – 1, 2 şi 3 erori standard
faţă de valoarea medie.

 Conform tabelului distribuţiei normale (slide 48) , +/-


1,64 erori standard includ 90% din aria de sub grafic.
 De asemenea, 2,58 erori standard includ 99% din arie
sau 49,51% de fiecare parte a mediei.

39
Nivelul de încredere sau pragul de semnificaţie
reprezintă:
 Probabilitatea asociată unui interval de predicţie.

 De exemplu, dacă o procedură de estimare a


intervalului prevede că 95% din intervalele
formate utilizând procedeul respectiv va include
parametrul populației, se spune că estimarea
intervalului să fie construit la un nivel de
încredere de 95%.
40
Exemplu:
Dar ce încredere putem avea în intervalul
(𝑥 − 1,64∗σ𝑥 , 𝑥 + 1,64 ∗σ𝑥 )

Pentru a determina gradul de încredere procedăm astfel:


 Dimensiunea eşantionului este suficient de mare
pentru a aplica distribuţia normală.
 Dacă z=1,64, din tabel avem că valoarea corespunde
pentru 0,4495 din arie.

41
Concluzie:
 0,4495 * 2 = 0,899
 Aşadar, putem spune că putem avea o încredere de 90% că
media populaţiei se află în intervalul (𝑥 − 1,64 ∗ σ𝑥 , 𝑥 +
1,64 ∗ σ𝑥 )

 Folosind datele problemei, avem o încredere de 90% că


durata de viaţă a unei baterii se situează în intervalul:
(36 - 1,64*0,707 ; 36 +1,64*0,707)
(34,8405 ; 37,1594)
42
Amintimdateleproblemei:
 Managerul unei firme doreşte să facă o estimare (predicţie) asupra
medieideviaţăabateriilorprodusedefirmalacare lucrează.

 Selectează un eşantion de 200 de baterii şi în urma testelor efectuate,


determinăomediedeviaţăde36de luni.

 Secunoaşteabatereastandardapopulaţieicafiind10luni. Ulterioram
spuscăvremsăavemoîncrederede90%.

43
Interpretare:
 Presupunem că am determinat pe baza unui eşantion că avem o
încredere de 90% că media de viaţă a unei baterii se situează în
intervalul ≈ 35 şi 37 de luni.

 Nu putem spune că avem o probabilitate de 0,90 ca durata medie


de viaţă a tuturor bateriilor să fie în acest interval.
 Vom spune că dacă selectăm mai multe eşantioane cu aceeaşi
dimensiune şi calculăm intervalele de predicţie pentru fiecare
eşantion, atunci în 90% din cazuri, media populaţiei va fi în
aceste intervale.
44
Dardacăavemcastandardîncercetareanoastrăun anumit
nivel de încredere față de care ne raportăm, cum
procedăm?

De exemplu:
 La un prag de semnificaţie de 95% determinaţi
intervalul de predicţie pentru durata de viaţă a unei
baterii.

45
Pentru exemplul nostru avem:

95%încredere
 Deci,1-α= 0,95
 α = 0,05
 α/2 = 0,025
 0,5-0,025= 0,475dinarie
 Îi corespundevaloarealui z=1,96 (cautamintabel)

46
Pentru exemplul
nostru valoarealui z a
fost determinatăîn funcție
de 0,475din aria
distribuției normale:

32
Forma generala a unui interval de
incredere pentru media unei populatii:

(𝑥ҧ ± 𝑧𝛼 × 𝜎𝑥ҧ )
2
In exemplul nostru:
(36 – 1.96 * 0,707 ; 36 + 1.96 * 0,707)
(34.614 ; 37.385)

In acest caz, avem o încredere de 95% că media de viaţă a unei


baterii se situează în intervalul 34.614 şi 37.385 luni.
Standard
Normal
Distribution
Table
2. Estimarea intervalului de încredere pentru
media unei populații – σ necunoscut

Exemplu:

O agenţie de asistenţă socială este interesată să estimeze valoarea medie anuală


a salariului a 700 de familii ce locuiesc în blocurile cu 4 etaje dintr-o
comunitate.

Este extras aleatoriu un eşantion de 50 de familii şi se determină că salariul


mediu este de 4800 lei şi abaterea standard de 950 lei.

Se consideră un prag de încredere de 90%.


2. Estimarea intervalului de încredere pentru
media unei populații – σ necunoscut

Avem:
 Dimensiunea eşantionului n = 50
 Media de selecţie 𝑥 = 4800
 Abaterea standard de selecţie s = 950 (Nu cunoaştem abaterea standard a
populaţiei, aşa că vom folosi abaterea standard a eşantionului)
 Dimensiunea populaţiei N = 700
 90% încredere
2. Estimarea intervalului de încredere pentru
media unei populații – σ necunoscut

Eroarea standard a populaţiei

 Avem o populaţie finită, 700 de familii, deci vom folosi următoarea formulă
pentru a calcula eroarea standard a mediei populaţiei finite:

𝜎 𝑁−𝑛
𝜎𝑥ҧ = ×
𝑛 𝑛−1

In exemplul nostru:
950 700−50
𝜎𝑥ҧ = × = 129.57 lei
50 50−1
2. Estimarea intervalului de încredere pentru
media unei populații – σ necunoscut

 90% încredere  z = 1,64


Intervalul de predicţie:
 (𝑥ҧ ± 𝑧 × 𝜎𝑥ҧ )
 (4800 − 1,64 ∗ 129,57 ; 4800 + 1,64 ∗ 129,57)
 (4587,50 ; 5012,50)

Cu o încredere de 90% putem estima că media anuală a câştigului celor 700 de


familii care locuiesc în blocurile cu 4 etaje este cuprinsă între 4587,50 şi 5012,50
lei.
Observatie!
 Pentru esantioanele cu un numar mai mic sau egal cu 30 se va utiliza
distributia t in locul distributiei normale de probabilitate, iar formula
generica pentru determinarea unui interval de incredere pentru media unei
populatii devine:

(𝑥ҧ ± 𝑡𝛼 × 𝜎𝑥ҧ )
2
De citit / vazut (optional):

Teorema limita centrala:

http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Probability/BS704_Probability12.html

https://www.simplypsychology.org/central-limit-theorem.html

https://www.statisticshowto.com/probability-and-statistics/normal-distributions/central-limit-
theorem-definition-examples/

http://math.etc.tuiasi.ro/rstrugariu/cursuri/SPD2014/c92014.pdf

https://www.youtube.com/watch?v=_YOr_yYPytM
Va multumesc!

33

S-ar putea să vă placă și