Sunteți pe pagina 1din 9

SEMINAR 22.04.

2021 STATISTICĂ Grupa 304

INFERENȚA STATISTICĂ

Analiza inferențială

Analiza statistică Analiza descriptivă (estimarea mediei


= + populației totale)

Tendință centrală
Mai multe valori: O singură valoare:
Variația Interval de Valoare ipotetică
încredere
Forma distribuției (Testarea ipotezelor
(Sondaj statistic) statistice)
Eșantion de volum redus (n<=30) Eșantion de volum mare (n>30)

Distribuția t (Student) Distribuția z (Distribuția normală redusă/standard)

Când n crește, Distribuția t se apropie de Distribuția normală redusă.

Pentru n= 30 cele două distribuții coincid

Sondajul statistic: (eroarea maximă/limită) Sondajul statistic: (eroarea maximă/limită)


∆𝑥̅ = 𝑧𝑐𝑟𝑖𝑡 ∙ 𝜎𝑥̅
∆𝑥̅ = 𝑡𝑐𝑟𝑖𝑡 ∙ 𝜎𝑥̅
𝑧𝑐𝑟𝑖𝑡 – din tabelul Distribuției z
𝑡𝑐𝑟𝑖𝑡 – din tabelul Distribuției t

Testarea ipotezei privind media unei populații Testarea ipotezei privind media unei populații
totale: totale:

Testul t: 𝑡𝑐𝑎𝑙𝑐 , 𝑡𝑐𝑟𝑖𝑡 Testul z: 𝑧𝑐𝑎𝑙𝑐 , 𝑧𝑐𝑟𝑖𝑡


Problema 1. Reprezentantul unei Camere de comerț locale susține că prețul mediu de vânzare al
unei case dintr-un oraș este de 90 mii EUR. Un agent imobiliar dorește să testeze această ipoteză
și selectează aleator 8 tranzacții imobiliare recente, înregistrând prețul de vânzare în cazul fiecărei
tranzacții. Datele sunt următoarele (mii EUR):
75 102 80 85 78 94 98 60

a) Determinați media și abaterea standard a setului de date. Verificați reprezentativitatea


mediei.
b) Estimați prețul mediu de vânzare al unei case din oraș, utilizând un interval de încredere
garantat cu o probabilitate de 90% (tcrit: 1,89). – sondaj in 3 pasi
c) Ar trebui agentul imobiliar să accepte ipoteza reprezentantului Camerei de Comerț, la
un nivel de semnificație de 10%? (tcrit: 1,89)
d) Dar dacă agentul imobiliar susține că prețul mediu de vânzare al unei case din oraș este
semnificativ mai mic (<) de 90 mii EUR, aveți suficiente motive să-i dați dreptate? (tcrit
= 1,41)

Rezolvare:

Populația totală: totalitatea tranzacțiilor imobiliare din acel oraș

Eșantionul: cele 8 tranzacții imobiliare selectate aleator

n=8 (volumul eșantionului)

n<30 eșantion de volum redus

Unitatea statistică: o tranzacție imobiliară

Variabila statistică (X): prețul de vânzare al caselor tranzacționate

̅̅̅̅ valorile variabilei


xi, 𝑖 = 1,8
∑ 𝑥𝑖 75+102 +⋯+60 672
a) 𝑥̅ = = = = 84 𝑚𝑖𝑖 𝐸𝑈𝑅
𝑛 8 8
∑(𝑥𝑖 − 𝑥̅ )2 (75 − 84)2 + (102 − 84)2 + ⋯ + (60 − 84)2
𝑠2 = = = 190
𝑛−1 8−1

𝑠 = √𝑠 2 = √190 = 13,78 mii EUR

13,78
𝑣= ∙ 100 = 16,4%<35% serie omogenă, medie reprezentativă
84

b) 1-α = 0,9 (nivel de incredere), α = 0,1 (nivel de semnificatie)


Estimarea mediei populației totale (µ) pe interval de încredere – PAȘI:
𝑠 13,78
Eroarea standard a mediei: 𝜎𝑥̅ = = = 4,87 mii EUR
√𝑛 √8
Eroarea maximă: ∆𝑥̅ = 𝑡𝑐𝑟𝑖𝑡 ∙ 𝜎𝑥̅ = 1,89 ∙ 4,87 = 9,2 mii EUR

Intervalul de încredere: 𝑥̅ − ∆𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + ∆𝑥̅

84 − 9,2 ≤ 𝜇 ≤ 84 + 9,2

74,8 ≤ 𝜇 ≤ 93,2 mii EUR

Estimăm – cu o probabilitate de 90% – că prețul mediu de vânzare al unei case din acel oraș este cuprins
între 74,8 și 93,2 mii EUR.

c) µ0 = 90 (valoarea ipotetică)

• Ipotezele:
H0: µ = µ0 → µ = 90 (afirmatia reprezentantului Camerei de Comert)

H1: µ ≠ µ0 → µ ≠ 90(<,>)

Alegerea testului statistic: testul t (student) bilateral (n<30)

• Valoarea calculată a testului statistic:


𝑥̅ − 𝜇0 𝑥̅ − 𝜇0 84 − 90 −6
𝑡𝑐𝑎𝑙𝑐 = = 𝑠 = = = −1,23
𝜎𝑥̅ ⁄ 𝑛 13,78 4,87
√ ⁄
√8

• Valoarea critică a testului: tcrit: 1,89 (dat în text)


• Se reprezintă 𝑡𝑐𝑎𝑙𝑐 și tcrit pe axa orizontală a următorului grafic și se compară:

-1,89 -1,23 0 1,89

Rr Rac Rr

• Regula de decizie: cum −𝑡𝑐𝑟𝑖𝑡 ≤ 𝑡𝑐𝑎𝑙𝑐 ≤ 𝑡𝑐𝑟𝑖𝑡 → 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝑎𝑐 → accept H0, reprezentantul
Camerei de Comerț are dreptate, în medie, o casă din oraș se vinde cu 90 mii EUR.

d) Ipotezele:
H0: µ = µ0 → µ = 90 (afirmatia reprezentantului Camerei de Comert)

H1: µ < µ0 → µ < 90 (afirmatia agentului imobiliar)

Alegerea testului statistic: testul t (student) unilateral stânga (TUS)

Valoarea calculată a testului statistic:

𝑡𝑐𝑎𝑙𝑐 = −1,23

Valoarea critică a testului: tcrit: 1,41 (dat în text)

Se reprezintă 𝑡𝑐𝑎𝑙𝑐 și tcrit pe axa orizontală a următorului grafic:

-1,41 -1,23 0

Rr Rac
Regula de decizie: cum 𝑡𝑐𝑎𝑙𝑐 ≥ −𝑡𝑐𝑟𝑖𝑡 → 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝑎𝑐 → accept H0, prețul mediu al unei case din
oraș nu diferă semnificativ de 90 mii EUR. Nu avem suficiente motive să-i dăm dreptate
agentului imobiliar, care susține că prețul mediu este semnificativ mai mic de 90 mii EUR.

Problema 2. Un specialist de la Oficiul pentru Protectia Consumatorului realizeaza un studiu pentru a


analiza satisfactia turistilor privind calitatea serviciilor oferite de unitatile hoteliere dintr-o statiune turistica.
El afirma ca in anul precedent s-au primit in medie 40 de reclamatii la un birou al Oficiului. Pentru testarea
acestei afirmatii, s-a inregistrat numarul de reclamatii primite la 6 dintre birourile Oficiului, selectate
aleator. In urma prelucrarii datelor, s-au obtinut urmatoarele rezultate:

Numar de reclamatii
Mean=Sum/Count xbar=270/6=45
Standard Error 𝜎𝑥̅ = 2.266
Standard Deviation s=5.55
Sample Variance s2=30.8
Sum 270
Count n=6
Confidence Level(90.0%) ∆𝑥̅ = 4.56

I. Putem estima cu o probabilitate de 90% ca in medie, la un birou al Oficiului, s-au primit intre
40 si 50 reclamatii (valoare critica: 2.015)
40.435 ≤ 𝜇 ≤ 49.565

II. Dorim sa testam afirmatia specialistului OPC, pentru un nivel de semnificatie de 10%. (alfa=0.1, nivel
de incredere=90%=0.9) (valoare critica: 2,015)
1. Valoarea ipotetica este: a) 40; b) 30.8; c) 6; d) 270; e) nu se poate determina.

2. Testul aplicat este:


a) Testul z unilateral dreapta;
b) Testul t bilateral;
c) Testul t unilateral stanga;
d) Testul z unilateral stanga;
e) Testul t unilateral dreapta.

3. Ipoteza nula si ipoteza alternativa sunt:

a) H0: µ = 270; H1: µ ≠ 270;


b) H0: µ < 400; H1: µ > 40;
c) H0: µ = 40; H1: µ ≠ 40;
d) H0: µ = 30.8; H1: µ > 30.8;
e) H0: µ = 40; H1: µ < 40;
4. Valoarea mediei esantionului, 𝑥̅ este: a) 40; b) 270; c) 60; d) 45; e) nu se poate determina
5. Eroarea standard a mediei este: a) 270; b) 30.8; c) 2.27; d) 16.67; e) 5.55
6. Valoarea calculata a testului este: a) 1.67; b) -1.67; c); 4.12; d) 2.2; e) 40.9
7. Concluzia aplicarii testului este:
a) Respingem afirmatia specialistului;
b) Numarul mediu de reclamatii primit la un birou al OPC anul trecut difera semnificativ de 40;
c) Acceptam afirmatia specialistului;
d) Numarul mediu de reclamatii primit la un birou al OPC anul trecut este 40;
e) Nu sunt suficiente informatii pentru a decide daca acceptam sau respingem afirmatia
specialistului.
III. Sa presupunem ca dorim sa testam daca numarul mediu de reclamatii primit la un birou al OPC anul
trecut a depasit semnificativ estimatia specialistului, pentru acelasi nivel de semnificatie. (valoare critica:
1,476)
a) Ipotezele nula si alternativa sunt: …………………………
H0: µ =40
H1: µ >40

b) Testul aplicat este : testul t unilateral dreapta (TUD)


c) Valoarea calculata a testului este: 2.207
d) Concluzia aplicarii testului este: respingem H0, acceptam H1, anul trecut s-au primit in medie, la
un birou al OPC mai mult de 40 de reclamatii.

Solutie:

Populatia: toate birourile OPC-ului


Esantionul: cele 6 birouri selectate aleator
Unitatea statistica: biroul (un birou)
Variabila statistica (X): numarul de reclamatii
µ0 = 40 (valoarea ipotetica)
n = 6 (volumul esantionului)
𝑡𝑐𝑟𝑖𝑡 = 2.015
n<30 esantion de volum redus, testul t

I. Sondajul statistic – estimarea mediei populatiei total (𝜇) folosind un interval de incredere

• Eroarea standard a mediei: 𝜎𝑥̅ = 2.266 reclamatii


• Eroarea maxima: ∆𝑥̅ = 𝑡𝑐𝑟𝑖𝑡 ∙ 𝜎𝑥̅ = 2.015 ∙ 2.266 = 4.56 reclamatii (se utilizeaza aceeasi
valoare critica ca cea de la testul bilateral)
• Intervalul de incredere: 𝑥̅ − ∆𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + ∆𝑥̅

45 − 4.565 ≤ 𝜇 ≤ 45 + 4.565

40.435 ≤ 𝜇 ≤ 49.565 reclamatii

II.

Ipotezele:

H0: µ = 40 ipoteza nula (afirmatia specialistului)

H1: µ ≠ 40 (µ<40 or µ>40) ipoteza alternativa

Testul t bilateral:
𝑥̅ − 𝜇0 𝑥̅ − 𝜇0
𝑡𝑐𝑎𝑙𝑐 = = 𝑠
𝜎𝑥̅ ⁄ 𝑛

Rezultate esantion:

∑ 𝑥𝑖 𝑆𝑢𝑚 270
𝑥̅ = = 𝐶𝑜𝑢𝑛𝑡 = = 45 𝑟𝑒𝑐𝑙𝑎𝑚𝑎𝑡𝑖𝑖 (media esantionului)
𝑛 6

𝑠 2 = 30.8 (dispersia esantionului)

𝑠 = √𝑠 2 = √30.8 = 5.55 𝑟𝑒𝑐𝑙𝑎𝑚𝑎𝑡𝑖𝑖 (abaterea standard a esantionului)

𝐸𝑟𝑜𝑎𝑟𝑒𝑎 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑎 𝑚𝑒𝑑𝑖𝑒𝑖 (𝑒𝑟𝑜𝑎𝑟𝑒𝑎 𝑚𝑒𝑑𝑖𝑒 𝑑𝑒 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑖𝑡𝑎𝑡𝑒)


𝑠 5.55
𝜎𝑥̅ = = = 2.266
√𝑛 √6

𝑥̅ − 𝜇0 𝑥̅ − 𝜇0 45 − 40 5
𝑡𝑐𝑎𝑙𝑐 = = 𝑠 = = = 2.207
𝜎𝑥̅ ⁄ 𝑛 2.266 2.266

Nr. reclamatii

Mean 45
Standard Error 2.266
Median 43.5
Mode #N/A
Standard Deviation 5.550
Sample Variance 30.8
Kurtosis 1.851
Skewness 1.390
Range 15
Minimum 40
Maximum 55
Sum 270
Count 6
Confidence Level(90.0%) 4.565

= STANDARDIZE (x, mean, standard_dev)


unde x=𝑥̅ ; mean=𝜇0 ; standard_dev=𝜎𝑥̅
=standardize (45,40,2.266) → afiseaza 2.207

-2,015 0 2.015 2.207

Rr Racc Rr

𝑡𝑐𝑎𝑙𝑐 > 𝑡𝑐𝑟𝑖𝑡 → 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝑟 → respingem H0, acceptam H1, media populatiei totale difera semnificativ
de 40 – afirmatia specialistului nu este adevarata (adica nu avem suficiente motive sa ii acceptam
afirmatia, ci s-o respingem, ceea ce inseamna ca noi credem ca nu este adevarata), anul trecut s-a
primit nu numar mediu diferit de 40 de reclamatii, la un birou al OPC (rezultat garantat cu o
probabilitate de 90%).

III.

Testul t unilateral dreapta

H0: µ=40

H1: µ>40

𝑡𝑐𝑎𝑙𝑐 = 2.207
𝑡𝑐𝑟𝑖𝑡 = 𝑡𝛼;𝑛−1 = 𝑡0.1;5 = 1.476

1-α=0.9

0 1,476 2.207

Rac Rr

𝑡𝑐𝑎𝑙𝑐 > 𝑡𝑐𝑟𝑖𝑡 → 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝑟 → respingem H0, acceptam H1, media populatiei totale este semnificativ
mai mare de 40 – deci anul trecut s-au primit in medie, la un birou al OPC mai mult de 40 de
reclamatii.

S-ar putea să vă placă și