Sunteți pe pagina 1din 8

SEMINAR TIS

Aplicații rezolvate și propuse

1. Testarea ipotezei privind media populației pentru eșantioane de volum mare (Testul Z)
1. Conducerea Direcției Regim Permise de Conducere și Înmatriculare a Vehiculelor din București dorește să
fluidizeze servirea persoanelor care solicită un anumit serviciu. Din analize anterioare se cunoaște că timpul de
servire a este normal distribuit, de medie 130 de minute și abatere standard 15 minute. Conform informațiilor
actualizate, conducerea instituției se îndoiește de faptul că timpul mediu de servire a unei persoane este de 130
minute. Pentru a studia această problemă, se înregistrează timpii de servire pentru un eșantion aleator de 100 de
persoane. Timpul mediu obținut în eșantion este 120 minute. Poate conducerea instituției să concluzioneze, pentru
o probabilitate de 95%, că timpul mediu este diferit de 130 minute?
Ipotezele testate sunt:
𝐻 : 𝜇 = 𝜇0 = 130
{ 0
𝐻1 : 𝜇 ≠ 𝜇0 = 130
Trebuie, așadar, să răspundem la întrebarea: „Este media de 120 minute suficient de diferită de valoarea 130,
pentru a ne permite să concluzionăm că media populației nu este egală cu 130 minute?”
Vom putea să respingem ipoteza nulă dacă media eșantionului este suficient de diferită, relativ la valoarea 130.
Dar, interpretările nu sunt evidente. Dacă în eșantion obțineam media 1300 sau 13 atunci diferențele erau clare.
De asemenea, dacă media eșantionului era 130,5 atunci egalitatea era și ea evidentă.
Fiind vorba de un eșantion de volum mare, distribuția de eșantionare a mediei 𝑥̄ este normală, cu media 𝜇 și
abaterea standard 𝑠/√𝑛 și vom utiliza testul z:
𝑥 − 𝜇0 𝑥̄ − 𝜇0 𝑥̄ − 130 𝑥̄ − 130 120 − 130
𝑧= = = = = = −6,67
𝑠𝑥 𝑠/√𝑛 15/√100 1,5 1,5
Regiunea critică, de respingere a ipotezei nule, pentru testul bilateral este:
𝑧 < −𝑧𝛼⁄2 sau 𝑧 > 𝑧𝛼⁄2 .
Valoarea critică a testului 𝑧𝛼/2 = 𝑧0.025 = 1,96
Întrucât 𝑧 = −6,67 < −1,96 = 𝑧0.025, rezultă că sunt suficiente dovezi pentru a respinge ipoteza nulă H0 și a
accepta ipoteza alternativă, aceea că timpul mediu de servire a unei persoane este diferit de 130 minute.
2. (TEMA) Un producător de ceapă preambalează produsul în saci ce trebuie să aibă, în medie, 15 kg.
El dorește să verifice corectitudinea ambalării și selectează aleator 100 de saci, înregistrează
datele și obține că greutatea medie a sacilor este de 14,45 kg, cu o abatere standard de 0,8 kg.
Să se testeze, pentru o probabilitate de 95%, dacă greutatea sacilor diferă semnificativ de
greutatea solicitată.
3. (TEMA) Un producător de dulciuri ambalează bomboane pentru bradul de Crăciun în pungi cu o
greutate medie de 1.5 kg. Pentru a verifica dacă greutatea pungilor este diferită de această valoare
selectează aleator 120 de pungi, pentru care obține: greutatea totală a celor 120 de pungi este
194,5 kg, iar eroarea standard a greutății medii a pungilor la nivelul eșantionului este egală cu
0,025. Să se analizeze rezultatul obținut pentru o probabilitate de 95%.

1
2. Testarea ipotezei privind media populației pentru eșantioane de volum redus (Testul t)
1. În scopul creșterii producției, o fermă pomicolă aplică un nou fertilizator, în cinci dintre livezile de cireși ale
fermei, livezi ce au aceeași suprafață. Producția înregistrată după aplicarea fertilizatorului este: 2,60; 3,32; 1,80;
3,43; 2,00 (mii kg.). Știind că producția medie la nivelul celor 5 livezi în anul anterior a fost de 2,01 mii kg, sunt
suficiente dovezi pentru a concluziona că recolta medie obținută după aplicarea fertilizatorului este semnificativ
mai mare față de producția anului anterior, pentru un nivel de încredere de 5%?
∑5𝑖=1 𝑥𝑖
Producția medie obținută după aplicarea fertilizatorului este 𝑥 = 𝑛
2,63 mii kg.,
∑5𝑖=1 ∑(𝑥𝑖 −𝑥)2 2,203
cu dispersia 𝑠𝑥2 = 𝑛−1
= 4
= 0,5507

și abaterea standard: 𝑠𝑥 = √𝑠𝑥2 = 0,74 mii kg.


Ipotezele testate sunt:
𝐻0 : 𝜇 = 𝜇0 = 2,01kg
{
𝐻1 : 𝜇 > 𝜇0 = 2,01 kg, (test unilateral dreapta)
Testul utilizat, în ipoteza distribuției normale a populației din care a fost extras eșantionul în raport cu producția,
este:
𝑥−𝜇0 𝑥−𝜇0 2,63−2,01
𝑡= = = = 1,874
𝑠𝑥 𝑠𝑥 ⁄√𝑛 0,74/√5

Valoarea critică a testului pentru un nivel de semnificație de 5% și un 4 grade de libertate este 2,132. Regiunea
critică este dată de t>tα,n-1.
Cum 𝑡 = 1,874 < 𝑡0,05;4 = 2,132, nu putem concluziona că producția obținută după aplicarea fertilizatorului este
semnificativ mai mare decât producția anului anterior de 2,01 mii kg.
2. (TEMA) Numărul mediu de flori culese de pe o unitate de arie, într-o seră, este de 425 fire.
Pentru a verifica eficacitatea unui nou îngrășământ granulat, aplicat pe 7 unități de arie, au fost
înregistrate date referitoare la producția de flori. Pe baza datelor înregistrate s-a determinat un
număr mediu de 438 fire/unitate de arie, cu o dispersie de 400. Știind că distribuția recoltei de
flori pe unitate de arie este aproximativ normală, pentru un nivel de semnificație de 2% se poate
concluziona că în urma aplicării îngrășământului granulat s-a obținut o creștere semnificativă a
producție?
3. (TEMA) Managerul unui magazin alimentar depozitează într-o încăpere lădițe cu ciuperci de
1 kg. Pentru a verifica dacă încăperea prezintă condiții optime pentru a împiedica deshidratarea
acestora, rezultând astfel o pierdere în greutate, acesta decide să testeze, după 3 zile de
depozitare, greutatea a 10 lădițe. În urma prelucrării datelor s-au obținut următoarele date:
greutatea medie a lădițelor după 3 zile de depozitare este de 0,94 kg., cu o eroare standard de
0,03. Presupunând că greutatea lădițelor este o variabilă normal repartizată testați dacă condițiile
de depozitare sunt optime, pentru o probabilitate de 99% de garantare a rezultatelor.

2
3. Testarea ipotezei privind proporția (media variabilei alternative) - (Testul Z)
1. Un târg de prezentare a echipamentelor agricole este considerat de succes dacă cel puțin 12% dintre vizitatori
încheie un contract de achiziție a unui echipament. A fost selectat un eșantion de 400 de vizitatori ai târgului
internațional de produse și echipamente în domeniul agriculturii INDAGRA, ediția 2018 și s-a constatat că 56
dintre aceștia au încheiat un contract pentru achiziția unui echipament agricol. Pentru o probabilitate de 99%
poate fi considerată ediția 2018 a târgului INDAGRA un succes?
Ipotezele testate sunt:
𝐻 : 𝑝 = 𝑝0 = 0,12
{ 0
𝐻1 : 𝑝 > 𝑝0 = 0,12, (test unilateral dreapta)
Testul statistic este:
𝑓 − 0,12 0,14 − 0,12 0,02
𝑧= = = = 1,15
√𝑓(1 − 𝑓)/𝑛 √0,14 ⋅ 0,86/400 0,017

Cum 𝑧𝛼 = 𝑧0.01 = 2,33 și 𝑧 < 𝑧𝛼 , rezultă că nu ne aflăm în regiunea critică (Rc), nu avem suficiente dovezi să
respingem ipoteza nulă (𝐻0 ), deci procentul nu este mai mare de 12%.

2. Un lot de 200 de sticle de băuturi răcoritoare este supus unui control de calitate. Lotul este declarat
necorespunzător dacă mai mult de 3% dintre sticle nu respecta compoziția prestabilită de producător. În urma
verificării, 7 sticle sunt găsite ca necorespunzătoare. Oferă aceste informații suficiente dovezi ca întregul lot să
fie declarat “necorespunzător“ ? Utilizați o probabilitate de 95% de garantare a rezultatelor.
𝑛 = 200, (𝑛 > 30)
𝑝0 = 3% = 0.03
𝑚 7
𝑚=7⟹𝑓= = = 0,035 (3,5%)
𝑛 200
𝑃 = 95% → 𝛼 = 5% = 0,05

Ipotezele statistice sunt:


𝐻 : 𝑝 = 𝑝0 = 0,03
{ 0
𝐻1 : 𝑝 > 𝑝0 = 0,03, (test unilateral dreapta)

Testul statistic este:


𝑓 − 𝑝0 0,035 − 0,03 0,005
𝑧= = = = 0,385
√𝑓(1 − 𝑓)/𝑛 √0,035 ⋅ 0,965/200 0,013

Cum 𝑧𝛼 = 𝑧0.05 = 1,645 și 𝑧 < 𝑧𝛼 , rezultă că acceptăm 𝐻0 - pentru un nivel de încredere de 95%, nu ne aflăm
în regiunea critică (Rc), adică nu avem suficiente dovezi ca întregul lot să fie declarat necorespunzător.

3. (TEMA) Un producător din industria textilă, ce confecționează pantaloni pentru bărbați, dorește să
verifice dacă procentul produselor identificate cu defecte în urma controlului calitativ este mai mic de
5%. În urma cercetării realizate pe un eșantion aleator de 300 de perechi de pantaloni, au fost găsite 13
perechi de pantaloni cu defecte. Oferă aceste informații suficiente dovezi că procentul pantalonilor cu
defecte este mai mic de 5%? Utilizați o probabilitate de 99% de garantare a rezultatelor.

3
4. Testarea ipotezei privind egalitatea dintre două medii (eșantioane volum mare)
1. Pentru a verifica dacă între două mărci de autoturisme nu există diferențe semnificative privind cheltuielile de
întreținere a fost selectat un eșantion de 80 persoane care dețin unul dintre cele două mărci. După înregistrarea
cheltuielilor de întreținere anuală și prelucrarea datelor s-au obținut următoarele rezultate sintetice:
Marca 1 Marca 2
n1=35 pers. n2=45 pers.
Cheltuiala medie = 580 Euro Cheltuiala medie = 430 Euro
Abaterea standard a cheltuielilor = 75 Euro Abaterea standard a cheltuielilor = 50 Euro
Pentru un nivel de semnificație de 5% să se testeze ipoteza din enunțul problemei.
𝑛1 = 35, (𝑛 > 30) 𝑛2 = 45, (𝑛 > 30)
𝑥1 = 580 euro 𝑥2 = 430 euro
𝑠1 = 75 euro 𝑠2 = 50 euro
𝛼 = 5% = 0,05

Ipotezele statistice sunt:


𝐻 : 𝜇 = 𝜇2 , (𝜇1 − 𝜇2 = 0)
{ 0 1
𝐻1 : 𝜇1 ≠ 𝜇2

-1,96 0 +1,96 10,2


Testul statistic este:
(𝑥1 − 𝑥2 ) − (𝜇1 − 𝜇2 ) (𝑥1 − 𝑥2 ) − 0 580 − 430 150
𝑧𝑐𝑎𝑙𝑐 = = = = = 10.2
2 2 14.7
𝑠2 𝑠2 𝑠2 𝑠2 √75 + 50
√ 1+ 2 √ 1+ 2 35 45
𝑛1 𝑛2 𝑛1 𝑛2

𝑧𝑐𝑎𝑙𝑐 ∈ 𝑅𝑐 → resping 𝐻0 (se acceptă 𝐻1 ), pentru o 𝑃 = 95% există diferențe semnificative statistic privind
cheltuielile de întreținere.

2. (TEMA) Pentru două eșantioane de studenți, unul de fete și altul de băieți, au fost înregistrate date
referitoare la nota obținută la matematică. Pe baza datelor înregistrate s-au obținut următoarele rezultate
sintetice:
Eșantion Nr. studenți Nota medie Abaterea standard a notelor
Fete 30 7,27 1,15
Băieți 40 6,84 1,57

Oferă aceste date suficiente informații pentru a accepta ipoteza conform căreia nu există diferențe
semnificative statistic între rezultatele obținute de studenți, în funcție de genul acestora? Utilizați un nivel
de semnificație de 2%.

4
4`. Testarea ipotezei privind egalitatea dintre două medii (testul t) - rezolvare folosind EXCEL
1. Unul dintre furnizorii de top de semințe certificate de porumb afirmă că prin cultivarea hibrizilor tardivi se
obțin producții mult mai mari decât prin cultivarea hibrizii semitardivi. Directorul unei companii din domeniul
agricol care dorește să-și axeze activitate pe cultivarea porumbului de consum este interesat de corelarea
potențialului genetic al hibrizilor cu perioada de vegetație. Pentru a verifica afirmația furnizorului de semințe
realizează un studiu pe două eșantioane de producători (25 de producători selectați aleator care cultivă hibrizi
tardivi și 25 de producători care cultivă hibrizi semitardivi) și înregistrează producția medie la hectar obținută în
anul precedent. Directorul dorește să afle dacă, pentru un nivel de semnificație de 5%, producția obținută prin
utilizarea celor două tipuri de hibrizi diferă semnificativ. Datele înregistrate sunt:
Producția medie la hectar (tone/ha)
Hibrizi tardive (HT): 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0; 7,1; 6,1; 5,0; 6,3; 7,0;
6,4; 6,1; 6,6; 7,7; 6,4
Hibrizi semitardivi (HST):5,2; 6,7; 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1; 5,8; 7,0;
5,7; 5,9; 4,9; 5,3; 4,2; 7,1
Rezolvare:
Ipotezele testate sunt:
𝐻 : 𝜇 = 𝜇2 sau 𝜇1 − 𝜇2 = 𝑑
{ 0 1
𝐻1 : 𝜇1 ≠ 𝜇2 sau 𝜇1 − 𝜇2 ≠ 𝑑

Pentru a putea identifica testul ce trebuie aplicat se vor calcula și compara abaterile standard ale celor două
eșantioane. După introducerea datelor pe două coloane, din modulul Data Analysis se alege Descriptive Statistics:

HT HST
Output-ul obținut este:
Mean 6.288 Mean 6.016
Standard Error 0.184 Standard Error 0.228
Median 6.3 Median 5.9
Mode 5 Mode 5.9
Standard Deviation 0.921 Standard Deviation 1.1415
Sample Variance 0.848 Sample Variance 1.3031
Kurtosis -0.761 Kurtosis -0.3736
Skewness -0.096 Skewness 0.1042
Range 3.3 Range 4.3
Minimum 4.6 Minimum 4.2
Maximum 7.9 Maximum 8.5
Sum 157.2 Sum 150.4
Count 25 Count 25
Deoarece abaterile standard sunt aproximativ egale (𝑠1 = 0,921 ș𝑖 𝑠2 = 1,14) iar cele două eșantioane au un
volum redus, se aplică testul t pentru dispersii egale (în ipoteza că populațiile din care au fost extrase
eșantioanele au o distribuție normală în raport cu variabila producția medie la hectar).
Rezolvarea problemei se poate face utilizând EXCEL:

5
După introducerea datelor pe două coloane, din modulul Data Analysis se alege t-Test: Two-Sample Assuming
Equal Variances, se specifică variabilele și diferența ipotetică testată dintre mediile celor două eșantioane (d=0,
adică Hypothesized Mean Difference=0):

t-Test: Two-Sample Assuming Equal Variances

HT HST
Mean 6.288 6.016
Variance 0.848 1.303
Observations 25 25
Pooled Variance 1.075
Hypothesized Mean Difference (d) 0
Se obțin rezultatele: df (grade de libertate ) 48
t Stat 0.927
P(T<=t) one-tail 0.179
t Critical one-tail 1.677
P(T<=t) two-tail 0.358
t Critical two-tail 2.011

Valoarea calculată a testului t este 0.927.


Valoarea critică a testului t (test bilateral) este 2,01, mai mare decât valoarea calculată. Concluzia este că nu există
motive suficiente pentru a respinge ipoteza nulă, pentru un nivel de încredere de 95%. Așadar afirmația
producătorului de semințe nu este susținută de rezultatele cercetării, producția medie la hectar nu diferă
semnificativ între cele două tipuri de hibrizi.
Nivelul de semnificație observat p este 0,358 în cazul testului bilateral, mai mare decât nivelul de semnificație
stabilit 𝛼 = 0,05. Se observă că mediile diferă semnificativ doar pentru o probabilitate de aproximativ 64% (adică
(1 − 𝑝) ∗ 100).
OBSERVATIE
De regula, testarea ipotezei privind egalitatea dintre doua medii, in cazul eșantioanelor de volum redus, trebuie
precedata de testarea ipotezei privind egalitatea dintre doua dispersii.
2. Directorul unei companii pentru fabricarea mobilei de birou, crede ca productivitatea lucrătorilor
depinde, printre altele și de succesiunea operațiilor pe care trebuie sa le execute muncitorul. Pentru
producerea unui birou ergonomic sunt considerate două variante de realizarea a acestuia (din punctul de
vedere al succesiunii operațiilor). Pentru a decide care variantă este mai bună au fost selectați aleator 50
de muncitori care asamblau birouri și au fost înregistrați timpii de asamblare.

Timpii de asamblare (ore)


Varianta A 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0;
7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4; 5,2; 6,7
Varianta B 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1;
5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1
Directorul dorește să afle dacă pentru un nivel de semnificație de 5%, timpii de asamblare în cele două
variate diferă.

6
5. Testarea ipotezei privind dispersia unei populații
Pentru a dimensiona cantitatea de legume proaspete livrate zilnic la o piață dintr-un cartier bucureștean, un
producător agricol dorește să cunoască cantitatea medie vândută, dar mai ale să știe dacă variația medie a cantității
vândute, pentru un anumit produs, este mai mare de 10 kg. Pentru 10 zile consecutive au fost înregistrate date
referitoare la vânzările înregistrate: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66 kg. Se cunoaște că cererea pentru
respectivul produs are o distribuție normală. Să se testeze pentru o probabilitate de 95% dacă variația cantității
cerute este mai mare de 10 kg.
Ipotezele testate sunt:
𝐻 : 𝜎 2 = 100
{ 0 2
𝐻1 : 𝜎 > 100
Abaterea standard în eșantion este de 13,85 kg, iar dispersia 𝑠 2 = 191,8.
Valoarea calculată a testului statistic este:
(𝑛 − 1)𝑠 2 1726
𝜒2 = = = 17,26
𝜎2 100
2 2
Valoarea critică a testului este 𝜒𝛼,𝑛−1 = 𝜒0.05,9 = 16,92,
2
Deoarece 𝜒 2 > 𝜒𝛼,𝑛−1 vom respinge ipoteza nulă și vom accepta ipoteza alternativă, conform căreia, adică
abaterea cantității cerute este semnificativ mai mare de 10 kg.

7
6. Elemente de analiză dispersională (ANOVA)
Aplicație Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are următoarele
avantaje față de vechiul produs: este mai practic de utilizat, are o calitate cel puțin la fel de bună și cost semnificativ mai mic.
Pentru a decide pe care dintre cele trei avantaje să-și axeze strategia de marketing, directorul acestui departament a realizat
un studiu în trei orașe.
În orașul A campania de publicitate s-a axat pe ușurința de utilizare a noului produs.
În orașul B campania de publicitate s-a axat pe calitatea noului produs.
În orașul C campania de publicitate s-a axat pe prețul mai mic al noului produs.
În toate cele 3 orașe s-a înregistrat numărul de bucăți vândute în 20 de săptămâni.
Directorul de marketing ar dori să știe dacă există diferențe semnificative între numărul de bucăți vândute, în medie pe
săptămână, în cele trei orașe după terminarea campaniei de publicitate.
Ușurința 529 658 793 514 663 719 711 606 461 529
folosirii: 498 663 604 495 485 557 353 557 542 614
804 630 774 717 679 604 620 697 706 615
Calitate:
492 719 787 699 572 523 584 634 580 624
672 531 443 596 602 502 659 689 675 512
Preț:
691 733 698 776 561 572 469 581 679 532
Ipotezele ce trebuie testate sunt:
H0: μ1 = μ2 = μ3 cu alternativa
H1: cel puțin două medii sunt diferite.
Rezolvare folosind EXCEL:
1. Introduceți datele astfel:
- în A1 tastați „Ușurința folosirii”, în B1 tastați „Calitate“, în C1 tastați „Preț“
- datele se introduc pe coloane.
2. Apăsați Tools-Data Analysis și ANOVA: Single Factor.
3. La Input Range selectați datele (sau scrieți A1:C21). Selectați Labels in First Row.
4. Specificați Grouped by Columns. Apăsați OK.
Se obțin rezultatele:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Ușurința folosirii 20 11551 577.55 10775
Calitate 20 13060 653 7238.11
Preț 20 12173 608.65 8670.24
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 57512.23 2 28756.12 3.233 0.047 3.159
Within Groups 506983.5 57 8894.447

Total 564495.7 59

În tabelul SUMMARY sunt trecute datele referitoare la cele trei populații:


- numărul de unități din fiecare populație: 20 de săptămâni;
- numărul total de bucăți vândute în această perioadă pentru fiecare populație;
- numărul mediu de bucăți vândute în fiecare săptămână pentru fiecare populație;
- dispersia populațiilor.
Din aceste date observăm că cea mai mare vânzare medie a fost în orașul B în care publicitatea a avut ca argument principal
calitatea superioară a noului produs.
Cea mai mică medie și cea mai mare dispersie (împrăștiere a datelor) s-a înregistrat în Orașul A unde publicitatea a pus accent
pe ușurința folosirii noului produs.
În tabelul ANOVA este calculată Statistica F = 3,233 cu o valoare p egală cu 0,047 (pragul de semnificație). Această valoare
p ne permite să spunem că cel puțin două medii diferă semnificativ (cu o probabilitate de 95%), ceea ce însemnă că tactica
aleasă pentru promovarea produsului influențează valoarea vânzărilor.

S-ar putea să vă placă și