Sunteți pe pagina 1din 6

Seminar 7, 8, 9

TESTAREA IPOTEZELOR STATISTICE


APLICATII REZOLVATE

Aplicația 1. Conducerea Direcției Regim Permise de Conducere și Înmatriculare a Vehiculelor din București
dorește să fluidizeze servirea persoanelor care solicită un anumit serviciu. Din analize anterioare se cunoaște
că timpul de servire a este normal distribuit, de medie 130 de minute și abatere standard 15 minute. Conform
informațiilor actualizate, conducerea instituției se îndoiește de faptul că timpul mediu de servire a unei
persoane este de 130 minute. Pentru a studia această problemă, se înregistrează timpii de servire pentru un
eșantion aleator de 100 de persoane. Timpul mediu obținut în eșantion este 120 minute. Poate conducerea
instituției să concluzioneze, pentru o probabilitate de 95%, că timpul mediu este diferit de 130 minute?
Rezolvare:
Ipotezele testate sunt:
H 0 :   130
H1 :   130
Trebuie, așadar, să răspundem la întrebarea: “Este media de 120 minute suficient de diferită de valoarea 130,
pentru a ne permite să concluzionăm că media populației nu este egală cu 130 minute?”
Vom putea să respingem ipoteza nulă dacă media eșantionului este suficient de diferită, relativ la valoarea
130. Dar, interpretările nu sunt evidente. Dacă în eșantion obțineam media 1300 sau 13 atunci diferențele erau
clare. De asemenea, dacă media eșantionului era 130,5 atunci egalitatea era și ea evidentă.
Fiind vorba de un eșantion de volum mare, distribuția de eșantionare a mediei x este normală, cu media  și
abaterea standard s / n și vom utiliza testul z:
x  130 x  130 120  130
z    6,67 .
15 / 100 1,5 1,5
Regiunea critică, de respingere a ipotezei nule, pentru testul bilateral este: z   z 2 sau z  z 2 .
Valoarea critică a testului z / 2  z0.025  1.96
Întrucât z  6,67  1.96  z0.025 , rezultă că sunt suficiente dovezi pentru a respinge ipoteza nulă H0 și a
accepta ipoteza alternativă, aceea că timpul mediu de servire a unei persoane este diferit de 130 minute.

Aplicația 2. În scopul creșterii producției, o fermă pomicolă aplică un nou fertilizator, în cinci dintre livezile
de cireși ale fermei, livezi ce au aceeași suprafață. Producția înregistrată după aplicarea fertilizatorului este:
2,60; 3,32; 1,80; 3,43; 2,00 (mii kg.). Știind că producția medie la nivelul celor 5 livezi în anul anterior a fost
de 2,01 mii kg, sunt suficiente dovezi pentru a concluziona că recolta medie obținută după aplicarea
fertilizatorului este semnificativ mai mare față de producția anului anterior, pentru un nivel de încredere de
5%?

Rezolvare:
Producția medie obținută după aplicarea fertilizatorului este x  2,63 mii kg., cu dispersia:
 x 
2
x 2,203
s 2
 i
 0,5507 și abaterea standard: s x  s x2  0,74 mii kg.
n 1
x
4
Ipotezele testate sunt:
H0: μ = 2,01
H1: μ > 2,01 (test unilateral dreapta).

Testul utilizat, în ipoteza distribuției normale a populației din care a fost extras eșantionul în raport cu
x x 2,63  2,01
producția, este t     1,874 . Valoarea critică a testului pentru un nivel de
sx sx n 0,74 / 5
semnificație de 5% și un 4 grade de libertate este 2,132. Regiunea critică este dată de t>tα,n-1.
Cum t=1,874< t0,05;4=2,132, nu putem concluziona că producția obținută după aplicarea fertilizatorului este
semnificativ mai mare decât producția anului anterior de 2,01 mii kg.

Aplicația 3. Un târg de prezentare a echipamentelor agricole este considerat de succes dacă cel puțin 12%
dintre vizitatori încheie un contract de achiziție a unui echipament. A fost selectat un eșantion de 400 de
vizitatori ai târgului internațional de produse și echipamente în domeniul agriculturii INDAGRA, ediția 2016
și s-a constatat că 56 dintre aceștia au încheiat un contract pentru achiziția unui echipament agricol. Pentru o
probabilitate de 99% poate fi considerată ediția 2016 a târgului INDAGRA un succes?
Răspuns:
Ipotezele sunt:
H 0 : p  0,12
H1 : p  0,12 (test unilateral dreapta).
f  0,12 0,14  0,12 0,02
Testul statistic este: z     1,15 .
f (1  f ) / n 0,14  0,86 / 400 0,017
Cum z  z0.01  2,33 și z  z , rezultă că nu ne aflăm în regiunea critică (Rc), nu avem suficiente dovezi să
respingem ipoteza nulă, deci procentul nu este mai mare de 12%.

Aplicația 4. Unul dintre furnizorii de top de semințe certificate de porumb afirmă că prin cultivarea hibrizilor
tardivi se obțin producții mult mai mari decât prin cultivarea hibrizii semitardivi. Directorul unei companii din
domeniul agricol care dorește să-și axeze activitate pe cultivarea porumbului de consum este interesat de
corelarea potențialului genetic al hibrizilor cu perioada de vegetație. Pentru a verifica afirmația furnizorului
de semințe realizează un studiu pe două eșantioane de producători (25 de producători selectați aleator care
cultivă hibrizi tardivi și 25 de producători care cultivă hibrizi semitardivi) și înregistrează producția medie la
hectar obținută în anul precedent. Directorul dorește să afle dacă, pentru un nivel de semnificație de 5%,
producția obținută prin utilizarea celor două tipuri de hibrizi diferă semnificativ. Datele înregistrate sunt:
Producția medie la hectar (tone/ha)
Hibrizi tardivi: 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0; 7,1; 6,1; 5,0; 6,3; 7,0; 6,4;
6,1; 6,6; 7,7; 6,4
Hibrizi semitardivi:5,2; 6,7; 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1; 5,8; 7,0; 5,7;
5,9; 4,9; 5,3; 4,2; 7,1

Rezolvare:
Ipotezele testate sunt:
H 0 : 1   2 sau 1   2  d
H1 : 1  2 sau 1  2  d
Pentru a putea identifica testul ce trebuie aplicat se vor calcula și compara standard ale celor două eșantioane:
s1 = 0,921 și s2 = 1,14. Deoarece abaterile standard sunt aproximativ egale (se poate aplica un test statistic
pentru testarea egalității dintre dispersii), iar cele două eșantioane au un volum redus, se aplică testul t pentru
dispersii egale (în ipoteza că populațiile din care au fost extrase eșantioanele au o distribuție normală în raport
cu variabila producția medie la hectar).

Rezolvarea problemei se poate face utilizând EXCEL:


După introducerea datelor pe două coloane, din modulul Data Analysis se alege t-Test: Two-Sample
Assuming Equal Variances, se specifică variabilele și diferența ipotetică testată dintre mediile celor două
eșantioane (d=0, adică Hypothesized Mean Difference=0)
Se obțin rezultatele:
t-Test: Two-Sample Assuming Equal Variances

Varianta A Varianta B
Mean 6.288 6.016
Variance 0.8477667 1.30306667
Observations 25 25
Pooled Variance 1.0754167
Hypothesized Mean Difference 0
Df 48
t Stat 0.9273326
P(T<=t) one-tail 0.1791967
t Critical one-tail 1.6772242
P(T<=t) two-tail 0.3583935
t Critical two-tail 2.0106336

Valoarea calculată a testului t este 0,927.


Valoarea critică a testului t (test bilateral) este 2,01, mai mare decât valoarea calculată. Concluzia este că nu
există motive suficiente pentru a respinge ipoteza nulă, pentru un nivel de încredere de 95%. Așadar afirmația
producătorului de semințe nu este susținută de rezultatele cercetării, producția medie la hectar nu diferă
semnificativ între cele două tipuri de hibrizi.
Nivelul de semnificație observat p este 0,358 în cazul testului bilateral, mai mare decât nivelul de semnificație
stabilit   0.05 . Se observă că mediile diferă semnificativ doar pentru o probabilitate de aproximativ 64%
(adică 1-p).

Aplicația 5. Pentru a dimensiona cantitatea de legume proaspete livrate zilnic la o piață dintr-un cartier
bucureștean, un producător agricol dorește să cunoască cantitatea medie vândută, dar mai ale să știe dacă
variația medie a cantității vândute, pentru un anumit produs, este mai mare de 10 kg. Pentru 10 zile consecutive
au fost înregistrate date referitoare la vânzările înregistrate: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66 kg. Se cunoaște
că cererea pentru respectivul produs are o distribuție normală. Să se testeze pentru o probabilitate de 95% dacă
variația cantității cerute este mai mare de 10 kg.
Rezolvare:
Ipotezele testate sunt:
H 0 :  2  100 ,
H 1 :  2  100 .
Abaterea standard în eșantion este de 13,85 kg, iar dispersia s 2  191,8 .
Valoarea calculată a testului statistic este:
(n  1) s 2 1726
2    17 ,26
2 100
Valoarea critică a testului este 2,n1   02.05,9  16,92 ,
Deoarece    ,n1 vom respinge ipoteza nulă și vom accepta ipoteza alternativă, conform căreia, adică
2 2

abaterea cantității cerute este semnificativ mai mare de 10 kg.

Aplicația 6. A fost realizat un studiu pentru identificarea principalilor factori ce influențează tipul de turism (extern
sau intern) preferat de clienții unei agenții. Unul dintre factorii identificați îl reprezintă variabilitatea veniturilor.
Știind că distribuția veniturilor (mii lei) în cele două populații analizate (populația clienților ce preferă turismul
extern, respectiv cea a clienților ce prefer turismul intern) este aproximativ normală, au fost selectate două
eșantioane, de volum 60, respective 50 de persoane. Abaterile standard ale veniturilor (mii lei) sunt: s1  2,84 și
s2  1,86 . Se utilizează o probabilitate de garantare a rezultatelor de 95%.
Rezolvare:
Ipotezele statistice sunt:
H 0 :  12 /  22  1 ,
H 1 :  12 /  22  1 .
s12 2,84 2 8,0686
Testul statistic are valoarea: F     2,3314 .
s 22 1,86 2 3,4596
Regiunea critică (pentru   0,05 ) este dată de: F  F0.05;59; 49  1,64 .
În general, dacă la numărător se trece dispersia cea mai mare testul F este un test unilateral dreapta.
Cum F  F0.0 5;5 9; 4 9 ipoteza nulă se respinge (aceea că raportul dintre dispersii este 1) și se acceptă ipoteza
alternativă. Acest lucru înseamnă că se acceptă ipoteza conform căreia împrăștierea veniturilor pentru turiștii
ce preferă turismul extern este semnificativ mai mare decât cea a turiștilor ce preferă turismul intern.
Tema 3. Elemente de analiză dispersională (ANOVA)

Aplicație Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are
următoarele avantaje față de vechiul produs: este mai practic de utilizat, are o calitate cel puțin la fel de bună
și cost semnificativ mai mic.
Pentru a decide pe care dintre cele trei avantaje să-și axeze strategia de marketing, directorul acestui
departament a realizat un studiu în trei orașe.
În orașul A campania de publicitate s-a axat pe ușurința de utilizare a noului produs.
În orașul B campania de publicitate s-a axat pe calitatea noului produs.
În orașul C campania de publicitate s-a axat pe prețul mai mic al noului produs.
În toate cele 3 orașe s-a înregistrat numărul de bucăți vândute în 20 de săptămâni.
Directorul de marketing ar dori să știe dacă există diferențe semnificative între numărul de bucăți vândute, în
medie pe săptămână, în cele trei orașe după terminarea campaniei de publicitate.
Ușurința 529 658 793 514 663 719 711 606 461 529
folosirii: 498 663 604 495 485 557 353 557 542 614
804 630 774 717 679 604 620 697 706 615
Calitate:
492 719 787 699 572 523 584 634 580 624
672 531 443 596 602 502 659 689 675 512
Preț:
691 733 698 776 561 572 469 581 679 532
Ipotezele ce trebuie testate sunt:
H0: μ1 = μ2 = μ3 cu alternativa
H1: cel puțin două medii sunt diferite.
Rezolvare folosind EXCEL:
1. Introduceți datele astfel:
- în A1 tastați „Ușurința folosirii“, în B1 tastați „Calitate“, în C1 tastați „Preț“
- datele se introduc pe coloane.
2. Apăsați Tools-Data Analysis și ANOVA: Single Factor.
3. La Input Range selectați datele (sau scrieți A1:C21). Selectați Labels in First Row.
4. Specificați Grouped by Columns. Apăsați OK.
Se obțin rezultatele:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Ușurința folosirii 20 11551 577.55 10775
Calitate 20 13060 653 7238.11
Preț 20 12173 608.65 8670.24
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 57512.23 2 28756.12 3.233 0.047 3.159
Within Groups 506983.5 57 8894.447

Total 564495.7 59
În tabelul SUMMARY sunt trecute datele referitoare la cele trei populații:
- numărul de unități din fiecare populație: 20 de săptămâni;
- numărul total de bucăți vândute în această perioadă pentru fiecare populație;
- numărul mediu de bucăți vândute în fiecare săptămână pentru fiecare populație;
- dispersia populațiilor.
Din aceste date observăm că cea mai mare vânzare medie a fost în orașul B în care publicitatea a avut ca
argument principal calitatea superioară a noului produs.
Cea mai mică medie și cea mai mare dispersie (împrăștiere a datelor) s-a înregistrat în Orașul A unde
publicitatea a pus accent pe ușurința folosirii noului produs.
În tabelul ANOVA este calculată Statistica F = 3,233 cu o valoare p egală cu 0,047 (pragul de semnificație).
Această valoare p ne permite să spunem că cel puțin două medii diferă semnificativ (cu o probabilitate de
95%), ceea ce însemnă că tactica aleasă pentru promovarea produsului influențează valoarea vânzărilor.

S-ar putea să vă placă și