Sunteți pe pagina 1din 4

A.

Testarea egalitatii dintre doua medii

1.Unul dintre furnizorii de top de semințe certificate de porumb afirmă că prin cultivarea hibrizilor tardivi
se obțin producții mult mai mari decât prin cultivarea hibrizii semitardivi. Directorul unei companii din
domeniul agricol care dorește să-și axeze activitate pe cultivarea porumbului de consum este interesat de
corelareapotențialului genetic al hibrizilor cu perioada de vegetație. Pentru a verifica afirmația furnizorului
de semințe realizează un studiu pe două eșantioane de producători (25 de producători selectați aleator care
cultivă hibrizi tardivi și 25 de producători care cultivă hibrizi semitardivi) și înregistrează producția medie
la hectar obținută în anul precedent. Directorul doreşte să afle dacă, pentru un nivel de semnificaţie de 5%,
producția obținută prin utilizarea celor două tipuri de hibrizi diferă semnificativ. Datele înregistrate sunt:

Producția medie la hectar (tone/ha)


Hibrizi tardivi: 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0; 7,1; 6,1; 5,0; 6,3; 7,0;
6,4; 6,1; 6,6; 7,7; 6,4

Hibrizi semitardivi:5,2; 6,7; 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1; 5,8; 7,0;
5,7; 5,9; 4,9; 5,3; 4,2; 7,1

Rezolvare:
Ipotezele testate sunt:
H 0 : μ1 =μ2 sau μ 1−μ 2=d
H 1 : μ1 ≠μ 2 sau μ 1−μ2 ≠d

Pentru a putea identifica testul ce trebuie aplicat se vor calcula şi compara dispersiile celor două
eșantioane.Deoarece dispersiile sunt aproximativ egale (se poate aplica un test statistic pentru testarea
egalității dintre dispersii), iar cele două eșantioane au un volum redus, se aplică testul t pentru dispersii
egale (în ipoteza că populațiile din care au fost extrase eșantioanele au o distribuție normală în raport cu
variabila producția medie la hectar).

Rezolvarea problemei se poate face utilizând EXCEL:

După introducerea datelor pe două coloane, din modulul Data Analysis se alege t-Test: Two-
Sample Assuming Equal Variances, se specifică variabilele șidiferența ipotetică testată dintre mediile
celor două eșantioane (d=0, adică Hypothesized Mean Difference=0)
Se obţin rezultatele:
t-Test: Two-Sample Assuming Equal Variances

Varianta A Varianta B
Mean 6.288 6.016
Variance 0.8477667 1.30306667
Observations 25 25
Pooled Variance 1.0754167
Hypothesized Mean Difference 0
Df 48
t Stat 0.9273326
P(T<=t) one-tail 0.1791967
t Critical one-tail 1.6772242
P(T<=t) two-tail 0.3583935
t Critical two-tail 2.0106336
Valoarea calculată a testului teste 0,927.
Valoarea critică a testului t (test bilateral) este 2,01, mai mare decât valoarea calculată. Concluzia
este că nu există motive suficiente pentru a respinge ipoteza nulă, pentru un nivel de încredere de 95%.
Așadar afirmația producătorului de semințe nu este susținută de rezultatele cercetării, producția medie la
hectar nu diferă semnificativ între cele două tipuri de hibrizi.
Nivelul de semnificație observatpeste 0,358 în cazul testului bilateral, mai mare decât nivelul de
semnificație stabilit α=0 . 05 . Se observă că mediile diferă semnificativ doar pentru o probabilitate de
aproximativ 64% (adică 1-p).

2. Pentru două eșantioane de studenți, unul de fete și altul de băieți, au fost înregistrate date referitoare la
nota obținută la matematică. Pe baza datelor înregistrate s-au obținut următoarele rezultate sintetice:
Eșantio Nr. studenți Nota medie Abaterea standard a notei
n
Fete 35 7,47 1,25
Băieți 40 6,84 0,95

Oferă aceste date suficiente informații pentru a accepta ipoteza conform căreia nu există diferențe
semnificative statistic între rezultatele obținute de studenți, în funcție de genul acestora? Utilizați un nivel
de semnificație de 5%.

B. ANOVA

1.Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are
următoarele avantaje faţă de vechiul produs: este mai practic de utilizat, are o calitate cel puţin la fel de
bună şi cost semnificativ mai mic. Pentru a decide pe care dintre cele trei avantaje să-şi axeze strategia de
marketing, directorul acestui departament a realizat un studiu în trei oraşe. În oraşul A campania de
publicitate s-a axat pe uşurinţa de utilizare a noului produs. În oraşul B campania de publicitate s-a axat pe
calitatea noului produs. În oraşul C campania de publicitate s-a axat pe preţul mai mic al noului produs. În
toate cele 3 oraşe s-a înregistrat numărul de bucăţi vândute în 20 de săptămâni.
Directorul de marketing ar dori să ştie dacă există diferenţe semnificative între numărul de bucăţi
vândute, în medie pe săptămână, în cele trei oraşe după terminarea campaniei de publicitate.
Uşurinţa 529 658 793 514 663 719 711 606 461 529
folosirii: 498 663 604 495 485 557 353 557 542 614

804 630 774 717 679 604 620 697 706 615
Calitate:
492 719 787 699 572 523 584 634 580 624

672 531 443 596 602 502 659 689 675 512
Preţ:
691 733 698 776 561 572 469 581 679 532

Identificarea metodei: Datele sunt cantitative şi problema revine la a compara mediile celor trei
populaţii. Ipotezele ce trebuie testate sunt: H0: μ1 = μ2 = μ3 cu alternativa H1: cel puţin două medii sunt
diferite.
Pentru aceasta se aplică o analiză de varianţă cu un singur factor.
Rezolvare folosind EXCEL:
1. Introduceţi datele astfel:
înA1 tastaţi „Uşurinţa folosirii“, în B1 tastaţi „Calitate“, în C1 tastaţi „Preţ“
datele se introduc pe coloane.
2. Selectaţi DATA-Data Analysis şi ANOVA: Single Factor.
3. La Input Range selectaţi datele (sau scrieţi A1:C21). Selectaţi Labels in First Row.
4. Specificaţi Grouped by Columns. Apăsaţi OK.

Se obţin rezultatele:
Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
Uşurinţa folosirii 20 11551 577.55 10775
Calitate 20 13060 653 7238.11
Preţ 20 12173 608.65 8670.24

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 57512.23 2 28756.12 3.233 0.047 3.159
Within Groups 506983.5 57 8894.447

Total 564495.7 59

În tabelul SUMMARY sunt trecute datele referitoare la cele trei populaţii:


- numărul de unităţi din fiecare populaţie: 20 de săptămâni
- numărul total de bucăţi vândute în această perioadă pentru fiecare populaţie
- numărul mediu de bucăţi vândute în fiecare săptămână pentru fiecare populaţie
- dispersia populaţiilor
Din aceste date observăm că cea mai mare vânzare medie a fost în Oraşul B în care publicitatea a avut
ca argument principal calitatea superioară a noului produs.
Cea mai mică medie şi cea mai mare dispersie (împrăştiere a datelor) s-a înregistrat în Oraşul A unde
publicitatea a pus accent pe uşurinţa folosirii noului produs.

În tabelul ANOVAeste calculată Statistica F = 3,233 cu o valoare p egală cu 0,047 (pragul de


semnificaţie). Această valoare p ne permite să spunem că cel puţin două medii diferă semnificativ (cu o
probabilitate de 95%), ceea ce însemnă că tactica aleasă pentru promovarea produsului influenţează
valoarea vânzărilor.

2. Un eşantion de60 de vizitatori ai unei expoziții sunt cronometrați cât timp vizitează expoziția (minute).
20 de vizitatori dimineața, 20 la prânz și 20 seara. Pentru a vedea dacă există o diferență semnificativă
între timpul în care vizitează expoziția în cele trei momente ale zilei, s-a realizat un test ANOVA,
rezultatele fiind prezentate mai jos.

Anova: Single Factor


SUMMARY
Groups Count Sum Average Variance
Dimineața 20 895 44.75 66.934
La prânz 20 988 49.4 500.99
Seara 20 1322 66.1 1501.36

ANOVA
Source of
Variation SS df MS F P-value F crit
Between Groups 5042.23 ..… ……. …… 0.03 3.16
Within Groups …. ……. 689.76

Total 44358.58
Formulați ipotezele testului, luați decizia și interpretați rezultatul obţinut.
3. Pentru un esantion de 50 de farmaciiamplasate in cele trei mari provincii istorice ale Romaniei, s-au
inregistrat valorile aferente vanzarilor medii lunare, in unitati monetare (u.m.). Dupa prelucrarea
valorilor primare au rezultat datele din tabelul urmator:
Abaterea standard
Numar de Vanzari medii
Provincia (Abaterea medie patratica) a vanzarilor
farmacii lunare (u.m.)
(u.m.)
Moldova 15 45 10
Transilvania 22 35 9
Ţara Românească 13 66 15

Folosind modelul de analiză dispersionala ANOVA arătaţi dacă există diferenţe semnificative statistic
între cele trei provincii istorice, din punctul de vedere al vânzărilor lunare realizate de farmaciile
respectivului lant farmaceutic (Fcritic=3,195)

4. În vederea fundamentării deciziei de înlocuire a unor utilaje din dotarea unei fabrici, managerul acesteia
solicită o analiză a vechimii utilajelor şi a costului de întreţinere anual al acestora. Astfel, pentru cele 20
utilaje din dotarea fabricii – care sunt grupate după vechime (ani) in 3 grupe: vechime mica (<5 ani),
vechime medie (5-10 ani) si vechime mare (>10 ani). – s-a inregistrat costul de intretinere al acestora
(u.m.). In urma aplicarii metodei ANOVA de analiza dispersionala, si a prelucrarii datelor cu Excel, s-au
obtinut urmatoarele rezultate:
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups ............ …..… ……….. …... 0,001264 6,11
Within Groups ……… …..… 6,658824
Total 248,2 19        
Se cere:
a) Completaţi adecvat informaţiile lipsă din ouput-ul obţinut în urma prelucrării datelor (se precizează
formulele de calcul utilizate pentru obţinerea valorilor lipsă);
b) Se poate afirma că vechimea utilajelor influenţează variaţia costului de întreţinere al acestora în
mod semnificativ(nivel de semnificaţie 5%)? Cu ce probabilitate maximă puteţi susţine această
afirmaţie?

5. O fabrică de produse de patiserie produce un tip de fursecuri pe care îl comercializează într-un


supermarket. În vederea stimulării vânzărilor, managerul supermarketului hotărăşte să schimbe locaţia
de amplasare a produsului timp de 32 săptămâni. Astfel, produsul este mutat săptămânal în 3 locaţii: la
raionul de patiserie, la raionul de lactate şi lângă casa de marcat, înregistrându-se vânzările
săptămânale obţinute (unităţi monetare). În urma prelucrării datelor s-au obţinut următoarele rezultate
preliminare:
Groups Count Average (unităţi monetare) Variance
Raionul de lactate 9 36 63,5
Casa de marcat 8 46 140,5
Raionul de patiserie 15 49 31,8
Folosind metoda analizei dispersionale ANOVA arătaţi dacă există diferenţe semnificative între vânzările
medii săptămânale obţinute in urma amplasarii produsului în cele trei locaţii, pentru un nivel de
semnificaţie de 5% (valoarea critică a testului: 3,32).

S-ar putea să vă placă și