Documente Academic
Documente Profesional
Documente Cultură
1. Un cercetător face un studiu asupra unor firme, privind șansele pe care acestea le oferă tinerilor angajați de a
promova repede și de a avansa în carieră. Pentru aceasta el a cuprins în studiu un număr de 20 de companii
producătoare de tehnologie de vârf și a înregistrat timpul scurs de la angajarea inițială a unui salariat în firmă până
la prima promovare a acestuia. Firmele au fost grupate după mărime, iar datele înregistrate sunt:
Mărimea firmelor Număr de săptămâni de la angajare până la prima promovare
Mici 30; 26; 30; 32; 38; 24; 32; 28
Medii 34; 32; 25; 36; 33
Mari 47; 41; 43; 48; 40; 49; 40.
Se cere să se determine, folosind testul F de analiză dispersională, dacă variația timpului scurs până la prima
promovare este influențată semnificativ de mărimea firmei? (nivel de semnificație 5%)
Rezolvare:
▪ Populația statistica este mulțimea companiilor producătoare de tehnologie de vârf.
▪ Unitatea statistica este o companie (firma).
▪ Caracteristicile urmărite sunt:
X - variabila ce arata mărimea unei firme;
- variabila nenumerica având r=3 categorii sau variante: firme mici, firme mijlocii și firme mari.
Aceste categorii ale variabilei X vor determina împărțirea populației statistice în r =3 grupe și
anume:
Grupa 1 (grupa firmelor mici),
Grupa 2 (grupa firmelor mijlocii),
Grupa 3 (grupa firmelor mari);
- astfel, variabila X, mărimea firmei, se mai numește și factor de grupare.
si
Y - variabila ce arata durata de timp, în săptămâni, de la angajare la prima promovare a unui salariat al
unei firme producătoare de tehnologie de vârf;
- variabila numerica de interes.
o Fie 𝑌1 ~𝑁(𝜇1 , 𝜎12 ) variabila ce arata durata de timp, în săptămâni, de la angajare la prima promovare a unui
salariat al unei firme mici – Grupa 1, unde 𝜇1 este media variabilei la nivelul întregii grupe.
Din Grupa 1 (grupa firmelor mici) se selectează un subeșantion de volum 𝑛1 = 8 firme pentru care se
înregistrează valorile variabilei Y1:
{𝒚𝟏,𝟏 = 𝟑𝟎, 𝒚𝟏,𝟐 = 𝟐𝟔, 𝒚𝟏,𝟑 = 𝟑𝟎, 𝒚𝟏,𝟒 = 𝟑𝟐, 𝒚𝟏,𝟓 = 𝟑𝟖, 𝒚𝟏,𝟔 = 𝟐𝟒, 𝒚𝟏,𝟕 = 𝟑𝟐, 𝒚𝟏,𝟖 = 𝒚𝟏,𝒏𝟏 = 𝟐𝟖 }
𝑦1,1 +𝑦1,2 +...+𝑦1,𝑛1 240
Media de selecție de grupa este 𝑦̅1 = = = 30 săptămâni,
𝑛1 8
2 2 2
(𝑦1,1 −𝑦̄ 1 ) +(𝑦1,2 −𝑦̄ 1 ) +...+(𝑦1,𝑛1 −𝑦̄ 1 )
iar dispersia de selecție de grupa este 𝑠12 = = 18,2857.
𝑛1 −1
o Fie 𝑌2 ~𝑁(𝜇2 , 𝜎22 ) variabila ce arata durata de timp, în săptămâni, de la angajare la prima promovare pentru un
salariat al unei firme mijlocii – Grupa 2, unde 𝜇2 este media variabilei la nivelul întregii grupe.
Din Grupa 2 (grupa firmelor mijlocii) se selectează un subeșantion de volum 𝑛2 = 5 firme pentru care se
înregistrează valorile variabilei Y2:
{𝒚𝟐,𝟏 = 𝟑𝟒, 𝒚𝟐,𝟐 = 𝟑𝟐, 𝒚𝟐,𝟑 = 𝟐𝟓, 𝒚𝟐,𝟒 = 𝟑𝟔, 𝒚𝟐,𝟓 = 𝒚𝟐,𝒏𝟐 = 33}.
𝑦2,1 +𝑦2,2 +...+𝑦2,𝑛2 160
Media de selecție de grupa este 𝑦̅2 = = = 32 săptămâni,
𝑛2 5
2 2 2
(𝑦2,1 −𝑦̄ 2 ) +(𝑦2,2 −𝑦̄ 2 ) +...+(𝑦2,𝑛2 −𝑦̄ 2 )
iar dispersia de selecție de grupă este 𝑠22 = = 17,5.
𝑛2 −1
o Fie 𝑌3 ~𝑁(𝜇3 , 𝜎32 ) variabila ce arată durata de timp, în săptămâni, de la angajare la prima promovare pentru un
salariat al unei firme mari – Grupa 3, unde 𝜇3 este media variabilei la nivelul întregii grupe.
Din Grupa 3 (grupa firmelor mari) se selectează un subeșantion de volum 𝑛3 = 7 firme pentru care se
înregistrează valorile variabilei Y3:
{𝒚𝟑,𝟏 = 𝟒𝟕, 𝒚𝟑,𝟐 = 𝟒𝟏, 𝒚𝟑,𝟑 = 𝟒𝟑, 𝒚𝟑,𝟒 = 𝟒𝟖, 𝒚𝟑,𝟓 = 𝟒𝟎, 𝒚𝟑,𝟔 = 𝟒𝟗, 𝒚𝟑,𝟕 = 𝒚𝟑,𝒏𝟐 = 𝟒𝟎 }.
𝑦3,1 +𝑦3,2 +...+𝑦3,𝑛3 308
Media de selecție de grupa este 𝑦̅3 = = = 44 săptămâni,
𝑛3 7
2 2 2
(𝑦3,1 −𝑦̄ 3 ) +(𝑦3,2 −𝑦̄ 3 ) +...+(𝑦3,𝑛3 −𝑦̄ 3 )
iar dispersia de selecție de grupa este 𝑠32 = = 15,3333.
𝑛3 −1
o Media totala la nivelul întregului eșantion de volum 𝑛 = 𝑛1 + 𝑛2 + 𝑛3 = 20 firme este:
∑𝑟𝑖=1 𝑦𝑖 ∙ 𝑛𝑖 𝑦̅1 ⋅ 𝑛1 + 𝑦̅2 ⋅ 𝑛2 + 𝑦̅3 ⋅ 𝑛3 30 ⋅ 8 + 32 ⋅ 5 + 44 ⋅ 7
𝑦̅ = = = 35,4 săptămâni
∑𝑟𝑖=1 𝑛𝑖 𝑛1 + 𝑛2 + 𝑛3 20
o Nivelul de semnificație al testului este 𝛼 = 0,05, iar valoarea critica a testului este
𝐹𝑐𝑟𝑖𝑡𝑖𝑐 = 𝐹𝛼;𝑟−1,𝑛−𝑟 = 𝐹0,05;2,17 = 3,59,
deci regiunea critica este𝑅𝑐 = (𝐹𝑐𝑟𝑖𝑡𝑖𝑐 ; +∞) = (3,59; +∞).
o Cum 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐 ⇒ 𝐹𝑐𝑎𝑙𝑐 ∈ 𝑅𝑐 , respingem ipoteza nula H0 și acceptam ipoteza alternativa H1, concluzionând
ca la un nivel de semnificație de 5% și pe baza acestor date de selecție, mărimea companiei influențează
semnificativ variația duratei de timp până la prima promovare pentru un salariat.
Figura 1. Introducerea datelor și alegerea Anova: Single Factor din submeniul Data Analysis.
➢ Output-ul constă din două tabele: primul conține rezultatele obținute în urma prelucrării datelor din fiecare
grupa, iar cel de-al doilea este tabelul ANOVA.
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 808.8 2 404.4 23.7062069 1.20941E-05 3.591530568
Within Groups 290 17 17.05882353
Total 1098.8 19
2. Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are următoarele
avantaje față de vechiul produs: este mai practic de utilizat, are o calitate cel puțin la fel de bună și cost
semnificativ mai mic. Pentru a decide pe care dintre cele trei avantaje să-și axeze strategia de marketing, directorul
acestui departament a realizat un studiu în trei orașe.
În orașul A campania de publicitate s-a axat pe ușurința de utilizare a noului produs.
În orașul B campania de publicitate s-a axat pe calitatea noului produs.
În orașul C campania de publicitate s-a axat pe prețul mai mic al noului produs.
În toate cele 3 orașe s-a înregistrat numărul de bucăți vândute în 20 de săptămâni.
Directorul de marketing ar dori să știe dacă există diferențe semnificative între numărul de bucăți vândute, în
medie pe săptămână, în cele trei orașe după terminarea campaniei de publicitate.
Ușurința 529 658 793 514 663 719 711 606 461 529
folosirii: 498 663 604 495 485 557 353 557 542 614
804 630 774 717 679 604 620 697 706 615
Calitate:
492 719 787 699 572 523 584 634 580 624
672 531 443 596 602 502 659 689 675 512
Preț:
691 733 698 776 561 572 469 581 679 532
Se obțin rezultatele:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Ușurința folosirii 20 11551 577.55 10775
Calitate 20 13060 653 7238.11
Preț 20 12173 608.65 8670.24
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 57512.23 2 28756.12 3.233 0.047 3.159
Within Groups 506983.5 57 8894.447
Total 564495.7 59
3. (TEMA) Directorul unei companii pentru fabricarea mobilei de birou, crede ca productivitatea lucrătorilor
depinde, printre altele și de succesiunea operațiilor pe care trebuie sa le execute muncitorul. Pentru producerea
unui birou ergonomic sunt considerate două variante de realizarea a acestuia (din punctul de vedere al succesiunii
operațiilor). Pentru a decide care variantă este mai bună au fost selectați aleator 50 de muncitori care asamblau
birouri și au fost înregistrați timpii de asamblare.
Timpii de asamblare (ore)
Varianta A 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0;
7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4; 5,2; 6,7
Varianta B 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1;
5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1
Directorul dorește să afle dacă pentru un nivel de semnificație de 5%, timpii de asamblare în cele două variate
diferă.
4. (TEMA) Pe un grup de 39 subiecți se studiază efectul unor medicamente în cazul tratării unei boli. Acești
subiecți au fost împărțiți în trei grupe. Primului grup i s-a administrat medicamentul 1, celui tratării de-al
doilea grup i s-a administrat un medicament placebo, iar celui de-al treilea grup i s-a administrat
medicamentul2. Desigur subiecții nu au fost informați despre tipul de medicament ce le este administrat.
Înainte de aplicarea tratamentului mediile scorurilor analizelor corespunzătoare celor 3 grupuri nu difereau
semnificativ. În urma realizării acestui experiment s-au obținut următoarele rezultate:
1 1 1 1 1 1 1 1 1 1 1 1 1 1
431.46 442.06 336.74 332.28 352.54 360.34 338.04 430.82 418.28 384.44 337.8 397.08 380.26 587.22
2 2 2 2 2 2 2 2 2 2 2 2
404.62 408.86 455.58 482.74 440.66 466.46 380.34 324.82 400.2 397.92 418.94 347.22
3 3 3 3 3 3 3 3 3 3 3 3 3
519.54 387.74 344.7 442.62 376.5 316.48 314.68 353.8 354.28 430.94 354.74 417.12 445.68
Să se stabilească dacă tratamentul aplicat a influențat rezultatele analizelor (nivel de semnificație 5%).
5. Pentru 7 magazine situate în cartierul A al unui oraș și 5 magazine situate în cartierul B al aceluiași oraș, se
cunosc valorile vânzărilor (mil. lei). În urma aplicării metodei de analiză dispersională ANOVA și a
prelucrării datelor cu Excel, s-au obținut următoarele rezultate:
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups … 1 … 17.96283 0.00172 4.96460
Within Groups … … 7.89142
Total … …
Se cere să se determine datele lipsă și să se interpreteze rezultatele prelucrării. Influențează cartierul în care
sunt amplasate magazinele variația vânzărilor în mod semnificativ?
Rezolvare:
Ipotezele ce trebuie testate sunt:
H0: μ1 = μ2
H1: μ1 ≠ μ2
ANOVA
Source of Variation SS df MS F P-value F crit
𝑀𝑆𝐵
𝑆𝑆𝐵 = 𝑀𝑆𝐵 · 1 𝑀𝑆𝐵 = 𝐹𝑐𝑎𝑙𝑐 ∙ 𝑀𝑆𝑊 𝐹𝑐𝑎𝑙𝑐 =
Between Groups 1 𝑀𝑆𝑊 0.00172 4.96460
SSB=141.7522 MSB=141.7522
17.96283
𝑆𝑆𝑊 = 𝑀𝑆𝑊 · 10
Within Groups 𝑛 − 𝑟 = 10 MSW=7.89142
SSW=78.9142
𝑆𝑆𝑇 = 𝑆𝑆𝐵 + 𝑆𝑆𝑊
Total 𝑛 − 1 = 11
𝐒𝐒𝐓 = 𝟐𝟐𝟎. 𝟔𝟔𝟔𝟒
Formule utilizate:
𝑆𝑆𝐵
𝑀𝑆𝐵 =
𝑟−1
𝑆𝑆𝑊
𝑀𝑆𝑊 =
𝑛−𝑟
𝑆𝑆𝐵
𝑀𝑆𝐵
𝐹𝑐𝑎𝑙𝑐 = = −1
𝑟
𝑀𝑆𝑊 𝑆𝑆𝑊
𝑛−𝑟
𝐹critic = 𝐹0,05; 2,17 = 3,59
Pentru determinarea 𝐹0,05; 1,10 = 4,9646, se poate utiliza funcția F.INV din Excel: = 𝐹. 𝐼𝑁𝑉(1 − 𝛼; 𝑟 − 1; 𝑛 − 𝑟)
𝐹𝑐𝑎𝑙𝑐 = 17.96283 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐 = 4,9646 – cu un nivel de semnificație observat p_value=0,00172 (𝑝_𝑣𝑎𝑙𝑢𝑒 < 𝛼) →
cel puțin două medii diferă semnificativ (cu o probabilitate de 95%), ceea ce însemnă că zona (cartierul) în care sunt
amplasate magazinele influențează variația vânzărilor în mod semnificativ.
6. (TEMA) Pentru a evalua impactul zilei de tranzacționare asupra randamentului unei acțiuni s-a calculat,
pentru o perioadă de 20 de zile de tranzacționare, randamentul acțiunii în fiecare zi, de luni până vineri.
Pentru a vedea dacă există o diferență semnificativă între randamente, s-a realizat un test ANOVA, rezultatele
fiind prezentate mai jos:
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.001 4 … …. 0.11 3.06
Within Groups … 15 …
Total 0.004 19
Scrieți ipotezele testului, luați decizia și comentați implicațiile practice ale acestei decizii.
7. (TEMA) 60 de vizitatori ai unei expoziții sunt cronometrați cât timp vizitează expoziția (minute). 20 de
vizitatori dimineața, 20 la prânz și 20 seara. Pentru a vedea dacă există o diferență semnificativă între timpul
în care vizitează expoziția în cele trei momente ale zilei, s-a realizat un test ANOVA, rezultatele fiind
prezentate mai jos.
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Dimineața 20 895 44.75 66.934
La prânz 20 988 49.4 500.99
Seara 20 1322 66.1 1501.36
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 5042.23 ....... ......... ....... 0.03 3.16
Within Groups ...... ....... 689.76
Total 44358.58 ..........
Scrieți ipotezele testului, luați decizia și interpretați-o.
8. (TEMA) Un cercetător face un studiu asupra unor firme, privind șansele pe care acestea le oferă tinerilor
angajați de a promova repede și de a avansa în carieră. Pentru aceasta el a cuprins în studiu un număr de 20
de companii producătoare de tehnologie de vârf și a înregistrat timpul scurs de la angajarea inițială a unui
salariat în firmă până la prima promovare a acestuia. Firmele au fost grupate după mărime (mici, medii și
mari), iar în urma aplicării testului F de analiză dispersională rezultatele sunt:
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 384.3 … … …. 0.001922 3.591531
Within Groups … … …
Total 737.8 …
Completați spațiile libere și testați ipoteza conform căreia variația timpului scurs până la prima promovare
este influențată semnificativ de mărimea firmei (probabilitate de 95%)?
9. (TEMA) În marketingul produselor destinate copiilor este deosebit de importantă realizarea unor spoturi
publicitare televizate, care să capteze atenția copiilor. În timpul vizionării lor, o firmă de cercetări în
marketing vrea să stabilească în ce mod reclamele la diferite produse generează diferențe în ceea ce privește
durata atenției copiilor. Pentru aceasta, 20 de copii cu vârste sub 10 ani sunt rugați să vizioneze câte un clip
publicitar de 60 de secunde, la unul din cele 3 tipuri de produse (jocuri, dulciuri și articole de îmbrăcăminte),
apoi se măsoară timpul în care fiecare dintre ei urmărește atent reclama (în secunde). Din cei 20 de copii, 7
copii urmăresc o reclamă la jocuri, 5 dintre ei la dulciuri și restul la îmbrăcăminte. Rezultatele prelucrării
datelor în Excel sunt:
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups … … 694,125 …. 0,00023 …
Within Groups … … …
Total 1588,950 …
Completați tabelul și arătați dacă există suficiente dovezi pentru a concluziona că tipul produsului la care se
referă spoturile publicitare determină diferențe semnificative în duratele atenției cu care copiii urmăresc
aceste reclame (pentru nivel de semnificație de 5%).
10. (TEMA) Pentru un eșantion de 50 de farmacii, ce reprezintă 25% dintre farmaciile unui anumit lanț
farmaceutic, amplasate în cele trei mari provincii istorice ale României, s-au înregistrat valorile aferente
vânzărilor medii lunare, în unități monetare (u.m.). După prelucrarea valorilor primare au rezultat datele din
tabelul următor:
Număr de Vânzări medii lunare Abaterea standard
Provincia
farmacii (u.m.) (Abaterea medie pătratică) a vânzărilor (u.m.)
Moldova 15 45 10
Transilvania 22 35 9
Muntenia 13 66 15
a) Folosind modelul de analiză dispersionala ANOVA arătați dacă există diferențe semnificative statistic
între cele trei provincii istorice, din punctul de vedere al vânzărilor lunare realizate de farmaciile
respectivului lanț farmaceutic.
b) Să se estimeze, pentru o probabilitate de 95%, valoarea medie lunară a vânzărilor și valoarea totală
lunară a vânzărilor la nivelul întregului lanț farmaceutic.
11. (TEMA) O fabrică de produse de patiserie produce un tip de fursecuri pe care îl comercializează într-un
supermarket. În vederea stimulării vânzărilor, managerul supermarketului hotărăște să schimbe locația de
amplasare a produsului timp de 30 săptămâni. Astfel, produsul este mutat săptămânal în 3 locații: la raionul
de patiserie, la raionul de lactate și lângă casa de marcat, înregistrându-se vânzările săptămânale obținute
(unități monetare). În urma prelucrării datelor s-au obținut următoarele rezultate preliminare:
Groups Count Average (unități monetare) Variance
Raionul de lactate 9 36 63,5
Casa de marcat 8 46 140,5
Raionul de patiserie 15 49 31,8
a) Presupunând că datele provin dintr-un eșantion selectat aleator stratificat, estimați,
printr-un interval de încredere 95% nivelul mediu al vânzărilor săptămânale.
b) Să se determine volumul eșantionului necesar pentru estimarea valorii medii a vânzărilor cu o eroare maximă
admisă mai mică cu 35% față de rezultatul obținut la punctul anterior. Repartizați noul eșantion proporțional pe
subeșantioane.