Sunteți pe pagina 1din 10

Seminar: 22 martie - 2 aprilie

APLICAŢIE_1
SERIE cu Frecvențe (SFv) -- (date univariate)
Se cunosc datele privind distribuţia salariaților după
vârstă (ani) la o agenţie de turism:
Tabel - Distribuţia salariatilor după vârstă
Vârsta salariaților
Nr. salariați
(ani)
20 4
23 8
25 7
30 4
40 2
5

Total n
i 1
i  25

Se cere:
1. Să se stabilească vârsta medie a salariaților agenţiei de
turism;
2. Precizați seria privind salariații agenţiei de turism după vârsta
lor este omogenă; (sau media este reprezentativă?)
3. Măsuraţi asimetria distribuţiei.
4. Stabiliți vârsta medie și dispersia pentru salariații care au
vârsta sub 25 ani

Rezolvare
Precizări: Colectivitatea: un număr foarte mare de salariați
Eșantionul (volumul eșantionului = n): 25 salariați
Unitatea statistică: salariatul
Variabila statistică xi : vârsta (cantitativă, discretă)
Scala de măsurare: de raport

1
1. Stabilirea vârstei medii a salariaților agenţiei de turism

Tabel - Distribuţia salariatilor după vârstă


Vârsta salariaților (ani) Nr. salariați
( xi ) ( ni )
20 4
23 8
25 7
30 4
40 2
5
Total n
i 1
i  25

Vârsta medie a salariaților agenţiei de turism se determină prin aplicarea


relaţiei mediei aritmetice ponderate:
5

x n i i
20  4  23  8  ...  40  2 639
x i 1
5
   25,56 ani /salariat
n
25 25
i
i 1
S-a stabilit că, la nivelul agenţiei de turism vâsta medie a salariaților este de
aproximativ 26 ani /salariat (25,56 ani /salariat).

2. Precizați dacă seria privind salariații agenţiei de turism după vârsta lor este
omogenă;
Omogenitatea distribuției se stabileşte prin aplicarea coeficientului de variaţie:
s
v   100
x
Vârsta salariaților (ani) Nr. salariați
( xi ) ( ni )
20 4
23 8
25 7
30 4
40 2
5
Total n
i 1
i  25

x  25,56 ani/salariat

 x 
5
2
i  x ni
Determinarea dispersiei: s 2  i 1
5

n
i 1
i 1

s2 
20  25,562  4  23  25,562  8  25  25,562  7  30  25,562  4  40  25,562  2
25  1
s  28,09
2

2
Calcul abatere standard: s  s 2  28,09  5,30 ani/ salariat

s 5,30
Determinarea coeficientului de variație: v  100  100  20,74%  35% ,
x 25,56
Deoarece v = 20,74% < 35% concluzia este că, seria privind distribuția salariații
agenţiei de turism după vârsta lor este omogenă.

OBSERVATIE!!!!
În cazul cerinței de a preciza dacă vârsta medie a salariaților (media) este o
valoare reprezentativă, se calculează tot coeficientul de variație, numai că
interpretarea este următoarea: deoarece v=20,74%<35% atunci vârsta medie a
salariaților este o valoare reprezentativă

3. Măsurați asimetria seriei


Asimetria seriei se măsoară cu ajutorul coeficienţilor de asimetrie Pearson:

x  Mo 3x  M e 
C as( Mo)  şi C as( Me) 
s s

Aplicarea primului coeficient de asimetrie Pearson


x  Mo
C as( Mo) 
s
presupune determinarea valorii dominante a distribuţiei (Mo).

Vârsta salariaților (ani) Nr. salariați


( xi ) ( ni )
20 4
23 8
25 7
30 4
40 2
5
Total n
i 1
i  25

Frecvenţei celei mai mari (celor mai mulți salariați) care este 8 ( nmax  8 ), îi
corespunde valoarea xi  23  M o  23 ani /salariat
Cei mai mulți salariați au, în medie, vârsta de 23 ani.

x  M o 25,56  23
Cas( Mo)    0,483  0 ; 0,5
s 5,30
deci, distribuţiei salariaţilor după vârstă îi corespunde o asimetrie pozitivă redusă
(predomină valorile mici)

3
Utilizarea celui de-al doilea coeficient de asimetrie Pearson
3x  M e 
C as( Me) 
s
presupune determinarea medianei distribuţiei.

Tabel – Algoritm de calcul pentru determinarea medianei


Vârsta salariaților (ani) Nr. salariați Frecvenţe cumulate
( xi ) ( ni ) crescător ( FC .CR. )
20 4 4
23 8 12
25 7 19
30 4 23
40 2 25
5
Total n
i 1
i  25 ---

Etape de determinare a medianei:


- se cumulează crescător frecvenţele (coloană în tabel cu FC .CR. )

- se stabileşte locul medianei

LMe 
n i 1

25  1
 13
2 2
- se determină valoarea medianei ca fiind valoarea xi care satisface relaţia: ca

prima valoare cumulată să fie mai mare sau egală cu locul medianei ( pFc.cr .  LMe )

Deoarece pFc.cr .  LMe , adică 19  13 , rezultă că xi  25  M e  25 ani /salariat

Jumătate dintre salariați au o vârstă medie sub 25 ani, în timp ce restul


acestora au în medie peste 25 ani.

3x  M e  325,56  25


Cas( Me)    0,317  0;1,5 , deci distribuţiei salariaţilor
s 5,30
după vârstă îi corespunde o asimetrie pozitivă redusă (predomină valorile mici)

4
4. Stabiliți vârsta medie și dispersia pentru salariații care au vârsta sub 25 ani

Rezolvarea constă în transformarea variabilei nealernative (vârsta cu 5 variante


de răspuns) în variabilă alternativă (vârsta numai cu 2 variante de răspuns)

Vârsta – variabilă nealternativă (cu 5 variante de raspuns)


Variante Vârsta salariaților (ani) Nr. salariați
de răspuns ( xi ) ( ni )
V1 20 4
V2 23 8
V3 25 7
V4 30 4
V5 40 2
5
Total n
i 1
i  25

Varianta 1 = V1 =20 ani


Varianta 2 = V2 =23 ani
........................................
Varianta 5 = V5 =40 ani

Vârsta – variabilă alternativă (numai cu 2 variante de răspuns)


Vârsta salariaților (ani) Nr. salariați
Sub 25 ani 4+8 = 12
De 25 ani și peste 25 ani 7+4+2 =13
Total 25

Situația favorabilă (m) este reprezentată de numărul salariaților cu vârsta sub


25 ani (cerința): m = 4+8 = 12 salariați

Vârsta medie a salariaților cu vârsta sub 25 ani se notează cu f (media) și se


interpretează procentual, astfel:
m 12
f    0,48
n 25
Interpretare: 48% dintre salariați au, în medie, vârsta sub 25 ani

Dispersia pentru salariații cu vârsta sub 25 ani se notează cu s2 și se calculează:

s 2  f 1  f   0,481  0,48  0,2496  0,25

5
APLICAŢIE_2
Regula de compunere a Variabilității (ANOVA)
Un cercetător face un studiu asupra unor firme, privind șansele pe care acestea
le oferă tinerilor angajați de a promova repede și de a avansa în carieră. Pentru
aceasta el a cuprins în studiu un număr de 20 companii producătoare de tehnologii
de vârf și a înregistrat timpul scurs de la angajarea inițială a unui salariat în firmă
(săptămâni), până la prima promovare a acestuia. Firmele au fost grupate după
mărime, iar datele înregistrate au fost introduse în excel, iar rezultatele se prezintă
astfel:
Groups Count Sum Average Abatere standard
Mici 8 240 ...... 4,28
Medii 5 ..... 32 4,18
Mari ...... 308 44 3,92

Variația timpului scurs de la angajarea inițială a unui salariat în firmă până la prima
promovare:
a. este influențată semnificativ de mărimea firmei deoarece K2=73,61% > 50%
b. nu este influențată semnificativ de mărimea firmei deoarece K 2=73,61% > 50%
c. nu este influențată semnificativ de mărimea firmei deoarece R2=73,61% > 50%
d. este influențată semnificativ de mărimea firmei deoarece R2=73,61% > 50%

Rezolvare:
Eșantionul = 20 firme = n
Timp (săptămâni) = f (mărimea firmei cu grupele: Mici, Medii, Mari) + alți factori

Average Abatere standard


Count
(media grupei) pe grupă
(Nr Sum
(Nr mediu
Firme) (suma
Groups săptămâni/grupă)
(Mărimea ni săptamânilor) si
firmei)
yi
Mică_1 8 n1 240 30...... y1 4,28 s1
Medie_2 5 n2 ...... 32 y2 4,18 s2
Mare_3 7... n3 308 44 y3 3,92 s3

În vederea stabilirii cerinței, dacă variația timpului scurs de la angajarea inițială a


unui salariat în firmă până la prima promovare este influențată semnificativ de
2
mărimea firmei, trebuie calculat COEFICIENTUL DE DETERMINAȚIE: R

6
Coeficentul de determinație se calculează pornind de la regula de compunere a
SSB
variabilității ( SST  SSB  SSW ), luând în considerare relația: R 
2

SST

Completare spații punctate în tabel:

 Media primei grupe (Mică_1):


8

y i
240
y1  i 1
  30 sapt. / firma
n1 8

 Suma săptămânilor pentru a doua grupă (Medie_2)


5

y i
y2  i 1
n2
5

y
i 1
i  y2  n2  32  5  160 saptamâni

 Nr firme pentru a treia grupă (Medie_3)


7

y i
y i 1
n3
7

y i
308
n3  i 1
  7 firme
y3 44

Sau

n
i 1
i  n1  n2  n3

3
n3   ni  n1  n2  20  8  5  7 firme
i 1

7
REGULA DE COMPUNERE A VARIABILITĂȚII:

SST  SSB  SSW

 Varianţa dintre grupe (Between Groups)


r
SSB    yi  y   ni  ???????
2

i 1

yi este media fiecărei grupe, reprezentată de y1 , y 2 , y3 (Average --- vezi

rezultate tabel SUMMARY)

y1  30 saptamani / firma
y2  32 saptamani / firma
y3  44 saptamani / firma

x  y este media generală a eşantionului format din cele 20 firme (n =


20 firme), care se determină ca medie aritmetică ponderată a mediilor
fiecărei grupe:

 y n i i
y1n1  y2 n2  y3n3 30  8  32  5  44  7
y i 1
   35,40 saptamani / firma
r
n1  n2  n3 857
n
i 1
i

r
SSB    yi  y   ni   y1  y  n1   y2  y  n2   y3  y  n3
2 2 2 2

i 1

SSB  30  35,40  8  32  35,40  5  44  35,40  7  808,80


2 2 2

SSB  808,80

8
 Varianța din interiorul grupelor (Withing Groups)
r
SSW   si2  (ni  1)  ??????????
i 1

si2 este dispersia fiecărei grupe, reprezentată de s , s S2 , s P2 (Variance ---


2
C

se calculează pe baza valorilor abaterii standard pe grupă)


s12  s1   4,28  18,29
2 2

s22  s2   4,18  17,50


2 2

s32  s3   3,92  15,33


2 2

r
SSW   si2  (ni  1)  s12 n1  1  s22 n2  1  s32 (n3  1)
i 1
SSW  s n1  1  s22 n2  1  s32 (n3  1)  18,29 8  1  17,50 5  1  15,33 7  1  290
2
1

SSW  290

Varianţa TOTALĂ (SST)


SST  SSB  SSW
SST  808,80  290  1098,80
Influența factorului principal împărțit pe grupe (Mărimea firmei cu grupele:
Mică_1, Medie_2, Mare_3) asupra timpului scurs de la prima angajare până la prima
promovare (săptămâni) se stabilește prin calculul COEFICIENTULUI DE
DETERMINAŢIE:

SSB 808,80
R2    0,7361 , Rezultatul arată că 73,61% reprezintă
SST 1098,80
influenţa mărimii firmei în variaţia timpului scurs de la angajarea inițială a unui salariat
în firmă până la prima promovare. Fiind mai mare de 50% se precizează că, mărimea
firmei influențează semnificativ timpul scurs de la prima angajare până la prima
promovare, deci COEFICIENTUL DE DETERMINAŢIE calculat ESTE semnificativ
statistic

Răspuns corect: Variația timpului scurs de la angajarea inițială a unui salariat în


firmă până la prima promovare:
9
d. este influențată semnificativ de mărimea firmei deoarece R2=73,61% >
50%

Rezultate_ One-Way ANOVA

Descriptives
Nr_Saptam
95% Confidence
Std. Std. Interval for Mean
N Mean Minimum Maximum
Deviation Error Lower Upper
Bound Bound
Mica 8 30,00 4,276 1,512 26,43 33,57 24 38
Medie 5 32,00 4,183 1,871 26,81 37,19 25 36
Mare 7 44,00 3,916 1,480 40,38 47,62 40 49
Total 20 35,40 7,605 1,700 31,84 38,96 24 49

ANOVA
Nr_Saptam

Sum of Squares df Mean Square F Sig.

Between Groups 808,800 2 404,400 23,706 ,000

Within Groups 290,000 17 17,059


Total 1098,800 19

10

S-ar putea să vă placă și