Sunteți pe pagina 1din 8

Bazele Statisticii Seminar 6

3. ANALIZA UNEI SERII STATISTICE BIDIMENSIONALE (BIVARIATE)

O serie bidimensională prezintă variaţia unităţilor unui eşantion după două variabile de
grupare în mod simultan: fie două variabile numerice (cantitative), fie două variabile nenumerice
(calitative), fie o variabilă numerică şi o variabilă nenumerică.

Aplicaţie:
Distribuţia portofoliului de asiguraţi după vârstă (pe intervale de valori) şi genul asiguratului
este reprezentată în tabelul de mai jos.

Tabel 1. Distribuţia eşantionului de asigurăţi după grupa de vârstă şi genul asiguratului

Genul
feminin masculin
Grupa de vârstă
[18-26) 15 21
[26-31) 11 15
[31-65) 64 56
[65-70] 9 9

3.1. Prezentarea seriei

a. Să se caracterizeze seria de date pe baza tabelului de mai sus.


Este o serie de date bidimensională (bivariată) care prezintă variaţia asiguraţilor (unităţilor
statistice) după două variabile statistice (caracteristici) în mod simultan: o variabilă numerică
continuă - vârsta asiguratului (𝑋) şi o variabilă nenumerică nominală - genul asiguratului (𝑌).
- valorile variabilei 𝑋 sunt 𝑥𝑖 (𝑖 = ̅̅̅̅̅̅
1, 𝑚) şi sunt reprezentate prin intervale de valori [𝑥𝑖−1 , 𝑥𝑖 ):
[18 − 26), [26 − 31), [31 − 65), [65 − 70] ;
- valorile variabilei 𝑌 sunt 𝑦𝑗 (𝑗 = ̅̅̅̅̅
1, 𝑝) şi sunt reprezentate prin categoriile feminin (𝑦1 ) şi
masculin (𝑦2 ).
Distribuţia asiguraţilor după grupa de vârstă şi genul asiguraţilor este reprezentată prin cuplul
de valori (𝑥𝑖 , 𝑦𝑗 , 𝑛𝑖𝑗 ), unde:
- 𝑛𝑖𝑗 reprezintă frecvenţele absolute parţiale corespunzătoare valorilor 𝑥𝑖 şi 𝑦𝑗 .
Folosind simbolurile de mai sus, tabelul 1 se poate rescrie astfel:

𝒚𝒋
feminin masculin
𝒙𝒊
[18-26) 𝑛11 = 15 𝑛12 = 21
[26-31) 𝑛21 = 11 𝑛22 = 15
[31-65) 𝑛31 = 64 𝑛32 = 56
[65-70] 𝑛41 = 9 𝑛42 = 9
Interpretare:
- frecvenţa absolută parţială 𝑛21 = 11: din totalul asiguraţilor, 11 asiguraţi sunt de genul
feminin şi se încadrează în grupa de vârstă [26-31).

1
Bazele Statisticii Seminar 6

b. Să se calculeze efectivele (frecvenţele) marginale corespunzătoare lui 𝒙𝒊 , efectivele


marginale corespunzătoare lui 𝒚𝒋 şi efectivele marginale totale.

În cadrul unei distribuţii bidimensionale, se disting: distribuţii marginele şi distribuţii


condiţionate. Distribuţiile marginale se împart în:
- distribuţia marginală în 𝑋 reprezentată de cuplul de valori (𝑥𝑖 , 𝑛𝑖∙ ): 𝑿: (𝒙𝒊 , 𝒏𝒊∙ ), unde 𝒏𝒊∙
sunt frecvenţele absolute marginale corespunzătoare valorii 𝑥𝑖 ;
- distribuţia marginală în 𝑌 reprezentată de cuplul de valori (𝑦𝑗 , 𝑛∙𝑗 ): 𝒀: (𝒚𝒋 , 𝒏∙𝒋 ), unde 𝒏∙𝒋
sunt frecvenţele absolute marginale corespunzătoare valorii 𝑦𝑗 ;

Observaţii:
- pentru calculul lui 𝒏𝒊∙ , adunăm pe linie (𝑗 = ̅̅̅̅̅
1, 𝑝) frecvenţele absolute parţiale 𝑛𝑖𝑗 ;
- pentru calculul lui 𝒏∙𝒋 , adunăm pe coloană (𝑖 = ̅̅̅̅̅̅
1, 𝑚) frecvenţele absolute parţiale 𝑛𝑖𝑗 ;
- pentru calculul lui 𝒏∙∙ , frecvenţele marginale totale, adunăm fie pe coloană frecvenţele
absolute marginale 𝑛𝑖∙ , fie pe linie frecvenţele absolute marginale 𝑛∙𝑗 ;
𝒑
𝒚𝒋
𝑦1 = feminin 𝑦2 = masculin
𝒙𝒊 𝒏𝒊∙ = ∑ 𝒏𝒊𝒋
(𝑗 = 1) (𝑗 = 2)
𝒋=𝟏
𝑥1 = [18-26) 15 21 𝒏𝟏∙ = 𝟏𝟓 + 𝟐𝟏 = 𝟑𝟔
𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎 𝑥2 = [26-31) 11 15 𝒏𝟐∙ = 𝟏𝟏 + 𝟏𝟓 = 𝟐𝟔
𝑥3 = [31-65) 64 56 𝒏𝟑∙ = 𝟔𝟒 + 𝟓𝟔 = 𝟏𝟐𝟎
𝑥4 = [65-70] 9 9 𝒏𝟒∙ = 𝟗 + 𝟗 = 𝟏𝟖
𝒎 𝒑
𝒎 𝒏∙𝟏 𝒏∙𝟐
𝒏∙𝒋 = ∑ 𝒏𝒊𝒋 = 𝟏𝟓 + 𝟏𝟏 + 𝟔𝟒 = 𝟐𝟏 + 𝟏𝟓 + 𝟓𝟔 𝒏∙∙ = ∑ 𝒏𝒊∙ = ∑ 𝒏∙𝒋 = 𝟐𝟎𝟎
𝒊=𝟏 + 𝟗 = 𝟗𝟗 + 𝟗 = 𝟏𝟎𝟏 𝒊=𝟏 𝒋=𝟏

𝒋 = ̅̅̅̅̅
𝟏, 𝒑

- frecvenţele absolute marginale totale pe coloană:


𝒎 𝒎 𝒑

𝒏∙∙ = ∑ 𝒏𝒊∙ = ∑ ∑ 𝒏𝒊𝒋


𝒊=𝟏 𝒊=𝟏 𝒋=𝟏

- frecvenţele absolute marginale totale pe linie:


𝒑 𝒑 𝒎

𝒏∙∙ = ∑ 𝒏∙𝒋 = ∑ ∑ 𝒏𝒊𝒋


𝒋=𝟏 𝒋=𝟏 𝒊=𝟏

Interpretare:
- efectivul marginal 𝑛3∙ = 120: din totalul asiguraţilor, 120 au vârsta cuprinsă în intervalul
[31-65) (nu specificăm nimic de genul asiguratului);
- efectivul marginal 𝑛∙2 = 101 : 101 din totalul asiguraţilor sunt de genul masculin (nu
specificăm nimic de vârsta asiguratului).

2
Bazele Statisticii Seminar 6

c. Să se calculeze frecvenţele relative parţiale, frecvenţele relative marginale corespunzătoare


lui 𝒙𝒊 , frecvenţele relative marginale corespunzătoare lui 𝒚𝒋 şi frecvenţele relative marginale
totale.
Calculul frecvenţelor relative marginale se bazează pe frecvenţele relative parţiale (𝑓𝑖𝑗 ), care
ne arată ponderea unei anumite grupe din total.

Observaţii:
- pentru calculul lui 𝒇𝒊𝒋 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul sau volumul
eşantionului (𝑛∙∙ ): 𝒇𝒊𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙∙ ;
- pentru calculul frecvenţele relative marginale corespunzătoare lui 𝑥𝑖 (𝒇𝒊∙ ), adunăm pe linie
(𝑗 = ̅̅̅̅̅
1, 𝑝) frecvenţele relative parţiale 𝑓𝑖𝑗 ;
- pentru calculul frecvenţele relative marginale corespunzătoare lui 𝑦𝑗 (𝒇∙𝒋 ) , adunăm pe
coloană (𝑖 = ̅̅̅̅̅̅
1, 𝑚) frecvenţele relative parţiale 𝑓𝑖𝑗 ;
- pentru calculul frecvenţele relative totale (𝒇∙∙ ), adunăm fie pe coloană frecvenţele relative
marginale 𝑓𝑖∙ , fie pe linie frecvenţele relative marginale 𝑓∙𝑗 .
𝒑
𝒚𝒋 𝒇𝒊𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙∙
𝒇𝒊∙ = ∑ 𝒇𝒊𝒋
𝒙𝒊 feminin masculin 𝒋=𝟏
[18-26) 𝑓11 = 15⁄200 = 0,075 𝑓12 = 21⁄200 = 0,105 𝒇𝟏∙ = 𝟎, 𝟎𝟕𝟓 + 𝟎, 𝟏𝟎 = 𝟎, 𝟏𝟖
𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎 [26-31) 𝑓21 = 11⁄200 = 0,055 𝑓22 = 15⁄200 = 0,075 𝒇𝟐∙ = 𝟎, 𝟎𝟓𝟓 + 𝟎, 𝟎𝟕𝟓 = 𝟎, 𝟏𝟑
[31-65) 𝑓31 = 64⁄200 = 0,32 𝑓32 = 56⁄200 = 0,28 𝒇𝟑∙ = 𝟎, 𝟑𝟐 + 𝟎, 𝟐𝟖 = 𝟎, 𝟔𝟎
[65-70] 𝑓41 = 9⁄200 = 0,045 𝑓42 = 9⁄200 = 0,045 𝒇𝟒∙ = 𝟎, 𝟎𝟒𝟓 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟏𝟎
𝒎 𝒎 𝒑
𝒇∙𝟏 = 𝟎, 𝟎𝟕𝟓 + 𝟎, 𝟎𝟓𝟓 + 𝒇∙𝟐 = 𝟎, 𝟏𝟎𝟓 + 𝟎, 𝟎𝟕𝟓 +
𝒇∙𝒋 = ∑ 𝒇𝒊𝒋 𝒇∙∙ = ∑ 𝒇𝒊∙ = ∑ 𝒇∙𝒋 = 𝟏
𝟎, 𝟑𝟐 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟒𝟗𝟓 𝟎, 𝟐𝟖 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟓𝟎𝟓
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏

𝒋 = ̅̅̅̅̅
𝟏, 𝒑
- frecvenţele relative marginale totale pe coloană:
𝒎 𝒎 𝒑 𝒎 𝒑
𝒏𝒊𝒋
𝒇∙∙ = ∑ 𝒇𝒊∙ = ∑ ∑ 𝒇𝒊𝒋 = ∑ ∑
𝒏∙∙
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏
- frecvenţele relative marginale totale pe linie:
𝒑 𝒑 𝒎 𝒑 𝒎
𝒏𝒊𝒋
𝒇∙∙ = ∑ 𝒇∙𝒋 = ∑ ∑ 𝒇𝒊𝒋 = ∑ ∑
𝒏∙∙
𝒋=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏 𝒊=𝟏

Interpretare:
- frecvenţa relativă marginală 𝑓4∙ = 0,10: din totalul asiguraţilor, 10% (= 0,10 ∗ 100%) au
vârsta cuprinsă în intervalul [65-70] (nu specificăm nimic de genul asiguratului);
- frecvenţa relativă marginală 𝑓∙1 = 0.49: 49,50% (= 0,495 ∗ 100%) din totalul asiguraţilor
sunt de genul feminin (nu specificăm nimic de vârsta asiguratului).

3
Bazele Statisticii Seminar 6

d. Să se calculeze frecvenţele relative condiţionate corespunzătoare distribuţiei condiţionate


a variabilei 𝑿 în funcţie de variabila 𝒀 şi frecvenţele relative condiţionate corespunzătoare
distribuţiei condiţionate a variabilei 𝒀 în 𝑿.

Distribuţiile condiţionate se împart în:


- distribuţia condiţionată a variabilei 𝑋 în funcţie de variabila 𝑌 este definită pentru fiecare
valoare 𝑦𝑗 , fiind reprezentată de cuplul de valori (𝑥𝑖 , 𝑛𝑖𝑗 ): 𝑿: (𝒙𝒊 , 𝒏𝒊𝒋 );
- acestei distribuţii îi corespund frecvenţele relative condiţionate 𝒇𝒊⁄𝒋.

- distribuţia condiţionată a variabilei 𝑌 în funcţie de variabila 𝑋 este definită de fiecare valoare


𝑥𝑖 , fiind reprezentată de cuplul de valori (𝑦𝑗 , 𝑛𝑖𝑗 ): 𝒀: (𝒚𝒋 , 𝒏𝒊𝒋 );
- acestei distribuţii îi corespund frecvenţele relative condiţionate 𝒇𝒋⁄𝒊 .

Observaţii:
- pentru calculul lui 𝒇𝒊⁄𝒋 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul pe fiecare
grupă 𝒋 dată de valorile variabilei 𝑌 (𝑛∙𝑗 ): 𝒇𝒊⁄𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙𝒋;
- suma pe coloană (pe fiecare grupă 𝑗) reprezintă întregul, fiind întodeauna 1.

- pentru calculul lui 𝒇𝒋⁄𝒊 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul pe fiecare
grupă 𝒊 dată de valorile variabilei 𝑋 (𝑛𝑖∙ ): 𝒇𝒋⁄𝒊 = 𝒏𝒊𝒋 ⁄𝒏𝒊∙ ;
- suma pe linie (pe fiecare grupă 𝑖) reprezintă întregul, fiind întodeauna 1.

Frecvenţele relative condiţionate 𝒇𝒊⁄𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙𝒋


𝒚𝒋
feminin masculin
𝒙𝒊
[18-26) 𝑓1⁄1 = 15⁄99 = 0,15 𝑓1⁄2 = 21⁄101 = 0,20
𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎 [26-31) 𝑓2⁄1 = 11⁄99 = 0,11 𝑓2⁄2 = 15⁄101 = 0,15
[31-65) 𝑓3⁄1 = 64⁄99 = 0,65 𝑓3⁄2 = 56⁄101 = 0,55
[65-70] 𝑓4⁄1 = 9⁄99 = 0,09 𝑓4⁄2 = 9⁄101 = 0,09
𝒎 𝒎
𝒏𝒊𝒋 (𝟎, 𝟏𝟓 + 𝟎, 𝟏𝟏 + 𝟎, 𝟔𝟓 (𝟎, 𝟐𝟎 + 𝟎, 𝟏𝟓 + 𝟎, 𝟓𝟓
∑ 𝒇𝒊⁄𝒋 = ∑
𝒏∙𝒋 + 𝟎, 𝟎𝟗) = 𝟏 + 𝟎, 𝟎𝟗) = 𝟏
𝒊=𝟏 𝒊=𝟏

Interpretare:
- frecvenţa relativă condiţionată 𝑓1⁄1 = 0,11: din totalul asiguraţilor de gen feminin, 11%
(= 0,11 ∗ 100%) au vârsta cuprinsă în intervalul [18-26) de ani (variabila 𝑋 , vârsta
asiguratului, este condiţionată de valoarea variabilei 𝑌, feminin);
- frecvenţa relativă condiţionată 𝑓4⁄2 = 0,09: din totalul asiguraţilor de gen masculin, 9%
(= 0,9 ∗ 100%) au vârsta cuprinsă în intervalul [65-70] de ani (variabila 𝑋 , vârsta
asiguratului, este condiţionată acum de a doua valoarea a variabilei 𝑌, masculin).

4
Bazele Statisticii Seminar 6

Frecvenţele relative condiţionate 𝒇𝒋⁄𝒊 = 𝒏𝒊𝒋 ⁄𝒏𝒊∙


𝒑 𝒑
𝒚𝒋 𝒏𝒊𝒋
feminin masculin ∑ 𝒇𝒋⁄𝒊 = ∑
𝒙𝒊 𝒏𝒊∙
𝒋=𝟏 𝒋=𝟏
[18-26) 𝑓1⁄1 = 15⁄36 = 0,41 𝑓2⁄1 = 21⁄36 = 0,59 (𝟎, 𝟒𝟏 + 𝟎, 𝟓𝟗) = 𝟏
[26-31) 𝑓1⁄2 = 11⁄26 = 0,42 𝑓2⁄2 = 15⁄26 = 0,58 (𝟎, 𝟒𝟐 + 𝟎, 𝟓𝟖) = 𝟏
[31-65) 𝑓1⁄3 = 64⁄120 = 0,53 𝑓2⁄3 = 56⁄120 = 0,47 (𝟎, 𝟓𝟑 + 𝟎, 𝟒𝟕) = 𝟏
[65-70] 𝑓1⁄4 = 9⁄18 = 0,5 𝑓2⁄4 = 9⁄18 = 0,5 (𝟎, 𝟓𝟎 + 𝟎, 𝟓𝟎) = 𝟏

𝒋 = ̅̅̅̅̅
𝟏, 𝒑

Interpretare:
- frecvenţa relativă condiţionată 𝑓1⁄2 = 0,42: 42% din totalul asiguraţilor cu vârsta cuprinsă
în intervalul [26-31) sunt de genul feminin (variabila 𝑌, genul asiguratului, este condiţionată
de valoarea variabilei 𝑋, 𝑥2 = [26 − 31));
- frecvenţa relativă condiţionată 𝑓2⁄1 = 0,59: 59% din totalul asiguraţilor cu vârsta cuprinsă
în intervalul [18-26), sunt de genul masculin (variabila 𝑌 , genul asiguratului, este
condiţionată de valoarea variabilei 𝑋, 𝑥1 = [18 − 26)).

5
Bazele Statisticii Seminar 6

3.2. Analiza seriei bidimensionale folosind indicatori ai statisticii descriptive (media


aritmetică, varianţa şi abaterea standard)

3.2.1. Media aritmetică


Pentru analiza unei serii bidimensionale după o variabilă numerică şi o variabilă nenumerică,
se poate calcula media aritmetică a variabilei numerice, o dată, pe grupele date de variabila
nenumerică, şi, pe urmă, media aritmetică pe total a variabilei numerice.

a. Să se calculeze vârsta medie în funcţie de genul asiguratului.

𝒚𝒋 feminin masculin
(𝒙′𝒊 ∗ 𝒏𝒊𝒋 ) (𝒙′𝒊 ∗ 𝒏𝒊𝒋 ) 𝒏𝒊∙ (𝒙′𝒊 ∗ 𝒏𝒊∙ )
𝒙′𝒊 (𝑗 = 1) (𝑗 = 2)
22 15 (22 ∗ 15) = 330 21 (22 ∗ 15) = 472 36 (22 ∗ 36) = 792
28,5 11 (28,5 ∗ 11) = 313,5 15 (28,5 ∗ 15) = 427,5 26 (28,5 ∗ 26) = 741
48 64 (48 ∗ 64) = 3072 56 (22 ∗ 15) = 2688 120 (22 ∗ 120) = 5760
67,5 9 (67,5 ∗ 9) = 607,5 9 (67,5 ∗ 9) = 607,5 18 (67,5 ∗ 18) = 1215
𝒏∙𝒋 99 4323 101 4185 𝒏∙∙ = 𝟐𝟎𝟎 8508
1. Media pe grupa feminin sau 2. Media pe grupa masculin 4. Media pe total în funcţie de 𝑛𝑖∙
media condiţionată (de grupa media condiţionată (de grupa ∑𝒎 𝒙′ ∗ 𝒏𝒊∙
feminin) masculin) ̅ = 𝒊=𝟏𝒎 𝒊
𝒙 = 𝟒𝟐, 𝟓𝟒
∑𝒊=𝟏 𝒏𝒊∙
3. Media pe total în funcţie de 𝑥̅𝑗
∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊𝒋 ∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊𝒋
̅𝟏 =
𝒙 = 𝟒𝟑, 𝟔𝟔 ̅𝟐 =
𝒙 = 𝟒𝟏, 𝟒𝟒 ∑𝒑𝒋=𝟏 𝒙
̅𝒋 ∗ 𝒏∙𝒋
𝒏∙𝒋 𝒏∙𝒋 ̅=
𝒙 = 𝟒𝟐, 𝟓𝟒
∑𝒑𝒋=𝟏 𝒏∙𝒋

Interpretare:
- 𝑥̅1 = 43,66: un asigurat de gen feminin are vârsta medie de 43,66 ani:
- 𝑥̅2 = 41,44: un asigurat de gen masculin are, în medie, vârsta de 41,44 ani.

b. Să se calculeze vârsta medie pe total.

- media aritmetică pe total în funcţie de mediile condiţionate (pe grupe sau intragrupe) 𝑥̅𝑗
∑𝒑𝒋=𝟏 𝒙
̅𝒋 ∗ 𝒏∙𝒋 ̅𝟏 ∗ 𝒏∙𝟏 + 𝒙
𝒙 ̅𝟐 ∗ 𝒏∙𝟐 𝟒𝟑, 𝟔𝟔 ∗ 𝟗𝟗 + 𝟒𝟏, 𝟒𝟒 ∗ 𝟏𝟎𝟏 𝟒𝟑𝟐𝟑 + 𝟒𝟏𝟖𝟓
̅=
𝒙 𝒑 = = = = 𝟒𝟐, 𝟓𝟒 𝒂𝒏𝒊
∑𝒋=𝟏 𝒏∙𝒋 𝒏∙𝟏 + 𝒏∙𝟐 𝟗𝟗 + 𝟏𝟎𝟏 𝟐𝟎𝟎

- media aritmetică pe total în funcţie de frecvenţele absolute marginale 𝑛𝑖∙


∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊∙ 𝟖𝟓𝟎𝟖
̅=
𝒙 𝒎 = = 𝟒𝟐, 𝟓𝟒 𝒂𝒏𝒊
∑𝒊=𝟏 𝒏𝒊∙ 𝟐𝟎𝟎

Interpretare:
- 𝑥̅ = 42,54: în medie, un asigurat are vârsta de 42,54 ani.

6
Bazele Statisticii Seminar 6

3.2.2. Varianţa
Din indicatorii dispersiei, pentru analiza unei serii bidimensionale după o variabilă
numerică şi o variabilă nenumerică, de interes este varianţa.
Componentele varianţei sunt:
- varianţe condiţionate sau pe grupe (𝒔𝟐𝒋 ) sunt determinate de influenţa factorilor aleatori
sau întâmplători şi exprimă variaţia valorilor individuale 𝒙𝒊 de la mediile condiţionate
̅𝒋 : (𝒙𝒊 − 𝒙
𝒙 ̅ 𝒋 );
- varianţa între grupe sau intergrupe (𝒔𝟐𝒙̅𝒋 ) este determinată de influenţa factorilor esenţiali
şi exprimă variaţia mediilor intragrupe sau pe grupe 𝒙 ̅𝒋 de la media totală 𝒙̅ 𝒋 : (𝒙
̅ 𝒋 − 𝒙̅ );
factorii esenţiali sunt factorii care grupează colectivitatea statistică în mai multe
categorii: de exemplu genul asiguratului;
- varianţa totală (𝒔𝟐𝑿 ) include influenţa ambelor categorii de factori, întâmplători şi de
grupare, şi exprimă variaţia valorilor individuale 𝒙𝒊 de la media totală 𝒙
̅: (𝒙𝒊 − 𝒙 ̅ );
- regula de adunare a varianţelor este:
̅̅̅𝟐 ) + varianţa intergrupe (𝒔𝟐 )
varianţa totală (𝒔𝟐𝑿 ) = media varianţelor intragrupe (𝒔 ̅𝒋
𝒙

a. Să se măsoare dispersia sub influenţa factorilor aleatori pentru fiecare grupă de asiguraţi
(după gen) şi media varianţelor intragrupe.

feminin masculin
𝒚𝒋 (𝑗 = 1) (𝑗 = 2)
𝒙′𝒊 (𝒙′𝒊 − 𝒙
𝟐
(𝒙′𝒊 − 𝒙
𝟐 4. Varianţa între grupe (intergrupe)
̅𝟏 ) (𝒙′𝒊 − 𝒙
̅𝟏 ) ∗ 𝒏𝒊𝒋 ̅𝟐 ) (𝒙′𝒊 − 𝒙
̅𝟐 ) ∗ 𝒏𝒊𝒋
22 -24,67 9129,134 -19,44 7936,186
28,5 -18,17 3631,638 -12,94 2511,654 𝟐
∑𝒑𝒋=𝒊(𝒙
̅𝒋 − 𝒙
̅) ∗ 𝒏∙𝒋
48 1,33 113,2096 6,56 2409,882 𝒔̅𝟐𝒙̅𝒋 =
67,5 20,83 3905 26,06 6112,112 ∑𝒑𝒋=𝟏 𝒏∙𝒋
Total - 16778,98 - 18969,83
1. Varianţa pe grupa feminin 2. Varianţa pe grupa masculin 3. Media varianţelor de grupă
′ 𝟐 ′ 𝟐
∑𝒎 ̅𝑭 ) ∗ 𝒏𝒊𝒋
𝒊=𝟏(𝒙𝒊 − 𝒙 ∑𝒎 ̅𝑴 ) ∗ 𝒏𝒊𝒋
𝒊=𝟏(𝒙𝒊 − 𝒙 ∑𝒑𝒋=𝒊 𝒔𝟐𝒋 ∗ 𝒏∙𝒋
𝒔𝟐𝟏 = 𝒔𝟐𝟐 = ̅̅̅
𝒔𝟐 = = 𝟏𝟕𝟖, 𝟕𝟖
𝒏∙𝟏 𝒏∙𝟐 ∑𝒑𝒋=𝟏 𝒏∙𝒋
= 𝟏𝟔𝟗, 𝟒𝟗 = 𝟏𝟖𝟕, 𝟖𝟐

- varianţa condiţionată (de grupa feminin) sau varianţa intragrupă care măsoara variaţia în
cadrul grupei feminin:
′ 𝟐
∑𝒎 ̅𝟏 ) ∗ 𝒏𝒊𝒋 𝟏𝟔𝟕𝟕𝟖, 𝟗𝟖
𝒊=𝟏(𝒙𝒊 − 𝒙
𝒔𝟐𝟏 = = = 𝟏𝟔𝟗, 𝟒𝟗
𝒏∙𝟏 𝟗𝟗

- varianţa condiţionată (de grupa masculin) sau varianţa intragrupă care măsoara variaţia
în cadrul grupei masculin:
′ 𝟐
∑𝒎 ̅𝟐 ) ∗ 𝒏𝒊𝒋 𝟏𝟖𝟗𝟔𝟗, 𝟖𝟑
𝒊=𝟏(𝒙𝒊 − 𝒙
𝒔𝟐𝟐 = = = 𝟏𝟖𝟕, 𝟖𝟐
𝒏∙𝟐 𝟏𝟎𝟏

7
Bazele Statisticii Seminar 6

- media varianţelor de grupă este una din componentele varianţei totale şi se determină:
∑𝒑𝒋=𝒊 𝒔𝟐𝒋 ∗ 𝒏∙𝒋 𝒔𝟐𝟏 ∗ 𝒏∙𝟏 + 𝒔𝟐𝟐 ∗ 𝒏∙𝟐 𝟏𝟔𝟗, 𝟒𝟗 ∗ 𝟗𝟗 + 𝟏𝟖𝟕, 𝟖𝟐 ∗ 𝟏𝟎𝟏
̅̅̅
𝟐
𝒔 = = = = 𝟏𝟕𝟖, 𝟕𝟖
∑𝒑𝒋=𝟏 𝒏∙𝒋 𝒏∙𝟏 + 𝒏∙𝟐 𝟗𝟗 + 𝟏𝟎𝟏

b. Să se măsoare varianţa sub influenţa factorului de grupare (genul asiguratului).


𝟐
∑𝒑𝒋=𝒊(𝒙
̅𝒋 − 𝒙
̅) ∗ 𝒏∙𝒋 (𝒙 ̅)𝟐 ∗ 𝒏∙𝟏 + (𝒙
̅𝟏 − 𝒙 ̅)𝟐 ∗ 𝒏∙𝟐
̅𝟐 − 𝒙
𝒔̅𝟐̅𝒙𝒋 = =
∑𝒑𝒋=𝟏 𝒏∙𝒋 𝒏∙𝟏 + 𝒏∙𝟐
(𝟒𝟑, 𝟔𝟔 − 𝟒𝟐, 𝟓𝟒)𝟐 ∗ 𝟗𝟗 + (𝟒𝟏, 𝟒𝟒 − 𝟒𝟐, 𝟓𝟒)𝟐 ∗ 𝟏𝟎𝟏 𝟏𝟖𝟏𝟎, 𝟖𝟒
𝒔̅𝟐𝒙̅𝒋 = = = 𝟗, 𝟎𝟓
𝟗𝟗 + 𝟏𝟎𝟏 𝟐𝟎𝟎

c. Să se măsoare dispersia portofoliului de asiguraţi din punct de vedere al grupei de vârstă


după genul asiguratului, folosind regula de adunare a varianţelor.
𝒔𝟐𝑿 = 𝒔̅𝟐 + 𝒔̅𝟐𝒙̅𝒋 = 𝟏𝟕𝟖, 𝟕𝟖 + 𝟗, 𝟎𝟓 = 𝟏𝟖𝟕, 𝟖𝟑

Observaţii:
- varianţa nu are unitate de măsură şi nu se interpretează;
- pe baza varianţei se calculează abaterea standard ca radical din valoarea varianţei; abaterea
standard are aceeaşi unitate de măsură ca a variabilei analizate şi se interpretează.

S-ar putea să vă placă și