Documente Academic
Documente Profesional
Documente Cultură
O serie bidimensională prezintă variaţia unităţilor unui eşantion după două variabile de
grupare în mod simultan: fie două variabile numerice (cantitative), fie două variabile nenumerice
(calitative), fie o variabilă numerică şi o variabilă nenumerică.
Aplicaţie:
Distribuţia portofoliului de asiguraţi după vârstă (pe intervale de valori) şi genul asiguratului
este reprezentată în tabelul de mai jos.
Genul
feminin masculin
Grupa de vârstă
[18-26) 15 21
[26-31) 11 15
[31-65) 64 56
[65-70] 9 9
𝒚𝒋
feminin masculin
𝒙𝒊
[18-26) 𝑛11 = 15 𝑛12 = 21
[26-31) 𝑛21 = 11 𝑛22 = 15
[31-65) 𝑛31 = 64 𝑛32 = 56
[65-70] 𝑛41 = 9 𝑛42 = 9
Interpretare:
- frecvenţa absolută parţială 𝑛21 = 11: din totalul asiguraţilor, 11 asiguraţi sunt de genul
feminin şi se încadrează în grupa de vârstă [26-31).
1
Bazele Statisticii Seminar 6
Observaţii:
- pentru calculul lui 𝒏𝒊∙ , adunăm pe linie (𝑗 = ̅̅̅̅̅
1, 𝑝) frecvenţele absolute parţiale 𝑛𝑖𝑗 ;
- pentru calculul lui 𝒏∙𝒋 , adunăm pe coloană (𝑖 = ̅̅̅̅̅̅
1, 𝑚) frecvenţele absolute parţiale 𝑛𝑖𝑗 ;
- pentru calculul lui 𝒏∙∙ , frecvenţele marginale totale, adunăm fie pe coloană frecvenţele
absolute marginale 𝑛𝑖∙ , fie pe linie frecvenţele absolute marginale 𝑛∙𝑗 ;
𝒑
𝒚𝒋
𝑦1 = feminin 𝑦2 = masculin
𝒙𝒊 𝒏𝒊∙ = ∑ 𝒏𝒊𝒋
(𝑗 = 1) (𝑗 = 2)
𝒋=𝟏
𝑥1 = [18-26) 15 21 𝒏𝟏∙ = 𝟏𝟓 + 𝟐𝟏 = 𝟑𝟔
𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎 𝑥2 = [26-31) 11 15 𝒏𝟐∙ = 𝟏𝟏 + 𝟏𝟓 = 𝟐𝟔
𝑥3 = [31-65) 64 56 𝒏𝟑∙ = 𝟔𝟒 + 𝟓𝟔 = 𝟏𝟐𝟎
𝑥4 = [65-70] 9 9 𝒏𝟒∙ = 𝟗 + 𝟗 = 𝟏𝟖
𝒎 𝒑
𝒎 𝒏∙𝟏 𝒏∙𝟐
𝒏∙𝒋 = ∑ 𝒏𝒊𝒋 = 𝟏𝟓 + 𝟏𝟏 + 𝟔𝟒 = 𝟐𝟏 + 𝟏𝟓 + 𝟓𝟔 𝒏∙∙ = ∑ 𝒏𝒊∙ = ∑ 𝒏∙𝒋 = 𝟐𝟎𝟎
𝒊=𝟏 + 𝟗 = 𝟗𝟗 + 𝟗 = 𝟏𝟎𝟏 𝒊=𝟏 𝒋=𝟏
𝒋 = ̅̅̅̅̅
𝟏, 𝒑
Interpretare:
- efectivul marginal 𝑛3∙ = 120: din totalul asiguraţilor, 120 au vârsta cuprinsă în intervalul
[31-65) (nu specificăm nimic de genul asiguratului);
- efectivul marginal 𝑛∙2 = 101 : 101 din totalul asiguraţilor sunt de genul masculin (nu
specificăm nimic de vârsta asiguratului).
2
Bazele Statisticii Seminar 6
Observaţii:
- pentru calculul lui 𝒇𝒊𝒋 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul sau volumul
eşantionului (𝑛∙∙ ): 𝒇𝒊𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙∙ ;
- pentru calculul frecvenţele relative marginale corespunzătoare lui 𝑥𝑖 (𝒇𝒊∙ ), adunăm pe linie
(𝑗 = ̅̅̅̅̅
1, 𝑝) frecvenţele relative parţiale 𝑓𝑖𝑗 ;
- pentru calculul frecvenţele relative marginale corespunzătoare lui 𝑦𝑗 (𝒇∙𝒋 ) , adunăm pe
coloană (𝑖 = ̅̅̅̅̅̅
1, 𝑚) frecvenţele relative parţiale 𝑓𝑖𝑗 ;
- pentru calculul frecvenţele relative totale (𝒇∙∙ ), adunăm fie pe coloană frecvenţele relative
marginale 𝑓𝑖∙ , fie pe linie frecvenţele relative marginale 𝑓∙𝑗 .
𝒑
𝒚𝒋 𝒇𝒊𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙∙
𝒇𝒊∙ = ∑ 𝒇𝒊𝒋
𝒙𝒊 feminin masculin 𝒋=𝟏
[18-26) 𝑓11 = 15⁄200 = 0,075 𝑓12 = 21⁄200 = 0,105 𝒇𝟏∙ = 𝟎, 𝟎𝟕𝟓 + 𝟎, 𝟏𝟎 = 𝟎, 𝟏𝟖
𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎 [26-31) 𝑓21 = 11⁄200 = 0,055 𝑓22 = 15⁄200 = 0,075 𝒇𝟐∙ = 𝟎, 𝟎𝟓𝟓 + 𝟎, 𝟎𝟕𝟓 = 𝟎, 𝟏𝟑
[31-65) 𝑓31 = 64⁄200 = 0,32 𝑓32 = 56⁄200 = 0,28 𝒇𝟑∙ = 𝟎, 𝟑𝟐 + 𝟎, 𝟐𝟖 = 𝟎, 𝟔𝟎
[65-70] 𝑓41 = 9⁄200 = 0,045 𝑓42 = 9⁄200 = 0,045 𝒇𝟒∙ = 𝟎, 𝟎𝟒𝟓 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟏𝟎
𝒎 𝒎 𝒑
𝒇∙𝟏 = 𝟎, 𝟎𝟕𝟓 + 𝟎, 𝟎𝟓𝟓 + 𝒇∙𝟐 = 𝟎, 𝟏𝟎𝟓 + 𝟎, 𝟎𝟕𝟓 +
𝒇∙𝒋 = ∑ 𝒇𝒊𝒋 𝒇∙∙ = ∑ 𝒇𝒊∙ = ∑ 𝒇∙𝒋 = 𝟏
𝟎, 𝟑𝟐 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟒𝟗𝟓 𝟎, 𝟐𝟖 + 𝟎, 𝟎𝟒𝟓 = 𝟎, 𝟓𝟎𝟓
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏
𝒋 = ̅̅̅̅̅
𝟏, 𝒑
- frecvenţele relative marginale totale pe coloană:
𝒎 𝒎 𝒑 𝒎 𝒑
𝒏𝒊𝒋
𝒇∙∙ = ∑ 𝒇𝒊∙ = ∑ ∑ 𝒇𝒊𝒋 = ∑ ∑
𝒏∙∙
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏
- frecvenţele relative marginale totale pe linie:
𝒑 𝒑 𝒎 𝒑 𝒎
𝒏𝒊𝒋
𝒇∙∙ = ∑ 𝒇∙𝒋 = ∑ ∑ 𝒇𝒊𝒋 = ∑ ∑
𝒏∙∙
𝒋=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏 𝒊=𝟏
Interpretare:
- frecvenţa relativă marginală 𝑓4∙ = 0,10: din totalul asiguraţilor, 10% (= 0,10 ∗ 100%) au
vârsta cuprinsă în intervalul [65-70] (nu specificăm nimic de genul asiguratului);
- frecvenţa relativă marginală 𝑓∙1 = 0.49: 49,50% (= 0,495 ∗ 100%) din totalul asiguraţilor
sunt de genul feminin (nu specificăm nimic de vârsta asiguratului).
3
Bazele Statisticii Seminar 6
Observaţii:
- pentru calculul lui 𝒇𝒊⁄𝒋 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul pe fiecare
grupă 𝒋 dată de valorile variabilei 𝑌 (𝑛∙𝑗 ): 𝒇𝒊⁄𝒋 = 𝒏𝒊𝒋 ⁄𝒏∙𝒋;
- suma pe coloană (pe fiecare grupă 𝑗) reprezintă întregul, fiind întodeauna 1.
- pentru calculul lui 𝒇𝒋⁄𝒊 , împărţim frecvenţele absolute parţiale (𝑛𝑖𝑗 ) la totalul pe fiecare
grupă 𝒊 dată de valorile variabilei 𝑋 (𝑛𝑖∙ ): 𝒇𝒋⁄𝒊 = 𝒏𝒊𝒋 ⁄𝒏𝒊∙ ;
- suma pe linie (pe fiecare grupă 𝑖) reprezintă întregul, fiind întodeauna 1.
Interpretare:
- frecvenţa relativă condiţionată 𝑓1⁄1 = 0,11: din totalul asiguraţilor de gen feminin, 11%
(= 0,11 ∗ 100%) au vârsta cuprinsă în intervalul [18-26) de ani (variabila 𝑋 , vârsta
asiguratului, este condiţionată de valoarea variabilei 𝑌, feminin);
- frecvenţa relativă condiţionată 𝑓4⁄2 = 0,09: din totalul asiguraţilor de gen masculin, 9%
(= 0,9 ∗ 100%) au vârsta cuprinsă în intervalul [65-70] de ani (variabila 𝑋 , vârsta
asiguratului, este condiţionată acum de a doua valoarea a variabilei 𝑌, masculin).
4
Bazele Statisticii Seminar 6
𝒋 = ̅̅̅̅̅
𝟏, 𝒑
Interpretare:
- frecvenţa relativă condiţionată 𝑓1⁄2 = 0,42: 42% din totalul asiguraţilor cu vârsta cuprinsă
în intervalul [26-31) sunt de genul feminin (variabila 𝑌, genul asiguratului, este condiţionată
de valoarea variabilei 𝑋, 𝑥2 = [26 − 31));
- frecvenţa relativă condiţionată 𝑓2⁄1 = 0,59: 59% din totalul asiguraţilor cu vârsta cuprinsă
în intervalul [18-26), sunt de genul masculin (variabila 𝑌 , genul asiguratului, este
condiţionată de valoarea variabilei 𝑋, 𝑥1 = [18 − 26)).
5
Bazele Statisticii Seminar 6
𝒚𝒋 feminin masculin
(𝒙′𝒊 ∗ 𝒏𝒊𝒋 ) (𝒙′𝒊 ∗ 𝒏𝒊𝒋 ) 𝒏𝒊∙ (𝒙′𝒊 ∗ 𝒏𝒊∙ )
𝒙′𝒊 (𝑗 = 1) (𝑗 = 2)
22 15 (22 ∗ 15) = 330 21 (22 ∗ 15) = 472 36 (22 ∗ 36) = 792
28,5 11 (28,5 ∗ 11) = 313,5 15 (28,5 ∗ 15) = 427,5 26 (28,5 ∗ 26) = 741
48 64 (48 ∗ 64) = 3072 56 (22 ∗ 15) = 2688 120 (22 ∗ 120) = 5760
67,5 9 (67,5 ∗ 9) = 607,5 9 (67,5 ∗ 9) = 607,5 18 (67,5 ∗ 18) = 1215
𝒏∙𝒋 99 4323 101 4185 𝒏∙∙ = 𝟐𝟎𝟎 8508
1. Media pe grupa feminin sau 2. Media pe grupa masculin 4. Media pe total în funcţie de 𝑛𝑖∙
media condiţionată (de grupa media condiţionată (de grupa ∑𝒎 𝒙′ ∗ 𝒏𝒊∙
feminin) masculin) ̅ = 𝒊=𝟏𝒎 𝒊
𝒙 = 𝟒𝟐, 𝟓𝟒
∑𝒊=𝟏 𝒏𝒊∙
3. Media pe total în funcţie de 𝑥̅𝑗
∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊𝒋 ∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊𝒋
̅𝟏 =
𝒙 = 𝟒𝟑, 𝟔𝟔 ̅𝟐 =
𝒙 = 𝟒𝟏, 𝟒𝟒 ∑𝒑𝒋=𝟏 𝒙
̅𝒋 ∗ 𝒏∙𝒋
𝒏∙𝒋 𝒏∙𝒋 ̅=
𝒙 = 𝟒𝟐, 𝟓𝟒
∑𝒑𝒋=𝟏 𝒏∙𝒋
Interpretare:
- 𝑥̅1 = 43,66: un asigurat de gen feminin are vârsta medie de 43,66 ani:
- 𝑥̅2 = 41,44: un asigurat de gen masculin are, în medie, vârsta de 41,44 ani.
- media aritmetică pe total în funcţie de mediile condiţionate (pe grupe sau intragrupe) 𝑥̅𝑗
∑𝒑𝒋=𝟏 𝒙
̅𝒋 ∗ 𝒏∙𝒋 ̅𝟏 ∗ 𝒏∙𝟏 + 𝒙
𝒙 ̅𝟐 ∗ 𝒏∙𝟐 𝟒𝟑, 𝟔𝟔 ∗ 𝟗𝟗 + 𝟒𝟏, 𝟒𝟒 ∗ 𝟏𝟎𝟏 𝟒𝟑𝟐𝟑 + 𝟒𝟏𝟖𝟓
̅=
𝒙 𝒑 = = = = 𝟒𝟐, 𝟓𝟒 𝒂𝒏𝒊
∑𝒋=𝟏 𝒏∙𝒋 𝒏∙𝟏 + 𝒏∙𝟐 𝟗𝟗 + 𝟏𝟎𝟏 𝟐𝟎𝟎
Interpretare:
- 𝑥̅ = 42,54: în medie, un asigurat are vârsta de 42,54 ani.
6
Bazele Statisticii Seminar 6
3.2.2. Varianţa
Din indicatorii dispersiei, pentru analiza unei serii bidimensionale după o variabilă
numerică şi o variabilă nenumerică, de interes este varianţa.
Componentele varianţei sunt:
- varianţe condiţionate sau pe grupe (𝒔𝟐𝒋 ) sunt determinate de influenţa factorilor aleatori
sau întâmplători şi exprimă variaţia valorilor individuale 𝒙𝒊 de la mediile condiţionate
̅𝒋 : (𝒙𝒊 − 𝒙
𝒙 ̅ 𝒋 );
- varianţa între grupe sau intergrupe (𝒔𝟐𝒙̅𝒋 ) este determinată de influenţa factorilor esenţiali
şi exprimă variaţia mediilor intragrupe sau pe grupe 𝒙 ̅𝒋 de la media totală 𝒙̅ 𝒋 : (𝒙
̅ 𝒋 − 𝒙̅ );
factorii esenţiali sunt factorii care grupează colectivitatea statistică în mai multe
categorii: de exemplu genul asiguratului;
- varianţa totală (𝒔𝟐𝑿 ) include influenţa ambelor categorii de factori, întâmplători şi de
grupare, şi exprimă variaţia valorilor individuale 𝒙𝒊 de la media totală 𝒙
̅: (𝒙𝒊 − 𝒙 ̅ );
- regula de adunare a varianţelor este:
̅̅̅𝟐 ) + varianţa intergrupe (𝒔𝟐 )
varianţa totală (𝒔𝟐𝑿 ) = media varianţelor intragrupe (𝒔 ̅𝒋
𝒙
a. Să se măsoare dispersia sub influenţa factorilor aleatori pentru fiecare grupă de asiguraţi
(după gen) şi media varianţelor intragrupe.
feminin masculin
𝒚𝒋 (𝑗 = 1) (𝑗 = 2)
𝒙′𝒊 (𝒙′𝒊 − 𝒙
𝟐
(𝒙′𝒊 − 𝒙
𝟐 4. Varianţa între grupe (intergrupe)
̅𝟏 ) (𝒙′𝒊 − 𝒙
̅𝟏 ) ∗ 𝒏𝒊𝒋 ̅𝟐 ) (𝒙′𝒊 − 𝒙
̅𝟐 ) ∗ 𝒏𝒊𝒋
22 -24,67 9129,134 -19,44 7936,186
28,5 -18,17 3631,638 -12,94 2511,654 𝟐
∑𝒑𝒋=𝒊(𝒙
̅𝒋 − 𝒙
̅) ∗ 𝒏∙𝒋
48 1,33 113,2096 6,56 2409,882 𝒔̅𝟐𝒙̅𝒋 =
67,5 20,83 3905 26,06 6112,112 ∑𝒑𝒋=𝟏 𝒏∙𝒋
Total - 16778,98 - 18969,83
1. Varianţa pe grupa feminin 2. Varianţa pe grupa masculin 3. Media varianţelor de grupă
′ 𝟐 ′ 𝟐
∑𝒎 ̅𝑭 ) ∗ 𝒏𝒊𝒋
𝒊=𝟏(𝒙𝒊 − 𝒙 ∑𝒎 ̅𝑴 ) ∗ 𝒏𝒊𝒋
𝒊=𝟏(𝒙𝒊 − 𝒙 ∑𝒑𝒋=𝒊 𝒔𝟐𝒋 ∗ 𝒏∙𝒋
𝒔𝟐𝟏 = 𝒔𝟐𝟐 = ̅̅̅
𝒔𝟐 = = 𝟏𝟕𝟖, 𝟕𝟖
𝒏∙𝟏 𝒏∙𝟐 ∑𝒑𝒋=𝟏 𝒏∙𝒋
= 𝟏𝟔𝟗, 𝟒𝟗 = 𝟏𝟖𝟕, 𝟖𝟐
- varianţa condiţionată (de grupa feminin) sau varianţa intragrupă care măsoara variaţia în
cadrul grupei feminin:
′ 𝟐
∑𝒎 ̅𝟏 ) ∗ 𝒏𝒊𝒋 𝟏𝟔𝟕𝟕𝟖, 𝟗𝟖
𝒊=𝟏(𝒙𝒊 − 𝒙
𝒔𝟐𝟏 = = = 𝟏𝟔𝟗, 𝟒𝟗
𝒏∙𝟏 𝟗𝟗
- varianţa condiţionată (de grupa masculin) sau varianţa intragrupă care măsoara variaţia
în cadrul grupei masculin:
′ 𝟐
∑𝒎 ̅𝟐 ) ∗ 𝒏𝒊𝒋 𝟏𝟖𝟗𝟔𝟗, 𝟖𝟑
𝒊=𝟏(𝒙𝒊 − 𝒙
𝒔𝟐𝟐 = = = 𝟏𝟖𝟕, 𝟖𝟐
𝒏∙𝟐 𝟏𝟎𝟏
7
Bazele Statisticii Seminar 6
- media varianţelor de grupă este una din componentele varianţei totale şi se determină:
∑𝒑𝒋=𝒊 𝒔𝟐𝒋 ∗ 𝒏∙𝒋 𝒔𝟐𝟏 ∗ 𝒏∙𝟏 + 𝒔𝟐𝟐 ∗ 𝒏∙𝟐 𝟏𝟔𝟗, 𝟒𝟗 ∗ 𝟗𝟗 + 𝟏𝟖𝟕, 𝟖𝟐 ∗ 𝟏𝟎𝟏
̅̅̅
𝟐
𝒔 = = = = 𝟏𝟕𝟖, 𝟕𝟖
∑𝒑𝒋=𝟏 𝒏∙𝒋 𝒏∙𝟏 + 𝒏∙𝟐 𝟗𝟗 + 𝟏𝟎𝟏
Observaţii:
- varianţa nu are unitate de măsură şi nu se interpretează;
- pe baza varianţei se calculează abaterea standard ca radical din valoarea varianţei; abaterea
standard are aceeaşi unitate de măsură ca a variabilei analizate şi se interpretează.