Documente Academic
Documente Profesional
Documente Cultură
Cap2 PDF
Cap2 PDF
Tabel 2.2.
Frecvenţe de grupă a unei populaţii formate din N unităţi descrisă prin
patru caracteristici calitative (U1, U2, U3, U4)
Ordinul r al grupei de
Frecvenţe de grupă de ordinul r r = 0,4 ; n = 1,4
unităţi r = 0,4
0 N
(U1) (U2) (U3) (U4)
1
(U1 ) (U 2 ) (U 3 ) (U 4 )
(U1 U 2 ) (U1 U 3 ) (U1 U 4 ) (U 2 U 3 ) (U 2 U 4 ) (U 3 U 4 )
(U1 U 2 ) (U1 U 3 ) (U1 U 4 ) (U 2 U 3 ) (U 2 U 4 ) (U 3 U 4 )
2
(U1 U 2 ) (U1 U 3 ) (U1 U 4 ) (U 2 U 3 ) (U 2 U 4 ) (U 3 U 4 )
(U1 U 2 ) (U1 U 3 ) (U1 U 4 ) (U 2 U 3 ) (U 2 U 4 ) (U 3 U 4 )
Capitolul II 45
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
3
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 ) (U1 U 2 U 4 ) (U1 U 3 U 4 ) (U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
4
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
(U1 U 2 U 3 U 4 ) (U1 U 2 U 3 U 4 )
Tabel 2.3
1
Noţiunea de “izotropie” provine din fizică şi se referă la însuţirea unei substanţe de a avea
proprietăţi identice cu altele, indiferent de timpul şi spaţiul în care ele sunt măsurate. În
statistică, izotropia – în sensul amintit – se referă la însuşirea unor grupări multiple de a
avea asocieri de acelaşi semn în fiecare pătrat elementar.
50 Statistică generală
afecta direct omogenitatea şi compatibilitatea în ansamblul
datelor culese).
2. O clasificare multiplă poate fi privită ca o succesiune de
dichotomii. La fiecare partiţionare, o unitate poate fi inclusă în
una din alternativele U1 sau U 1 , U2 sau U 2 şi combinaţii ale
acestora. Dacă datele provin dintr-un sondaj statistic,
problematica expusă (prin implicaţiile ei) capătă dimensiuni
exprimate în termeni de estimaţii şi care se va trata în capitolul
3.
3. Cea mai importantă clasificare de tip omogen a unităţilor
populaţiei statistice este prin care toate aceste unităţi se distribuie
după o singură “stare” a variabilei calitative studiate. Aceasta
conduce la un tip de clasificare (clusterizare) ierarhică.
4. Deseori se întâlnesc clasificări multiple prezentate în tabele de
contingenţă aparent neizotropice. În practică, însă, printr-o
rearanjare convenabilă (scopului) a unor coloane sau rânduri din
tabele studiate se pot obţine tabele transformate cu proprietăţi
de izotropie; acestea pot, apoi, să fie reduse la tabele de tip 2x2
fără să existe riscul obţinerii unor asocieri cu semne diferite.
5. Din motive practice, în metodologia prezentată se pot utiliza
simultan nu numai variabile măsurabile de pe scala nominală ci
şi combinaţii de tipul una pe scala nominală şi alta (celelalte)
pe scala fie ordinală, fie de interval, fie de raport. Cert este
că una din aceste combinaţii trebuie să cuprindă o variabilă
nominală (cu una sau mai multe modalităţi de exprimare).
Tabelul 2.5.
(mild. lei)
Tabelul 2.6.
A B C D E
A 1,22 1,50 1,50 2,35 2,00
B 0 1,80 1,80 2,65 2,74
C 1,80 0 0 1,32 1,12
D 2,65 1,32 1,32 0 1,22
E 2,74 1,12 1,12 1,22 0
B C D E
A 1,22 1,50 2,35 2,00
B 1,80 2,65 2,74
C 1,32 1,12
D 1,22
B C şi E D
A 1,22 1,50 2,35
B 1,80 2,65
C şi E 1,22
54 Statistică generală
Distanţa minimă prezentată în datele tabelului 2.6 este 1,22, între A şi B
(aceeaşi minimă distanţă există între grupul C şi E pe de o parte şi D pe de altă
parte); se regrupează, deci, în primul rând societăţile comerciale A şi B şi se
reface noul tabel al distanţelor, utilizând datele din tabelul 2.8. Se determină:
D({A, B},{C, E}) = min {d(A, {C, E}), d(B, {C, E})}= min {1,5, 1,8} = 1,5
şi analog d({A, B},D) = min {d(A,D), d(B, D) = min {2,35, 2,65} = 2,35
Noul tabel al distanţelor este următorul:
Tabelul 2.9.
C şi E D
A şi B 1,5 2,35
C şi E 1,22
Tabelul 2.8.
A şi B
C, E şi D 1,50
B
C
D
E
0 1 2 distanţa
1 2 3 4 5 1 2U4 3 5
1 0 4 9 5 8 1 0 4 9 8
2 4 0 6 3 6 2U4 4 0 6 5
3 9 6 0 6 3 3 9 6 0 03
4 5 3 6 0 5 5 8 5 3 0
5 8 6 3 5 0
Aglomerarea (agregarea) 2 şi 4 la Aglomerarea (agregarea) 3
disimilaritatea 3 şi 5 la disimilaritatea 3
1 2U4 3U5
1 0 4 8 1U2U4 3U5
2U4 4 0 5 1U2U4 0 5
3U5 8 5 0 3U5 5 0
Aglomerare 1 şi 2U4 la Aglomerare finală 1U2U4 şi
disimilaritatea 4 3U5 la disimilaritatea 5
Rezultatul dendogramei
4 5
3 4
2 3
1 3
0 0
1 2 4 3 5 Ranguri de Criteriul
nivel valorilor
Tabelul 2.11.
Tabelul 2.12.
Distribuţia aparatelor după numărul pieselor defecte
Tabelul 2.14.
Distribuţia personalului Societăţii Comerciale
"GRUPO" după vechime
Grupe de persoane
după vechime (ani) Încadrarea persoanelor pe
Număr de persoane
sup intervale de vechime
x iin f [ xi < xi
0 1 2
/// 3
6, 5 [ x < 8, 0
8, 0 [ x < 9, 5 ///// /// 8
///// ///// // 12
9, 5 [ x < 11, 0
11,0 ≤ x <12,0 ///// ///// ///// //// 19
///// //// 9
12, 5 [ x < 14, 0
14, 0 [ x < 15, 5 ///// 5
//// 4
15, 5 [ x < 17
TOTAL - 60
Tabelul 2.15.
Modelul grupării combinate
Tabelul 2.16
Tabelul 2.17.
Asocierea frecvenţelor după două caracteristici alternative
Tabelul 2.19
Trimestrul I Trimestrul I
Indicatori
2000 2001
1. Fond de timp maxim disponibil din care: 3.865.100 3.773.000
2. Fond de timp efectiv lucrat 3.688.155 3.602.700
3. Fond de timp nelucrat 176.000 170.300
3.865.155 3.602.700
ore-om ore-om
Întrebări de control
• Ce se înţelege prin prelucrare statistică primară şi care sunt
principalele operaţii implicate ?
• Care sunt funcţiile operaţiilor de structurare a datelor ?
• Care sunt paşii algoritmului de clasificare ierarhică ?
• Care este obiectivul agregării datelor statistice şi prin ce metode se
realizează aceasta ?
• Ce se înţelege prin serie statistică teritorială şi cum se reprezintă ea
grafic ?
• Ce se înţelege prin serie cronologică şi prin ce metode se reprezintă
ea grafic ?
• Firma „VIM” specializată în cercetări de piaţă a intervievat 1309
persoane pentru testarea preferinţelor acestora faţă de câteva posturi
de televiziune. Date înregistrate sunt sistematizate astfel:
Vârsta Număr persoane
Până la 18 ani, total 494
Din care:
- Antena 1 89
- ProTV 211
- 7 abc 107
- Prima TV 87
19-29 ani, total 327
Din care:
- Antena 1 57
- ProTV 130
- 7 abc 81
- Prima TV 59
30-39 ani, total 91
Din care:
- Antena 1 38
- ProTV 29
- 7 abc 14
- Prima TV 10
40-49 ani, total 140
Din care:
- Antena 1 77
- ProTV 42
- 7 abc 11
70 Statistică generală
- Prima TV 10
50-59 ani, total 136
Din care:
- Antena 1 63
- ProTV 28
- 7 abc 36
- Prima TV 9
60 ani şi peste, total 121
Din care:
- Antena 1 59
- ProTV 30
- 7 abc 21
- Prima TV 11
Se cere:
- Să se grupeze datele de mai sus şi să se prezinte rezultatul într-
un total de contingenţă.
- Să se vizualizeze datele de mai sus prin cele mai adecvate
metode.
• Graficele statistice trasate în coordonate polare se utilizează în mod
curent pentru vizualizarea:
a) oricărei serii de date statistice;
b) seriilor de repartiţie;
c) trendului (tendinţei) din evoluţia în timp a unui fenomen;
d) evoluţia în timp a unui fenomen afectată de oscilaţii sezoniere;
e) tendinţei legăturii dintre variabile şi pentru alegerea modelelor
de regresie.
• În reprezentările grafice ale datelor statistice se utilizează:
a) în exclusivitate scara aritmetică;
b) în funcţie de ordinul de mărime a datelor se utilizează după caz scara
aritmetică, logaritmică, semilogaritmică, dublu logaritmică etc.;
c) în funcţie de ordinul de mărime a datelor scala nominală,
ordinală de intervale, de rapoarte, continuă sau discretă;
d) orice scară, numai graficul să fie trasat într-un sistem de axe
rectangulare;
e) orice scară, numai graficul să fie trasat într-un sistem de axe polare.
• Cartograma se foloseşte pentru a reprezenta grafic:
a) unităţi statistice cu două dimensiuni, întotdeauna după o
caracteristică;
b) unităţi statistice cu două dimensiuni, întotdeauna după mai
multe caracteristici;
Capitolul II 71
c) unităţi statistice cu două dimensiuni, niciodată după mai multe
caracteristici;
d) unităţi statistice cu două dimensiuni, după una sau mai multe
caracteristici;
e) cartograma nu este un grafic utilizat de statistică.
• Dacă în urma grupării unui set de date pe intervale de variaţie egale,
se obţin frecvenţele nule, atunci se recomandă:
a) să se regrupeze datele după o altă caracteristică;
b) se utilizează în continuare aceeaşi distribuţie neţinând cont de
frecvenţele nule;
c) se utilizează în continuare distribuţia dacă este doar o singură
frecvenţă nulă;
d) se regrupează datele, mărind numărul de intervale de variaţie;
e) se regrupează datele mărind dimensiunea intervalului.
• Formula lui Sturges se poate aplica pentru determinarea:
a) amplitudinii variaţiei unei caracteristici;
b) valorii maxime dintr-un set de date;
c) valorii minime dintr-un set de date;
d) numărului de grupe;
e) numărului de caracteristici.
• O serie de timp se reprezintă grafic printr-o:
a) corelogramă;
b) diagramă de structură;
c) cronogramă (historiogramă);
d) cartogramă;
e) cartodiagramă.
• Graficele statistice în coordonate polare se utilizează în mod curent
pentru vizualizarea:
a) oricărei serii de date statistice;
b) seriilor de repartiţie;
c) evoluţiei trendului din evoluţia unui fenomen;
d) evoluţiei unui fenomen afectat de oscilaţii sezoniere;
e) tendinţei legăturii dintre variabile şi alegerea modelului de
regresie.
• Se cunosc următoarele date privind „numărul de facturi” întocmite
de S.C. „Anonimus” S.R.L. în luna noiembrie 2000:
Data Nr. facturi Data Nr. facturi Data Nr. facturi
1 6 11 10 21 14
2 10 12 14 22 12
3 12 13 6 23 11
4 10 14 18 24 10
72 Statistică generală
5 8 15 13 25 8
6 9 16 9 26 4
7 10 17 14 27 12
8 11 18 12 28 9
9 12 19 17 29 12
10 9 20 12 30 16
I II III
Grupe de Grupe de Grupe de
Nr. Nr. Nr.
zile după nr. zile după nr. zile după nr.
zile zile zile
de facturi de facturi de facturi
0–5 1 0–5 1 0–6 55
6 – 11 13 6 – 10 16 7 – 14 90
11 – 15 13 11 – 15 10 15 – 22 103
15 – 20 3 16 – 20 3 23 – 30 82
IV V
Intervale ale
Intervale ale
numărului Nr.
Nr. zile numărului de
zilnic de zile
facturi
facturi
(0 – 5] 1 [0 – 5) 1
(5 – 10] 13 [5 – 10) 9
(10 – 15] 13 [10 – 15) 17
(15 – 20] 3 [16 – 20) 3