Documente Academic
Documente Profesional
Documente Cultură
COMPACTAREA DATELOR
23.1 Parametrii stocrii datelor
Volumul datelor este dat n mai multe feluri. Pentru o colectivitate ale
crei indivizi se descriu cu acelai ablon, volumul informaiilor este prezent
prin numrul indivizilor. Avem o imagine suficient de clar, despre un fiier
care conine informaii referitoare la 30.000 persoane sau despre o matrice
are 50 linii i 80 coloane, din punct de vedere al volumului de date.
Pentru o mai bun precizare, se vor lua n considerare:
N - numrul de indivizi ai colectivitii;
L
- lungimea structurii de date asociate unui individ;
B - factorul de blocare;
R - lungimea informaiilor reziduale;
Volumul de date V este dat de relaia:
V = f (N * L, B) + g(R)
(23.1)
pi
V
100
Ci
(23.2)
V C
j1
(23.3)
[min] C i Vj
j1
(23.4)
De exemplu, se consider:
Ci = 1000, V1 = 200, V2 = 500, V3 = 400, V4 = 300
(23.5)
Se calculeaz sumele:
S1 = V1 + V2 + V3 + V4 = 1400 > Ci
S2 = 200 + 500 + 400 = 1100 > Ci
S3 = 200 + 500 + 300 = 1000 = Ci
S4 = 500 + 400 = 900 < Ci
S5 = 500 + 400 + 300 = 1200 > Ci
S6 = 200 + 500 = 700 < Ci
S7 = 500 + 300 = 800 < Ci
S8 = 200 + 300 = 500 < Ci
S9 = 200 + 400 = 600 < Ci
S10 = 400 + 300 = 700 < Ci
(23.6)
(23.7)
(23.8)
(23.9)
(23.10)
(23.11)
(23.12)
(23.13)
(23.14)
(23.15)
(23.16)
g : KA
(23.17)
unde:
k = { k1, k2, . . . , km}
(23.18)
este mulimea cuvintelor compactate, aa fel nct exist o pereche (i, j),
pentru care:
kj = f (ai)
ai = g (kj)
(23.19)
(23.20)
(23.21)
(23.22)
de lungime iniial:
L1 = 1g(a1 a2 a3 a3 a3 a3 a3) = 1g (a1) + 1g (a2) + 4*1g (a3)
(23.23)
(23.24)
de lungime:
L2 = 1g (k1) + 1g (k2) + 4*1g (k3)
(23.25)
L1 - L 2
100
L1
(23.26)
(23.27)
(23.28)
Li - Lf
100 25%
Lf
(23.29)
L i - f i *1g(c j ) f j
j1
j1
Li
*100
(23.30)
L i - f j * [1g(C j ) 1g j )]
j1
Li
* 100
(23.31)
g2,
. . .,
30
DENUMIRE
15
VALOARE
1
CUIE
TABLA
VAR
2
100
200
600
900
1480 523
* 100 64%
1480
(23.32)
VALOARE
!**
!**
p'
(23.33)
pentru
pentru
pentru
pentru
pentru
pentru
forjor
strungar
frezor
economist
mecanic
supraveghetor
L m 2 * (n 1 n 2 n 3 n 4 n 5 n 6 )
L s n1 n 2 n 3 n 4 n 5 n 6
(23.36)
1
101
1001
10001
10101
100001
L B n 1 *1 n 2 * 3 n 3 * 4 n 4 * 5 n 5 * 5 n 6 * 6
Observm c:
8 * L b 8 * Ls L B
(23.38)
(23.37)
L F 8 13 (n 1 n 2 n 3 n 4 n 5 n 6 )
(23.39)
(23.40)
(23.41)
Lb=100*6+300*8+100*6+100*9+300*7+100*13=7900 baii
LB=100+300*3+100*4+100*5+300*5+100*6=4000 bii
(23.42)
(23.43)
p1
104000 3000
*100 97%
104000
(23.45)
p2
7900 * 8 3000
*100 95%
7900 * 8
(23.46)
p3
23.6
repetitive
4000 3000
*100 25%
4000
Compactarea
prin
(23.44)
(23.47)
identificarea
de
subiruri
(23.48)
1000
1001
1010
1011
1100
1101
1110
1111
1000
u1
lor
it
am
cr
sa
nstr
asera
1001
1e
se
la
ar
sc
ma
eau
res
1010
pr
ut
ea
ei
st
ne
eam
tit
1011
mb
re
ta
ra
os
tre
esti
ros
1100
mp
tr
ti
ne
ti
ist
ndu
oasa
1101
ni
te
ca
un
at
tri
u-se
isem
1110
in
ta
oi
ns
ri
urile
ati
tit
1111
lui
nu
au
nt
oa
ind
nul
art
x
17
x
26 24
sux
64
de
26
aga
12
x
rge
36 27
x lux x
62
57 12
Cix
x
26
Vix
A
x
x
vor spx ge
58 24 12
42
ux x
, valux x
48 57 12
57 12
fox odat ca-n povex
53
73
A fox
x
53
Dx
x
26
rude x
17
ciodat
16
x
ix aratx
62 57 15
74
o x x
fata
13 33
85
177 137
* 100 22%
177
(23.49)
177 116
* 100 34%
177
(23.50)
177 * 8 116 * 6
* 100 52%
177 * 8
(23.51)
CICLU:
BETA:
ORG
MOV
PUSH
XRA
LDAX
ADC
DCR
JZ
STAX
INX
INX
JMP
MOV
420 H
D , E
B
A
B
M
E
BETA
B
B
H
CICLU
LOAX B
XRA M
MOV A , E
STAX B
STC
JM GAMA
MOV A , M
XRA E
STC
JM DELTA
GAMA: CMC
DELTA:
POP
MOV
RET
END
B
E , D
53
C5
AF
OA
8E
1D
CA
02
03
23
C3
5F
OA
AE
7B
02
37
FA
7E
AB
37
FA
C1
5A
C9
2F
04
23
04
3F
04
3F
04
Frecvena
8
2
4
9
4
4
4
1
1
6
1
3
1
4
6
53
C5
AF
OA
0004
8E
0005
1D
0006
CA
0009
000A
02
03
000B
23
000C
C3
000F
5F
0010
0A
0011
AE
0012
7B
0013
02
0014
0015
37
FA
0018
7E
0019
AB
001A
37
001B
FA
001F
C1
00
OF
00
03
00
1F
00
1F
0020
5A
0021
C9
Frecvena
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
5
1
2
2
2
1
2
5
2
Frecvena
1
2
4
1
2
1
A
B
C
D
E
F
6
2
1
3
2
11120
11170
11121
11130
11135
11122
11131
11131
11120
11136
11109
11104
(23.52)
iar:
60
D
0,005
Xmin 11108
(23.53)
(23.54)
26
5
27
17
32
18
66
16
51
0
84 2 * 8
100
100
100 52%
24 * 8
192
(23.55)
111
113
111
111
112
112
112
112
112
112
3 7 12 2
45
100
100 46%
12 8
96
(23.56)
Nr. de apariii
simbol
0
1
2
3
4
5
6
7
Total
12
8
6
5
4
3
2
0
40
30%
0
0
20%
10
1
100 %
15%
12%
10%
110
2
3
35 %
0
5%
23%
13 %
5%
1
1110
50 %
8%
0%
70 %
11110
111110
1
1111110
1
1111111
30%
20%
15%
12%
110
100%
27%
70%
43%
8%
5%
6
7
11110
23%
13%
5%
101
1110
0
0
10%
100
0%
111110
111111
Nr. de
apariii
simbol
12
8
6
5
4
3
2
0
40