Documente Academic
Documente Profesional
Documente Cultură
Panaitescu
TRANSMITEREA I CODAREA
INFORMAIEI
Note de curs
1
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
2
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
CUVNT INTRODUCTIV
Lucrarea prezent este suportul cursului cu numele din titlu, tinut pe durata
unui semestru, trei ore pe sptmn, la anul II specializarea Electronic
aplicat din cadrul Faculttii de Inginerie mecanic si electric a Universittii
Petrol-Gaze Ploieti. Este produsul unei experiente de predare care se
ntinde pe un interval de peste cinsprezece ani. Versiunea de fa este revzut
si adugit n 2015 pentru instruirea unei noi promoii de la specializarea
amintit.
Textul cuprins ntre copertile virtuale ale acestei lucrri constituie aproape un
manual de Transmiterea i codarea informaiei. S-a subliniat cuvntul
aproape deoarece n unele sectiuni ale lucrrii se poate observa o expunere
mai curnd rezumativ a temelor aduse n discutie. De aceea a fost mentinut
subtitlul Note de curs, dat fiind caracterul multor pasaje mai curnd de ghid al
expunerilor celui care pred disciplina sau, ocazional, de posibil referint
concis a initiatilor n domeniu. n acele sectiuni nu sunt continute toate
explicatiile i comentariile care cu sigurant ar fi necesare pentru ca textul
lucrrii s devin pe de-a-ntregul un manual. Asemenea adaosuri se fac de
obicei la expunerea oral i, n afar de asta, n cursul predrii pot aprea
actualizri din mers ale unor teme, ntr-o dinamic mic a disciplinei,
produs de lecturile curente ale titularului cursului.
Aadar, pentru studenti, lectura celor scrise mai departe nu poate suplini total
audierea cursului. Dac lucrarea se difuzeaz n formatul acesta, se difuzeaz
mai ales ca un ajutor n ntelegerea notielor proprii, n vederea pregtirii
testelor intermediare i a examenului. Studentii sunt ndemnati s consulte
concomitent bibliografia indicat, att pentru subiectele care nu se regsesc
aici ct i pentru subiectele care sunt preluate din sursele citate si reformulate
n Notele de curs de mai jos.
Alturi de prezentele Note de curs, cititorul poate accesa i consulta on line,
pentru studiu individual sau n timpul orelor de aplicatii prevzute n orar, un
volum de Aplicaii la disciplina Transmiterea i codarea informaiei.
3
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
4
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
CUPRINS
INTRODUCERE
p.9
13
SURSE DE INFORMAIE
Informaie. Surse de informaie. Entropie
Entropia relativ
Surse de informatie multiple
Surse de informatie cu memorie. Modelul Markov
Legea numerelor mari i AEP (Asymptotic Equipartition Property)
Entropia diferenial
Discretizarea
Entropiile difereniale combinate, condiionate i relative
CANALE DE TRANSMITERE A INFORMAIEI
35
Generalitti
Entropii a priori, entropii a posteriori.
Informaia mutual (transinformaia)
Tipuri speciale de canale
Capacitatea canalelor
Modelul de canal AWGN (Additive White Gaussian Noise)
O problem special privind canalele
Canale de tip continuu
CODURI PENTRU CANALE FR ZGOMOT
Generalitti despre coduri
Particulariti ale codurilor
Inegalitatea lui Kraft i teorema lui McMillan
Lungimea medie a unui cod. Coduri compacte
Teorema de codare a lui Shannon
Teorema lui Shannon pentru surse Markov
Teorema lui Shannon i capacitatea canalelor
Coduri compacte coduri Huffman
Principii generale pentru compresia de date
Codarea run-length
5
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
51
Codoare Markov
Codarea aritmetic
Compresia LZW (Lempel, Ziv, Welch)
Compresia cu pierdere de informaie
Codarea rat-distorsiune
Msuri ale distorsiunii
Proprieti ale functiei R(D)
Funcia rat-distorsiune i informaia
CRIPTAREA
101
6
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
109
183
Spatiul evenimentelor
Probabilitti, probabilitti conditionate
Variabile aleatoare
BIBLIOGRAFIE
199
7
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
8
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
INTRODUCERE
Informatia este generat i vehiculat n foarte multe mprejurri. Observarea
unui fenomen, lectura unei crti, experimentele stiintifice de pild sunt
generatoare de informatie. Frecvent, informatia trebuie transmis la distant
si/sau stocat eficient i n conditii de sigurant.
Ideea principal a cursului Transmiterea i codarea informatiei este de a
descrie i a prelucra informatia astfel nct ea s poat fi cuantificat la surs,
adaptat la particularittile mediilor de transmitere sau de stocare, recuperat n
form utilizabil la locul receptiei sau dup un interval de timp de depozitare.
Exist asadar surse care genereaz informatie. Informatia trebuie msurat
Canalele de transmitere i operatiile de memorare trebuie s lucreze optim.
Receptoarele, utilizatorii trebuie s recupereze informatia din canal sau din
memorie ntr-o manier care s o fac utilizabil, inteligibil. Astfel de subiecte
sunt abordate de-a lungul acestui curs i n bun parte n aceste Note de curs.
ntr-o sumar enumerare, obiectivele acestei discipline sunt:
caracterizarea informatiei generate de surse diverse, transmise prin canale
variate, receptionate de receptoare de genuri diferite;
optimizarea transmiterii i stocrii informatiei (de regul prin utilizarea unor
coduri);
transmiterea protejat prin medii/canale, stocarea eficient n conditii sigure
n diverse tipuri de memorie (protectia la perturbatii i erori).
ntr-o prim faz, n centrul atentiei sunt sursele de informatie discrete i
informatia discret/discretizat. Discutia se va extinde ori de cte ori va fi cazul
i la sursele continue generatoare de informatie.
Un exemplu simplu aduce cititorul mai aproape de cteva aspecte de baz ale
teoriei informatiei: Se presupune c din localitatea A se transmit spre localitatea
B, dup un anumit program, informatii despre starea vremii din A. Simplificnd
lucrurile, presupunem c n A poate s strluceasc soarele, cerul poate fi
nnorat, poate s plou sau poate s fie cea, acestea fiind descrieri exhaustive.
Starea vremii din A poate fi caracterizat asadar ca nsorit, nnorat, ploioas
sau cetoas. Lista aceasta de descriptori ai strii vremii n A alctuieste un
alfabet al sursei. Fiecare din acesti descriptori este un simbol al sursei de
informatie i o secven de astfel de referiri la vremea din A, chiar i foarte
scurt format dintr-un singur simbol se constituie ntr-un mesaj. Este
convenabil i n mare msur natural ca informatia s fie legat cantitativ de
gradul de incertitudine n care se afl receptorul/utilizatorul fa n fat cu ceea
ce se transmite i/sau se receptioneaz. Dac, de pild, vremea n A este uzual
nsorit (65% din cazuri) receptionarea mesajului de un simbol nsorit este
9
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
nsorit
nnorat
ploioas
cetoas
0,65
0,20
0,10
0,05
nsorit
nnorat
ploioas
cetoas
00
01
10
11
nsorit
nnorat
ploioas
cetoas
10
110
111
10
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
pentru simbolurile mai probabile i cuvinte de cod mai lungi pentru simboluri
mai putin probabile. De aici o dubl sugestie: de a msura informatia n biti i
de a observa o relatie de crestere concomitent a informatiei i a inversului
(valorii reciproce a) probabilittii atasate simbolurilor. O definire logaritmic a
cantittii de informatie pare n acest context foarte potrivit
Informatia purtat de un simbol = log(1/Probabilitatea acelui simbol)
Cu aceast definire logaritmic (logaritmii n baza 2) se pot face evaluri ale
surselor de informatie i ale canalelor prin care informatia se transmite.
Dar, dup cum cititorul a observat, s-au utilizat aici unele notiuni care se cer
explicate. Anexele acestui curs i sectiunile urmtoare vor (re)introduce unele
elemente de calcul al probabilittilor, de teorie a codurilor etc., care vor aduce o
lumin mai complet asupra caracterizrii informatiei n mprejurri variate.
n ceea ce priveste siguranta stocrii/transmiterii informatiei, codurile
protectoare la erori au un rol determinant. Despre ce erori este vorba? Sunt
posibile erori datorate unei functionri neconforme a aparaturii implicate n
operatii de transmitere/stocare, sunt posibile interferente ale unor perturbatii
numite frecvent zgomote etc. Desigur, acest vast subiect nu poate fi evitat, ci
dimpotriv, va fi foarte prezent n paginile care urmeaz ca i n versiunea
vorbit a acestui curs.
11
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
12
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
SURSE DE INFORMAIE
Informaie. Surse de informaie. Entropie
Fie un cmp de probabilitate discret An (v.Anexa 1) format din n evenimente
elementare A1, , An care alctuiesc o familie exhaustiv; Fie p1, , pn
probabilittile acestor evenimente. Probabilitile satisfac obligatoriu relaiile
n
p k 0, 1 k n,
k 1
13
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
k f ( xk ) f k xk
k 1
k 1
Aplicarea acestei inegalitti pentru functia f(x) = xlogx, pentru xk = pk i n
= 1/n, 1 k n conduce la
n
n 1 n 1
1
pk log pk pk log pk
k 1 n k 1 n
k 1 n
n
si, ntruct
1 , rezult
k 1
1
1
1
Hn ( p1 ,..., pn ) log
n
n
n
adic
1
1
Hn ( p1 ,..., pn ) Hn ,...,
n
n
Proprietatea aceasta arat c entropia este maxim atunci cnd
probabilittile p1, , pn sunt egale. Orice cmp de probabilitate cu
probabilitti asociate evenimentelor elementare componente altfel dect
egale este redundant.
4. Are loc egalitatea
Hn+1( p1, , pn, 0) = Hn( p1, , pn)
ceea ce arat c dou cmpuri de probabilitate care difer prin adugarea
unui eveniment, i acela imposibil au aceeai nedeterminare.
Entropia relativ
Se admite c o variabil aleatoare are distributia teoretic p. Apoi, cum se va
vedea n capitolele despre codare, variabila aceasta se poate reprezenta printrun cod caracterizat n mare msur de entropia H(p). Dar, datorit unor
informatii incomplete, distributia p nu este cunoscut i de aceea se foloseste o
distributie diferit q. n acest caz, codul va fi afectat negativ n performantele
lui. Cantitatea care cuantific diferenta de performant este notat uzual cu
D(p||q) i este cunoscut sub numele de entropia relativ, n unele lucrri sub
numele de i-divergen.
Definitie. Entropia relativ sau distana Kullback-Leibler ntre dou functii de
probabilitate p(x) i q(x) se defineste ca
p( x)
p ( x)
D ( p || q ) p( x) log
E p log
q( x)
q ( x)
x
14
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
i 1
Ai i i j Ai A j i se definesc
pA(i) =
p( x) , i = 1, , K
xAi
qA(i) =
q( x) , i = 1, , K
x Ai
atunci
D(p||q) D(pA||qA)
cu egalitate dac i numai dac p(x/x Ai) = q(x/x Ai), x Ai, pentru toi
indicii i.
5. Inegalitatea procesrii datelor. Dac W este o matrice stochastic |X||Y|
(cu liniile avnd suma elementelor egal cu unitatea) i dac se definesc
p W(x, y) = p(x)W(y/x), x X, y Y
q W(x, y) = q(x)W(y/x), x X, y Y
pW(y) = p W ( x, y ) ,
y Y
xX
qW(y) =
q W ( x, y ) ,
yY
xX
atunci
D(p||q) D(pW||qW)
cu egalitate dac numai i numai dac probabilitatea a posteriori a lui x
cnd se d y este aceeai pentru orice y n ambele distribuii combinate
P W i Q W.
6. Inegalitatea lui Pinsker. Distana variaional ntre dou functii de
probabilitate
d ( p, q ) | p( x ) q ( x) |
x X
15
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
D(p||r) + D(q||r) = 2 D
|| r D p ||
D q ||
2
2
2
a i 1 ai i b i 1 bi . Atunci
n
ai
a
b
i 1
i
cu egalitate dac i numai dac ai/bi = c pentru toi indicii i, cu c o constant.
Demonstratie: Mai nti se observ c:
este suficient a demonstra inegalitatea pentru ai > 0. Ignorarea indicilor i
pentru care ai = 0 nu schimb partea din stnga a inegalittii i poate numai
s fac mai mare partea din dreapta prin posibila reducere a sumei b;
este suficient a demonstra inegalitatea pentru bi > 0, altminteri, partea
stng este + i nu mai este nimic de demonstrat;
este suficient a demonstra inegalitatea pentru a = b. Inegalitatea este
invariant la scalarea numerelor bi deoarece
n
n
a
a
1
a
a
1
ai log i ai log i ai log i a log
a log a log
bi i 1
bi
i 1
bi
a log b
i
a log
Asadar, este suficient ca pentru {ai }in1 i {bi }in1 cu ai, bi > 0 i a = b s se arate
c
n
a
ai log i 0
bi
i 1
cu egalitate dac i numai dac ai = bi pentru orice i = 1, , n. Se reamintete
faptul c
log t t 1 pentru t > 0
cu egalitate numai pentru t = 1. Mai departe, punnd ti = ai/bi, se obtine
succesiv
n
n
n
n
a
ai log i ai log ti ai (ti 1) (bi ai )
bi
i 1
i 1
i 1
i 1
ceea ce dovedete inegalitatea urmrit, concomitent cu conditia de egalitate.
Surse de informatie multiple
n continuare, fie cmpurile
A ... An
B ... B m
i Bm = 1
An = 1
p1 ... p n
q1 ... q m
ambele finite, independente, complete, adic cu sumele probabilittilor egale cu
unitatea
16
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1 i
k 1
i 1
k 1 i 1
i 1
Dac cele dou cmpuri nu sunt independente, atunci probabilitile evenimentelor (Ak , Bi), 1 k n , 1 i m se calculeaz diferit: ki = pk qi/k, cu qi/k
probabilitatea evenimentului Bi conditionat de Ak.
Dac se defineste mai nti o entropie conditionat de evenimentul/simbolul Ak
m
Hm(Bm/Ak) = qi / k log qi / k
i 1
Hm(Bm/An) =
Hm(Bm/Ak)
k 1
k 1
i dup nsumarea dup indicele i
n
pk qi / k log qi / k qi log qi
k 1
i 1
i 1
17
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H ( S ni / S1 , S 2 ,..., S ni 1 )
i 0
18
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
19
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
P
0,5 0,5 0
0
0 0,2 0,8
0
cu strile mentionate acolo i elementele pij Pr( S m; j / S m;i ) .
Sursele Markov ergodice reprezint o clas important de surse Markov. O
surs Markov ergodic este una care observat timp ndelungat genereaz o
secvent de simboluri care este tipic. Cele mai multe surse Markov sunt
ergodice. O surs neergodic este dat n figura alturat.
20
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
t1 t2 ... tn
are liniile identice. Matricea T este numit matricea de distributie stationar a
strilor i este deplin determinat de una din liniile ei.
n exemplul de mai devreme
0,1
0,64 0,16 0,1
0,25 0,25 0,1 0, 4
P2 P P
0,4
0,1 0, 25 0, 25
P P P
0, 445 0,205
0,1
0,25
0,1
0,178 0,562
0,16
i urmrind puterile succesive ale matricei P, se poate spune c sunt semne de
convergen.
Evaluarea elementelor din matricea T prin continuarea calculelor pentru puteri
k din ce n ce mai mari nu este tocmai productiv i nici foarte precis. Calea de
determinare a elementelor matricii T este alta, i anume aceea care tine seama
c
T lim k P k 1 lim k P k P T P
21
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H ( S / S m ) Pr(si / S m ) I ( si / S m )
i 1
S m i 1
i 1
H ( S ) Pr(S m si ) log
S m 1
1
Pr(si / S m )
cu operatorul de sumare
i cu S m si ( s j1 s j2 ...s jm si ) .
S m 1
S m i 1
22
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
si
0
1
0
1
0
1
0
1
S2
Pr(si / S 2 )
0,8
0,2
0,5
0,5
0,5
0,5
0,2
0,8
00
01
10
11
Pr(S 2 )
5/14
2/14
2/14
5/14
Pr(S 2 si )
4/14
1/14
1/14
1/14
1/14
1/14
1/14
4/14
Pentru exemplul enuntat mai sus i reluat de mai multe ori, tabelul alturat
faciliteaz evaluarea entropiei sistemului i conduce la entropia sursei
1
H ( S ) Pr(S 2 si ) log
Pr( si / S 2 )
S3
4
1
1
1
1
1
4
1
log
log
log
... log
0,81
14
0,8 14
0,2 14
0,5
14
0,8
msurat n biti/simbol.
Un model alternativ pentru aceeai surs este sursa adjunct.
Sursa adjunct este sursa fr memorie, cu simboluri mutual independente,
specificate deplin de probabilittile Pr(s1 ), Pr(s2 ),..., Pr(sq ) . Fa de o surs
Pr(0 / 00) Pr(00) Pr(0 / 01) Pr(01) Pr(0 / 10) Pr(10) Pr(0 / 11) Pr(11) 0,5
fie pe calea alternativ
Pr(0) Pr(S 2 ) Pr(00) Pr(01) 0,5
S
23
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H ( S ) 0,81 H ( S ) 1
n continuare se discut calitatea unor modele variate ale surselor de informatie
foarte generale.
Fie
~
H ( S m ) H (S / S m ) H (S / S1 , S 2 ,..., S m )
entropia unei surse reale, evaluat pe baza unui model Markov de ordinul m.
Cazul particular H ( S 0 ) corespunde unui model de ordinul 0, deci al unei surse
fr memorie. Pe baza unui rezultat obtinut relativ la sursele multiple este de
observat c
H ( S m ) H (S m1 ) ... H (S 1 ) H ( S 0 )
i, mrind pe m, se obtine
H ( S ) lim m H (S m )
care poart numele de entropia real a sursei. Pentru cazul unui model Markov
perfect de ordinul k se poate scrie
H ( S k ) H (S k 1 ) H (S k 2 ) ... H ( S )
n unele cazuri este mai la ndemn a se lucra cu blocuri de simboluri i nu cu
simboluri simple, izolate. Se nate astfel extensia unei surse de informatie.
Dac sursa S genereaz simbolurile {s1 , s 2 ,..., s q } atunci extensia ei de ordinul
n, notat Sn este o surs cu qn simboluri { 1 , 2 ,..., q n } , secvene distincte de
lungime n alctuite cu simbolurile sursei S. Dac sursa S este fr memorie,
probabilitile acestor blocuri sunt
Pr( i ) Pr(si1 ) Pr(si 2 )...Pr( sin )
iar dac sursa este foarte general
Pr( i ) Pr(sin / si1 , si 2 ,..., si ( n 1) ) Pr(si ( n 1) / si1 , si 2 ,..., si ( n 2) )... Pr(si1 )
Dac sursa S este lipsit de memorie atunci extensiile ei sunt toate fr
memorie.
Dac sursa originar este markovian de ordinul m atunci extensia ei de ordinul
n este markovian de un ordin egal cu primul ntreg superior sau egal
numrului m/n.
Fie ca exemplu sursa S = {0, 1} cu q = 2. Extensia a doua se prezint sub forma
S 2 { 1 00, 2 01, 3 10, 4 11}
iar extensia urmtoare, a treia, are opt simboluri
S 3 { 1 000, 2 001, 3 010, 4 011,
24
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
25
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H (S n )
H ( S n1 )
n
n
nH (S ) H ( S n ) nH ( S n1 )
H (S n )
H ( S n ) H (S n1 )
n
n 1
Rezult c entropiile combinate pe simbol sunt n relatia
H ( S n ) H ( S n 1 )
Dar H ( S ) lim
H ( S n ) aa nct lim
H (S n ) H ( S ) .
n
26
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
sirul alctuit numai din 0 devine comparativ din ce n ce mai probabil pe cnd
sirul alctuit numai din 1 devine din ce n ce mai puin probabil. Alte mesaje
arbitrare au probabilitti de forma C nni (0,75)i(0,25)ni, cu i numrul zerourilor
din secvena-mesaj. Expresia probabilittilor este bernoullian, dat fiind
ordinea variat n care pot aprea zerourile i unittile binare. Variatia
probabilittilor cu cresterea lui i de la 0 la n este mai nti cresctoare apoi
descresctoare, cum se ntmpl obinuit cu termenii unei dezvoltri binomiale.
Este momentul s fie aduse acum n discutie detaliile comportrii surselor
extinse la n foarte mare, acea proprietate de echipartitie asimptotic, cunoscut
mai ales n versiunea prescurtat, AEP Asymptotic Equipartition Property.
Legea numerelor mari i AEP (Asymptotic Equipartition Property)
Legea numerelor mari afirm c pentru variabilele aleatoare X1, X2, ..., Xn
independente i identic distribuite (i.i.d.), suma
1 n
Xi
n i 1
este apropiat de valoarea medie E[X].
AEP mai nseamn i c pentru variabile aleatoare i.i.d. valoarea
1
1
log
n
p( X 1, X 2 ,..., X n )
este apropiat de entropia H(X).
Exprimat altfel, faptul poate fi scris ca
p(x1, x2, , xn) 2 nH
Exemplul 1: Fie X {0, 1} cu p(1) = p, p(0) = q. Probabilitatea secventei i.i.d.
X
n
X
X , X , , X este p i q i . Dac n particular, p(0) = 0,7 i p(1) = 0,3
1
Probabilitatea
secvenei
0,0282
0,0121
0,005
0,0022
0,00095
0,0004
0,00017
0,000075
0,000032
0,0000138
0,0000059
Numrul
secvenelor
1
10
45
120
210
252
210
120
45
10
1
27
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Probabilitatea
secvenelor
0,0282
0,121
0,225
0,264
0,1995
0,1008
0,036
0,009
0,00144
0,000138
0,0000059
28
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Teorema 1 (AEP). Dac X1, X2, ..., Xn sunt variabile aleatoare i.i.d. cu
1
distribuia p(x), atunci log p( X 1 , X 2 ,..., X n ) H ( X ) n probabilitate.
n
Demonstratie: Deoarece Xi (i = 1, 2, ..., n) sunt variabile aleatoare i.i.d., la fel
sunt i log p(Xi). Din independen i WLLN Weak Low of Large Numbers
1
1
log p ( X 1 , X 2 ,..., X n ) log p( X i ) E[log p( X )] H ( X )
n
n i
n probabilitate.
Mulimea secventelor care apar cel mai frecvent (potrivit legii probabilistice a
variabilei aleatoare) sunt secvene tipice. Tipicalitatea este definit astfel:
Definiia 2. Multimea tipic A(n ) n raport cu distribuia p(x) este mulimea de
secvente x1, x2, ..., xn Xn cu proprietatea
2 n( H ( X ) ) p( x1 , x2 ,..., xn ) 2 n( H ( X ) )
Aadar secvenele tipice apar cu o probabilitate care este n apropierea
numrului 2 nH(X).
Exemplul 3. Revenim la primul exemplu, H(X) = 0,88129 i nH(X) = 8,8129.
Atunci 2nH(X) = 0,00223 ceea ce este foarte aproape de probabilitatea unei
secvene cu trei unitti binare, restul zerouri.
O multime tipic A(n ) are urmtoarele proprieti:
Teorema 2.
1. Dac ( x1, x2 ,..., xn ) A( n ) atunci
1
H(X) p( x1 , x2 ,..., xn ) H(X) +
n
2. Pentru n suficient de mare, Pr{ A(n ) } 1 .
3. | A( n ) | 2n ( H ( X ) ) , cu |A| numrul de elemente din multimea A.
4. Pentru n suficient de mare, | A( n ) | (1 )2n( H ( X ) ) .
Interpretri: Din proprietatea 1: aproape toate elementele dintr-o multime tipic
sunt practic echiprobabile. Din proprietatea 2: mulimea tipic apare cu o
probabilitate apropiat de unitate (de aceea este denumit tipic!). Din
proprietile 3 i 4: numrul de elemente ale unei multimi tipice este apropiat de
2nH(X).
Demonstratie.
1. Se ia (1/n) i logaritmul (n baza 2) din relatia de definiie a multimii
tipice:
1
1
1
( n( H ( X ) )) log p( x1 , x2 ,..., xn ) ( n( H ( X ) ))
n
n
n
2. Din definiia multimilor tipice, AEP i definitia convergentei n
probabilitate: Pr{( X 1 , X 2 ,..., X n ) | ( X 1 , X 2 ,..., X n ) A( n) } 1 concomitent cu
n . Aceasta nseamn c pentru orice > 0 exist un n0 astfel nct
29
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
pentru n n0 are loc Pr{| log p( X 1 , X 2 ,..., X n ) H ( X ) | } 1 . Se
n
pune = i se obtine proprietatea 2.
3. Succesiv, 1 = p ( x) p ( x ) 2 n ( H ( X ) ) = 2 n ( H ( X ) ) | A( n ) | .
x X n
x A( n )
x A( n )
n ( H ( X ) )
= 2 n( H ( X ) ) | A( n ) | .
x A( n )
h( x) ln dx ( x)
ln( 2 ) dx
2
2
E[ X 2 ] 1
1
ln( 2 2 ) ln(e 2 )
2
2
2
2
Cu notiunea de entropia diferenial clarificat, se pot reformula acum lucruri
deja definite pentru variabilele aleatoare discrete.
Proprietatea de echipartiie asimptotic (AEP Asymptotic Equipartition
Property)
Teorema 1. Fie X1, , Xn o secvent de valori ale unor variabile aleatoare i.i.d.
descrise de functia de repartitie f(x). atunci
30
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
log f ( X 1,..., X n ) E[ log f ( X )] h( X )
n
cu convergena n probabilitate.
Demonstratie: Este vorba exact de aceeai WLLN.
Definitia 2. Mulimi tipice. Pentru orice > 0 i orice n, o multime tipic A(n )
n raport cu f(x) este
1
A( n ) ( x1 ,..., xn ) S n | log f ( x1 ,..., xn ) h( X ) |
n
cu alte cuvinte, A(n ) este multimea pentru care entropia diferential empiric
este apropiat de entropia diferential.
Pentru variabilele aleatoare discrete, se vorbete de numrul de elemente dintr-o
multime tipic. Pentru variabilele aleatoare continue, conceptul analog este cel
de volum al unei multimi tipice.
Definitia 3. Volumul unei multimi A Rn este
vol(A) = dx1dx2 ...dxn
A
A( n )
n ( h ( X ) )
dx1...dxn 2 n ( h ( X ) ) vol( A( n ) )
A( n )
A( n )
Discretizarea
Dac o variabil aleatoare X cu distributie continu este studiat pe domenii
adiacente, atunci (teorema valorii medii) exist o valoare xi n fiecare domeniu
care verific egalitatea
f(xi) =
( i 1)
f ( x)dx
31
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
h( f ) f ( x ) xT K 1 x ln ( 2 ) n | K | 2 dx
2
1
1
E xi ( K 1 )ij x j ln (2 )n | K |
2 i, j
2
1
1
E ( x j xi )( K 1 )ij ln (2 ) n | K |
2 i, j
2
1
1
1
1
K ji ( K 1 )ij ln (2 )n | K | ( KK 1 ) jj ln (2 )n | K |
2 j i
2
2 j
2
1
1
1
n ln (2 ) n | K | ln (2e) n | K |
2
2
2
Entropia relativ are expresia
f
D ( f || g ) f log
g
Retinem o functie numit informatie mutual care are n cazul variabilelor
aleatoare continue expresia
f ( x, y )
dxdy D( f ( x, y ) || f ( x ) f ( y ))
I(X;Y) = f ( x, y ) log
f ( x) f ( y )
n care apare i o entropie relativ.
32
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
4. Regula lanului:
h( X
| X i 1,..., X 1 )
i 1
33
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
34
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
P
... ... ... ...
ij
1 pentru fiecare i =
j 1
0 1
35
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
0,01 0,99
c) un canal binar cu zgomot foarte general, pentru care alterarea celor dou
0,8 0,2
simboluri se produce n proportii diferite, P
.
0,3 0,7
O alt posibil reprezentare a unui canal este printr-un graf orientat cu
probabilittile Pij nscrise pe arce.
Pr(b j )
Pr(b j )
36
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
3
P3
1 9
10 10
entropia a priori este H(A) = 0,811 i entropiile a posteriori sunt H(A/b = 0) =
0,2762 i H(A/b = 1) = 0,9980. Aadar, n acest exemplu, la apariia la ieire a
simbolului 0 incertitudinea asupra valorii simbolului aplicat la intrare scade, iar
la apariia simbolului 1 la ieire incertitudinea asupra simbolului transmis
crete.
Informaia mutual (transinformaia)
Cu entropia a priori i cu entropia a posteriori relative la alfabetul de intrare se
poate calcula asa-numita echivocatie a intrrii la iesire
1
H ( A / B) Pr(b) H ( A / b) Pr(a, b) log
Pr(a / b)
B
A B
Exprimat altfel, H(A) este informatia sau incertitudinea medie la intrare nainte
de a observa iesirea canalului, iar H(A/B) este informatia sau incertitudinea
medie la intrarea canalului dup observarea ieirii. Diferena H(A) H(A/B)
este o msur a lucrrii canalului care const n a transmite informatia generat
de surs i aplicat la intrarea lui. Diferena este numit informatie mutual sau
transinformatie i se noteaz
I(A;B) = H(A) H(A/B)
Valoarea I(A;B) reprezint informatia furnizat de canal asupra sursei A de la
intrare. Este de ateptat ca ntr-un canal fr zgomote I(A;B) = H(A). Dac
37
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
Pr(b / a )
A B
Ultima expresie este o echivocaie a lui B condiionat de A sau o eroare medie
de transmitere.
O figur sugestiv pentru relatia ntre numerele caracteristice ale unui canal este
prezentat alturat. Figura ca i calculul direct arat c
H ( A, B) H ( A) H ( B) I ( A; B) H ( A) H ( B / A) H ( B) H ( A / B)
O exprimare n cuvinte a acestei egaliti multiple: incertitudinea total n A i
B este suma incertitudinilor din A i din B minus informatia transferat prin
canal sau este suma incertitudinii n A cu incertitudinea n B dup ce este dat A.
H ( B / A) Pr(a, b) log
38
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
P 0
0
0 11 / 30 19 / 30 0
0
0
0
0
0
1
Matricea are particularitatea c pe fiecare coloan are un singur element nenul.
n cazul exemplificat, multimea B, de elemente b care poart indici de la 1 la 6
se partitioneaz n {b1 , b2 , b3 }, {b4 , b5 }, {b6 } , astfel nct posibilitatea de confuzie
asupra identittii simbolului transmis, a1, a2 sau a3 este exclus. Odat cunoscut
simbolul produs la ieire, una din probabilittile condiionate devine o msur a
certitudinii, Pr(ak / b j ) 1 , iar celelalalte se anuleaz: Pr(ai / b j ) 0, i k .
Echivocaia calculat este nul, ceea ce este de ateptat deoarece n canal nu
sunt prezente zgomote.
Asadar, H(A/B) = 0 i I(A;B) = H(A) deoarece nu exist nici o incertitudine
asupra intrrii cnd este observat iesirea i informatia produs de canal la
ieire este aceeai cu cea aplicat la intrarea canalului.
Canalele deterministe sunt acelea pentru care simbolurile de la intrare care
produc la iesire acelai simbol se grupeaz n submultimi disjuncte. Se ntelege
c un asemenea canal poate avea n multimea A mai multe simboluri dect n
multimea B, ntocmai cum un canal fr zgomote poate avea un alfabet de iesire
B cu mai multe elemente dect alfabetul de intrare A. La un canal determinist,
odat cunoscut simbolul de la intrare se poate spune exact care va fi simbolul
de la iesire. Un exemplu este canalul caracterizat de matricea
39
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1 0 0 0 0 0
P 0 1 1 1 0 0
0 0 0 0 1 1
care are particularitatea c pe fiecare linie are un singur element nenul i acela
egal cu 1. Pe matrice se poate citi c odat cunoscut simbolul la intrare, asupra
simbolului de la iesire nu mai exist nici o incertitudine. Echivocatia/eroarea
medie este nul, H(B/A) = 0 i informatia mutual devine I(A;B) = H(B).
Canalele n cascad sunt conectate astfel nct, succesiv iesirea unui canal
constituie intrarea altui canal. ntr-un lan de numai dou canale de pild, se
utilizeaz trei multimi alfabetice, A, B i C cu r, s, respectiv t simboluri, cu B un
alfabet intermediar, alfabet de iesire din primul canal i de intrare n al doilea.
Dac se transmite simbolul ai, la iesirea primului canal se poate observa
simbolul bj. Acesta este aplicat la intrarea canalului al doilea care produce la
iesirea sa simbolul ck. Dac simbolul intermediar bj este cunoscut atunci
probabilitatea ca la iesire s apar simbolul ck depinde numai de bj
Pr(ck / ai , b j ) Pr(ck / b j )
relatie care este o definitie a canalelor n cascad. ntr-un parcurs invers are loc
Pr(ai / b j , ck ) Pr(ai / b j )
Calculul diferenei de entropii H(A/C) H(A/B) conduce la expresiile succesive
1
1
H ( A / C ) H ( A / B ) Pr(a, c) log
Pr(a, b) log
Pr(a / c ) AC
Pr(a / b)
AB
1
1
Pr(a, b, c ) log
Pr(a, b, c ) log
Pr(a / c) ABC
Pr(a / b)
A BC
Pr(a / b)
Pr(a, b, c) log
Pr(a / c)
A BC
Cu relatia
Pr(a, b, c) Pr(b, c) Pr(a / b, c)
A B C
BC
H ( A / C ) H ( A / B)
BC
Pr(a / b, c )
Pr(a / c)
1
1 x pentru x (0,1) rezult
x
H ( A / C ) H ( A / B) 0
cu egalitate dac i numai dac din Pr(a/c) = Pr(a/b, c), caz n care rezult
Pr(a/c) = Pr(a/b). Detaliile demonstratiei rmn n seama cititorului.
Relatia ultim se mai poate scrie i sub forma H ( A / C ) H ( A / B) . Deoarece
I ( A; B) H ( A) H ( A / B) i I ( A; C ) H ( A) H ( A / C ) rezult de aici un
fapt important:
I ( A; B) I ( A; C )
40
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
PI
, PII 0 2 / 3 1 / 3
0 1 / 2 1 / 2
0 1 / 3 2 / 3
Canalul secund nu este lipsit de zgomote i totui I(A;C) = I(A;B). Calculul
verific afirmatia.
1 / 3 1 / 3 1 / 3
P PI PII
PI
0 1 / 2 1 / 2
Problema aditivittii informaiei mutuale are sens dac intereseaz informatia
medie dat de o secvent de simboluri de iesire despre o secvent de simboluri
de intrare. Cazul apare cnd un acelai simbol de intrare este repetat de mai
multe ori i transmis printr-un canal cu zgomote sau cnd un simbol de intrare
este receptionat la iesire ca o secven de simboluri de iesire. Ideea general
este c informatia asupra unui simbol transmis este n ctig prin efectuarea mai
multor observatii. De pild, pentru fiecare simbol transmis se pot receptiona
dou simboluri la iesirea canalului (v.figura).
41
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H ( A / B) Pr(b) H ( A / b)
B
q p
42
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
1
I ( A; B ) 1 p log q log
p
q
Pr(a,b,c)
1 2
p
2
1 2
q
2
1
pq
2
1
pq
2
1
pq
2
1
pq
2
1 2
q
2
1 2
p
2
Pr(b,c)
Tip
1 2
( p q2 )
2
X
Y
Z
pq
Z
Z
pq
Z
1 2
( p q2 )
2
Y
X
I ( A; B C )
Pr(a, b, c ) log
A B C
Pr(a, b, c )
Pr(a) Pr(b, c )
q
log
p q2
p2 q2
Graficul alturat arat n culori diferite variaia n functie de eroarea q a celor
dou informatii mutuale, I(A;B) i I(A;BC). Se observ trei puncte n care are
loc egalitatea: punctele extreme, cnd transmiterea se face fr erori (chiar dac
la q = 1 are loc o inversare a biilor) i punctul central, q = 0,5, cnd nu exist
nici o diferen ntre transmiterea corect sau eronat, inversat a simbolurilor
sursei A.
43
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
I(A;B)
I(A;BxC)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Probabilitatea inversarii bitilor
0.8
0.9
Capacitatea canalelor
Capacitatea unui canal este o noiune de mare importan practic i se leag de
faptul c informatia mutual
Pr(a, b)
I ( A; B) Pr(a, b) log
Pr(a) Pr(b)
A B
depinde nu numai de canal, de probabilittile condiionate care-l definesc, ci i
de probabilittile simbolurilor de la intrare.
1
Eroare 1%
Eroare 10%
0.9
0.8
Transinformatia
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Probabilitatea primului simbol al sursei
44
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
0.9
O sugestie asupra modului n care variaz informatia mutual (sau transinformatia) cu probabilitile simbolurilor aplicate la intrare, n cazul simplu al
canalelor binare simetrice produce graficul alturat, trasat pentru dou niveluri
diferite ale erorilor introduse de canal.
Se observ c informatia mutual are de fiecare dat un maxim pentru cazul n
care simbolurile aplicate la intrarea canalului sunt echiprobabile. Acest extrem
are valoarea (a se calcula ca exercitiu)
1
1
I ( A; B) max 1 p log q log
p
q
Pentru o surs A mai general, asimetric i/sau cu mai multe simboluri,
stabilirea maximului transinformatiei nu este o operatie uoar. Dar de fiecare
dat cnd un simbol al sursei de intrare are aparitie cert, Pr(ai) = 1 i celelalte
sunt excluse, informatia mutual este nul. Valoarea maxim a informatiei
mutuale arat limita de sus a performanei canalului n transmiterea informatiei
generate de sursa de la intrare.
Se poate defini acum capacitatea canalului: maximum de transinformaie pe
multimea de surse care pot fi conectate la intrarea canalului
C = maxP(a)I(A;B) = maxP(a)[H(A) H(A/B)]
Aadar, capacitatea unui canal este deteminat exclusiv de matricea canalului,
notat mai devreme cu P.
n cazul canalelor binare simetrice cu nivelul erorilor q = 0,1 i q = 0,01
reprezentate n graficul de mai devreme, capacitatea variaz n raport cu nivelul
zgomotului: la nivel sczut (q = 0,01) capacitate mai mare, la nivel mai mare (q
= 0,1) capacitate mai redus. Lipsa total a zgomotelor aduce certitudinea n
transmitere i face capacitatea canalului maximal. Incertitudinea total de la p
= q = 0,5 aduce anularea capacittii de transmitere a canalului.
Cum s-a mai spus, calculul capacittii unui canal este oarecum delicat: este
vorba de stabilirea unui extrem n condiiile satisfacerii unor restricii. Un caz
mai simplu i interesant sub aspect practic l reprezint canalele uniforme. Un
canal este calificat ca uniform dac matricea P ataat are particularitatea c
elementele ei sunt de aa natur nct fiecare linie i fiecare coloan este o
permutare distinct a elementelor de pe prima linie. Rezult imediat c alfabetul
de iesire are acelai numr de simboluri ca i alfabetul de la intrare. Un canal
binar simetric este uniform, un canal binar cu anulare nu este uniform. Canalele
cu matricile de probabilitti conditionate
0.3 0.2 0.5
0.5 0.3 0.2, 0.7 0.3
0. 3 0. 7
0.5 0.3 0.2
45
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
nu sunt uniforme.
Pentru un canal uniform oarecare calculul pornete de la relatia
1
Pr(b / ai )
A
B
Suma a doua este suma unei linii din matricea P i este mereu aceeai oricare ar
fi linia i luat n considerare. Cum Pr(ai ) 1 rezult
I ( A; B) H ( B) H ( B / A) H ( B) Pr(ai ) Pr(b / ai ) log
1
Pr(b / ai )
B
cu termenul al doilea constant, independent de probabilittile P(ai). n aceste
conditii speciale
1
C max P ( ai ) I ( A; B ) max P ( ai ) H ( B ) Pr(b / ai ) log
Pr(b / ai )
B
46
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Densitatea de probabilitate
3
2.5
2
1.5
1
0.5
0
-4
-3
-2
-1
0
volti
47
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Densitatea de probabilitate
0.6
0.5
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
volti
48
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Ceea ce se ntmpl de data aceasta nu este tocmai n regul, mai ales cnd se
efectueaz o transmisie de date n care precizia este de mare importan.
O problem special privind canalele
Inginerii de telecomunicatii au de rezolvat uneori problema urmtoare:
Fie un canal cu banda de trecere W Hz. Canalul este afectat de perturbaii. Ce
debit de informaie se poate transmite prin acel canal la un raport
semnal/zgomot cunoscut?
Dac sursa cu alfabetul A are entropia H(A) atunci ea genereaz n medie H(A)
bii per simbol. Dac prin canal se transmite 1 simbol/secund atunci prin canal
se transmit n medie H(A) bii/secund. Zgomotul din canal reduce aceast
vitez cu echivocatia H(A/B). Aadar canalul nu poate produce la iesire o rat,
un debit de informaie mai mare dect R = I(A;B) = H(A) H(A/B) bii/secund.
Capacitatea canalului este valoarea maxim a transinformatiei I(A;B) i ea poate
fi numeric egal cu viteza maxim cu care se pot alimenta simboluri la intrarea
canalului de transmisie.
Urmeaz acum dezvoltarea unei expresii specifice pentru capacitatea canalului.
O teorem a eantionrii spune c dac un semnal este eantionat de N ori pe
secund atunci semnalul respectiv este limitat ca spectru de frecvente la N/2 Hz.
Sau, pentru un semnal de band limitat de mediul de transmisie la W Hz,
numrul de eantioane pe secund trebuie s depeasc Nmin = 2W pentru a
putea fi reconstituit din eantioanele sale.
Fie acum P puterea semnalului i = N0W puterea zgomotului n canal, cu N0
densitatea spectral de putere a zgomotului presupus constant n banda de
frecvene a semnalului transmis (zgomot alb).
Rdcina ptrat a unei puteri are dimensiunea unei tensiuni (curent) dac
sarcina este rezistiv de 1 ohm. Se admite c transmiterea informatiei se face n
trepte de tensiune care nu pot fi mai mici dect tensiunea eficace a zgomotului.
Numrul de trepte se calculeaz prin raportarea a dou tensiuni (cureni)
P 2
P
2
2
urmat de o rotunjire la un numr ntreg apropiat. Cu S niveluri ale semnalului
(altfel spus cu un alfabet cu S simboluri) entropia maxim se obine atunci cnd
nivelurile au aceeai probabilitate
S
1
1
P
log S log S log1 2
2
i 1 S
Dac se preiau Nmin = 2W eantioane pe secund i fiecare eantion poart logS
bii de informaie, atunci viteza maxim de transmitere este Rmax = 2WlogS bii
pe secund i din
1
P
Rmax C 2W log S 2W log1 2
2
rezult
S
49
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
C W log1 2
expresia unei teoreme (Shannon-Hartley) asupra capacittii unui canal definit
din unghiul de vedere al inginerului de telecomunicatii, n functie de raportul
semnal/zgomot, P/2 i de banda de frecvene a semnalului. Logaritmii sunt n
baza 2 i rezultatul este n bii/secund.
Un exemplu: Care este nivelul minim al raportului semnal/zgomot al unui canal
telefonic dac el trebuie s serveasc un modem de 56 kbps (kilobii pe
secund)?
Viteza de 56 kbps necesit o capacitate a canalului de cel puin C = 56000
biti/secund (bps). Lrgimea benzii unui canal telefonic W este de cca. 3,6 kHz.
Ecuaia
P
50
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
51
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
s4
Codul A
Codul B
Codul C
0
11
00
0
11
00
00
01
10
11
010
11
52
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
s4
Codul A
Codul B
Codul C
0
10
110
0
01
011
00
01
011
1110
0111
111
Cele trei coduri sunt unic decodabile deoarece n nici o mprejurare nu exist
decodri neunice, dar numai codul A este instantaneu. De ce? Fie secvena
01011101100100010 s1 s 2 s 4 s 3 s1 s 2 s1 s1 s 2
n momentul cnd apare simbolul terminal 0 receptorul poate imediat s fac
decodarea. Simbolul 0 are aici rol de separator i decodarea este instantanee
(i codul este unic decodabil).
Fie acum secventa
01101011100 s 3 s 2 s 4 s1 s1
codat cu codul B. i acum simbolul 0 are rol de separator, dar pentru o
decodare corect a cuvntului curent este necesar citirea primului caracter din
cuvntul urmtor. De exemplu cuvntul 011 nu poate fi interpretat ca s3 dect
dup ce avem confirmarea prin lectur c urmtorul caracter este primul (0)
din cuvntul urmtor. Dac urmtorul simbol este 1 atunci decodarea corect
este 0111 s 4 . Dei codul B este unic decodabil, separatorul 0 garanteaz
aceast calitate, dar el nu este un cod instantaneu.
n cazul codului C argumentarea este nc mai convingtoare. Pentru aceasta se
ia secventa 01111111. Receptorul este incapabil s decodeze pn nu primeste
un simbol 0 sau un marcaj de final de transmisie. Este clar c acest cod nu
este instantaneu i receptorul trebuie s fie n partea de decodare complicat pe
msur. Codul este totui unic decodabil, simbolul 0 joac i aici rol de
separator.
Conditia de prefix. Fie X i xi1 xi 2 ...xin un cuvnt de cod de lungime n. Secvena
de simboluri ( xi1 xi2 ...xi j ) cu j n este numit prefix al cuvntului de cod Xi .
Conditia necasar i suficient ca un cod s fie instantaneu este ca nici un
cuvnt al codului s nu fie prefix al vreunui alt cuvnt de cod.
Se impune a observa c deoarece un cod instantaneu este unic decodabil
conditia de prefix este o conditie suficient (dar nu necesar) pentru ca un cod
s fie unic decodabil.
53
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
54
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
55
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
K r li 1
i 1
56
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Codul A
0
100
110
111
Codul B
0
100
110
11
Codul C
0
10
110
11
K 2 l1 2 1 2 3 2 3 2 2 1
i 1
Inegalitatea lui Kraft este satisfcut. Codul poate fi reproiectat pentru a deveni
instantaneu: 0, 110, 111, 10.
Codul C. Cuvntul de cod pentru mesajul s4 este prefix pentru cuvntul de cod
asociat mesajului s3. Conditia de prefix nu este ndeplinit. Codul nu este
instantaneu.
Se calculeaz
4
K 2 l1 2 1 2 2 2 3 2 2 1
i 1
57
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
K r li 1
i 1
58
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
L pi li
i 1
Sunt interesante codurile unic decodabile cu lungimea medie cea mai mic.
Fie o surs i simbolurile/mesajele ei aplicate pe o multime de cuvinte de cod
unic decodabile, care folosesc un alfabet cu r simboluri. Acest cod este compact
dac lungimea lui medie este mai mic sau cel mult egal cu lungimea medie a
oricrui alt cod unic decodabil care utilizeaz acelai alfabet pentru codarea
simbolurilor/mesajelor sursei date.
Problema determinrii codurilor compacte este fundamental pentru codarea
unei surse de informatie. ntruct intereseaz lungimea medie a cuvintelor de
cod i nu cuvintele de cod particulare, cercetarea poate fi restrns numai la
codurile compacte instantanee. Teorema lui McMillan permite aceasta.
Cteva observaii referitoare la codurile compacte:
Lungimea medie a unui cod bloc (cu cuvinte de lugime n) este chiar n i cea
mai mic lungime medie a unui cod bloc este log2q/log2r.
Pentru a obtine o lungime medie mic este necesar a se atribui celor mai
probabile simboluri, cuvintele de cod cele mai scurte. Aceast procedur are
sens deplin deoarece cu ct se atribuie cuvinte mai scurte unor simboluri, cu
att mai lungi sunt cuvintele de cod rmase a fi atribuite.
Exemple suport pentru aceste asertiuni:
Coduri de lungime cuvintelor egal (coduri bloc)
00 01 10 11
Coduri inegale ca lungime
coduri mai scurte - simboluri mai frecvente
0
10
110
111
coduri mai lungi - simboluri mai putin frecvente
pi
0,5
0,1
0,2
0,2
Codul A
00
01
10
11
Codul B
1
000
001
11
ntrebri:
a) Care sunt lungimile medii ale codurilor din tabel?
b) Care cod este mai bun sub aspectul lungimii medii?
Codul A are lungimea medie LA = 2 bii/simbol.
Codul B are lungimea medie LB = 0,51 + 0,13 + 0,23 + 0,22 = 1,8
bii/simbol.
Codul B este mai bun dect codul A deoarece LB < LA.
59
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
pi log 2
pi log 2 r i 1
pi log 2 r
i 1
Urmeaz demonstraia relaiei limitative pentru lungimea medie L a cuvintelor
de cod:
q
q
1
H r (S ) L pi log r pi li
pi i 1
i 1
q
q
1
1
1 q
1
pi log r l i
pi ln
pi i 1
r
ln r i 1
pi r l i
i 1
Cum pentru x > 0 lnx x 1, rezult
1 q 1
1 q 1
1 q
1 q li
r 1
H r (S ) L
p
i
i
li
li
ln r i 1 pi r
ln r i 1
ln r i 1
ln r i 1 r
pi log r
li
i 1
aa nct
H r (S ) L 0
ceea ce era de demonstrat.
Egalitatea are loc ntr-adevr cnd Pi r l i pentru toti indicii i.
Definirea entropiei H(S) ca un numr de bii per simbol capt un sens. H(S)
este lungimea medie a unui cod binar msurat n bii per simbol. Hr(S) este
lungimea medie cea mai mic a unui cod bazat pe un alfabet cu r simboluri i
este msurat n numrul de simboluri pe alfabetul codului.
Nu exist o garanie c se poate obtine n fapt un cod cu lungimea medie L =
Hr(S), dar relatia dintre L i Hr(S) exprim o eficien a codului prin
= Hr(S)/L
60
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
pi
0,5
0,1
0,2
0,2
Codul C
0
21
1
20
Lungimea medie minim trebuie reevaluat deoarece este vorba acum de un alt
alfabet al codului. Limita inferioar a numerelor LC este
H3(S) = H(S)/log23 = 1,761/1,585 = 1,111
Aadar, codul C este eficient la nivelul 85%, mai slab chiar dect codul A.
Este codul C compact? Foarte probabil deoarece puin mai poate fi fcut (sau
nimic) pentru creterea eficienei acestui cod.
n general L Hr(S) i eficiena este inferioar unittii. Cum se pot obtine totui
eficiene mai apropiate de 100%? Conform demonstratiei de mai sus, aceasta se
ntmpl atunci cnd pentru toi indicii i au loc egalitile Pi r l i ceea ce este
posibil rar, pentru sursele numite surse speciale. n alti termeni, prin surse
speciale nelegem sursele care au probabilittile pi asociate simbolurilor astfel
nct numerele logr(1/pi) sunt ntregi. Pentru sursele speciale, un cod pe un
alfabet cu r simboluri, cu lungimile cuvintelor li = logr(1/pi) satisface condiiile
Pi r l i i de aici rezult L = Hr(S). Se atinge efectiv marginea inferioar a
lungimilor medii ale codurilor pentru acea surs i acel alfabet. Eficienta de
61
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
100% este atins i este atins implicit i lungimea medie cea mai mic posibil
pentru un cod compact.
Cteva surse speciale sunt prezentate n tabelele care urmeaz.
Sursa
s1
s2
s3
s4
pi
0,25
0,25
0,25
0,25
Cod
00
01
10
11
Sursa
s1
s2
s3
s4
pi
0,5
0,25
0,125
0,125
Cod
0
10
110
111
Sursa
s1
s2
s3
s4
s5
s6
s7
pi
1/3
1/3
1/9
1/9
1/27
1/27
1/27
l
Probabilittile sunt de forma 3 i ceea ce
pentru r = 3 produce un cod binar compact de
lungime medie de exact 13/9, ct este i
entropia sursei calculat n baza 3, adic de
eficient maxim
Cod
0
1
20
21
220
221
222
62
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
i 1
i 1
63
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Problema extensiilor are o valoare aparte cnd sursa i codul folosesc acelai
alfabet. Desigur, pentru o surs binar i un canal digital binar codarea nu se
face n scopul unei conversii alfabetice. Un exemplu plin de sensuri l constituie
cazul sursei cu dou mesaje din tabelul alturat.
pi
0,8
0,2
Mesaje
s1
s2
pi
0,64
0,16
0,16
0,04
Codul compact
0
10
110
111
64
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
H r (S ) m n H r (S ) m
n
n
n n
o dubl inegalitate care spune acelai lucru ca n cazul surselor fr memorie:
pe msur ce n creste, Ln /n se apropie de Hr(S), entropia sursei. Aadar:
Teorema de codare a lui Shannon pentru canale fr perturbatii se menine
la limit, att pentru sursele fr memorie ct i pentru sursele Markov.
Limita inferioar a lungimii medii este Hr(S). Aceast entropie depinde ns
de modelul care se utilizeaz pentru surs. Entropia unei surse descrete la
ordine din ce n ce mai mari ale modelului Markov pn cnd este atins
L
L
H ( S ) n H (S ) 1 0 n 1
n
n
Pentru extensia a doua
Sursa
00
01
pi
0
0,5
65
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Cod
0
10
11
0,5
0
1
-
66
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Pr(s1s2)
0,49
0,21
0,21
0,09
Cod
0
10
110
111
i apoi
L2/2 = 0,905 L i = H(S)/L = 0,88/0,905 = 0,972
Codarea sursei are ca efect transmiterea n canal a secventei 0 10 110 10 0 caz
n care o estimare a probabilittilor celor dou simboluri conduce la Pr(0) = 5/9,
Pr(1) = 4/9 i H(S) = 0,99, mai aproape de entropia maxim.
Modul cum au fost evaluate probabilittile n acest exemplu este contestabil,
dar servete destul de convingtor la ilustrarea relatiei debit de informatie
capacitate a canalului.
Coduri compacte coduri Huffman
Am artat mai devreme c pn i pentru o surs simpl poate fi necesar uneori
a se lucra cu extensii de ordine nc mai mari de 2 sau 3. Stabilirea unui cod
compact este simpl numai n cazul unor surse generatoare de puine mesaje.
Pentru extensiile lor i pentru surse cu o list mai bogat de mesaje, codurile
compacte nu mai sunt att de evidente. Este necesar aadar o algoritmizare a
codrii prin coduri compacte.
O metod simpl a fost pus la punct de Huffman n 1952. Este nc utilizat
datorit simplitii ei. Mai departe este dezvoltat cazul codurilor compacte
binare, deci cu un alfabet al codului din dou simboluri.
Sursa redus. Se consider o surs S cu simbolurile s1, s2, , sq, i cu
probabilittile de aparitie p1, p2, , pq. Se consider totodat c probabilittile
sunt ordonate descresctor, p1 p2 pq. Prin combinarea ultimelor dou
simboluri ntr-unul singur cu nsumarea probabilittilor lor, se obtine o nou
surs, o surs redus a sursei S, care are acum numai q 1 simboluri. Fie
aceasta S1. Dup eventuala reordonare a probabilittilor i a simbolurilor, prin
combinarea din nou a ultimelor dou simboluri se obtine o alt redus a sursei
67
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
S, fie aceasta S2, care are i ea un simbol mai putin. Pe aceast cale se obine o
succesiune de surse reduse S1S2S3, ultima din succesiune cu numai dou
simboluri.
Dac pentru una din sursele reduse Sj codul compact este cunoscut, atunci codul
compact pentru sursa (redus) precedent Sj1, care poate fi n cele din urm
chiar sursa iniial se construieste astfel:
Se identific simbolurile din Sj1, s, scare au produs prin reunire simbolul
s din Sj . Simbolurilor din Sj1, exceptnd s sli se atribuie aceleai cuvinte
de cod ca i n Sj. Simbolurilor s, sli se atribuie cuvinte de cod noi obtinute
prin adugarea la cuvntul de cod al simbolului s, a unui 0, respectiv a unui 1.
i acum algoritmul de codare binar al lui Huffman
1. Se reduce sursa S la S1 i mai departe la S2, S3 etc. pn la sursa redus
compus numai din dou simboluri (sau pn la una pentru care stabilirea
unui cod compact este facil).
2. Se atribuie sursei ultime un cod compact. Dac este cu numai dou
simboluri se face atribuirea trivial 0 i 1.
3. Se parcurge invers secvena de surse reduse modificnd sau nu cuvintele de
cod dup reeta de mai sus. Codul atribuit sursei iniiale este codul compact
Huffman.
Ca exemplu, fie o surs cu ase simboluri/mesaje cu probabilittile de apariie
date imediat mai jos
s1
0,3
s2
0,4
s3
0,04
s4
0,1
s5
0,1
s6
0,06
p
0,4
0,3
0,1
0,1
0,06
0,04
p/S1
0,4
0,3
0,1
0,1
0,1
p/S2
0,4
0,3
0,2
0,1
p/S3
0,4
0,3
0,3
p/S4
0,6
0,4
68
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
S
s2
s1
s5
s4
s3
s6
p
0,4
0,3
0,1
0,1
0,06
0,04
1
00
011
0100
01010
01011
p/S1
0,4
0,3
0,1
0,1
0,1
1
00
011
0100
0101
p/S2
0,4
0,3
0,2
0,1
1
00
010
011
p/S3
0,4
0,3
0,3
1
00
01
p/S4
0,6
0,4
0
1
00
1
01010
0100
011
01011
Codul are o lungime medie de L = 2,2 bii/simbol, entropia sursei este H(S) =
2,1435, prin urmare eficienta codului este de cca. 97%.
Sunt de retinut urmtoarele:
Codul nu este unic: la realizarea surselor reduse sunt puncte unde sunt
posibile alegeri alternative ale simbolurilor care urmeaz a fi reunite ntrunul singur, iar atribuirea de 0 i 1 n cuvintele de cod poate fi inversat.
Alegerea posibil n unele etape poate conduce la cuvinte de cod de lungimi
diferite. dar niciodat lungimea medie nu se modific.
Nu este necesar a merge pn la o ultim surs redus de numai dou
simboluri. Dac pe parcurs se identific o codare pentru o surs redus mai
bogat n simboluri parcursul invers poate fi initiat imediat
Un exemplu de cod alternativ este prezentat n tabelul care urmeaz. Acesta se
deosebete de cel de mai devreme prin alegerea diferit a ordinei simbolurilor
n sursa redus S1: simbolul rezultat prin reunirea a dou simboluri din sursa
originar este plasat diferit n lista ordonat.
S
s2
s1
s5
s4
s3
s6
p
0,4
0,3
0,1
0,1
0,06
0,04
1
00
0100
0101
0110
0111
p/S1
0,4
0,3
0,1
0,1
0,1
1
00
011
0100
0101
p/S2
0,4
0,3
0,2
0,1
1
00
010
011
p/S3
0,4
0,3
0,3
1
00
01
p/S4
0,6
0,4
69
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
0
1
0,22
0,15
0,12
0,10
0,10
0,08
0,06
0,05
0,05
0,04
0,03
2
3
00
01
02
03
11
12
13
100
101
0,22
0,15
0,12
0,10
0,10
0,08
0,07
0,06
0,05
0,05
2
3
00
01
02
03
10
11
12
13
0,23
0,22
0,15
0,12
0,10
0,10
0,08
1
2
3
00
01
02
03
0,40
0,23
0,22
0,15
0
1
2
3
70
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
71
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
72
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Sirul codat
$Sc*655.72
Sc-9
GunsSc_7butter
Observaii:
irul ScXCc este un descriptor compus din cel puin trei caractere. Asadar,
codarea este eficace dac repetarea caracterului X se produce de cel puin 4
ori.
Caracterul de numrare Cc este mrginit de numrul de bii pe care este
reprezentat. Pe 8 bii el nu poate depi 255. Pe 16 bii valoarea acceptat
creste cu lungirea concomitent a descriptorului Cc.
Alfabetul sursei poate s nu permit un caracter special. n asemenea cazuri
este necesar un tratament special (de pild n cazul transmiterii de la o surs
binar) (De judecat: de ce nu este posibil a se utiliza un caracter special
pentru o surs binar?)
Codoare Markov
Un sumar al cunostinelor acumulate pn la acest moment pune n eviden
urmtoarele:
Limita inferioar a lungimii medii a unui cod este entropia sursei sau mai
exact spus entropia evaluat pe baza unui model al sursei. Prin considerarea
unor extensii ale sursei, lungimea aceasta minim poate fi aproape atins i
codul devine mai eficient.
Modelul Markov pentru o surs poate avea entropii semnificativ mai reduse
dect sursa adjunct, entropia real H ( S ) fiind cea mai mic entropie deci
limita de jos a lungimii medii a cuvintelor de cod.
Aadar un codor aproape ideal al unei surse cu memorie ar trebui s foloseasc
un model Markov de un ordin m atfel nct entropia H ( S m ) s fie ct mai
apropiat de H ( S ) . Apoi o a n-a extensie a modelului Markov de ordinul m,
cu un n suficient de mare pentru ca lungimea medie a cuvintelor de cod s fie
ct mai apropiat de H ( S m ) .
n cazul codrii Huffman apar dificulti de implementare datorate incomoditii de a estima statistica modelului Markov al sursei pe baza unui volum
finit de date. Mai apare apoi i problema stabilirii unui cod pentru o extensie a
sursei de un ordin n mare. Codarea Huffman necesit memorii i calcule de
ordinul qn, aadar, pentru spaiul de memorare i pentru timpul de calcul se
nregistreaz o cretere exponenial cu n. Dar nu-i mai puin adevrat c pentru
n foarte mare nu este necesar a fi cunoscute toate cuvintele de cod cu
probabilitile lor deoarece din mulimea de mesaje n numr de qn numai unele
pot aprea efectiv, multe fiind cu totul improbabile.
O alternativ la codarea Huffman este codarea aritmetic. Aceasta se bazeaz
pe faptul c suma probabilitilor Pr(si1 si2 ...si n ) ale celor qn cuvinte ale
extensiei unei surse este egal cu unitatea. Toate numerele acestea se situeaz n
intervalul [0, 1) i este important a fi localizat subintervalul n care numrul
73
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Pr(si1 si2 ...si n ) se situeaz pentru ca apoi s fie transmii suficieni bii pentru
74
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Definirea unor limite superioare i inferioare. De la acest punct, limitele superioar i inferioar ale intervalului curent vor fi numite high i low. Limitele
subintervalelor sunt calculate din probabilitti cumulate:
k
K(ak) =
(ai )
i 1
Noul interval I este pus acum a fi [low, high). Calculul nu este o noutate: el
este conform cu metoda matematic folosit la construcia figurii de mai sus.
Aspectul cel mai relevant al acestei metode este c subintervalul I este mai larg
pentru un simbol s1 mai probabil. Cu ct este mai larg intervalul cu att mai
redus este numrul de cifre dup virgul i cuvtul de cod este mai scurt. Toate
numerele care vor fi generate n iteratiile urmtoare vor fi localizate n
intervalul I deoarece acesta este utilizat ca interval de baz, asa cum a fost mai
devreme intervalul I = [0, 1).
75
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Aceast regul este valabil pentru toti paii, n particular i pentru primul cnd
low = 0 i high low = 1. Deoarece vechile limite nu mai sunt necesare, ele se
pot nlocui, se pot suprascrie: low low; high high.
Calculul acesta iterativ poate prea complicat, dar un exemplu simplu va lmuri
lucrurile.
Fie S secvena abaabcda sub modelul ideal M de mai sus.
La nceput se ia intervalul [0, 1) i primul simbol din S. Deoarece s1 = a noile
limite calculate sunt
low = 0
high = 0 + 0,51 = 0,5
Intervalul nou rezultat este [0, 0,5). Iteraia urmtoare codeaz un b i
low = 0 + 0,5(0,5 0) = 0,25
high = 0 + 0,5(0,5 0) + 0,25(0,5 0) = 0,375
Urmeaz un a i
low = 0,25
high = 0,25 + 0,5(0,375 0,25) = 0,3125
apoi nc un a
low = 0,25
high = 0,25 + 0,5(0,3125 0,25) = 0,28125
Al cincilea caracter este un b
low = 0,25 + 0,5(0,28125 0,25) = 0,265625
high = 0,25 + 0,5(0,28125 0,25) + 0,25(0,28125 0,25) = 0,2734375
urmat de un c
low = 0,265625 + 0,5(0,2734375 0,265625) + 0,25(0,2734375 0,265625)
= 0,271484375
high = 0,265625 + 0,5(0,2734375 0,265625) + 0,25(0,2734375 0,265625)
+ 0,1250,25(0,2734375 0,265625)
= 0,2724609375
un d
low = 0,271484375 + (0,5 + 0,25 + 0,125)(0,2724609375 0,271484375)
= 0,2723388672
high = 0,2724609375
76
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Acum se stabilete codul numr real. Ar trebui specificat intervalul calculat. Sar putea memora limitele de sus i de jos ale intervalului, dar aceasta ar fi o
schem ineficient. tiind c intervalul n ntregime este unic pentru un mesaj,
se poate memora n siguran un singur numr din acest interval. Lema
urmtoare contureaz aceast tehnic.
Lem. Codurile tuturor mesajelor de aceeai lungime formeaz o partitie a
intervalului I = [0, 1).
Acest rezultat transpare limpede din figura alturat. O concluzie a lemei deriv
din observatia c fragmentele/clasele partiiei devin infinit de mici pentru
mesaje infinit de lungi. n practic nu exist mesaje infinit de lungi, dar exist
mesaje foarte lungi i partiiile mrunte rezultate pot crea probleme n
calculatoarele obinuite, care utilizeaz o aritmetic finit. Soluia este o
operatie de re-scalare.
n exemplul prezentat mai devreme se poate memora 0,27234 sau oricare alt
valoare din interval. Se admite suplimentar faptul c se cunoate plasarea
finalului de mesaj, dei nu acesta este cazul n general (de pild n transmiterea
77
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
78
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Pentru a calcula limitele low, high la fircare etap, s-a utilizat aritmetica n
virgul mobil. Dac nu se recurge la mijloace suplimentare, se poate ajunge la
numere cu foarte multe cifre dup virgul, chiar infinit de multe (cum este cazul
cu 1/3). Numerele de acest gen sunt dificil de manipulat ntr-o aritmetic finit.
Prevenirea unor asemenea situaii este subiectul paragrafului urmtor.
Unicitatea reprezentrii. Fie pentru ai codul C(ai) definit ca
1
C (ai ) K (ai 1 ) PM (ai )
2
C(ai) este centrul intervalului ai. Codul C(ai) poate fi scurtat la lungimea
1
l (ai ) log
1
PM (ai )
cu logaritmul n baza 2 (se folosesc aici notaiile i pentru a extrage dintrun numr real ntregul egal sau imediat superior, respectiv ntregul egal sau
imediat inferior).
Se definete C (ai )l ( a i ) ca fiind codul pentru ai scurtat la l(ai) digii.
Exemplu. Fie S = s1s2s3s4 o secven pe alfabetul A = {a1, a2, a3, a4}. Fie
probabilittile calculate pe baza modelului M
PM(a1) = 1/2, PM(a2) = 1/4, PM(a3) = 1/8, PM(a4) = 1/8
Tabelul urmtor arat o codare binar posibil pentru secvena propus.
1
Reprezentarea binar pentru C(ai), dup scurtare la lungimile log
1,
PM (ai )
79
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
l ( ai )
2
Deoarece C(ai) este prin definitie mai mic dect K(ai) rezult c
C (ai )l ( ai ) < K(ai)
Pe de alt parte
1
1
1
1
1
P (a )
M i
l ( ai )
1
1
1
1
log
1
log
2
2
log
1
P (a )
2 PM ( ai )
2 2 PM ( ai ) 2 P (a )
2 M i
M
i
Dar prin definiie
PM (ai )
C (ai ) K (ai 1 )
2
de unde
1
C ( a i ) K ( a i 1 ) l ( a i )
2
i
C (ai )l ( ai ) K(ai1)
cu concluzia final
K(ai1) C (ai )l ( a i ) < K(ai)
S-a dovedit astfel c C (ai )l ( a i ) este o reprezentare pentru C(ai) lipsit de
ambiguiti. Pentru a arta c nici la decodare nu apar ambiguiti, trebuie
dovedit c acest cod ndeplineste condiia de prefix.
Fe un numr x din intervalul [0, 1) i reprezentarea lui binar x1x2xn. Este
evident c orice alt numr y care n reprezentare binar are prefixul x1x2xn se
situeaz n intervalul [x, x + 1/2n). Este tiut c dac simbolurile ai i aj sunt
80
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
C (ai )l ( ai ) , C (ai )l ( ai ) 2l ( ai )
este continut n intervalul [K(ai1), K(ai)), ceea ce ar face imposibil ca simbolul
ai s aib un cod care s fie prefix pentru codul unui alt simbol aj, diferit.
O inegalitate stabilit mai devreme
C (ai )l ( ai ) K(ai1)
sprijin demonstraia pentru limita inferioar. Este acum suficient a arta c
1
K(ai) C (ai )l ( ai ) l ( ai )
2
Inegalitatea aceasta este evident deoarece
P (a )
1
K (ai ) C (ai )l ( ai ) K (ai ) C (ai ) M i l ( ai )
2
2
Aadar, codul este liber de prefix. n particular, scurtarea lui C(ai) la l(ai) bii
produce un cod decodabil fr ambiguitti. S-a rezolvat astfel problema
utilizrii aritmeticii finite n cazul codurilor n virgul mobil.
Codarea ca o secvent de biti. Pentru a implementa eficient codarea aritmetic,
trebuie inut seam de unele restricii: nu exist numere reale infinit de lungi i
implementrile cu ntregi pure sunt un mod mai rapid de calcul pentru
procesoarele de genul celor din faxuri (care utilizeaz codarea aritmetic sub
protocolul G3).
Exist cel puin o implementare care consum foarte putin memorie (un singur
registru de 32 de biti pentru limite) i numai cteva instructiuni simple n
numere ntregi. Ieirea este o secven de bii fr ambiguitti, care poate fi
memorat sau expediat din mers.
Compresia LZW
Compresia LZW ii datoreaz numele realizatorilor ei, A.Lempel i J.Ziv (1978)
i Terry A.Welch (1984), cel care a completat lucrarea primilor doi. Din cauza
simplittii i versatilitii ei, este tehnica cea mai avansat pentru comprimarea
datelor de uz general. Tipic, este de ateptat ca algoritmul LZW s comprime
fiiere text, fiiere executabile i alte genuri de fiiere similare la circa jumtate
din dimensiunea lor nainte de comprimare. Tehnica LZW este deosebit de
performant n cazul fisierelor extrem de redundante, cum sunt tabelele,
fiierele surs, semnalele obtinute prin sistemele de achiziie de date. Pentru
aceste cazuri, rapoarte de compresie de 1:5 sunt foarte uzuale. LZW este baza
unor utilitti pentru calculatorul personal care pretind dublarea capacittii
discului.
Comprimarea LZW este totdeauna folosit pentru fiierele imagine GIF i ofer
o optiune de luat n considerare pentru fisierele TIFF i PostScript.
81
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Compresia LZW utilizeaz un tabel de coduri precum cel prezentat mai jos.
ntr-o alegere obinuit, se asigur un tabel cu 4096 de linii. Datele codate LZW
ntru comprimare constau n totalitate din numere pe 12 biti, fiecare numr
referindu-se la una din poziiile din tabelul de coduri, un gen de dicionar.
Decomprimarea se execut prin luarea fiecrui cod din fiierul comprimat i
traducerea lui folosind tabelul de coduri, la caracterul sau caracterele pe cale
l/le reprezint. Codurile de la 0 la 255 din tabelul dat ca exemplu sunt
totdeauna atribuite reprezentrii caracterelor de un singur byte lungime din
fisierul de intrare, cel a crui comprimare se urmrete. De pild, dac s-ar
utiliza numai aceste prime 256 de coduri, fiecare byte ar fi convertit la 12 biti n
fiierul codat LZW, ceea ce ar produce un fiier cu 50% mai mare. n timpul
decomprimrii fiecare cod de 12 biti din fisierul codat LZW ar fi tradus invers,
prin intermediul tabelului cu coduri, n bytes/octei unici. Desigur, acest mod de
a trata lucrurile nu este de vreo utilitate.
Coduri
0000
0001
0255
0256
0256
Traducere
0
1
255
145 201 4
248 245
4095
82
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Punctul cheie al metodei este acela c o secven din fiierul de intrare nu este
adugat n tabelul de coduri pn cnd nu a fost aezat n fisierul comprimat
ca bytes individualizati (coduri de la 0 la 255). Acesta este un fapt important
deoarece permite programului de decomprimare s reconstruiasc tabelul-
83
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
t
h
e
/
r
a
i
n
/
i
n
/
S
p
a
i
n
/
f
a
l
l
s
/
m
a
i
n
l
y
/
o
n
/
t
h
e
/
p
l
a
STRING+
CHAR
t
th
he
e/
/r
ra
ai
in
n/
/i
in
in/
/S
Sp
pa
ai
ain
n/
n/f
fa
al
ll
ls
s/
/m
ma
ai
ain
ainl
ly
y/
/o
on
n/
n/t
th
the
e/
/p
pl
la
Este n
tabel?
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Da (262)
Nu
Nu
Nu
Nu
Da (261)
Nu
Da (263)
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Da (261)
Da (269)
Nu
Nu
Nu
Nu
Nu
Da (263)
Nu
Da (256)
Nu
Da (258)
Nu
Nu
Nu
Iesire
Adaugare
n tabel
t
h
e
/
r
a
i
n
/
256 = th
257 = he
258 = e/
259 = /r
260 = ra
261 = ai
262 = in
263 = n/
264 = /i
262
/
S
p
265 = in/
266 = /S
267 = Sp
268 = pa
261
269 = ain
263
f
a
l
l
s
/
m
270 = n/f
271 = fa
272 = al
273 = ll
274 = ls
275 = s/
276 = /m
277 = ma
269
l
y
/
o
278 = ainl
279 = ly
280 = y/
281 = /o
282 = on
263
283 = n/t
256
284 = the
258
p
l
285 = /p
286 = pl
287 = la
84
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Noul
STRING
t
h
e
/
r
a
i
n
/
i
in
/
S
p
a
ai
n
n/
f
a
l
l
s
/
m
a
ai
ain
l
y
/
o
n
n/
t
th
e
e/
p
l
a
Comentarii
Nici o actiune
Prima potrivire
42
43
44
i
n
/
ai
ain
ain/
45
EOF
Da (261)
Da (269)
Nu
269
288 = ain/
ai
ain
/
EOF,
STRING la ieire
85
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
86
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
87
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
{B1, B2, }
decodor
canal . . .
{X1, X2, }
88
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
R
O
O
Y
O
O
Y
Y
Y
Y
G
G
Intensitate
3
2
1
0
Codare
Cuvnt de cod
001
01
1
000
nlocuirea intensittii fiecrui pixel cu codul binar din tabel conduce la secventa
binar
B(X) = 0010010110010101101011000111000
Raportul de compresie este r = 32/31 sau 1,0323:1. Primul numr, 32 face
trimitere la codarea banal prin 2 biti pe pixel, codare posibil deoarece
numrul de simboluri ale alfabetului sursei este 4 i log24 = 2.
Exemplul 4 face o comparatie ntre dou codri diferite pentru vectorul de date
X = ABRACADABRA
Primul codor este fr memorie ca n exemplul anterior (cu alte cuvinte
simbolurile cuprinse n vectorul X sunt codate independent unul de altul) i
rezultatul este cuprins n tabelul urmtor
Codarea I
Caracter
Cuvnt de cod
A
0
B
10
R
110
C
1110
D
1111
89
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Codarea II
Caracter, caracter premergtor
A,
B, A
C, A
D, A
R, B
A, R
A, C
A, D
Cuvnt de cod
1
0
10
11
1
1
1
1
90
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
X i , j
Cuvnt de cod
000
001
010
011
100
101
110
111
15,5
47,5
79,5
111,5
143,5
175,5
207,5
239,5
1 31
=
(k 15,5) 2 = 85,25
32 k 0
Aceeai tehnic poate fi utilizat pentru codarea imaginii la alte rate R = 0, 1, 2,
, 8. La fiecare rat R se divid valorile de la 0 la 255 n prti egale, de 256/2R
niveluri fiecare. Apoi se asociaz fiecare Xi,j la valoarea median a fiecrei
prti/grupe de care apartine. Ieirea codorului const n cei R biti care se
identific cu grupa de care Xi,j apartine. Se poate verifica urmtoarea formul
pentru distorsiunea D(R), dependent de aceste rate R:
2
256 / 2 R 1
1 256
k 2 2 R 1
, R = 0, 1, 2, , 8
D ( R) k 0
256
2R
Perechile rat-distorsiune se pot grupa ntr-un tabel
R
0
1
2
3
4
5
6
7
D(R) 5461,25 1365,25 341,25 85,25 21,25 5,25 1,25 0,25
8
0
91
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
5000
Distorsiunea
4000
3000
2000
1000
4
5
Rata (biti/pixel)
92
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
care este rata minim R la care se poate obtine o distorsiune medie D dat?
O ntrebare mai cuprinztoare: ce perechi (R, D) pot fi realizate practic?
Codarea rat-distorsiune se poate aplica att pentru surse discrete ct i pentru
surse continue.
Un exemplu simplu: cuantizarea unei variabile aleatoare gaussiene X ~ N(0, 2).
Variabila X trebuie reprezentat folosind R bii pe eantion, adic prin numai
aproximativ N = 2R valori.
Msura distorsiunii poate fi eroarea ptratic. Atunci, trebuie stabilite valorile
de diviziune a domeniului de definitie, {x1, , xN+1} i valorile aproximante
{y1, , yN} care s minimizeze media ptratelor diferenelor ntre valorile
reprezentate i valorile care le reprezint:
N x i 1
E ( X X ) 2
f ( x)( x y ) dx
i
i 1 x i
E ( X X )2 0, i 1, ..., N 1
xi
E ( X X )2 0, i 1, ..., N
yi
ceea ce conduce la
xi = (yi + yi 1)/2 (conditia de vecin-cel-mai-apropiat)
i
x i 1
yi
xi
x i 1
xf ( x)dx
xi
(conditia de centroid)
f ( x )dx
Pentru R = 1
x
2
x0
x0
2 2
93
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Distorsiunea Hamming
1 x x
d ( x, x)
0 x x
Distorsiunea eroare absolut
d ( x, x ) | x x |
Distorsiunea eroare ptratic
d ( x, x ) ( x x )2
Distorsiunea pentru dou secvente, xn i x n se defineste astfel:
1 n
d ( x n , x n ) d ( xi , xi )
n i 1
adic media aritmetic a distorsiunilor pe fiecare simbol, pe fiecare liter.
Pentru distorsiunea eroare ptratic, de pild,
1 n
1
d ( x n , x n ) ( xi xi ) 2 || xi xi ||2
n i 1
n
Revenim acum la codarea rat-distorsiune.
n figura alturat
Xn
Codor
fn
I {1, 2, , N}
Decodor
gn
X n
Xn = (X1, , Xn) este o secven de n variabile aleatoare i.i.d. (un vector aleator
n-dimensional). Distribuiile Xi ~ p(x) pot fi discrete sau continue.
Pentru simplitate se consider aici variabile aleatoare discrete. Extinderea la
variabile aleatoare continue este practic imediat. Componentele Xi aparin unui
alfabet discret al sursei, X.
Definiie: Un cod rat-distorsiune (N, n) (un cuantizor vectorial) cu rata R =
(log2N)/n const n:
o aplicaie de codare
f n : X n {1, ..., N }
(o aplicatie many-to-one deoarece |Xn| N).
o aplicaie de decodare
g n : {1, ..., N } X n
cu X n { X n (1), ..., X n ( N )} un dicionar al codului (o aplicaie biunivoc).
Not: Pentru n mare, aproximativ 2nH(X) secvene de intrare aplicate pe 2nR
secvene de ieire (R H(X)). f 1(1), , f 1(N) sunt mulimi sau regiuni de
atribuire.
Dac Xi sunt variabile aleatoare discrete, atunci f 1() sunt mulimi de secvene;
dac sunt continue atunci sunt volume n Rn.
94
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
p( x
)d ( x n , g n ( f n ( x n )))
xn
95
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
X ~ p(x)
X | E[d ( X , X )] D
p ( x | x )
1 n
E[d ( X n , X n )] E[d ( X i , X i )]
n i 1
Apoi,
nR I ( X i , X i ) R ( I ) E[d ( X i , X i )]
i
nR nR ( I ) Ed ( X i , X i ) nR ( I ) Ed ( X n , X n ) nR ( I ) ( D )
n i 1
0
D Dmax
Pentru sursa gaussian
D(R) = 22 2R
adic fiecare bit descriptiv suplimentar reduce distorsiunea medie cu un factor
de 4 (6 dB).
Pentru R = 1 (cuantizare pe un bit), D(1) = 0,25 2.
Se consider acum cuantizarea (scalar) unidimensional (n = 1) i se demonstreaz c E[d(X, X )] = 0,3633 2.
96
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n 2 necesare
( n 2 ) 2
( nD ) 2
1
2
R log
2
D
(n contrast cu mpachetarea n sfere pentru codarea n cazul canalului
gaussian).
Descrierea simultan a variabilelor independente gaussiene: Fiind dat o rat a
bitilor total R, cum se pot aloca acesti bii unei multimi de variabile aleatoare
gaussiene X1, , Xm astfel nct MSE (eroarea medie ptratic) total s fie
minimizat?
Se minimizeaz
m
D Di
i 1
supus la restriciile
m
R i Ri 0, i = 1, , m
i 1
97
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n care
1
2
R( Di ) log i
Di
2
Prin codarea independent a fiecrei componente Xi i prin utilizarea unor
valori X i ~ N (0, i2 D ) se pot obtine egalitile n expresia cu inegalitti de
mai sus, adic
R ( m ) ( D) min f ( X m | X m ) I ( X m ; X m ) R( Di )
i
De acum, se cere aflarea unui set de puncte (R(Di), Di), i = 1, , m, astfel nct
iR(Di) = R i suma iDi s fie minim.
De observat c i Ri = R(i2) = 0 poate fi o soluie.
Se presupune c toi Xi au Di < i2, adic Di i2e 2 Ri i Ri > 0.
Atunci se urmrete stabilirea unor (R1, ..., Rm) astfel nct s aib loc
min R1 , ..., Rm i2e 2 Ri
i
J ( R1 , ..., Rm ) i2 e 2 Ri Ri R
i
i
Apoi,
J
0 , i = 1, , m
Ri
dau
i2e 2 Ri
2
pentru orice indice i.
Rezult regula alocrii bitilor astfel nct toate variabilele s aib distorsiunea
egal.
Dar trebuie s satisfac relatia
1
i2
i 2 log R
de unde
2e 2 R
n care 2 este media geometric a dispersiilor 12, , m2 i R R / m este
rata medie pe variabil.
98
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Acum, dac > i2 pentru vreun indice i, atunci solutia nu este valid. Se
ignor Xi (se pune Ri = 0) i se repet procedura de mai sus pn cnd rmne o
mulime de variabile pentru care < i2.
Aceasta este problema umplerii-cu-ap cu rsturnare.
i2
42
12
D1
D2
X1
X2
D4
D5
X4
X5
D3
X3
Se aloc bii numai acelor variabile care nu sunt sub nivelul apei .
Teorema separrii surs-canal: Secventa Vn de variabile i.i.d. poate fi
transmis cu distorsiunea medie D printr-un canal fr memorie cu capacitatea
C dac i numai dac C > R(D).
Vn
Xn(Vn)
Canal de
capacitate C
Yn
V n
99
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
CRIPTAREA
Primalitatea numerelor ntregi
n teoria numerelor se recunoate unanim complexitatea a dou probleme de
calcul foarte importante i foarte legate una de alta:
Primalitatea: Fiind dat un ntreg, este el prim?
Factorizarea: Fiind dat un ntreg, care sunt factorii primi ai acestuia?
Evident, calitatea de a fi prim a unui numr ntreg (primalitatea) nu poate fi mai
dificil de stabilit dect factorii lui, deoarece dac se cunoate cum se stabilete
un factor, ar trebui s se cunoasc i cum se face testarea primalittii. Ceea ce
este surprinztor dar fundamental i baza criptografiei moderne este c
problema primalitii este uoar n timp ce factorizarea este dificil!
Cum se tie, primalitatea poate fi rezolvat trivial ntr-un timp O(x) de fapt
sunt de testat numai factorii eventuali care sunt ca valoare sub rdcina ptrat
a lui x. Dar, e limpede, algoritmii acetia sunt exponeniali exponeniali n
numrul n de bii ai lui x, o msur mai precis i mai plin de sens a
dimensiunii problemei (vzut astfel, timpul de rulare a algoritmului devine
respectiv O(2n), O(2n/2)). n fapt, urmarea acestei linii (de testare a din ce n ce
mai puini factori) nu duce nicieri: deoarece factorizarea este dificil, singura
speran de a gsi un algoritm rapid pentru primalitate este de a cuta unul care
s decid dac un numr n este sau nu prim fr a evidenia neaprat un factor
al lui n, n cazul n care rspunsul este negativ.
Imediat, este descris un astfel de algoritm. Acest algoritm se bazeaz pe faptul
urmtor relativ la exponenierea modulo un-numr-prim.
Teorema 1 (Mica teorem a lui Fermat): Dac p este numr prim, atunci
pentru orice a 0 mod p are loc a p 1 = 1 mod p.
Demonstraie: Se consider toate numerele nenule modulo p, = {1, 2, , p
1}. Acum, dac se ia un numr a din aceast mulime i dac se multiplic toate
numerele din cu a modulo p, se obine o alt multime a = {a1, a2, , a(p
1)}, toate modulo p. Se poate afirma c toate cele p 1 numere din a sunt
distincte i n consecint a = . Ca demonstraie, dac ai = aj mod p, atunci,
prin multiplicarea ambilor membri cu a 1 mod p (deoarece p este prim i a 0
mod p se stie c a are un invers) se obtine i = j. Prin urmare, produsele x x
i
x a
100
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Un numr c este un numr Carmichael dac nu este prim i nc pentru toti divizorii primi ai
lui c cu d > 1 se ntmpl astfel c d 1 s divid pe c 1. Cel mai mic numr Carmichael este
561 = 3.11.17 (se observ, desigur, c 3 1, 11 1 i 17 1 divid fiecare pe 561 1). Dac c
este un numr Carmichael i a este relativ prim cu c, atunci ac 1 = 1 mod c. Puteti demonstra
asta?
101
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
zecimali, ansa ca acel numr s fie prim este putin mai mic de 1 la 2D (una
din circa 26 de persoane are codul numeric personal numr prim).
Teorema numerelor prime este un fapt dintre cele fundamentale n matematici
i este foarte greu de demonstrat. Dar mpreun cu algoritmul de mai devreme,
ea ne abiliteaz s gsim uor numere prime mari (ncercai cteva i retinei
unul care verific conditia de primalitate) i acesta este ingredientul cheie al
algoritmului RSA. Un alt ingredient este varianta urmtoare a teoremei 1:
Teorema 4: Dac p i q sunt prime, atunci pentru orice a 0 modulo pq avem
a(p 1)(q 1) = 1 modulo pq.
Demonstratia teoremei 4 este aceeai cu aceea a teoremei 1 cu excepia faptului
c se consider multimea tuturor numerelor 1, 2, , pq 1 care sunt relativ
prime cu pq. Se observ c exist (p 1)(q 1) astfel de numere ca
verificare, unul din fiecare p numere ntre 0 i pq este divizibil cu p i unul din
fiecare q numere este divizibil prin q i pq(1 1/p)(1 1/q) = (p 1)(q 1).
Exemplu: Fie p = 3 i q = 5. Dintre toate numerele modulo pq = 15, i anume
{0, 1, 2, , 14}, o treime sunt divizibile cu 3 ({0, 3, 6, 9, 15}) i din cele 10
rmase o cincime sunt divizibile cu 5 ({5, 10}). Toate numerele rmase, n
numr de (p 1)(q 1) = 8 ( = {1, 2, 4, 7, 8, 11, 13, 14}) sunt prime cu 15 i
prin urmare ele au toate un invers modulo 15. Aceasta face posibil
demonstratia teoremei 1 prin luarea lui a oricare dintre aceste 8 numere.
Criptografia i algoritmul RSA (Rivest, Shamir, Adleman)
Criptografia se ocup de scenarii de genul urmtor: dou persoane A i B
doresc s comunice n prezena unei alte persoane deosebit de curioase E. Se
presupune c A vrea s trimit lui B mesajul x. Criptografia ofer soluii n
forma urmtoare: A calculeaz o funcie de x, e(x), utiliznd o cheie secret i
trimite e(x) pe canalul ascultat (i) de E. B primete e(x) i prin utilizarea cheii
sale (care n criptografia tradiional este aceeai cu cheia deinut de A, dar n
criptografia modern este diferit) calculeaz o funcie d(e(x)) = x, recupernd
astfel mesajul. Se prezum c E este incapabil s recupereze x din e(x) deoarece
nu are cheia.
O metod criptografic clasic const n substituirea de litere. A i B au czut
de acord asupra unei permutri de litere A, , Z i un mesaj m = a1a2an
alctuit din n litere devine e(m) = (a1)(a2)(an). n pofida faptului c exist
26! chei posibile, acesta este un sistem de criptare foarte slab, expus la atacul
evident prin frecvena literelor.
Cu concursul calculatoarelor, criptografii pot crea sisteme de criptare n care
sunt substituite blocuri ntregi de litere (sau bii), rezistente astfel la atacul prin
frecvene. Cel mai de succes dintre ele este Data Encryption Standard (DES), o
metod de criptare sponsorizat de guvernul american, propus n 1976. DES
utilizeaz o cheie pe 64 de biti (pentru codarea fiierelor mai mari, acestea se
sparg n blocuri de 8 biti). Cei care au propus DES pretind c este sigur. Sunt i
detractori care-l suspecteaz c la modul subtil nu este att de sigur.
102
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
103
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
104
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Notatia gcd este prescurtarea de la greatest common divisor cel mei mare divizor comun.
105
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Teorema 6: Fie p, q dou numere prime distincte. Fie n = pq. Atunci numrul
x(p 1)(q 1) 1 (mod n) pentru orice x care satisface conditia gcd(x, n) = 1.
Demonstratie: Mai nti s reducem modulo p ambele prti ale congruenei din
enun (este permis deoarece p divide pe n). Gsim c
x(p 1)(q 1) (x(p 1))(q 1) (1)(q 1) 1 (mod p)
unde s-a folosit mica teorem a lui Fermat pentru a conchide c xp 1 1 (mod
p). Similar avem x(p 1)(q 1) 1 (mod q). Se obtine un sistem de dou ecuatii
x(p 1)(q 1) 1 (mod p)
x(p 1)(q 1) 1 (mod q)
De reinut c gcd(p, q) = 1. Aadar, dup teorema restului chinezesc, trebuie s
existe o solutie unic pentru x(p 1)(q 1) mod pq. Se poate vedea c x(p 1)(q 1)
1 (mod pq) este una din solutiile posibile i n virtutea unicitii, aceasta trebuie
s fie singura posibilitate. Adevrul teoremei decurge de aici.
S recapitulm. Mica teorem a lui Fermat spune c xp 1 1 (mod p) i tocmai
am vzut c x(p 1)(q 1) 1 (mod pq). Care este aici pattern-ul general? De unde
vin aceti exponenti magici? Exist vreo relatie generalizabil ntre p 1 i p i
(p 1)(q 1) i pq? Da, exist.
Conceptul de care avem nevoie este acela de functie totient a lui Euler, (n).
Numrul (n) este definit ca numrul de ntregi pozitivi mai mici ca n i mutual
primi cu n. Se poate vedea c (p) = p 1 cnd p este prim, deoarece ntregii 1,
2, , p 1 sunt toti mai mici dect p i relativ primi cu p. Cu putin efort de
numrare se poate determina i (n) cnd n = pq, un produs de dou numere
prime. Se obtine rezultatul urmtor:
Lema 1: Fie p, q dou numere prime distincte i n = pq. Atunci (n) = (p
1)(q 1).
Demonstratie: Cti ntregi sunt mai mici dect n i sunt relativ primi cu n?
ntregii p, 2p, 3p, , (q 1)p nu se pun: ei au un factor comun cu n. Dintr-un
motiv similar nu se numr nici q, 2q, 3q, , (p 1)q. Acestea sunt toate
excepiile i cele dou liste de numere sunt disjuncte. Dac din cele n 1
numere mai mici ca n le eliminm pe acestea, se obtine cea ce urmrim. n
final, prima list contine q 1 exceptii, a doua, p 1 exceptii. Aadar, sunt n
1 (p 1) (q 1) = pq p q 1 = (p 1)(q 1) ntregi pozitivi mai mici
dect n i relativ primi cu n.
La acest moment este natural a formula conjectura conform creia funcia
totient a lui Euler croiete crarea ctre o generalizare a micii teoreme a lui
Fermat. i, desigur, se poate demonstra urmtorul rezultat:
Teorema 7 (Teorema lui Euler): x(n) 1 (mod n) pentru orice x care satisface
conditia gcd(x, n) = 1.
Demonstratie: Demonstratia este exact ca aceea pentru mica teorem a lui
Fermat. Se consider o multime de ntregi pozitivi mai mici dect n i relativ
primi cu n. Dac alegem oricare element x din obtinem o alt multime x =
{ix mod n: i }. De notat c toate elementele din x sunt distincte (deoarece x
este inversabil) i relativ prime cu n, asadar = x. n consecint, produsele
106
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
i
i
i
i
i x
i x
O functie hash este o amprent numeric redus produs/rezultat din orice gen de date.
Functii hash sunt utilizate i n criptografie.
107
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
orice mesaj care se rezum prin hash la acelai digest; acest lucru reprezint un
risc de securitate.
Recent, SHA-1 (Secure Hash Algorithm 1, unul dintr-o serie de algoritmi
siguri de obtinere de versiuni hash, SHA-1, SHA-224, SHA-256, SHA-384 i
SHA-512), o functie hash pentru acest scop, a fost compromis; s-a gsit o
functie mai simpl care produce aceleai valori ca i SHA-1.
Un certificat d asigurarea c cheia public a lui A este corect. Certificatul
adaug o semntur (de genul Verisign) la cheia public care verific
autenticitatea. Exist de asemenea autoriti time-stamp pentru verificarea
timpului la care mesajul a fost compus i/sau trimis.
Utilizarea practic a criptrii RSA
Algoritmii cu cheie privat sunt mult mai rapizi (de cca. 1000 de ori). n
general, exponentul public este de obicei mult mai mic dect exponentul privat,
ceea ce nseamn c decriptarea unui mesaj este mai rapid dect criptarea i
verificarea unei semnturi este mai rapid dect semnarea; aceasta-i foarte bine
deoarece semnarea i criptarea sunt fcute numai o dat, n timp ce verificarea
unei semnturi date se poate repeta de mai multe ori. RSA este utilizat
deobicei pentru a coda o cheie care poate fi apoi utilizat cu un sistem de cheie
privat.
SSH (Secure Shell). Programul ssh-keygen genereaz o pereche de chei
public-privat prin alegerea aleatoare de numere prime mari; aceast operaie
consum cteva minute pe un minicomputer Nova.
n particular, cheia privat este depus n .ssh2/id_dsa_2048_a; cheia public
este depus n .ssh2/id_dsa_2048_a.pub. Procedura de logare din contul A la
contul B: SSH de pe A trimite un identificator de sesiune semnat (cunoscut
numai clientului i serverului, criptat cu cheia privat a lui A) serverului SSH al
lui B. B se asigur c cheia public a lui A se afl ntr-un fiier denumit
authorized_keys i este corect. Dac aa este, serverul SSH al lui B permite
logarea la B.
SSH menine i verific totodat o baz de date care contine informatii de
identificare pentru fiecare host cu care a lucrat vreodat; dac un host se
schimb, utilizatorul este avertizat. Toate comunicatiile n orice directie sunt
criptate cu o metod de cheie privat.
108
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Codor
mesaj
codat
Canal
mesaj
codat,
fr
erori
Decodor
mesaj
Prezena perturbatiilor conduce mai mult sau mai putin accidental la alterarea
informatiei. Fenomenul se combate prin introducerea unei codri i a unei
decodri suplimentare care s protejeze informatia n faa posibilelor deteriorri
datorate perturbatiilor. Pentru aceasta, schema de transmitere de mai sus se
completeaz astfel:
Perturbatii
Codor
surs
Codor
canal
Canal
Decodor
canal
Decodor
surs
Conexiune invers
109
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n
NL s L c
c
ns
Dac se ntmpl ca relaia de mai sus s nu produc un numr N ntreg atunci
este necesar ca din timp n timp s se transmit cte un bit fr semnificaie
(dummy).
Se folosesc uneori urmtoarele caracterisitici ale codurilor de canal:
a) Debitul relativ al codului
L c ns
R
N s nc
b) Redundana codului
1 N
C red
R L
c) Excesul de redundan
1
NL
E red 1
R
L
Dou exemple:
1. Codorul sursei are debitul 2 bps, codorul de canal are debitul 4 bps. Dac L
= 3 atunci N = 6 i la fiecare cuvnt trei biti sunt disponibili pentru controlul
fluxului de informatie.
2. Codorul de surs are debitul 3 bps, codorul canalului are debitul 4 bps.
Acum N = (4/3)L. Dac L = 3, atunci N = 4 i un bit din fiecare cuvnt poate
110
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
P(b j )
P (b j )
si apoi
P(bj/a*)P(a*) P(bj/ai)P(ai)
relatie care implic nu numai probabilittile din matricea care descrie canalul ci
i probabilittile a priori ale simbolurilor de intrare, probabilitti care nu sunt
dect rareori cunoscute.
Decodarea care asigur verosimilitatea maxim foloseste exclusiv relatiile d(bj)
= a*, cu a* acel simbol de la intrare pentru care
P(a*/bj) P(ai/bj)
111
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
pentru orice i.
Aceast metod are avantajul c nu necesit probabilitile a priori, cele de la
intrarea canalului. Cu toate c n general nu asigur riscul minim de eroare,
metoda verosimilittii maxime este cu eroare minim dac simbolurile la
intrarea canalului sunt echiprobabile, ceea ce ndeobte se urmrete.
Probabilitatea deciziilor eronate se calculeaz avnd n vedere c dac P[a* =
d(bj)/bj] este asociat deciziei corecte atunci probabilitatea erorii n aceleai
conditii de receptie a simbolului bj este
P(E/bj) = 1 P[a* = d(bj)/bj]
Evident, o probabilitate maxim a deciziei corecte se obtine concomitent cu o
probabilitate minim de eroare, de unde i denumirea uneia dintre metodele de
detectie enunat mai devreme.
Riscul general de a comite erori de decizie este dat de media
PE P( E / b j ) P(b j )
B
i, echivalent, de
PE P( E / ai ) P(a i )
A
P ( E / ai )
P (b / a )
i
bB
bB
P(b / a ) ,
i
se fac
bB
0,3
112
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
113
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
00
000
01
001
10
011
11
111
Sunt, dup cum se observ, 4 cuvinte de cod necesare pentru codarea celor 4
mesaje. Cu 3 biti se pot alctui 8 cuvinte distincte: 4 din ele vor fi cuvinte de
cod, 4 din ele nu vor fi cuvinte ale codului.
Cu regula de decizie prin distante Hamming, la receptionarea cuvintelor 010,
100, de pild, se procedeaz ca n tabelul alturat.
114
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
b = b1b2b3
010
100
Decizie/Aciune
Eroare detectat
Eroare corectat
115
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
00
000
01
011
10
101
11
110
Bitul suplimentar este alturat bitilor mesajului (scris diferit n tabel) i valoarea
lui este aleas astfel ca suma bitilor din cuvintele de cod s fie par. Se verific
uor c distanta minim a codului este d(K) = 2. Conform asteptrii, acest cod
poate detecta cuvintele cu un bit eronat deoarece d(K) = 2 > t = 1.
Coduri cu repetiie
Codurile cu repetiie, ca acela din tabelul urmtor se definesc i se utilizeaz
numai pentru L = 1 i N impar.
Mesaje
Coduri
0
000
1
111
116
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
00
000
01
001
10
011
11
111
Un astfel de cod nu poate detecta erori i, cu att mai mult, nu poate nici s le
corecteze. Dac se trimite cuvntul de cod 000 i se receptioneaz cuvntul 001
eroarea nu poate fi detectat i rmne ca o eroare deoarece cuvntul (eronat)
receptionat apartine codului.
Codul care urmeaz, notat cu K6 este definit astfel:
Mesaje
Coduri
Mesaje
Coduri
000
000000
100
100011
001
001110
101
101101
010
010101
110
110110
011
011011
111
111000
Se poate constata c distanta minim este d(K) = 3. Aadar codul poate corecta
un bit eronat. De pild, dac se transmite a = 010101 i se receptioneaz b =
010111, cuvntul de cod cel mai apropiat de b este a = 010101 i eroarea este
localizat i corectat cu uurint. Proprietatea se extinde la orice cuvnt
transmis i la orice bit alterat. Cu 6 cifre binare se pot forma 64 de cuvinte, dar
din acestea numai M = 2L = 8 sunt utilizate n operatia de codare.
Limita superioar B[N, d(K)] a numrului de cuvinte de cod. Distana minim
d(K) a unui cod bloc K determin capacitatea acelui cod de a detecta (sau de a
corecta) erori. Dac se cere proiectarea unui cod de lungime N cu distanta
minim d(K), care este limita B[N, d(K)] asupra lui M i, implicit, asupra lui L
pentru o pereche [N, d(K)] dat? Aceasta este denumit uneori problema
central a teoriei codrii. Cteva rezultate:
B(N, 1) = 2N
B(N, 2) = 2N 1
B(N, 3) = 2N/(N + 1)
B(N, 4) = 2N 1/N
n general
B(N, 2t + 1) = B(N +1, 2t +2)
pentru t = 0, 1, 2, ..., astfel nct dac se cunoate limita pentru distanta minim
d(K) par, se poate calcula limita pentru distanta minim d(K) impar. Pentru
distanta d(K) par exist o limit dat relatia lui Plotkin
B[N, d(K)] = 2d(K)/[2d(K) N]
n conditiile d(K) N < 2d(K).
Pentru cazul L = 2 (M = 4) de pild, care este lungimea minim a cuvintelor de
cod pentru detectarea unei erori i apoi pentru corectarea unei erori?
117
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Pentru detectarea unui bit eronat distana minim trebuie s fie mai mare dect
1, deci d(K) = 2. Din M = 4 B(N, 2) = 2N 1 rezult N = 3 (cel mai mic N).
Codul cu L = 2, N = 3 este un cod cu paritate constant, ca acela discutat puin
mai devreme.
Pentru corectarea unui bit eronat distana minim trebuie s fie mai mare dect
2, deci d(K) = 3. Din M = 4 B(N, 3) = 2N/(N + 1) rezult N = 5 (cel mai mic
N). Codul cu L = 2, N = 5 poate fi, de pild, urmtorul
Mesaje (L = 2)
Coduri (N = 5)
00
00000
01
01011
10
10111
11
11100
118
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
este suma acestora dou: q3 + 3q2p 310 6, mult mai mic dect probabilitatea
erorii per bit q = 0,001. Dar cu ce cost: R(K3) = 1/3.
Codul repetitiv L = 1, N = 5, n aceleasi conditii de eroare per bit, Peb(K5) = q =
0,001, are probabilitatea de bloc/cuvnt eronat dat de relatia Pe(K5) = q5 + 5q4p
+ 10q3p2 10 8, care cumuleaz probabilittile ca 5, 4 sau 3 biti din cei N = 5
s fie eronati. Situatia este mai bun dar debitul relativ scade la R(K5) = 1/5.
Lucrurile stau nc mai ru sub aspectul vitezelor relative la codurile repetitive
cu N mai mare.
Exist o soluie pentru acest inconvenient? Rspunsul este afirmativ. Pentru
ilustrare se consider din nou un canal binar simetric cu eroarea de bit probabil
n proportia Peb(Kn) = q = 0,001. Se proiecteaz un cod cu cuvinte de N = 4 biti
i unul cu cuvinte de N = 6 biti, notate cu K4, respectiv K6, ntr-o tentativ de a
cobor probabilitatea Pe(Kn) i de a mentine R(Kn) = 1/2.
Codul K4 (N = 4, L = 2)
Mesaje
Coduri
00
0000
01
0111
10
1000
11
1111
transmite o dat bitul prim i de trei ori bitul al doilea. Se efectueaz o corectie
conditionat: se admite c primul bit este corect, b1 = a1 i apoi bitul al doilea
este stabilit prin procedeul majoritar aplicat pe sirul de biti b2b3b4. Decodarea
este corect dac a) cuvntul receptionat are toti bitii corecti sau dac b)
cuvntul receptionat are bitul prim corect i ntre bitii ceilalti unul i numai unul
este alterat. Probabilittile asociate celor dou situatii sunt p4, respectiv C31qp3
= 3qp3. Prin urmare, 1 Pe(K4) = p4 + 3qp3 i Pe(K4) = 1 (p4 + 3qp3) 0,001.
Codul K6 dintr-un exemplu schitat mai devreme, cu N = 6, L = 3 poate corecta
eroarea de un bit per cuvnt, dar va produce cuvinte eronate ori de cte ori
numrul de biti eronati din cuvnt este t > 1.
Decodarea este corect cnd toti bitii sunt corecti (probabilitate p6) sau unul din
biti este eronat (probabilitate 6qp5). Prin urmare probabilitatea unei erori de
cuvnt este Pe(K6) = 1 (p6 + 6qp5) 0,000015, ceea ce este mult mai putin
dect 0,001.
Solutia a doua, K6 d o reducere a probabilittii erorilor n cuvnt cu dou
ordine de marime fr a reduce debitul relativ de informatie.
Exemplele tratate i comparate ndeamn la cteva ntrebri:
a) Se poate gsi un cod (cu N chiar mai mare) care s fac Pe(Kn) orict de mic
cu R(Kn) = 1/2, constant?
b) Poate fi un cod orict de fiabil dorim la R(Kn) = 0,9?
c) Poate fi un cod orict de fiabil dorim la R(Kn) = 0,99?
Teorema fundamental a lui Shannon d unele rspunsuri la ntrebri de genul
celor formulate mai sus.
Pentru un canal binar simetric fr perturbatii capacitatea este C = log 2 = 1 bit,
ceea ce nseamn c dac se transmite prin canal 1 bit de informatie se
receptioneaz acel 1 bit de informatie.
119
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
120
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
0
0
1
1
1
0
0
0
0
1
0
1
121
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
x1
x
2
H 0 sau Hx 0
...
xn
(n scriere martricial) i H are n k linii i n coloane.
Matricile de verificare pentru codurile cu repetitie i codurile cu paritate
constant par se pot scrie imediat (exercitiu).
Dac x este cuvnt de cod atunci Hx = 0. Dac y este cuvnt de cod atunci Hy =
0. Rezult imediat c z = x + y este tot un cuvnt de cod. ntr-adevr, Hz = H(x
+ y) = Hx + Hy = 0 + 0 = 0. De unde o alt definitie pentru codurile linare:
coduri pentru care suma a dou cuvinte de cod este tot un cuvnt de cod.
Proprietatea se verific usor pentru codurile repetitive i pentru codurile de
paritate constant par.
Se propune ca exercitiu verificarea liniarittii codului K4 discutat mai devreme.
Tot ca exercitiu se propune a se verifica dac codul K6 descris mai devreme este
un cod liniar.
Codul
Mesaje
Coduri
00
000
01
001
10
011
11
111
discutat putin mai sus nu este liniar deoarece, de pild, 001 + 011 = 010.
Rezultatul nsumrii celor dou cuvinte de cod nu este un cuvnt de cod.
Coduri rectangulare (produs). ntre codurile construite n mod intuitiv se afl i
codurile matriciale rs utilizate pentru transmiterea informatiei n forma unor
matrici bidimensionale, matrici cu r 1 linii i s 1 coloane, completate cu
nc o linie i nc o coloan alctuite din biti de control/verificare a parittii.
De pild codul rectangular 34
x1 x 2 x3 x 4
x
5 x 6 x 7 x8
x9 x10 x11 x12
cu x1 , x 2 , x3 , x5 , x6 , x 7 biti informationali i restul biti de control. Fiecare bit de
control/verificare este ales pentru a satisface regula parittii pe orizontal i pe
vertical, pe linii i pe coloane, adic:
x1 x 2 x3 x 4 0
x5 x 6 x7 x8 0
x9 x10 x11 x12 0
pentru paritatea pe linii i
x1 x5 x9 0
x 2 x6 x10 0
122
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
x3 x7 x11 0
x 4 x8 x12 0
pentru paritatea pe coloane. Ecuatiile sunt mai multe cu una fa de necesar.
Sistemul de relatii este redundant dar el se scrie i se utilizeaz ca atare.
Matricea de verificare pentru codul rectangular 34 exemplificat apare n
expresia
1 1 1 1 0 0 0 0 0 0 0 0 x1
0 0 0 0 1 1 1 1 0 0 0 0 x
2
0 0 0 0 0 0 0 0 1 1 1 1 ...
Hx
0
1 0 0 0 1 0 0 0 1 0 0 0 x 6
0 1 0 0 0 1 0 0 0 1 0 0 ...
0 0 1 0 0 0 1 0 0 0 1 0 x12
Coduri liniare sistematice sunt codurile liniare n care partea informational
nemodificat este separat de cea de control i de aceea este imediat vizibil i
recuperabil. n cuvntul de cod se disting primii k biti i urmtorii n k biti
x T m T | b T m1 m2 ... mk b1 b2 ... bn k
Aadar, cuvntul de cod se stabilete prin adugarea la cuvntul-mesaj care
trebuie codat a n k biti de control/verificare. n literatur, indexarea se face
uneori ncepnd cu zero, adic
x T m T | b T m0 m1 ... mk 1 b0 b1 ... bn k 1
ceea ce nu schimb problema n esena ei.
De aici nainte se va discuta aproape exclusiv despre codurile sistematice. Din
codurile exemplificate pn acum, codurile cu repetiie sunt sistematice. La fel
codurile cu paritate constant (par) sunt sistematice. Se poate observa/dovedi
(exercitiu) c i codurile K4 i K6 aduse deja de cteva ori n discutie sunt
sistematice.
Dac biii mesajului, m1 , m 2 ,..., mk sunt considerati independeni i biii de
verificare, de control b1 , b2 ,..., bn k se fac dependeni de acestia, atunci biii de
verificare pot fi exprimati prin functii explicite de cei dinti.
Rezultatul interesant sub aspect practic este c biii de control se ataeaz biilor
informationali la codare, iar la decodare, dup corectarea eventualelor erori i
recuperarea cuvntului de cod corect, bitii de control se omit pur i simplu.
Forma sistematic a matricei H. Cu notaiile
b pentru vectorul cu n k componente al biilor de control;
m pentru vectorul cu k componente al biilor de informatie;
c pentru vectorul cu n componente al biilor care alctuiesc cuvntul de cod
c = [mT | bT]T x;
P pentru o matrice (n k)k a coeficienilor (din corpul cu dou elemente 0
i 1, adugat cu operaiile de adunare, sau-exclusiv i de multiplicare,
i;
123
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
124
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
125
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
00
00000
01
01101
10
10110
11
11011
b Pm 1 0
b2 m1
x 4 x1
m2
0 1
b3 m2
x5 x 2
ceea conduce la o regsire a tabelului cu cuvintele de cod dat mai sus.
Decodarea prin sindrom
Pentru a decoda un cuvnt receptionat r se procedeaz astfel:
1. Se calculeaz sindromul s = Hr
2. Pentru detectarea erorilor:
a. s 0 arat prezenta erorilor i se cere (eventual) retransmiterea
b. s = 0 confirm transmiterea fr eroare
3. Pentru corectarea erorii:
a. cu sindromul s evaluat se stabileste liderul (unic al) codomeniului ec i
se calculeaz c = r + ec
b. dac sunt mai multi vectori lider n codomeniu, corectarea nu-i posibil,
cuvntul recepionat este detectat ca eronat i se cere retransmiterea lui
4. Se extrage mesajul m prin renunarea la biii de control atasati lui m, care
completeaz cuvntul de cod c.
Rmne de discutat cum se stabilete liderul (vectorii lider ai) unui codomeniu.
Dou ci sunt sugerate de discutia de pn la acest stadiu.
126
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
127
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H 1 1 0 1 0 x 4 x1 x 2
0 1 0 0 1
x5 x 2
Deoarece n matricea H nu sunt coloane nule i coloanele sunt dou cte dou
distincte rezult ponderea w(K) = 3 i corectarea unei erori este totdeauna
posibil. Codul este dat n tabelul urmtor
Mesaje
Coduri
00
00000
01
01011
10
10110
11
11101
128
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1 1 0 0 1 0 0 0
x5 x1 x 2
H
x6 x 2
0 1 0 0 0 1 0 0
1 0 0 0 0 0 1 0
x 7 x1
x8 x1
1 0 0 0 0 0 0 1
care corespunde codului
Mesaje
Coduri
00
01
10
11
00000000 01111100 10101011 11010111
129
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
2 n k C ni
i0
2 n k C ni 1 n n 2 m 1
i 0
130
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Propunem ca exemplu cazul codului Hamming (7, 4). Matricea lui de control
are m = (n k) = 3 linii i n = 7 coloane, izomorfe cu cele 23 1 numere binare
nenule exprimate pe trei cifre. Cuvintele care trebuie codate au k = 4 biti. n
varianta nesistematic, matricea H are nfiarea
0 0 0 1 1 1 1
H 0 1 1 0 0 1 1
1 0 1 0 1 0 1
Dup sistematizare ea devine
x5 x 2 x3 x 4
0 1 1 1 1 0 0
Hsist = 1 0 1 1 0 1 0 x 6 x1 x3 x 4
1 1 0 1 0 0 1
x 7 x1 x 2 x 4
cu relaiile de calcul al biilor de control alturi. Tabelul complet al codului este
dat n tabelul care urmeaz.
Mesaje
Coduri
Mesaje
Coduri
Mesaje
Coduri
Mesaje
Coduri
0000
0000000
0100
0100101
1000
1000011
1100
1100110
0001
0001111
0101
0101010
1001
1001100
1101
1101001
0010
0010110
0110
0110011
1010
1010101
1110
1110000
0011
0011001
0111
0111100
1011
1011010
1111
1111111
n
7
15
31
m
3
4
5
R
4/7
11/15
26/31
131
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
i
n
2k
i 0
1
1
1
1
1
3
4
1
3
6
10
15
4
10
20
etc.
1
5
20
15
C90i 212 i
i 0
i
23
211
i 0
n cazul n = 90 Golay a artat c nu exist nici un cod perfect (90, 78) corector
a dou erori. Pentru n = 23 Golay a gsit un cod (23, 12) corector de 3 erori i a
i dat o matrice pentru el
1 0 0 1 1 1 0 0 0 1 1 1
1 0 1 0 1 1 0 1 1 0 0 1
1 0 1 1 0 1 1 0 1 0 1 0
1 0 1 1 1 0 1 1 0 1 0 0
1 1 0 0 1 1 1 0 1 1 0 0
P 1 1 0 1 0 1 1 1 0 0 0 1
1 1 0 1 1 0 0 1 1 0 1 0
1 1 1 0 0 1 0 1 0 1 1 0
1 1 1 0 1 0 1 0 0 0 1 1
1 1 1 1 0 0 0 0 1 1 0 1
0 1 1 1 1 1 1 1 1 1 1 1
132
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
bi aij m j 0 mod 2 , i = 1, 2, , 11
j 1
bi aij m j mod 2 , i = 1, 2, , 11
j 1
133
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Pned(K) =
Aq p
ni
i 1
Pned(K) =
Aq p
ni
i d (K )
134
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
ntreg m este numit banda de gard a erorii incidentale. Ultimul simbol dintr-o
secven incidental eronat este separat de primul simbol dintr-o secvent
urmtoare incidental eronat de m sau mai multi biti corecti. Parametrul m
trebuie specificat atunci cnd este descris o eroare incidental. Lungimea unei
erori incidentale este definit ca numrul de biti de la primul simbol eronat la
ultimul afectat de eroare, inclusiv.
Cele mai multe coduri sunt gndite spre a detecta i/sau a corectar erori
independente, ntmpltoare. Este, de pild, cazul codurilor Hamming. Exist
ns metode speciale pentru corectarea erorilor incidentale pe secvene de l biti,
de genul celor semnalate mai devreme.
Intercalarea biilor este una din aceste metode. Intercalarea se face ntr-o
manier bine precizat, iar la recepie se face de-intercalarea dup aceeai
regul, dar inversat. Prin procedeul intercalrii se realizeaz o randomizare (de
la englezescul random aleator) a plasrii erorilor. Erorile din sistematice
devin (fals) aleatoare. Schema transmisiei este urmtoarea:
Codare
Canal cu erori
(fals) aleatoare
Intercalare
Canal cu
erori
incidentale
Deintercalare
Decodare
b1
b6
b11
b2
b7
b12
Intrare
b3
b4
b8
b9
b13 b14
135
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
b5
b10
b15
b1
b11
b6
b7
b11
b3
b1
y1
b2
-
b3
y3
b1
-
b6
z6
b11
-
y1
z6
y3
b2
b5
b10 b15
b14
b13
b9
b2
b5
1
2
3
4
5
00011 00101 01001 10001 00110
6
7
8
9
10
01010 10010 01100 10100 11000
136
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
acelasi cuvnt transmis este alterat tot pe primii trei bii, mesajul recepionat
este 11110, cuvnt 4 din 5 care din nou pune n eviden o eroare de tipul
unidirecional, incidental.
Codurile sum de control (Check Sum) sunt dedicate aceluiasi tip de erori, erori
unidirecionale. Aceste coduri sunt generate prin adugarea unui cuvnt de
control prin sum, de lungime n, la fiecare bloc de s cuvinte informaionale de
lungime n. Cuvntul de control se obtine prin nsumarea modulo 2n a celor s
cuvinte purttoare de informatie. Aadar, codarea se face ntr-un sumator de s
cuvinte de lungime n cu omiterea transferului dincolo de puterea maxim 2n.
Sumatorul genereaz cuvntul de control prin sum. Decodarea se realizeaz
ntr-un sumator identic care nsumeaz s cuvinte receptionate, rezultatul este
pus ntr-un circuit SAU EXCLUSIV cu cuvntul de control. Dac rezultatul
este nul transmisia este considerat bun. n caz contrar, n transmitere au
aprut erori. Propriettile unui cod cu sum de control sunt:
Simplu i ieftin, deci larg utilizat
Detecteaz cel putin o eroare
Detectia erorilor multiple depinde de numrul s i de pozitia bitilor n
cuvinte; acoperirea erorilor este foarte bun pentru biii de ordin redus
Acoperirea erorilor poate fi controlat prin ponderarea diferit a bitilor
i/sau prin sume de control reprezentate pe mai mult de n biti
Latena erorilor este ndelungat, adic trebuie s se termine transmiterea
blocului de s cuvinte pentru a face posibil verificarea corectitudinii
Diagnoza are o rezolutie redus, eroarea poate fi n diferite locuri din blocul
de s cuvinte.
Utilizri ale codrii cu sum de control: dipozitive de memorare secveniale,
periferice cu transfer n blocuri, memorii read-only, dispozitive numrtoare
seriale etc.
Un exemplu cu n = 8, s = 8 cu o sum de control Ck modulo 28 tot de 8 biti dup
fiecare secvent de 8 cuvinte (octei, bytes, fiecare n lungime de 8 bii). Dac
se transmit urmtorii octei (exprimai n hexadecimal): 32, 62, 01, FA, 22, 02,
E3, A1, octetul de control este Ck = 337 mod 100 = 37 (i acesta tot n
hexadecimal).
Acoperirea erorilor multiple poate fi nc sporit prin utilizarea unei sume de
control cu reprezentare extins la m bii pentru date transmise exprimate pe n
biti, m > n i a sumei de control modulo 2m. De pild, n = 8 i m = 16 produce
un cuvnt-sum de control de 2 octei pentru o secvent de s octeti transmii.
Din lumea editorilor de carte este cunoscut codul ISBN-ul (International
Standard Book Number). Acesta are o parte care reprezint o sum de
verificare. De pild secventa ISBN de 10 simboluri 0-13-283796-X (care cu
exceptia cratimelor identific ara, editorul, cartea) conine un ultim simbol
reprezentat de o cifr zecimal 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 sau de X n loc de 10.
Acest ultim simbol este adugat pentru verificarea unei sume de control mai
complicate, n care cifrele din codul ISBN intr ponderate cu ordinul lor
137
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
10
C k ia11i
i 1
Suma aceasta trebuie s fie divizibil cu 11 dac ISBN-ul este corect, dac este
valid.
Inconvenientul principal al codurilor cu sum de control este acela c rezultatul
obtinut prin nsumarea de cuvinte nu este suficient de complex, suma cuvintelor
nu este suficient de reactiv la erorile pe unul sau mai multi bii, reactivitate
util la detectarea i/sau corectarea acestora.
O operatie aritmetic relativ simpl, dar mai eficient este mprirea cuvintelor
de cod i retinerea restului mpririi. Aceast operatie suplimentar este larg
utilizat n cazul codurilor polinomiale, n particular n cazul codurilor ciclice.
Coduri polinomiale/ciclice
Anticipnd ntructva, codurile polinomiale au proprietatea de liniaritate: suma
a dou cuvinte de cod este i ea un cuvnt de cod. Proprietatea deriv din
liniaritatea operaiei de adunare a polinoamelor.
n anumite codiii, codurile polinomiale au i proprietatea de ciclicitate: orice
permutare circular a unui cuvnt de cod este tot un cuvnt de cod. Condiiile
acestea particulare se refer la mulimea de coeficienti ai polinoamelor i la
algebra lor mai mult sau mai puin specific. Polinoamele sunt definite peste un
corp finit, numit n general corp Galois, nume atribuit n onoarea postum a
matematicianului variste Galois (1811-1832). Corpurile Galois cele mai
frecvent utilzate de specialitii n codare sunt GF(2) i GF(2n) (GF vine de la
Galois Field, cum se numesc corpurile Galois n literatura n limba englez).
Detalii despre aceste corpuri finite vor fi date ceva mai departe.
Revenind la proprietatea ciclicitii, ntr-un cod ciclic, dac 00100110 este un
cuvnt al codului, atunci i 00010011, i 10001001, dar i 00101001 sunt
cuvinte care aparin codului, prin permutare circular primele dou, prin
nsumarea cuvntului iniial cu urmtorul pentru cel din urm.
Codurile ciclice sunt construite i analizate eficient nu prin vectori binari i
matrici binare, ci mai curnd prin polinoame cu coeficienti ntr-un corp finit. De
aceea, n literatur codurile ciclice se mai numesc i coduri polinomiale: o
seam de operaii cu cuvintele de cod au echivalene n operatii cu polinoame.
Deoarece sunt coduri liniare, codurile ciclice au implementri convenabile att
sub aspectul complexitii ct i n ceea ce priveste viteza codrii i decodrii.
Proprietile codurilor ciclice le fac eficiente n utilizri cum ar fi tratarea
erorilor multiple aleatoare sau incidentale, unidirecionale sau nu. Nu
ntmpltor n transmisiunile moderne se folosesc pentru detectarea sau
corectarea erorilor codurile ciclice, n particular codurile CRC (Cyclic
Redundancy Check).
S-a spus deja, codurile ciclice se genereaz i se studiaz convenabil n raport
cu mulimea polinoamelor n nedeterminata X
a0X 0 + a1X 1 + + an 1X n 1
138
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
139
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Algoritmul lui Euclid i mprirea n corpuri finite. Cel mai mare divizor
comun al unei perechi de numere ntregi r i s, gcd(r, s)4, este cel mai mare
ntreg care divide att pe r ct i pe s.
Algoritmul lui Euclid este o metod eficient de a gsi gcd(r, s); este mult mai
rapid dect factorizarea lui r i s urmat de reinerea factorilor comuni. Ca
produs secundar al algoritmului lui Euclid, se pot gsi ntregii a i b astfel nct
d = gcd(r, s) = ar + bs. Dac gcd(r, s) = 1 atunci algoritmul produce valoarea
reciproc (invers) a lui r n inelul ntregilor modulo s.
Ideea algoritmului lui Euclid este de a reduce calculul lui gcd(r, s) pentru
ntregii r, s pozitivi la calculul lui gcd(r, s) cu perechea de numere (r, s) mai
mici dect cele din perechea (r, s). Mai mici nseamn aici c ambele
componente ale perechilor (r, s), (r, s) sunt n relatia r r, s s, dar fie r <
r, fie s < s. Dac r < s atunci (s mod r) < r aa nct (r, s) = (r mod s, r)
reprezint o problem mai redus, mai mic potrivit acestei definiii.
Algoritmul lui Euclid genereaz o secven descresctoare r1 > r2 > > rn > 0
n care fiecare ri este obtinut din dou numere anterioare prin ri = ri 2 mod ri 1
i valoarea ultim este rn = gcd(r, s). Resturile sunt definite iterativ astfel:
s = Q1r + r1 0 < r1 < |r|
r = Q2r1 + r2 0 < r2 < r1
r1 = Q3r2 + r3 0 < r3 < r2
......................
rn 2 = Qnrn 1 + rn
0 < rn < rn 1
rn 1 = Qn + 1rn
Procedura se ncheie dup un numr finit de pai deoarece fiecare rest este un
numr pozitiv mai mic dect restul precedent.
Resturile succesive satisfac relatia de recuren liniar
ri = ri 2 Qiri 1
cu condiiile initiale r1 = s i r0 = r. Decurge de aici c fiecare divizor comun al
numerelor ri 1 i ri 2 divide i pe ri, iar fiecare divizor comun al numerelor ri i
ri 1 divide i pe ri 2. Asadar gcd(ri, ri 1) = gcd(ri 1, ri 2) pentru orice indice
i. n particular, rn = gcd(rn, rn 1) = gcd(r0, r 1) = gcd(r, s).
Fiecare rest ri este o combinaie liniar ntreag a celor dou resturi anterioare.
Astfel, prin inducie, restul ultim este o combinatie liniar a primelor dou
resturi r0 = r i r1 = s, adic rn = gcd(r, s) = ar + bs cu a i b ntregi. Este
evident c a i b au n mod necesar semne diferite. Coeficientii a i b pot fi
calculai iterativ prin generarea secventelor {ai} i {bi} n modul
ri = air + bis i = 1, 0, 1, , n
Valorile iniiale pentru {ai} i {bi} sunt evident a1 = 0, b1 = 1 i a0 = 1, b0 = 0.
Perechile ai, bi se pot determina din ai 1, ai 2, bi 1, bi 2 astfel:
ri = Qiri 1 + ri 2 = Qi(ai 1r +bi 1s) + (ai 2r +bi 2s) =
= ( Qiai 1 + ai 2)r + ( Qibi 1 + bi 2)s = air + bis
gcd(r, s) greatest common divisor, notaie preferat n textul prezent pentru scurtimea ei fa
de poate mai uzuala prescurtare c.m.m.d.c. cel mai mare divizor comun.
140
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Qi
2
5
1
2
ai
bi
0
1
2
11
13
1
0
1
5
6
Qi
ai
bi
0
1
1
0
Un exemplu la ndemn de corp finit este cel al claselor de resturi modulo p, cu p un numr
prim, cu operatiile uzuale de adunare i de multiplicare a claselor. Reamintim, notatia GF(p)
vine de la sintagma n limba englez Galois Field (cmp Galois corp Galois). i aceast
notatie aste mentinut de-a lungul ntregii expuneri.
141
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
45
32
13
6
1
0
2
0
1
2
2
6
2
1
3
7
17
1
0
1
2
5
Qi(x)
x+1
x
x+1
x
ai(x)
0
1
x+1
x2 + x + 1
x3 + x
ri(x)
10011
1100
111
10
1
0
Qi(x)
11
10
11
10
ai(x)
0
1
11
111
1010
142
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Qi(x)
100
1
100
10
ai(x)
0
1
100
101
10000
143
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Coduri polinomiale
n teoria codrii, un cod polinomial este un cod liniar bloc cu mulimea de
cuvinte valide format din acele polinoame care sunt divizibile cu un polinom
fixat, numit polinom generator.
Definitii: Fie un corp finit GF(q), ale crui elemente se numesc mai departe
simboluri. Pentru a construi coduri polinomiale, se identific secvenele
ordonate de n simboluri an 1 a0 cu polinoamele an 1xn 1 + + a1x + a0, cu
coeficienti n corpul GF(q).
Se aleg doi ntregi pozitivi m n i fie g(x) un polinom de gradul m numit
polinomul generator. Codul polinomial generat de g(x) este codul n care
cuvintele de cod corespund acelor polinoame de grad inferior lui n, care sunt
divizibile cu g(x).
Un exemplu: Fie codul polinomial peste corpul GF(2) = {0, 1}, cu n = 5, m = 2
i polinomul generator g(x) = x2 + x + 1. Acest cod const din urmtoarele
cuvinte de cod:
0g(x), 1g(x), xg(x), (x + 1)g(x),
x2g(x), (x2 + 1)g(x), (x2 + x)g(x), (x2 + x + 1)g(x).
sau explicit
2
3
2
3
0, x + x + 1, x + x + x, x + 1,
x4 + x3 + x2, x4 + x3 + x + 1, x4 + x, x4 + x2 + 1.
Echivalent, n exprimare binar
00000, 00111, 01110, 01001,
11100, 11011, 10010, 10101.
De observat c orice cod polinomial este un cod liniar: orice combinaie liniar
de cuvinte de cod este la rndu-i un cuvnt de cod. n cazuri ca acesta, cu corpul
GF(2) ca baz, combinaiile liniare se fac cu operatia SAU-EXCLUSIV (XOR),
de pild 00111 XOR 10010 = 10101.
Codarea. ntr-un cod polinomial peste corpul finit GF(q) cu lungimea cuvtului
n i polinomul generator g(x) de gradul m, sunt exact qn m cuvinte de cod. Prin
definitie, p(x) este un cuvnt al codului dac i numai dac acesta este de forma
p(x) = g(x)q(x) cu q(x) ctul de grad inferior numrului n m. Deoarece
sunt numai qn m asemenea cturi, codul are tot attea cuvinte, n m. n
consecint, cuvintele de date, cuvintele informaionale trebuie s fie de
lungimea n m.
Unii autori, cum sunt Lidl i Pilz (1999), discut de aplicatia q(x) g(x)q(x)
ca o atribuire de cuvinte de date cuvintelor de cod.
Alternativ, se folsete adesea metoda urmtoare pentru a crea un cod sistematic:
fiind dat un cuvnt de date d(x) de lungime n m, se multiplic mai nti d(x)
cu xm, ceea ce are ca efect deplasarea lui d(x) cu m pozitii spre stnga. n
general, xmd(x) nu este divizibil cu g(x), deci nu este un cuvnt de cod. Exist
ns un cuvnt de cod unic care se poate obtine prin modificarea a m simboluri
cele mai din dreapta ale polinomului xmd(x). Pentru aceast operatie se
calculeaz restul mprtirii lui xmd(x) prin g(x):
144
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
145
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
146
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
divizor al lui xn 1. Decurge de aici c orice cod ciclic este un cod polinomial.
Dac polinomul generator g are gradul d, atunci rangul codului C este n d.
Idempotentul codului C este un cuvnt de cod e pentru care e2 = e (adic e este
un element idempotent al lui C) i e este o identitate pentru cod, ec = c pentru
orice cuvnt de cod c. Un astfel de cuvnt exist totdeauna i este unic; el este
un generator al codului.
Un cod ireductibil este un cod ciclic n care codul ca ideal este minimal n R
astfel c generatorul su este un polinom ireductibil.
Exemple: Dac A = GF(2) i n = 3, mulimea cuvintelor de cod continute n
codul ciclic al lui 110 este exact
000, 110, 011, 101.
El corespunde idealului GF(2)[x]/(x3 + 1) generat de (1 + x).
De observat c (1 + x) este un polinom ireductibil n inelul polinoamelor i de
aceea codul este un cod ireductibil.
Idempotentul acestui cod este polinomul x + x2 care corespunde cuvntului de
cod 011.
Exemple triviale de coduri ciclice sunt An nsusi i codul care contine numai
cuvntul nul. Acestea corespund respectiv polinoamelor generatoare 1 i xn + 1,
polinoame care divid totdeauna pe xn + 1.
Peste GF(2), codul cu paritate constant alctuit din toate cuvintele de pondere
par corespunde generatorului x + 1. i acesta este totdeauna un factor al
polinomului xn + 1.
Submulimile de polinoame generate prin multiplicarea cu un polinom fix a
tuturor celorlalte polinoame se numesc ideale ale inelului respectiv. Teorema
mprtirii ntregi pentru polinoame conduce la o mprtire a polinoamelor n
clase dup schema explicat de relatia urmtoare
b(X) = a(X)q(X) + r(X)
Polinomul b(X) apartine clasei de resturi r(X) modulo a(X). Restul r(X) este un
polinom de grad strict mai mic dect gradul polinomului a(X) prin care se face
mprtirea.
Dac a(X) este polinomul care genereaz pe calea artat un ideal I atunci
idealul respectiv coincide cu clasa de resturi r(X) = 0, adic toate polinoamele
din idealul I se mpart exact (fr rest) la polinomul a(X). Prin adunarea la
polinoamele din idealul I a unui polinom oarecare r ( X ) 0 , de un grad
inferior polinomului a(X) se obtine o alt clas de resturi, clasa de resturi r(X)
modulo a(X). Operatiile cu polinoame se transform n operatii cu clase i
operatiile cu clase sunt deplin reprezentate prin operatiile cu resturile r(X)
specifice. Asadar, oricare din clasele de resturi va fi reprezentat de polinomul
de cel mai mic grad din clasa respectiv. Clasele astfel definite pot fi privite i
ca vectori cu n componente, componentele fiind coeficientii polinoamelor de
grad n 1, a0X 0 + a1X 1 + + an 1X n 1: a = a0a1an1. Vectorii de acest gen
pot fi multiplicati scalar. Produsul scalar coincide cu produsul de clase dac
polinomul a(X) este de forma
a(X) = X n + 1
147
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
G
... ... ... ...
... ... ...
0 ... ...
g 0 ... g m
0
matrice cu k = n m linii care conine pe linii codurile asociate polinoamelor
g(X), Xg(X), , Xk 1g(X). Orice polinom combinaie liniar a polinoamelor
din aceast list este de asemenea asociat unui cuvt cu sens, unui cuvnt al
codului. Matricea G de mai sus este numit matricea generatoare a codului
148
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
ciclic. Ea are k linii liniar independente din care se pot forma 2k cuvinte de cod.
Din relatia funcional
g(X)h(X) = Xn + 1
echivalent n mulimea cuvintelor cu
v(X)h(X) = 0
rezult matricea de control al paritii H cu proprietatea
HvT = 0
Matricea H este legat de coeficienii plinomului
h(X) = h0 + h1 X + + hk Xk
i are forma
0 ... 0 hk hk 1 ... h0
0
1+X
X2
1 + X2
X + X2
1 + X + X2
X X 2 (0 1 1)
1 X 2 (1 0 1)
1 X X 2 (1 1 1)
149
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
cuvintele de cod sunt cele dou nscrise pe liniile matricii, la care se adaug
combinatia liniar (unic)
1 X 2 (1 0 1)
Matricea de control este dat de polinomul h(X) = 1 + X + X 2 i este
H [1 1 1]
Deoarece ponderea minim este d = 2 se poate detecta o eroare. Cuvintele de
cod verific relatia
HvT = 0
Cazul III. m = 2. k = 1; g(X) = 1 + X + X 2, h(X) = 1 + X.
Matricea generatoare este
G [1 1 1]
i exist un singur vector cuvnt de cod diferit de cuvntul nul. Ponderea este d
= 3 i permite corectarea unei erori.
Matricea de control este
H 01 11 10
Este vorba aici de codul cu repetiie, cu transmiterea fiecrui bit de trei ori.
Generarea sistematic a cuvintelor de cod.
Fie i ( X ) an k an k 1 X ... an 1 X k 1 polinomul de grad strict mai mic dect
k = n m, cu coeficientii bii purttori de informatie. Polinomul Xmi(X) de grad
mai mic dect n contine n partea final, cea cu ordinele cele mai mari, aceiasi
bii. Teorema mprtirii ntregi pentru acest polinom
Xmi(X) = g(X)q(X) + r(X)
conduce la ctul q(X) de grad mai mic dect k i la restul r(X) de grad mai mic
dect m. Cuvtul
v(X) = r(X) + Xmi(X)
este divizibil cu g(X), aadar este cuvnt de cod. Restul r(X) are drept
coeficieni, adic simboluri de control, combinatii liniare ale simbolurilor
purttoare de informatie. Prin operatii elementare algebrice, matricea
generatoare poate fi adus la forma
G [ P Ik ]
cu Ik matricea unitate de ordinul k. Cuvintele de cod se pot scrie conform
relatiei matriciale
v = iG
150
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Adunare
ab ba
( a b ) c a (b c )
a(b c ) ab ac
a0 a 0a
a ( a) 0 ( a ) a
nmulire
ab ba
(ab)c a(bc)
(a b)c ac bc
a.1 a 1.a
1
aa 1 a 1a , dac a 0
Un corp cu numr finit de elemente este un corp finit sau un corp Galois
(denumit astfel n onoarea lui variste Galois, 1811-1832).
Deoarece elementele neutre sunt diferite unul de cellalt, un corp trebuie s
contin cel putin dou elemente. Exemple de corpuri: corpul numerelor
complexe, corpul numerelor reale, corpul numerelor rationale dar nu multimea
numerelor intregi, care este un inel.
Pentru un corp finit numrul de elemente alctuitoare, cardinalul su se mai
numeste i ordinul corpului. Ordinul unui corp finit este totdeauna un numr
prim sau o putere ntreag pozitiv a unui numr prim. Pentru fiecare putere a
unui numr prim exist un corp finit i numai unul GF(pn) (fcnd abstractie de
un izomorfism).
GF(p) este numit corp prim de ordinul p i este corpul claselor de resturi
modulo p, iar elementele lui se noteaz cu 0, 1, ..., p 1. Egalitatea a = b n
GF(p) este tot una cu a b (mod p). A se observa c n inelul resturilor modulo
4, 22 0 (mod 4), asadar 2 nu are invers pentru operatia de nmultire i inelul
claselor de resturi modulo 4 este altceva dect corpul finit cu patru elemente.
Pentru claritate, corpurile finite cu k = pn se scriu GF(pn) i nu GF(k).
Corpul finit GF(2) contine elementele 0 i 1 care se adun i se nmultesc
conform binecunoscutelor table de adunare i nmulire
+
0
1
0
0
1
1
1
0
0
1
0
0
0
1
0
1
151
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Polinoame
0
x0
x1
x2
x3
x4
x5
x6
x7
0
1
x
x2
x+1
x2 + x
2
x +x+1
x2 + 1
1
Vectori
binari
(000)
(001)
(010)
(100)
(011)
(110)
(111)
(101)
(001)
Exprimare zecimal
0
1
2
4
3
6
7
5
1
152
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
este valabil pentru orice x i y din corpul finit GF(q) dac p este tocmai
caracteristica lui.
Cuvinte de cod prin rdcinile polinomului generator. Un polinom oarecare
v(x), de grad n 1 este cuvnt de cod dac i numai dac are printre rdcini
rdcinile polinomului generator g(x). Aceasta nseamn c polinomul v(x) este
divizibil cu g(x) i face parte din idealul generat de acesta din urm. Polinomul
g(x) este divizor pentru xn + 1 ceea ce face ca rdcinile lui i ale poilnomului
v(x) s fie i rdcini ale polinomului xn + 1. Numrul rdcinilor polinomului
xn + 1 generator al claselor de resturi modulo p(x) = xn + 1 este n.
Dac n = 2m 1 atunci polinomul xn + 1 are ca rdcini elementele nenule ale
corpului Galois GF(2m) n numr de n = 2m 1, notate n 1.
Corpul Galois GF(2m) contine clasele de resturi generate de un polinom
ireductibil q(x) de gradul m. Pentru fiecare grad m exist un polinom ireductibil
q(x) i sunt tabele cu astfel de polinoame. Dac q(x) este i primitiv atunci toate
elementele nenule ale corpului Galois GF(2m), respectiv toate rdcinile
m
polinomului x 2 1 1 , pot fi exprimate ca puteri ale uneia din rdcinile
polinomului primitiv q(x). Fie acea rdcin . Lista complet a rdcinilor este
1, n1 cu n = 2m 1. Un caz particular ar putea fi acela n care
polinomul generator g(x) este chiar q(x).
Exemplu: Fie n = 2m 1 = 15, adic m = 4. Elementele nenule ale corpului
Galois GF(24) sunt generate de polinomul ireductibil de gradul patru q(x) = 1 +
x + x4 care are rdcina primitiv . Cele 15 elemente nenule din GF(24) sunt
date n tabelul urmtor:
Puteri ale
lui
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
n binar
1000
0100
0010
0001
1+
1100
0110
0011
1 + +
1101
1 +
1010
0101
1 + +
1110
+ +
0111
1 + + +
1111
1 + +
1011
1 +
1001
1000
153
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
a0 0 a1 0 a2 1 a3 10 11 0
0
1
1
1 1
egalitate echivalent cu sistemul
154
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
a0 1 0
a3 1 0
a2 1 0
a1 a2 a3 1 0
care conduce la a1 = a2 = a3 = a4 = 1 i la expresia lui m3(x) de mai sus.
Matricea de control. Dac cuvntul de cod v(x) are ca rdcini r
atunci
v ( i ) a0 i0 a1 1i ... an 1 .n 1 0
pentru toi indicii i = 1, 2, ..., r. Scriind matricea
10 11 12 ... 1n 1
1
2
n 1
0
H 2 2 2 ... 2
...0 ...1 ...2 ... ...
n 1
r r r ... r
i vectorul v [a0a1a2 ... an 1 ] , rezult
HvT = 0
care este o condiie de inteligibilitate, de apartenen la cod a cuvtului v(x). n
matricea de mai sus elementele i0 1 . Rdcinile i se aleg dintre cele 2m 1
elemente nenule ale corpului GF(2m) astfel nct ele s aib polinoame
minimale distincte. Astfel produsul polinoamelor minimale dau polinomul
generator
g ( x ) m1 ( x )m2 ( x )... mr ( x )
care este chiar produsul lor deoarece sunt mutual prime. Suplimentarea cu alte
rdcini ale polinoamelor minimale nu aduc modificri polinomului generator,
dup cum s-a vzut mai devreme. Rangul matricei H este egal cu gradul
polinomului generator.
Exemplul anterior continuat conduce la matricea
1
2
14
0
H 0 3 6 ... 42
...
n care se substituie puterile lui conform tabelului de mai sus i se obtine
0 0 0 ... 1
0 0 1 ... 0
0 1 0 ... 0
1
H 10 01 01 ...
...
1
0
0
1
...
1
0
0
0
...
1 0 0 ... 11
155
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
sau
0 0 0 1
H 00 01 10 00
1 0 0 0
Polinomul generator este g(x) = 1 + x + x4.
Corectorul. Fie ... i1 ... i e ... cu
...
...
...
...
1
0
0
1
...
( 2 e 1)(i 1)
Sindromul este atunci
z H T hi1 ... hie
o sum de e coloane din H, una din sumele diferite de e coloane diferite.
Rezult corectori distinci pentru situaii diferite.
n cazul corectrii unei singure erori, matricea de control este
H 0 1 2 ... n 1
156
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Codurile convolutionale sunt specificate uzual prin trei numere ntregi pozitive,
(n, k, m), numrul de biti la iesire, numrul de biti la intrare, respectiv numrul
registrelor de memorie.
Raportul k/n este numit rata codului i este uzual o msur a eficienei codului.
De obicei k i n sunt de la 1 la 8, m de la 2 la 10 i rata codului de la 1/8 la 7/8
cu exceptia aplicatiilor spaiale la mare distant cnd ratele codului pot fi i de
1/100 sau chiar mai mici.
Productorii de echipamente de codare specific parametrii codurilor
convoluionale putin diferit: (n, k, L). Numrul L este aa-numita restrictie de
lungime a codului i se calculeaz din k i m cu relatia L = k(m 1). Restrictia
de lungime L reprezint numrul de biti din memoria codorului care servesc la
generarea celor n bii de la iesire. Restrictia de lungime se noteaz ocazional cu
K (majuscul), ceea ce ar putea duce uneori la confundarea cu litera mic
definit mai sus ca reprezentnd altceva. Unele surse consider pe K drept
produsul dintre k i m.
Alte surse definesc un cod convolutional prin perechea (r, K) n care r este rata
k/n a codului i K este restricia de lungime, de fapt L 1.
n textul care urmeaz, specificarea codurilor convoluionale se face exclusiv
prin tripla valoare (n, k, m).
Parametrii codului convoluional i structura codorului. Structura codorului
convoluional (n varianta grafic) se extrage uor din parametrii lui. Mai nti
se deseneaz m casete reprezentnd cele m registre de memorie. Apoi se pun pe
figur n sumatoare modulo 2 care produc cele n ieiri. Registrele de memorie se
conecteaz la sumatoare conform unor polinoame generatoare (v.figura
alturat).
m1 m0 m 1
m1
m0
v1
m1
v2
m1 m 1
m0 m 1
v3
Acesta este un codor convolutional (3, 1, 3). Genereaz la iesire 3 bii pentru
fiecare bit introdus la intrare i are 3 registre de memorie. Este alimentat la
intrare de fiecare dat cu 1 bit (intrare bit-cu-bit). Codul generat are aadar rata
de 1/3. Restrictia de lungime a codului este 2. Cum s-a menionat deja, cei 3 biti
de la iesire sunt rezultatul nsumrii selective modulo 2 a unor biti din registrele
de memorie, n 3 sumatoare distincte. Selectarea bitilor pentru fiecare iesire se
face conform unor aa-numite polinoame generatoare. De pild, primul bit de
157
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
iesire are ca polinom generator pe (1, 1, 1), bitul al doilea are pe (0, 1, 1) i al
treilea pe (1, 0, 1). Astfel,
v1 = (m1 + m0 + m1) mod 2
v2 = (m0 + m1) mod 2
v3 = (m1 + m1) mod 2
sau ntr-o scriere cu operatorul sau-exclusiv
v1 = (m1 m0 m1)
v2 = (m0 m1)
v3 = (m1 m1)
Polinoamele dau codului calitatea unic de a proteja la erori. Un cod
convoluional (3, 1, 3) poate avea proprieti diferite de ale altuia definit prin
alt alegere a plinoamelor generatoare.
Alegerea polinoamelor gneratoare. Oricare ar fi ordinul m al codului, sunt
multe alegeri posibile ale polinoamelor generatoare. Nu toate produc secvene
de iesire care s protejeze eficient la erori. n cartea Error-Correcting Codes,
W.W.Peterson i E.J.Weldon sunt date liste cuprinztoare de polinoame
generatoare adecvate. Polinoamele potrivite se obtin de obicei prin simulare pe
calculator. Pentru rata 1/2, tabelul alturat ofer polinoame de acest gen.
Restrictia de
lungime
3
4
5
6
77
8
9
10
g1
g2
110
1101
11010
110101
110101
110111
110111
110111001
111
1110
11101
111011
110101
1110011
111001101
1110011001
Starea unui codor. Starea unui codor este dat de o secvent de biti. Codoarele
rafinate au restrictia de lungime mare, cele simple au restrictia mai redus i
numrul de stri mai restrns.
Codul (2, 1, 4) din figura alturat are o restrictie de lungime 3. Registrele
umbrite detin bitii de stare. Registrul clar detine bitul abia sosit. Asta nseamn
c dup valorile bitilor din cele trei registre de memorie, codorul are 8 stri
distincte. Aceste 8 combinatii i bitul proaspt sosit determin valorile de iesire
obtinute pentru v1 i v2, bitii din secvena codat.
Surse variate reproduc acest tabel care d pentru restrictia de lungime 7 dou polinoame
generatoare identice. Probabil c este vorba de o eroare neobservat, propagat de la o surs la
alta.
158
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
v1
m1 m0 m 1 m 2
m1
m0
m1
m2
v2
m1 m0 m 2
m1 m0 m 1
v1
u1
m1
m0
m1
v2
m0 m 1
159
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
m1 m0 m 1
v3
u2
m1
m0
m1
v4
m0 m 1
u1
m1
m0
m1
m2
m3
v2
u2
m1
m0
m 1
m 2
v3
Polinoamele generatoare sunt n cazul acesta (1, 0, 0, 1, 1), (1, 1, 1, 0, 1), (0, 1,
0, 1) i (1, 0, 1, 1).
Un alt exemplu este codul convolutional (4, 3, 3), care preia 3 biti i produce 4
biti (vezi figura alturat). Numrul de registre de capacitate tripl este 3.
Restrictia de lungime este L = 32 = 6. Codul are 26 = 64 de stri i necesit
polinoame generatoare de gradul 9. Blocurile umbrite reprezint prin numrul
lor restrictia de lungime.
Procedura de reprezentare sub form grafic a structurii unui codor (n, k, m) cu
k mai mare ca 1 urmeaz paii descrii imediat.
Mai nti se deseneaz k multimi de m casete. Apoi se deseneaz cele n
sumatoare modulo 2. Se conecteaz cele n sumatoare la registrele de memorie
urmnd coeficientii unuia, mereu altul, dintre cele n polinoame generatoare de
160
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
gradul (km). Ceea ce se obtine este o structur ca aceea din figura alturat.
Aceasta reprezint codorul convolutional (4, 3, 3). Codorul are 9 registre de
memorie, 3 biti la intrare i 4 biti la iesire. Registrele umbrite contin biti
vechi i reprezint starea curent.
(0,1,0,0,1,0,1,0,1)
v1
u3u2u1
m3
m2
m1
(1,0,1,0,1,0,0,0,0)
m0
m1
m2
(0,0,1,1,0,1,0,1,0)
v2
m3
m4
m5
(0,1,0,0,0,1,1,0,1)
v4
v3
m2
m1
m0
m1
m2
m3
m4
m5
v4
u3u2u1
161
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
vlj ul i g ij
i0
n care vjl este bitul l de la iesirea j a codorului, ul i sunt biti aplicati la intrare i
gij este coeficientul i din polinomul generator j.
Ca un exemplu, fie de codat secventa de doi biti 10, cu un cod convoluional (2,
1, 4). Codorul lucreaz ca n figurile urmtoare, comentate n ordinea fireasc a
liniilor i de la stnga la dreapta.
1
0
0
0
0
Mai nti se introduce n codor bitul 1, cum se vede n prima figur, apoi bitul 0
cum se vede n figura urmtoare. Apoi un numr de biti nuli (de purjare), pn
cnd codorul revine la starea cu toate registrele de memorie continnd 0.
a. La momentul t = 0 starea initial a codorului este 000 (bitii n numr de L
situati n registrele pozitionate spre dreapta, cu fondul umbrit). Bitul de
intrare 1 i bitii de stare produc la iesire doi biti: 11. Cum? Prin nsumarea
modulo 2 a tuturor bitilor din registre, respectiv prin nsumarea modulo 2 a
trei biti.
b. La t = 1, bitul de intrare de la momentul anterior se deplaseaz n registrul
vecin spre dreapta. La fel se deplaseaz i ceilalti bii. Registrul de intrare
primete acum bitul 0 din secvena de codat. Codorul este deja n starea
100. Biii de iesire calculati la fel ca la punctul anterior sunt din nou 11.
c. La t = 2, bitii din registre se deplaseaz din nou cu o pozitie spre dreapta.
Starea codorului devine 010 i n registrul de intrare se introduce un nou bit
nul, primul din cei 3 de purjare. Bitii de la iesire sunt acum 10.
162
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n figura care urmeaz este verificat tratarea prin calcul pe baza introducerii n
codor a bitilor secventei 1011, unul cte unul. Rezultatul obtinut este acelai.
Aadar, modelul de calcul prin convoluie este corect.
1
0
1
163
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
0
1
0
1
0
0
Bit la intrare
1
0
1
1
0
0
0
Bii la iesire
11
11
01
11
01
01
11
Biii de stare
000
100
010
101
110
011
001
164
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Bit de
intrare
u
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
Starea
de
plecare
s1s2s38
000
000
001
001
010
010
110
110
100
100
101
101
110
110
111
111
Bii la
iesire
Starea
de sosire
v1v2
00
11
11
00
10
01
01
10
11
00
00
11
01
10
10
01
s1s2s3
000
100
000
100
001
101
001
101
010
110
010
110
011
111
011
111
Acest tabel descrie n mod unic codul (2, 1, 4). Tabelul este diferit pentru alte
coduri i depinde de coeficienii polinoamelor generatoare utilizate.
n explicarea codrii convoluionale i a decodrii, se recurge frecvent la
grafic. Un codor are toate elementele unui automat finit. De aceea este natural
ca diagramele de stare i arborii s fie printre reprezentrile sale. Dar cea mai
frecventat reprezentare pare a fi diagrama spalier (trellis). Aceasta pentru c o
diagram spalier cuprinde n aceeai imagine i aspectul temporal al proceselor
de codare i de decodare.
Diagrama spalier (trellis). Diagramele spalier sunt numite astfel pentru c
arat precum unele structuri similare utilizate n cultivarea unor plante, n slile
de sport etc. n cazul codurilor convoluionale grafurile spalier sunt aparent
ncurcate, greu de descifrat. Cu toate acestea sunt preferate n general grafurilor
de stare sau grafurilor arbore deoarece reprezint mai direct i mai complet
aspectele secveniale, temporale ale codrii convoluionale. ntr-un graf spalier,
chiar dac nu este figurat, pe axa absciselor este subnteles timpul discret
alctuit din momentele n care au loc evenimente determinante pentru operaia
de codare. Pe vertical sunt artate toate strile posibile ale codului. Scurgerea
timpului se traduce printr-o deplasare pe spalier n sensul pozitiv, spre dreapta.
Mai condensat, strile codului se pot reprezenta n octal. Aceasta este reprezentarea aleas n
unele puncte ale discutiei despre codurile convolutionale. Cititorul va fi avertizat la momentul
potrivit.
165
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Fiecare tranziie nseamn sosirea unui nou bit din secvena care trebuie codat.
Tranziiile sunt iniiate/stimulate de acei bii.
000
S t r i
001
010
011
100
101
110
111
Repetare
166
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Biti la intrare: 1
000
S t r i
001
010
011
100
101
110
111
Intrare
000
001
010
011
100
101
110
111
Secventa
de cod
valid
000000
000011
001111
001100
111110
111101
110001
110010
Secventa
primit
111100
167
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Potrivirea Distana
de bii
Hamming
2
0
2
4
5
5
3
3
4
6
4
2
1
1
3
3
168
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
11
01
11
000
Retur
001
S t r i
01
010
011
100
101
110
111
Decizii: 1
4,5
2. Decodorul preia urmtorii doi biti, 11. Prin consultarea aceluiasi tabel,
decide c un 1 a fost trimis spre codare, ceea ce corespunde exact cu unul
din cuvintele de cod. Contorul de erori rmne neschimbat.
3. Bitii receptionati n continuare sunt 01. Alegerile posibile pentru cuvntul
de cod sunt 11 sau 00. Apare o nou eroare i contorul de erori este
incrementat cu 1. Contorul de erori contine deocamdat o valoare tot mai
169
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
11
01
11
01
000
S t r i
001
Retur
010
011
100
101
110
111
Decizii: 1
4,5
5. Decodorul revine la punctul de decizie nr.3 unde contorul de erori era mai
mic dect pragul 3 i face cealalt alegere. ntlneste din nou o conditie de
eroare. Bitii receptionati sunt 11 dar cuvintele de cod posibile sunt 01 i 10.
Contorul de erori ajunge din nou la 3. Decodorul se ntoarce din nou din
drum.
6. Ambele ramuri posibile din punctul nr.3 au fost epuizate. Decodorul trebuie
s mearg nc mai napoi, la punctul nr.2. Dac urmeaz ramura
neexplorat nc, contorul de erori ajunge din nou la pragul 3. De aceea,
decodorul trebuie s mearg nc mai napoi, la punctul de decizie nr.1.
Biti la intrare: 01
11
01
11
000
Retur
S t r i
001
010
011
100
101
110
111
Decizii: 1
Retur
2
170
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
11
01
11
01
01
11
000
S t r i
001
010
011
100
101
110
111
Decizii: 1
171
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Metrici
1
S t r i
001
010
011
100
101
110
111
Starea de plecare9
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
0 0
00 11
01
1 1
0 4
172
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Biti la intrare: 01
11
Metrici
000
S t r i
001
010
011
100
101
110
111
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
0 0 4 4
00 11 11 00
11
2 0 0 2
0 4 2 6
3. La t = 2, cele patru stri tranziteaz la opt stri pentru a evidenia toate cile
posibile. Metricile cilor pentru biii 01 sunt calculate i adugate metricilor
de la momentul anterior t = 1.
S t r i
Biti la intrare: 01
11
01
Metrici
000
001
010
011
100
101
110
111
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
0 0 2 2 4 4 6 6
00 11 10 01 11 00 01 10
01
1 1 2 0 1 1 0 2
0 4 1 5 2 6 3 7
173
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
S t r i
Biti la intrare: 01
11
01
11
Metrici
000
6,3
001
3,4
010
4,3
011
3,6
100
4,5
101
3,4
110
6,2
111
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
3,6
0 0 1 1 2 2 3 3
00 11 11 00 10 01 01 10
11
2 0 0 2 1 1 1 1
0 4 0 4 1 5 1 5
4 4 5 5 6 6 7 7
11 00 00 11 01 10 10 01
11
0 2 2 0 1 1 1 1
2 6 2 6 3 7 3 7
n etapa curent, ca i mai departe, metricile colorate n rou sunt cele care
sunt suportul deciziilor de eliminare a unor drumuri. Drumurile eliminate
sunt i ele colorate n rosu.
174
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
S t r i
Biti la intrare: 01
11
01
11
01
Metrici
000
4,4
001
5,3
010
5,4
011
2,5
100
4,4
101
3,3
110
5,4
111
4,3
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
0 0 1 1 2 2 3 3
00 11 11 00 10 01 01 10
01
1 1 1 1 2 0 0 2
0 4 0 4 1 5 1 5
4 4 5 5 6 6 7 7
11 00 00 11 01 10 10 01
01
1 1 1 1 0 2 2 0
2 6 2 6 3 7 3 7
S t r i
Biti la intrare: 01
11
01
11
01
01
Metrici
000
5,4
001
6,2
010
5,4
011
4,5
100
5,4
101
4,4
110
5,4
111
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
6,3
0 0 1 1 2 2 3 3
00 11 11 00 10 01 01 10
01
1 1 1 1 2 0 0 2
175
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Starea de sosire
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
0 4 0 4 1 5 1 5
4 4 5 5 6 6 7 7
11 00 00 11 01 10 10 01
01
1 1 1 1 0 2 2 0
2 6 2 6 3 7 3 7
7. La t = 6, biii recepionai sunt 11. Din nou sunt calculate metricile pentru
fiecare drum. Se elimin drumurile cu metricile cumulate mai mari, se
menin ambele drumuri convergente ntr-un nod dac metricile lor cumulate
sunt egale.
S t r i
Biti la intrare: 01
11
01
11
01
01
11
Metrici
000
6,2
001
5,5
010
4,6
011
5,4
100
4,4
101
5,5
110
6,4
111
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
Starea de plecare
Biti admisibili
Biti primiti
Distanta Hamming
Starea de sosire
5,4
0 0 1 1 2 2 3 3
00 11 11 00 10 01 01 10
11
2 0 0 2 1 1 1 1
0 4 0 4 1 5 1 5
4 4 5 5 6 6 7 7
11 00 00 11 01 10 10 01
11
0 2 2 0 1 1 1 1
2 6 2 6 3 7 3 7
La pasul acesta graful spalier este parcurs complet; nu mai sunt perechi de
biti recepionate care s fie decodate. ntr-o procedur a parcursului invers,
se examineaz graful i se retine drumul cu cea mai mic metric.
Drumul trasat prin strile 000, 100, 010, 101, 110, 011, 001, 000 este cel
care corespunde secvenei decodate 1011000.
176
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
S t r i
Biti la intrare: 01
11
01
11
01
01
11
Metrici
000
001
010
011
100
101
110
111
177
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
-2
-1
-2
-1
-2
-1
0
volti
2
2
cu vt tensiunea prag de decizie, 0 n cazul de fa, cu 2 variana zgomotului sau
puterea lui. Funcia erfc este cunoscuta functie de eroare (error function).
Relatia aceasta se poate rescrie i ca
S
1
Pe1 erfc
2
Z
Aceasta este relatia familiar pentru rata biilor eronai. Se admite c decizia
hard este cea adoptat.
Dar ce se ntmpl dac s-ar proceda altfel: n loc de dou regiuni decizionale sar mpri intervalul de tensiuni n patru regiuni decizionale?
178
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
-3
-2
-1
0
volti
Arii-probabilitti: 0.5793
0.2621
0.1227
0.0359
179
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
( x )2
1
2
f(x) =
e 2
2
atunci functia de repartiie (de probabilitate cumulat) este
F(x) =
f (t )dt
Pr[a < x b] =
f (t )dt
= F(b) F(a)
Regiunea 1
0,5793
0,0359
Regiunea 2
0,2621
0,1227
Regiunea 410
0,0359
0,5793
Regiunea 3
0,1227
0,2621
Acest proces de decizie prin divizarea n mai mult de dou prti a spaiului
decizional este cunoscut ca proces de decizie soft. Probabilitile de genul celor
din tabel, reprezentate i n graf sunt numite i probabilitti de tranziie. Sunt
valori ale tensiunii cu 4 apartenene posibil diferite pentru fiecare semnal
recepionat care servete la elaborarea deciziei.
Ca i n viaa real, i n cazul semnalelor mai mult informaie nseamn
decizii mai bine fundamentate. Deciziile soft mresc sensibilitatea metricilor
folosite la decodare i amelioreaz performana cu pn la 3 dB n cazul unei
decizii soft pe 8 niveluri.
0
0,05
0,04
0,12
0,26
0,26
10
0,12
0,95
0,56
0,95
0,58
0,05
0,04
180
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
181
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
Prima problem care poate influenta negativ eficiena decodrii se rezolv prin
operatii de intercalare-deintercalare care fac msurtorile succesive temporar i
artificial deprtate cu o decorelare notabil dac nu total.
Problema a doua se poate rezolva recursiv. J.Hagenauer i P.Hoeher (1989)
propun un asemenea algoritm recursiv de actualizare a parametrilor statistici ai
perturbatiilor, pe baza observaiilor curente.
182
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
183
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
184
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
A A
i
i 1
185
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n n
P Ai (1) j 1 S j cu S j P ( Ai1 ... Ai j ) j n .
i1 ,i 2 ,...,i j n
i 1 j 1
Dac F Ai iI este o familie numerabil de evenimente mutual exclusive
P Ai P An / Ai P ( A2 / A1 ) P ( A1 )
i 1
i 1
P ( A) P( Ai ) P( A / Ai )
i 1
P ( Ai / A) P( Ai ) P( A / Ai ) / P( Ai ) P( A / Ai )
i 1
186
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
iI
PX ( J ) PX ( xi ) J K X
xi J
( x ) dx 1
187
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
188
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
PROBABILITATI
p(x)
0.5
FUNCTIA DE REPARTITIE
F(x)
0.5
4
x
PROBABILITATI
p(x)
0.5
0
-2
10
10
FUNCTIA DE REPARTITIE
F(x)
0.5
0
-2
6
x
m M ( x)
xf ( x)dx
care face parte din lista nesfrsit a momentelor de diferite ordine ale variabilei,
acesta fiind momentul de ordinul unu.
189
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
M [ g ( x )]
g ( x) f ( x )dx
i dac g(x) = xr cu r natural, avem tocmai momentul de ordinul r despre care sa amintit.
n cazul particular g ( x ) [ x M ( x )]2 se obtine o alt valoare important
relativ la variabila aleatoare descris de functia de repartitie F(x) sau de
densitatea de repartitie f(x), i anume dispersia. Rdcina ptrat pozitiv a
dispersiei se numeste abatere medie ptratic sau abaterea standard. Dispersia
notat uzual cu este momentul centrat de ordinul doi al variabilei aleatoare,
unul din multiplele momente centrate de ordine diferite ale variabilei.
Nu numai variabilele aleatoare continue au momente, medii, dispersii ci i cele
discrete. n cazul discret, formulele de calcul contin sume n locul integralelor i
variabila parcurge ntreaga list de valori posibile, iar densitatea de repartitie
este nlocuit de probabilittile asociate valorilor pe care variabila le poate lua.
Astfel, media se calculeaz cu relatia
m M ( x ) pi xi
iI
i dispersia, cu relatia
2 pi ( xi m) 2
iI
Pentru media unei functii de variabila aleatoare X, relatia integral de mai sus se
transform n
M [ g ( x)] pi g ( xi )
iI
190
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
1
2
f ( x)
e 2
2
n care m este media variabilei x i 2 este dispersia ei. Legea normal este
perceput ca o lege limit pentru sumele de variabile aleatoare. Un fenomen
afectat de foarte multi factori aleatori se prezint de cele mai multe ori ca un
fenomen aleator descris de o lege normal.
Variabilele aleatoare din expunerea teoretic sau din exemplele prezentate mai
sus au fost pn acum simple, adic a fost vorba n toate cazurile de o singur
functie X : R legat de un cmp de probabilitate (, K, P) unic.
Se pot imagina variabile aleatoare cu mai multe componente, variabile aleatoare
sub forma unor vectori cu componente aleatoare definite relativ la un acelai
cmp de probabilitate sau la cmpuri de probabilitate diferite. Astfel legea
urmtoare se refer la o variabil aleatoare vectorial.
Legea normal multidimensional este dat de densitatea de repartitie
1
( x m )T W 1 ( x m )
1
2
f ( x)
e
n
(2 ) 2 det W
cu media m, un vector cu n componente i cu matricea de covariatie W, o
matrice (nxn) pozitiv definit.
Pentru ca exemplul s aib consistenta necesar, trebuie definit mai clar
matricea W. Este de comentat mai nti problema corelatiei a dou variabile
aleatoare care pot fi independente, caz n care valorile pe care le ia una nu
influenteaz n nici un fel valorile pe care le poate lua cealalt, dar pot fi mai
mult sau mai putin dependente ceea ce nseamn c dac una din variabile a luat
o valoare atunci legea de repartitie a celeilalte se modific n functie de acea
valoare a primei variabile.
Fiind date dou variabile aleatoare x i y de medii nule, media produsului lor
M(xy) se numeste covariatie. Dac covariatia este nul se poate spune n general
c cele dou variabile nu sunt corelate. Dimpotriv, dac M(xy) 0 variabilele
sunt corelate, exist o corelatie ntre ele, exist o dependent ntre valorile pe
care ele le iau n sensul artat putin mai devreme. Dac mediile sunt diferite de
zero, afirmatia i definitia se mentin pentru abaterile de la medie. ntruct
covariatia M(xy) poate lua valori foarte diferite, pentru o apreciere cantitativ
mai riguroas a triei corelatiei se utilizeaz coeficientul de corelatie
M ( xy )
M ( x2 ) M ( y2 )
care ia valori numai n intervalul [1, 1] i n expresia cruia se disting
dispersiile celor dou variabile, M(x2) i M(y2). O valoare apropiat de
191
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
192
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
DENSITATEA DE PROBABILITATE
f(x)
0.5
0
-1
-0.5
0.5
1.5
1.5
FUNCTIA DE REPARTITIE
F(x)
0.5
0
-1
-0.5
0.5
x
193
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
194
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
2
q
H1
cu valoarea de provenient experimental n stga semnului discriminator, cu
valoarea teoretic tebelar sau evaluat n dreapta acelui semn. Pe calea aceasta
se poate selecta legea de repartitie adecvat prin eventuala repetare a evalurilor
pentru alte functii de repartitie.
Estimarea i verificarea parametrilor unei legi de repartitie teoretice. Aa cum
s-a artat, legea de repartitie cea mai frecvent utilizat n modelarea i
simularea dinamicii sistemelor este legea normal. Ipotezele i verificrile
parametrice discutate n cele ce urmeaz se refer n exclusivitate la variabile
aleatoare repartizate normal sau, cum se mai spune, gaussian.
Selectie, parametri de selectie. O list de valori observate x1 , x2 ,..., xn ale unei
variabile aleatoare poart numele consacrat de selectie. Numele ar putea prea
impropriu prin prisma etimologiei cuvntului selectie i de aceea trebuie
subliniat c valorile din lista de observatii nu comport nici un proces subiectiv
de alegere. Prin selectie se ntelege numai observarea experimental i retinerea
unui numr finit de valori ale variabilei aleatoare din numrul extrem de mare
de valori pe care aceasta le poate lua.
Se admite c variabila are o repartitie normal cu media i dispersia .
Se defineste ca medie de selectie media aritmetic a valorilor observate
n
x
x
i 1
n
Ea este o estimatie absolut corect a mediei i se repartizeaz normal ca i
variabila x observat, cu aceeai medie dar cu dispersia /n. Din datele care
alctuiesc selectia se pot calcula dou dispersii de selectie
n
(x
s2
)2
i 1
si
n
(x
s2
x )2
i 1
n 1
Ambele sunt estimri absolut corecte ale dispersiei , prima cu n grade de
libertate, a doua, mai uzual deoarece nu necesit cunoasterea mediei teoretice
, cu n 1 grade de libertate.
195
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
n
care este o variabil aleatoare repartizat normal i este chiar normat adic are
media nul i dispersia egal cu unitatea. Se stabileste un nivel de ncredere sau
de semnificatie q, uzual de 0,95 (95%), pentru care n tabele sau prin calcul se
gseste un zq, n particular z0,95 = 1,96. Aceast valoare delimiteaz un interval
(zq, +zq), numit interval de ncredere, care contine 95% din valorile z calculate
din datele selectiilor de tipul i de volumul specificat mai devreme. Prin urmare
valorile din afara intervalului de ncredere nu sunt excluse dar sunt cu totul
improbabile, probabilitatea lor fiind complementara pn la unitate, 1 q.
Aparitia unei valori z din aceast categorie pune sub semnul unei serioase
ndoieli valabilitatea ipotezei formulate. Asadar, dac valoarea calculat
z ( z q , z q ) ipoteza se accept, n caz contrar se respinge sau ntr-o
exprimare care pune n evident ambele ipoteze, mutual exclusive
H0
z zq
H1
Dac dispersia nu este cunoscut, se utilizeaz variabila Student, n care
intervine radicalul pozitiv al dispersiei de selectie
x 0
t
s
n
Variabila Student este o variabil aleatoare n legtur cu care se mentioneaz
i un numr de grade de libertate, acelai cu al estimatiei s2. Se stabileste un
nivel de ncredere q i un interval de ncredere (tq, +tq). Tabelele dau aceste
valori pentru diverse niveluri de ncredere, cel mai uzual fiind acelai 0,95, dar
i pentru grade de libertate diferite. Desigur, valorile tq pot fi foarte bine
evaluate numeric. Ipoteza H0 se confirm dac valoarea Student calculat se
situeaz n interiorul intervalului de ncredere. Ipoteza se respinge n caz
contrar. Sintetic
H0
t tq
H1
196
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
H1
Criteriul F se aplic de obicei unilateral.
Variabila z normal normat i variabilele aleatoare t i F care sunt n
conexiune direct cu legea de repartitie normal permit formularea i testarea
unui numr important de alte ipoteze statistice. O alt variabil aleatoare
important legat de variabila repartizat normal este variabila despre care sa vorbit la verificarea calittii unei legi de repartitie teoretice de a fi un model
adecvat al unei variabile aleatoare observate experimental. Variabila este o
sum de ptrate ale unor variabile normale normate independente i are gradele
de libertate egale cu numrul de termeni din sum. Variabila permite ea
nsi verificarea de ipoteze asupra dispersiei, dat fiind faptul c ntr-o estimatie
s2 a dispersiei teoretice se poate separa o sum de ptrate de variabile z
normale normate independente si, implicit, o variabil . Tabele sau calculul
direct dau i n cazul acesta valori q2 care constituie pragul discriminator de
ipoteze la un nivel de semnificatie q precizat.
197
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
198
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
BIBLIOGRAFIE
199
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.
200
An evaluation version of novaPDF was used to create this PDF file.
Purchase a license to generate PDF files without this notice.