Ascunderea Informatiei in Text Folosind Gramatici de Tip LR - K

Ascunderea informaţiei in text folosind
gramatici de tip LR(k)
Traian Florin Serbănuţă
11 martie 2002
2
Cuprins
1 Introducere 5
1.1 Prezentarea lucrării . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Scurtă istorie a steganografiei . . . . . . . . . . . . . . . . . . 5
2 Preliminarii teoretice 9
2.1 Gramatici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Gramatici independente de context . . . . . . . . . . . 9
2.1.2 Gramatici de tip LR(k) . . . . . . . . . . . . . . . . . 11
2.1.3 Algoritm de parsare pentru gramatici de tip LR(k) . . 14
2.2 Gramatici ponderate . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 Coduri Huffman . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.1 Codificare . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.2 Construcţia codurilor Huffman . . . . . . . . . . . . . . 22
3 Sistemul de criptare 25
3.1 Prezentarea sistemului . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Extinderea sistemului . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Algoritmii de criptare şi decriptare . . . . . . . . . . . . . . . 28
3.3.1 Algoritmul de criptare . . . . . . . . . . . . . . . . . . 28
3.3.2 Procesul de decriptare . . . . . . . . . . . . . . . . . . 30
3.4 Siguranţa sistemului . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Analiza teoretică a securităţii sistemului . . . . . . . . 31
3.4.2 Metode de ı̂mbunătăţire a securitătı̂i sistemului . . . . 32
4 Concluzii 35
A Coduri Huffman 39
B Construcţia unei tabele de parsare 41
C Exemplu de aplicare a criptării/decriptării 51
3
4 CUPRINS
Capitolul 1
Introducere
1.1 Prezentarea lucrării

Această lucrare tratează ascunderea informaţiei folosind gramatici de tip
LR(k). Deşi criptosistemul prezentat poate fi folosit şi pentru criptare efi-
cientă, am preferat să păstrez ı̂ncadrarea iniţială dată ı̂n [Way96], deoarece
mi se pare mai potrivită.
Deoarece ı̂n descrierea criptosistemului folosesc elemente din teoria lim-
bajelor formale - gramatici de tip LR(k) - şi din teoria codurilor - coduri
Huffman -, am ales să prezint aceste elemnte ı̂n cadrul ı̂n care sunt definite,
prezentând doar rezultatele şi algoritmii care i-am folosit ı̂n aplicaţia demon-
strativă. De aceea capitolul II, intitulat Preliminarii teoretice descrie
aceste elemente pe care se bazează criptosistemul.
Capitolul III este destinat criptosistemului. Prezint mai ı̂ntâi un cripto-
sistem simplu, cu câteva inconveniente, apoi arăt cum se poate extinde astfel
ı̂ncât să fie eliminate acele inconveniente. În finalul capitolului, dau nişte
rezultate teoretice privind securitatea sitemului.
În capitolul IV fac descrierea aplicaţiei, indicând algoritmii folosiţi, pre-
cum si modul de utilizare al aplicaţiei.
În sfârşit, ı̂n capitolul V prezint câteva concluzii asupra criptosistemului,
precum şi metode de ı̂mbunătăţire şi diversificare.
Dar, mai ı̂ntâi, să trecem ı̂n revistâ cateva metode de ascundere a informaţiei
utilizate de-a lungul timpului.
1.2 Scurtă istorie a steganografiei

Cuvântul steganografie provine de la grecescul steganos care ı̂nseammnă
ascuns (secret) şi graphein care ı̂nseamnă reprezentare grafică (scriere)şi,
5
6 CAPITOLUL 1. INTRODUCERE
tradus astfel, steganografia inseamnă scriere ascunsă, şi acesta este sensul
folosit ı̂n ziua de azi, adică scriere care nu este vizibilă unui observator oare-
care. De exemplu, scrierea de către copii a mesajelor cu ”cerneală simpatică”
este un exemplu de steganografie deoarece scrierea este ascunsă ı̂n sensul că
nu poate fi citită decât de cineva care ştie să o caute.
Dar sub această denumire, se găseşte o gamă largă de metode secrete de a
comunica. Inafară de cerneala invizibilă, mai sunt micropuncte (folosite in al
II-lea război mondial), rearanjarări ale caracterelor (altele decât permutările
şi substituţiile folosite ı̂n criptografie), semnături digitale, canale ascunse,
cominicaţii spread-spectrum (bazate pe ı̂mprăştierea semnalului).
,,Staganografia este arta şi ştiinţa comunicării ı̂ntr-un fel ı̂n care se as-
cunde existenţa comunicării. În contrast cu criptografia, ı̂n care inamicului
ı̂i este permis să detecteze, intercepteze şi să modifice mesaje, fără a putea
ı̂ncălca anumite premize de securitate garantate de un anumit criptosistem,
scopul steganografiei este de a ascunde mesaje ı̂n alte mesaje inofensive astfel
ı̂ncât să nu-i permită inamicului nici măcar să detecteze existenţa unui mesaj
ascuns.” (Markus Kuhn)[SH]
Unul dintre primele documente care atestă folosirea procedeelor steganografice
se găseşte ı̂n Istoriile lui Herodot. In Grecia antică, textul se scria pe plăcuţe
acoperite cu ceară. În una din povestiri, Demeratus voia să anunţe Sparta de
intenţiile lui Xerxes (ı̂mpăratul Persiei) de a invada Grecia. Pentru a evita
capturarea mesajului, el a răzuit ceara de pe plăcuţe şi a scris mesajul direct
pe lemn, apoi a acoperit din nou plăcuţele cu ceară. Astfel, tăbliţele păreau
goale şi nefolosite şi au trecut de inspecţia santinelelor fără ı̂ntrebări.
Altă metodă ingenioasă consta ı̂n următoarele: mesagerul era ras ı̂n cap şi
se scria mesajul pe pielea capului sau. Astfel, mesajul rămânea de nedetectat
până când mesagerul era din nou ras ı̂n cap.
Vechii chinezi, foloseau de asemenea o metodă ce implica ceara: mesajul
era scris pe mătase fină, care era apoi introdusă ı̂ntr-o bilă, acoperită cu ceară
şi ı̂nghiţită de mesager.
Cerneala invizibilă (simpatică) a fost folosită timp de secole de majori-
tatea civilizaţiilor fiind folosită cu succces şi ı̂n al II-lea război mondial.
Surse obişnuite de cerneală invizibilă sunt laptele, oţetul, sucurile de fructe şi
urina. Toate acestea se ı̂nnegresc la căldură. Metodele moderne care implică
cerneală invizibilă sunt mult mai complexe şi pentru obţinerea mesajului sunt
necesare procedee asemănătoare developării.
Odată cu tehnologia informaţiei şi informaţia digitală, steganografia şi-a
găsit locul ı̂n semnături digitale (care presupun ascunderea informaţiei ı̂n
date, fără a perturba prea mult ı̂ntelesul acestora).
Ascunderea informaţiei se poate ı̂n imagini (pe bitul cel mai puţin semni-
ficativ al culorilor, la imagini arhivate, etc.), ı̂n arhive, ı̂n fişiere executabile
1.2. SCURTĂ ISTORIE A STEGANOGRAFIEI 7
(asemănător viruşilor).
În al II-lea razboi mondial, germanii au descoperit tehnologia Mikrat
(micro-punct)[MD] care constă ı̂n proiectarea unei imagini ı̂ntr-o altă imag-
ine, mult micşorată de mărimea unui punct tipografic. Referindu-se la această
tehnică, directorul FBI J. Edgar Hoover o denumea ”capodopera spionajului
inamic”.
Comunicarea spread-spectrum (prin ı̂mprăştierea semnalului) [SS]presupune
existenţa unei game largi de canale de comunicaţie (de exemplu bandă ra-
dio) şi constă de exemplu ı̂n transmiterea de pachete mici aleator pe diferite
canale, sincronizarea făcându-se cu ajutorul unui generator de numere pseudo-
aleatoare.
O altă metodă, care e refolosită sub diverse forme şi astăzi este sistemul
de criptare folosit de cardinalul Richelieu care consta ı̂ntr-un şablon care se
aşeza peste foaia de hârtie, apoi se scrie ı̂n găurile şablonului mesajul, după
care se ı̂ndepărtează şablonul şi se completează foaia astfel ı̂ncât să rezulte
un mesaj inofensiv.
Putem include aici şi mesajele care ascund după o anumită regulă litere
ı̂n cuvintele unui text, spre exemplu ı̂n prima sau a doua literă din fiecare
cuvânt. Mesajul din exemplul următor a fost trimis de un spion german in
al II-lea război mondial:
Apparently neutral’s protest is thoroughly discounted and ig-

nored. Isman hard hit. Blockade issue affects pretext for embargo
on by products, ejecting suets and vegetable oils.
Dacă selectăm a două literă din fiecare cuvânt, mesajul obţinut este
Pershing sails from NY June 1.
De asemenea, se pot ascunde mesaje si prin aşezarea ı̂n pagină sau spaţierea
unui text. De exemplu, să zicem că avem un mesaj M 1 ı̂n care dorim să
evidenţiem nişte cuvinte. pentru aceasta creem mesajul M 2 care este M 1 ı̂n
care am marit puţin spaţiul din faţa cuvintelor ce trebuie evidenţiate şi l-am
micşorat pe cel de dupa la fel de puţin. In acest fel, prin suprapunerea celor
2 texte, textul rezultat va avea ı̂ngroşate acele cuvinte.
Exemplu: Fie mesajele:
Cerneala invizibilă (simpatică) a fost folosită timp de

secole de majoritatea civilizaţiilor fiind folosită cu succces şi ı̂n
al doilea război mondial.
şi
8 CAPITOLUL 1. INTRODUCERE

Prin suprapunerea celor două mesaje se obţine următorul mesaj:

ı̂n care dacă citim literele ı̂ngroşate ı̂n ordine obţinem numele Claudia.
Capitolul 2
Preliminarii teoretice
În acest capitol voi defini câteva din elementele matematice care stau la
baza sistemului de criptare propus. Ele fac parte fie din teoria limbajelor
formale (gramaticile de tip LR(k)), fie din teoria codurilor şi a compresiei
de date (arbori Huffman şi coduri Huffman). Le voi prezenta pe amândoua
acordându-le importanţă egală ı̂n cele două secţiuni ce urmează.
2.1 Gramatici
Definiţia 1.1 (V ∗ ):
Dată fiind o mulţime V numită alfabet, se defineşte V ∗ ca fiind monoidul
liber generat de V cu operaţia de concatenare. Elementele lui V ∗ se numesc
cuvinte peste alfabetul V şi sunt alaturări oarecare de simboluri din V .
Pentru w ∈ V ∗ , prin |w| ı̂ntelegem lungimea cuvăntului w (numărul de sim-
boluri care ı̂l formează.
Elementul neutru faţă de operaţia de concatenare se notează cu λ şi este

cuvăntul vid.
Notaţia αβ, unde α, β ∈ V ∗ ı̂nseamnă şirul obţinut prin concatenarea celor
două şiruri.
2.1.1 Gramatici independente de context
Definiţia 1.2 (Gramatică independentă de context):

O gramatică independentă de context este un cvadruplu (N, Σ, S, P ), unde:
N este o mulţime finită de simboluri, numite simboluri neterminale (vari-
abile)
9
10 CAPITOLUL 2. PRELIMINARII TEORETICE
Σ este o mulţime finită de simboluri numite simboluri terminale (alfabet)
S este un simbol din N , numit simbolul de start
P este o mulţime de perechi (A, α), unde A ∈ N şi α ∈ (N ∪ Σ)∗ . O astfel

de pereche se numeşte producţie şi se notează cu A −→ α.
Pe parcursul acestei lucrări, voi folosi litere mici de la ı̂nceputul alfa-

betului (a, b, c, ...) pentru a nota elementele din Σ (terminalele) şi litere mari
(A, B, C, S, ...) pentru elementele din N (variabilele). Pentru elemente din
(N ∪ Σ)∗ voi folosi litere greceşti mici (α, β, γ) iar pentru elemente din Σ∗
(cuvintele) voi folosi litere mici de la sfarşitul alfabetului (w, x, y, ...).
Definiţia 1.3 (derivare):

Fie G = (N, Σ, S, P ) o gramatică independentă de context şi α, β ∈ (N ∪Σ)∗ .
Spunem că α derivează ı̂n β (şi notăm cu α =⇒ β) dacă ∃A ∈ N , α1 , α2 , β1 ∈
(N ∪ Σ)∗ a.ı̂. α = α1 Aα2 , β = α1 β1 α2 şi A −→ β1 ∈ P
∗
Notăm cu =⇒ ı̂nchiderea reflexivă şi tranzitivă a relaţiei =⇒ (corespunzând
+
derivării ı̂n mai multi paşi) şi cu =⇒ ı̂nchiderea tranzitivă a relaţiei =⇒ (core-
spunzând derivării ı̂n cel puţin un pas).
∗
Pentru a fi mai expliciţi, α =⇒ β dacă există derivările
α =⇒ α1 =⇒ α2 ... =⇒ αn =⇒ β
+
cu n ≥ 0 iar la α =⇒ β, diferenţa este că n ≥ 1.
Definiţia 1.4 (Şir generat de o gramatică):

Fie G = (N, Σ, S, P ) o gramatică independentă de context şi w ∈ Σ∗ . Spunem
∗
că gramatica G generează şirul w dacă există derivarea S =⇒ w
Definiţia 1.5 (Arbore asociat unei derivări):

Fiecarei producţii A −→ w0 X1 w1 X2 ...Xn wn , A ∈ N , wi ∈ Σ∗ , i = 0, n şi
Xj ∈ N , j = 1, n i se poate asocia un arbore avănd rădăcina etichetată cu A
şi frunzele cu wi , i = 0, n respectiv Xj , j = 1, n.
∗
În acelaşi fel asociem prin extensie ficărei derivări S =⇒ w un arbore de
derivare cu rădăcina etichetată cu S, nodurile etichetate cu neterminale
şi frunzele etichetate cu şiruri de terminale astfel ı̂ncât subarborele format
dintr-un nod şi descendenţii săi direcţi să fie arborele producţiei care s-a
folosit la derivare.
2.1. GRAMATICI 11
Definiţia 1.6 (Limbaj generat de o gramatică):

Numim limbaj generat de o gramatica G = (N, Σ, S, P ) (şi notăm L(G)
mulţimea tuturor şirurilor care pot fi generate de gramatică, adică
∗
L(G) = {w ∈ Σ∗ |S =⇒ w}
Definiţia 1.7 (Gramatică ambiguă):

Fie G = (N, Σ, S, P ) o gramatică independentă de context. Spunem că G este
ambiguă dacă ∃w ∈ L(G) pentru care există doi arbori de derivare distincţi.
În caz contrar, spunem că gramatica este neambiguă.
Deoarece pentru sistemul de criptare propus ne interesează ca fiecare şir

generat de gramatică să aibă un unic arbore de derivare, căt si ca descoperirea
acelui unic arbore să se facă ı̂ntr-un timp rezionabil de mic.
Gramaticile LR(k) ofera acest lucru, adică condiţia de neambiguitate şi
gasirea arborelui de derivare in ordin de timp liniar faţă de mărimea şirului
de intrare.
2.1.2 Gramatici de tip LR(k)

Mai ı̂ntâi voi da ı̂ncă câteva definiţii pregătitoare:
Definiţia 1.8 (derivare dreaptă):

Fie G = (N, Σ, S, P ) o gramatică independentă de context şi α = α1 Aw ∈
(N ∪ Σ), unde A ∈ N şi w ∈ Σ∗ . Spunem că α =⇒ β dacă şi numai dacă
d.d.
∃A −→ β1 ∈ P a.ı̂. β = α1 β1 w (i.e. β a fost obţinut din α prin derivarea
celui mai din dreapta neterminal).
∗ +
Notăm cu =⇒ şi cu =⇒ ı̂nchiderile corespunzătoare ale relatiei =⇒.
d.d. d.d. d.d
Se poate observa că şirul de derivări drepte prin care este obţinut un
cuvânt este dat de parcurgerea in postordine a arborelui de derivare asociat
cuvântului.
Definiţia 1.9 (F irstk ):

Fie G = (N, Σ, S, P ) o gramatică independentă de context şi α ∈ (N ∪ Σ)∗ .
Atunci:
∗ ∗
F irstk (α) = {w ∈ Σ∗ ||w| < k şi α =⇒ w sau |w| = k şi α =⇒ wx}
Din definiţie se poate observa că F irst0 (α) = λ, ∀α ∈ (N ∪ Σ)∗ .

Vom mai avea nevoie de următoarea definiţie:
Definiţia 1.10 (Σ∗k ):

Fie Σ un alfabet. Atunci Σ∗k = {w ∈ Σ∗ ||w| ≤ k}
Dăm acum definiţia gramaticilor de tip LR(k):
Definiţia 1.11 (Gramatici de tip LR(k)):

Fie G = (N, Σ, S, P ) o gramatică independentă de context ı̂n care sim-
bolul de start nu apare ı̂n membrul drept al niciunei producţii. Spunem
că G este gramatică de tip LR(k), k ≥ 0, dacă oricare ar fi derivările
∗ ∗
drepte S =⇒ αAw =⇒ αβw şi S =⇒ γBx =⇒ αβy astfel ı̂ncât F irstk (w) =
d.d. d.d. d.d. d.d.
F irstk (y), atunci α = γ, A = B şi x = y.
Se observă că din γBx =⇒ αβy rezultă că există B −→ δ şi γδx = αβy,
d.d.
adică δ = β.
Intuitiv, dacă αβw şi αβy sunt obţinute prin derivări drepte şi avem
F IRSTk (w) = F IRSTk (y) şi dacă A −→ d.d.
β este ultima producţie folosită
ı̂n obţinerea lui αβw prin derivări drepte, atunci producţia A −→ d.d.
β tre-
buie folosită şi pentru a reduce αβw (la αAy) la parsare. Deoarece A de-
rivă ı̂n β independent de w, condiţia din definiţie spune că există suficientă
informaţie ı̂n F IRSTk (w) pentru a determina că αβ a fost derivat din αA.
Când parsăm, nu poate exista confuzie despre cum ar trebui să reducem o
producţie obţinută prin derivări drepte.
Condiţia ca S să nu apară ı̂n membrul drept al unei producţii a fost pusă
pentru a putea determina ı̂n timpul parsării dacă acceptăm şirul de intrare
când obţinem un S (ı̂n urma unei reduceri).
În general, gramaticile independente de context nu conţin suficientă informaţie
ı̂n F IRST (k) pentru a determina din ce a fost derivat şirul pe care ı̂l ex-
aminăm. Mai mult, aceste gramatici pot fi ambigue, pe când gramaticile
LR(k) nu.
Pentru a arăta că restricţia ca simbolul de start nu apare ı̂n dreapta nici
unei producţii nu restrânge din generalitate, dăm următoarea definiţie:
Definiţia 1.12 (Extensia unei gramatici independente de context):

Fie G = (N, Σ, P, S) o gramatică independentă de context. Extensia gra-
maticii G se defineşte ca fiind
G0 = (N ∪ {S 0 , Σ ∪ {$}, S 0 , P ∪ {S 0 S$}}
unde S 0 , $ nu aparţin mulţimii N ∪ Σ.

2.1. GRAMATICI 13
Gramatica extinsă G0 este aproape G, având ı̂n plus o nouă producţie

de start S 0 S$. Presupunem că S 0 S$ este producţia cu indexul 0 ı̂n G0 şi
că celelalte producţii ale lui G sunt numerotate 1, 2, ..., p. Am adăugat o
nouă producţie de start pentru ca, atunci când se cere o acţiune de reducere
folosind o producţia cu indexul 0, să putem interpreta această ”reducere” ca
un semnal de acceptare.
Este evident că w ∈ L(G) ⇐⇒ w$ ∈ L(G0 ) Putem, deci, presupune că
ı̂ntr-o gramatică simbolul de start nu apare ı̂n membrul drept al nici unei
producţii, fără ca aceasta să ne restrângă generalitatea.
Exemple:
Fie gramatica G:
S −→ AB
A −→ a
B −→ CD|aE
C −→ ab
D −→ bb
E −→ bba.
G nu este LR(1), deoarece avem derivările (ı̂n gramatica extinsă):
S 0d.d. S =⇒ AB =⇒ ACD =⇒ ACbb =⇒ Aabbb şi
d.d. d.d. d.d. d.d.
S 0d.d. S =⇒ AB =⇒ AaE =⇒ Aabba
d.d. d.d. d.d.
Dacă luăm şirul Aabw nu putem determina dacă el a fost obţinut din ACw
sau nu uitându-ne la primul simbol din w. Totuşi, G este LR(2).
Fie gramatica G:
S −→ Ab|Bc
A −→ Aa|λ
B −→ Ba|λ
G nu este LR(k) oricare ar fi k, deoarece avem următoarele derivări drepte:
∗
S 0d.d. S =⇒ Aak b =⇒ ak b
d.d. d.d.
∗
S 0d.d. S =⇒ Bak c =⇒ ak c
d.d. d.d.
Aceste derivări respectă ipotezele definiţiei unei gramatici LR(k), cu α = λ,
β = λ, w = ak b, γ = λ şi y = ak c. Totuşi, avem A 6= B, deci G nu este
LR(k)∀k ∈ IN
Totuşi, gramatica de mai sus nu este ambiguă, ba chiar generează acelaşi
limbaj cu următoarea gramatică LR(0):
S −→ C|D
C −→ aC|b
D −→ aD|c
Definiţia 1.13 (Analiză sintactică):
Fie G = (N, Σ, S, P ) o gramatică independentă de context şi w ∈ Σ∗ . A
analiza sintactic w ı̂nseamnă a arăta algoritmic dacă w ∈ L(G). E de ı̂nteles

că, ı̂n acest caz se obţin şi derivările prin care este obţinut w.
Un astfel de algoritm care face analizaza sintactică se mai numeşte şi parser.
2.1.3 Algoritm de parsare pentru gramatici de tip LR(k)

Pentru fiecare gramatică LR(k) G = (N, Σ, S, P ) poate fi construit un
parser determinist. Acest parser va avea o mulţime de stări şi două tabele
de parsare, numite actiune şi goto. Tabela actiune ne va spune la fiecare
pas dacă trebuie să facem o acţiune deplasare (adică să avansăm ı̂n şirul de
intrare) sau una de reducere, iar ı̂n cazul unei acţiuni de reducere, ne spune
ce producţie s-a folosit pentru derivare.
Tabela actiune este definită pe mulţimea stărilor şi Σ∗k şi pentru o stare
s şi un cuvânt u poate avea valorile deplasare care spune că se avansează ı̂n
şirul de parsat, eroare, acceptare sau un numar j care desemnează producţia
care se reduce.
Tabela goto este definită pe mulţimea stărilor şi Σ şi pentru o stare s şi
o literă a poate avea valoarea eroare sau un număr i desemnând starea ı̂n
care se va trece din starea s la ı̂ntâlnirea literei a.
Aceste două tabele definite, algoritmul de parsare este relativ simplu. El
este asociat unei gramatici extinse. Algoritmul lucrează cu triplete de forma
(S, W, π), unde S este stiva de lucru ce conţine stările şi literele/neterminalele
care au produs aceste stări, W este cuvântul care a rămas de parsat şi π stiva
producţiilor care au fost reduse (stiva de ieşire). La sfârşitul algoritmului,
dacă se termină cu acceptarea cuvântului, şirul din buffer-ul de ieşire este
derivarea dreaptă a cuvântului de intrare relativ la gramatica iniţială (ig-
norând simbolul $).
Algoritmul 1.1: parsare(z, G, actiune, goto, π) Algoritmul testează apartenenţa

cuvântului z la limbajul generat de gramatica G şi determină o derivare
dreaptă a acestuia ı̂n caz afirmativ.
Intrare: z = a1 . . . an cuvânt, G gramatică LR(k), actiune şi goto tabelele

de parsare associate lui G.
Iesire: dacă avem acceptare procedura returneaza adevarat şi π este derivarea
dreaptă a lui z.
Algoritmul actionează ca un automat, folosind două stive, ı̂n felul următor
Configuraţia iniţială (0, z$, λ)

2.1. GRAMATICI 15
pentru o configuraţie (sS, aW, π). fie u, format din primele (cel mult)k
simboluri ale lui aW .
(sS, aW, π) ` (s0 asS, W, π)

dacă actiune(s, u) = deplasare şi s0 = goto(s, a).
(sS, aW, π) ` (tAs0 S 0 , aW, iπ)

dacă actiune(s, u) = i şi producţia i este A −→ α iar s0 S 0 e
obtinut din sS prin scoaterea a 2 | α | simboluri şi t = goto(s0 , a)
(sS, aW, π) ` acceptare

dacă actiune(s, u) = acceptare
(sS, aW, π) ` eroare

dacă actiune(s, u) = eroare
Cel mai simplu mod de a arăta cum funcţionează un parser LR(k) este
printr-un exemplu, ı̂n care avem deja construite tabelele actiune şi goto.
Procedeul de construire al acestor tabele ı̂l vom explica mai jos.
Gramatica care generează limbajul expresiilor aritmetice simple cu nu-
mere naturale separate de ’;’este LR(1). Definiţia gramaticii, şi tabelele,
actiune şi goto, sunt destul de elaborate şi le-am inclus ı̂n anexa 2.1.3.
Algoritmul procedează astfel: Extrage câte k litere din şirul de intrare
(fie u acest şir) şi aplică funcţia actiune perechii (s, u), unde s este starea
din capătul stivei stărilor. Dacă rezutatul este eroare, atunci algoritmul se
opreşte. Dacă rezultatul este i, iar regula i este A −→ α atunci se scot 2 | α |
simboluri din stivă stărilor. Această regulă se aplică până când nu mai avem
reduceri de făcut.
Şi pentru reducere şi pentru deplasare, se aplică funcţia goto primului
simbol din u (fie el u1 ) şi primei stări din stivă, apoi u1 şi starea obţinută se
adaugă stivei.
Pentru gramatica dată ca exemplu şi şirul de intrare 1 + 0$, algoritmul
de parsare va funcţiona astfel:
Starea curentă a automatului Se reduce

(s0 , 1 + 0$, λ)
` (s10 1s0 , +0$, λ)
` (s11 C1 s0 , +0$, P15 ) C1 −→ 1
` (s51 N0 s11 C1 s0 , +0$, P12 P15 ) N0 −→ λ
` (s12 N s0 , +0$, P9 P12 P15 ) N −→ C1 N0
` (s14 F s0 , +0$, P8 P9 P12 P15 ) F −→ N
` (s15 T s0 , +0$, P6 P8 P9 P12 P15 ) T −→ F
` (s16 Es0 , +0$, P4 P6 P8 P9 P12 P15 ) E −→ T
` (s20 + s16 Es0 , 0$, P4 P6 P8 P9 P12 P15 )
` (s1 0s20 + s16 Es0 , $, P4 P6 P8 P9 P12 P15 )
` (s12 N s20 + s16 Es0 , $, P10 P4 P6 P8 P9 P12 P15 ) N −→ 0
` (s14 F s20 + s16 Es0 , $, P8 P10 P4 P6 P8 P9 P12 P15 ) F −→ N
` (s21 T s20 + s16 Es0 , $, P6 P8 P10 P4 P6 P8 P9 P12 P15 ) T −→ F
` (s16 Es0 , $, P3 P6 P8 P10 P4 P6 P8 P9 P12 P15 ) E −→ E + T
` (s17 S1 s0 , $, P2 P3 P6 P8 P10 P4 P6 P8 P9 P12 P15 ) S1 −→ E
` (acceptare, P2 P3 P6 P8 P10 P4 P6 P8 P9 P12 P15 )
Ultima componentă a unei stări a parserului reprezintă şirul de derivări
drepte necesar pentru a obţine din şirul de simboluri de pe stivă şirul de
intrare parsat. Astfel, la sfârsit avem pe stivă simbolul E, din care obţinem
şirul iniţial de intrare (a+a∗a) prin aplicarea, pe rând, a regulilor 1,3,6,4,6,2,4
şi 6 ı̂n derivare dreaptă.
Construcţia tabelelor actiune şi goto

În această secţiune voi arăta cum se pot construi cele două tabele care
stau la baza parserului LR(k). Pentru aceasta, sunt necesare câteva definiţii:
Fie G = (N, Σ, P, S) o gramatică independentă de context.
Definiţia 1.14 (Prefix viabil):

∗
Fie S =⇒ αAw =⇒ αβw (rezultă w ∈ Σ∗ o derivare dreaptă ı̂n G. Spunem
d.d. d.d
că şirul γ este un prefix viabil al lui αβw dacă γ este un prefix al lui αβ.
Definiţia 1.15 (Configuraţie LR(k)):

Fie G0 ” extensia lui G. Numim configuraţie LR(k) o regulă de forma
(A −→ α.β; u), unde A −→ αβ ∈ P şi u ∈ Σ∗k .
u se numeşte simbol lookahead
Definiţia 1.16 (Configuraţie LR(k) validă):

Spunem că configuraţia LR(k) (A −→ α.β; u) este validă pentru prefixul via-
2.1. GRAMATICI 17
∗
bil αβ, dacă există o derivare S =⇒ αAw =⇒ αβγw astfel ı̂ncât u = F IRSTk (w$).
d.d. d.d.
Definiţia 1.17 (Închiderea unei mulţimi de configuraţii LR(k)):

Definim ı̂nchiderea unei mulţimi I de configurţii LR(k) ca fiind multimea J
rezultată ı̂n urma aplicării următorului algoritm.
Algoritmul 1.2: Inchidere Închiderea unei mulţimi de configuraţii LR(k)
Intrare: I - mulţime de configuraţii LR(k)
Iesire: J - inchiderea mulţimii I
J ←− I
repetă
pentru ∀A −→ α.Bβ; u ∈ J, B ∈ N
pentru ∀B −→ γ ∈ P
pentru ∀v ∈ F irstk (βu)
J ←− J ∪ {B −→ .γ; v}
până când nu se mai adugă configuraţii noi
Următorul algoritm produce la ieşire mulţimea de configuraţii ı̂n care

se poate ajunge dintr-o mulţime I iniţială prin avansarea peste un termi-
nal/neterminal. Algoritmul foseşte procedura Inchidere.
Algoritmul 1.3: GOT O(I, X)
Intrare: I - mulţime de configuraţii LR(k), X ∈ N ∪ Σ
Iesire: J
J ←− {A −→ αX.β; u|A −→ α.Xβ; u ∈ I}
J ←− Inchidere(I)
Iar acum, definim mulţimile canonice LR(k) asociate gramaticii extinse

0
G ” ca fiind ieşirea următorului algoritm.
Algoritmul 1.4: conf ig(G0 )

Intrare: I - mulţime de configuraţii LR(k), X ∈ N ∪ Σ

Iesire: C - mulţimea mulţimilor canonice
C ←− {inchidere({S 0 −→ .S; $})}
repetă
pentru ∀I ∈ C
pentru ∀X ∈ N ∪ Σ
dacă GOT O(I, X) 6= Ø şi GOT O(I, X) 6∈ C
C ←− C ∪ {GOT O(I, X)}
până când nu se mai adaugă noi mulţimi de configuraţii
Acest algoritm produce o mulţime de configuraţii pe care o vom numerota:
C = {I0 , I1 , . . . , In }
unde I0 corespundere ı̂nchiderii mulţimii {S 0 −→ .S; $}. La această mulţime
de configuraţii asociem o mulţime de stări S{0, ∞, . . . , \} ı̂n care fiecare stare
s ∈ S i se asociază muţimii de configuraţii Is .
Înainte de a arăta algoritmul de construire a tabelelor actiune şi goto,
mai aven nevoi de o definitie:
Definiţia 1.18 (Funcţie F IRST fără λ):

Funcţia F IRST fără λ (F F LG
k (α)) se defineşte astfel:
(1) Dacă α nu ı̂ncepe cu un neterminal, atunci F F Lk (α) = F IRSTk (α)
(2) Dacă α ı̂ncepe cu un neterminal, atunci
∗
F F Lk (α) = {w | w ∈ F IRSTk (α) şi există o derivare α =⇒ β =⇒ wx, unde
d.d. d.d
β 6= Awx oricare ar fi A un neterminal}
Definiţia 1.19 (tabelele actiune şi goto):

Fie G o gramatică independentă de context, fie S mulţimea de stări ale lui
G determinată ı̂n urma algoritmului conf ig(G0 ) şi l : P −→ IN funcţia care
asociază numere producţiilor. Se definesc funcţiile a şi g astfel:
a : S × Σ∗k −→ l(P ) ∪ {deplasare, acceptare, eroare}


 l(A −→ α) dacă A −→ α.; u ∈ Ik şi A 6= S 0

deplasare dacă A −→ α.β; v ∈ Ik , β 6= λ şi u ∈ F F Lk (βv)
a(k, u) =

 acceptare dacă S 0 −→ S.; $ ∈ Ik

eroare altfel
g : S × Σ ∪ N −→ S ∪ {eroare}
2.2. GRAMATICI PONDERATE 19
½
j dacă GOT O(Ik , X) = Ij
g(k, X) =
eroare altfel
Dacă funcţiile a şi g sunt bine definite (nu au ieşiri multiple pentru aceeaşi
intrare, definim tabelele actiune şi goto ca fiind graficele respectiv ale lui a şi
g.
Consideraţii teoretice
Pentru demonstraţiile acestor rezultate, vezi [AU72]
Teorema 1.1: O gramatică G = (N, Σ, S, P ) este LR(k) dacă şi numai

dacă următoarea condiţie este valabilă ∀u ∈ Σ∗k . Fie αβ un prefix viabil al lui
αβw, unde αβw a fost obţinut prin derivări drepte (ı̂n gramatica augmentată
G0 ). Dacă producţia cu punct [A −→ β., u] este validă pentru αβ, atunci nu
există o altă producţie cu punct [A1 −→ β1 .β2 , v] care să fie validă pentru
αβ, cu u ∈ F F Lk (β2 v).
Această teoremă ne asigură că o gramatică este LR(k) dacă şi numai dacă
tabelele actiune şi goto pot fi create.
Teorema 1.2: Algoritmul 1.4 determină ı̂n mod corect mulţimea mulţimilor
canonice.
Teorema 1.3: Algoritmul 1.1 determină ı̂n mod corect o derivare dreaptă
a şirului de intrare, dacă există una, sau se termină cu eroare altfel.
2.2 Gramatici ponderate

În vorbirea curentă anumite sintagme apar mai des, ı̂n funcţie de specificul
textului, patricularităţile persoanei care ı̂l scrie precum şi alţi factori. Pot fi
incluse aici ticurile verbale, precum şi exclamaţii şi interjectii care apar mai
des (de exemplu ı̂n cadrul unui meci de fotbal). De asemenea, ı̂n descrierea
unei scene de luptă să zicem dintr-un film, este natural să apară mai des
numele personajul principal.
De aceea, atunci când incercăm modelarea limbajului natural folosind
gramatici, este natural să ı̂ncercăm să modelăm şi acest aspect, folosind
probabilităti (ponderi) asociate producţiilor care să ajute la generarea de
text statistic asemănător cu realitatea.
Definiţia 2.20 (gramatică ponderată):

Se numeşte gramatică ponderată asociată unei gramatici independente de
context G = (N, Σ, S, P ) perechea GP = (G, p), unde p : P −→ <, unde
p((A, α)) este ponderea asociata producţiei A −→ α şi influenţează (prin
mărime) alegerea lui α in derivarea variabilei A.
Prin normalizare, se poate da o semnificaţie de probabilitate ponderii

asociate unei producţii.
Definiţia 2.21 (gramatică ponderată normalizată):

Se numeşte gramatică ponderată normalizată asociată lui G gramatica pon-
derată GP = (G, p) având următoarea restricţie:
X
∀A ∈ N, pA,α = 1
(A,α,pA,α )∈P 0
. În acest caz, pA, α reprezintă probabilitatea ca la derivarea variabilei A să

se foloseasca producţia A −→ α.
2.3 Coduri Huffman

Codurile Huffman reprezintă o tehnică foarte utilizată şi eficientă ı̂n com-
presia de date. Ideea de bază este utilizarea unei modalităţi optime pen-
tru reprezentarea fiecărui caracter sub forma unui şir binar, ı̂n funcţie de
frecvenţa acestuia.
Voi expune mai ı̂ntâi cateva noţiuni pregătitoare din teoria codurilor (din
[Ata01]), apoi voi da algoritmii pentru crearea şi folosirea codurilor Huffman
(din [CLR90]).
2.3.1 Codificare
Definiţia 3.22 (Codificare):

Fiind date mulţimile A (alfabetul sursă) şi B (alfabetul cod), o codificare
este o aplicaţie injectivă K : A −→ B ∗ .
Elementele mulţimii K(A) ⊆ B ∗ se numesc cuvinte-cod, iar K(A) se

numeşte cod.
Dacă B are numai două simboluri, codificarea K se numeş te binară.
2.3. CODURI HUFFMAN 21
Definiţia 3.23 (Codificare a mesajelor):

Pentru o codificare K : A −→ B ∗ , se numeş te codificare a mesajelor
(textului) sursa aplicaţia K ∗ : A∗ −→ B ∗ definita recursiv prin:
• K ∗ (λ) = λ (λ este cuvântul vid);
• K ∗ (aα) = K ∗ (a)K ∗ (α), ∀a ∈ A, α ∈ A∗ .
Definiţia 3.24 (Codificare unic decodabilă):

Codificarea K este unic decodabilă dacă K ∗ este injectivă.
Definiţia 3.25 (Codificare prefix (instantanee)):
1. O codificare K : A −→ B ∗ se numeşte instantanee dacă K(A) are

proprietatea prefixului (dacă α, αβ ∈ K(B) atunci β = λ).
Observăm că o codificare prefix este evident unic decodabilă (din definiţie).
Avantajul codurilor instantanee este acela că dacă se cunoaşte dinainte
frecvenţa simbolurilor sursă, atunci simbolurile sursă care apar mai frecvent
pot fi codificate cu cuvinte cod mai scurte, realizăndu-se astfel o codificare
mai eficientă (cerinţă ı̂n compresia de date). O astfel de codificare eficientă
este realizată de codurile Huffman.
Coduri Huffman
Definiţia 3.26 (Sursă de informaţie):

O sursă de informaţie este o pereche S = (A, P ) unde
A = {a1 , a2 , . . . , an } este alfabetul sursă (mulţime ordonată);
P = {P (a1 ), P (a2 ), . . . , P (an )} este mulţimea ordonată a probabilităţilor

elementelor lui A, deci
0 ≤ P (ai ) ≤ 1, (1 ≤ i ≤ n);
Pn
P (ai ) = 1.
i=1
Fie K o codificare a unei surse de informaţie. Dacă se notează cu di =

|K(ai )| (|α| reprezintă lungimea secvenţei α), se poate defini lungimea medie
L a cuvintelor cod prin
Xn
L= di P (ai ).
i=1
O codificare este eficientă dacă lungimea medie a secvenţelor cod este cât
mai mică.
Definiţia 3.27 (Cod Huffman):

Fiind dată o sursă de informaţie S şi un alfabet cod, un cod Huffman este
un cod instantaneu având lungimea medie minimă.
Lungimea medie minimă a unui cod Huffmann se notează cu Lmin (S).
2.3.2 Construcţia codurilor Huffman

Construcţia codurilor Huffman binare se face pornind de la următoarea
observaţie: O sursă cu două simboluri are evident un cod Huffman de cuvinte
cod {0, 1} (şi deci Lmin (S) = 1).
O sursă cu trei simboluri {a1 , a2 , a3 } n care a1 are probabilitate maximă,
poate fi redusă la cazul a două simboluri {a1 , a2,3 } unde P (a2,3 ) = P (a2 ) +
P (a3 ). Pentru aceste două simboluri o codificare Huffman este K(a1 ) =
0, K(a2,3 ) = 1. De asemenea pentru sursa cu simbolurile {a2 , a3 } o codificare
Huffman este K(a2 ) = 0, K(a3 ) = 1. Combinând cele două rezultate obţinem
un cod Huffman pentru sursa originală:
a1 a2 a3
0 10 11
Bazat pe acest procedeu de compunere a unor codurilor Huffman mai
simple pentru a genera unul mai complex, se poate construi un algoritm
Greedy care construieşte o codificare Huffman.
Procedeul de construire.Se dau:
A - alfabetul
∀a ∈ A, P (c) probabilitatea/frecvenţa de apariţie a lui c
(A, P ) reprezintă sursa de informaţie.
Algoritmul 3.5: Huffman(A)
1 n ←− |A|
2 min-heap Q ←− A
2.3. CODURI HUFFMAN 23
3 pentru i ←− 1, n − 1
3.1 alocă nod z

3.2 extrage min Q ı̂n x
3.3 extrage min Q ı̂n y
3.4 z.f ius ←− x
3.5 z.f iud ←− y
3.6 P (z) ←− P (x) + P (y)
3.7 Q ←− z
4 return min(Q).
Algoritmul construieşte arborele binar corespunzător unei codificări Huff-

man. Construcţia este ”bottom-up”, având ca frunze simbolurile sursă. Co-
dul unui simbol a este dat de drumul de la rădăcina arborelui A păna la
frunza ce ı̂l reprezintă astfel:
Algoritmul 3.6: cod(a,A)
1 dacă a = root(A) return ””
2 p ←− parinte(a)
3 dacă a = f ius(p) return cod(p, A) + 0 00 altfel return cod(p, A) + 0 10
Deoarece toate caracterele sunt frunze in arborele codificării, codurile lor

nu pot fi prefixul codurilor altor caractere, deci avem de a face cu o codificare
prefix.
Prezentăm acum algoritmul care dintr-un şir de ’biţi’ extrage un caracter
incepând de la poziţia index şi avansează index-ul ı̂n mod corespunzător:
Algoritmul 3.7: getNextChar(index,A)
1 a ←− root(A)
2 cât timp a nu e frunză
2.1 dacă sir[index] = 0 00 atunci a ←− f ius(a) altfel a ←− f iud(a)

2.2 index ←− index + 1
3 return c
Cu aceşti trei algoritmi se poate realiza compresia/decompresia unui text.

Scopul nostru este ı̂nsă de a inversa procesul, folosind arborii Huffman pentru
a codifica producţiile corespunzătoare unei variabile, conform ponderilor lor,
şi de a genera text pornind de la o secvenţă de biţi căreia i se asociază o
producţie din gramatică.
Pentru demonstraţiile privind corectitudinea algoritmilor, vezi [CLR90].
Capitolul 3
Sistemul de criptare
Vom defini un sistem de ascundere a informaţiei bazat pe gramatici de tip

LR(k), prin elementele sale componente: mulţimea textelor clare, mulţimea
textelor criptate, mulţimea cheilor, precum şi funcţiile de criptare/decriptare.
De asemenea, vom prezenta un rezultat teoretic privind siguranţa sistemului.
3.1 Prezentarea sistemului

Voi prezenta mai ı̂ntâi un sistem simplu, care are limitări ı̂n privinţa
capacitătii de criptare. Apoi vom arăta cum se poate extinde pentru a elimina
aceste limitări.
Mai ı̂ntâi, asociem fiecărei variabile X dintr-o gramatică ponderată un
arbore Huffman având ca sursă de informaţie producţiile care au ca membru
stâng pe X şi probabilităţile asociate lor. Pentru variabilele care nu au decât
o producţie, arborele Huffman asociat lor nu va avea decât un nod (adică
rădăcina) (şi deci codificarea Huffman asociată lor va fi vidă).
Cheile de criptare
Începem cu cheile de criptare pentru că, aşa cum vom vedea, ele determină
mulţimea textelor clare. Mulţimea cheilor de criptare K este:
K = {(GP, H)}
unde GP = (G, p)) gramatică LR(k) ponderată şi H mulţimea codificărilor

Huffman ataşate variabilelor lui GP .
Putem impune condiţia ca gramatica GP să nu conţină producţii inuti-
lizabile (care nu apar ı̂n nici un arbore de derivare asociat lui G.
25
26 CAPITOLUL 3. SISTEMUL DE CRIPTARE
Textele criptate asociate unei chei

Mulţimea textelor criptate pentru o cheie k = (G, H) ∈ K este mulţimea
tuturor şirurilor care se pot genera folosind gramatica G, adică L(G)
Textele clare asociate unei chei

Dată fiind o funcţie cod : P −→ {0, 1}∗ care dă codul asociat fiecărei
producţii A −→ α corespunzător codificării lui A din H, şi Cod extensia ei
unică la P ∗ mulţimea textelor clare se defineşte ca fiind:
C = {x ∈ {0, 1}∗ |∃w ∈ L(G) obţinut prin şirul D = d1 , d2 . . . dn de
derivări drepte şi x = Cod(D)}
Funcţia de decriptare
Funcţia de decriptare ı̂ntoarce şirul de biţi ascuns ı̂ntr-un cuvânt w ∈
L(G) şi o putem defini astfel:
Dk = Cod ◦ parse : L(G) −→ C
unde parse este funcţia care pentru un cuvănt al limbajului dă unicul şir de
derivări drepte asociat lui
Funcţia de criptare
Întrucât gramatica este neambiguă, fiecare text clar este unic determinat
de un cuvănt al limbajului. Adică, funcţia Dk este bijectivă. Definim funcţia
de criptare astfel:
Ek = Dk−1 : C −→ L(G)
Observatii
Precum se poate vedea, am definit textele criptate ı̂naintea celor clare re-
spectiv funcţia de decriptare ı̂naintea celei de criptare. Aceasta se datorează
faptului că atunci când criptăm folosind acest sistem efectuăm practic un
procedeu asemănător decompresiei datelor comprimate prin metoda de com-
presie Huf f man.
Marele dezavantaj al acestui sistem este acela că nu poate să cripteze
dacât acele şiruri care corspund unor cuvinte ı̂n limbajul generat de gramatică
şi doar după ce construim gramatica şi codificăril Huffman putem spune dacă
mesajul poate fi criptat cu ajutorul acestei chei.
Se impune deci găsirea unei metode de extindere a acestui sistem, care să
elimine aceste dezavantaje (sau să le minimizeze).
3.2. EXTINDEREA SISTEMULUI 27
3.2 Extinderea sistemului

O condiţie esenţială care trebuie pusă este ca măcar o variabilă X dintr-o
gramatică să aibă două producţii asociate. Dacă acest lucru se ı̂ntâmplă,
putem fi siguri că folosind această gramatică ı̂n procesul de criptare, vom
putea cripta un mesaj având cel puţin un bit (acel ascuns cănd se derivează
variabila X. De asemenea, se impune condiţia:
∗
∀X ∈ N ∃w ∈ Σ∗ , X =⇒ w (3.1)
Plecăm de la presupunerea că orice cuvănt din L(G) reprezintă o entitate

de un anumit fel (de exemplu o expresie aritmetică). Atunci, pentru a putea
genera cuvinte oricăt de lungi, trebuie să legăm cumva aceste cuvinte ı̂ntre
ele (de exemplu prin cuvinte de legătură). De aceea o dată fiind o gramatică
G = (N, Σ, S, P ), o extindem la următoarea gramatică:
G1 = (N ∪ {S1 , Xleg }, Σ ∪ Σleg , S1 , P ∪ {S1 −→ S1 Xleg S, S1 −→ S} ∪ Pleg )
ı̂n care:
• S1 este noul simbol de start
• Xleg este variabila care reprezintă legăturile ı̂ntre entităţi
• Σleg este alfabetul utilizat ı̂n producţiile lui Xleg
• Pleg este mulţimea de producţii asociate lui Xleg . Acestei mulţimi de
producţii i se asociază o codificare Huffman ca pentru orice altă vari-
abilă.
Obesrvăm că dacă Xleg are doar o producţie asociată (X −→ α), putem
să-l eliminăm şi să-l ı̂nlocuim cu α ı̂n singura producţie ı̂n care apare, caz ı̂n
care gramatica ar fi:
G1 0 = (N ∪ {S1 }, Σ ∪ Σleg , S1 , P ∪ {S1 −→ S1 αS, S1 −→ S})
Pentru a putea cripta acum orice şir vom proceda ı̂n felul următor:
1 La folosirea variabilei S1 ı̂n derivare nu se ascunde nici un bit, codificarea
atasată ei fiind Ø.
2 completăm mesajul criptat cu un şir de biţi care indică sfărşitul mesajului.
3 În mod implicit, la derivarea variabilei S1 se foloseşte producţia S1 −→
S1 Xleg S.
4 după ascunderea ı̂ntregului mesaj, pentru a ı̂ncheia derivarea, derivăm

fiecare variabilă rămasă ı̂n criptat ı̂ntr-un şir w ∈ Σ∗
5 la decriptare, se va reţine din şirul de biţi rezultat doar ceea ce se găseşte

ı̂naintea indicatorului de sfărşit de fişier.
Folosirea observaţiei 3 ne asigură că putem cripta şiruri oricăt de lungi

(gramatica este recursivă şi folosim această recursivitate).
Observaţia 4 ne asigură că procedura care relizează criptarea este un
algoritm (se termină).
Observaţia 2 ne asigură că putem recupera şirul intact la decriptare.
În concluzie, prin această exetnsie, noul sistem de criptare rezultat poate
realiza criptarea oricărui mesaj. Voi da mai jos algoritmii de criptare/decriptare
şi apoi voi arăta cum se aplică aceştia pe un exemplu particular.
3.3 Algoritmii de criptare şi decriptare

3.3.1 Algoritmul de criptare
Mai ı̂ntâi să arătăm acum cum putem construi cuvinte (rezonabil de mici)
ı̂n care poate deriva orice neterminal. Avem nevoie de ele la sfârşitul proce-
sului de criptare (obs. 4). Pentru aceasta dăm următorul algoritm:
Algoritmul 3.1: cuvinte(G)
Intrare: G = (N, Σ, S, P ) Gramatică care respectă condiţia 3.1
Iesire: P 0 mulţime care conţine producţii de forma X −→ w, w ∈ Σ∗ , cel

puţin una pentru fiecare variabilă a lui G.
P 0 ←− P \{A −→ αAβ}
(eliminăm producţiile cu recursie imediată)
cât timp apar neterminale ı̂n derapta producţiilor
pentru toate producţiile A −→ αXβ ∈ P 0 , X ∈ N

dacă există o producţie X −→ w, w ∈ Σ∗
pentru toate producţiile X −→ w, w ∈ Σ∗
P 0 ←− P 0 ∪{A −→ αwβ}
P 0 ←− P 0 \{A −→ αwβ}
3.3. ALGORITMII DE CRIPTARE ŞI DECRIPTARE 29
Teorema 3.1: Dacă condiţia 3.1 este ı̂ndeplinită, procedura cuvinte este
un algoritm şi se termină cu ieşirea dorită.
Demonstraţie:
• Condiţia 3.1 asigură existenţa a cel puţin unui cuvănt pentru fiecare
variabilă.
• Finititudinea algoritmului rezultă din faptul că neterminalele se ı̂nlocuiesc

doar cu şiruri de terminale.
• Faptul că algoritmul nu ciclează ı̂ntr-o stare intermediară este dat de

condiţia că gramatica nu are simboluri inutilizabile.
Se porneşte de la simbolul de start S1 şi se efectuează doar derivări drepte.

Dacă codificarea lui S1 nu este vidă, la derivare alegem acea producţie al cărei
cod este prefix ı̂n textul clar şi avansăm ı̂n textul clar sărind peste acest cod.
Apoi procedeul se repetă, ţinând cont de observaţiile din secţinuea anterioară.
Acum dăm algoritmul care realizează acest lucru folosind procedura getN extChar
(algoritmul 2.3.2) şi procedura cuvinte definită mai sus:
Algoritmul 3.2: cripteaza(sir, G, H)
P 0 ←− cuvinte(G)
sir ←− sir < EOF >
criptat ←− S1
index ←− 0
cât timp index ≤ |sir|
A ←− cea mai din dreapta variabilă

dacă A = S1 ı̂nlocuieşte S1 cu S1 SXleg S
altfel
α ←− getN extChar(index, HA ), unde HA e arborele asociat lui
A
ı̂nlocuieşte A cu α ı̂n criptat
pentru toate variabilele rămase ı̂n criptat
A ←− cea mai din dreapta variabilă

ı̂nlocuieşte A folosind o producţie oarecare din P 0
return criptat
Datorită observaţiior din secţiunea anterioară, algoritmul se termină generând

un element al lui L(G) şi ascunzând biţii din sir.
Observaţii:
• Variabila index se modifică (creşte) ı̂n procedura getN extChar.
• Dacă arborele are un singur nod, acela este şi rădăcină şi frunză şi este
singurul şir ı̂n care se poate deriva, deci se ı̂nlocuieşte făra a ascunde
nici un bit.
• Cu cât arborii Huffman au ı̂naltime mai mare (i.e. sunt mai multe
alegeri de făcut la un moment dat) cu atât putem ascunde mai mulţi
biţi.
• Datorită derivărilor drepte, se produce şi o amestecare a ordinii biţilor

ı̂n textul criptat.
3.3.2 Procesul de decriptare

Dat fiind un text criptat w ∈ L(G) vrem să obţinem textul clar care ı̂i
corespunde. Deoarece G este LR(k), pentru orice cuvânt ı̂n L(G) parserul
determină şirul (unic) de derivări drepte prin care se obţine acel cuvănt.
Înlocuim apoi fiecare producţie din şirul de derivări cu codul corespunzător
ei din H şi obţinem un şir de biţi care conţine mesajul iniţial. Nu ne rămâne
decât să considerăm mesajul doar pănâ la ı̂ntâlnirea marcajului < EOF >.
Prezentăm sub formă de algoritm implementarea observaţiilor precedente.
Algoritmul de decriptare foloseşte procedură parsare (1.1), precum şi proce-
dura cod (algoritmul 2.3.2).
Algoritmul 3.3: Decripteaza(w, G, H)
Intrare: w textul criptat, (G, (H)) cheia de criptare.
Iesire: clar textul clar corespunzător lui w, sau eroare dacă w nu e recunos-
cut ca text criptat.
dacă !parseaza(w, G, actiune, goto, π)

return eroare
clar1 ←− ””
3.4. SIGURANŢA SISTEMULUI 31
cât timp π = iπ 0
Fie A −→ α producţia cu numărul i

c ←− cod(α, HA ), unde HA e arborele de codificare asociat lui A
clar1 ←− clar1 + c
π ←− π 0
determină clar de lungime minimă cu proprietatea clar < EOF > prefix al
lui clar1
dacă ∃clar return clar

altfel return eroare
Deoarece procedura parseaza este un algoritm, execuţia ei se termină şi

produce un şit finit de etichete ale producţiilor folosite la derivare. Acest şir
de etichete este transformat printr-o singură parcurgere ı̂ntr-un şir finit de
biti. Din acest nou şir este extras un prefix reprezentând textul clar.
Datorită acestor observaţii, putem afirma că procedura decripteaza este
algoritm, si realizează decriptarea unui şir dat la intrare.
Pentru a face ı̂ntelese mai bine procedeele de criptare/decriptare, am
inclus un exemplu detaliat ı̂n anexa C.
3.4 Siguranţa sistemului

3.4.1 Analiza teoretică a securităţii sistemului
Securitatea acestui tip de criptare se bazează pe dificultatea găsirii acelei
gramaticii care a generat un text, adică a arborelui de parsare asociat textu-
lui. Într-adevăr, se poate găsi o gramatică care să genereze un text, dar sunt
foarte multe gramatici care pot genera acelaşi text. Iar la producţii diferite
se asociază arbori Huffman diferiţi, deci si criptări diferite.
Problema revine la a determina exact acea gramatică cu care este produs
textul. Dacă ar exista un algoritm ı̂n timp determinist polinomial care să
ı̂nveţe să genereze arborele de parsare pentru un text dat, atunci acest algo-
ritm ar putea să fie antrenat să prezică şi apartenenţa unui şir la limbajul
generat de o gramatică.
Teorema 4.2: Fie A un algoritm care poate ı̂nvăţa să genereze arborele
de parsare şi fie G1 o gramatică. Atunci cu acest algoritm se poate prezice
apartenenţa unui şir la L(G1 )
Demonstraţie: Considerăm G1 = (N1 , Σ, S1 , P1 ) şi fie G2 = (N2 , Σ, S2 , P2 ) o

altă garmatică peste acelasi alfabet. Fie G = (N, Σ, S, P ), unde: N = N1 ∪
N2 ∪ {S} şi P = P1 ∪ P2 ∪ {S −→ S1 ,S −→ S2 }. Antrenăm algoritmul
A cu exemple din L(G), şi arborii lor de parsare. Algoritmul A ı̂nvăţă să
genereze arborele de parsare pentru orice şir w ∈ L(G). Atunci ∀w ∈ L(G)
A determină dacă S derivă ı̂n S1 sau ı̂n S2 , adică dacă w ∈ L(G1 ) sau nu.
Dar, precum afirmă umătoarea teoremă, corolar ı̂n [AK91], dacă inver-
sarea RSA-ului e o problemă intratabilă, atunci nu se poate ı̂nvăţa un pro-
gram să prezică apartenenţa unui şir la limbajul generat de o gramatică
neregulată. Dar mai ı̂ntâi, nişte definiţii pregătitoare.
Definiţia 4.1 (definiţii pregătitoare):

Fie X = {0, 1}∗
Prin reprezentare de concepte C ı̂ntelegem orice submulţime a lui X ×X.
Pentru un element hu, xi ∈ C, u e un nume de concept şi x un exemplu. Se
spune că x e membru al conceptului u.
Definim CDF A ca o mulţime de perechi hu, xi astfel ı̂ncât u este codarea bi-
nară a unui automat finit determinist M peste X şi x este un cuvânt acceptat
de M .
În mod asemănător se definesc şi C2DF A , CN F A şi CCF G corespunzătoare au-
tomatelor infinite şi gramaticilor independente de context.
Reuniunile finite de AFD sunt reprezentate de C∪DF A iar intersecţiile finite
de AFD de C∩DF A .
Teorema 4.3: Dacă presupunem intratabilitatea oricărei din următoarele

trei probleme: testarea reziduurilor pătratice modulo un număr compus, in-
versarea criptării RSA sau factorizarea intregilor Blum, atunci următoarele
reprezentări de concepte nu sunt predictibile ı̂n timp polinomial folosind cereri
de apartenenţă: C∪DF A , C∩DF A , C2DF A , CN F A şi CCF G
3.4.2 Metode de ı̂mbunătăţire a securitătı̂i sistemului

Există diverse procedee care permit modificarea producţiilor unei gra-
matici astfel ı̂ncât criptarea obţinută folosind noua gramatică să difere de
criptarea obţinută folosind gramatica iniţială.
Astfel de procedee sunt expansiunile, contracţiile şi permutările.
3.4. SIGURANŢA SISTEMULUI 33
Expansiunea
Expansiunea: Fie A o variabilă şi αi , i = 1, n expresiile ı̂n care derivă A.
Fie αik , k = 1, m un subsir al lui αi . Pentru orice producţie B −→ β1 Aβ2 ,
adăugăm producţiile B −→ β1 αik β2 . La sfârşit, ştergem producţiile A −→
αik .
Contracţia
Contracţia este un procedeu invers expansiunii (care adaugă noi variabile
gramaticii).
Permutarea
Permutarea constă ı̂n permutarea producţiilor unei variabile, din care
rezultă modificarea arborilor Huffman, deci şi a criptării.
Aceste modificări pot fi efectuate simultan de către cei doi parteneri care
comunică folosind un generator de numere pseudo-aleatoare sincronizat (cu
aceeaşi sămânţa). Aceasta sămânţă are valoarea unei chei suplimentare de
criptare.
Detalii privind aceste procedee se gasesc in [Way96].
Capitolul 4
Concluzii
Sistemul prezentat este destul de bun, ı̂n sensul că pentru anumite chei
poate fi comparat cu RSA-ul sau cu alte sisteme puternice de criptare.
Pentru o implementare pe internet a acestui sistem vezi [SPAM].
Dezavantaje:
• faptul ca o gramatică trebuie sa fie destul de elaborată pentru a-i păcăli
pe cei ce pot intercepta mesajele
• e necesar un schimb prealabil de chei pe un canal sigur
• datorită mărimii lor, cheile nu se pot schimba
• nu se ştie ce gramatici au puterea de criptare echivalentă cu RSA (deşi
se ştie că există)
Avantaje:
• cu ajutorul acestui sistem se poate ascunde informaţie ı̂n text aparent
inofensiv.
• asa cum am arătat mai sus deşi cheile nu se pot schimba prea des, ele
se pot transforma
• este uşor de proiectat o gramatică (realizarea unei gramatici necesită
puţine noţiuni teoretice) şi depinde doar de imaginaţia celui ce o crează.
Indicaţii pentru construirea unei gramatici ”bune”
• Gramatica trebuie să fie construită astfel ı̂ncât să simuleze o situaţie
din viaţa reală bazată pe repetiţie cum ar fi comentariul uni meci sau
povestirea unei telenovele sau un basm, sau ca ı̂n exemplul nostru un
discurs de candidatură. Oricum, sunt multe domenii care implică o
oarecare rutină (mai ales privite din afară)
35
36 CAPITOLUL 4. CONCLUZII
• Cu cât mai multe variabile sunt, cu atât mai bine. Adică se poate merge
cu construcţia textului până ls structura frazei, sau chiar a cuvântului.
• este bună folosirea a cât mai multe producţii pentru o variabilă pentru
a putea ascunde cât mai multă informaţie. Dacă avem 2n producţii
pentru o variabilă, atunci derivând-o putem ascunde n biţi. Putem
folosi fraze asemănătoare, sinonime, etc.
• mulţimea neterminalelor dintr-o producţie să fie cât mai mică pentru
ca să ascundem căt mai mult cu căt mai puţine cuvinte. (de aceea
exemplu dat e doar ı̂n scop didactic)
Informaţia (şirul de biţi) trebuie să fie aleatoare, de aceea se recomandă o

preprocesare care să randomizeze intrarea (ori o altă criptare, ori o arhivare).
Prezentăm ca exemplu de cheie pentru acest sistem, care realizează o
criptare eficientă (fără modificarea dimensiunii iniţiale).
G = (N, Σ, S, P ), unde:
• N = {Ai : i = 0, 255} mulţimea variabilelor;
• Σ = {tj : j = 0, 255} mulţimea caracterelor ASCII;
• S este una din variabile (să zicem A0 ;
• Producţiile sunt de forma Ai −→ tj Ak1 . . . Ak(ij) : i, j = 0, 255.
Această gramatică pemiterea ascunderea a 8 biţi de informaţie la fiecare

alegere, producând un singur caracter (deci tot 8 biţi) ceea ce ı̂nseamnă o
conservare a mărimii textului, una din cerinţele unui bun sistem de criptare.
Bibliografie
[Way96] Wayner, Peter, Disappearing Cryptography, Being and Nothingness

on the Net
[Ata01] Atanasiu, Adrian, curs de teroria codurilor
[AK91] Angluin, D., Kharitonov, M., When won’t memebership queries

help?, ACM Press 1991
[KV89] Kearns, M., Valiant, L. G., Cryptographic Limitations on Learning

Boolean Formulae and Finite Automata
[AU72] Aho, A. V., Ullman, J. D., The Theory of Parsing, Translation And
Compiling
[CLR90] Cormen, Th. H., Leiserson, Ch. E., Rivest R. R., Introduction to
Algorithms, MIT Press 1990
[SPAM] http://www.spammimic.com.
[SH] http://www.jjtc.com/Steganography/
[SS] http://www.tapr.org/
[MD] http://www89.pair.com/techinfo/Microdot/microdot.htm
37
38 BIBLIOGRAFIE
Anexa A
Coduri Huffman
Prezint aici un cod Huffman asociat frecvenţei literelor ı̂n limba engleză
care l-am completat cu < EOF > divizând nodul lui Z:
Frecv. Codul Frecv. Codul

Litera % Huffman Litera % Huffman
A 6.22 1011 O 6.06 1000
B 1.32 010100 P 1.87 00000
C 3.11 10101 Q 0.10 0101011100
D 2.97 01011 R 5.87 0111
E 10.53 001 S 5.81 0110
F 1.68 110001 T 7.68 1101
G 1.65 110000 U 2.27 00010
H 3.63 11001 V 0.70 0101010
I 6.14 1001 W 1.13 000011
J 0.06 01010111011 X 0.25 010101111
K 0.31 01010110 Y 1.07 000010
L 3.07 10100 Z 0.06 01010111010110
M 2.48 00011 < EOF > 0.00 01010111010111
N 5.73 0100 .
39
40 ANEXA A. CODURI HUFFMAN
Anexa B
Construcţia unei tabele de

parsare
Gramatica
Vom folosi ca exemplu de gramatică aceeaşi gramatică folosită şi ı̂n exem-
plul de criptare/decriptare, deoarece ı̂n procesul de decriptare avem nevoie
şa parsăm şirul criptat. Gramatica este:
0 S 0 −→ S1 $ 13 C −→ C1
1 S1 −→ S1 ; E 14 C −→ 0
2 S1 −→ E 15 C1 −→ 1
3 E −→ E + T 16 C1 −→ 2
4 E −→ T 17 C1 −→ 3
5 T −→ T ∗ F 18 C1 −→ 4
6 T −→ F 19 C1 −→ 5
7 F −→ (E) 20 C1 −→ 6
8 F −→ N 21 C1 −→ 7
9 N −→ C1 N0 22 C1 −→ 8
10 N −→ 0 23 C1 −→ 9
11 N0 −→ N0 C
12 N0 −→ λ
Această gramatică este extensia gramaticii expresiilor aritmetice simple
cu numere naturale separate de ’;’. Mai jos, prezint paşii de construie a
mulţimii configuraţiilor, apoi tabelele actiune şi goto.
41
42 ANEXA B. CONSTRUCŢIA UNEI TABELE DE PARSARE
I0 I7
C1 −→ .1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ 4 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$
C1 −→ .2 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
goto(I0 , 3) = I8
C1 −→ .3 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .4 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 I8
C1 −→ .5 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ 3 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$
C1 −→ .6 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .7 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 goto(I0 , 2) = I9
C1 −→ .8 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .9 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 I9
E −→ .E + T ;$|; |+ C1 −→ 2 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$
E −→ .T ;$|; |+ goto(I0 , 1) = I10
F −→ .( E ) ;$| ∗ |; |+
F −→ .N ;$| ∗ |; |+ I10
N −→ .0 ;$| ∗ |; |+ C1 −→ 1 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$
N −→ .C1 N0 ;$| ∗ |; |+
S1 −→ .E ;$|; goto(I0 , C1) = I11
S1 −→ .S1 ; E;$|; I11
S −→ .S1 ;$ N −→ C1 .N0;$| ∗ |; |+
T −→ .F ;$| ∗ |; |+ N0 −→ . ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
T −→ .T * F ;$| ∗ |; |+ N0 −→ .N0 C;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
goto(I0 , 0) = I1 goto(I0 , N ) = I12
I1 I12
N −→ 0 .;∗| + |; |$ F −→ N .;∗| + |; |$
goto(I0 , 9) = I2 goto(I0 , () = I13
I2 I13
C1 −→ 9 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$ C1 −→ .1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
goto(I0 , 8) = I3 C1 −→ .2 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .3 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
I3 C1 −→ .4 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ 8 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$ C1 −→ .5 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .6 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
goto(I0 , 7) = I4
C1 −→ .7 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
I4 C1 −→ .8 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ 7 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$ C1 −→ .9 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
E −→ .E + T;)|+
goto(I0 , 6) = I5 E −→ .T ;)|+
F −→ ( .E ) ;$| ∗ |; |+
I5 F −→ .( E ) ;)| ∗ |+
C1 −→ 6 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$ F −→ .N ;)| ∗ |+
goto(I0 , 5) = I6 N −→ .0 ;)| ∗ |+
N −→ .C1 N0;)| ∗ |+
I6 T −→ .F ;)| ∗ |+
C1 −→ 5 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |; |$ T −→ .T * F ;)| ∗ |+
goto(I0 , 4) = I7 goto(I0 , F ) = I14
43
I14 goto(I18 , C1) = I11

T −→ F .;∗| + |; |$ goto(I18 , N ) = I12
goto(I0 , T ) = I15 goto(I18 , () = I13
goto(I18 , F ) = I14
I15 goto(I18 , T ) = I15
E −→ T . ;$|; |+ goto(I18 , E) = I19
T −→ T .* F;$| ∗ |; |+
I19
goto(I0 , E) = I16
E −→ E .+ T ;$|; |+
I16 S1 −→ S1 ; E .;$|;
E −→ E .+ T;$|; |+
goto(I19 , +) = I20
S1 −→ E . ;$|;
goto(I0 , S1) = I17 I20
C1 −→ .1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
I17 C1 −→ .2 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
S −→ S1 . ;$ C1 −→ .3 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
S1 −→ S1 .; E;$|; C1 −→ .4 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
goto(I17 , ; ) = I18 C1 −→ .5 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .6 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
I18 C1 −→ .7 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .8 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .2 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .9 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .3 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 E −→ E + .T;$|; |+
C1 −→ .4 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 F −→ .( E ) ;$| ∗ |; |+
C1 −→ .5 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 F −→ .N ;$| ∗ |; |+
C1 −→ .6 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 N −→ .0 ;$| ∗ |; |+
C1 −→ .7 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 N −→ .C1 N0;$| ∗ |; |+
C1 −→ .8 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 T −→ .F ;$| ∗ |; |+
C1 −→ .9 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 T −→ .T * F ;$| ∗ |; |+
E −→ .E + T ;$|; |+
E −→ .T ;$|; |+ goto(I20 , 0) = I1
F −→ .( E ) ;$| ∗ |; |+ goto(I20 , 9) = I2
F −→ .N ;$| ∗ |; |+ goto(I20 , 8) = I3
N −→ .0 ;$| ∗ |; |+ goto(I20 , 7) = I4
N −→ .C1 N0 ;$| ∗ |; |+ goto(I20 , 6) = I5
S1 −→ S1 ; .E;$|; goto(I20 , 5) = I6
T −→ .F ;$| ∗ |; |+ goto(I20 , 4) = I7
T −→ .T * F ;$| ∗ |; |+ goto(I20 , 3) = I8
goto(I20 , 2) = I9
goto(I18 , 0) = I1 goto(I20 , 1) = I10
goto(I18 , 9) = I2 goto(I20 , C1) = I11
goto(I18 , 8) = I3 goto(I20 , N ) = I12
goto(I18 , 7) = I4 goto(I20 , () = I13
goto(I18 , 6) = I5 goto(I20 , F ) = I14
goto(I18 , 5) = I6 goto(I20 , T ) = I21
goto(I18 , 4) = I7
goto(I18 , 3) = I8 I21
goto(I18 , 2) = I9 E −→ E + T .;$|; |+
goto(I18 , 1) = I10 T −→ T .* F ;$| ∗ |; |+
goto(I21 , ∗) = I22 goto(I13 , 8) = I27
I22 I27
C1 −→ .1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ 8 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
C1 −→ .2 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .3 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 goto(I13 , 7) = I28
C1 −→ .4 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .5 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 I28
C1 −→ .6 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 C1 −→ 7 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
C1 −→ .7 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 goto(I13 , 6) = I29
C1 −→ .8 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .9 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9 I29
F −→ .( E ) ;$| ∗ |; |+ C1 −→ 6 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
F −→ .N ;$| ∗ |; |+
N −→ .0 ;$| ∗ |; |+ goto(I13 , 5) = I30
N −→ .C1 N0;$| ∗ |; |+
T −→ T * .F ;$| ∗ |; |+ I30
C1 −→ 5 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
goto(I22 , 0) = I1
goto(I22 , 9) = I2 goto(I13 , 4) = I31
goto(I22 , 8) = I3
goto(I22 , 7) = I4 I31
goto(I22 , 6) = I5 C1 −→ 4 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
goto(I22 , 5) = I6
goto(I13 , 3) = I32
goto(I22 , 4) = I7
goto(I22 , 3) = I8 I32
goto(I22 , 2) = I9 C1 −→ 3 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
goto(I22 , 1) = I10
goto(I22 , C1) = I11 goto(I13 , 2) = I33
goto(I22 , N ) = I12
goto(I22 , () = I13 I33
goto(I22 , F ) = I23 C1 −→ 2 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
I23 goto(I13 , 1) = I34

T −→ T * F .;$| ∗ | + |;
I34
goto(I16 , +) = I20 C1 −→ 1 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
goto(I15 , ∗) = I22
goto(I13 , E) = I24 goto(I13 , C1) = I35
I24 I35
E −→ E .+ T;)|+ N −→ C1 .N0;)| ∗ |+
F −→ ( E .) ;$| ∗ |; |+ N0 −→ . ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
N0 −→ .N0 C;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
goto(I13 , 0) = I25
goto(I13 , N ) = I36
I25
N −→ 0 .;∗| + |) I36
goto(I13 , 9) = I26 F −→ N .;∗| + |)
I26 goto(I13 , () = I37

C1 −→ 9 .;1|2|3|4|5|6|7|8|9|0| ∗ | + |)
45
I37 goto(I40 , 7) = I28

C1 −→ .1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 6) = I29
C1 −→ .2 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 5) = I30
C1 −→ .3 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 4) = I31
C1 −→ .4 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 3) = I32
C1 −→ .5 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 2) = I33
C1 −→ .6 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , 1) = I34
C1 −→ .7 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , C1) = I35
C1 −→ .8 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , N ) = I36
C1 −→ .9 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I40 , () = I37
E −→ .E + T;)|+ goto(I40 , F ) = I41
E −→ .T ;)|+
F −→ ( .E ) ;)| ∗ |+
F −→ .( E ) ;)| ∗ |+ I41
F −→ .N ;)| ∗ |+ T −→ T * F .;+| ∗ |)
N −→ .0 ;)| ∗ |+
N −→ .C1 N0;)| ∗ |+
T −→ .F ;)| ∗ |+
T −→ .T * F ;)| ∗ |+ goto(I37 , E) = I42
goto(I13 , F ) = I38
I38 I42
T −→ F .;∗| + |) E −→ E .+ T;)|+
F −→ ( E .) ;)| ∗ |+
goto(I13 , T ) = I39
I39
E −→ T . ;)|+
T −→ T .* F;)| ∗ |+ goto(I37 , 0) = I25
goto(I37 , 9) = I26
goto(I39 , ∗) = I40 goto(I37 , 8) = I27
goto(I37 , 7) = I28
I40 goto(I37 , 6) = I29
C1 −→ .1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , 5) = I30
C1 −→ .2 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , 4) = I31
C1 −→ .3 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , 3) = I32
C1 −→ .4 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , 2) = I33
C1 −→ .5 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , 1) = I34
C1 −→ .6 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , C1) = I35
C1 −→ .7 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , N ) = I36
C1 −→ .8 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , () = I37
C1 −→ .9 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 goto(I37 , F ) = I38
F −→ .( E ) ;)| ∗ |+ goto(I37 , T ) = I39
F −→ .N ;)| ∗ |+ I43
N −→ .0 ;)| ∗ |+ g(42,))=43
F −→ ( E ) .;∗| + |)
N −→ .C1 N0;)| ∗ |+
T −→ T * .F ;)| ∗ |+
goto(I40 , 0) = I25
goto(I40 , 9) = I26 goto(I42 , +) = I44
goto(I40 , 8) = I27
I44 I46
C1 −→ .1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C −→ .0 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .2 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C −→ .C1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .3 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .1 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .4 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .2 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .5 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .3 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .6 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .4 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .7 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .5 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .8 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .6 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .9 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9 C1 −→ .7 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
E −→ E + .T;)|+ C1 −→ .8 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
F −→ .( E ) ;)| ∗ |+ C1 −→ .9 ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
F −→ .N ;)| ∗ |+ N −→ C1 N0 .;)| ∗ |+
N −→ .0 ;)| ∗ |+ N0 −→ N0 .C ;)| ∗ | + |0|1|2|3|4|5|6|7|8|9
N −→ .C1 N0;)| ∗ |+
T −→ .F ;)| ∗ |+
T −→ .T * F ;)| ∗ |+ goto(I46 , 0) = I47
I47
C −→ 0 .;∗| + |0|9|8|7|6|5|4|3|2|1|)
goto(I44 , 0) = I25
goto(I44 , 9) = I26 goto(I46 , 9) = I26
goto(I44 , 8) = I27 goto(I46 , 8) = I27
goto(I44 , 7) = I28 goto(I46 , 7) = I28
goto(I44 , 6) = I29 goto(I46 , 6) = I29
goto(I44 , 5) = I30 goto(I46 , 5) = I30
goto(I44 , 4) = I31 goto(I46 , 4) = I31
goto(I44 , 3) = I32 goto(I46 , 3) = I32
goto(I44 , 2) = I33 goto(I46 , 2) = I33
goto(I44 , 1) = I34 goto(I46 , 1) = I34
goto(I44 , C1) = I35 goto(I46 , C1) = I48
goto(I44 , N ) = I36
goto(I44 , () = I37 I48
goto(I44 , F ) = I38 C −→ C1 .;∗| + |0|9|8|7|6|5|4|3|2|1|)
goto(I44 , T ) = I45
goto(I46 , C) = I49
I45
E −→ E + T .;)|+ I49
T −→ T .* F ;)| ∗ |+ N0 −→ N0 C .;∗| + |0|9|8|7|6|5|4|3|2|1|)
I50
g(24,))=50
F −→ ( E ) .;∗| + |; |$
goto(I45 , ∗) = I40 goto(I24 , +) = I44

goto(I35 , N 0) = I46 goto(I11 , N 0) = I51
47
I51
C −→ .0 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C −→ .C1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .1 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .2 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .3 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .4 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .5 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .6 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .7 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .8 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
C1 −→ .9 ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
N −→ C1 N0 .;$| ∗ |; |+
N0 −→ N0 .C ;$| ∗ |; | + |0|1|2|3|4|5|6|7|8|9
goto(I51 , 0) = I52
I52
C −→ 0 .;∗| + |; |0|9|8|7|6|5|4|3|2|1|$
goto(I51 , 9) = I2
goto(I51 , 8) = I3
goto(I51 , 7) = I4
goto(I51 , 6) = I5
goto(I51 , 5) = I6
goto(I51 , 4) = I7
goto(I51 , 3) = I8
goto(I51 , 2) = I9
goto(I51 , 1) = I10
goto(I51 , C1) = I53
I53
C −→ C1 .;∗| + |; |0|9|8|7|6|5|4|3|2|1|$
goto(I51 , C) = I54
I54
N0 −→ N0 C .;∗| + |; |0|9|8|7|6|5|4|3|2|1|$
Tabela goto
( ) * ; + 0 1 2 3 4 5 6 7 8 9 C C1 E F N N0 S1 T
0 13 · · · · 1 10 9 8 7 6 5 4 3 2 · 11 16 14 12 · 17 15
1 · · · · · · · · · · · · · · · · · · · · · · ·
2 · · · · · · · · · · · · · · · · · · · · · · ·
3 · · · · · · · · · · · · · · · · · · · · · · ·
4 · · · · · · · · · · · · · · · · · · · · · · ·
5 · · · · · · · · · · · · · · · · · · · · · · ·
6 · · · · · · · · · · · · · · · · · · · · · · ·
7 · · · · · · · · · · · · · · · · · · · · · · ·
8 · · · · · · · · · · · · · · · · · · · · · · ·
9 · · · · · · · · · · · · · · · · · · · · · · ·
10 · · · · · · · · · · · · · · · · · · · · · · ·
11 · · · · · · · · · · · · · · · · · · · · 51 · ·
12 · · · · · · · · · · · · · · · · · · · · · · ·
13 37 · · · · 25 34 33 32 31 30 29 28 27 26 · 35 24 38 36 · · 39
14 · · · · · · · · · · · · · · · · · · · · · · ·
15 · · 22 · · · · · · · · · · · · · · · · · · · ·
16 · · · · 20 · · · · · · · · · · · · · · · · · ·
17 · · · 18 · · · · · · · · · · · · · · · · · · ·
18 13 · · · · 1 10 9 8 7 6 5 4 3 2 · 11 19 14 12 · · 15
19 · · · · 20 · · · · · · · · · · · · · · · · · ·
20 13 · · · · 1 10 9 8 7 6 5 4 3 2 · 11 · 14 12 · · 21
21 · · 22 · · · · · · · · · · · · · · · · · · · ·
22 13 · · · · 1 10 9 8 7 6 5 4 3 2 · 11 · 23 12 · · ·
23 · · · · · · · · · · · · · · · · · · · · · · ·
24 · 50 · · 44 · · · · · · · · · · · · · · · · · ·
25 · · · · · · · · · · · · · · · · · · · · · · ·
26 · · · · · · · · · · · · · · · · · · · · · · ·
27 · · · · · · · · · · · · · · · · · · · · · · ·
28 · · · · · · · · · · · · · · · · · · · · · · ·
29 · · · · · · · · · · · · · · · · · · · · · · ·
30 · · · · · · · · · · · · · · · · · · · · · · ·
31 · · · · · · · · · · · · · · · · · · · · · · ·
32 · · · · · · · · · · · · · · · · · · · · · · ·
33 · · · · · · · · · · · · · · · · · · · · · · ·
34 · · · · · · · · · · · · · · · · · · · · · · ·
35 · · · · · · · · · · · · · · · · · · · · 46 · ·
36 · · · · · · · · · · · · · · · · · · · · · · ·
37 37 · · · · 25 34 33 32 31 30 29 28 27 26 · 35 42 38 36 · · 39
38 · · · · · · · · · · · · · · · · · · · · · · ·
39 · · 40 · · · · · · · · · · · · · · · · · · · ·
40 37 · · · · 25 34 33 32 31 30 29 28 27 26 · 35 · 41 36 · · ·
41 · · · · · · · · · · · · · · · · · · · · · · ·
42 · 43 · · 44 · · · · · · · · · · · · · · · · · ·
43 · · · · · · · · · · · · · · · · · · · · · · ·
44 37 · · · · 25 34 33 32 31 30 29 28 27 26 · 35 · 38 36 · · 45
45 · · 40 · · · · · · · · · · · · · · · · · · · ·
46 · · · · · 47 34 33 32 31 30 29 28 27 26 49 48 · · · · · ·
47 · · · · · · · · · · · · · · · · · · · · · · ·
48 · · · · · · · · · · · · · · · · · · · · · · ·
49 · · · · · · · · · · · · · · · · · · · · · · ·
50 · · · · · · · · · · · · · · · · · · · · · · ·
50 · · · · · 52 10 9 8 7 6 2 4 3 2 54 53 · · · · · ·
51 · · · · · · · · · · · · · · · · · · · · · · ·
52 · · · · · · · · · · · · · · · · · · · · · · ·
53 · · · · · · · · · · · · · · · · · · · · · · ·
54 · · · · · · · · · · · · · · · · · · · · · · ·
Legenda
număr i deplasare la starea i
· eroare
49
Tabela actiune
$ ( ) * ; + 0 1 2 3 4 5 6 7 8 9
0 · d · · · · d d d d d d d d d d
1 10 · · 10 10 10 · · · · · · · · · ·
2 23 · · 23 23 23 23 23 23 23 23 23 23 23 23 23
3 22 · · 22 22 22 22 22 22 22 22 22 22 22 22 22
4 21 · · 21 21 21 21 21 21 21 21 21 21 21 21 21
5 20 · · 20 20 20 20 20 20 20 20 20 20 20 20 20
6 19 · · 19 19 19 19 19 19 19 19 19 19 19 19 19
7 18 · · 18 18 18 18 18 18 18 18 18 18 18 18 18
8 17 · · 17 17 17 17 17 17 17 17 17 17 17 17 17
9 16 · · 16 16 16 16 16 16 16 16 16 16 16 16 16
10 15 · · 15 15 15 15 15 15 15 15 15 15 15 15 15
11 12 · · 12 12 12 12 12 12 12 12 12 12 12 12 12
12 8 · · 8 8 8 · · · · · · · · · ·
13 · d · · · · d d d d d d d d d d
14 6 · · 6 6 6 · · · · · · · · · ·
15 4 · · d 4 4 · · · · · · · · · ·
16 2 · · · 2 d · · · · · · · · · ·
17 A · · · d · · · · · · · · · · ·
18 · d · · · · d d d d d d d d d d
19 1 · · · 1 d · · · · · · · · · ·
20 · d · · · · d d d d d d d d d d
21 3 · · d 3 3 · · · · · · · · · ·
22 · d · · · · d d d d d d d d d d
23 5 · · 5 5 5 · · · · · · · · · ·
24 · · d · · d · · · · · · · · · ·
25 · · 10 10 · 10 · · · · · · · · · ·
26 · · 23 23 · 23 23 23 23 23 23 23 23 23 23 23
27 · · 22 22 · 22 22 22 22 22 22 22 22 22 22 22
28 · · 21 21 · 21 21 21 21 21 21 21 21 21 21 21
29 · · 20 20 · 20 20 20 20 20 20 20 20 20 20 20
30 · · 19 19 · 19 19 19 19 19 19 19 19 19 19 19
31 · · 18 18 · 18 18 18 18 18 18 18 18 18 18 18
32 · · 17 17 · 17 17 17 17 17 17 17 17 17 17 17
33 · · 16 16 · 16 16 16 16 16 16 16 16 16 16 16
34 · · 15 15 · 15 15 15 15 15 15 15 15 15 15 15
35 · · 12 12 · 12 12 12 12 12 12 12 12 12 12 12
36 · · 8 8 · 8 · · · · · · · · · ·
37 · d · · · · d d d d d d d d d d
38 · · 6 6 · 6 · · · · · · · · · ·
39 · · 4 d · 4 · · · · · · · · · ·
40 · d · · · · d d d d d d d d d d
41 · · 5 5 · 5 · · · · · · · · · ·
42 · · d · · d · · · · · · · · · ·
43 · · 7 7 · 7 · · · · · · · · · ·
44 · d · · · · d d d d d d d d d d
45 · · 3 d · 3 · · · · · · · · · ·
46 · · 9 9 · 9 d d d d d d d d d d
47 · · 14 14 · 14 14 14 14 14 14 14 14 14 14 14
48 · · 13 13 · 13 13 13 13 13 13 13 13 13 13 13
49 · · 11 11 · 11 11 11 11 11 11 11 11 11 11 11
50 7 · · 7 7 7 · · · · · · · · · ·
51 9 · · 9 9 9 d d d d d d d d d d
52 14 · · 14 14 14 14 14 14 14 14 14 14 14 14 14
53 13 · · 13 13 13 13 13 13 13 13 13 13 13 13 13
54 11 · · 11 11 11 11 11 11 11 11 11 11 11 11 11
Legenda
număr i reduce producţia cu eticheta i
d deplasare
A acceptare
· eroare
Anexa C
Exemplu de aplicare a
criptării/decriptării
Cheia de criptare
Gramatica din componenţa chei de criptare este B. Observăm că această
gramatică respecţă condiţiiie extensiei unei gramatici din 3.2.
Iată acum o posibilă alegere a lui H:
HS1 S1 −→ S1 ; E λ HC C −→ C1 0
S1 −→ E λ C −→ 0 1
HE E −→ E + T 1 HC1 C1 −→ 1 011
E −→ T 0 C1 −→ 2 000
HT T −→ T ∗ F 0 C1 −→ 3 101
T −→ F 1 C1 −→ 4 0100
HF F −→ (E) 0 C1 −→ 5 111
F −→ N 1 C1 −→ 6 001
HN N −→ C1 N0 1 C1 −→ 7 100
N −→ 0 0 C1 −→ 8 110
HN0 N0 −→ N0 C 0 C1 −→ 9 0101
N0 −→ λ 1
Se observă că producţiilor S1 −→ S1 ; E şi S1 −→ E li se asociază codul
vid, precum am arătat la procedeeul de extindere al sistemului. În rest,
la derivarea celorlalte variabile se poate ascunde un singur bit, cu excepţia
variabilei C1 cu care se pot ascunde 3 sau 4 biţi.
Textul clar
Vom considera un mesaj ca fiind un text ı̂n limba engleză din care s-au
eliminat spaţiile şi semnele de punctuaţie şi s-au transformat toate literele
51
52ANEXA C. EXEMPLU DE APLICARE A CRIPTĂRII/DECRIPTĂRII
litere mari. Acestui mesaj i se aplică funcţia de codificare Huffman bazată

pe tabela din anexa A. Rezultatul obţinut este textul clar.
Pentru acest exemplu vom considera textul Make love not War. Acesta
suferă următoarele transformări:
• eliminarea spaţiilor şi transformarea literelor ı̂n litere mari
M AKELOV EN OT W AR
• aplicarea funcţiei de codificare Huffman (rezultă textul clar)
00011 1011 01010110 001 10100 1000 0101010 001
0100 1000 1101 000011 1011 0111
procesul de criptare
După aplicarea procedurii cuvinte, mulţimea de producţii P 0 va arăta

cam aşa (se poate proba uşor urmărind paşii algoritmului):
C1 −→ 1|2|3|4|5|6|7|8|9
C −→ 0|1|2|3|4|5|6|7|8|9
N0 −→ λ N −→ 0|1|2|3|4|5|6|7|8|9
F −→ 0|1|2|3|4|5|6|7|8|9
T −→ 0|1|2|3|4|5|6|7|8|9
E −→ 0|1|2|3|4|5|6|7|8|9
S1 −→ 0|1|2|3|4|5|6|7|8|9
F −→ (0)|(1)|(2)|(3)|(4)|(5)|(6)|(7)|(8)|(9)
Le-am aşezat ı̂n ordinea ı̂n care apar ı̂n P 0 pe durata execuţiei algoritmu-
lui.
Se adaugă la sfărşitul textului clar marcatorul de sfârşit de fişier adică
codul Huffman al lui < EOF > (01010111010111) Rezultă şirul:
00011 1011 01010110 001 10100 1000 0101010 001
0100 1000 1101 000011 1011 0111 01010111010111
Voi ilustra printr-un tabel paşii pe care ı̂i execută algoritmul păna se
ascunde tot textul clar, arătând la fiecare pas ce derivare se foloseşte şi ce
bit se ascunde.
53
criptat Producţia Biţii

folosită ascunsi
S1 S1 −→ S1 ; E λ
S1 ; E E −→ T 0
S1 ; T T −→ T ∗ F 0
S1 ; T ∗ F F −→ (E) 0
S1 ; T ∗ (E) E −→ (E + T ) 1
S1 ; T ∗ (E + T ) T −→ F 1
S1 ; T ∗ (E + F ) F −→ N 1
S1 ; T ∗ (E + N ) N −→ 0 0
··· ··· ···

Ascunderea Informatiei in Text Folosind Gramatici de Tip LR - K

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Ascunderea Informatiei in Text Folosind Gramatici de Tip LR - K

Încărcat de

Drepturi de autor:

Formate disponibile

Ascunderea informaţiei in text folosind

gramatici de tip LR(k)

Traian Florin Serbănuţă

B Construcţia unei tabele de parsare 41

C Exemplu de aplicare a criptării/decriptării 51

1.1 Prezentarea lucrării

1.2 Scurtă istorie a steganografiei

Apparently neutral’s protest is thoroughly discounted and ig-

Pershing sails from NY June 1.

Cerneala invizibilă (simpatică) a fost folosită timp de

Cerneala invizibilă (simpatică) a fost folosită timp de

Prin suprapunerea celor două mesaje se obţine următorul mesaj:

Cerneala invizibilă (simpatică) a fost folosită timp de

Elementul neutru faţă de operaţia de concatenare se notează cu λ şi este

2.1.1 Gramatici independente de context

Definiţia 1.2 (Gramatică independentă de context):

Σ este o mulţime finită de simboluri numite simboluri terminale (alfabet)

S este un simbol din N , numit simbolul de start

P este o mulţime de perechi (A, α), unde A ∈ N şi α ∈ (N ∪ Σ)∗ . O astfel

Pe parcursul acestei lucrări, voi folosi litere mici de la ı̂nceputul alfa-

Definiţia 1.3 (derivare):

Definiţia 1.4 (Şir generat de o gramatică):

Definiţia 1.5 (Arbore asociat unei derivări):

Definiţia 1.6 (Limbaj generat de o gramatică):

Definiţia 1.7 (Gramatică ambiguă):

Deoarece pentru sistemul de criptare propus ne interesează ca fiecare şir

2.1.2 Gramatici de tip LR(k)

Definiţia 1.8 (derivare dreaptă):

Definiţia 1.9 (F irstk ):

Din definiţie se poate observa că F irst0 (α) = λ, ∀α ∈ (N ∪ Σ)∗ .

Vom mai avea nevoie de următoarea definiţie:

Definiţia 1.10 (Σ∗k ):

Dăm acum definiţia gramaticilor de tip LR(k):

Definiţia 1.11 (Gramatici de tip LR(k)):

Definiţia 1.12 (Extensia unei gramatici independente de context):

unde S 0 , $ nu aparţin mulţimii N ∪ Σ.

Gramatica extinsă G0 este aproape G, având ı̂n plus o nouă producţie

analiza sintactic w ı̂nseamnă a arăta algoritmic dacă w ∈ L(G). E de ı̂nteles

2.1.3 Algoritm de parsare pentru gramatici de tip LR(k)

Algoritmul 1.1: parsare(z, G, actiune, goto, π) Algoritmul testează apartenenţa

Intrare: z = a1 . . . an cuvânt, G gramatică LR(k), actiune şi goto tabelele

Algoritmul actionează ca un automat, folosind două stive, ı̂n felul următor

Configuraţia iniţială (0, z$, λ)

(sS, aW, π) ` (s0 asS, W, π)

(sS, aW, π) ` (tAs0 S 0 , aW, iπ)

(sS, aW, π) ` acceptare

(sS, aW, π) ` eroare

Starea curentă a automatului Se reduce

Construcţia tabelelor actiune şi goto

Definiţia 1.14 (Prefix viabil):

Definiţia 1.15 (Configuraţie LR(k)):

Definiţia 1.16 (Configuraţie LR(k) validă):

Definiţia 1.17 (Închiderea unei mulţimi de configuraţii LR(k)):

Algoritmul 1.2: Inchidere Închiderea unei mulţimi de configuraţii LR(k)

Intrare: I - mulţime de configuraţii LR(k)

Iesire: J - inchiderea mulţimii I

până când nu se mai adugă configuraţii noi

Următorul algoritm produce la ieşire mulţimea de configuraţii ı̂n care

Algoritmul 1.3: GOT O(I, X)

Intrare: I - mulţime de configuraţii LR(k), X ∈ N ∪ Σ

J ←− {A −→ αX.β; u|A −→ α.Xβ; u ∈ I}

Iar acum, definim mulţimile canonice LR(k) asociate gramaticii extinse

Algoritmul 1.4: conf ig(G0 )