Sunteți pe pagina 1din 22

Bazele Tehnologiei Informaţiei

Curs 3
Codificarea informatiei

Un simbol este un element fundamental ce conţine o informaţie.


Toate simbolurile care pot fi generate de o sursă se constituie într-un
alfabet al sursei respective. Realizarea unei corespondenţe între
cuvintele (un cuvânt este o succesiune finită de simboluri) a două
alfabete diferite este o formă de codare.
Pentru o sursă care emite simboluri informaţia este maximă dacă
în cadrul acestui experiment evenimentele sunt echiprobabile. Ca
atare, redundanţa unei surse reprezintă diferenţa dintre entropia
informaţională maximă posibilă şi cea reală (astfel aflăm care este
măsura în care sursa emite simboluri în mod inutil).
În realizarea unei codificări se va considera capacitatea codului
(sau valoarea maximă a entropiei alfabetului codului), eficiența
(raportul dintre lungimea medie minimă şi lungimea medie a unui
cuvânt de cod) și redundanța acestuia (mărime complementară
eficienţei).
Codificarea informatiei
Codificarea informatiei
 Lungimea secventei de cod
 fixa
 variabila

Codurile pot fi numerice și alfanumerice.


Coduri alfanumerice

 Exemple de coduri alfanumerice:


 BCD (Binary Coded Decimal). Secvența de cod are 6 biți/caracter.
 EBCDIC (Extended Binary Coded Decimal Information Interchange). Secvența de cod
are 8 biți/caracter.
 ASCII (American Standard Code for Information Interchange). Secvența de cod are 8
biți/caracter. Care este numărul maxim de caractere ce se poate reprezenta
utilizând ASCII?
 Unicode – oferă suport schimburilor electronice de date, procesării şi afişării
textelor scrise în diverse limbi internaţionale. Secvența de cod are 16
biți/caracter. A fost adoptat de mari companii internaţionale, printre care: Apple,
HP, IBM, Microsoft, Oracle, Sun, Unisys, ş.a. Ultima versiune – 2016 – v9.0 (suport
pentru > 128.000 caractere – printre ultimile caractere introduse sunt cele emoji).
Caracter Codul Codul Codu
ul ASCII EBCDIC l
Unicod
0 0011 1111 e(0030)
0000 0000 H
1 0011 1111 (0031)
0001 0001 H
2 0011 1111 (0032)
0010 0010 H
3 0011 1111 (0033)

Coduri alfanumerice
0011 0011 H
……
. 9 0011 1111 (0039)
1001 1011 H
a 0110 1000 (0061)
Coduri normalizate pentru care 0001 0001 H
partea stângă permite identificarea b 0110 1000 (0062)
imediată a naturii informației 0010 0010 H
….
codificate: litere, cifre, funcții, iar .z 0111 1010 (007A)
următoarele poziții ale codului sunt 1010 1001 H

organizate astfel încât să permită A 0100 1100 (0041)


0001 0001
conversia pentru calcule sau B 0100 1100
H

(0042)
ordonare alfabetică. 0010 0010 H
….
.Z 0101 1110 (005A)
1010 1001 H
LF(linefee 0000 0010 (000A)
d) 1010 0101 H
ASCII
ASCII
ASCII
ASCII
ASCII
ASCII
Coduri numerice
 Ponderate
 Neponderate

 Codurile ponderate (zi sunt cifrele zecimale de la 0 la 9) sunt codurile în care


fiecărei cifre de cod îi este asociată o pondere, iar valoarea cifrei zecimale se
obţine prin înmulţirea cifrei de cod cu ponderea asociată (P j este ponderea
asociata rangului j) şi însumând valorile:
Coduri ponderate

 Codul 8421: codul binar-zecimal natural, cu ponderi puteri ale lui 2


 Codul 2421 (Aiken): cod autocomplementar
 Codul 8421: ultimile două sunt ponderi negative, cod
autocomplementar
 Codul bichinar (50 43210): secvenţe de câte 7 simboluri binare
împărţite în două grupe
Coduri ponderate
Coduri ponderate
Coduri neponderate

 Codul Exces 3 – autocomplementar


 Codul Gray – două secvenţe de cod consecutive diferă printr-o singură
poziţie binară
 Codul 2 din 5 – cod pseudo-ponderat; secvenţele de cod pentru
cifrele zecimale 1-9 au asociate ponderile 74210 cu excepţia cifrei 0.
Dintre cele 5 cifre binare doar două sunt semnificative.
Coduri neponderate
Coduri de bare
 Codul de bare 2 din 5 – două linii late şi trei înguste. Raportul de imprimare
linie lată/îngustă este de 2:1 sau 3:1. Spaţiile nu conţin informaţie (la “codul
2 din 5 intercalat” densitatea informaţiei este mai mare deoarece şi spaţiile
conţin informaţii în acelaşi mod ca şi liniile)
Coduri de bare

 Exemplu: reprezentarea numărului 10 cu ajutorul codului de bare 2


din 5.
 1 - linie lată
 0 – linie îngustă
Codul QR Quick Response

 Cod de bare matricial (bi-dimensional)


 Codul QR Code (Quick Response Code) este un cod de bare 2D matrix.  Poate
codifica pana la 2509 caractere numerice sau 1520 de caractere alfanumerice si
ofera 3 nivele de control al erorilor.  Cel mai mic cod QR este de 21 X 21 cells
(fiecare cell codifica un bit) si poate merge in multiplu de 4 cells pana la marimea
de 105 X 105 cells. 
 Patratele din coltul din stanga jos, stanga sus si dreapta sus sunt pentru
recunoasterea tipului.
 Standard in 1996.
Bibliografie
 Floarea Nastase, Razvan Zota, Bazele tehnologiei
informatiei, Editura ASE, Bucuresti, 2005, paginile 51-59.
 Iuliana Dorobat, Bazele tehnologiei informatiei aplicatii,
Editura ASE, Bucuresti, 2018.
 https://profs.info.uaic.ro/~fliacob/An1/2007-2008/Utilit
ati/U11/Despre%20entropie/Informatie%20si%20entropie
%20(%20Problema%20entropiei%20maxime%20).pdf
 https://towardsdatascience.com/the-intuition-behind-sh
annons-entropy-e74820fe9800
 http://www.unicode.org/emoji/charts/full-emoji-list.ht
ml
 http://www.asciitable.com/
 https://blog.hubspot.com/blog/tabid/6307/bid/29449/h
ow-to-create-a-qr-code-in-4-quick-steps.aspx

S-ar putea să vă placă și