Sunteți pe pagina 1din 5

Compresia datelor

Compresia datelor se ocup cu reprezentarea informaiei ntr-o form


compact. Acest lucru se realizeaz prin identificarea i extragerea redundanei din
date. Datele pot fi caractere dintr-un fiier text, numere ce reprezint eantioane ale
unor semnale vocale sau de imagine etc.
Exemple de compresie :
- codul Morse, care aloc literelor ce apar mai des n cuvinte mai puine semne
(linie, punct) i celor mai rare, mai multe semne;
- alfabetul Braille, care folosete tablouri de puncte de dimensiuni 2x3, n care
punctele sunt distribuite n funcie de probabilitile de apariie a literelor n cuvinte.
n aceste exemple de compresie s-a folosit structura statistic a cuvintelor, dar mai
exist i alte caracteristici ale semnalelor ce pot fi folosite n scopul realizrii
compresiei. Astfel, n timpul vorbirii, construcia fizic a cavitii bucale dicteaz
tipul de sunete ce se produc, adic mecanica producerii vorbirii impune structura
vorbirii, prin urmare, n loc de a transmite vorbirea nsi, s-ar putea transmite
informaii cu privire la conformaia cavitii bucale, care ar putea fi folosite la
recepie pentru a sintetiza vorbirea. n acest sens, o cantitate adecvat de informaie
privind conformaia cavitii bucale poate fi reprezentat mai compact dect
numerele ce reprezint eantioanele semnalului vocal.
n compresie mai pot fi folosite caracteristicile utilizatorului datelor. De multe
ori, cnd se transmit semnale sonore sau vizuale, acestea sunt destinate percepiei
umane, dar oamenii au posibiliti de percepie limitate.De exemplu, oamenii nu pot
auzi frecvene foarte nalte, pe care, ns, unele animale le pot percepe. Aadar, nu are
rost a transmite informaii ce nu pot fi percepute, astfel nct informaiile irelevante
nu mai trebuie transmise.
Cu toate c n ultimul timp capacitatea de stocare i transmitere a informaiei a
crescut mult (de exemplu compact discul i fibra optic), aceasta nu rspunde pe
deplin cerinelor practice, motiv care justific necesitatea compresiei fiierelor de
dimensiuni mari ce trebuie stocate sau transmise. n cazul stocrii, pentru a crete
volumul de date ce poate fi stocat, cum este cazul fiierelor grafice, se folosesc
metode care comprim datele la stocare i le decomprim la redare. n cazul
transmiterii, limea de band a semnalelor digitale este foarte mare, n comparaie cu
a canalelor disponibile, astfel nct compresia datelor la emitor este absolut
necesar pentru a putea folosi canalul. La recepie are loc operaia de decompresie.
De exemplu, semnalul TV de nalt definiie, HDTV, necesit pentru transmiterea
fr compresie aproximativ 884 Mbii/secund. Pentru a transmite aceast cantitate
mare de informaie, ar fi necesar un canal cu banda de cca. 220 MHz. Folosind
compresia, este necesar a transmite mai puin de 20 Mbii /sec, care, mpreun cu
semnalul audio, pot fi transmii ntr-o band de 6 MHz.

Coala

Mod Coala nr. Document Semnt. Data


Comparaie ntre un fiier audio necomprimat (WAV) i unul comprimat (MP3)
Tehnici de compresie i decompresie
Compresia fr pierderi (compresie lossy)
Dup cum arat numele, aceasta nu implic pierderea de informaie, datele
iniiale fiind refcute exact din cele compresate. Aceast compresie se folosete de
obicei pentru semnale discrete ca text, date generate de calculator, unele tipuri de
informaie video, deoarece refacerea exact este esenial n cazul textelor (sensul
comunicrii), unor imagini (imagistic pentru diagnostic), numere (comunicri
bancare) etc. n anumite domenii o pierdere de date relativ mic poate fi tolerat,
dac gradul de comprimare necesar nu se poate atinge altfel; compresia audio i
video digital, precum i compresia imaginilor suport o anumit pierdere de date,
fr nrutirea evident a rezultatelor. Compresia cu pierdere de informaie, mai este
cunoscut i sub numele de compresie ireversibil.
Compresie audio

Compresia audio este destinat reducerii mrimii fiierelor audio. Algoritmii de


comprimare audio se refer la codec-urile audio.
Compresie video

Compresia video este procedeul prin care se reduce cantitatea de date utilizate pentru
prezentarea de imagini video.
Compresia imaginilor

Compresia cu fractali i compresia cu reele neurale sunt dou din compresiile lossy
folosite n compresia imaginilor.

Coala

Mod Coala nr. Document Semnt. Data


Compresia cu pierderi (compresie lossless)

Compresia cu pierderi conduce la o rat de compresie superioar cu preul


pierderii de informaie, datele care au fost supuse compresiei neputnd fi refcute
exact. Aceast compresie este mai eficient cnd se aplic semnalelor imagistice sau
sonore, caz n care pierderea de informaie din afara percepiei vizuale sau auditive
umane poate fi tolerat. Multe tehnici de compresie cu pierderi pot fi ajustate la
diferite nivele de calitate. Evident, creterea acurateei semnalului refcut se obine cu
preul unei compresii mai reduse. Volumul compresiei depinde att de mrimea
redundanei sursei, ct i de eficiena reducerii acesteia.
Se mai numete i metod de compresie reversibil sau cu pstrarea biilor. La
decodificare se obin exact datele iniiale. Acest gen de codificare este cel mai ntlnit
i se aplic n general n situaiile n care refacerea fr eroare este esenial:

programe executabile: BIN, ELF, EXE, SDC, BAT


surse de programe
arhivare (fiiere comprimate): 7-
Zip, TAR, GZIP, WinZIP, LZW, ARJ, WinRAR, SDC
fiier text: ODT, TXT, DOC, RTF
fiiere audio: FLAC (Free Lossless Audio Codec), ALAC (Apple
Lossless), MPEG-4 ALS, TTA (True Audio Lossless), Monkey's Audio
imagerie medical (DICOM, PET/CT, IRM), imagini satelit, scheme, desene
tehnice.

Evaluarea compresiei
Un algoritm de compresie poate fi evaluat n funcie de:
- necesarul de memorie pentru implementarea algoritmului;
- viteza algoritmului pe o anumit main;
- raportul de compresie;
- calitatea reconstruciei.
De obicei, ultimele dou criterii sunt eseniale n adoptarea algoritmului de
compresie.
Uzual, performanele compresiei pot fi exprimate prin raportul de compresie i
rata de compresie.
Raportul de compresie este raportul dintre numrul de bii necesar reprezentrii
datelor nainte i dup compresie.
Rata de compresie reprezint numrul mediu de bii necesar reprezentrii unui
eantion.
n compresia cu pierderi, versiunea reconstruit difer de varianta original i,
pentru a determina eficiena algoritmului de compresie, trebuie s existe mijloace de
apreciere a diferenei dintre semnalul original i cel reconstruit. Diferena dintre
semnalul original i cel reconstruit se numete distorsiune. Tehnicile de compresie cu

Coala

Mod Coala nr. Document Semnt. Data


pierderi se folosesc de obicei pentru compresia semnalelor analogice, care se mai
numesc forme de und, motiv pentru care compresia semnalelor analogice mai poart
denumirea de codarea formelor de und. n cazul codrii semnalelor video i sonore
destinatarul este, de obicei, omul, al crui rspuns este dificil de apreciat, motiv
pentru care se folosesc msuri aproximative de determinare a calitii reconstruciei.
Ali termeni folosii n aprecierea diferenei dintre semnalul original i cel
refcut este fidelitatea i calitatea. Acestea sunt cu att 5 mai ridicate, cu ct diferena
dintre versiunea reconstruit i cea original a sursei este mai mic.
Modelare i codare
Cerinele reconstruciei sunt cele ce impun dac compresia este cu sau fr
pierderi, schema exact depinznd de un numr de factori. Unii din cei mai
importani sunt impui de caracteristicile datelor destinate compresiei, de exemplu, o
tehnic de compresie poate fi eficient pentru compresia unui text, dar total
ineficient pentru imagini. Fiecare aplicaie prezint particulariti specifice.
Dezvoltarea algoritmilor de compresie pentru o varietate de date cuprinde dou
faze:
- prima faz se refer de obicei la modelare, cnd se ncearc extragerea
informaiei despre orice redundan din date i descrierea acesteia sub forma unui
model;
- a doua faz este codarea.
N CE CONST COMPRESIA DATELOR?
Probabil c unii i imagineaz c atunci cnd folosesc un program de compresie a
datelor, gen WinRar, WinZip, 7-Zip etc., datele sunt n mod misterios ngrmdite
unele peste altele, ocupnd astfel mai puin spaiu pe mediul de stocare. Desigur c
lucrurile nu stau chiar aa. Calculatoarele stocheaz orice tip de informaie cu ajutorul
a dou semne, 0 i 1, iar s faci din acestea unele mai mici, nu prea merge.

Aadar, este nevoie de o alt tehnic. Care este aceea? Simplu spus, compresia
datelor nseamn identificarea unor elemente comune (a unui model, mod de

Coala

Mod Coala nr. Document Semnt. Data


organizare) n modul de distribuire a datelor dintr-un fiier ce urmeaz s fie
comprimat i folosirea acestor elemente comune, folosind algoritmi matematici,
pentru a elimina parte din date, fr a afecta informaia. Adic, de exemplu, n cazul
unui fiier audio, se pot elimina pri ce sunt asociate unor frecvene care oricum nu
sunt sesizabile de urechea uman.

Multe tipuri de fiiere folosesc datele n mod neeconomicos, adic folosesc aceleai
secvene de date de mai multe ori. Prin compresie, aceste secvene sunt determinate,
codificate i folosite n aa fel nct spaiul folosit pe disc s fie ct mai mic cu
putin.
Iat un exemplu simplu de algoritm de comprimare:
Avem textul:
"FIIERELE IMAGINI SUNT DE MAI MULTE FELURI: FIIERE JPEG,
FIIERE GIF, FIIERE, PNG ETC. FIIERELE AUDIO SUNT DE MAI MULTE
TIPURI, DE ASEMENEA."
Dup cum se observ cu uurin, n textul de mai sus, "fiiere" apare de 3 ori, "de"
apare de 3 ori, "fiierele" apare de 2 ori, spaiile goale apar de 22 ori. Putem asocia
operaiunii de compresie un mic dicionar unde "fiiere" este 1, "de" este 2, "fiierele"
este 3 i aa mai departe. n felul acesta, atunci cnd apare n text un oarecare cuvnt
care se repet, n loc s fie folosit cuvntul respectiv, este folosit semnul din
dicionar, care ocup mult mai puin spaiu. Se pot urmri cuvintele care se repet, ori
asocieri de litere. Atunci cnd textul este mic, economia de spaiu este neglijabil,
cnd ns textul este mare, aceasta devine relevant.
Acesta este un exemplu foarte simplu. n realitate lucrurile sunt mult mai complicate,
iar crearea unui algoritm de compresie ct mai bun este o perpetu provocare pentru
experii IT. n funcie de tipul de informaie, text, imagine, video ori audio, sunt
folosite metode de comprimare diferite, cci fiecare tip de informaie are
caracteristicile sale la care se preteaz maniere de abordare privind compresia
diferite.

Coala

Mod Coala nr. Document Semnt. Data

S-ar putea să vă placă și