Documente Academic
Documente Profesional
Documente Cultură
3 Surse de Informatie
3 Surse de Informatie
SURSE DE INFORMATIE
3.1. Informatia
3.1.1. Definitii si notatii
Definitie : Informatia este cantitatea de incertitudine pe care o avem asupra producerii unui
viitor eveniment, rezultat in urma unui experiment aleator.
Fie un experiment aleator ale carui rezultate sunt descrise prin v.a. X , care ia valori in
multimea X x1 , x 2 , , x n . Incertitudinea asupra evenimentului Ei , caruia ii corespunde
realizarea particulara xi , se noteaza:
i U X x Ux
U E
U de la uncertainty
Incertitudinea si informatia sunt, din punct de vedere cantitativ, doua notiuni echivalente.
Vorbim despre incertitudine inainte de producerea evenimentului si de informatie dupa
producerea sa.
U xi i xi
i de la information
Incertitudinea/informatia unui eveniment este o functie de probabilitatea de aparitie pi a
evenimentului:
U xi i xi F p i
Proprietati :
- informatia este totdeauna o cantitate pozitiva
- informatia adusa de un eveniment sigur este zero
3.1.3. Unitati de masura pentru informatie
a) BIT (BInary uniT)
Definitie : 1 bit este cantitatea de informatie care se obtine cand se realizeaza un eveniment
cu probabilitatea 1/2.
1bit log 2 1 / 2
Transformarea unitatilor :
1dit 3,32bit
1nat 1,44bit
unde U xi / y j este incertitudinea care ramane asupra lui xi dupa producerea lui y j (cand
se cunoaste y j ) .
p xi , y j
p xi p y j
p xi / y j 1 / 4
i x i , y j 1 2 1
Definitii :
Simbolul (sau litera) este elemental fundamental, ireductibil, care contine informatie.
x1 , x 2 , , x N sunt simboluri
Alfabetul este totalitatea simbolurilor diferite care pot fi generate de sursa.
X este alfabetul sursei
Cuvantul este o succesiune de simboluri (Exemplu: un byte este o succesiune de 8
simboluri binare).
Limba este totalitatea cuvintelor formate cu un alphabet (Exemplu: 256 de cuvinte
binare de 8 biti).
Exemple de surse discrete:
1. Banda cu text de la TV este o sursa care emite litere: IN TARA AU FOST
INUNDATII
2. Un semafor este o sursa cu trei simboluri: rosu, galben, verde
3. Un iPod este o sursa care genereaza simboluri binare care sunt convertite intr-o
melodie.
3.2.2. Clasificarea surselor discrete
a) Din punctual de vedere al dependentei dintre v.a X k .:
-
Definitie: Sursa fara memorie (simpla sau independenta) genereaza v.a. independente. Cu
alte cuvinte, probabilitatea de a genera un anumit simbol xi la momentul k nu depinde de
simbolurile generate anterior.
p ( X k xi / X k 1 , X k 2 ,...) p( X k xi )
sau i .
Un caz particular al surselor stationare este sursa ergodica. Pentru a defini sursa ergodica, ne
bazam pe notiunea de sir tipic.
Definitie: Sir tipic
Fie un sir de simboluri generat de sursa, suficient de lung a.i. sa putem estima
probabilitatile de aparitie a simbolurilor folosind definitia probabilitatii ca raport intre
numarul de cazuri favorabile si numarul total de cazuri.
Daca intr-un sir, probabilitatile astfel estimate ale simbolurilor sunt egale cu
probabilitatile din setul sursei, atunci sirul este tipic.
Altfel spus, daca n este lungimea sirului tipic considerat si ni este numarul de
simboluri x i din sir, atunci ni npi oricare ar fi i.
Definitie: O sursa ergodica este o sursa care genereaza numai siruri tipice.
Observatie: Definitiile stationaritatii si ergodicitatii de mai sus sunt valabile pentru sursa
fara memorie. In cazul sursei cu memorie, ele se enunta inlocuind notiunea de simbol cu cea
de stare (definitia starii estedata in subcapitolul de Surse Markov).
Surse discrete
Surse stationare
Surse ergodice
X 0,1
Alfabetul :
Probabilitatile de aparitie asimbolurilor sunt probabilitati conditionate, de forma
p ( X k x i / X k 1 , X k 2 )
p (0 / 0,0)
p (1 / 0,0)
Multimea starilor S 00
p (0 / 0,1)
p (1 / 0,1)
p (0 / 1,0)
p (1 / 1,0)
p (0 / 1,1)
p (1 / 1,1)
01 10 11
Multimea starilor are N R , unde N este dimensiunea alfabetului, iar R este ordinul sursei.
Definitie: Probabilitatea ca sursa Markov sa fie intr-o anumita stare este egala cu
probabilitatea de aparitie a sirului de simboluri care constituie starea.
Definitia II: O sursa Markov se defineste prin urmatoarele marimi:
Alfabetul simbolurilor: X x1 , x 2 , , x N
Setul de probabilitati ale simbolurilor: P X p1 , p 2 , , p N cu
Multimea starilor: S k s1 , s 2 , , s N k
pi p xi / s j q j
j
Fiecare simbol nou generat constituie, impreuna cu cele anterioare, o noua stare :
Exemplu : Sursa Markov binara de ordinul 2
p (1 / 0,0) p (1,0 / 0,0)
Probabilitatea ca sursa sa genereze simbolul 1 cand se afla in starea 0,0 este totuna cu
probabilitatea ca sursa sa treaca din starea 0,0 in starea 1,0.
Definitia II : O sursa Markov este o sursa cu memorie la care probabilitatea de aparitie a
unei stari nu depinde decat de starea anterioara.
3.3.2. Descrierea surselor Markov prin diagrame de stare
Exemplu : Sursa binara Markov de ordinul 2
S s1 , s 2 , s3 , s 4 00
p (0 / 0,0)
p (0 / 0,1)
p (0 / 1,0)
p (0 / 1,1)
01 10 11
p (0,0 / 0,0) 1 / 3
p (0,0 / 0,1) 2 / 3
p (0,1 / 1,0) 1 / 3
p (0,1 / 1,1) 1 / 4
01
1/4
1/5
2/3
11
3/4
4/5
1/3
10
00
1/3
2/3
Observatie : Descrierea prin diagrame de stare este utila cand sursa Markov este stationara.
3.3.3. Descrierea surselor Markov prin matricea de tranzitie si
prin vectorul probabilitatilor starilor
Definitie : Matricea de tranzitie are ca elemente probabilitatile conditionate ale sursei
Markov.
p1, 2
p N k ,1
p N k ,2
p1,1
p1, N k
p N k , N k
P S q1 q N R
Prin tranzitivitate:
P S k P S k 1 T P S k 2 T 2 P S 0 T k
P S 0 1 / 3 2 / 3
1/ 4
T
1/ 2
3 / 4
1 / 2