Sunteți pe pagina 1din 24

2.

REPREZENTAREA NUMERIC A
SEMNALULUI VOCAL
Reprezentarea numeric implic urmtoarele operaii:

eantionarea efectuat cu o frecven F
e
compatibil cu cerinele
impuse de teorema eantionrii;
cuantizarea fiecrui eantion cu un pas de cuantizare q,
ales n funcie de precizia dorit pentru reprezentare;
codarea adecvat aplicaiei particulare.
1. Eantionarea

spectrul semnalului vocal se poate ntinde pn la 12 kHz
==> ar trebui aleas o frecven de eantionare F
e
= 24 kHz
==> costuri (filtrare, transmisie, nregistrare etc.) ridicate.
n cazul transmisiilor telefonice spectrul semnalului vocal
este limitat la 3.4 kHz
==> se alege frecvena de eantionare F
e
= 8 kHz.
n aplicaii de sintez sau recunoatere a vorbirii, valoarea
frecvenei de eantionare crete (de exemplu: F
e
= 16 kHz).
semnalul audio (voce plus muzic) pretinde o bun
reprezentare n domeniul frecven pn la peste 20 KHz
==> utilizarea unei frecvene de eantionare F
e
= 44 - 48 kHz.
2. Cuantizarea

operaia de cuantizare a eantioanelor produce o eroare care
se comport ca un zgomot alb suprapus peste semnal.
pasul de cuantizare q va fi impus de ctre raportul
semnal/zgomot dorit.
n cazul transmisiei telefonice fiecare eantion este
reprezentat pe 8 bii.
cuantizarea semnalului audio necesit o eroare de cuantizare
mai mic, folosindu-se cuvinte de 16 bii.
caracteristica esenial care rezult din modul de
reprezentare este debitul binar (debitul informaional) [bii/s].
transmisia telefonic necesit un debit de 8000 8 = 64 Kb/s.
transmisia sau nregistrarea unui semnal audio necesit un
debit de pn la 48000 16 = 768 Kb/s.
3. Codarea

a) Codarea direct a semnalului
(waveform coding = codarea formei de und).
[PCM Pulse Code Modulation, DPCM Differential PCM, ADPCM
Adaptive Differential PCM, DM Delta Modulation, ADM Adaptive Delta
Modulation, SBC Sub-Band Coding, ATC Adaptive Transform Coding etc.]
b) Codarea parametric
(source coding = codarea sursei).
parametrii ce caracterizeaz transmitana tractului vocal
(ctigul o i coeficienii a
i
);
parametrii ce caracterizeaz modul de excitaie al tractului
vocal (zgomot alb sau tren de impulsuri periodice).
Clasificarea sistemelor de codare n funcie de debitul binar
Tipul codrii Debitul biniar [kb/s] Denumirea calitii
codrii
Codarea semnalului
(WAVE-FORM
CODING)
> 64 (64-768)
16 64
4,8 16
Calitate specific
radiodifuziunii
Calitate C.C.I.T.T.
Calitate acceptabil pentru
comunicaii
Codarea sursei
(SOURCE CODING)
0,1 4,8 Calitate sintetic
Complexitatea relativ a sistemelor de codare a vorbirii
Sistemul Prescurtarea Complexitatea relativ
Modulaia delta
adaptiv
ADM 1
Modulaia
impulsurilor n cod
adaptiv
ADPCM 2
Codarea n sub-benzi SBC 5
Codarea adaptiv a
transformatei
ATC 50
Codare LPC
(parametric)
LPC 100
Vocoder formantic - 500
3. PROPRIETI STATISTICE ALE
SEMNALULUI VOCAL
semnalul vocal = realizare particular a unui proces aleator nestaionar.
dou tipuri de statistic:
statistic pe termen lung
- proprietile statistice medii ale semnalului vocal sunt
estimate pe intervale de timp de ordinul ctorva zeci de
secunde i mediate pe mai muli vorbitori;
statistic pe termen scurt
- evaluarea proprietilor statistice pe trane temporale
de ordinul a 10-30 ms, n decursul crora semnalul
poate fi considerat cvasistaionar.
1000 2000 3000 4000 5000 6000 7000 8000
-2500
-2000
-1500
-1000
-500
0
500
1000
1500
2000
2500
Esantioane
Reprezentarea n timp a semnalului vocal obinut la pronunarea cuvntului ase

1700 1750 1800 1850 1900 1950 2000 2050 2100
-2500
-2000
-1500
-1000
-500
0
500
1000
1500
2000
2500
Esantioane
3000 3100 3200 3300 3400 3500 3600
-2500
-2000
-1500
-1000
-500
0
500
1000
1500
2000
2500
Esantioane
a
s
Caracteristici statistice ale semnalului vocal
Principalele caracteristici statistice ale semnalului vocal sunt:
densitatea de probabilitate;
valoarea medie;
variana;
rata trecerilor prin zero;
funcia de autocorelaie;
funcia de autocovarian;
coeficientul de autocorelaie;
densitatea spectral de putere;
densitate spectral de putere pe termen scurt.

1. Densitatea de probabilitate
N

- reprezint numrul de eantioane din semnalul x[n]


ale cror amplitudini sunt cuprinse n intervalul
,
2 2


A A
(
+
(

| |
, n N N e atunci cnd
densitatea de probabilitate a semnalului x[n] (pp. ergodic i staionar)
( )
0
lim
2 1
x
N
N
p
N

A
=
+
estimri experimentale ale acestei densiti de probabilitate,
realizate pe segmente de vorbire de ordinul a 50 secunde i
mediate pe cteva zeci de vorbitori, au artat c aceast
densitate de probabilitate este apropiat de distribuia Laplace.
Legea de repartiie
Expresie analitic ( )
x
p ( 0
x
m = )
Uniform
( )
1
rect
2
a
a

Gaussian (normal)
2
2
1
exp
2
2
x
x

o
t o
(

(


Laplace (biexponenial)
2
1
exp
2
x
x

o
o
(

(

Gamma (de ordinul 1/2)
3
3
exp
8 2
x x

to o
(


(
(

Expresiile a 4 legi de repartiie uzuale
2. Valoarea medie
Valoarea medie a unui semnal staionar (dac variabila
aleatoare este continu) este dat de relaia:
( )
d
x x
m p

=
}
n cazul semnalelor discrete:
| | { } | |
1
lim
2 1
N
x
N
n N
m E x n x n
N

=
= =
+

Pentru semnalul vocal aceast medie va fi presupus nul
(ea nu conine nici o informaie util).
3. Variana
cazul analogic - variana este dat de relaia:

( ) ( ) ( ) ( )
2
2 2
0
d d
x
x x x x
m
m p p o

=

= =
} }
pentru semnale discrete de medie nul, relaia de definiie este:
| |
2 2
1
lim
2 1
N
x
N
n N
x n
N
o

=
=
+

acest parametru reprezint energia medie a semnalului.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.5
1
1.5
2
2.5
x 10
8
Energie/interval
Timp (s)
Evoluia varianei (energiei) pe termen scurt a semnalului
vocal corespunztor cuvntului ase, estimat pe trane
de 200 eantioane (25 ms)
4. Rata trecerilor prin zero
Pentru un semnal eantionat se consider c exist treceri prin zero
atunci cnd dou eantioane succesive au semnul opus.
Rata trecerilor prin zero pe termen scurt se determinat cu formula:
| | | |} | |} { {
1
1
sgn sgn 1
2
mN N
n mN
Z m x n x n
N
+
=
=

me
- indicele tranei
N = lungimea tranei
Rata trecerilor prin zero pe termen lung prezint o repartiie
apropiat de cea gaussian, cu o valoare medie de 0.49 pentru
fonemele nesonore i de 0.14 pentru cele sonore.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Rata de treceri prin zero/interval
Timp (s)
Rata trecerilor prin zero pentru cuvntul ase
5. Funcia de autocorelaie
pentru un semnal aleator discret funcia de autocorelaie
se exprim prin sperana matematic (media statistic):
| | | | | | { }
xx
k E x n x n k = +
pentru un semnal staionar i ergodic:
| | | | | | | | | |
1
lim
2 1
N
xx
N
n N
k x n x n k x n x n k
N

=
= + = +
+

pentru o tran de lungime finit (N eantioane):
| | | | | |
1
0
1

N k
xx
n
k x n x n k
N k


=
= +


Proprieti ale funciei de autocorelaie:
funcie par:
| | | |
xx xx
k k =
| |
{ }
| |
max 0
xx xx
k =
dac | | | | | | | |
xx xx
x n x n N k k N = + = +
6. Funcia de autocovarian
relaie similar cu cea a funciei de autocorelaie,
dup ce n prealabil s-a extras valoarea medie:
| | | | ( ) | | ( ) { }
| |
| | ( ) | | ( ) | |
semnal ergodic
2
xx x x
x n
x x xx x
k E x n m x n k m
x n m x n k m k m

=
= + =
= + =
n cazul semnalului vocal media a fost presupus nul
==> funcia de autocovarian = funcia de autocorelaie:
| | | |
xx xx
k k =
| | | |
2
0 0
x xx xx
o = =
7. Coeficientul de autocorelaie
Coeficientul de autocorelaie reprezint funcia de autocorelaie
normat la valoarea sa maxim:
| |
| |
| |
0
xx
xx
xx
k
k

=
| | | |
1,1
xx
k e
n cazul tranei sonore, funcia de autocorelaie este
cvasiperiodic i n primul maxim diferit de cel din origine
permite determinarea frecvenei fundamentale
n cazul tranei nesonore, funcia de autocorelaie nu mai este
periodic i n general nu mai conine maxime comparabile
cu cel din din origine.
0 20 40 60 80 100 120 140 160 180 200
-0.5
0
0.5
1
k
0 20 40 60 80 100 120 140 160 180 200
-0.5
0
0.5
1
k
Coeficientul de autocorelaie pe termen scurt
pentru o tran sonor (sus), respectiv nesonor (jos)
0
0
1 1 8000
133 Hz
60
e
e
F
F
T P T P
= = = = =

8. Densitatea spectral de putere


Densitatea spectral de putere se definete prin
transformata Fourier a funciei de autocorelaie:
( ) ( ) | | { } | |
j j jk
xx xx xx xx
k
S e e k k e
e e e

=
= u = =

F
2
e
f
F
e t =
O estimare a acesteia se obine lund o secven de lungime
finit din funcia de autocorelaie, utiliznd o fereastr de ponderare:
( ) ( ) | | | | | |

K
j j jk jk
xx xx xx xx
k k K
S e e w k k e k e
e e e e


=
= u = =

9. Densitatea spectral de putere pe termen scurt
Pe termen scurt semnalul vocal se poate presupune cvasistaionar
==> se poate folosi transformata Fourier de la semnalele deterministe:
( )
| | | |
,
j jm
m
X n e x m w n m e
e e
=

0 500 1000 1500 2000 2500 3000 3500 4000


40
50
60
70
d
B
Hz
0 500 1000 1500 2000 2500 3000 3500 4000
25
30
35
40
45
Hz
d
B
DSP (ts)
sonor
DSP (ts)
nesonor

S-ar putea să vă placă și