Sunteți pe pagina 1din 21

ACSTICA DEL TRACTO VOCAL

Federico Miyara

1. INTRODUCCIN

El tracto vocal puede considerarse en primera aproximacin como un conducto


cuya seccin transversal cambia con la posicin a lo largo de su eje. Debido a los diver-
sos mecanismos articulatorios ya comentados, la forma y dimensiones de dicha seccin
tambin experimentan, en principio, una evolucin en el tiempo. No obstante, desde el
punto de vista de los fenmenos acsticos involucrados esta evolucin es muy lenta y
entonces podemos suponer que el sistema es estacionario.
Nos proponemos estudiar el comportamiento del sonido en el interior de este tipo
de conducto. Para asentar los conceptos fsicos a utilizar, consideraremos inicialmente
el caso ms simple de un tubo cilndrico.

2. LA ECUACIN DE ONDA

2.1. Ecuacin de onda en un tubo de seccin constante [1]

Consideremos un tubo cilndrico de seccin transversal A y extensin infinita co-


mo el indicado en dos instantes de tiempo (figura 1). Las dos regiones sombreadas co-
rresponden a la misma porcin de gas. En la parte superior de la figura la presin total
es constante e igual a la presin atmosfrica, Po. En la parte inferior la porcin de aire

Po Po

xx x + x

x + y

Po + p Po + p + p

x x+y x + y + x + y

Figura 1. Un tubo de seccin constante en dos instantes de tiempo di-


ferentes. Arriba, en estado de equilibrio. Abajo, un pequeo volumen
de aire se ha desplazado y expandido.

1
se ha desplazado una distancia y, y su espesor pas de valer x a valer x + y. La pre-
sin se ha modificado en un valor p, en la cara izquierda y p + p en la cara derecha,
dando lugar a una fuerza neta que acta sobre el volumen de gas. Tanto el desplaza-
miento como el incremento de presin son funciones de las dos variables x y t, es decir,
y(x, t) y p(x, t). Llamaremos presin sonora al incremento de presin p(x, t).
Podemos aplicar la segunda ley de Newton. Para ello tengamos en cuenta que si la
densidad del aire es o, entonces la masa de dicha porcin es o A x. La fuerza neta
que acta en la direccin del movimiento puede calcularse teniendo en cuenta que a la
presin del lado izquierdo es Po + p, mientras que del lado derecho es Po + p + p:

(Po + p) A (Po + p + p) A = p A.

Entonces, dado que la aceleracin es yt t, resulta

p A = o A x yt t.

Dividiendo por A y por x y pasando al lmite cuando x 0, se obtiene

px = o yt t. (1)

Esta es una ecuacin diferencial en derivadas parciales con dos funciones incgnitas: la
presin p y el desplazamiento y. Se necesitar otra ecuacin que las vincule para poder
despejarlas. Dicha ecuacin puede obtenerse mediante las relaciones que existen entre el
volumen y la presin en un medio gaseoso. Si la temperatura fuera constante (proceso
isotrmico), la relacin sera la ley de Boyle:

PV = cte.

Pero el gradiente de temperatura es muy bajo y la conductividad trmica del aire tem-
bin, por lo que el intercambio de calor es despreciable. El proceso resulta, por consi-
guiente, adiabtico. Las compresiones adiabticas responden a la ley

PV = cte. (2)

donde = CP/CV, es decir el cociente entre las capacidades calorficas a presin cons-
tante y a volumen constante. Para gases diatmicos, como el aire, 1,4. De la ecua-
cin 2 podemos obtener la expresin incremental

dP dV
= . (3)
P V

En el presente caso, dP = p, P = Po, dV = Ay, V = Ax, de donde

p y
= .
Po x

Pasando al lmite cuando x 0, resulta,

2
p
= yx . (4)
Po

Tenemos ahora dos ecuaciones, (1) y (4), que vinculan las incgnitas funcionales
p(x, t) e y(x, t). En general estamos ms interesados en la presin que en el desplaza-
miento, debido a que es la magnitud que puede medirse directamente con mayor facili-
dad (utilizando un micrfono como transductor). Derivando la ecuacin (1) con respecto
a x y la (4) dos veces con respecto a t, tenemos, finalmente,

Po
ptt = p xx , (5)
o
o bien
ptt = c 2 p xx , (6)

ecuacin conocida como ecuacin de onda unidimensional. La constante c es la veloci-


dad del sonido.
Es posible demostrar que la solucin general de la ecuacin (6) est dada por

p(x, t) = f(x ct) + g(x + ct). (7)

donde f y g son dos funciones arbitrarias de una variable derivables dos veces.1 Cada
trmino de esta ecuacin puede interpretarse de un modo muy sencillo. Por ejemplo, si
en el trmino f(x ct) tomamos t = 0, tendremos la distribucin inicial de presin, co-
mo se indica en la parte superior de la figura 2. Luego de un tiempo t > 0 la nueva dis-
tribucin de presin es la que se indica en la parte inferior. Vemos que cualquier rasgo
distintivo (por ejemplo un pico) de la presin se ha movido una distancia ct hacia la
derecha. Es importante notar que lo que se propaga es la distribucin de presin, no la
materia.

f(x)

x
xo

f(x ct)

x
xo + ct

Figura 2. Propagacin de una onda a lo largo del tubo. Arriba se indica la distri-
bucin inicial (t = 0) de la presin a lo largo del tubo. Abajo se observa cmo luego
de un tiempo t > 0 la distribucin de presin se ha desplazado una distancia ct.

1
Es fcil verificar que la funcin dada por la ecuacin (7) es solucin, para lo cual basta calcular las
derivadas correspondientes. Pero adems, todas las soluciones de la ecuacin (6) son de esta forma.

3
2.2. Ecuacin de onda en un tubo de seccin variable [2]

Consideremos ahora un tubo cuya seccin transversal es A(x) como el indicado en


dos instantes de tiempo en la figura 3. Nuevamente, las dos regiones sombreadas co-
rresponden a la misma porcin de gas. En la parte superior de la figura se representa la
situacin de equilibrio, es decir en ausencia de perturbaciones. La presin total es cons-
tante e igual a la presin atmosfrica, Po. En la parte inferior la porcin de aire se ha
desplazado una distancia y y se ha descomprimido desde un espesor x a uno x + y.
Mientras tanto, la presin sufri un incremento p en la cara izquierda y p + p en la cara
derecha, y la seccin cambi de A(x) a A(x + y). 2

A(x)

Po Po

x x + x

x + y
A(x + y)
Po + p + p
Po + p

x + y + x + y
x+y

Figura 3. Un tubo de seccin variable en dos instantes de tiempo dife-


rentes. Arriba, en estado de equilibrio. Abajo, un pequeo volumen de
aire se ha desplazado y expandido.

Apliquemos ahora la segunda ley de Newton a la porcin de aire. En este caso la


masa de es o A(x) x. La fuerza neta que acta en la direccin del movimiento puede
calcularse a partir de las presiones del lado izquierdo y derecho:

(Po + p) A(x + y) (Po + p + p) A(x + y) = p A(x + y).

Dado que normalmente y es pequeo, puede aproximarse A(x + y) mediante un desarro-


llo de Taylor de primer grado:

A(x + y) A(x) + A(x) y. (8)

2
A diferencia del caso anterior, en el que la seccin era constante, es decir A(x) = A, ahora las secciones
a uno y otro lado de la porcin analizada son diferentes (por ejemplo, A(x) y A(x + x) en la situacin
de equilibrio). Sin embargo, dado que haremos tender x a 0, la diferencia no ser importante. En
cambio s es importante diferenciar A(x) y A(x + y), ya que y, pese a ser pequeo, no tender a 0.

4
Entonces la fuerza neta actuante vale

p A(x + y) p [A(x) + A(x) y].

Aplicando la ley de Newton,

p A(x + y) = o A(x) x yt t.

Dividiendo por A(x) y por x y pasando al lmite cuando x 0, se obtiene

A' (x )
p x 1 + y = o y tt .
A( x )
(9)

Esta ecuacin diferencial en derivadas parciales es no lineal, lo cual complica notable-


mente su resolucin. Si y es pequeo (lo cual sucede para sonidos no muy intensos) el
incremento relativo del rea entre x y x + y es despreciable y entonces se puede aproxi-
mar por

px = o yt t. (10)

Ahora debemos particularizar a este nuevo caso la ecuacin de la compresin adiabtica


(ecuacin (3)). Igual que antes, dP = p, P = Po. El volumen inicial ser ahora
V(x) = A(x)x y el incremento de volumen

dV = A(x + y)(x + y) A(x)x

dV [A(x) + A(x) y] (x + y) A(x)x.

Reemplazando
p [A( x ) + A' ( x ) y ] y + A' ( x ) y x
= .
Po A( x ) x

Pasando al lmite cuando x 0, resulta,


p
= [ [A(x ) + A' ( x ) y ] y x + A' ( x ) y ] .
Po A( x )

Aqu podemos efectuar la misma aproximacin anterior, es decir A(x) y << A(x), de-
bido al pequeo incremento relativo de rea causado por un desplazamiento tan pequeo
como lo es y para intensidades moderadas. Resulta, finalmente


p
= [A(x ) y x + A' ( x ) y ] ,
Po A( x )
es decir


p
= [A(x ) y ]x . (11)
Po A( x )

5
Como estamos interesados en una ecuacin diferencial con la presin p(x, t) como
nica incgnita, debemos ahora eliminar la incgnita y de las ecuaciones (10) y (11).
Para ello derivamos la (11) dos veces con respecto a t. Luego invertimos el orden de
derivacin, e introducimos las derivadas temporales dentro del corchete. Como A(x) es
independiente del tiempo, dentro del corchete aparece yt t, que puede ser reemplazado
por el valor obtenido de la ecuacin (10). Resulta:

c2
ptt = [A(x ) p x ]x . (12)
A( x )

donde c2 = Po/o es, igual que antes, la velocidad del sonido. Esta ecuacin se conoce
como ecuacin de la corneta, o ecuacin de la bocina. En el caso en que A(x) = A, es
fcil verificar que se reduce al caso del tubo cilndrico.
A modo de ejemplo resolveremos el caso de una bocina exponencial como las
utilizadas en los parlantes de compresin (compression drivers). Supondremos entonces
que

A(x) = Ao e x / L, (13)

donde Ao es el rea de la seccin en el origen y L la longitud para la cual el rea ha cre-


cido e veces. Reemplazando en la ecuacin 12 y operando,

1 1
ptt = p xx + px . (14)
2 L
c

Por la forma especial de A(x) la ecuacin qued reducida a una ecuacin lineal a coefi-
cientes constantes. Cuando L la ecuacin se aproxima a la ecuacin de onda para
el tubo cilndrico.
De especial inters en este tipo de ecuaciones es la obtencin de soluciones esta-
cionarias, es decir, soluciones en las que las variables se encuentran separadas en dos
factores multiplicativos:

p(x, t) = X(x)T(t). (15)

Las soluciones estacionarias forman una base de soluciones, es decir, un conjunto de


soluciones tal que cualquier otra solucin puede expresarse como combinacin lineal de
ellas. Adems, constituyen los modos normales de oscilacin caractersticos del siste-
ma. En este caso se cumple

1 1
X T" = X" T + X' T .
c2 L

Dividiendo por X T se puede expresar como

1
X" + X'
1 T" L
= .
c2 T X

6
Dado que el lado izquierdo es una funcin slo de t y el derecho slo de x, ambos deben
ser iguales a una misma constante que llamamos 2:

1
X" + X'
1 T" L
= = 2 .
c2 T X

Se obtiene el siguiente sistema de ecuaciones diferenciales ordinarias:


T" + 2 c 2 T = 0

(16)
1
X" + X' + 2 X = 0
L

Su solucin puede llevarse a cabo por cualquiera de los mtodos conocidos, obtenindo-
se

T(t) = To sen (c t + o) (17)

x
X (x ) = X o e x / 2 L sen 4 2 L2 1 + o . (18)
2L

Consideremos el caso particular de una bocina exponencial de longitud l, como se


muestra en la figura 4. Si suponemos que la bocina est abierta en sus extremos, la pre-
sin ser muy pequea en ellos, pudiendo considerarse nula. Esto impone condiciones
de contorno dadas por

p(0, t) = p(l, t) = 0. (19)

para todo tiempo t. Esto significa que

o = 0, (20)

l
4 2 L2 1 = k . (21)
2L

De esta ecuacin se pueden obtener los valores admisibles de :

2
1 2k L
= 1 + , (22)
2L l

donde k = 1, 2, ... La presin sonora viene dada, entonces, por

2
k c 2k L
p( x , t ) = P e x / 2L
sen x sen 1 + t + o . (23)
l 2L l

7
En la parte inferior de la figura 4 se indica la distribucin de la presin sonora a lo
largo de la bocina para tres valores de k para un valor de t que hace mximo el factor
dependiente del tiempo. Las frecuencias no estn distribuidas armnicamente, salvo en
el caso en que L >> l, es decir, cuando la bocina tiende a ser cilndrica.

Ao x
x=0

p(x, to) x=l

x
x=0 x=l

Figura 4. Arriba, una bocina exponencial. Abajo, distribucin de la


presin sonora en un instante para tres soluciones estacionarias con
n = 1, 2 y 3.

2.2. El tracto vocal con prdidas [3]

El anlisis realizado anteriormente supuso un tubo idealizado carente de todo tipo


de prdidas. Un conducto real exhibe al menos dos fenmenos que obligan a modificar
las ecuaciones. El primero es la friccin viscosa; el segundo, la absorcin en las pare-
des.
En lugar de efectuar el anlisis en trminos del desplazamiento y(x, t) es conve-
niente hacerlo en trminos de la velocidad de las partculas v(x, t) y de la velocidad vo-
lumtrica, o caudal, u(x, t). Notemos que v(x, t) puede interpretarse de dos maneras:
como la velocidad en el instante t de la partcula que en equilibrio estara en x, o como
la velocidad de la partcula que en el instante t se encuentra efectivamente en x. De
acuerdo con la notacin que venamos utilizando, la primera interpretacin conduce a

v(x, t) = yt(x, t), (24)

mientras la segunda, a

v(x, t) = yt(x, t) ytx(x, t) y(x, t), (25)

Sin embargo, el trmino agregado en la ecuacin (25) es despreciable, por lo cual utili-
zaremos la segunda interpretacin pero aceptaremos como vlida la ecuacin (24).

8
La velocidad volumtrica o caudal, u(x, t) es el volumen que cruza una seccin de
rea A(x) por unidad de tiempo. Suponiendo que la velocidad es normal a la seccin (lo
cual sucede pues suponemos que las ondas son planas), u(x, t) est dada por

u(x, t) = v(x, t) A(x). (26)

Entonces las ecuaciones (10) y (11) adoptan la forma simtrica siguiente:

o
px = ut (27)
A( x )

Po
pt = ux . (28)
A( x )

La modificacin de estas ecuaciones para tener en cuenta la friccin y la absorcin


en las paredes se simplifica mucho si en lugar de continuar trabajando en el dominio
tiempo lo hacemos en el dominio frecuencia, utilizando para ello la transformacin de
Laplace. Tengamos en cuenta que la transformacin de Laplace clsica se aplica a fun-
ciones de una sola variable, en tanto que aqu tenemos funciones de dos variables. Si
consideramos la variable espacial como un parmetro fijo en el momento de transfor-
mar, obtendremos una transformada dependiente de ese mismo parmetro. As, la trans-
formada de p(x, t) ser P(x, s), y la transformada de u(x, t) resultar U(x, s). Entonces

s
Px = o U (29)
A( x )

Po
sP = Ux, (30)
A( x )

donde las derivadas temporales quedaron reemplazadas por el factor s.


Tengamos en cuenta que APx dx representa la fuerza neta sobre una capa de aire
de espesor dx debida al cambio de presin, en tanto que osU es la fuerza de acelera-
cin que se opone a la anterior. En caso de haber friccin viscosa, se agrega una nueva
fuerza que tiende a contrarrestar a la fuerza de presin, que resulta proporcional a la
velocidad. El factor de proporcionalidad puede depender de la frecuencia y de la posi-
cin, lo que hubiera sido difcil de tener en cuenta en el dominio tiempo. Por ejemplo,
es de suponer que en un estrangulamiento la friccin sea mucho ms alta que en una
cavidad de gran seccin. La ecuacin 29 puede escribirse, entonces, como

s
Px = o U R(x , s ) U (31)
A( x )

Para tener en cuenta las prdidas por absorcin en las paredes, reescribamos la
ecuacin 30 de la forma siguiente:

A( x )
Ux = sP . (32)
Po

9
Observemos que Ux dx representa la variacin de caudal entre la cara derecha y la iz-
quierda de una capa de aire de espesor dx. La ecuacin 30 establece uno de los meca-
nismos por los que se pierde caudal: el hecho de que la presin est aumentando, lo cual
hace disminuir el volumen de una dada masa de aire. El otro mecanismo, que pretende-
mos incorporar, es el aumento de la seccin total debido a la presin sobre las paredes
del tracto cuando stas no son rgidas. Este fenmeno se ilustra en la figura 5.

Po

Po + p

x x + dx

Figura 5. Efecto de la presin sobre las paredes no rgidas del tracto.


Se ha supuesto que los diferentes puntos reaccionan localmente.

Para simplificar el anlisis deberemos suponer que las paredes interiores del tracto
responden localmente a la presin, es decir, lo hacen con independencia de lo que suce-
da con un punto vecino. Si bien en realidad esto no sucede, el hecho de que por conti-
nuidad la presin no vare bruscamente de un punto a otro vecino lo compensa.

vn

dS

x
x + dx

Figura 6. Geometra para e clculo de la admitancia acstica total de


la pared del tracto.

10
La reaccin local de una superficie ante la presin se traduce en el concepto de
impedancia acstica como cociente entre las transformadas de Laplace de la presin y
la velocidad, y en el concepto dual de admitancia acstica, cociente entre las transfor-
madas de la velocidad y la presin. Con referencia a la figura 6, si la presin sobre la
pared en un punto ubicado en coordenadas cilndricas (, x) es Pp(, x, s) y la velocidad
de desplazamiento de la pared normal a la superficie es Vn(, x, s), entonces la admitan-
cia puntual es

Vn ( , x , s )
Y * (, x , s ) = . (33)
Pp (, x , s )

Dado que la longitud de onda es mucho mayor que las dimensiones transversales del
tracto vocal, 3 podemos suponer que el campo sonoro es plano, por lo cual la presin
sonora es aproximadamente constante en toda la seccin, es decir Pp(, x, s) P(x, s),
de manera que

Vn(, x, s) = Y*(, x, s) P (x, s). (34)

Nos proponemos calcular el caudal que escapa por la pared a causa del corrimiento de
sta. Consideremos para ello el caudal que escapa por el contorno de la delgada lmina
de espesor dx de la figura 6. Podemos escribir el elemento de rea como
dS = S(, x) d dx,

donde S(, x) depende de la forma del conducto. El caudal que escapa por dicho contor-
no ser
2
dU pared = dx Vn (, x, s ) S (, x ) d =
0
2
= dx Y * (, x, s ) P( x, s ) S (, x ) d =
0
2
= P( x, s ) dx Y * (, x, s ) S (, x ) d
0

Llamando admitancia total en el punto x a

2
Y ( x, s ) = 0 Y * (, x, s ) S (, x ) d , (35)

y dividiendo por dx podemos escribir

Upared x(x, s) = Y (x, s) P (x, s). (36)

Este valor representa las prdidas de caudal debidas a que la presin en aumento est
empujando las paredes perimetrales de la lmina hacia afuera, y debe restarse en la
ecuacin (30):

3
Las frecuencias de inters para la voz humana son inferiores a 4 kHz, la longitud de onda resultante es
mayor de 8,6 cm, mientras que las dimensiones del tracto vocal no superan en general los 2 3 cm.

11
A( x )
Ux = sP Y ( x, s ) P . (37)
Po

Hemos as incorporado, en las ecuaciones (29) y (37), los efectos de la friccin y


la absorcin en las paredes internas del tracto. Combinndolas obtenemos una ecuacin
que involucra nicamente la presin P(x, s).

As
= + YP .
A
Px (38)
s + A R c2
o x o

Si bien sta es una ecuacin en derivadas parciales, en la prctica se comporta como si


fuera una ecuacin ordinaria, ya que slo aparecen las derivadas con respecto a una sola
variable (la x). Las derivadas respecto a la variable t quedaron absorbidas al aplicar la
transformacin de Laplace. Es, entonces, una ecuacin homognea de segundo orden a
coeficientes variables y dependientes adems del parmetro s. La solucin general es de
la forma

P( x, s ) = a g ( x, s ) + b h( x, s ) , (39)

donde g y h son dos soluciones particulares linealmente independientes, y, por aplica-


cin de la ecuacin 31,
A
U ( x, s ) = (a g x ( x, s ) + b h x ( x, s )) . (40)
o s + A R

3. REPRESENTACIN MATRICIAL

Es interesante analizar el tracto vocal como una caja negra con una entrada (la
glotis) y una salida (los labios). Dado que existen dos variables de entrada y dos de sali-
da (las respectivas presiones y velocidades de volumen), el problema es enteramente
similar al de un cuadripolo elctrico, y su descripcin puede realizarse por medio de una
representacin matricial [2].

3.1. Caso general

Si suponemos que la entrada est en x = 0 y la salida en x = L, tendremos

Pent = P(0 , s ) = a g (0 , s ) + b h(0 , s )


, (41)
A
U ent = U (0, s ) = (a g x (0, s ) + b h x (0, s ))
o s + A R

Psal = P ( L , s ) = a g (L , s ) + b h (L , s )
. (42)
A
U sal = U (L , s ) = (a g x (L , s ) + b h x (L , s ))
o s + A R

12
Tenemos 4 ecuaciones y 6 incgnitas (a, b, Psal, Usal, Pent y Uent). Podemos elegir dos de
ellas como parmetros independientes, y luego obtener los restantes. Suponiendo cono-
cidos Psal y Usal podemos despejar las constantes a y b de las ecuaciones (42), y de las
(41) obtener Pent y Uent. Resulta, aplicando la regla de Cramer,

Psal h(L, s )
o s + AR
U sal h x (L, s )
a = A
g ( L , s ) h (L , s )
g x (L , s ) h x (L , s )
(43)
g (L , s ) Psal
o s + AR
g x ( L, s ) U sal
b = A .
g ( L , s ) h (L , s )
g x (L , s ) h x ( L , s )

Entonces

g (0, s ) h(0, s ) Psal h( L , s )


A A

s + AR x g (0, s ) h x (0, s )

o s + AR
U sal h x (L, s )
Pent o o s + AR
= A (44)
U
ent g (L, s ) h(L, s ) g (L , s ) Psal

s + AR
g x (L , s ) h x (L , s )
g x (L , s ) o U sal
A

o bien

g (0, s ) h(0, s )
A A
g x (0, s ) h x (0, s ) h (L, s )P + h(L, s ) o s + AR U

Pent + +
= o
s AR s AR x sal sal
o A
U
ent g ( L , s ) h( L , s ) g (L, s )P g (L, s ) o s + AR U
x sal sal
g x (L, s ) h x (L, s ) A

Esto puede expresarse en la forma

Pent K K12 Psal P


= 11 = K sal , (45)
U K K 22 U sal U
ent 21 sal

donde los parmetros Kij son anlogos a los parmetros A, B, C y D de las matrices de
transmisin de los cuadripolos, utilizadas para describir conexiones en cascada (por
ejemplo, en lneas de transmisin). Los valores resultantes son:

13
g (0, s )h x (L, s ) h(0, s )g x (L, s )
K11 = (46)
g (L, s ) h(L, s )
g x (L , s ) h x ( L , s )

o s + AR g (0, s )h(L, s ) h(0, s )g (L, s )


K12 = (47)
A g ( L , s ) h (L , s )
g x (L , s ) h x ( L , s )

A g x (0, s )h x (L, s ) h x (0, s )g x (L, s )


K 21 = (48)
o s + AR g (L, s ) h(L, s )
g x (L, s ) h x (L, s )

g (0, s )h(L, s ) h x (0, s )g (L, s )


K 22 = x . (49)
g (L , s ) h (L , s )
g x (L , s ) h x (L , s )

Los coeficientes Kij son funciones de s, y en la generalidad de los casos son dema-
siado complejos como para su tratamiento analtico mediante frmulas cerradas. Si bien
en el mejor de los casos las funciones A(x, s), R(x, s) e Y(x, s) podran determinarse ex-
perimentalmente y luego aproximarse mediante sendas expresiones analticas, en la
prctica las dificultades para medir en forma directa la resistencia viscosa y la admitan-
cia de las paredes del tracto vocal son enormes.
En la prxima seccin analizaremos un caso sencillo al cual podremos reducir los
casos reales.

3.2. Caso de un tubo uniforme

Supondremos ahora el caso particular de un tubo de seccin, friccin y admitancia


constantes a lo largo de toda su longitud para cada valor de s, es decir

A(x, s) = Ao(s) (50)

R(x, s) = Ro(s) (51a)

Y(x, s) = Yo(s) (51b)

Entonces la ecuacin (38) puede expresarse como

Pxx = 2 P, (52)

donde

14
s Y
2 (s ) = ( o s + AR ) + . (53)
c2 A
o

La ecuacin 52 admite una sencilla solucin general de la forma

P(x, s) = a Ch ( x) + b Sh ( x). (54)

Con las funciones g(x, s) = Ch ( x) y h(x, s) = Sh ( x) se pueden calcular los coefi-


cientes Kij. Resulta

o s + AR
K11 K12 Ch(L ) Sh(L )
K = = A . (55)
K
s + AR Sh(L ) Ch(L )
A
21 K 22

o

En este caso sencillo fue posible obtener una expresin cerrada para la matriz de trans-
misin, siempre y cuando se conozcan A, R e Y. Aun en el caso ideal en que R = 0 e
Y = 0 (resultando = s/c) los coeficientes obtenidos no son funciones racionales. Esto
es caracterstico de las lneas de transmisin a parmetros distribuidos. De hecho, el
tubo rgido sin prdidas se comporta como una lnea de transmisin elctrica puramente
reactiva (con el anlogo a la impedancia caracterstica igual a la impedancia acstica del
aire, oc, dividida por la seccin A para convertir la velocidad lineal en volumtrica).

3.3. Descomposicin del tracto vocal en tubos uniformes

A pesar de que el tracto vocal no es uniforme, puede analizarse de una manera


simplificada si se lo reduce a un cierto nmero de componentes uniformes conectadas
una a continuacin de la otra, como se muestra en la figura 7.

K1

K2 Ki
Kn x

Figura 7. Aproximacin del tracto vocal mediante una interconexin


de tubos de propiedades independientes de la posicin, cada uno con
su matriz de transmisin Ki.

15
Si llamamos K1, ..., Kn a las matrices de transmisin de cada segmento, podemos
obtener la matriz total como el producto matricial de todas ellas.

K = K1 K2 ... Kn. (56)

Esto simplifica notablemente el anlisis en los casos en que sea posible descomponer un
conducto en secciones aproximadamente constantes. La ecuacin (56) sigue cumplin-
dose an cuando las secciones sean variables.

3.4. Efecto de la impedancia de radiacin

Al igual que en el caso de una lnea de transmisin elctrica, es interesante el


efecto de carga de la impedancia de radiacin. Para baja frecuencia (debajo de 800 Hz)
esta impedancia vale aproximadamente [3]:

Plabios (s )
Z R (s ) = Cs, (57)
U labios (s )

relacin que representa la menor eficiencia en baja frecuencia de un emisor pequeo.

Uglotis Ulabios
+ +
Pglotis K ZR Plabios

Figura 8. Un tracto vocal, representado como cuadripolo acstico,


cargado por la impedancia de radiacin.

Podemos escribir la ecuacin (45) en la forma

Pent P Z
= K sal = K R U sal , (58)
U U 1
ent sal

de donde
Pglotis = (K11ZR + K12) Ulabios (59)

Uglotis = (K21ZR + K22) Ulabios (60)

es decir
Pglotis
= K11Z R + K12 (61)
U labios

U glotis
= K 21Z R + K 22 . (62)
U labios

16
Invirtiendo esta ltima, se la puede representar como funcin de transferencia:

U labios 1
= . (63)
U glotis K 21Z R + K 22

Los ceros i del denominador son los formantes del tracto. Si los ceros son complejos,
es decir i = i + ji, entonces i son las frecuencias (angulares) para las que la trans-
ferencia tiene mximos locales o resonancias (figura 9). Para cada i, la correspondiente
parte real i es (en valor absoluto) la mitad del ancho de banda (medido entre los puntos
de 3 dB) de la campana de resonancia.

Ul / Ug

f
F1 F2 F3
Figura 9. Formantes del tracto vocal para una determinada posicin
de los rganos articulatorios.

4. MODELO DE PREDICCIN LINEAL

Los modelos anteriores permiten una representacin analtica de los fenmenos


acsticos involucrados en la emisin vocal, pero no son fcilmente aprovechables para
el tratamiento de la mayora de los problemas prcticos, ya que no es sencillo obtener
las funciones involucradas. Particularmente deseable sera un modelo apto para su tra-
tamiento digital y que tuviera pocos parmetros de fcil obtencin a partir de un anlisis
de ejemplos de emisiones. Un modelo de este tipo es el modelo de prediccin lineal.
Supongamos primero el caso del tracto vocal sin prdidas, es decir que R = 0 e
Y = 0. En este caso, de la ecuacin (53) se obtiene

s
= (64)
c
y entonces

L s o c Li s
Ch i Sh
= c c .
Ai
Ki (65)
A L s L s
i Sh i Ch i
oc c c

Podemos suponer que subdividimos el tracto vocal en N segmentos todos de igual


longitud, de modo que Li = L/N. Esto no implica prdida de generalidad, ya que puede
adoptarse un tamao que sea suficientemente pequeo como para representar con sufi-

17
ciente aproximacin todas las variaciones importantes en la seccin del tracto. En ese
caso

Ls oc L s
Ch Sh
N c
= N c Ai . (66)
Ls
Ki

Ai Sh L s Ch
c N c
o N c

Supondremos tambin que la impedancia de radiacin tambin puede despreciarse


y adoptaremos ZR = 0. Entonces, de (63) resulta

U labios 1
= , (67)
U glotis K 22

de manera que para encontrar la funcin de transferencia entre el caudal en la glotis


(entrada) y en los labios (salida) bastar hallar K22. La matriz de transmisin de todo el
tracto vocal, segn la ecuacin (56) puede expresarse como

K11 K12 K K12,1 K11, N K12, N


K = = 11,1 . (68)
K 21 K 22 K
21,1 K 22,1 K
21, N K 22, N

Se puede comprobar que K22 es un polinomio de 2N - 1 trminos, homogneo en los Khk,i,


es decir en el que cada trmino tiene exactamente N factores Khk,i:

2 N 1 N
K a k i bk i ,i ,
K 22 =
(69)
k =1 i =1

donde los ndices ak i y bk i son iguales a 1 2 y cumplen adems que ak1 = bkN = 2 y
ak (i + 1) = bk i (por ejemplo, para N = 4, uno de los trminos es K21,1K12,2K22,3K22,4)4. Por
otra parte, cada elemento de las matrices de (68) depende de s en la forma de un seno o
coseno hiperblico. Dichas funciones pueden expresarse de la siguiente manera

e x + e x 1 + e 2 x
Ch x = = , (70)
2 2 e x

e x ex 1 e 2 x
Sh x = = , (71)
2 2 ex

lo cual permite expresar

1 e 2 Ls / Nc
K a k i bk i ,i = Ck i (72)
2e Ls / N c

4
En forma ms general, Kmh requiere que ak1 = m y que bkN = h, siendo las otras condiciones las mis-
mas.

18
donde la eleccin del signo + o el depende de si el elemento contena un Sh o un Ch.
Resulta

2 N 1
(1 )
N
e 2 Ls / Nc .
1
K 22 = Ck (73)
e Ls / c k =1 i =1

La suma es un polinomio de grado N en e2Ls / Nc, por lo cual

N 2 Ls
k

1
K 22 = a k e Nc . (74)
e Ls / c k = 0

Entonces
Ls

U labios c
GU (s ) =
e
= . (75)
U glotis N 2 Ls
k
a k e Nc
k =0

Recordemos que la transformada de Laplace de un retardo temporal se obtiene multipli-


cando la transformada por una exponencial. Podemos poner esto de manifiesto del si-
guiente modo:

2 Ls N 2 Ls
N k
U labios (s ) a k e Nc = U glotis (s ) e 2 Nc . (76)
k =0

Llamando T = 2L / Nc y antitransformando,

N
N
ak ulabios (t k T ) = u glotis t

T.
2
(77)
k =0

Esta expresin indica que hay una relacin directa entre el caudal en la glotis retardado
un tiempo NT y el caudal en los labios en sus versiones retardadas unos tiempos kT
con k = 1, ..., N.
La ecuacin (77) tiene el aspecto de una ecuacin diferencia, salvo porque el
tiempo t es aqu una variable continua y no discreta. Podemos transformarla en discreta
si tomamos muestras a intervalos iguales a T , es decir con una tasa de muestreo fs = 1/T.
Para que esto sea factible sin introducir distorsiones por aparicin de frecuencias alias
debe elegirse N de modo que se satisfaga el teorema de muestreo, para lo cual debe ser
fs > 2 fmx, es decir

4L
N > f mx . (78)
c

Por ejemplo, para fmx = 5000 Hz y una longitud tpica del tracto vocal de L = 0,17 m se
obtiene un valor N 10.

19
Bajo las condiciones anteriores, llamando tn = nT y muestreando la ecuacin (77)
en estos instantes particulares se cumple que

N
N
ak ulabios (n T k T ) = u glotis n T

T,
2
(79)
k =0

y, pasando al tiempo discreto (con abuso de notacin),

N
N
ak ulabios (n k ) = u glotis n


2
(80)
k =0

Aplicando transformada Z y operando resulta.

U labios z N / 2
GU ( z ) = = . (81)
U glotis N
ak z k
k =0

El retardo zN / 2 representa el tiempo requerido por la onda sonora generada en la glotis


para atravesar el tracto vocal. Tanto desde el punto de vista del anlisis como desde el
punto de vista de la sntesis dicho tiempo en general carece de importancia, y se lo eli-
mina. Asimismo, se suele normalizar a 1 el trmino independiente del denominador,
obtenindose el modelo de prediccin lineal (LPM):

GU (z ) =
1
. (82)
N
k
1 + ak z
k =1

Obsrvese que si bien la deduccin de este modelo fue hecha para el caso en el que no
hay prdidas ni impedancia de radiacin, el mismo permite representar tambin sistemas
disipativos.

20
Bibliografa y referencias

1. Beranek, Leo L. Acstica. Editorial Hispanoamericana. S. A. Buenos Aires (Arg.), 1961


2. Madisetti, Vijay K.; Williams, Dougls B. (editores). The Digital Signal Processing Handbook.
CRC-Press - IEEE Press. Boca Raton, FL, USA, 1997. Section X.
3. Sondhi, M. M. Model for wave propagation in a lossy vocal tract. Journal of the Acoustical So-
ciety of America. Vol 56, No 5, May 1974, pp. 1070-1075.
4. Syrdal, A.; Bennet, R.; Greenspan, S. Applied Speech Technology CRC Press. Boca Raton, FL,
USA, 1995
5. Pelton, Gordon E., Voice Processng. MacGraw-Hill. Singapore, 1992.
6. Fletcher, Harvey, Speech and Hearing in Communication. American Institute of Physics. Woo-
dbury, USA, 1995.

21

S-ar putea să vă placă și