Documente Academic
Documente Profesional
Documente Cultură
209
RESUMEN
En las pginas que siguen revisamos las bases principales desde las que puede
abordarse el estudio de la fontica desde una perspectiva perceptiva. Tras situarla
en un contexto lingstico, comenzamos analizando sus principales condicionantes:
la neurofisioanatoma auditiva y su funcionamiento psicoacstico, as como las
relaciones entre percepcin y produccin. El ncleo de nuestra presentacin es un
resumen de los principales resultados obtenidos en el estudio perceptivo de los
niveles subsegmental y segmental del sistema fnico espaol.
ABSTRACT
In the following pages we review the main bases from which the study of phonetics
can be approached from a perceptual point of view. After placing it in a linguistic
context, we discuss their main constraints: the neurophysioanatomical patterns and
its psychoacoustical functioning, as well as the relationships between perception
and production. The core of our presentation is a summary of major findings in the
perceptual study of subsegmental and segmental levels in the Spanish phonic
system.
210
1. INTRODUCCIN
Hace 30 aos, cuando se cre el Laboratorio de Fontica de la Universidad de
Barcelona, en esta disciplina la perspectiva articulatoria llevaba siglos de ventaja a
la recin nacida fontica acstica1. Precisamente la instalacin de diversos
laboratorios en universidades espaolas, precedidos por el que Toms Navarro
Toms dirigi en el Consejo Superior de Investigaciones Cientficas (Zamora
Vicente 2001), permiti el desarrollo de la descripcin acstica de los sonidos
lingsticos, primero en el mbito investigador y pronto tambin en el docente.
Esta presentacin concierne al tercer punto de vista desde el que puede estudiarse
el sistema fnico de una lengua: el perceptivo. Tal como ocurri con su dos
hermanas mayores, necesita ganarse un espacio diferenciado a partir de la
interdisciplinariedad: slo partiendo de algo de fisiologa, algo de neurologa, algo
de psicoacstica, y bastante de fontica articulatoria y acstica se podrn explicar
los mecanismos que subyacen a la descodificacin de los sonidos. Pero la Fontica
Perceptiva no es neurologa, ni anatoma, in fisiologa, ni psicoacstica del habla.
A diferencia de esas ciencias prximas, como en toda disciplina lingstica, el
principio organizador de la Fontica Perceptiva es el sistema de elementos que
permite la comunicacin oral. Por lo tanto, habra dos lmites que marcaran las
fronteras en esta perspectiva de la fontica:
1.
2.
Mientras en el primer punto creemos que habra consenso, el segundo forma parte de un
debate en el que no entraremos aqu, que durante muchos aos opuso a las corrientes
funcionales de la lingstica, ms centradas en el uso comunicativo (punto 2), y a las
corrientes formales, ms interesadas en el anlisis de la competencia interna (punto 1). Hoy
211
212
Por ltimo, posiblemente sera tambin oportuna una reflexin sobre las
aplicaciones que esta perspectiva de la fontica tiene en campos como la enseanza
de segundas lenguas y los dficits perceptivos.
En esta presentacin nos centraremos en ese foco principal que mencionbamos: la
descodificacin de los sonidos lingsticos. Comenzaremos analizando brevemente
algunos de sus condicionantes generales. A continuacin entraremos en el nivel
subsegmental, y segmental; el suprasegmental desborda los limites preestablecidos
para esta presentacin, aunque su contribucin es esencial para el proceso de la
descodificacin lingstica.
Para realizar este clculo se toma como base el funcionamiento de un tubo de 28 mm. (la
longitud media del canal auditivo humano en el adulto) cerrado por un extremo.
213
con control de ganancia: si no existiera, slo un 0,1% de la energa que llega al tmpano saldra del odo interno; pero a la vez, varios mecanismos protegen a este
delicado rgano de los traumas que le podran producir intensidades sonoras
excesivas.
En el tmpano encontramos la primera y ms bsica separacin de frecuencias del
odo y el primer mecanismo de control de intensidad. En cuanto a la primera, si la
onda es grave, el tmpano vibra como un todo, pero en altas frecuencias, distintas
partes de la membrana responden a distintas frecuencias. Respecto al segundo, si la
onda que llega es demasiado intensa el tmpano se tensa, vibrando menos. Pero los
verdaderos protagonistas de esa enorme capacidad amplificadora del odo medio
son los tres elementos que constituyen la cadena de huesecillos: martillo, yunque y
estribo, los ms pequeos del cuerpo, insertos en el ms duro (el hueso temporal),
para unir el tmpano y la cclea. Y precisamente la diferencia de tamao entre esos
dos extremos -la membrana timpnica y la ventana oval, donde el estribo presiona
la cclea- explica buena parte de esa accin amplificadora: la proporcin de 17/1
(la primera mide unos 55 mm2, y la segunda apenas 3,2 mm2) incrementa la
presin unas 35 veces. Pero, adems, nos encontramos con el efecto palanca
obtenido gracias a la diferencia de tamao entre el martillo y el yunque: otro 30%
de incremento en la energa de entrada.
Paradjicamente, unida a esta capacidad amplificadora, tambin encontramos entre
las funciones de estos huesos diminutos la contraria, la proteccin frente a los
excesos sonoros. Para ello, contamos con el llamado reflejo acstico, una contraccin involuntaria del msculo estapedial ante todo estmulo inferior a 1-2 KHz e
intensidad superior a 85-90 dB, cuya consecuencia inmediata es sustituir el efecto
palanca al que acabamos de aludir por una accin rotatoria: 20 dB menos. Ocurre muy interesante para el apartado 2.3. que mientras hablamos podemos desencadenar en nuestro propio odo el reflejo acstico, cerrando el canal de entrada
comunicativo.
Sobre la seleccin de frecuencias, el odo medio interviene, aunque no de manera
tan potente como respecto a la energa: sus msculos actan como un filtro de paso
bajo, con una atenuacin aproximada de 15 dB por octava en la zona de 1.000 Hz.
Continuamos nuestro camino para llegar a la cclea o caracol, el rgano de la
audicin por excelencia, y elemento principal del odo interno5. La cclea es una
diminuta central elctrica. En sus escasos tres centmetros y medio se transforma el
5
Porque los canales semicirculares, que la acompaan, son de la mayor importancia para los
estudiosos del equilibrio, pero no para los del lenguaje.
214
movimiento del lquido coclear en descargas que activarn las fibras nerviosas
hasta llegar al cerebro. Para conseguirlo contamos con dos lquidos cuyo contacto
suelta chispas, en el sentido literal, gracias a sus diferentes composiciones
qumicas: la endolinfa, presente en el interior del conducto coclear6, rica en socio y
pobre en potasio y la perilinfa, en el interior de las clulas ciliadas (y en el resto de
la cclea), que es justo lo contrario: rica en potasio y pobre en sodio. La presin del
estribo sobre la ventana oval provoca una ola en el viscoso lquido coclear, la onda
viajera o desplazante, que avanza desde la base hasta el pice. Ese movimiento,
diferente para cada frecuencia de entrada, produce a su vez una friccin de los
cilios, que provoca el intercambio de iones de sodio y potasio entre la endolinfa y
la perilinfa. Consecuencia: despolarizacin de la clula ciliada, por eso aumenta la
actividad elctrica de la fibra nerviosa a ella conectada: el chispazo.
En el caracol se realiza un anlisis frecuencial de la onda de entrada afinadsimo.
Primero, y de forma ms basta, gracias a la selectividad frecuencial: la capacidad
del sistema auditivo para responder de modo selectivo segn la frecuencia del
estmulo, para filtrar un estmulo frente a otros simultneos sobre la base de su
frecuencia. Nos referimos a ese patrn de la onda desplazante, diferente segn la
frecuencia del estmulo (los sonidos agudos presentan su punto de mxima
amplitud al inicio de la cclea, y cuanto ms graves ms se desplazan hacia el
final): es la mecnica coclear pasiva. A ella se une otro mecanismo (calificado
como activo), del que son responsables las clulas ciliadas externas, las ms
abundantes (un 75% del total). La suma de ambos es una descomposicin frecuencial muy afinada del estmulo de entrada (sobre todo para sonidos de frecuencias
altas e intensidades medias y bajas; el resto necesita otro tipo de procesamiento,
que veremos a continuacin), transformado en un patrn de estimulacin elctrica,
apto para recorrer el camino hacia el cerebro (Gil Loyzaga y Poch Broto 2000)
En cuanto al control de energa, el odo interno tambin contribuye, gracias a lo
que se conoce como comportamiento no lineal de la cclea. En los seres vivos, los
incrementos de intensidad en la seal no se traducen en idnticos incrementos en la
amplitud de vibracin de la membrana basilar. Llega un momento en que, por ms
La cclea se divide en dos rampas por medio de un canal hueco, el conducto coclear, en
cuya base se inserta el rgano de Corti, donde residen a su vez las clulas ciliadas: unos
15.000 receptores neurosensoriales, que se denominan as por sus estereocilios (vellos)
rgidos, cuyo roce con la membrana superior del propio rgano de Corti abre y cierra los
canales inicos por donde se intercambian los componentes qumicos de la endolinfa y la
perilinfa, provocando los cambios de potencial elctrico
215
La retina tiene 130 millones de receptores fotosensibles, frente a las 15.000 clulas ciliadas
del odo; el nervio ptico est formado por un milln de fibras, el auditivo slo contiene
40.000 - 50.000 fibras.
216
217
218
Tenemos que considerar, adems, lo que ocurre cuando se entrecruzan estas tres
categoras, y especialmente las dos primeras, porque no todas las frecuencias
requieren la misma intensidad para ser percibidas. Muy al contrario, existe una
zona, la que va de 500 a 8000 Hz, mucho ms sensible que el resto, donde apenas
8
Esa sera la razn por la que distintas lenguas tenderan a contrastar categoras
fonolgicas apoyndose en la informacin acstica contenida en cambios frecuenciales con
duraciones en torno a los 50 ms (Lpez Bascuas 1997: 12)
219
Figura 1. Curvas de audibilidad. (M.A.P. = Minimal Audible Pressure ; se obtienen mediante auriculares. M.A.F.= Minimal Audible
Field ; se obtienen en campo libre).
220
221
El pico que los contornos equisonoros muestran en frecuencias altas (8 KHz) no tiene un
correlato claro en el promedio de energa del espaol, segn los datos de Guirao (1980). No
obstante, resulta inevitable recordar la importancia de esta zona de frecuencias para la
discriminacin de /s/, cuyo peso morfofonolgico en espaol es de primera magnitud
222
223
enmascaran a los agudos, y no a la inversa. Esto afecta a la percepcin de los sonidos del lenguaje, y se ha revelado como especialmente relevante en el procesamiento de las transiciones
Los estudios sobre el ancho de banda del enmascaramiento en el odo permitieron
descubrir el sistema de bandas crticas que caracteriza la audicin. Se denomina
as a cada una de las fronteras o lmites -24 en total- en que el sistema auditivo
agrupa las frecuencias para su procesamiento. Funcionan como filtros de paso de
banda, con un ancho mayor para las frecuencias graves, hasta 500 Hz (lo cual
permite el procesamiento de los armnicos del F0, por ejemplo), y menor por
encima de 1 KHz (para el procesamiento de formantes). La percepcin auditiva se
basa en el anlisis en bandas crticas del odo interno. De hecho, el analizador
auditivo perifrico puede ser concebido como un banco de filtros de paso de
banda, numerados de x=1 a x=24, con anchos de banda de alrededor de 100 Hz
por debajo de 500 Hz y anchos de banda de 1/6 del centro de la frecuencia por
encima de 1 kHz (Schroeder, Atal y Hall 1979: 220).
As, los estmulos que coincidan en el interior de una banda crtica interactan
perceptivamente (el ms intenso predomina), pero los que pertenezcan a bandas
diferentes se analizan de modo independiente.
2.3. Las relaciones con el exterior
El exterior del sistema perceptivo humano es el mundo del sonido, y ms
concretamente, por lo que a nuestros intereses concierne, el sistema de sonidos del
lenguaje, y su origen, los mecanismos de la produccin del mensaje oral.
En el apartado anterior mostrbamos cmo el rea conversacional se sita en el
corazn del campo de audibilidad. En este, veremos un poco ms detalladamente
las relaciones entre percepcin y produccin. En primer lugar abordaremos el
origen filogentico y ontogentico- de esa relacin necesaria entre dos sistemas
con restricciones muy distintas, pero condenados a entenderse.
Desde el punto de vista evolutivo, el sistema auditivo precede en varios millones
de aos al fonador11. ste ltimo, muy especializado en nuestra especie, nos
permite un repertorio segmental y suprasegmental mucho ms amplio que el de los
11
La historia del aparato auditivo en el ser humano se remonta al periodo cretcico (hace
ms de 6,5 millones de aos), aunque algunos de sus rasgos bsicos (como la sincronizacin
en fase y la organizacin tonotpica) son muy anteriores, del paleozoico, 225 millones de
aos atrs. En cambio nuestro aparato fonador actual slo se remonta a unos 150.000 aos.
224
13
En la historia de los estudios sobre adquisicin del lenguaje ha habido una larga polmica
a este respecto, iniciada con las propuestas de Jakobson sobre la discontinuidad entre el
balbuceo y las primeras palabras del nio. Para el lingista praguense, se tratara de dos
etapas sin relacin entre s, la primera obedecera a leyes universales, comunes a todas las
lenguas, mientras que la segunda ya sufrira las restricciones particulares de cada lengua.
Esta hiptesis se ha ido rebatiendo con el tiempo, y hoy en da parece probado que el
balbuceo presenta caractersticas propias en cada lengua, y que se trata de un entrenamiento
imprescindible para emisiones posteriores con significado, sin rupturas entre la etapa
prelingstica y la lingstica, precisamente creando lazos entre produccin y percepcin.
225
14
Este autor parte de esta relacin entre lo que percibimos y lo que producimos para
construir su Teoria de la Variabilidad Adaptativa, conocida tambin como Hiptesis de
Hipo e Hiperarticulacin (H&H).
226
3. ELEMENTOS MNIMOS
Hasta este momento hemos abordado las principales restricciones externas que
condicionan el sistema perceptivo, considerado un instrumento a travs del cual
tiene lugar la descodificacin de los mensajes lingsticos. A partir de ahora
entraremos en el principal objetivo de esta presentacin: la estructura interna de los
mecanismos de descodificacin. Comenzaremos por sus componentes menores, en
el nivel subsegmental: los rasgos distintivos, si tenemos en cuenta la estructura del
sistema perspectiva lingstica- y las Diferencias Mnimas Perceptibles (DMP),
si nos situamos en una perspectiva funcional psicolingstica-.
3.1. Los rasgos distintivos
Como ocurre ante cualquier fenmeno inexplorado, las investigaciones sobre
percepcin del habla han partido de lo conocido, para relacionarlo con lo nuevo.
Por eso se han buscado correspondencias entre los mecanismos de descodificacin
y uno de los elementos ms ampliamente asentados en los estudios fnicos: los
rasgos distintivos.
En ocasiones, se han tomado como referencia las tradicionales clasificaciones
articulatorias: modo de articulacin, lugar de articulacin y sonoridad/sordez. Entre
los resultados obtenidos por este tipo de experimentos (realizados
fundamentalmente mediante manipulacin del habla, suprimiendo o enmascarando
ciertas bandas de frecuencia), destacamos los siguientes (OShaughnessy 1990):
1. El modo de articulacin es el rasgo articulatorio ms resistente. Las
diferencias entre oclusin, fricacin, etc., se han mantenido en
circunstancias adversas con ms contundencia que las que oponen sonidos
sordos a sonoros, o labiales a dentales, palatales o velares. Sus claves
perceptivas parecen residir en frecuencias inferiores a 1000 Hz
227
Nasalidad:
Sonoridad:
Gravedad:
472 Hz
758 Hz
1290 Hz
Densidad:
Continuidad:
Estridencia:
1618 Hz
1800 Hz
2521 Hz.
Estos datos han sido confirmados en experimentos sobre el espaol con odos
patolgicos: existe una relacin entre cada rasgo distintivo y una banda de
frecuencia determinada: a mayor prdida auditiva en esa frecuencia, peores
16
En la metodologa empleada se tom como estmulo un test construido con pares mnimos
opuestos por un rasgo distintivo, sobre el cual se aplic el ndice de Articulacin
(Articulation Index, una medida establecida en 1947 por French y Steinberg para determinar
la cantidad de informacin lingstica preservada en la audicin residual de las personas
con prdida auditiva). Se determin as la importancia relativa de las diferentes partes del
espectro auditivo en la discriminacin de los rasgos distintivos acsticos.
228
229
3.2.3. Intensidades
Segn los estudios iniciales de Flanagan, anteriormente mencionados, el umbral
diferencial de intensidad promedio para formantes en estmulos lingsticos es de 2
dB. Sin embargo, esa media se distribuye de forma desigual en el espectro: el
primer formante, que es el ms prominente perceptivamente (saliente) requiere tan
slo 1,5 dB, mientras que el F2 debe duplicar esa cifra para provocar un cambio
perceptivo; las frecuencias interformnticas necesitan alcanzar incluso 13 dB.
3.2.4. Duraciones
Las DMP temporales en sonidos del lenguaje han sido objeto de bastantes estudios,
que nos proporcionan resultados muy variados: desde 3 msg hasta 36. Tal
disparidad se debe, en buena parte, a diferencias metodolgicas entre los
230
4. SEGMENTOS
4.1. La percepcin de las vocales
Casi un axioma en fontica acstica, originado en los laboratorios Haskins durante
la dcada de los 50, ha sido considerar el primer y segundo formantes como las
18
Eso hace pensar que quiz slo manejemos dos categoras de transiciones: larga / breve
19
231
Segn Landercy y Renard (1977), en un estudio que inclua las vocales nasalizadas, stos
son los ndices ms importantes para cada timbre: F1 y F2: [a y u o ]; F1 y F3: [e y i];
F2 y F3: [a i].
21
La autora atribuye esta excelente respuesta a dos factores: las diferencias acsticas entre
el sistema voclico del espaol y el del ingls (menor nmero de unidades, y como
consecuencia, mayor separacin entre ellas); y el modo de percepcin, que sera categorial
en espaol y continuo en ingls.
22
Utilizaron estmulos susurrados (sin F0) y filtrados (sin F3) de nueve vocales emitidas por
15 locutores (5 hombres, 5 mujeres y 5 nios). Segn sus resultados, se acertaron ms
vocales filtradas (86%) que susurradas (77%).
232
23
Las propiedades del sistema auditivo son las responsables de estas diferencias: las bandas
crticas, suficientemente estrechas en bajas frecuencias, actan como un mecanismo de
integracin frecuencial, fusionando los primeros armnicos del F0 y resolvindolos como un
pico separado. La respuesta no-lineal de la periferia auditiva, por su parte, refuerza la
importancia de las regiones del F1 y el F2.
233
Romero presenta tambin un estudio con jueces bilinges cataln-espaol. Los campos de
dispersin perceptivos de las vocales catalanas han sido estudiados por Puig y Freixa, 1990,
y Fernndez Planas y Carrera Sabat 2004. Para el espaol de Chile contamos tambin con
el trabajo de Len Valds 1998.
25
Las diferencias evidentes entre los resultados obtenidos por ambos estudios pueden
deberse a la distinta metodologa empleada, entre otros factores: Romero utiliza voz natural
(15 vocales cardinales ms 3 inglesas); Fernndez Planas emplea sntesis de voz: 371
estmulos, con un F1 que iba de 109 a 1119 Hz, y un F2 de 500 a 2450.
234
235
Voice Onset Time, en espaol Tiempo de Inicio de la Sonoridad (TIS), es el periodo que
transcurre entre la salida turbulenta del aire fonador, al deshacerse la oclusin bucal (barra
de explosin), y la vibracin de las cuerdas vocales para la emisin de la vocal siguiente
(barra de sonoridad). Este tiempo puede ser positivo (primero aparece la barra de explosin,
y luego la de sonoridad), lo cual es caracterstico de las consonantes sordas; o negativo
(comienza la sonoridad cuando todava no se ha deshecho la oclusin bucal, y el aire
contina retenido): es propio de las consonantes sonoras.
236
27
237
238
239
29
240
5. REFERENCIAS BIBLIOGRFICAS
ABRAMSON, A. S. y L. LISKER (1972): Perception of Voice Timing in Spanish
Stop Consonants, The Journal of the Acoustical Society of America
(J.A.S.A.) 52, p. 175.
ALBAL, M. J. (1992): Anlisis y sntesis de las consonantes nasales, Revista de
Filologa Espaola, LXXII, pp. 47-73.
BORZONE DE MANRIQUE, M. I. (1979): On the recognition of isolated Spanish
vowels, en H. Hollien y P. Hollien (eds.): Current Issues in the Phonetic
Sciences, Amsterdam, John Benjamins, pp. 677-681.
241
242
243
244
245
PUIG, J. y J. FREIXA (1990): El camp de dispersi de les vocals catalanes des del
punto de vista de la percepci, Estudios de Fontica Experimental, IV, pp.
123-146.
RECASENS, D. (1983): Place cues for nasal consonants with special reference to
Catalan, The Journal of the Acoustical Society of America, 73 (4), pp.
1346-1353.
ROMERO, J. (1989): Campos de dispersin auditivos de las vocales del castellano.
Percepcin de las vocales, Estudios de Fontica Experimental, III, pp. 181206.
SCHROEDER, M. R; B. S. ATAL y J. L. HALL (1979): Objective measure of certain
speech signal degradation based on masking properties of human auditory
perception, en Lindblom y hman (eds): Frontiers of Speech Communication Research, Londres, Academic Press, pp. 217-229.
SINNOTT, J. M. y L. A. MCARDLE (2000): Comparative perception of voicing
contrasts, The Journal of the Acoustical Society of America, 107 (5), p.
2855.
SOTO BARBA, J. (1994): Los fonemas /b/ y /p/ se diferencian por la sonoridad?,
Estudios filolgicos, 29, pp. 33-37.
THART, J; A. COLLIER y R. COHEN (1990): A Perceptual Study of Intonation: An
Experimental-Phonetic Approach to Speech Melody, Cambridge, C.U.P.
TRAUNMLLER, H. (1987): Phase vowels, en Schouten (ed): The Psychophysics
of Speech Perception, Dordrecht, Martinus Nijhoff Pub, pp. 377-384.
TUDELA, P. (1989): Psicologa experimental, Madrid, UNED.
WILLIAMS , L. (1976): Prevoicing as a perceptual cue for voicing in Spanish,
J.A.S.A, 59 (S1), p. S41.
ZAMORA VICENTE, A. (2001): Los orgenes de la fontica experimental en Espaa:
Exposicin, Cceres, Fundacin Biblioteca Alonso Zamora Vicente, p. 22.