Phontique acoustique 13 C. Meunier - Charge de Recherche Laboratoire Parole et Langage, CNRS UMR 6057 Universit de Provence 29 avenue Robert Schuman 13621 Aix-en-Provence Cedex 1, France. Courriel : christine.meunier@lpl.univ-aix.fr I. Les sons du langage Lensemble des congurations articulatoires possibles pour la production du langage parl nest pas extensible. Elles sont dpendantes du matriel anatomique dont dispose ltre humain. Et comme tous les tres humains disposent du mme appareil anatomique, les sons utiliss dans chacune des langues du monde relvent de congurations articulatoires communes. Il est donc possible de procder des regroupements de classes de sons dans lesquels chaque langue puise son propre inventaire. Ces classes de sons se font selon des critres articulatoires ou acoustiques. On observe sur la gure 1 les critres articulatoires retenus selon lAlphabet Phontique International (International Phonetic Alphabet, IPA) pour le classement des consonnes. Ainsi, dans la classe des fricatives, le franais utilise seulement une partie des possibilits oertes par lappareil anatomique. On remarquera sur cette gure 1 que le franais utilise peu la partie trs postrieure du tractus vocal, la consonne la plus arrire tant le /n/ uvulaire. De mme, dans linventaire des voyelles franaises il ny a aucune voyelle centrale, except le /c/ (Fig. 2). En fait, la structure de linventaire des sons dans une langue nest pas alatoire mais suit une logique universelle relative aux contraintes articulatoires et la distinctivit ncessaire au sein de chaque systme (Schwartz et al., 1997). De mme, la description acoustique des sons du langage tente de prsenter un panorama de valeurs permettant de distinguer lensemble des sons. Nous tenterons, dans ce chapitre, de dresser un inventaire des descriptions acoustiques des sons du franais en les reliant avec une explication articulatoire. I Neurophysiologie de la parole Fig. 1. Liste des principales consonnes des langues du monde dans lAlphabet Phontique International classes selon leur mode darticulation (en colonne) et leur lieu darticulation (en ligne). Lorsquil y a deux consonnes par case, celle de gauche est la consonne sourde, celle de droite est son quivalente sonore. Daprs International Phonetic Alphabet (International Phonetic Association, 1999). Les consonnes du franais sont entoures en gris. 2 I - Neurophysiologie - 13 - Phontique acoustique II. Lacoustique des sons Il est classique de distinguer les voyelles des consonnes selon des critres articulatoires : la production des voyelles suppose une libre circulation de lair dans le tractus vocal, tandis que lors de la production des consonnes, un rtrcissement du tractus en un point entrane une interruption ou une perturbation dans la circulation de lair. Cette distinction de bas niveau rete mal ce qui direncie fondamentalement voyelles et consonnes. En eet, en sappuyant uniquement sur des critres articulatoires ou acoustiques, la dirence entre une occlusive et une approximante est sans doute plus importante que la dirence entre cette mme approximante et une voyelle. Il apparat en fait que la distinction la plus probante entre les voyelles et les consonnes est de nature linguistique : les voyelles et les consonnes se distinguent selon leur place dans la syllabe, les voyelles peuvent tre le noyau (centre de la syllabe et seul lment indispensable pour une syllabe), ce que les consonnes, de rares exceptions prs, ne peuvent pas (cf. chapitre 14). Si les voyelles reprsentent un ensemble de productions plutt homogne, il nen va pas de mme pour la catgorie des consonnes constitues de classes de sons assez dirents aussi bien dun point de vue articulatoire quacoustique. On parle alors souvent de macroclasses de sons (Rossi, 1990) pour essayer de rendre compte de groupes de sons homognes du point de vue acoustique. Si la classe des voyelles est homogne, il est classique de distinguer les voyelles fermes des voyelles ouvertes et les voyelles antrieures des postrieures. Au sein des consonnes, deux macro- classes sont elles-mmes assez homognes, il sagit des occlusives et des fricatives. Reste ensuite un ensemble de sons, ayant peu de points communs, faisant oce dintermdiaire entre consonnes et voyelles que lon peut regrouper dans la macro classe des consonnes vocaliques. Dans cette macro classe, on trouve les approximantes, les glissantes, les vibrantes, etc. Nous allons voir ci-dessous plus en dtails les caractristiques de lensemble de ces sons. Pour une description gnrale de lacoustique des sons, cf. chapitres 6 et 8. 1. Les voyelles Toutes les voyelles sont voises, cest--dire quil sagit de sons priodiques. Cette priodicit est issue de la vibration des cordes vocales. Les voyelles sont caractrises par la prsence de zones dharmoniques renforces appeles formants . La conguration des cavits bucco-pharyngales tant dirente pour chaque voyelle, chacune delle va tre caractrise par des valeurs de formants direntes. En dautres termes, la modulation de la forme du tractus et donc de la taille des cavits, va occasionner des valeurs spciques de formants correspondant la forme que prend le tractus vocal pour chaque voyelle. Il existe un lien entre la taille dun rsonateur (cavits du tractus dans la parole) et sa frquence : plus la taille du rsonateur et importante, plus sa frquence est basse. Les valeurs de formants vont donc, en partie, dpendre de la taille des cavits de rsonance durant la production des voyelles. Pour les voyelles, trois cavits sont pertinentes: les cavits pharyngale, buccale et nasale. Quatre dimensions permettent de modier la forme ou laccs ces cavits : 1/ le degr daperture de la mandibule ; 2/ la position de la langue ; 3/ la position des lvres ; 4/ la position du velum (autorisant ou non le passage de lair dans les fosses nasales). Les variations au sein de ces quatre dimensions entranent des variations de timbre (valeurs de formants). Dans dautres langues, la dure ou encore la valeur tonale (variations de F0) vont constituer des dimensions supplmentaires permettant la distinctivit au sein du systme. Le premier formant (F1) est dtermin par le degr daperture de la mandibule (et de la hauteur de la langue). Le deuxime formant (F2) varie en fonction Fig. 2. Trapze vocalique reprsentant un classement des voyelles orales des langues du monde selon des critres articulatoires. Lorsque deux voyelles apparaissent de part et dautre dun point, la premire est une ralisation tire, la deuxime une ralisation arrondie (voir plus loin dans ce chapitre II.1 Les voyelles). Daprs International Phonetic Alphabet (International Phonetic Association, 1999). Les voyelles du franais sont entoures en gris. 3 I - Neurophysiologie - 13 - Phontique acoustique de la position avant ou arrire de la langue, mais aussi en fonction de la position tire ou arrondie des lvres. Enn, les valeurs du troisime formant (F3) sont dtermines par la position tire ou arrondie des lvres. Notons que la voyelle /c/, prsente en franais mais avec un statut phonologique trs particulier, prsente des caractristiques articulatoires totalement neutres et ne sera donc pas mentionne dans nos descriptions. a. Laperture Laperture de la mandibule ne fonctionne pas de faon isole. Elle entrane, de fait, un abaissement de la langue ainsi quun rtrcissement de la taille du pharynx. On oppose ainsi les voyelles ouvertes (ou basses), caractrises par une aperture maximale de la mandibule et un abaissement de la langue (entranant une trs petite cavit pharyngale), aux voyelles fermes (ou hautes), caractrises par une aperture trs rduite de la mandibule et la langue en position haute (laissant place une grande cavit pharyngale). Ainsi, les voyelles ouvertes sont caractrises par un F1 lev (/a/ = 700 Hz), tandis que les voyelles fermes ont un F1 bas (/i/ = 300 Hz) (Tableau 1 et Fig. 3). Les voyelles ouvertes sont /a/ ct /o/, /o /. Les voyelles mi-ouvertes sont /c/, /o/, /5/, /c /, /o /, /5 /. Les voyelles mi-fermes sont /c/, /o/, /o/. Les voyelles fermes sont /i/, /y/, /u/. b. La position de la langue Le mouvement de la langue en position avant ou arrire entrane une modication globale du tractus vocal et plus prcisment de la taille de la cavit buccale. Ce mouvement a une incidence sur la valeur du F2 (Fig. 3). Les voyelles antrieures sont caractrises par un F2 lev (/i/ = 2000 Hz), tandis que les voyelles postrieures laissent place une cavit buccale plus ample et ont un F2 bas (/u/ = 750 Hz). Les voyelles davant sont /i/, /y/, /c/, /o/, /c/, /o/, /a/, /c /, /o /. Les voyelles darrire sont /u/, /o/, /5/, /o/, /5 /, /o /. c. La position des lvres Certaines voyelles sont ralises avec une projection des lvres en avant. On parle alors darrondissement des lvres, de projection des lvres ou encore de protrusion . Ce geste articulatoire a pour consquence lallongement de la cavit buccale par la cration dune petite cavit, la cavit labiale. Cet allongement occasionnel du conduit vocal entrane un abaissement des F2 et F3. Ainsi, la seule dirence articulatoire entre /i/ et /y/, qui sont toutes les deux des voyelles fermes antrieures, est larrondissement des lvres pour la production de /y/. Le F3 de /y/ (2100 Hz) est alors plus bas que celui de /i/ (3000 Hz). Il en va de mme pour le F2 (/y/ = 1750 Hz ; /i/ = 2000 Hz). Les voyelles arrondies sont /y/, /u/, /o/, /o/, /o/, /5/, /5/, /o/. Les voyelles non-arrondies (tires) sont /i/, /c/, /c/, /a/, /o/, /o/, /c/. d. La nasalit Les voyelles nasales prsentent des caractristiques plus complexes concernant leur description acoustique. Lors de la production des voyelles nasales, le voile du palais sabaisse laissant le ux dair accder aux fosses nasales. Les fosses nasales entrent donc en communication avec le conduit oral. Le couplage acoustique de ces cavits donne lieu un formant supplmentaire, nomm formant nasal (vers 500 Hz 700 Hz) ainsi qu des anti-formants , autrement dit des zones o lon observe une forte chute de lintensit des harmoniques. Par ailleurs une modication des valeurs formantiques des voyelles orales correspondantes est observe. Les voyelles nasales sont /o /, /5 /, /c /, /o /. Les voyelles nonarrondies (tires) sont /i/, /y/, /u/, /c/, /o/, /o/, /c/, /o/, /5/, /a/, /o/. Tableau 1. Valeurs formantiques moyennes des voyelles orales du franais (daprs Tubach, 1989). F1 F2 F3 voy. fermes i 308 2064 2976 y 300 1750 2120 u 315 764 2027 voy. mi-fermes c 365 1961 2644 o 381 1417 2235 o 383 793 2283 voy. mi-ouvertes c 530 1718 2558 o 517 1391 2379 5 531 998 2399 voy.ouverte a 684 1256 2503 Fig. 3. Valeurs formantiques des voyelles a, i, u (en haut) et coupe sagittale du tractus vocal (en bas) avec les direntes positions de la langue pour la production de ces trois voyelles, les plus distinctes du point de vue articulatoire. 4 I - Neurophysiologie - 13 - Phontique acoustique 2. Les consonnes Les consonnes peuvent tre priodiques ou apriodiques. Par rapport aux voyelles, elles sont produites avec un resserrement du conduit vocal. Les consonnes constituent un ensemble de sons trs htrogne aussi bien du point de vue articulatoire quacoustique. Le type de resserrement ralis va permettre de distinguer les macroclasses de consonnes. Dune certaine faon les deux macro- classes occlusives et fricatives sont des sous-ensembles homognes et organiss. Nous regroupons les autres types de consonnes dans la catgorie des consonnes vocaliques en raison de la prsence dune structure de formant dans leur ralisation acoustique. Toutefois, cette catgorie est constitue de sons trs dirents dun point de vue articulatoire. En acoustique, trois grandes classes sont donc distingues : 1/ pour les occlusives (ou plosives), le conduit phonatoire est ferme durant une partie de lmission de la consonnes ; 2/ pour les fricatives (ou constrictives), le resserrement est important et donne lieu un bruit turbulent ; 3/ les consonnes vocaliques prsentent un rtrcissement ponctuel et/ou peu important du conduit vocal. Ce faible rtrcissement permet la prsence dune structure formantique visible pour ces consonnes. a. Les occlusives On distingue gnralement les occlusives orales des occlusives nasales. Eectivement, dun point de vue articulatoire les occlusives se caractrisent par la fermeture complte du conduit oral. Toutefois pour les nasales le voile du palais est abaiss. Locclusion devient alors relative puisque lair passe par les cavits nasales qui entrent en rsonance donnant lieu une structure de formant. Sur le simple critre de lanalyse acoustique, les occlusives nasales devraient tre classes parmi les consonnes vocaliques (Meunier, 1994). Pour cette raison, nous dcrirons les nasales plus bas (3. Les consonnes vocaliques). Les occlusives orales sont constitues de deux vnements temporels. Dabord une tenue, dure pendant laquelle locclusion est maintenue, puis un relchement de locclusion. Ces deux vnements donnent lieu une trace acoustique dirente selon que locclusive est priodique ou apriodique. Pour ces dernires, le conduit vocal tant totalement ferm, ces consonnes sont caractrises par un silence durant toute la dure de locclusion. A la n de locclusion, le contact de locclusion (lvres, palais ou autre) est brutalement relch donnant lieu un bruit dexplosion dont la frquence est caractristique de la consonne. Il en va de mme pour les occlusives priodiques la dirence prs que la vibration des cordes vocales donne lieu une onde sonore (remplaant le silence des occlusives apriodiques et visible sur un spectrogramme sous la forme dune barre de voisement ) dont la frquence est celle de la frquence fondamentale (F0) (Fig. 4). Les caractristiques de la barre de voisement ont une grande importance dun point de vue perceptif. Le Voice Onset Time (V.O.T.) est le temps dtablissement du voisement, mesur partir de la barre dexplosion (Serniclaes, 1987). En franais, les occlusives sourdes ont un V.O.T. positif (le voisement sinstalle aprs lexplosion), alors que les sonores ont un V.O.T. ngatif (ltablissement du voisement prcde lexplosion). Ce nest pas le cas dans toutes les langues (Lisker et Abramson, 1964). Les occlusives priodiques La priodicit ou lapriodicit des sons du langage fait rfrence, respectivement, la vibration ou labsence de vibration des cordes vocales. On trouve galement les termes vois/non vois ou sonore/sourd. On lit parfois dans des ouvrages que les consonnes sont des sons apriodiques. Toutefois, partir du moment o une source sonore est prsente, on observe, sur le signal de parole, une onde priodique laquelle peut tre ajoute une source bruite. Nous considrons que ces signaux sont priodiques. Fig. 4. Signaux temporel (en haut) et spectrographique (en bas) des squences /apa/ ( gauche) et /aba/ ( droite). On observe la barre de voisement permettant de distinguer le /b/ du /p/. 5 I - Neurophysiologie - 13 - Phontique acoustique sont gnralement plus courtes que les occlusives apriodiques. Leur bruit dexplosion est galement de moindre intensit que celui de leur quivalente sourde. Les occlusives orales apriodiques sont /p/, /t/, /k/. Les occlusives orales priodiques sont /b/, /d/, /g/. Les occlusives se distinguent galement en fonction de leur lieu darticulation, autrement dit du lieu o est eectu la fermeture du conduit vocal (Fig. 5). Il existe trois lieux darticulation pour les occlusives en franais : les bilabiales (les deux lvres viennent en contact), les alvolaires (lapex de la langue vient obturer le conduit oral en se plaant sur les alvoles, cest--dire, juste derrire les incisives centrales suprieures), les vlaires (le dos de la langue vient en contact du velum, cest--dire la partie molle et postrieure du palais). Les caractristiques acoustiques qui permettent de direncier ces trois types docclusives portent a priori sur une dure trs brve (5 30 ms), le bruit dexplosion. En eet, la tenue est constitue soit dun silence, soit dune onde non caractristique du lieu darticulation de la consonne produite. La frquence, la dure et lnergie du bruit dexplosion sont typiques de la consonne produite. Les bilabiales ont un bruit dexplosion de trs faible nergie (parfois mme non identiable), court et de basse frquence. Les alvolaires produisent un bruit intense, court et plutt de haute frquence. Enn, les vlaires ont un bruit intense, long et dont la frquence dpend troitement de la voyelle suivante. En eet, la frquence du bruit dpend de la taille de la cavit antrieure au lieu docclusion et pour les vlaires, le lieu docclusion va lgrement se dplacer selon que la voyelle suivante est une voyelle antrieure (/i/) ou postrieure (/u/), ceci en raison de la coarticulation (cf. plus loin dans ce chapitre). Toutefois, on considre gnralement que les traces acoustiques les plus saillantes pour lidentication du lieu darticulation des occlusives ne sont pas internes au segment consonantique, mais dans les pentes de transition des voyelles (cf. chapitre 8, Fig. 8). Les transitions sont les variations frquentielles (sous forme de pente) des formants de la voyelle au contact de la consonne. Le type de pente (montant, descendant ou plat) va dpendre du lieu darticulation de locclusive ainsi que du type de voyelle produit. Les occlusives bilabiales sont /p/ et /b/. Les occlusives alvolaires sont /t/ et /d/. Les occlusives vlaires sont /k/ et /g/. b. Les fricatives Les consonnes fricatives sont caractrises par la prsence dun bruit turbulent durant toute leur tenue. Ce bruit est issu dun resserrement important, mais incomplet du tractus vocal. Les fricatives peuvent tre apriodiques ou priodiques. Dans ce deuxime cas, le bruit se superpose une onde sinusodale caractristique de la frquence fondamentale (Fig. 6). Tout comme les occlusives, les fricatives sonores sont plus brves que les fricatives sourdes. De mme, on note une intensit globale du bruit plus faible pour les sonores en raison de la vibration des cordes vocales qui diminue la pression supraglottique. Les fricatives apriodiques sont /I/, /s/, /j/. Les fricatives priodiques sont /v/, /z/, //. La frquence et lintensit du bruit de friction dpendent du lieu darticulation de la consonne, Fig. 5. Coupe sagittale du tractus vocal et localisation des lieux darticulation et articulateurs utiliss pour la description des sons des langues du monde. Fig. 6. Signaux temporel (en haut) et spectrographique (en bas) des squences /aja/ ( gauche) et /aa/ ( droite). On constate le voisement bruit de la fricative //. A noter galement la dure plus courte et lintensit plus faible de la fricative sonore. 6 I - Neurophysiologie - 13 - Phontique acoustique cest--dire de lendroit du conduit o le passage de lair est le plus troit. Il existe trois lieux darticulation en franais pour les fricatives : lespace entre la lvre infrieure et les incisives suprieures (labio-dentales), lespace entre la langue et les alvoles (les alvolaires) et lespace entre la langue et le palais dur (les palatales). Notons que pour les alvolaires et les palatales, la langue entre en contact avec le lieu darticulation, mais uniquement sur les parties latrales, laissant passer lair au milieu. Le lieu de resserrement donne la cavit buccale une conguration particulire qui dtermine la frquence du bruit. Le bruit des labio- dentales est de faible intensit (cest dailleurs leur principale caractristique), il prsente des pics dius vers 3, 5 et 8 kHz. Celui des alvolaires, plus intense, se situe entre 4 et 8 kHz avec des pics autour de 5 kHz et 8 kHz. Enn pour les palatales, le bruit de turbulence se situe entre 2 et 7 kHz avec un pic dius dont la moyenne se trouve autour de 4 kHz. Les fricatives labio-dentales sont /I/, /v/. Les fricatives alvolaires sont /s/, /z/. Les fricatives palatales sont /j/, //. c. Les consonnes vocaliques Lappellation consonnes vocaliques est peu rpandue. Certains auteurs utilisent les termes Consonnes sonantes ou dautres ne regroupent pas ces consonnes dans une seule classe mais dtaillent chaque type. Nous avons choisi dutiliser ces termes car ils retent la fois laspect consonantique (rtrcissement du tractus) et vocalique (structure de formant) de ces consonnes. Dune certaines faon, il sagit de sons intermdiaires plutt considrs comme des consonnes en raison de la place quils occupent dans la syllabe (attaque ou coda, cf. chapitre 14). Cette catgorie est bien plus complexe dcrire que les autres catgories de consonnes. Elle est en fait constitue dlments trs divers. On distingue les approximantes latrales, les vibrantes, les nasales et les glissantes. Ces types de consonnes ont peu de caractristiques communes, si ce nest le rtrcissement partiel ou transitoire du tractus vocal qui permet lapparition de structures de formants moins stables et moins intenses que celles des voyelles. Mme si chacune de ces consonnes possde des structures formantiques spciques, les frquences des formants sont relatives aux consonnes et voyelles adjacentes. Il existe une approximante en franais, la latrale /l/. Les approximantes prsentent un rtrcissement du tractus vocal, mais moins important que celui des fricatives. Ce faible rtrcissement, intermdiaire entre larticulation vocalique et consonantique, ne gnre pas de bruit. Le lieu darticulation de /l/ est situ sur lavant du palais : lapex de la langue va se positionner sur les alvoles, laissant passer lair sur lun ou les deux cts de la langue, do son nom de latrale. Le F1 est autour de 300 Hz tandis que le F2 est fonction des voyelles adjacentes (Fig. 7). Fig. 7. Signaux spectrographiques des squences /ama/, /ala/ et /aja/. On note la faible intensit des formants des consonnes vocaliques compars ceux des voyelles. On observe galement laspect totalement continu des variations formantiques de la 7 I - Neurophysiologie - 13 - Phontique acoustique Tout comme pour lapproximante, il nexiste quune vibrante (ou trill en anglais) en franais, il sagit du /r/. La consonne /r/ a un statut tout fait particulier car cest le son du franais le plus multiforme. Il prend en eet des aspects extrmement varis en fonction du contexte phontique dans lequel il se trouve. Traditionnellement considr comme une vibrante en franais, il est, en fait, rarement ralis ainsi. Une vibrante est une consonne pour laquelle la langue va entrer en battements le plus souvent multiples au niveau du lieu darticulation (alvolaire ou uvulaire). La vibrante alvolaire /r/ ( r roul ) nest prsente que dans certains accents rgionaux et tend disparatre. Le lieu darticulation du r le plus frquent en franais est uvulaire (donc le son le plus postrieur du franais). Il est ralis vibrant (/n/ dans le tableau de lIPA) uniquement en groupe consonantique lorsquil est prcd dune occlusive ou dune fricative sonore (Fig. 8). Ce /n/ est alors constitu de trois parties : une partie voyelle suivie dune partie battue suivie elle-mme dune autre partie voyelle (pour une description complte, cf. Meunier, 1994). En revanche, on observe une ralisation fricative /n/ dans les groupes consonantiques o les occlusives ou fricatives sont sourdes. Dans ce dernier cas, le /n/ est totalement dvois (assimilation de voisement avec la consonne qui prcde) et prend le statut dune consonne fricative (Fig. 8). Enn, en contexte intervocalique, le r est en gnral ralis comme une approximante : il ny a pas de pas de battement et ce nest pas une fricative. Le lieu darticulation reste uvulaire dans tous les cas. Nous avions mentionn les consonnes nasales dans la partie relative aux occlusives en raison de lobstruction complte du conduit oral. De ce fait, ces consonnes sont souvent considres comme des occlusives. Il existe deux consonnes nasales en franais : /m/ et /n/. Dun point de vue articulatoire, elles sont totalement comparables aux occlusives orales si ce nest que labaissement du velum autorise la sortie de lair par les fosses nasales. Ainsi, /m/ est une bilabiale. Son articulation est identique celle de /p/ et /b/ except labaissement du voile du palais. De mme, /n/ est une alvolaire comme /t/ et /d/. Les formants de /m/ sont plus graves que ceux de /n/. Comme pour les voyelles nasales, on note pour ces consonnes la prsence danti-formants dus au couplage des cavits orale et nasale (Fig. 7). Les glissantes (ou glides an anglais) sont par excellence des lments phontiques intermdiaires entre consonnes et voyelles. Certains auteurs les font appartenir la classe des approximantes. Elles sont, de ce fait, galement appeles semi-voyelles ou semi- consonnes. Elles sont au nombre de trois en franais: /j/, /q/ ct /w/. Leur articulation se fait en rfrence larticulation des trois voyelles fermes : /i/ pour Fig. 8. Signaux temporel (en haut) et spectrographique (en bas) des squences /dna/ ( gauche) et /tna/ ( droite). On observe la partie vocalique puis battue (chute dintensit) du /n/ dans la squence voise /dna/. En revanche, dans la squence dvoise /tna/, le /n/ est totalement dvois et fricatif. Deux autres nasales sont souvent mentionnes comme tant des phonmes du franais. Il sagit de // et de /p/. Elles sont constitues chacune de deux lments consonantiques, /n/ + /j/ (pour //) et /n/ + /g/ (pour /p/). Leur apparition dans le discours est relativement rare et fortement conditionn par le lexique. // est cens apparatre dans des mots comme pagne (/pa/) ou peigne (/pc/). Toutefois, aucun argument convaincant ne peut expliquer pourquoi il sagit dun phonme spcique et non une ralisation allophonique de /nj/. Le phonme /p/, quant lui, napparat que dans des mots emprunts langlais. De plus, ces phonmes consonantiques ont un statut syllabique peu cohrent avec les autres consonnes : toutes les autres consonnes du franais peuvent se combiner pour constituer un groupe de consonnes soit en attaque, soit en coda de syllabe. Les deux consonnes // et de /p/ ne peuvent, elles, se combiner avec dautres consonnes. Ces arguments nous amnent considrer quil sagit, en franais, de groupes de consonnes plutt que de consonnes simples. 8 I - Neurophysiologie - 13 - Phontique acoustique /j/ (palatale), /y/ pour /q/ (labio-palatale) et /u/ pour /w/ (labio-vlaire). Les glissantes sont caractrises par une structure formantique faible, en variation constante et donc sans partie stable, la dirence des voyelles. Cette instabilit sexplique par un resserrement des articulateurs plus important pour les glissantes ainsi que par une articulation en mouvement. Leur caractre transitoire et vocalique fait quil est impossible de distinguer avec assurance la n dune glissante du dbut de la voyelle qui suit (Fig. 7). III. Prototypes acoustiques et ralits de la parole Lensemble des descriptions que nous avons propos ci-dessus reprsentent des prototypes des sons du franais. En dautres termes, il sagit de descriptions obtenues partir de productions trs contrles (appeles parole de laboratoire ) auprs de groupes de populations homognes. Pourquoi est-il ncessaire de contrler les productions de parole pour obtenir des prototypes acoustiques stables ? Dans la parole conversationnelle classique, les sources de variation de la parole sont nombreuses et leur impact sur les ralisations phontiques peut tre de nature changer considrablement les valeurs prototypiques des sons dcrits. En quelque sorte, lobjectif de la description des sons tant la distinctivit, il est ncessaire pour augmenter cette distinctivit de rduire les sources de variation. Toutefois, pour viter de donner dans ce chapitre limpression que tout cart par rapport ces prototypes est dviant, ce qui serait erron, nous nous proposons dvoquer rapidement quelques sources de variations normales de la parole. 1. Enchanements articulatoires et coarticulation Parmi les dirents facteurs qui occasionnent la variabilit des sons de la parole, celui qui a probablement donn lieu au plus grand nombre dtudes est la coarticulation. Elle peut tre dcrite comme le chevauchement et linteraction des dirents articulateurs au cours de la production de segments phontiques successifs (Farnetani, 1997). La vitesse de production des sons de la parole (12 sons par seconde, donc environ 700 sons par minute) a pour consquence que les gestes articulatoires ne peuvent tre produits indpendamment les uns des autres. Ils sont donc souvent soient anticips, soit persistants. Par exemple, lors de la ralisation du mot sous (/su/), la conguration du conduit vocal prsente, ds le dbut de la fricative, les caractristiques du trait darrondissement de la voyelle /u/ dont larticulation est anticipe, alors que dans la production de /si/, les lvres sont en position tires au dbut de larticulation du /s/. Ces deux congurations donnent des rsultats acoustiques trs dirents : larrondissement des lvres durant la ralisation du /s/ dans /su/ augmente la taille de la cavit buccale ; la frquence du bruit de /s/ dans /su/ est donc plus grave que celui de /si/. Dans ce cas, on observe donc un dcalage par rapport aux valeurs prototypiques. Cet exemple nest pas isol. La production de la parole implique la prsence systmatique de ce type de conguration. Le cas de la coarticulation est inhrent la production de la parole. Cest pourquoi la prise en compte des variations dues la coarticulation est dsormais incontournable dans les descriptions de la parole. Ces chevauchements systmatiques des gestes articulatoires trouvent un cadre privilgi au sein de la syllabe (cf. chapitre 14). Toutefois, des travaux rcents ont pu montr des phnomnes danticipation ou de persistance dans des units dpassant largement le cadre de la syllabe.
2. Caractristiques du locuteur Lanatomie du conduit vocal, qui change selon le sexe et lge, est lorigine dune autre forme de variation totalement inhrente la production de la parole. La hauteur de la voix est le paramtre le plus apparemment aect par lge ou le sexe des locuteurs. Si la F0 des enfants de deux ans est autour de 400 Hz, elle baisse continuellement pour se stabiliser aprs la pubert entre 200 Hz et 250 Hz pour les femmes tandis que celle des hommes se situe entre 100 Hz et 150 Hz. Si chaque auditeur est capable didentier le On remarquera parfois une nomenclature articulatoire peu cohrente pour les glissantes. Elle sexplique par une appartenance conjointe de ces phonmes la classe des voyelles comme celle des consonnes. Ainsi, en tant que consonnes, elles trouvent leur description articulatoire dote des termes propres aux lieux darticulation consonantiques : palatale, labio- palatale et labio-vlaire. Ces termes, peu explicites pour des consonnes du franais (le terme labio rfre en gnral, pour les consonnes, au lieu de constriction du tractus et non larrondissement des lvres), trouvent leurs quivalents dans la nomenclature propre la description des voyelles de cette faon : palatale = antrieur ; vlaire = postrieur ; labio = arrondi. Il est ncessaire dclairer cette quivalence dans la mesure o le lieu darticulation des glissantes se rfre celui des trois voyelles fermes. 9 I - Neurophysiologie - 13 - Phontique acoustique sexe du locuteur daprs la hauteur de la voix, il lui sera beaucoup plus dicile de prendre conscience que les hommes et les femmes produisent des voyelles dont les valeurs acoustiques sont direntes. Pourtant ces variations, dues aux tailles des rsonateurs (plus larges pour les hommes), sont bien relles et engendrent des valeurs de formant plus leves pour les femmes (Tubach, 1989). Ainsi, alors que les trois formants de /e/ pour un homme sont en moyenne de 365 Hz, 1961 Hz et 2644 Hz (cf. Tableau 1), ils augmentent pour une femme 417 Hz, 2351 Hz et 3128 Hz en raison de la taille rduite des direntes cavits. Indpendamment des caractristiques anatomiques des locuteurs, il existe galement des variations dues la spcicit de chaque locuteur, son origine gographique, ses caractristiques sociales, etc. Par exemple, les locuteurs du nord-est de la France produisent des /a/ (/o/) plus postrieurs que ceux de la moyenne des Franais. 3. Type de parole On oppose depuis quelques annes la parole de laboratoire la parole naturelle ou spontane . Lanalyse de la parole produite dans des conditions relles est relativement rcente. Une des raisons majeures de cette marginalit est la trs forte variabilit des sons produits en parole spontane, non contrle, mais aussi lidentication dlicate des sources de variations qui aectent le signal. Les ralisations des units phontiques sont ainsi trs loignes de leurs valeurs prototypiques. Dans une tude portant sur la ralisation et la perception des occlusives du franais, Duez (1995) montre quen parole spontane seulement la moiti des consonnes sont identies correctement. Parler est une adaptation constante aux situations de communication (Lindblom, 1990). Larticulation peut tre soutenue si la situation le demande (contexte peu informatif, milieu bruit, etc.) ou relche si la situation est peu ambigu. Plusieurs travaux (Lindblom, 1963 ; Gendrot et Adda-Decker, 2006) ont ainsi pu montrer que plus le dbit de parole augmente, moins les cibles articulatoires sont atteintes. De mme, larticulation des voyelles tend se rduire en mme temps que la production de la parole est contextualise (Meunier et al., 2006). Le triangle caractristique de la reprsentation acoustique des voyelles montre que les voyelles sont produites en priphrie lorsquelles sont prononces isolment, tandis quelles se centralisent lorsquelles sont produites dans un texte lu (Fig. 9). Cela signie que larticulation des voyelles en lecture de texte tend vers une voyelle centrale /c/, pour laquelle les gestes articulatoires sont les plus neutres. En consquence, la parole trs contrle (celle qui permet de fournir des mesures prototypiques) est caractrise par une hyperarticulation, alors que la parole contextualise est sous-articule. IV. Conclusion Nous avons cherch, dans ce chapitre, dresser un portrait des ralisations acoustiques des sons du franais. Ce portrait nest pas toujours simple tant donn la complexit de lorganisation des sons dans une langue. Si certaines classes de sons semblent former un systme articulatoire et acoustique organis en franais (les voyelles, les occlusives, les fricatives), dautres sons semblent plus isols et nentrent pas dans lorganisation dun systme de traits aussi rgulier. Dune certaine faon, il existe des sons trs ouverts (les voyelles) et dautres trs ferms (les occlusives et les fricatives). Entre les deux, les ralisations articulatoires semblent plus mouvantes et moins simples expliciter. Fig. 9. Ralisations acoustiques des voyelles /i/, /e/, /a/, /o/, /u/ prononces isolment ( gauche) et dans un texte. On observe la rduction considrable de la taille globale du systme vocalique ; les valeurs moyennes de formants observes en lecture de texte sont trs loignes des valeurs prototypiques (daprs Meunier et al., 2006). 10 I - Neurophysiologie - 13 - Phontique acoustique Nous insistons sur le fait que les ralisations acoustiques des sons dune langue sont des phnomnes bien plus mouvants quune simple description pourrait le laisser penser. La production des sons est une composante de lorganisation plus gnrale de la production du langage. Cette organisation suppose des interactions complexes entre les dirents niveaux linguistiques ainsi que des contraintes cognitives mettant en relation un locuteur avec un (ou des) auditeurs. Aussi, la prsentation de valeurs acoustiques prototypiques ne reprsente que la partie mergente de liceberg des productions sonores du langage en condition normale. Cette partie mergente est celle qui apparat lorsque lon isole la production des sons du contexte linguistique. Rfrences 1. Duez D. On spontaneous French speech : Aspects of the reduction and contextual assimilation of voiced stops . J Phonetics 1995, 23: 407-427. 2. Farnetani E. Coarticulation and connected speech. In Hardcastle WJ, Laver J (eds). Handbook of Phonetic Sciences. Blackwell. Oxford. 1997, pp 371-404. 3. Gendrot C, Adda-Decker M. Analyses formantiques automatiques en franais: priphralit des voyelles orales en fonction de la position prosodique. Actes des 26mes Journes dtudes sur la Parole, Dinard, juin 2006 : 407-410 4. International Phonetic Association. (1999). Handbook of the International Phonetic Association. A Guide to the Use of the International Phonetic Alphabet. Cambridge University Press. Cambridge. 5. Lindblom B. Spectrographic study of vowel reduction. J Acoust Soc Am 1963, 35: 1773-1781. 6. Lindblom B. Explaining phonetic variation : a sketch of the hyper- and hypospeech theory. In Hardcastle WJ, Marchal A (eds). Speech Production and Speech Modelling. Kluwer Academic Publishers. 1990, pp 403-439. 7. Lisker L, Abramson AS. A cross-language study of voicing in initial stops: acoustical measurements. Word 1964, 20: 384-422. 8. Meunier C. (1994). Les groupes de consonnes : problmatique de la segmentation et variabilit acoustique. Tse de lUniversit de Provence. Aix- en-provence. France. 9. Meunier C, Espesser R, Frenck-Mestre C. Aspects phonologique et dynamique de la distinctivit au sein des systmes vocaliques : une tude inter-langues. Actes des 26mes Journes dtudes sur la Parole, Dinard, juin 2006 : 333-336. 10. Rossi M. Segmentation automatique de la parole. Pourquoi ? Quel segments ? Traitement du signal 1990, 7: 315-326. 11. Schwartz JL, Bo LJ, Valle N. Major trends in vowel system inventories. J Phonetics 1997, 25: 233-253. 12. Serniclaes W. (1987). Etude exprimentale de la perception du trait de voisement des occlusives du franais. Tse de lUniversit Libre de Bruxelles. Bruxelles. Belgique. 13. Tubach JP. (1989). La parole et son traitement automatique. Masson. Paris.