Sunteți pe pagina 1din 37

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Universitatea Tehnic Gheorghe Asachi din Iai


Facultatea de Electronic, Telecomunicaii i Tehnologia
Informaiei

Raport de cercetare I
TRECERE N REVIST A DOMENIULUI
ACUSTICII ARTICULATORII CU APLICAII
MEDICALE

Doctorand:
Bioing. Alina Untu (Hulea)

Conductor tiinific:
Prof.dr.ing. Horia Nicolai Teodorescu, m.c. A.R.

-Iai 2011-

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

Cuprins
1. Introducere
2. Elemente de fonetic
2.1. Fonetica articulatorie
2.2. Fonetica acustic
2.3. Caracterizarea i clasificarea articulatorie a sunetelor
2.4. Caracterizarea i clasificarea acustic a sunetelor
3. Metode i instrumente de analiz a vocii
3.1. Metode subiective
3.2. Metode obiective
3.3. Instrumente de analiz a semnalului vocal i a articulrii sunetelor
4. Aplicaii medicale
4.1 Aplicaii n stomatologie
5. Concluzii i direcii viitoare

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

1. Introducere
Structura acestui raport este dat de coordonator, prof. dr. H. N. Teodorescu.
Vorbirea reprezint una dintre cele mai complexe operaii efectuate de organismul
uman, iar afectarea acesteia poate duce la imposibilitatea de a fi neles de ctre cei din jur,
avnd drept consecin deteriorarea vieii profesionale, sociale i personale a individului.
Tulburrile de limbaj apar cel mai adesea n perioada copilriei i se corecteaz de ctre
logopezi sau de-a lungul vieii i se datoreaz diverselor patologii ale laringelui, aparatului
stomatognat, afeciunilor ORL, tulburrilor psihologice sau neurologice cu afectarea
centrilor vorbirii. Lsnd la o parte defectele de vorbire cauzate de afectarea cortexului
cerebral, deficienele de pronunie se pot datora pe de o parte alterrii unei poriuni a
canalului fonator i pe de alt parte alterrii cavitilor rezonante sau unuia dintre
articulatori.
O afeciune pulmonar poate influena fonaia avnd drept consecine reducerea
timpului fonator, perturbaii de amplitudine sau modificri ale indexului VHI (Voice
Handicap Index) [1]. Afeciuni ale nasului duc la nazalizarea unor sunete cum ar fi
consoanele nazale sonore /m/, /n/ i automat la modificarea vorbirii.
Alte cauze ale defectelor de vorbire de etiologie organic sunt bolile congenitale,
boli metabolice de tipul hipo / hipertiroidism, neoplasme benigne sau maligne ale laringelui
i traume cum ar fi nodulii vocali [2]. Perforaiile palatului moale, ale buzelor, ale limbii
sau defectele de dentiie de tipul malocluzii, edentaii, protezri, nghesuiri de dini,
muctur deschis sau spaieri ntre dini pot influena de asemenea claritatea i
corectitudinea pronuniei sunetelor.
Vocea se caracterizeaz n mod tipic prin frecven, intensitate i calitate sau
complexitate. Prin varierea parametrilor vocii cum ar fi frecvena fundamental, intensitatea
sau prozodia, vorbitorul exprim emoii sau poate da un anumit sens vorbirii. O tulburare
de vorbire exist atunci cnd frecvena fundamental, calitatea i amplitudinea vocii unui
vorbitor difer mult fa de vorbitorii de aceeai vrst, sex, cultur i locaie demografic.
Dup [3], tulburrile de comunicare se mpart n tulburri ale vocii de tip disfonie,
tulburri de cauz motorie (dizartrie, apraxie), tulburri de limbaj (afazie) i tulburri de
cauz cognitiv. Disfonia poate avea cauze organice sau funcionale. Cauzele organice au
fost amintite anterior, iar cauzele funcionale sunt abuzul sau neutilizarea vocii, abuzul de
anumite substane (fumatul, alcoolul), etatea, tulburri psihosociale, condiii de isterie etc.
Tulburrile de cauz motorie se datoreaz tulburrilor de control muscular n dizartrie,
respectiv tulburrilor capacitii de a programa poziionarea musculatorii implicate n
vorbire i de a secveniona micrile necesare vorbirii n apraxie. Tulburrile de limbaj
(afazia) sunt cauzate de afectarea ariei cerebrale responsabile de nelegerea i exprimarea
limbajului, iar cele cognitive sunt cauzate de disfuncia emisferei cerebrale drepte, traume
cerebrale sau demen.

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

2. Elemente de fonetic
Fonetica studiaz sunetele limbii n planul fizic (acustica), n planul biologic
(fiziologia), n planul social, n sistemul limbii (fonologia, fonetica funcional), precum i
din punctul de vedere al proprietilor fiziologice i acustice (fonetica experimental).
Fonetica are urmtoarele seciuni: fonetica articulatorie, fonetica acustic i fonetica
neuroperceptiv. Fonetica articulatorie se refer la faza fiziologic motorie, de punere n
micare a organelor articulatorii ale emitorului, fonetica acustic la faza emisiunii sonore,
de producere a unui lan de semnale acustice ndreptate spre receptor, iar fonetica
neuroperceptiv la faza perceperii mesajului auditiv de ctre receptor, de convertire a
acestuia n lan de impulsuri nervoase i de recunoatere sau integrare [4].
2.1.

Fonetica articulatorie

Aparatul fonoarticulator este alctuit dintr-o serie de organe, muchi, oase ale
corpului, dintre care cele mai importante sunt plmnii, diafragma, traheea, laringele,
faringele bucal, faringele nazal, fosele nazale, cavitatea bucal, dinii, limba, buzele, palatul
i oasele feei. Acestea sunt implicate n producerea i modelarea vocii, respectiv n fonaie
i articulare. Schema organului fonator realizat de [5] este prezentat n Figura 1.

faringe

plmni

laringe
corzi vocale
trahee i
bronhii

cavitate
nazal

orificiu nazal

cavitate
bucal

orificiu bucal

velum

for muscular

Figura 1. Schema organului fonator [5]

n procesul de fonaie intervine fora muscular care determin expulzarea fluxului


de aer din plmni (sursa de aer), prin trahee, spre laringe.
Laringele este cea mai important poriune a canalului fonator la nivelul cruia sunt
situate corzile vocale, care n momentul pronuniei unui sunet sonor vibreaz dnd
frecvena fundamental a vocii. La acest nivel are loc fonaia care reprezint prima
modificare a fluxului de aer expirat. Corzile vocale au o form asemntoare cu cea a
buzelor i se dechid / nchid n funcie de trecerea aerului prin ele. Au o poriune fixat de
cartilajul tiroid, iar cealalt extremitate este ataat unei perechi de cartilaje mobile numite
aritenoide. n momentul producerii unui sunet, spaiul dintre corzile vocale n form de V
se ngusteaz. Laringele are rolul de a imprima sunetului caracterul de sonoritate i de a
controla intensitatea i variaiile tonului fundamental (influeneaz accentul i intonaia).
Conform studiilor realizate de [6] dimensiunile laringelui cresc cu vrsta ajungnd
ca la brbatul adult corzile vocale s aib lungimea de 17-23 mm, limea maxim a glotei
de 19 mm, iar orificiul intraglodic n seciune transversal de 24 mm. La femeia adult
dimensiunile laringelui sunt mai mici respectiv 12.5-17 mm lungimea corzilor vocale, 13
mm limea maxim a glotei i 17 mm orificiul intraglodic n seciune transversal. Un

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

studiu mai recent [7] a fost fcut pe adolesceni ntre 10.3 i 17.9 ani, care au fost mprii
pe trei categorii de vrst. Rezultatele obinute arat c att femeile ct i brbaii prezint
modificri semnificative ale lungimii i lrgimii cavitii orale i a tractului vocal n funcie
de vrst. Totodat brbaii i femeile prezint caracteristici similare n dezvoltarea
tractului vocal, ns la brbai s-a constatat c modificrile sunt mai accentuate dect la
femei.
Pentru ca sunetele simple produse de corzile vocale s se transforme n cuvinte este
necesar implicarea articulatorilor i a cavitilor rezonante care dau formanii superiori ai
frecvenei fundamentale. Individualitatea vocii este dat de forma i mrimea cavitilor
rezonante, amplitudinea este determinat de fora cu care aerul este expulzat,
iar tonalitatea de lungimea i gradul de tensionare a corzilor vocale. Rezonatorii sunt
reprezentai de faringe, cavitatea nazal i cavitatea bucal.
Faringele este un rezonator modificabil: prin ridicarea laringelui se scurteaz, prin
aciunea muchilor proprii se ngusteaz lateral, iar prin poziia orizontal a limbii i
mrete sau reduce deschiderea. Acesta are rolul de a direciona fluxul fonic fie spre
cavitatea bucal, fie spre cavitatea bucal i nazal concomitent. La nivelul faringelui are
loc diferenierea sunetelor n sunete orale i sunete nazale [4]. Studii recente realizate de [7]
i [8] arat c lungimea medie a faringelui crete cu vrsta i poate scade la persoanele cu
vrst foarte naintat.
Cavitatea bucal este alctuit din maxilarul inferior i superior, limba, buzele,
dinii, alveolele i palatul. Partea superioar a cavitii bucale se divide n mai multe zone:
dental, alveolar, prepalatal, palatal, postpalatal (velar) i uvular. Organele cavitii
bucale sunt de dou tipuri: fixe (dinii incisivi, alveolele acestora i palatul dur) i mobile
(maxilarul inferior, palatul moale, limba, uvula, buzele). La nivelul cavitii bucale se
produc cele mai multe fenomene de amplificare i modelare a fluxului fonic, aici avnd loc
articulaia propiu-zis.
Cavitile nazale reprezint un rezonator i amplificator
nemodificabil n care fluxul fonic capt doar caracter nazal.
2.2.

Fonetica acustic

Fonetica acustic studiaz proprietile fizice ale sunetelor, care sunt dependente de
cele articulatorii. Sunetul este rezultatul vibraiei unui corp elastic de o parte i de alta a
poziiei sale de echilibru, care declaneaz n masa de aer micri oscilatorii i ondulatorii.
Vibraia se caracterizeaz prin amplitudine (deprtarea maxim fa de poziia de echilibru)
i frecven (numrul de perioade realizate ntr-o secund). n funcie de caracterul periodic
sau neperiodic al vibraiei sunetele se mpart n tonuri i zgomote.
Vocalele care sunt produse prin vibraia periodic a corzilor vocale corespund
tonurilor, iar consoanele produse prin trecerea turbulent, neperiodic a fluxului de aer prin
canalul fonator ngustat sau nchis/deschis brusc corespund zgomotelor. O categorie aparte
alctuit att din tonuri (cu participarea corzilor vocale) ct i din zgomote, sunt consoanele
sonante.
Sunetele se caracterizeaz prin nlime, frecven, intensitate, timbru i durat.
nlimea depinde de frecvena oscilaiilor. Cu ct frecvena este mai mare cu att
sunetul este mai nalt. Dup nlime sau ton sunetele se clasific n ascuite (mai nalte) sau
grave (mai joase).
Frecvena reprezint numrul de perioade pe care un corp elastic le realizez ntr-o
secund.
Intensitatea sau tria sunetelor se msoar n decibeli i reprezint proprietatea
sunetelor de a fi articulate mai puternic sau mai slab.

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Timbrul este proprietatea unui sunet de a se distinge de un altul produs n condiii


identice de surse diferite i depinde de numrul, frecvena i amplitudinea vibraiilor care se
adaug la cea fundamental. n consecin timbrul vocii este dat de formanii superiori.
Timbrul unei voci se schimb n funcie de modificarea frecvenei fundamentale i a
formanilor astfel: dac se accentueaz frecvena fundamental sau formanii inferiori
timbrul devine grav, iar dac se accentueaz formanii superiori timbrul devine acut.
Timbrul este specific fiecrui vorbitor fcnd posibil recunoaterea vorbitorului dup
vocea sa.
Durata reprezint proprietatea unui sunet de a fi pronunat ntr-un interval de timp
mai scurt sau mai lung n funcie de capacitatea pulmonar a fiecrei persoane. n funcie de
durat sunetele se mpart n durative i n aceast categorie sunt incluse vocalele i
consoanele sonante i fricative, i momentane din care fac parte ocluzivele i africatele la
care se poate prelungi doar partea fricativ.
2.3.

Caracterizarea i clasificarea articulatorie a sunetelor

Fazele articulrii unui sunet dup [4] sunt tensiunea, inuta i destinderea. n faza de
tensiune organele articulatorii i pregtesc poziia pentru emiterea sunetului, ulterior i
pstreaz poziia articulrii sunetului (tensiune) i revin la poziia de repaus (destindere). La
ocluzive apar fazele de implozie, plozie i explozie n care se produce micarea de
nchidere a canalului fonator, nchiderea canalului fonator, respectiv deschiderea canalului
fonator. Sunetele se coarticuleaz ceea ce face ca poriunile lor iniiale i finale s se
transforme n sunete de tranziie spre sunetul anterior sau posterior.
Sunetele se mpart n vocale, consoane, semivocale i sonante. Acestea difer n
funcie de efortul expirator, tensiunea muscular i poziia organelor articulatorii. La vocale
efortul expirator este mai slab dect la producerea consoanelor, iar la consoane n
momentul articulrii apare un obstacol n calea fluxului de aer de la plmni i tensiuena
muscular este mai puternic, localizat la locul obstacolului.
Semivocalele sunt elemente fonetice nesilabice din compozitia unui diftong care se
aseaman cu consoanele n ceea ce privete poziia organelor articulatorii i cu vocalele din
punctul de vedere al tensiunii musculare. Semivocalele sunt variante ale vocalelor /i/, /u/,
/e/, /o/ i se deosebesc de acestea prin faptul c nu pot forma singure o silab.
Vocalele sunt elemente fonetice sonore, care se produc prin trecerea liber a
fluxului de aer prin canalul fonator fr ntmpinarea unui obstacol. Acestea sunt
determinate doar de vibraia corzilor vocale i au articulaie deschis. Conform Alfabetului
Fonetic Internaional [9] vocalele se clasific dup trei criterii: gradul de deschidere
(nchise, mijlocii i deschise), locul de articulare (anterioare, centrale i posterioare) i
rotunjimea (rotunjite i nerotunjite). n ceea ce privete locul de articulare la vocalele
anterioare limba se curbeaz spre partea anterioar a palatului, la cele posterioare spre
partea posterioar, iar la cele centrale rmne aplatizat. Rotunjimea se refer la poziia
buzelor, iar deschiderea la gradul de deschidere al cavitii bucale n timpul articulrii. n
Figura 2 sunt marcate n chenare negre cele apte vocale ale limbii romne simbolizate
prin: /a/ - [a], /e/ - [e], /i/ - [i], /o/ - [o], /u/ - [u], // - [], /// - [].

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Figura 2. Vocalele orale din AFI (Alfabetul Fonetic Internaional) [9]

Dup AFI [9] avem urmtoarea caracterizare a vocalelor limbii romne:


/a/ - vocal deschis central nerotunjit;
/e/ - vocal mijlocie anterioar nerotunjit;
/i/ - vocal nchis anterioar nerotunjit;
/o/ - vocal mijlocie posterioar rotunjit;
/u/ - vocal nchis posterioar rotunjit;
// - vocal mijlocie central nerotunjit;
/// - vocal nchis central nerotunjit.
Spre deosebire de alte limbi cum ar fi franceza i portugheza n care exist i vocale
n producerea crora o parte din fluxul de aer este dirijat spre cavitatea nazal, n limba
romn acestea sunt orale, ceea ce nseamn c fluxul de aer este dirijat aproape n totalitate
spre cavitatea bucal.
n cazul n care vocalele se situeaz anterior sau posterior unei consoane nazale ntro silab, preiau caracterul de nazalizare al acestora. O alt caracteristic a limbii romne
este desonorizarea (pierderea vibraiei) care se ntlnete la unele vocale finale i este
influenat de gradul de deschidere, distana fa de silaba accentuat, nvecinarea cu o
consoan surd (nesonor) [4].
Vocalele pot fi caracterizate i prin aa numitul triunghi al vocalelor sau
Triunghiul lui Vietor care reprezint o diagram a vocalelor realizat n cooncordan cu
poziia limbii i a cavitii bucale n timpul articulaiei. Acest triunghi a fost realizat pentru
prima oar de filologul i foneticianul german Wilhelm Vietor (1850-1918), iar ulterior a
fost prezentat i n [10] i [5]. Dup [10] triunghiul vocalelor raportat la organele
articulatorii este reprezentat n Figura 3.

dini i
o

e
a

Figura 3. Triunghiul vocalelor [10]

uvul

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Triunghiul vocalelor este o reprezentare schematic a tuturor vocalelor printr-un


grafic de coordonate F1-F2 care n funcie de valorile acestor parametri se poate mpri n
regiuni de decizie pentru estimarea vocalei pronunate. Primii doi formani ai vocalelor
prezint variabilitate de la o vocal la alta, intravorbitor, intervorbitor i de la un gen la
altul. Diverse studii au utilizat valorile acestor formani n sisteme de recunoatere vocal
realizate la nivel hardware [11] sau software. Conform figurii 4, vocalele /i/ i /e/ sunt
articulate prin deplasarea muchiului limbii spre n fa, respectiv spre poriunea anterioar
a palatului. Vocalele /o/ i /u/ se articuleaz prin deplasarea spre napoi a muchiului limbii,
respectiv spre partea posterioar a palatului (velum), iar la articularea vocalei /a/, limba
rmne ntr-o poziie neutr [10]. Triunghiul vocalelor d informaii despre modul de
articulare raportat la distana dintre formanii F1 i F2.
Consoanele sunt elemente fonetice n producerea crora fluxul de aer, mai intens
dect la vocale ntlnete un obstacol de-a lungul canalului fonator. Consoanele limbii
romne sunt pulmonare, produse prin comprimarea aerului n plmni, iar tensiunea se
concentrez ntr-un singur punct. Consoanele se clasific dup modul de articulare, dup
locul de articulare i dup sonoritate. Dup modul de articulare se mpart n fricative,
ocluzive, africate, sonante, vibrante i nazale. Dup locul de articulare se mpart n
bilabiale, labiodentale, alveolare, palatale, velare i glotale. Dup sonoritate se mpart n
sonore i nesonore. Clasificarea consoanelor limbii romne dup [9] este dat n Tabelul 1.
n chenar sunt prezentate consoanele sonore i variantele lor nesonore care au acelai mod
i loc de articulare. Dac lum n considerare locul unde se produce sunetul, consoanele
alveolare sunt considerate a fi dentale. Att dinii ct i limba au un rol important n
articularea consoanelor alveolare (dentale). Limba dirijeaz un flux de aer subire spre
vrful dinilor unde se produc turbulene de nalt frecven. Obstacolul la acest tip de
consoane se realizeaz prin apropierea limbii de alveolele incisivilor superiori la fricative,
sprijinirea vrfului limbii pe alveolele incisivilor superiori la ocluzive i prin ocluzie la
africate.
Tabel 1. Consoanele limbii romne [9]
Sonore
b
d
ghe, ghi
g
ge, gi
v
z
j
m
n
l
r

Mod de articulare
ocluziv
ocluziv
ocluziv
ocluziv
africat
fricativ
fricativ
fricativ
africat
fricativ
nazal
nazal
lateral
vibrant

Loc de articulare
bilabial
alveolar
palatal
velar
postalveolar
labiodental
alveolar
postalveolar
alveolar
glotal
bilabial
alveolar
alveolar
alveolar

Nesonore
p
t
che, chi, ke, ki
c
ce, ci
f
s

h
-

Sonantele sunt o categorie de consoane care fac trecerea de la vocale la consoanele


propiu-zise. Dup modul de articulare, sonantele se mpart n ocluzive (/m/, /n/) i
constrictive (/l/, /r/), iar dup locul de articulare - bilabiale (/m/) i dentale (/n/, /l/, /r/). Alte
caracteristici ale modului de articulare sunt puse n eviden de mprirea n nazale (/m/,
/n/) i lichide (/l/, /r/).

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

2.4.

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Caracterizarea i clasificarea acustic a sunetelor

Din punct de vedere acustic sunetele limbii romne se pot clasifica n funcie de
spectrul caracteristic. Spectrul unui sunet const n reprezentarea sunetului prin
amplitudinea vibraiilor corespunztoare fiecrei frecvene i este rezultatul ntregii
activiti a organelor articulatorii care intervin n producerea lui. Micrile articulatorii
produc modificarea formei, volumului cavitilor i a spaiului de rezonan care determin
gradul de concentrare sau de difuziune a formanilor.
Vocalele sunt semnale armonice caracterizate printr-o frecven fundamental care
reprezint frecvena de vibraie a corzilor vocale i formani multipli ai frecvenei
fundamentale. n Figura 4 sunt reprezentate frecvena fundamental (F0) i primii patru
formani superiori (F1-F4) ai unui semnal armonic.

Figura 4. Frecvena fundamental i primii patru formani superiori ai unui semnal armonic
[12]

Vocalele sunt generate de o und cu caracter periodic, care se diversific n funcie


de variaiile de form i volum ale cavitii bucale. n funcie de gradul de concentrare i
dispersie a formanilor (spaiul dintre formanii F1 i F3), vocalele se clasific n compacte
/a/, la care F1 este apropiat de F3, avnd un spaiu de rezonan amplu i difuze - /i/, /u/,
//, la care F1 este deprtat de F3, iar spaiul de rezonan este mic. n funcie de nlime,
influenat de volumul rezonatorului adic de distana dintre F2 fa de F1 i F3, vocalele
sunt acute - /e/, /i/, la care F2 este apropiat de F3 i grave - /o/, /u/, la care F2 este apropiat
de F1 [4].
Din punct de vedere al duratei, vocalele sunt sunete continui, durative, care pot fi
susinute mai mult sau mai puin, n funcie de volumul fluxului de aer care vine de la
plmni. Clasificarea acustic a vocalelor n compacte/difuze, acute/grave, corespunde
clasificrii articulatorii deschis/nchis, anterior/posterior.
Consoanele sunt zgomote produse prin trecerea turbulent a aerului prin canalul
fonator, cu spectru continuu. n funcie de prezena / absena frecvenei fundamentale se
clasific n:
sonore (v, z, b, d, g) - sunt constituite din vibraiile corzilor vocale i, predominant,
din zgomotul produs de fluxul de aer la nivelul obstacolului aflat n cavitatea
bucal;
surde (f, s, , h, p, t, k, k, , ) sunt constituite numai din zgomotul produs de felul
n care fluxul de aer depete obstacolul aflat n cavitatea bucal;
Sonantele (m, n, l, r) sunt sunete rezultate din mpletirea tonurilor i a zgomotelor,
cu predominarea celor dinti. Din punct de vedere al posibilitii de susinere, fricativele,
nazalele i laterala /l/ sunt durative, iar ocluzivele i africatele sunt momentane. Comparativ
cu vocalele consoanele prezint antirezonan care se refer la amplitudinea i distribuia
formanilor. n consecin la consoane energia este mai mic dect la vocale.

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

n acelai mod precum vocalele, dup [4], consoanele se clasific n funcie de


poziia formanilor n spectru sau intensitate n:
compacte: prepalatalele [, , , ], palatalele [k, g], velarele [k, g] i glotala [h]
care sunt articulate din regiunea velar pn n cea palatal inclusiv. Acestea sunt
realizate cu un rezonator mai deschis i au formanii concentrai n zona central;
difuze: bilabialele [m, p, b], dentalele [t, d, n, r, s, z, ] i labio-dentalele [f, v], care
sunt articulate n partea anterioar a cavitii bucale. Acestea sunt realizate cu un
rezonator mai nchis i au formanii dispersai;
acute: palatalele [k, g], prepalatalele [, , , ] i dentalele [s, z, t, d, n], care sunt
amplificate de un rezonator bucal mic, divizat de muchiul lingual prin apropiere
sau lipire de organul pasiv;
grave: glotala [h], velarele [k, g], bilabialele [m, p, b] i labio-dentalele [f, v], care
sunt articulate la o extremitate sau alta a cavitii bucale, cu un rezonator mare,
nedivizat de muchiul lingual.

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

3. Metode i instrumente de analiz a vocii


De-a lungul timpului au existat dou metode de analiz a vocii. O analiz
subiectiv, prin percepie auditiv, realizat de experi fonologi sau experi n analiza vocii
patologice i o analiz obiectiv, bazat pe msurri acustice ale parametrilor vorbirii, de
exemplu a frecvenelor formanilor i a frecvenei fundamentale, semiautomatic - utiliznd
calculatorul sau cu aparate speciale - spectrograful i sonograful, cu ajutorul crora
structura sunetului este vizualizat ca spectru nregistrat pe o band de hrtie
electrosensibil, numit spectrogram, respectiv sonogram.
3.1 Metode subiective
Clinicienii preocupai de evaluarea calitii vocii utilizeaz i valoreaz mai mult
analiza perceptual, considerat o metod standard, dect cea instrumental. Percepia
calitii vocii este important n evaluarea i tratamentul pacienilor cu tulburri ale vocii.
Kreiman et al. [13] a realizat un studiu bazat pe 57 de articole publicate ntre anii
1951-1993, de cercettori n domeniul evalurii vocii, pentru a determina care este cea mai
bun metod de evaluare a calitii vocii, ce standarde de autenticitate intra- i interevaluare ar trebui respectate i cum ar putea fi maximizate autenticitatea evalurilor i
nivelurile de cooncordan intra- i inter evaluatori. Comparaii ntre diverse studii au artat
c autenticitatea inter-evaluare i intra-evaluare difer foarte mult de la un studiu la altul.
Autorii propun o metod teoretic care atribuie variabilitii evalurii diverse surse cum ar
fi: date despre asculttori, sarcina utilizat pentru realizarea evalurilor, interaciunile dintre
asculttori i sarcinile atribuite, i eroarea random. Pentru ca evalurile perceptuale s fie
semnificative, asculttorii trebuie s utilizeze scrile de msur n mod consecvent: un
evaluator trebuie s evalueze un eantion de voce n mod similar la fiecare ascultare.
Totodat, cooncordana inter-evaluare trebuie s fie mare, ceea ce nseamn c un eantion
de voce evaluat de mai muli evaluatori trebuie s primeasc scoruri de evaluare similare.
Conform studiilor realizate de [13], n evaluarea perceptual a calitii vocii au fost
utilizate urmtoarele metode. O prim metod de evaluare const n mprirea
eantioanelor de voce pe diverse criterii cum ar fi voce aspr (rough) sau voce murmurat
(breathy). Scala EAI (Equal Appearing Interval) este o scal de puncte echidistante de la 1
la n, pe care asculttorii trebuie s bifeze numrul asociat unui eantion de voce. Scalele
VA (Visual Analog) constau n linii nedifereniate, n jur de 100 mm lungime, pe care
asculttorii trebuie s marcheze un semn pentru a indica gradul n care o voce posed o
anumit caracteristic. O alt metod const n estimarea direct a magnitudinii (DMEDirect Magnitude Estimation). Asculttorii atribuie un numr eantionului de voce pentru a
indica msura n care acel eantion posed calitatea pentru care este evaluat. n metoda
bazat pe comparaie pereche (paired comparison), asculttorii compar doi stimuli cum ar
fi gradul de diferen dintre diverse dimensiuni, similaritate / diferen, asprime relativ,
etc.
Rezultatele studiului arat c o autenticitate i o cooncordan perfect ntre
evalurile vocii de ctre un singur asculttor sau de ctre mai muli asculttori nu se pot
obine nici mcar la nivel teoretic. O soluie la aceast problem este propus de ctre
autori i const n reducerea variabilitii n evalurile calitii vocii prin nlocuirea
standardelor interne, instabile ale asculttorilor cu voci referin pentru fiecare dintre
calitile vocii. O alt soluie propus este dezvoltarea de protocoale de evaluare care s
controleze cteva din sursele de variabilitate ale percepiei calitii vocii de ctre
asculttori.

10

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Jacobson et. all [14] a dezvoltat un indice robust din punct de vedere statistic numit
Voice Handicap Index (VHI) care msoar influena tulburrilor de limbaj asupra calitii
vieii. Acest indice se calculeaz pe baza unui set de 30 de ntrebri adresate persoanelor
evaluate, prin care acestea i autoevalueaz propria voce. ntrebrile sunt mprite n trei
categorii de evaluare i anume: evaluare funcional, evaluare fizic i evaluare emoional.
Fiecare rspuns este cotat cu un punctaj de la 0 la 4, semnificnd descrierile: niciodat,
aproape niciodat, cteodat, aproape ntotdeauna, ntotdeauna. Acest indice a fost frecvent
utilizat de ctre clinicieni pentru evaluarea calitii vocii la cntrei care prezint noduli,
chiti sau polipi pe corzile vocale [15], la pacieni cu disfonie spasmodic [16], [17], n
evaluarea disfoniei pediatrice [18], la evaluarea vocii dup laringectomii pariale sau totale
[19]-[22] sau n evaluarea impactului psihosocioprofesional al tulburrilor de vorbire [23].
T. Nawka [24] a dezvoltat un indice de evaluare a tulburrilor de voce numit
Stimmstrungsindex (SSI) care include 12 ntrebri diferite de cele ntlnite n cazul
indicelui de evaluare a handicapului vocal (VHI). Acest indice a fost comparat cu indicele
VHI de ctre [25], care au demonstrat c printr-o simpl multiplicare a indicelui SSI se
obine o corelaie semnificativ statistic cu indicele VHI. Studiul s-a efectuat pe 210
pacieni la care s-au evaluat indicii VHI i SSI. Ulterior, indicele SSI a fost multiplicat cu
2.5, rezultnd un alt scor denumit VHI-korr, care a fost comparat cu indicele VHI.
Rezultatele studiului au artat c indicele SSI bazat pe scorul VHI-korr este comparabil cu
indicele VHI i prezint aplicabilitate n evaluarea clinic a deficienelor de vorbire. [25] au
dezvoltat i un modul de evaluare a tulburrilor de limbaj numit lingWAVES care
conine o interfa grafic cu un formular de pacient, un editor care transfer datele
pacientului ntr-o baz de date cu mai muli pacieni, i o vizualizare a clasificrii
rezultatelor.
3.2 Metode obiective
n ceea ce privete evaluarea calitii vocii prin analiz acustic, au fost descrise
diverse metode n literatur. L. Eskenazi et. all [26] a studiat relaia care exist ntre diverse
caliti ale vocii i civa parametri acustici calculai pentru vocala /i/, pronunat de
pacieni aparinnd a dou categorii: pacieni cu voce normal i pacieni cu voce
patologic. n cazul pacienilor din a doua categorie s-au analizat cinci parametri ai calitii
vocii: severitatea total, asprimea, rgueal i laringealizarea. S-a realizat iniial un test
standard de ascultare i evaluare a vocilor patologice pentru fiecare calitate a vocii, pentru
care s-a utilizat o scal de la 1 la 7. Rezultatele obinute n urma acestui test au fost
comparate cu mrimile acustice calculate, prin metode de regresie liniar, fiind utilizat
drept criteriu de selecie predicia bazat pe suma ptratelor (PRESS-Prediction Sum of
Squares). S-a constat c cei mai importani parametri acustici pentru evaluarea vocii
patologice sunt amplitudinea frecvenei fundamentale i raportul armonici zgomot (HNRHarmonics to Noise Ratio).
Parametrul HNR a fost utilizat anterior i de [27] n evaluarea gradului de rguel
(hoarseness) a vocii. Acesta se poate analiza subiectiv, prin metoda vizual, care presupune
msurarea direct pe spectrogram a gradului n care zgomotul nlocuiete armonicele
vocalelor susinute, sau obiectiv prin calcule. n acest studiu s-au utilizat ambele metode.
Calculul HNR a constat n urmtorii pai: calculul mediei a 50 de perioade consecutive ale
frecvenei fundamentale corespunztoare vocalei /a/, calculul energiei medii a formei de
und (H) i a energiei medii corespunztoare diferenelor dintre perioadele individuale i
perioadele mediate ale formei de und (N). Studiul s-a realizat pe un grup de 42 de

11

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

persoane cu voci normale i 41 de persoane cu diverse grade de rgueal. Rezultatele au


artat un grad de cooncordan ridicat ntre HNR calculat i cel evaluat subiectiv pe
spectrograme de ctre doi experi. Acest indice s-a dovedit a fi util i n evaluarea
cantitativ a rezultatelor tratamentului pentru rgueal. Caracteristicile spectrogramelor
vocalelor susinute, percepute a fi pronunate rguit dup [28] sunt urmtoarele: prezena
de componente zgomotoase peste formantul principal al fiecrei vocale, prezena de
componente zgomotoase peste 3000 Hz i pierderea armonicelor superioare. Cu ct vocea
este mai rguit cu att aceti parametri sunt mai accentuai.
HNR dup [27] a fost calculat plecnd de la ipoteza c semnalul caracteristic
vocalelor susinute are o component periodic, care este aceai de la un ciclu la altul i o
component de zgomot aditiv, care are media distribuiei n amplitudine egal cu zero.
Forma de und original f (t ) , poate fi considerat ca fiind o concatenare a formelor de
und f i (T ) , corespunztoare fiecrei perioade, unde T reprezint perioada corespunztoare
frecvenei fundamentale. Dac se realizeaz o mediere pe un numr n suficient de mare de
f i (T ) , atunci zgomotul este eliminat. Forma de und care conine un numr de 50 de
perioade mediate, fiind o bun reprezentare a componentei armonice, valid pentru
intervalul T = 0 la T , este dat de urmtoarea formul:
f A (T ) =

i =1

f i (T )
n

Ec. 1

Energia acustic a componentei armonice corespunztoare formei de und originale


f(t) s-a calculat cu formula:
T

H = n f A2 (T )dT

Ec. 2

Forma de und a zgomotului corespunztor la a i-a perioad a frecvenei


fundamentale se calculeaz scznd din fiecare perioad individual f i (T ) forma de und
mediat - f i (T ) f A (T ) . Energia acustic a componentei zgomotului este:
n Ti

N=

[ f i (T ) f A (T )]2 dT

Ec. 3

i =1 0

iar raportul HNR se obine din ecuaiile 2 i 3 astfel:


T

H / N = n f A2 (T )dT /
0

n T

[ f i (T ) f A (T )]2 dT

Ec. 4

i =1 0

Acesta este un caz ideal n care semnalul caracteristic al vocalelor susinute are o
component periodic. Exist i cazul n care la unele voci patologice apare fenomenul de
tremor (jitter), care reprezint variaia n timp a frecvenei fundamentale.
Parametrii jitter i shimmer au fost des utilizai ca indicatori n evaluarea
calitii vocii patologice. Un studiu realizat de [29], a artat c dei aceti parametri sunt
utilizai drept indicatori n evaluarea obiectiv a vocilor patologice, nu pot fi percepui la
nivel acustic de ctre experi evaluatori. Acetia pot percepe doar componenta de zgomot
aditiv care are importan n calitatea vocii.
Parametrul jitter reprezint o msur a fluctuaiei de la perioad la perioad a
frecvenei fundamentale i se calculeaz dup formula:

12

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

Jitter =

Ti Ti +1
1
N

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Ec. 5

Ti
i =1

unde Ti este perioada frecvenei fundamentale a ferestrei i, iar N este numrul total de
perioade ale unei pronunii.
Parametrul shimmer este o msur a variabilitii amplitudinii de la o perioad la
alta i se calculeaz cu formula:
Shimmer =

Ai Ai +1
1
N

Ec. 6

Ai
i =1

unde Ai este amplitudinea frecvenei fundamentale corespunztoare ferestrei de analizp i,


iar N reprezint numrul total de perioade a unei pronunii.
Dirk Michaelis et all. [30] a analizat caracteristicile acustice utilizate n evaluarea
vocilor patologice de ctre specialiti n domeniu, i pe baza unei selecii / combinri a
patru din 22 de parametri a gsit o msur util care d o bun descriere a vocii patologice
i care este uor de interpretat numit diagrama gradului de rgueal (hoarseness
diagram). Studiul are la baz un numr de 447 voci patologice, iar parametrii selectai sunt
coeficientul de corelaie mediu al perioadei (MWC), jitter, shimmer i GNE (glottal to
noise excitation ratio). GNE este o msur acustic proiectat s evalueze cantitatea de
zgomot ntr-un tren de impulsuri generat de oscilaia corzilor vocale. Studii realizate pe
voci sintetizate ct i studiul realizat de ctre autori pe voci nesintetizate au artat c acest
parametru este independent de variaiile n timp i amplitudine ale frecvenei fundamentale.
Ali parametri analizai cum ar fi NNE (normalized noise energy) sau CHNR (cepstrum
based harmonics to noise ratio) nu prezint aceast independen. Autorii au clasificat
caracteristicile semnalului vocal n dou categorii: trsturi neperiodice i trsturi
zgomotoase. Prima categorie a fost utilizat de specialiti n domeniu n evaluarea asprimii
perceptuale a vocii sau periodicitii oscilaiilor glotale, iar a doua categorie a fost utilizat
ca indicator al vocii murmurate (breathiness). Un tip de neperiodicitate a semnalului vocal
este legat de schimbrile formei de und de la un ciclu glotal la altul. Acest efect se poate
msura prin calcularea coeficientului de corelaie mediu ntre toate perechile de cicli
succesivi.
Studiul realizat a artat c cei patru parametri selectai dau cea mai bun descriere a
vocii patologice printr-o reprezentare bidimensional (hoarsness diagram) n care axa x
corespunde componentei neliniare alctuite din parametrii jitter, shimmer i MWC, care
contribuie n egal msur la iregularitatea semnalului, iar axa y componentei zgomotoase
(GNE). Aceast msur a calitii vocii a fost ulterior validat de ctre aceiai autori n
[31], [32], prin studii de caz pe diferite regiuni ale diagramei i utilizat de ali specialiti n
domeniu n evaluarea calitii vocii dup laringectomie parial [33], dup tratamentul
chirurgical al paraliziei corzilor vocale [34] sau n evaluarea disfoniei [35].
Un alt parametru util n evaluarea calitii vocii este indicele de inteligibilitate a
vorbirii - SII (Speech Inteligibility Index). Standardul SII a fost dezvoltat de American
National Standard Methods for the Calculation of the Articulation Index [36], numindu-se
iniial indexul de articulare (Articulation Index), iar ulterior a fost revzut n [37] i
redenumit drept indicele de inteligibilitate a vorbirii. Acest standard definete o metod
de calcul a mrimii fizice SII pe baza spectrului vorbirii, spectrului zgomotului aditiv
staionar i pragului de audibilitate a asculttorului. SII ncorporeaz i proceduri de calcul

13

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

al indicelui STI indicele de transmisie a vorbirii (Speech Inteligibility Index). Diverse


studii au artat c indexul SII este un bun indicator n evaluarea gradului de audibilitate a
pacienilor cu tulburri de auz [38] i poate fi utilizat i n evaluarea inteligibilitii n
tulburrile de vorbire [39].
n [40], autorii realizeaz o extensie a SII utiliznd ca parametru de msur
zgomotul fluctuant n loc de zgomotul staionar. Studiul s-a realizat pe persoane cu auz
normal i a avut la baz mprirea semnalului audio i a zgomotului pe cadre mici de timp.
Pe fiecare cadru s-a determinat valuarea indexului SII instantaneu i ulterior valorile tuturor
cadrelor au fost mediate, rezultnd SII-ul caracteristic tipului de zgomot utilizat. Acest
index ia valori ntre 0 i 1 i reprezint proporia n care informaia total coninut n
semnalul vocal este disponibil pentru asculttor. Utiliznd pragurile de recepie a vorbirii
(SRT) existente n literatur, acest studiu a artat c extensia SII realizat de ctre autori
este o bun msur de evaluare a pragului de recepie a vorbirii n condiii de zgomot
staionar, zgomot fluctuant, zgomot ntrerupt sau n condiiile zgomotului produs de mai
muli vorbitori.
3.3. Instrumente de analiz a semnalului vocal i a articulrii sunetelor
Primele instrumente de analiz i / sau sintez a vocii realizate la nivel hardware au
aprut nc din anii 1950 [41]. Ulterior au aprut o serie de patente ntre anii 1968-1977
care descriau o serie de analizoare vocale electronice utilizate pentru recunoatere vocal
[42], analiz vocal [43], bazate pe filtre recursive [44] i analiz vocal n timp real [45].
Analiza semnalului vocal se poate realiza prin metode indirecte, cu instrumente
realizate la nivel software sau prin metode directe cu ajutorul unor aparate specializate.
Unele dintre cele mai cunoscute instrumente software n ordinea apariiei sunt Klatt [46],
Snorri [47], [48], Goldwave [49], Wavesurfer [50], Praat [51], WASP [52] etc.
Klatt [46] este un software care poate genera voce sintetic prin sintez formantic
paralel sau n cascad. Acest program are o configuraie flexibil care permite generarea
de sunete sonore prin conexiunea n cascad sau paralel a unor rezonatori digitali, i de
sunete fricative doar prin conexiune paralel. Un program de control permite utilizatorului
s selecteze variabilele parametrilor de control cum ar fi frecvenele formanilor ca o
funcie de timp sau secven de puncte.
Snorri [47], [48] este un software de investigare a semnalului vocal, util pentru
cercettori n domeniu sau profesori foneticieni, care ofer cinci tipuri de instrumente:
editare de semnal vocal, adnotare fonetic sau ortografic a semnalului vocal;
analiz i monitorizare spectral a semnalului vocal n timp;
studiul prozodiei prin calcularea frecvenei fundamentale sau sintezei de noi semnale
prin modificarea traseului F0 sau a ratei de vorbire;
generare de parametri utili pentru sintetizatorul Klatt [46].
Goldwave [49] este un editor audio digital larg utilizat, care permite realizarea de
nregistrri, prelucrarea acestora prin filtrare, schimbare de volum, egalizare, reducere de
zgomot, reducerea segmentelor de linite i alte operaii de editare. Conine i un modul de
vizualizare a spectrogramei, anvelopei formei de und i a spectrului semnalului nregistrat.
Wavesurfer [50] prezint urmtoarele funcii: nregistrare, analiz spectral,
vizualizarea traseelor F0, formanilor i a energiei, calcularea mediei formanilor i
adnotare.
P. Boersma i D. Weenink [51] au realizat programul PraatTM, care permite analiza
semnalului vocal incluznd analiz spectral, analiza frecevenei fundamentale, a
formanilor, a intensitii i a parametrilor jitter i shimmer; segmentarea i adnotarea
14

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

semnalului vocal; sinteza i manipularea semnalului vocal; calculul unor parametri statistici
i programare cu ajutorul scripturilor.
WASP [52] este un instrument software mai simplu, care pe lang funcia de
nregistrare, permite vizualizarea formei de und, a spectrogramei i a traseului frecvenei
fundamentale.
Dintre aparatele specializate, cu metode directe de analiz a semnalului vocal
enumerm electroglotograful, stroboscopul, spectrograful, sonograful i fonetograful.
Electroglotografia [53] este o metod neinvaziv cu ajutorul creia se pot obine
informaii cu privire la vibraiile corzilor vocale. Semnalul EGG este nregistrat cu ajutorul
unui aparat numit electroglotograf care msoar impedana dintre corzile vocale n timpul
vorbirii. Metoda const n aplicarea a doi electrozi de suprafa de o parte i de alta a
laringelui. n momentul n care corzile vocale sunt n contact impedana este relativ mic,
iar cnd corzile vocale sunt ndeprtate impedana este mare. Astfel, semnalul EGG
msoar aria de contact a corzilor vocale. Semnalul EGG este invers relaionat cu fluxul de
aer. Cnd aria de contact dintre corzile vocale este mic atunci aerul trece, iar cnd aria de
contact este mare aerul nu trece. Semnalul obinut se numete electroglotogram, iar
reprezentarea grafic se numete laringogram.
Wertzner et al. [54] a utilizat electroglotografia pentru a studia eficiena de
nchidere i deschidere a corzilor vocale la copii cu i fr tulburri fonologice. La copii din
Brazilia, vorbitori de limb portughez, care prezint tulburri de vorbire s-a constatat
prezena unui proces de desonorizare a fricativelor i ocluzivelor. S-au nregistrat propoziii
pe baz de cuvinte ce conin fricativele /v/, /f/, /s/, /z/, /S/, /Z/ i au fost analizate n timp
real cu ajutorul unui electroglotograf. Analiza intragrup a artat c valorile coeficienilor de
deschidere a corzilor vocale n cazul fricativelor nesonore sunt semnificativ mai mari la
ambele grupuri analizate. Analiza intergrup a artat c valorile coeficienilor de deschidere
a corzilor vocale sunt semnificativ mai mari n cazul fricativelor /v/ i /z/ la copii cu
tulburri fonologice. Rezultatele studiului au artat c dei grupul cu tulburri pronun
fricativele sonore ca cele nesonore (fr frecven fundamental), valorile coeficienilor de
deschidere sunt diferite de la un caz la altul. Concluzia autorilor referitoare la acest aspect
este aceea c grupul cu tulburri fonologice este capabil s menin corzile vocale deschise
pentru mai mult timp la consoanele nesonore reale (/f/, /S/, /s/) n comparaie cu cele sonore
(/v/, /z/, /Z/).
Stroboscopia este o metod care const n vizualizarea dinamic a vibraiei corzilor
vocale cu ajutorul unui fibroscop introdus la nivelul laringelui prin cavitatea bucal sau prin
fosele nazale. Subiectului i se solicit s pronune anumite vocale, cuvinte, propoziii.
Aceast metod utilizeaz o surs de lumin stroboscopic (pulsatil) pentru vizualizarea
endoscopic a vibraiilor corzilor vocale ntr-o micare aparent ncetinit. Principiul
esenial al acestei tehnici este percepia vizual de micare aparent, prin care imaginile
successive prezentate cu o rat mai mare de 5 Hz par a se mica n mod continuu.
Sursa de lumin stroboscopic este sincronizat cu frecvena de rezonan a corzilor
vocale cu ajutorul unui microfon sau a unui traductor electroglotografic. Sursa de lumin
trebuie sincronizat n mod precis cu F0 pentru a furniza o imagine aparent static (fiecare
puls luminos ilumineaz aceai poziie n fiecare ciclu de vibraie a corzilor vocale), sau
cvasi-sincronizat (1-2 Hz sub/peste F0) pentru a furniza o micare aparent ncetinit
(fiecare puls luminos ilumineaz faze successive ale ciclurilor de vibraie ale corzilor
vocale).

15

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Sonograful i spectrograful sunt aparate cu ajutorul crora structura sunetului


este vizualizat ca spectru nregistrat pe o band de hrtie electrosensibil, numit
spectrogram, respectiv sonogram.
Fonetografia utilizat de ctre [55] este o metod de investigare i mapare a
potenialelor cantitative ale semnalului vocal. Limita maxim a fonaiei de intensitate mare
(strident) i a fonaiei de intensitate mic (slab) de-a lungul ntregii benzi de frecven
este indicat printr-o reprezentare grafic n coordonate frecven nivel de presiune a
sunetului (SPL). Subiecilor li s-a solicitat s produc fonaii de intensitate foarte mare i
intensitate mic la frecvenele selectate, astfel nct s acopere ntreaga band de frecven
caracteristic a fiecruia. Instrumentaia de baz const ntr-un generator de ton care
produce un sunet asemntor sunetului vocalic, utilizat ca referin pentru frecvena
fundamental i un dispozitiv de msur a nivelului de presiune a sunetului. Unui grup de
patru specialiti terapeui n vorbire i trei fizicieni ORL li s-a solicitat s descrie modul n
care analizeaz vizual fonetogramele i s identifice trsturile pe care le consider a fi
importante n evaluarea fonetogramelor. Descrierea fcut de acest grup include trei
parametri considerai a fi importani: forma fonetogramei care este complex, dar poate fi
vizualizat ca suma a dou elipse suprapuse fiecare dintre ele avnd o pant diferit a axei
mari; aria de nchidere care se formeaz ntre conturul fonaiei de intensitate mare i cea de
intensitate mic i dinamica benzii de frecven a semnalului vocal. n timp ce fonetograma
acoper ntreaga band de frecvene, vocea care funcioneaz normal utilizeaz doar o parte
din aceast band. Un exemplu de fonetogram este ilustrat n Figura 5.

Figura 5. Fonetograma unui subiect de gen masculin, cu voce normal [55]

Pe axa x este frecvena, iar pe axa y nivelul intensitii. Marcajul + reprezint


media frecvenei fundamentale a subiectului, iar valea de pe curba fonaiei de intensitate
mare reprezint trecerea de la registru normal la registru fals. Banda de frecven
caracteristic subiectului nregistrat se situeaz dup cum este artat n figura 4 ntre
Fminimum i Fmaximum. Aceasta se poate calcula ca fiind numrul de octave cuprinse ntre
Fminimum i Fmaximum. Valoarea unei octave se calculeaz cu urmtoarea formul:
x oct =

6 (log( x Hz high ) log( x Hzlow ))


log 2096 log 32.7

Ec. 7

Electropalatografia este o metod direct de analiz a articulaiei sunetelor care a


fost utilizat de [56] pentru a analiza pattern-urile de articulaie la copii cu sindrom Down.
Metoda const n utilizarea unui palat artificial realizat din acril care are implantai 62 de
electrozi din argint, plasai pe opt rnduri orizontale i fixat de molari cu ajutorul unor
clipsuri. Acest palat artificial difer de la pacient la pacient n funcie de caracteristicile i
dimensiunile palatului dur, astfel nct orice contact dintre limb i electrozi care apare n
16

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

timpul articulrii sunetelor s poat fi nregistrat. Poziiile electrozilor sunt determinate n


funcie de dimensiunea anatomic a palatului, astfel nct palate de diferite dimeniuni i
forme pot fi comparate cu referine pentru fiecare din rndurile i poziiile electrozilor.
Contactele nregistrate sunt afiate pe calculator i ulterior pot fi analizate. Un exemplu de
afiaj al contactelor care apar n timpul fazei de nchidere a consoanei /t/ este ilustrat n
Figura 6, n care cu 0 sunt marcate contactele, iar n partea dreapt sunt afiate zonele de
referin pentru poziia electrozilor i numrul rndului pe care sunt plasai acetia.
Rnd
Zon alveolar
Zon palatal
Zon velar

Figura 6. Afiajul contactelor limbii n timpul fazei de nchidere a consoanei /t/ [56]

Rezultatele studiului au artat c la copii cu sindrom Down exist o insuficien n


ceea ce privete controlul muscular al limbii, constnd n micri ncetinite i dificultate n
controlul vrfului limbii i coarticulrii, i o asimetrie i variabilitate n articulare.
O alt tehnic de msurare a articulrii sunetelor a fost dezvoltat de [57] i se
bazeaz pe msurarea cu ajutorul ultrasunetelor a micrilor dorsale ale limbii. Aceast
metod a fost testat pe pacieni cu tulburri de articulaie a vorbirii i pe persoane
sntoase. Variabilele gsite care caracterizeaz o articulare anormal sunt: variabilitate
excesiv a amplitudinii i duratei n timpul micrilor articulatorii, coordonare
interarticulatorie insuficient, o meninere insuficient a amplitudinii micrii i o
difereniere spaial i temporal insuficient a micrilor scurte i lungi. nregistrrile de
semnal ultrasonor i semnal vocal sunt achiziionate cu ajutorul unui generator-receptor de
ultrasunete i un amplificator audio. Acestea sunt convertite n semnal digital de 1 kHz cu
ajutorul unui circuit special i sunt stocate ntr-un calculator. Ulterior se poate realiza
analiza micrilor dorsale ale limbii pe baza graficelor semnalelor achiziionate.
Traductorul ultrasonor este aezat n poziie vertical pe mijlocul liniei inferioare a
mandibulei, iar ntrzierea este msurat n mod repetat ntre emisia unui scurt impuls
ultrasonor i recepia ecoului su. La fiecare milisecund se realizeaz o msurtoare
corespunztoare distanei dintre traductor i partea dorsal a limbii. n mod specific, un
ecou mare se formeaz la interfaa dintre esutul muscular al limbii i aerul ambiant i
timpul dintre emisia i recepia lui este msurat. Msurtorile acestei ntrzieri
corespunztoare distanei dintre traductorul ultrasonic i partea dorsal a limbii precum i
semnalul acustic generat n mod concomitent sunt continuu nregistrate pe un
microcomputer, pe o perioad de 4.5 ms.
Kay Elemetrics Corp. [58] a dezvoltat un sistem hardware / software de analiz a
semnalului vocal specializat, numit Computerized Speech Lab (CSL). Sistemul are la baz
un dispozitiv de nregistrare de tip intrare/ieire care este legat la un calculator. Pachetul de
analiz a semnalului vocal are i un program opional LPC pentru analiz / sintez. CSL
conine o serie de programe / baze de date dintre care amintim programul MDVP (Multi
Dimensional Voice Program), programe de analiz a fonetogramei, spectrogramei n timp
real, percepiei auditive, procesare n timp real a electroglotogramei, de sintez a

17

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

semnalului vocal, baze de date cu semnale palatografice, cu nregistrri ce conin semnal


vocal provenit de la voci patologice, etc.
Un alt software care permite evaluarea semnalului vocal sau antrenarea vocii este
Dr. Speech realizat de Tiger Electronics, Neu-Anspach, Germany [59]. Acesta dispune de
module de analiz a semnalului vocal n timp real (spectrograme, formani, intensitate,
etc.), de terapie a vocii prin jocuri, de un modul hardware/software care realizeaz achiziia
de date, analiza clinic i tratamentul tulburrilor de rezonan nazal, module de antrenare
i evaluare a vocii i de analiz a fonetografic.
Smits et al. [60] a realizat o analiz comparativ ntre CSL i Dr. Speech (DRS) n
ceea ce privete analiza acustic a vocii. Studiul s-a realizat pe un grup de 120 de voci
normale, iar parametrii considerai pentru evaluarea comparativ a celor dou programe
sunt: frecvena fundamental, deviaia standard a frecvenei fundamentale, jitter, shimmer
i raportul HNR (Harmonics to Noise Ratio). S-a gsit o corelaie semnificativ a frecvenei
fundamentale, HNR i valoarea relativ a parametrului shimmer. Corelaia valorilor
absolut i relativ a parametrului jitter i deviaia standard a frecvenei fundamentale s-a
dovedit a fi slab. Studiul a artat c CSL i DLS nu sunt comparabile n mod absolut, ns
rezultatele cu privire la datele normative sunt identice.
SDCS (Speech Disorders Classification System) [61] este un sistem de clasificare a
vocilor patologice pe baza a10 parametri care msoar capacitatea de articulare: procentajul
de consoane corecte (PCC), procentajul de consoane corecte ajustat (PCC-A), procentajul
de consoane corecte reviyuit (PCC-R), procentajul de consoane corecte inventariat (PCC-I),
indexul care msoar capacitatea articulrii (ACI), procentajul de vocale/diftongi corecte
(PVC), procentajul de vocale/diftongi corecte revizuit (PVC-R), procentajul de foneme
corecte (PPC), procentajul de foneme corecte revizuit (PPC-R) i indexul de inteligibilitate
(II). Raportul realizat de ctre autori are ca date de referin 1386 eantioane de voce din
baza de date fonologic a proiectului, care aparin unor subieci cu vrste cuprinse ntre 3 i
40+ ani. Baza de date a fost investigat iniial pentru eliminarea eantioanelor de voce care
aparineau persoanelor cu tulburri de dezvoltare, cognitive, anomalii cranio-faciale sau cu
probleme senzoriale-motorii. Eantioanele de voce au fost mprite pe grupuri n funcie de
clasificarea vorbitorului n funcie de tulburrile de vorbire furnizat de sistemul SDCS.
PEAKS [62] este un sistem de evaluare automat a vocii i a tulburrilor de vorbire,
aprut recent, n 2009, care poate fi accesat direct prin internet de ctre orice pacient.
Semnalul vocal nregistrat este ulterior analizat prin-un sistem de recunoatere automat a
vorbirii i analiz prozodic. Acest sistem a fost testat pe dou tipuri de tulburri ale
comunicrii: tulburri de voce i tulburri de articulare. Pentru validarea rezultatelor
obinute cu acest sistem, s-a realizat i o evaluare a vocilor patologice de ctre un panel de
specialiti. Pentru a minimiza subiectivitatea evalurii, s-a realizat o medie a rezultatelor
obinute de experi pentru a crea un scor de consens, care a fost tratat drept referin. La
ambele tipuri de patologii rezultatele obinute cu sistemul PEAKS au fost n cooncordan
cu cele obinute de specialiti.

18

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

4. Aplicaii medicale
Analiza semnalului vocal are diverse aplicaii n medicin care permit evaluarea
vocii att n scopul diagnosticrii unei patologii, ct i n detectarea alterrii / mbuntirii
actului fonator dup un tratament sau dup o intervenie chirurgical.
Perforaia orofacial (CLF - Cleft Lip Palate) este o malformaie congenital care se
caracterizeaz prin dezvoltarea incomplet a structurilor care separ cavitatea nazal de cea
oral i anume buzele, alveolele, palatul moale i palatul tare. Aceast anomalie cauzeaz
tulburri morfologice i funcionale printre care se numr i defectele de vorbire care apar
datorit nchiderii incomplete a inelului orofaringeal n timpul micrilor de articulare ale
palatului moale. Unii dintre cei mai receni parametri de evaluare a vorbirii la pacieni cu
CLF, utilizai n [63] sunt: rezonana nazal, fluxul de aer nazal expirat, friciunea
faringeal, stopul glotal, inteligibilitatea i grimasa. Fiecare parametru a fost evaluat dup
un protocol de evaluare pe o scar invers de la 3 la 0, iar scorul final s-a obinut prin
sumarea scorurilor fiecrui parametru. Evaluarea s-a realizat pe un eantion de 68 de
pacieni care au fost operai de acelai chirurg i rezultatele arat c doar patru dintre
acetia au avut rezultate negative cu privire la gradul nazalitii de la sever la moderat la
toate consoanele, prezena friciunii faringeale severe, cu o substituie sistematic la
fricative i africate, prezena stopului glotal i un grad sczut de inteligibilitate.
Maier A. et al. [64] a studiat inteligibilitatea la copii cu perforaie de buz i palat
prin tehnici de recunoatere a vorbirii. Acest tip de patologie poate cauza limitri
funcionale chiar i dup tratament chirurgical adecvat sau nonchirurgical, una dintre
acestea constnd n apariia unor defecte de vorbire. Ca metod obiectiv de determinare i
cuantizare a tulburrilor de articulare autorul a utilizat un sistem de recunoatere automat a
vorbirii cu ajutorul cruia a analizat 31 de nregistrri de cuvinte standard, aparinnd unor
copii vorbitori de limb german care prezentau CLF. Sistemul de recunoatere automat a
vorbirii a fost antrenat cu voci adulte normale i voci de copii. S-a realizat i o evaluare
subiectiv de ctre patru experi i confruntat cu evaluarea automat a vorbirii. Sistemul de
recunoatere automat a vorbirii a produs o acuratee de recunoatere a cuvintelor ntre
1,2% i 75,8%, respectnd rata de evaluare a experilor i avnd o discriminare suficient.
Astfel, acest studiu dovedete c sistemul de recunoatere automat a vorbirii servete ca un
bun mijloc de a concretiza i cuantifica efectul global al vorbirii copiilor cu CLF.
Analiza semnalului vocal s-a utilizat n vederea evalurii calitii vocii n cazul
pacienilor cu laringectomie [65], [66], cancer intraoral [67], [68], rezecie parial a unor
tumori ale limbii [69], n clasificarea disfoniei [70], n studiul blbielii [71], n detectarea
vocii patologice cauzate de diverse boli [72].
n [65] s-a studiat vocea substituit de vocea traheoesofagial cu ajutorul unui
sistem de recunoatere vocal i prin evaluare subiectiv de ctre cinci experi a unor
nregistrri de text standard provenind de la 18 pacieni cu laringectomie. Sistemul a fost
antrenat cu voci normale i nu a fost adaptat la voci patologice. Comparativ cu vocea
normal vocea substituit prezint prozodie i modulaie sczut, valori sczute a
parametrilor jitter i shimmer, frecven fundamental sczut i raport fonaie
sonor/nesonor diferit. Acurateea cuvintelor (WA) msurat cu sistemul de recunoatere
vocal a fost calculat cu urmtoarea formul:
WA[%] = 100 * ( NC NW ) / N ,
Ec. 8
unde NC este numrul de cuvinte corect recunoscute, NW este numrul de cuvinte inserate
incorecte, iar N numrul total de cuvinte pronunate. Rezultatele obinute n cazul vocii
substituite au fost comparate cu cele obinute n cazul vocilor normale i s-a constatat c

19

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

acurateea de recunoatere a silabelor i a cuvintelor este mai mic n primul caz (10-50%).
Studiul a artat c recunoaterea vocal automat reprezint o bun metod de evaluare a
vocii la pacienii cu laringectomie.
Pentru evaluarea tipului i extinderii tulburrilor de vorbire dup glosectomie
parial, K. S. Heller [69] a nregistrat pre i postoperator 10 pacieni cu rezecie de
carcinom situat n partea mobil a limbii, avnd dimensiune mai mic de 3 cm. Preoperator
s-au obinut rate normale ale dacokineziei vorbirii, fr distorsiuni, la toi cei 10 pacieni.
Analiza fonologic a fost normal la 9 din 10 pacieni. Evaluarea postoperatorie a artat
rate normale ale dacokineziei vorbirii la 6 pacieni i distorsiuni linguale medii la 4
pacieni. La trei sptmni postoperator un pacient prezenta distorsiuni ale sunetelor i
unul vorbire neclar. Evaluarea acestor pacieni dup 6 luni postoperator a demonstrat c
vorbirea lor s-a corectat. Compararea nregistrrilor realizate nainte i dup operaie au
artat c nu sunt modificri de vorbire la 8 din cei 10 pacieni. La ceilali doi pacieni dup
o perioad de adaptare mai mare (6 luni) s-a considerat c vorbirea este normal. Acest
studiu demonstreaz c glosectomia parial timpurie a carcinoamelor limbii poate fi
realizat cu tulburri permanente minime ale vorbirii.
R. Linder et al. [70] a utilizat o reea neuronal artificial bazat pe scalarea
psihoacustic a parametrilor acustici ai semnalului vocal n scopul clasificrii disfoniei.
Autorii au utilizat o paradigm de extracie a caracteristicilor acustice ale semnalului vocal
(jitter, shimmer, deviaia standard a frecvenei fundamentale, raportul dintre excitaia
glotal i zgomot (GNE)), pentru a reanaliza 120 de eantioane de voce analizate anterior
de Schonweiler et al. Modificnd algoritmii matematici ai sistemul bazat pe reele
neuronale utilizat de autorii amintii anterior, Linder et al. a obinut clasificarea corect pe
dou categorii, voce normal i voce rguit n cazul unui procentaj de 80% din numrul
total de eantioane de voce analizate. Fa de studiul anterior autorii au luat n calcul pe
lng analiza dimensiunilor R (roughness) i B (breathiness) i cea mai bun cale de
difereniere ntre indivizii cu voce normal i cei cu voce rguit (hoarsness = H). Pentru
dezvoltarea sistemului au utilizat parametrul GNE care permite o mai bun distincie ntre
clasele R i B i au verificat tipul de disfonie cu o specificitate i senzitivitate mai mare,
reducnd scara de evaluare de la patru puncte la dou puncte prin calcularea
caracteristicilor de operare ale receptorului (ROC). Acest ultim metod a permis o mai
bun difereniere ntre prezena sau absena caracteristicii H.
A. A. Dibazar et al. [72] a realizat un sistem robust, neinvaziv, de detectare
automat a vocii normale i patologice. Un banc de filtre Mel, coeficienii cepstrali i
msurtori ale dinamicii frecvenei fundamentale au fost modelate prin mixturi Gaussiene
ntr-un clasificator de tip HMM (Hidden Markov Model). Metoda a fost evaluat prin
utilizarea nregistrrilor vocalei susinute /a/, provenite de la 700 subieci cu voci normale i
patologice din baza de date MEII (Massachusetts Eye and Ear Infirmary). Scopul principal
al studiului a constat n clasificarea binar a semnalului vocal prin dou metode. Fiecare
subiect a fost reprezentat printr-o secven de vectori de trsturi coninnd 12 coeficieni
Mel cepstrali i frecvena fundamental. n baza de date au fost inclui de asemenea 34
dintre cei mai utilizai parametri n evaluarea tulburrilor de vorbire care au fost extrai cu
programul MDVP. Prima metod a constat n clasificarea parametrilor extrai cu MDVP
pentru vocala susinut /a/, cu trei tipuri de clasificatori: clasificatorul de discriminare
liniar (LDC), clasificatorul bazat pe cea mai apropiat medie (NMC) i modelarea prin
mixuri Gaussiene (GMM). Rezultatele cele mai bune pentru fazele de antrenare i testare sau obinut cu ultimul clasificator. A doua metod a constat n clasificarea coeficienilor Mel
cepstrali i a frecvenei fundamentale cu HMM. Cu aceast metod autorii au obinut cea
20

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

mai bun rat de clasificare corect a vocilor normale i patologice n cazul vocalei
susinute /a/ (99,44 %).
O alt aplicaie a evalurii calitii vocii const n studiul efectului medicamentului
levodopa asupra funciei vocale la pacieni cu boala Parkinson [73]. n boala Parkinson sunt
ntlnite frecvent disfuncii fonatorii i articulatorii. Jaime et. all au investigat din punct de
vedere acustic efectul tratamentului cu levodopa asupra funciei vocale a 20 de pacieni cu
aceast boal, nainte i dup aplicarea tratamentului. Pacienii au fost de asemenea
comparai cu un grup de control. Pentru compararea msurtorilor nante i dup
tratamentul cu levodopa s-au utilizat teste Wilcoxon pereche. Analiza acustic s-a realizat
cu ajutorul programelor Computerized Speech Lab i MultiDimensional Voice Program.
Msurtorile au artat c frecvena fundamental a crescut semnificativ dup tratament, n
timp ce perturbaia pe termen scurt a frecvenei jitter, soft phonation index i indexul de
intensitate a frecvenei tremorului au sczut semnificativ dup medicaie. Msurtorile
obiective ale analizei acustice sunt utile n evaluarea rspunsului farmacologic
dopaminergic n cazul bolii parkinson. mbuntirea frecvenei fundamentale i a
parametrilor vocali poate fi un rezultat al scderii hipokineziei i rigiditii laringeale.

4.1 Aplicaii n stomatologie


Patologiile aparatului stomatognat care afecteaz articularea corect a sunetelor sunt
edentaia, spaierile i nghesuirile care afecteaz n special incisivii superiori i inferiori,
malocluziile i defecte ale articulaiei temporo-mandibulare. Defectele de vorbire pot fi
cauzate i de aplicarea unui tratament ortodontic incorect, de tipul unei proteze
incompatibile cu dimensiunile fiziologice ale cavitii bucale sau cu nclinaie mare fa de
nivelul buzelor, o protez cu palat care modific punctele de referin ale articulrii unor
sunete sau proteze care las un spaiu intraocluzal mare.
Malocluziile se caracterizeaz printr-o relaie anormal ntre dinii celor dou arcade
superioar i inferioar, care determin nchiderea incorect a gurii. Malocluziile se
clasific pe baza relaiei dintre primul molar superior fa de restul ocluziei.
a)

b)

c)

d)

Figura 7. Tipuri de malocluzie: a) ocluzie normal, b) malocluzie clasa I, c) malocluzie clasa II, d)
malocluzie clasa III [74]

n Figura 7 sunt ilustrate ocluzia normal (Figura 7 a) i cele trei tipuri principale
de malocluzie:
Malocluzie clasa I se caracterizeaz printr-o ocluzie molar normal, ns dinii
din fa pot fi ingrmdii sau erupi mai n fa sau mai n spate. Un exemplu obinuit este
atunci cnd caninii permaneni cresc pe lng dinii de lapte, n exterior (Figura 7 - b)).

21

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Malocluzie clasa II sau supraocluzie vertical n care dinii superiori sunt ieii
mai n fa, depindu-i pe cei inferiori (Figura 7 c)).
Malocluzie clasa III - ocluzia invers sau subocluzia este atunci cnd dinii de pe
mandibul sunt ieii mult n fa (Figura 7 d)).
Un alt tip de malocluzie este ocluzia deschis - atunci cnd se formeaz un spaiu
ntre dinii din fa superiori i dinii din fa inferiori [74].
Analiza semnalului vocal n scopul evalurii eficienei tratamentului ortodontic s-a
realizat nc din anii `60 cnd Rathbone i Snidecor [75] au studiat instrumental diferenele
ce apar n pronunia de propoziii test ce conin consoane post-dentale (n, t, d, r, l, s, sh, z,
zh, y), linguo-dentale (th sonor i nesonor), labio-dentale (f, v) i combinaii post-dentale
(ch, j) nainte i dup tratamentul ortodontic a 10 pacieni cu diferite stadii de malocluzie.
Au constatat c nainte de tratament din 16 sunete dentale testate un procent de 6.4 % sunt
defectuoase, cele mai mari erori concentrndu-se asupra consoanelor dentale de tip fricativ
(s, z, sh, zh i th). Dup patru ani, opt pacieni din 10 au fost reexaminai dup aceeai
procedur, rezultnd o scdere a procentului de sunete cu pronunie defectuoas de pn la
1.5 %. Erorile de pronunie s-au pstrat la consoanele fricative avnd ns un grad mai
sczut, iar celelalte sunete dentale au fost corectate astfel nct erorile au fost indetectabile.
Acest studiu a dovedit c defectele de vorbire se corecteaz dup tratamentul ortodontic
fr a fi nevoie de aplicarea unei terapii de educare a vorbirii. Analiza de semnal vocal n
cazul unor patologii ale aparatului stomatognat este important n diagnosticarea i
evaluarea eficienei tratamentului ortodontic.
n 1978, A. H. Guay et al. [76] a studiat defectele de pronunie a consoanei /s/ i
modificrile poziiei de articulare a limbii n cazul pacienilor care prezentau malocluzie
clasa III. n acest sens au examinat radiografic un numr de 12 pacieni care au fost evaluai
i vocal i auditiv. Toi pacienii aveau auz normal, iar 11 dintre ei prezentau distorsiuni n
pronunia sibilantei /s/. Poziia limbii era mai joas i mai retractat la pacienii cu
malocluzie fa de cazul normal, iar n timpul pronuniei consoanei /s/ acetia prezentau o
retracie a limbii din cauza ncercrii de a asigura o relaie normal ntre vrful limbii i
dinii maxilarului superior, o cretere ridicat a depresiunii mandibulare i o cretere a
distanei normale dintre vrful limbii i dinii maxilarului superior. n ciuda micrilor
compensatorii ale articulatorilor prezente la aceti pacieni, numai unul din 12 avea
capacitatea de a pronuna corect consoana /s/, contrastnt cu rezultalele obinute de ali
autori n cazul examinrii unor pacieni care prezentau malocluzie clasa II.
La nceputul anilor 80, D.M. Plank [77] a investigat inteligibilitatea vorbirii la
pacieni care au suferit rezecie chirurgical parial a maxilarului. Caracteristicile de
inteligibilitate ale unui discurs au fost evaluate n urmtoarele condiii experimentale:
preoperator, postoperator cu obturaie protetic imediat i postoperator cu obturaie
protetic definitiv. Fiecare pacient a citit un pasaj standard n condiiile amintite anterior,
iar nregistrrile au fost evaluate de ctre 10 asculttori neantrenai. nregistrrile au fost
evaluate n funcie de numrul de cuvinte corect scrise de ctre asculttori. Analiza de
varian a artat c nu exist pierdere de inteligibilitate ntre cele trei condiii de
nregistrare. Un grup de 50 asculttori au evaluat n mediu zgomotos perechi de propoziii
coninnd segmente de vorbire nregistrate preoperator i postoperator cu obturaie protetic
definitiv. Rezultatele obinute n urma aplicrii procedurii statistice sign-test au artat c
asculttorii pot distinge ntre segmentele de vorbire nregistrate preoperator i postoperator
la apte din opt pacieni nregistrai.

22

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Studiile n domeniu au fost continuate de E. A. Tobey i J. Lincks [78] care au


examinat caracteristicile acustice ale vorbirii a cinci pacieni cu operaie maxilofacial
nainte i dup reconstrucia prostodontic pentru a determina eficiena protezrii maxilare
n eliminarea rezonanei nazale. n acest scop s-au msurat valorile formanilor vocalelor /i/
i /u/. Folosind tehnici de analiz a varianei s-a constatat c restaurarea prostodontic a
redus semnificativ rezonana nazal la toi pacienii fie prin eliminarea complet a acesteia,
fie prin reducerea amplitudinii rezonanei, fie prin schimbarea frecevnei de rezonan spre
regiuni mai apropiate de cele ale vocalelor.
T. Laine et al. [79] a examinat un grup de absolveni vorbitori de limb finlandez,
325 femei i 126 brbai (cu vrsta medie de 23.4 ani) n vederea determinrii relaiei dintre
tulburrile de articulaie n vorbire i trsturile ocluziei incizale. Subiecii au fost
nregistrai independent de ctre doi terapeui n vorbire, iar gradul de cooncordan ntre
acetia a fost de 85%. Analize de covarian cu privire la efectul vrstei, al sexului, al
istoricului tratamentului dentar i terapiei vorbirii au artat diferene statistice semnificative
ntre cazurile cu malocluzii de tip overbite, overjet i spaieri ntre incizorii maxilari la
subiecii cu i fr articulare defectuas a sunetelor. Rezultatele arat c un sunet /s/ corect
este mai dificil de produs n cazuri de overjet crescut sau overbite sczut. Spaierile
maxilare par a fi asociate cu dificulti n producerea sunetelor din limba finlandez n
poriunea medio-alveolar a palatului (/s/, /r/, /l/, /n/ i /d/): sunetele pronunate incorect
sunt articulate prea anterior, exceptnd sunetul /s/ i ocazional /r/ care sunt produse mai
lateral dect normal. Autorii i-au continuat studiile cu privire la relaia dintre tulburrile de
vorbire i dimensiunile arcurilor alveolare, anomaliile ocluzale i tratamentul malocluziilor
ntr-o serie de lucrri publicate ntre anii 1986-1992 [80-82].
Spre sfritul anilor 1990, bazndu-se pe un numr de 42 de articole consultate,
Johnson i Sandy [83] au prezentat stadiul cercetrilor realizate pn n anul 1999 de ctre
specialiti n domeniu, vizavi de relaia dintre poziia dinilor i vorbire. S-a constatat c
dinii au un rol important n vorbire, ns relaia dintre poziia dinilor i vorbire a rmas
nc controversat. Se cunoate capacitatea pacienilor de a-i compensa defectele de
vorbire ce apar n cazul malocluziilor, ns mecanismul ce st la baz rmne necunoscut.
Dei s-a demonstrat c exist o relaie ntre defectele de dentiie i defectele de pronunie,
nu s-a putut concluziona c ar exista o corelaie i cu severitatea malocluziilor.
A. Caine [84] a realizat un studiu pilot pentru a determina importana alinierii
structurilor fiziologice n performana vocal. O echip format dintr-un specialist n
terapia vocii, un stomatolog i un chiropractor au evaluat i corectat nealinierile structurale
la 9 cntrei profesioniti, pe o perioad de 2 ani. Acetia au constatat c persoanele
investigate care aveau disfuncii temporo-mandibulare prezentau instabilitate a frecvenei
fundamentale, lipsa aerului, nervozitate i sentimentul de eec. Evaluatorii au constatat c
pacienii crora li s-au extras premolarii pentru a nltura suprapunerea dinilor erau
incapabili de a realiza contactul limb/palat deoarece limba nu se potrivea corect pe
poriunea de palat nedezvoltat. La cei crora li s-au extras ali molari limba nu avea
referin de articulare n partea posterioar a cavitii bucale n cazul consoanelor. Dup
aceste constatri s-a nceput tratamentul dental. S-au gsit trei categorii de patologii dentale
n funcie de vrst: pacieni sub 30 de ani cu palat ngust i scurt, pacieni peste 30 de ani
cu spaii acolo unde era nevoie de referine i pacieni peste 30 de ani cu malocluzie cauzat
de alinierea incorect a mandibulei. Tratamentul a constat n aplicarea de aparate dentare,
iar problemele de voce s-au redus nc de la nceputul tratamentului.

23

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

P. Varley i A. Caine [85] au investigat terapia vocii complementar tratamentului


ortodontic. Din practica stomatologic autorii au constatat c vocea poate fi un instrument
de diagnostic al posturii, de prevenire a regresului tratamentului ortodontic i un instrument
de dezvoltare a creterii dentiiei. Funcia vocal poate fi afectat de disfuncia oricrei
structuri ataate cadrului laringeal: malocluzia dinilor, lipsa suportului molarilor, perforaia
limbii, disfuncia temporo-mandibular sau a cuplului cranian. Autorii concluzioneaz c
orice tratament ortodontic trebuie s ia n considerare efectul de lung durat asupra vocii.
G. Hezdecke et al. [86] a investigat articularea vorbirii la pacieni cu protez
implantabil pe maxilar. Autorii au testat ipoteza c rata de vorbire incorect variaz cu
design-ul protezei n cazul a 30 de pacieni cu edentaie crora li s-au implantat proteze
mandibulare. S-au realizat dou teste: pe pacieni care purtau proteze maxilare fixe i
detaabile i pe subieci cu proteze detaabile cu i fr palat. S-au realizat nregistrri de
cuvinte n limba francez dup ce protezele au fost purtate timp de dou luni i s-au calculat
procentajele corespunztoare consoanelor ocluzive, fricative i vocalelor percepute correct
de ctre evaluatori. n cazul pacienilor cu proteze detaabile s-a obinut un procentaj mai
mare de consoane / vocale pronunate corect n comparaie cu cei care purtau proteze fixe.
ntre diferitele tipuri de tratamente s-au constatat diferene numai n cazul consoanelor.
ntre cele dou tipuri de proteze detaabile nu s-au gsit diferene semnificative n ceea ce
privete ratele de eroare. Acest studiu arat c pacienii cu proteze detaabile cu sau fr
palat prezint o vorbire mai inteligibil dect cei cu proteze fixe.
Un studiu mai recent realizat de C. Sinescu et al. [87] pune n eviden o serie de
parametri cantitativi care reflect alterarea vocii cauzat de montarea incorect a protezelor
dentare. Pentru investigare s-au utilizat nregistrri ale consoanelor /s/ i /sh/ provenite de la
un pacient cu protez maxilar superioar fix, cruia i s-au aplicat cinci tipuri de proteze
cu direcii unghiulare de nclinare diferite fa de buze (= 0, 30, 60). Parametrii au
fost extrai cu Transformata Fourier pe termen Scurt (STFT spectrograma), transformata
wavelet i entropia Shannon a distribuiei amplitudinii. Pentru calcule numerice autorii au
utilizat formele discrete ale acestor parametri definite prin ecuaiile:
Transformata Fourier:
X ( k , v j ) =

x (t n )

i 2 v t
jn

ut ( k t n ) ,

Ec. 9

k =1

unde ut (t ) este o funcie fereastr (Hamming);


Transformata wavelet:
T ( k , v j ) =

x(t n )0* ( n v j k )dt ,

Ec. 10

k =1

unde este o funcie numit funcie wavelet de baz (Paul wavelet).


Parametri de analiz definii de autori sunt urmtorii:

un parametru sum definit cu formula:


S=

max vmax

Z ( k , v j ) ,

k = 0v j =0

24

Ec. 11

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

unde Z=|X| pentru Transformata Fourier pe termen scurt i Z=|T| pentru Transformata
wavelet. Acest parametru reprezint un parametru de normalizare necesar pentru a
normaliza spectrul STFT i toate transformatele wavelet.

o probabilitate de distribuie:
( k , v j ) =

Z ( k , v j )
S

Ec. 12

valorile medii ale distribuiei de-a lungul i v :


max vmax

k ( k , v j ) ,

< >=

Ec. 13

k = 0v j = 0

< v >=

max vmax

v j ( k , v j ) ,

Ec. 14

k = 0v j =0

< v >=

max vmax

k v j ( k , v j ) ,

Ec. 15

k =0vk =0

dispersiile:
1

max vmax
2

D =
( k < >) 2 ( k , v j ) ,
=0v =0

k j

Ec. 16

max vmax
2

Dv =
(v j < v >) 2 ( k , v j ) ,
=0v =0

k j

Ec. 17

max vmax

D v =
( k < >) 2 (v j < v >) 2 ( k , v j ) ,
=0v =0

k j

Ec. 18

max vmax
2

2
v =
( k v j < v >) ( k , v j )
=0v =0

k j

Ec. 19

entropia Shannon a amplitudinii distribuiei:


N

H =

p k ln p k ,

Ec. 20

k =1

unde p k este probabilitatea de a gsi amplitudinea Ak , p k = h( Ak ) / R , h( Ak ) reprezint


histograma distribuiei amplitudinilor cu k = 1 : N , k este un parametru discret care
reprezint numrul de nivele de amplitudine n care este stabilit histograma, N = 20 este
N

numrul de nivele echidistante ale histogramei, iar R este definit prin R = h( Ak ) .


k =1

25

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Din reprezentarea grafic a celor dou transformate n cazul aplicrii protezelor fr


nclinare i cu nclinare de 30, a rezultat c ambele transformate sunt mai bine localizate n
cazul protezei fr nclinare i mai dispersate n cellalt caz, iar consoana /s/ reflect mai
bine poziia corect a protezei. Rezultatele au artat c n cazul consoanei /sh/ parametrul
D v corespunztor STFT poate fi utilizat drept parametru cantitativ de evaluarea a
corectitudinii montrii protezelor dentare deoarece prezint o variaie regulat, cu o valoare
extrem de minim la o nclinare a protezei de = 0. n mod similar la consoana /s/,
parametrul v a STFT i parametrii Dv i D v ai transformatei wavelet pot fi utilizai ca
parametri de evaluare cantitativi ntruct prezint variaie regulat i o valoare minim la
= 0. Att la consoana /s/ ct i la consoana /sh/, entropia Shannon a distribuiei
amplitudinii poate fi de asemea utilizat ca un parametru cantitativ deoarece are o valoare
local extrem la = 0.
E. C. Ward et al. [88] a studiat impactul malocluziei i reconstruciei ortognatice
chirurgicale asupra funciei de articulare i rezonan a sunetelor. Trsturile articulatorii i
rezonana nazal au fost evaluate nainte i dup ase luni de la reconstrucia ortognatic
chirurgical a cinci pacieni cu deformri dentofaciale. Evaluarea perceptual i fiziologic
preoperatorie a artat c pacienii prezentau o nazalizare a sunetelor (doi prezentau
hiponazalitate i unul hipernazalitate) i patologii ale funciei de articulare (patru pacieni
prezentau deficiene articulatorii medii i patru prezentau o reducere a presiunii limbii sau a
presiunii interlabiale). Dup operaie nazalitatea s-a redus la trei pacieni, iar precizia
articulrii i inteligibilitatea s-au mbuntit doar la unul singur. S-a constatat o
mbuntire a presiunii interlabiale la trei pacieni, n timp ce impactul asupra presiunii
limbii a variat astfel: s-a mbuntit ntr-un caz, s-a deteriorat n alt caz, iar la ceilali trei
pacieni a rmas neschimbat. Variabilitatea rezultatelor a subliniat importana evalurii
vorbirii i funciei de rezonan nainte i dup reconstrucia ortognatic.
Defectele de articulaie cauzate de dentiie anormal au fost investigate i de M.
Daisuke i S. Kaoru [89]. Studiul s-a bazat pe un eantion de 24 de subieci care au fost
mprii pe dou grupe. Grupa I conine 18 subieci din care 6 cu cte un dinte lips pe
maxilarul anterior, 5 cu dantur complet, 5 cu molari lips pe mandibul i 2 cu edentaie.
Grupa II conine 6 subieci din care unul are malocluzie de tip open bite i 5 au protruzie
mandibular. Evaluarea articulrii sunetelor s-a bazat pe 100 de monosilabe din limba
japonez, iar analiza vocal s-a realizat cu ajutorul unui spectrograf de sunet. Scorul de
articulare a fost de 71.4-96.0% (medie 89.0%) la primul grup, n timp ce pentru grupul II a
fost de 88.4-97.0% (medie 93.0%). Sunetele care au prezentat modificri de articulare au
fost alveolarele /d/, /n/ i /t/ care au fost prununate asemntor cu bilabialele /b/, /m/, /p/,
sunetul sibilant /b/ s-a asemnat cu /r/, iar la sunetele /s/, /ts/, /n/, valorile formantului F2 au
crescut, determinnd o cretere a diferenei dintre formanii F1 i F2. S-a constatat de
asemenea c limba a prezentat micri spre n fa, compensatorii patologiilor de dentiie
prezente. Autorii au concluzionat c defectele de dentiie nu afecteaz conversaiile
cotidiene.
Efectul aparatelor dentare (Braketilor) asupra articulrii vorbirii a fost studiat de B.
Haydar el al. [90]. Abilitile de articulare a sunetelor au fost evaluate n cazul a 15 pacieni
la sfritul tratamentului ortodontic prin ndeprtarea aparatelor de contenie (retainer)
superior i inferior. Evaluarea distorsiunilor de articulare s-a realizat prin nregistrarea de
vocale i consoane n contexte CV, VCV, VC, CVC la pacieni fr retainer pe maxilar i
mandibul, cu retainer pe o singur arcad sau concomitent pe ambele arcade. Testul s-a
realizat n prima zi, dup 24 de ore i dup o sptmn de la sfaritul tratamentului. S-au

26

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

observat distorsiuni de articulare statistic semnificative n cazul sunetelor /t/ i /d/, n prima
zi la pacieni care purtau retainer numai pe maxilar sau pe ambele arcade. Distorsiuni
semnificative s-au observat i la sunetul /k/, n cazul purtrii aparatului de contenie pe
maxilar i mandibul concomitent. Aceste distorsiuni, n timpul purtrii retainer-elor au
sczut n mod semnificativ sau chiar au disprut complet n a aptea zi, demonstrnd
capacitatea limbii de a se adapta ntr-o scurt perioad de timp.
Analiza gnatosonic a fost introdus de Watt n anii 1970 [91-93] i reprezint
analiza sunetelor produse n timpul ocluziei printr-o micare asemntoare micrii din
timpul masticaiei [94]. Cercetri ulterioare au evideniat importana analizei gnatosonice n
detectarea ocluziilor imperfecte ale dentiiei [95-100]. Metoda dezvoltat de [93] se
bazeaz pe extragerea numrului, duratei i anvelopei contactelor ocluzale din semnalul
ocluzal nregistrat. Autorii au concluzionat c forma anvelopei contactelor ocluzale este
determinat de numrul de contacte ocluzale i de dinamica poriunii terminale ale ocluziei,
respectiv dinamica alunecrii dinilor de la primul contact ocuzal pn la poziia de
echlibru. Un sunet ocluzal normal este caracterizat printr-un singur contact scurt i un
singur maxim bine definit. Operaiile efectuate pentru extragereea trsturilor prin metode
euristice bazate pe investigare vizual sunt estimarea duratei pulsurilor, a numrului de
pulsuri, identificarea fiecrui contact ocluzal independent, determinarea unui maxim
absolut i a timpului de cresctor al fiecrui contact ocluzal. Aceast metod de detecie a
contactelor ocluzale imperfecte poate fi un instrument complementar analizei gnatofonice
care reprezint analiza semnalului vocal n vederea determinrii relaiei dintre defectele de
pronunie i diverse patologii ale aparatului stomatognat. Termenul de gnatofonie a fost
introdus de H. N. Teodorescu n anii 1986-1988 i desemneaz un nou domeniu la grania
dintre fonetic, acustic i stomatologie. Autorul a dezvoltat un corpus de sunete
gnatofonice i gnatosonice, precum i o metodologie de achiziie, preprocesare i analiz a
acestor sunete descrise n [101-105].
Corpusul de sunete gnatofonice este alctuit din cuvinte ce conin consoane fricative
n varianta sonor respectiv nesonor, labiodentale (/v/ / /f/), alveolare (/z/ / /s/) i
postalveolare (/j/ / /sh/) n contexte consoan-vocal sau vocal-consoan-vocal (vocalele
/a/, /e/, /i/, /o/, /u/, //). Cuvintele sunt astfel alese nct s se poate realiza o analiz
comparativ ntre consoane pereche n variant sonor / nesonor situate n acelai context,
a cror pronunie poate fi confundat. Studiile n domeniu au artat c acest tip de consoane
n articularea crora intervin dinii sau alveolele prezint cel mai des modificri n cazul
patologiilor aparatului stomatognat care implic n principal incisivii superiori i inferiori.
H.N. Teodorescu i M. Feraru au realizat o clasificare a sunetelor gnatofonice
raportat n [106]. Studiul s-a axat pe utilizarea conceptelor de pseudo-formani i pseudodistane. Termenul de pseudo-formanii este utilizat pentru descriereea traseelor
asemntoare cu cele ale formanilor pe care le detecteaz utilitarul PraatTM [50] n cazul
consoanelor nesonore. Parametrii selectai pentru clasificarea sunetelor gnatofonice cu
pronunie similar (s/f, s/, /j, f/v) sunt prezena/absena pseudo-formanilor detectai cu
PraatTM , valorile pseudo-formanilor i energia medie n partea central a sunetului. Autorii
au definit distana dintre dou pronunii ale aceleiai vocale ca fiind:

d ( f 1, f 2) =

( f
k =0

k1

unde f i = ( f 0i , f 1i , f 2i , f 3i , f 4i ), i = 1, 2 .

27

fk2 )2 ,

Ec. 21

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

n cazul consoanelor fricative autorii au definit distana spectral exprimat n scar


logaritmic a frecvenelor pseudoformanilor:
4
4
ln( Fka Fkb )
d ( a, b) = d k =
,
Ec. 22
Fka + Fkb
k =0
k =0
2
unde Fka este formantul k corespunztor sunetului notat cu a.
Rezultatele obinute de ctre autorii acestui studiu arat c discriminarea ntre /f/ i /v/
msurat prin distana dintre consoane este semnificativ redus la persoanele n vrst sau
la cele cu deficiene ale dentiiei, n special a celei frontale n comparaie cu persoanele cu
dentiie normal.
Un alt studiu mai recent realizat de acelai autor [107] face o trecere n revist a
domeniului analizei semnalului vocal cu aplicaii n stomatologie i propune o serie de
indici de evaluare a calitii vocii. Ariile de interes ale autorului sunt studiul deficienelor
de vorbire cauzate de starea dentiiei raportate la mecanismele de articulare i deficienele
de vorbire produse de deficitul mobilitii articulaiei temporo-mandibulare. Relativ la
indicii cantitativi de evaluare a modificrilor de pronunie, autorul introduce o serie de
distane pentru a identifica gradul de similitudine dintre dou foneme. Distana nul
reprezint identitatea. Cu ct distana dintre dou foneme este mai mic cu att ele sunt mai
similare. n sens contrar ele sunt diferite.
Sunt introduse dou distane simple, cte una pentru fiecare din cei doi formani
principali F1 i F2, ntre dou vocale notate V1 i V2. Distanele sunt notate cu d1 i d2 i
reprezint gradul relativ de distincie ntre cele dou vocale, la nivelul unui singur formant.
Distana dintre cele dou vocale este definit ca raportul dintre valoarea absolut a
diferenei dintre valorile medii ale formanilor i suma acestor valori. ntruct urechea
uman difereniaz frecvenele pe scar logaritmic autorul a aplicat logaritmul, obinnd
urmtoarele ecuaii pentru diferenele dintre cele dou vocale:
d1 (V1 , V 2 ) =

| ln( F1V 1 ) ln( F1V 2 ) |


,
ln( F1v1 ) + ln( F1V 2 )

d 2 (V1 , V 2 ) =

| ln( F2V 1 ) ln( F2V 2 ) |


,
ln( F2v1 ) + ln( F2V 2 )

Ec. 23

Ec. 24

unde d1,2 (V 1, V 2) reprezint distanele, iar F1,2V 1 , F1,2V 2 reprezint valorile frecvenelor
primului respectiv celui de-al doilea formant. Lund n considerare faptul c urechea uman
poate distinge vocalele bazndu-se doar pe valorile primilor doi formani autorul a definit
nivelul de distincie ntre dou vocale ca fiind valoarea maxim dintre cele dou distane
definite anterior:
d (V1 , V 2 ) = max( d1 (V1 , V 2 ), d 2 (V1 , V 2 )).
Ec. 25
H. N. Teodorescu a introdus apoi un set de definiii mai rafinat lund n considerare
i variaia temporal a pronuniei. Astfel Ec. 10 va deveni:
1
d1 (V1 , V 2 ) =
Ns

Ns

k =1

1
d1 (V1 , V 2 )[k ] =
Ns

Ns

k =1

| ln( F1V 1 [k ]) ln( F1V 2 [k ]) |


,
ln( F1V 1 [k ]) + ln( F1V 2 [k ])

Ec. 26

unde k este momentul de timp, Ns numrul de eantioane, d (V1,V 2 )[k ] reprezint distana
instantanee, iar F1V 1[k ], F1V 2 [k ] reprezint valorile frecvenelor primului formant la
momentul de timp k.
Un alt parametru introdus este gradul de confuzie dintre dou vocale, definit ca
minimul distanelor instantanee:
C1 = min k (d1 (V1 , V 2 )[k ],
Ec. 27

28

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

C 2 = min k (d 2 (V1 , V 2 )[k ],

Ec. 28
iar gradul total de confuzie este minimul celor dou grade de confuzie definite anterior:
C = min(C1 , C 2 ) = min(min k (d1 (V1 , V 2 )[k ], min k (d 2 (V1 , V 2 )[k ])).
Ec. 29
Definiiile de mai sus sunt valabile doar pentru fonemele sonore, care prezint
frecven fundamental. Autorul propune o msur care poate fi utilizat pentru descrierea
spectral a oricrui sunet n comparaie cu altul, pe baza amplitudinilor componentelor
spectrale:
d ( f , v) =

1 1
NW M

Ns M

k =1 i =1

| Av,i [k ] A f ,i [k ] |
Av,i [k ] + A f ,i [k ]

Ec. 30

Unde Av ,i [k ], A f ,i [k ] reprezint valorile amplitudinilor componentelor spectrale i, n


spectrul instantaneu al fonemelor /v/ i /f/, aa cum sunt determinate ntr-o fereastr W, care
conine NW eantioane, centrat pe eantion la momentul de timp k al fonemului respectiv.
Un alt indice introdus de autor n vederea evalurii corectitudinii pronuniei
sunetelor din punct de vedere temporal este descris de urmtoarea formul:
t (V ) t (Vi )
v = i
,
Ec. 31
t (Vi )
i
unde t (Vi ) este durata fonemului Vi, iar t (Vi ) este media duratei fonemului Vi aparinnd
aceluiai cuvnt, aceleiai propoziii, la subieci sntoi, cu voce normal (fr patologii).
n vederea evalurii calitii tratamentului protetic care se reflect n calitatea
vorbirii, autorul propune doi indici caracteristici pronuniei i definii prin parametri
perceptuali acustici. Primul index se refer la distana fonetic medie a unui set de foneme
pronunate de un pacient protezat, raportat la distana fonetic medie a aceluiai fonem
pronunat de subieci sntoi, cu dentiie normal. Al doilea index se refer la
variabilitatea pronuniei unui fonem. Se poate analiza itravariabilitatea, pentru acelai
vorbitor sau intervariabilitatea ntre un vorbitor i un grup de vorbitori. Intervariabilitatea
arat specificitatea unui vorbitor, respectiv patologia, n cazul n care este comparat cu un
grup de subieci cu dentiie normal, iar intravariabilitatea este determinat prin compararea
unor foneme situate n contexte similare, pronunate de acelai vorbitor.
Concluzionnd, autorul propune un sistem de evaluare a modificrilor de pronunie
ce apar n cazul unor patologii ale aparatului stomatognat care este alctuit din urmtoarele
componente: baz de date de semnal vocal, achiziie semnal, procesare semnal, analiz
spectral, comparaie i calcul indici de calitate a vorbirii (SQI) i de inteligibilitate (SII) i
indicele de evaluare a calitii globale a reabilitrii protetice (Figura 8).

Achiziie semnal

Procesare semnal

Analiz spectral

Indice de evaluare a
calitii globale pentru
evaluarea reabilitrii
protetice

Comparaie i calcul
indici SII, SQI
Baz de date de
semnal vocal

Figura 8. Schema bloc a unui sistem de evaluare a calitii reabilitrii vorbirii n tratamentul
stomatologic [107]

29

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

5. Concluzii i direcii viitoare


La ora actual, cel puin n Romnia, nu exist la nivel de cabinet / clinic
stomatologic metode sau aparatur de analiz automat a vocii n vederea diagnosticrii
unei patologii ale aparatului stomatognat sau a evalurii eficienei tratamentului ortodontic.
Studiile realizate de-a lungul timpului n acest domeniu, au artat c analiza acustic
(perceptiv) subiectiv a vocii de ctre terapeui n vorbire este o tehnic complementar
utilizat de stomatologi dar i de medici ORL n vederea identificrii modificrilor ce apar
n calitatea vocii n cazul diverselor afeciuni. Totui, aceast metod bazat pe realizarea
de nregistrri, ascultarea lor i evaluarea pe baza unor scoruri calitative este o metod
rudimentar i consumatoare de timp, care pe lng medic necesit i prezena altui
specialist. Pentru eliminarea acestor inconveniente ar fi util dezvoltarea unui sistem
automat precum cel propus de Teodorescu [107], care pe baza unor indici calitativi /
cantitativi de evaluare a calitii / inteligibilitii pronuniei sunetelor i a unor reguli
decizionale, s detecteze diversele patologii ale vocii, s le clasifice i mai mult dect att
s determine i cauzele acestora care pot fi: o afeciune respiratorie, laringeal, nazal sau
stomatologic.
Avnd n vedere c pe lng funcia rezonatoare cavitatea bucal are un rol
important n articularea sunetelor prin implicarea dinilor, alveolelor, limbii, buzelor,
palatului i a velumului, ar fi necesar identificarea unor parametri acustici cantitativi care
s fie utili n determinarea defectelor de pronunie cauzate de o articulare incorect.
Acetia s-ar putea defini n principal pentru consoanele bilabiale, labiodentale, alveolare,
postalveolare sau palatale a cror pronunie se modific n cazul edentaiei, n special la
nivelul incisivilor superiori i anteriori, diverselor tipuri de malocluzie, aplicrii de aparate
dentare pentru corectarea arcadelor (brakei) sau aplicrii unor proteze cu o geometrie
necompatibil cu formele i dimensiunile cavitii bucale ale pacientului.
Primul pas n realizarea acestui obiectiv, dup cum a subliniat i Teodorescu [107]
const n dezvoltarea unei baze de date valide din punct de vedere statistic, cu un numr
suficient de nregistrri de cuvinte / propoziii care s conin sunetele cele mai predispuse
la modificri de pronunie n cazul patologiilor aparatului stomatognat. Aceast baz de
date ar trebui structurat / organizat astfel nct s permit o utilizare ct mai facil a
nregistrrilor n vederea procesrilor ulterioare. Este important pentru nceput, realizarea
de nregistrri pe persoane sntoase, fr defecte de dentiie i fr alte afeciuni care ar
cauza tulburri de vorbire. Acestea vor fi utilizate drept referin. Sunt necesare de
asemenea nregistrri provenind de la persoane cu diverse patologii ale dentiiei, grupai pe
clase de patologii (de exemplu: malocluzie clasa I, edentaie, proaspt protezai, etc.).
Toate nregistrrile trebuie preprocesate dup o metodologie deja conceput de
Teodorescu i descris n [101-105]. Urmtorul pas l constituie identificarea unor
parametri acustici i temporali care s serveasc drept indici calitativi de evaluare a calitii
/ inteligibilitii pronuniei sunetelor. Scopul final este realizarea unui clasificator care pe
baza parametrilor identificai la pasul anterior i a unei serii de reguli decizionale, s
clasifice automat patologiile aparatului stomatognat.
Baza de date necesar analizei gnatofonice este deja conceput i dezvoltat n
[101-105], iar o clasificare a tipurilor consoanei fricative dentolabiale /v/, care ar putea fi
util n evaluarea calitii vorbirii la pacieni cu patologii ale dentiiei a fost realizat n
[108,109]. Ca direcii de viitor ne propunem dezvoltarea bazei de date, ntruct la ora
actual avem puine cazuri patologice, identificarea relaiei dintre tipurile de /v/ obinute i
diverse patologii de dentiie i urmarea pas cu pas a direciei propuse de Teodorescu n
[107] n vederea realizrii unui sistem de clasificare automat a patologiilor aparatului
stomatognat.

30

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

Referine
[1] P. S. Phillips, S. P. Hirani, R. Epstein, Peak flow and voice pathology, Journal of Voice,
vol. 23, no.5, pp.521-528, 2008
[2] A. E. Aronson, Clinical voice disorders (3rd ed), New York: Thieme, 1990
[3] R. S. Melfi, S. J. Garrison, Communication Disorders,
http://emedicine.medscape.com/article/317758-overview
[4] G. Necula, Limba romn contemporan Fonetic (i fonologie). Note de curs. Teorie
i exerciii, Galai, 2010
[5] H. N. Teodorescu, L. Buchholtzer, C. Posa, Comunicarea oral om-main, Ed.
Tehnica, 1986
[6] J. J. Ballenger, Diseas of the nose, Throat and Ear, Philadelphia, Lea & Febiger, pp.
275, 1969
[7] S. A. Xue, R. W. Chi Cheng, L. Manwa, Vocal tract dimensional development of
adolescents: An acoustic reflection study, International Journal of Pediatric
Otorhinolaryngology, vol. 74, pp. 907912, 2010
[8] S. Xue, G. Hao, Changes in the human vocal tract due to aging and the acoustic
correlates of speech production: a pilot study, J. Speech Lang. Hear. Res., vol. 46, no. 3, pp.
689, 2003
[9] http://ro.wikipedia.org/wiki/Alfabetul_Fonetic_International
[10] K. J. Koubek, A Pedagogical Application of the Vowel Triangle, Italica
vol. 50, no. 2, pp. 303-305, 1973
[11] M. Hulea, A. Untu, Dispozitiv electronic de preprocesare n regim paralel a spectrului
vocal, Iftene, Teodorescu, Cristea, Tufi (Eds.), Resurse lingvistice i instrumente pentru
prelucrarea limbii romne, Editura Universiti "Al. I. Cuza" Iai, ISSN 1843-911X, pp.
61-70, 2010
[12] H. N. Teodorescu, Prelucrarea vorbirii i teorii fuzzy, curs predat la Facultatea de
Informatic, Universitatea Al. I. Cuza Iai
[13] J. Kreiman, B. R. Gerratt, G. B. Kempster, A. Erman, G. S. Berke, Perceptual
evaluation of voice quality. Review, tutorial, and a framework for future research, Journal
of Speech and Hearing Research, vol. 36, pp. 21-40, February 1993.
[14] B. H. Jacobson, A. Johnson, C. Grywalski, A. Silbergleit, G. Jacobson, M. S.
Benninger, The voice handicap index (VHI). Development and validation, American
Journal of Speech-Language Pathology, vol.6, pp. 66-70, August 1997
[15] C. A. Rosenan, T. Murry, Voice handicap index in singers, Journal of Voice, vol. 14,
no. 3, pp. 370-377, September 2000
[16] M. S. Benninger, G. Gardner, C. Grywalski, Outcomes of botulinum toxin treatment
for patients with spasmodic dysphonia, Arch Otolaryngol Head Neck Surg. vol. 127, pp.
1083-1085, 2001
[17] J. M. Wingate, B. H. Ruddy, D. S. Lundy , J. Lehman , R. Casiano , S. P. Collins, G.
E. Woodson, C. Sapienza, Voice handicap index results for older patients with adductor
spasmodic dysphonia, J Voice, vol. 19, no. 1, pp. 124-31, 2005
[18] K. B. Zur, S. Cotton, L. Kelchner, S. Baker, B. Weinrich, L. Lee, Pediatric voice
handicap index (pVHI): A new tool for evaluating pediatric dysphonia, International
Journal of Pediatric Otorhinolaryngology, vol. 71, no. 1, pp. 77-82, January 2007
[19] M. Schuster, J. Lohscheller, U. Hoppe, P. Kummer, U. Eysholdt, F. Rosanowski,
Voice handicap of laryngectomees with tracheoesophageal speech, Folia Phoniatr. Logop.,
vol. 56, no. 1, pp. 62-7, 2004

31

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

[20] M. Moerman, J. P. Martens, P. Dejonckere, Application of the voice handicap index in


45 patients with substitution voicing after total laryngectomy, European Archives of OtoRhino-Laryngology,vol. 261, no. 8, pp. 423-428, 2004
[21] T. Kandogan, A. Sanal, Quality of life, functional outcome, and voice handicap index
in partial laryngectomy patients for early glottic cancer, BMC Ear, Nose and Throat
Disorders, vol.5, pp. 1-7, 2005
[22] R. Kazi, J. De Cordova, A. Singh, R. Venkitaraman, C.M. Nutting, P. Clarke, P. RhysEvans, K. J. Harrington, Voice-related quality of life in laryngectomees: assessment using
the VHI and V-RQOL symptom scales, Journal of Voice, vol. 21, no. 6, pp. 728-734,
November 2007
[23] K. Maertens, F. I. de Jong, The voice handicap index as a tool for assessment of the
biopsychosocial impact of voice problems, Royal Belgian Society for Ear, Nose, Throat,
Head and Neck Surgery, Leuven, BELGIQUE, vol. 3, no. 2, pp. 61-66, 2007
[24] T. Nawka, U. Gonnermann, Stimmstrungsindex (SSI), M. (Hrsg.) Gross, Editor,
Aktuelle phoniatrisch-pdaudiologische Aspekte, Median Verlag, pp. 375379, 2003
[25] M. Gugatschka, J. Rechenmacher, J. Chibidziura, G. Friedrich, Comparability and
conversion of stimmstrungsindex (SSI) and voice handicap index (VHI), Laryngo-RhinoOtol, vol. 86, no. 11,pp. 785-788, 2007
[26] L. Eskenazi, D. G. Childers, D. M. Hicks, Acoustic correlates of vocal quality, Journal
of Speech and Hearing Research, vol. 33, pp. 298-306, June 1990.
[27] E. Yumoto , W. J. Gould, T. Baer, Harmonics-to-noise ratio as an index of the degree
of hoarseness, J Acoust Soc Am., vol. 71, no. 6, 1982
[28] N. Yanagihara, Significance of harmonic changes and noise components in hoarseness,
Journal of Speech and Hearing Research, vol. 10, pp. 531-541, September 1967.
[29] J. Kreiman, B. R. Gerratt, B. Gabelman, Jitter, shimmer, and noise in pathological
voice quality perception (A), J. Acoust. Soc. Am., vol. 112, no. 5, pp. 2446-2446,
November 2002
[30] D. Michaelis, M. Frhlich, H. Werner Strube, Selection and combination of acoustic
features for the description of pathologic voices, J. Acoust. Soc. Am., vol. 103, no. 3, pp.
1628-1639, March 1998
[31] M. Frohlich, D. Michaelis, H. W. Strube, E. Kruse, Acoustic voice quality description:
Case studies for different regions of the hoarseness diagram, Advances in Quantitative
Laryngoscopy, 2nd Round Table. Thomas Wittenberg, Patrick Mergell, Monika Tigges
and Ulrich Eysholdt (Eds.), Erlangen, pp.143-150, 1997
[32] M. Frhlich, D. Michaelis, H. W. Strube, E. Kruse, Acoustic voice analysis by means
of the hoarseness diagram, Journal of Speech, Language, and Hearing Research vol.43, pp.
706-720, June 2000.
[33] A. Olthoff, S. Mrugalla, R. Laskawi, M. Frhlich, I. Stuermer, E. Kruse, P. Ambrosch,
W. Steiner, Assessment of irregular voices after total and laser surgical partial
laryngectomy, Arch Otolaryngol Head Neck Surg., vol. 129, pp. 994-999, 2003
[34] W. Harnisch, S. Brosch, M. Schmidt, R. Hagen, Breathing and voice quality after
surgical treatment for bilateral vocal cord paralysis, Arch Otolaryngol Head Neck
Surg. vol. 134, no.3, pp. 278-284, 2008
[35] C. Hummel, M. Scharf, A. Schuetzenberger, E. Graessel, F. Rosanowski, Objective
voice parameters and self-perceived handicap in dysphonia, Folia Phoniatr. Logop., vol. 62,
pp. 303-307, 2010
[36] ANSI S3.5-1969, American National Standard Methods for the Calculation of the
Articulation Index, (American National Standards Institute), New York, 1969
[37] ANSI S3.5-1997, American National Standard Methods for Calculation of the Speech
Intelligibility Index, (American National Standards Institute), New York, 1997.

32

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

[38] L. Magnusson, Predictions the speech recognition performance of elderly individuals


with sensorineural hearing impairment: A procedure based on the speech intelligibility
index, Scandinavian Audiology, vol. 25, pp. 215222, 1996
[39] R. D. Kent, Hearing and believing some limits to the auditory-perceptual assessment
of speech and voice disorders, American Journal of Speech-Language Pathology, vol.5, pp.
7-23, August 1996
[40] K. S. Rhebergen, N. J. Versfeld, A speech intelligibility index-based approach to
predict the speech reception threshold for sentences in fluctuating noise for normal-hearing
listeners, J. Acoust. Soc. Am., vol. 117, no. 4, pp. 21812192, April 2005
[41] W. A. Munson, H. C. Montgomery, A speech analyzer and synthesizer, J. Acoust. Soc.
Am., vol. 22, no. 5, pp. 678-678, September 1950
[42] G. L. Clapper, Speech analyzer for speech recognition system- US Patent 3,395,249,
1968 - Google Patents
[43] D. C. Lokerson , Speech Analyzer, US Patent 4,039,754, 1977 - Google Patents
[44] S. A White, Speech analyzer/synthesizer using recursive filters - US Patent 4,038,495,
1977 - Google Patents
[45] J. J Dubnowski et al., Real-time speech analyzer- US Patent 4,015,088, 1977 - Google
Patents
[46] D.H. Klatt, Software for a cascade/parallel formant synthesizer, J. Acoust. Soc. Am.,
67, 971-995, 1980
[47] D. Fohr, Y. Laprie, Snorri: an interactive tool for speech analysis, Proc Eurospeech89,
Paris, Sep. 1989.
[48] Y. Laprie, Snorri, a software for speech sciences, ESCA/SOCRATES Workshop on
Method & Tool Innovations for Speech Science Education MATISSE, pp. 89-92, 1999
[49] Ch. S. Craig, Computerprogramm Goldwave, Version 3, 1997
[50] K. Sjlander, J. Beskow, Wavesurfer - an open source speech tool, Proc of ICSLP, vol.
4, pp. 464467, 2000
[51] P. P. G., Boersma , Praat, a system for doing phonetics by computer, Glot
International, vol. 5, no. 9/10, pp. 341-345, 2002, http://www.fon.hum.uva.nl/praat/
[52] SFS/WASP Version 1.41 (7.12.2007), Mark Huckvale University College London,
Department of Phonetics and Lingvistics, http://www.phon.ucl.ac.uk/resource/sfs/
[53] www.asel.udel.edu/speech/cis889/AcPhon.pdf
[54] www.ialpathens2010.gr/abstracts/PDF/256.12647624822.pdf
[55] A. M. Sulter, H. P. Wit, H. K. Schutte, D. G. Miller, A structured approach to voice
range profile (phonetogram) analysis, Journal of Speech and Hearing Research, vol. 37, pp.
1076-1085, 1994
[56] C. Hamilton, Investigation of the articulatory patterns of young adults with Down
syndrome using electropalatography, Down Syndrome Research and Practice. Vol. 1, no. 1,
pp.15-28, 1993
[57] E. Keller, Ultrasound measurement of tongue dorsum movements in articulatory
speech impairments. In J.H. Ryalls (Ed.), Phonetic Approaches to Speech Production in
Aphasia and Related Disorders, San Diego, CA: College-Hill Press, pp. 93-112, 1987
[58] http://www.speech.cs.cmu.edu/comp.speech/Section1/Labs/kay.html
[59] http://www.drspeech.com
[60] I. Smits, P. Ceuppens, M. S. De Bodt, A comparative study of acoustic voice
measurements by means of Dr. Speech and Computerized Speech Lab., J Voice, vol. 19,
no. 2, pp. 187-96, 2005
[61] D. Austin, L. D. Shriberg, Lifespan reference data for ten measures of articulation
competence using the Speech Disorders Classification System (SDCS) (Tech. Rep. No. 3),
Phonology Project, Waisman Center, University of WisconsinMadison, 1996

33

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

[62] A. Maier, T. Haderlein, U. Eysholdt, F. Rosanowski, A. Batliner, M. Schuster, E.


Noth, PEAKS A system for the automatic evaluation of voice and speech disorders, Speech
Communication, vol. 51, pp. 425-437, 2009
[63] R. Rullo, D. DiMaggio, V. M. Festa, N. Mazzarella, Speech assessment in cleft palate
patients: A descriptive study, International Journal of Pediatric Otorhino laryngology, vol.
73, pp. 641644, 2009
[64] A. Maier, C. Hacker, E. Nth, E. Nkenke, T. Haderlein, F. Rosanowski, M. Schuster,
Intelligibility of children with cleft lip and palate: Evaluation by speech recognition
techniques, Proc. International Conf. on Pattern Recognition,volume 4, pp. 274-277,
HongKong, China, 2006.
[65] M. Schuster, T. Haderlein, E. Noth, J. Lohscheller, U. Eysholdt, F. Rosanowski,
Intelligibility of laryngectomees substitute speech: automatic speech recognition and
subjective rating, Eur Arch Otorhinolaryngol, vol. 263, pp. 188193, 2006
[66] Yu Zhangand, J. J. Jiang, Acoustic analyses of sustained and runningvoices from
patients with laryngeal pathologies, Journal of Voice, vol.22, no.1, 2008
[67] K. Mady, R. Sader, P. H. Hoole, A. Zimmermann, H. H. Horch, Speech evaluation and
swallowing ability after intra-oral cancer, Clin Ling Phon, vol. 17, pp. 411-420, 2003.
[68] R. C. Dwivedi, R. A. Kazi, N. Agrawal, et al., Evaluation of speech outcomes
following treatment of oral and oropharyngeal cancers, Cancer Treat Rev. vol. 35, no. 5,
pp. 417-24, 2009
[69] K. S. Heller, J. Levy, J. J. Sciubba, Speech patterns following partial glossectomy for
small tumors of the tongue, Head & Neck, vol. 13, pp. 340343, 1991
[70] R. Linder, A. E. Albers, M. Hess, S. J. Poopl, R. Schonweiler, Artificial neural
network-based classification to screen for dysphonia using psychoacoustic scaling of
acoustic voice features, Journal of Voice, vol.22, no. 2, 2008
[71] M. C. Franken, L. Boves, H. F. Peters, R. L. Webster, Perceptual rating instrument for
speech evaluation of stuttering treatment, Journal of Speech and Hearing Research, vol. 38,
pp. 280-288, 1995
[72] A. A. Dibazar, S. Narayanan, T. W. Berger, Feature analysis for automatic detection of
pathological speech, Engineering Medicine and Biology Symposium 02,vol.1, pp.182183,
2002
[73] J. Sanabria, P. G. Ruiz, R. Gutierrez, The effect of levodopa on vocal function in
Parkinsons disease, Clin. Neuropharmacol., vol. 24, pp. 99102, 2001
[74] http://www.medici-stomatologi.ro/infodent/malocluzia-dentara
[75] J. S. Rathbone, J. C. Snidecor, Appraisal of speech defects In dental anomalies with reference
to speech improvement, The Angle Orthodontist, vol. 29, no. 1, pp. 54-59, 1959

[76] A. H. Guay, D. L. Maxwell, R. Beecher, A radiographic study of tongue posture at rest


and during the phonation of /s/ in class III malocclusion, Angle Orthod., vol. 48, no. 1, pp.
10-22, 1978
[77] D. M. Plank, B. Weinberg, V. A. Chalian, Evaluation of speech following prosthetic
obturation of surgically acquired maxillary defects, The Journal of Prosthetic Dentistry, vol.
45, no. 6, pp. 626-638, 1981
[78] EA Tobey, J. Lincks, Acoustic analyses of speech changes after maxillectomy and
prosthodontic management, J Prosthet. Dent., vol. 62, pp. 449-55, 1989
[79] T. Laine, M. Jaroma, A. L. Linnasalo, Articulatory disorders in speech related to the
position of the incisors, Eur J.Orthod., vol. 7, pp. 260-266, 1985
[80] T. Laine, Articulatory disorders in speech as related to size of the alveolar arches.
European, J. Orthodontics, vol. 8, no. 3, pp. 192-197, 1986
[81] T. Laine, Associations between articulatory disorders in speech and occlusal
anomalies. European J. Orthodontics, vol. 9, no. 1, pp. 144-150, 1987

34

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

[82] T. Laine, Malocclusion traits and articulatory components of speech. European J.


Orthodontics, vol. 14, no. 4, pp. 302-309, 1992
[83] N. C. L. Johnson, J. R. Sandy, Tooth position and speechis there a relationship?,
The Angle Orthodontist, vol. 69, no. 4, pp. 306-310, August 1999.
[84] A. Caine, Voice loss in performers: a pilot treatment programme to test the effect on
the voice of correcting structural misalignment, Logopedics, Phoniatrics, and Vocology,
vol. 23 (suppl.1), pp. 32-37, 1998.
[85] P. Varley, A. Caine, Voice therapy and dentistry, Dentistry Monthly, pp.24-29, 1999
[86] G. Heydecke, D. H. McFarland, J. S. Feine, J. P. Lund, Speech with maxillary implant
prostheses: Ratings of articulation, Journal of Dental Research, vol. 83, no. 3, pp. 236-240,
2004
[87] C. Sinescu, G.E. Draganescu, D. Dodenciu, L. Bereteu, M. Negrutiu, M. Romanu,
Quantitative parameters which describe speech sound distortions due to inadequate dental
mounting. Physica A 387, pp. 12051217, 2008.
[88] E. C. Ward, M. McAuliffe, S. K. Holmes, A. Lynham, F. Monsour, Impact of
malocclusion and orthognathic reconstruction surgery on resonance and articulatory
function: an examination of variability in fi ve cases, Brit J Oral Maxillofac Surg., vol. 40,
no. 5, pp.410-7, 2002.
[89] M. Daisuke i S. Kaoru, Articulation disorders caused by abnormal dentition, J Osaka
Dent Univ, vol. 40, no.2, pp. 99-111, 2006
[90] B. Haydar, G. Karabulut, S. Ozkan, A. U. Aksoy, S. Ciger, Efects of retainers on the
articulation of speech, American Journal of Orthodontics and Dentofacial Orthopedics, vol.
110, pp. 535-540, 1996
[91] D. M. Watt, A gnathosonic study of tooth impact, Dent. Pract. Dent. Rec., vol. 17, no.
9, pp.317-24, 1967
[92] D. M. Watt, Y. Wakabayashi, Study of a classification of occlusion, J Oral Rehabil.,
vol. 5, no. 2, pp. 101-10, 1978
[93] D. M. Watt, P. M. McPhee, Gnathosonic monitoring of occlusion of complete and
partial dentures, J. Oral Rehabil, vol. 12, no. 2, pp. 107-12, 1985
[94] H. N. Teodorescu, Occlusal Sound Analysis, IET 3rd, International Conference
MEDSIP (Advances in Medical, Signal and Information Processing) 2006, Vol. 2006, pp.14, Glasgow, UK, 17-19 iulie, ISBN: 0 86341 658 6, 2006
[95] V. Burlui, H. N. Teodorescu, C. S. Morrau, L'analyse en frquence de la fonction
phontique chez l'dent total, 7me Symposium Europen Sur Le Traitement de
l'Edntation Totale, Lyon, France, 1993 (vol. de rezumate al Simpozionului).
[96] V. Burlui, H. N. Teodorescu, C. S. Morrau, L'analyse en frquence de la restauration
de la fonction phontique chez l'dent total, Symposium Europen Sur Le Traitement de
l'Edntation Totale , Lyon, Frana, 1993
[97] V. Burlui, H. N. Teodorescu, C. S. Morrau, La fonction phonatoire chez l'dent
total. Analyse en frquence. Les Cahiers de Prothse (France), no. 88, pp. 63-68, 1994
[98] V. Burlui, H. N. Teodorescu, C. S. Morrau, Analiza n frecvena gnatoprotetic,
Sesiunea jubiliar "30 de ani de nvmnt stomatologic ieean", 1996.
[99] C. Morrau, V. Burlui, H. N. Teodorescu, Analiza i prelucrarea automatl a
zgomotelor ocluzale, Ziua Facultii de Stomatologie Iai, 2 februarie, 1998
[100] C. Morrau, V. Burlui, H.-N. Teodorescu, Analiza i prelucrarea asistat de
computer a zgomotelor ocluzale, Revista de Medicin Stomatologic, Vol. II, Nr.3, pp. 4851, 1998
[101] H. N. Teodorescu, M. Feraru, Micro-corpus de sunete gnatosonice i gnatofonice,
Pistol, Cristea, Tufi (Eds.), Resurse lingvistice i instrumente pentru prelucrarea limbii
romne;, Editura Universiti "Al. I. Cuza" Iai, ISBN 978-973-703-297-3, pp. 21-30, 2007

35

UNIUNEA EUROPEAN

GUVERNUL ROMNIEI
MINISTERUL MUNCII, FAMILIEI
I PROTECIEI SOCIALE
AMPOSDRU

Fondul Social European


POSDRU 2007-2013

Instrumente Structurale
2007-2013

OIPOSDRU

UNIVERSITATEA TEHNIC
GHEORGHE ASACHI
DIN IAI

[102] H. N. Teodorescu, S. M. Feraru, D. Trandab, M. Zbancioc, R. Luca, A. Verbu, M.


Hnatiuc, R. Ganea, O. Voroneanu, L. Pistol, D. cheianu, 2005-2007, situl Web Sunetele
Limbii Romne.
http://www.etc.tuiasi.ro/sibm/romanian_spoken_language/index.html
[103] H. N. Teodorescu, D. Trandab, S. M. Feraru, M. Zbancioc, R. Luca, R., A corpus of
the sounds in the Romanian spoken language for language-related education, Chapter Six,
pp. 73-90. n volumul Carlos Perin Pascual (Editor), Revisiting Language Learning
Resources, Cambridge Scholars Publishing (CSP), UK, 2007.
[104] H. N. Teodorescu, S. M. Feraru, S.M., A study on Speech with Manifest Emotions,
10th International Conference on Text, Speech and Dialogue, TSD 2007, Pilsen, Czech
Republic, September 3-7, 2007, Lecture Notes in Computer Science, Springer Verlag, vol.
4629, pp. 254-262, 2007
[105] H.N. Teodorescu, A. Untu, Corpus pentru gnatofonie: protocol, metodologie,
adnotare", Iftene, Teodorescu,
Cristea, Tufi (Eds.), Resurse lingvistice i
instrumente pentru prelucrarea limbii romne, Editura Universiti "Al. I. Cuza" Iai,
ISSN 1843-911X, pp. 51-60, 2010
[106] H.N. Teodorescu, M. Feraru, Classification in gnathophonics - preliminary results,
The Second International Symposium on Electrical and Electronics Engineering, ISEEE
2008, 12-13 septembrie 2008, Galai, Romnia, Galai University Press, ISBN 1842-8046,
pp. 525-530, 2008
[107] H. N. Teodorescu, Voice analysis in dentistry, Journal of Romanian Medical
Dentistry, vol 14, no. 3, pp. 171-186, 2010
[108] A. Untu, H. N. Teodorescu, Pattern analysis of /v/ pronunciations in _/v/V contexts,
The Eighth IASTED Int. Conf. on Signal Processing, Pattern Recognition, and Applications
SPPRA 2011, Innsbruck, Febr. 16-18, 2011
[109] A. Untu, H. N. Teodorescu, Classification of the pronunciations of the /v/ consonant
in the context _/v/V in the Romanian language, SpeD 2011 - The 6th Conference on Speech
Technology and Human Computer Dialogue, 18-21 Mai, 2011

36

S-ar putea să vă placă și