Sunteți pe pagina 1din 8

Spectrographic analysis of the voice: effect of visual training on the reliability of evaluation

Amanda Freitas Valentim1, Marcela Guimares Crtes2, Ana Cristina Crtes Gama3

RESUMO
Objetivo: Verificar se o treinamento visual melhora a concordncia inter e intra-avaliadores da interpretao da anlise acstica espectrogrfica. Mtodos: Trata-se de um estudo experimental longitudinal que utilizou espectrogramas coletados em um banco de dados de consultrio particular, referentes a vozes de homens e mulheres analisadas pelo programa Gram 5.0 em escala de 60 dB, em display scroll, paleta BW, com anlise de frequncias em escala linear, banda estreita, FFT 1024 e resoluo 5.4 Hz. Vinte sujeitos, estudantes de Fonoaudiologia, avaliaram 25 espectrogramas, sendo cinco destes repetidos para avaliar a concordncia intra-sujeitos, antes e aps um treinamento de anlise de espectrogramas. Os parmetros analisados foram: forma do traado espectrogrfico, grau de escurecimento dos harmnicos, estabilidade do traado espectrogrfico, presena de rudo, presena de sub-harmnicos e definio dos harmnicos. O treinamento teve a durao total de quatro horas. Utilizou-se a estatstica Kappa para avaliar a concordncia intrassujeitos e o teste Qui-quadrado de ajuste para a concordncia intersujeitos. Resultados: Em relao concordncia intrasujeitos, os aspectos escurecimento do traado, estabilidade do traado, presena de sub-harmnicos, e definio de harmnicos obtiveram melhora desta e os demais aspectos mantiveram concordncia quase perfeita depois do treinamento. Quanto concordncia intersujeitos, os aspectos de estabilidade do traado e presena de sub-harmnicos obtiveram melhora, e o aspecto presena de rudo obteve piora aps o treinamento. Concluso: O treinamento visual melhorou a confiabilidade inter e intra-avaliadores na interpretao de espectrogramas. Descritores: Voz; Acstica da fala; Espectrografia do som; Variaes dependentes do observador; Capacitao

INTRODUO Atualmente, a avaliao fonoaudiolgica da voz pode ser feita por meio da avaliao perceptivo-auditiva, ou da anlise acstica, que so medidas ou grficos gerados por programas de computador. Pode-se dizer que a avaliao acstica uma anlise objetiva, pois quantifica o sinal sonoro. Porm, o ser humano participa em maior ou menor grau do processo de avaliao
Trabalho realizado no Departamento de Fonoaudiologia da Universidade Federal de Minas Gerais UFMG Belo Horizonte (MG), Brasil. (1) Ps-graduanda (Mestrado) do Programa de Ps-Graduao em Engenharia Mecnica da Universidade Federal de Minas Gerais UFMG Belo Horizonte (MG), Brasil. (2) Ps-graduanda (Mestrado) do Programa de Ps-Graduao em Cincias da Sade - Sade da Criana e do Adolescente da Universidade Federal de Minas Gerais UFMG Belo Horizonte (MG), Brasil. (3) Doutora, Professora Adjunto do Departamento de Fonoaudiologia da Universidade Federal de Minas Gerais UFMG Belo Horizonte (MG), Brasil. Endereo para correspondncia: Amanda Freitas Valentim. R. David Campista, 207/501, Floresta, Belo Horizonte (MG), Brasil, CEP: 30150-090. E-mail: amandafvalentim@gmail.com Recebido em: 1/6/2009; Aceito em: 24/9/2009

e da compreenso do resultado observado, o que indica que no existe uma avaliao puramente objetiva(1). Medidas acsticas da voz tm recebido ateno considervel por serem de natureza no invasiva e relativamente aplicveis na clnica e em pesquisas. Porm, essas medidas devem ser utilizadas juntamente com a avaliao perceptivoauditiva para serem consideradas clinicamente significativas(2). A anlise acstica tem a espectrografia como uma de suas principais ferramentas. O espectrograma pode ser definido como um grfico que mostra a intensidade por meio do escurecimento ou colorao do traado, as faixas de frequncia no eixo vertical e o tempo no eixo horizontal. Sua representao mostra estrias horizontais, denominadas harmnicos. O espectrograma demonstra visualmente as caractersticas acsticas da emisso, porm essas informaes exigem interpretao por parte do avaliador(3). No existe correlao direta entre dados auditivos e espectrogrficos, entretanto, um estudo encontrou que os parmetros perceptivo-auditivos de grau geral da disfonia, rouquido/aspereza, soprosidade e instabilidade se relacionaram com traado irregular dos harmnicos nos espectrogramas em mais de 66% dos casos avaliados; loudness fraca se relacionou com grau
Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

Artigo Original

Anlise espectrogrfica da voz: efeito do treinamento visual na confiabilidade da avaliao

336

Valentim AF, Crtes MG, Gama ACC

de escurecimento dos harmnicos fraco em 87,5% dos casos; quebras de sonoridade na voz, com falhas na continuidade do traado em 62,5%; disfonia e instabilidade vocal, com rudo entre os harmnicos em 97,4%; disfonia, rouquido/aspereza com diminuio da concentrao de energia nas altas frequncias em 48,7%; disfonia, rouquido/aspereza e sub-harmnicos em 79,5%. Isso mostra que esses aspectos so importantes parmetros a serem analisados em um espectrograma(4). Outra pesquisa, realizada com vozes disrtricas, encontrou traado espectrogrfico instvel em todos os casos e, na maioria deles, ausncia de harmnicos superiores e presena de rudo entre harmnicos. Esses achados so compatveis com as vozes rouco-soprosas, com alterao de ressonncia e incoordenao da musculatura larngea encontradas nesses sujeitos. Apesar disso, no houve equivalncia estatisticamente significante entre os parmetros auditivos e acsticos, reforando a ideia de que estas avaliaes devem ser complementares(5). A avaliao espectrogrfica da voz apresenta subjetividade da anlise, portanto, tal julgamento perceptivo-visual pode sofrer influncias da experincia do avaliador. Assim como a avaliao espectrogrfica da voz, a videolaringoscopia, exame que possibilita visualizar as estruturas larngeas e o padro vibratrio das pregas vocais, necessita de uma anlise perceptivo-visual, sofrendo, portanto, a influncia de fatores relacionados instrumentao, treino e habilidade dos avaliadores, que faro a interpretao do exame(6). Na literatura, estudos que analisaram o efeito do treinamento visual na concordncia intra e interavaliadores na interpretao de avaliaes por imagem, como espectrogramas de fala e exames radiolgicos, demonstraram diferentes resultados nos momentos pr e ps treinamento, fato que pode ser justificado principalmente pelo grau de complexidade da imagem e, consequentemente, da anlise perceptivo-visual(7-11). No se encontrou na literatura nenhum trabalho que estudasse o efeito do treinamento visual na avaliao espectrogrfica vocal, portanto, essa pesquisa pretende analisar o quanto o treinamento visual interfere na concordncia intra e inter examinadores na avaliao da anlise espectrogrfica da voz. MTODOS Trata-se de um estudo experimental longitudinal, que utilizou espectrogramas coletados em um banco de dados de consultrio particular, com a autorizao do profissional responsvel. Os registros pertencem a homens e mulheres disfnicos ou sem alterao de voz, com mais de 18 anos de idade. O material de voz colhido foi a emisso sustentada da vogal /a/. A gravao das vozes arquivadas foi realizada diretamente em computador, equipado com microfone profissional, do tipo condensado, estreo, omnidirecional, sensibilidade de -20 dB, da marca EQUITEK E-100, ligado a uma fonte de eletricidade (Phanton Power) de uma mesa de som marca MACKIE 1202 VLZ 12 canais. Os indivduos estavam em p, com o microfone situado a 10 cm da boca e com ngulo de captao direcional de 90. O microfone estava deslocado do corpo da unidade de gravao para evitar captao de rudo
Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

do maquinrio. Foi utilizada fita digital marca Panasonic e as gravaes foram realizadas em ambiente silente. A gravao da vogal sustentada foi transferida para o PC IBM Aptiva E30P, processador AMD K6 2 / 500 MHz, memria de 128 mega bytes RAM, espao de disco 8,4 Giga bytes, placa de som Crystal SoundFusion. As emisses foram analisadas acusticamente pelo programa Gram 5.0, o qual gera a imagem espectrogrfica do som. As vozes foram gravadas em arquivo mono, sample rate de 11k e resoluo de 16 bit e as espectrografias, geradas em escala de 60 dB em display scroll e paleta BW. A anlise das frequncias foi realizada em escala linear, banda estreita, FFT 1024 e resoluo 5.4 Hz. Os espectrogramas foram colocados em slides do software PowerPoint para serem apresentados aos participantes. Foram selecionados para o estudo, 20 estudantes que estavam cursando 3 a 5 perodos de Fonoaudiologia de uma universidade. Estes foram escolhidos devido ao fato de no terem participado de nenhum tipo de treinamento em anlise espectrogrfica. A amostra foi composta por uma pessoa do sexo masculino e 19 do sexo feminino, com idades variando de 19 a 35 anos. Todos os participantes assinaram o termo de consentimento livre e esclarecido. Para anlise da concordncia intra e inter avaliadores, utilizou-se de 25 espectrogramas, dos quais cinco foram repetidos. Foi realizada uma breve explicao sobre os parmetros espectrogrficos a serem analisados, a partir de exemplos de cada item e ento os participantes realizaram uma primeira avaliao. Depois do treinamento visual, os sujeitos refizeram a anlise dos mesmos 25 espectrogramas. Portanto, os resultados so de avaliao anterior e posterior ao treinamento, com um intervalo de uma semana entre as duas avaliaes. As vozes no foram apresentadas em momento algum, sendo a anlise puramente visual. Para o treinamento visual, utilizou-se de aproximadamente 100 espectrogramas que foram exibidos e classificados. O treinamento foi realizado em dois encontros, com durao total de quatro horas. Foi utilizado o Protocolo de Anlise Visual/Espectrogrfica, elaborado pelas pesquisadoras, em que o avaliador deveria classificar os seguintes parmetros (Figuras 1 a 3): - Forma do traado espectrogrfico (regular, irregular ou ausente): o traado foi considerado regular quando as linhas dos harmnicos eram bem definidas, ntidas; irregular quando no era possvel definir os harmnicos em alguma parte do traado; ausente quando no havia traado. - Grau de escurecimento dos harmnicos (forte, normal, fraco ou no possvel avaliar): o grau de escurecimento foi considerado forte quando os harmnicos apresentavamse em tons de preto e cinza escuro e podiam ser vistos ao longo de todo o espectro; fraco quando os harmnicos apresentavam-se em tons de cinza claro e se apagavam em algumas regies do espectro; normal quando apresentava colorao intermediria. Nos casos de traado ausente, no possvel avaliar o grau de escurecimento. - Estabilidade do traado espectrogrfico (estabilidade, instabilidade ou no possvel avaliar): considerou-se que o traado tinha instabilidade quando apresentava oscila-

Efeito do treinamento com espectrogramas

337

es evidentes ou quebras; estabilidade quando o traado mantinha-se contnuo e constante, com ondulaes mnimas. Nos casos de traado ausente, no possvel avaliar a estabilidade do traado. - Presena de rudo (presente ou ausente): quando o traado apresentava, entre os harmnicos, o fundo sombreado ou pontilhado, dexando-o mais escuro, considerou-se que o rudo estava presente. Quando no havia esse sombreado e podia-se ver o fundo branco, considerou-se rudo ausente. - Presena de sub-harmnicos (presente ou ausente): considerou-se que o traado apresentava sub-harmnicos quando, em alguma parte do espectrograma, verificava-se a presena de traado entre dois harmnicos consecutivos. Os sub-harmnicos foram considerados ausentes quando isto no acontecia. - Definio dos harmnicos (o avaliador deve escrever at qual frequncia os harmnicos encontram-se definidos): foi considerado que os harmnicos estavam definidos at a frequncia mais alta onde estes ainda eram ntidos. Essa pesquisa foi aprovada pelo Comit de tica em Pesquisa da Universidade Federal de Minas Gerais (UFMG) sob o parecer ETIC 675/07. Para anlise dos dados, foi utilizada a estatstica Kappa para avaliar a concordncia intraexaminadores, que foi classificada de acordo com o seguinte critrio(12): quase perfeita - Kappa entre 0,80 e 1,00; boa - Kappa entre 0,60 e 0,80; moderada - Kappa entre 0,40 e 0,60; regular - Kappa entre 0,20 e 0,40; discreta -Kappa entre zero e 0,20; pobre - Kappa entre -1 e zero. Utilizou-se, tambm, o teste Qui-quadrado de ajuste para avaliar a concordncia interexaminadores, e o ndice de significncia adotado foi de p<0,05.

RESULTADOS A Tabela 1 mostra os valores de concordncia intra-avaliadores individuais e gerais, por parmetro espectrogrfico, antes e depois do treinamento. Apenas dois aspectos apresentavam concordncia quase perfeita e um, concordncia boa antes do treinamento. Todos os parmetros apresentaram melhora ou mantiveram o mesmo nvel de concordncia depois do treinamento, sendo que cinco dos seis aspectos apresentaram concordncia quase perfeita ou boa. A Tabela 2 apresenta os valores de concordncia interavaliadores por parmetro espectrogrfico, antes e depois do treinamento. Antes do treinamento, apenas um parmetro apresentava valor de p estatisticamente significante e dois, menores que 0,10. Todos os parmetros apresentaram diminuio no valor de p aps o treinamento, com exceo de presena de rudo, sendo que dois foram significantes e todos os valores de p foram menores que 0,10. DISCUSSO Atualmente, o padro-ouro utilizado para avaliao de voz a avaliao perceptivo-auditiva, que subjetiva e depende da experincia do avaliador(13). Diante da subjetividade da avaliao perceptivo-auditiva, cada vez mais, tm-se utilizado ferramentas complementares para avaliao da voz, como a anlise acstica. Um dos tipos de anlise acstica so as medidas a curto prazo, que so valores gerados por programas de computador, sendo dessa forma mais objetivos. Porm, como cada programa utiliza uma maneira diferente para calcular os parmetros acsticos, os valores

Figura 1. Espectrograma com traado regular, intensidade fraca, estvel, com rudo ausente, sub-harmnicos ausentes e harmnicos definidos at 3 kHz Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

338

Valentim AF, Crtes MG, Gama ACC

Figura 2. Espectrograma com traado irregular, intensidade normal, instvel, com presena de rudo, presena de sub-harmnicos e harmnicos definidos at 2 kHz

Figura 3. Espectrograma com traado ausente, no qual no possvel avaliar estabilidade e grau de intensidade, com presena de rudo, subharmnicos ausentes e harmnicos definidos at 0 kHz

de normalidade diferem entre eles. Alm disso, esses valores tambm variam conforme os instrumentos de gravao, rudo ambiental, gnero e idade do falante(14,15) o que mostra que a qualidade do equipamento utilizado no registro das vozes, o
Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

tipo de programa e as caractersticas anatomofuncionais da laringe podem influenciar nos resultados destas medidas a curto prazo. A espectrografia vocal uma outra forma de anlise acsti-

Efeito do treinamento com espectrogramas

339

Tabela 1. Valores individuais e gerais para anlise da concordncia intra-avaliadores antes e depois do treinamento visual, para cada parmetro espectrogrfico Sujeitos A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Geral Classif.* 1,00 0,55 1,00 1,00 0,62 0,33 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 0,00 1,00 0,29 0,44 0,55 1,00 0,80 a Forma D 1,00 1,00 1,00 1,00 0,55 1,00 0,55 1,00 1,00 1,00 1,00 1,00 0,00 1,00 1,00 0,55 1,00 1,00 0,00 1,00 0,85 a Intensidade A 0,41 1,00 0,55 0,00 0,38 0,06 0,55 0,00 1,00 0,64 -0,43 0,55 0,44 0,00 0,64 -0,25 0,06 -0,15 0,29 0,64 0,43 c D 0,62 0,55 0,62 -0,11 0,55 0,17 0,00 1,00 0,06 1,00 0,33 0,29 1,00 0,67 1,00 0,55 0,62 1,00 1,00 0,67 0,62 b Estabilidade A 0,00 1,00 0,55 0,55 1,00 0,67 0,00 0,17 0,55 1,00 -0,36 0,55 1,00 0,55 1,00 1,00 0,17 -0,25 0,29 1,00 0,59 c D 1,00 1,00 1,00 0,29 0,00 1,00 0,29 1,00 1,00 1,00 1,00 0,55 0,55 1,00 0,62 0,55 0,62 0,55 0,55 1,00 0,75 b A 1,00 0,55 0,55 0,62 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 0,94 a Rudo D 0,55 1,00 0,55 1,00 1,00 1,00 0,55 0,55 1,00 1,00 1,00 1,00 1,00 0,55 1,00 0,55 1,00 1,00 1,00 1,00 0,87 a Sub-harmnicos A 0,62 -0,25 1,00 0,29 1,00 0,55 0,55 1,00 1,00 1,00 1,00 0,00 1,00 0,62 0,62 1,00 0,29 1,00 1,00 1,00 0,69 b D 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 0,62 1,00 1,00 0,55 0,62 1,00 0,62 1,00 1,00 0,62 1,00 1,00 0,90 a A -0,11 0,55 0,00 -0,25 -0,25 -0,25 -0,36 0,55 -0,33 0,44 0,29 0,33 0,00 0,17 -0,36 0,62 0,55 0,38 0,55 0,62 0,35 d Definio D 1,00 1,00 0,62 0,00 0,29 1,00 1,00 -0,15 0,00 0,00 1,00 0,00 0,17 0,00 1,00 0,50 1,00 1,00 0,00 1,00 0,56 c

Estatstica Kappa Legenda: A = antes do treinamento; D = depois do treinamento; *Classif. = classificao da concordncia(12); a = quase perfeita; b = boa; c = moderada; d = regular; e = discreta; f = pobre

Tabela 2. Valores da concordncia interavaliadores antes e aps o treinamento visual, para cada parmetro espectrogrfico Parmetro espectrogrfico Forma do traado Intensidade do traado Estabilidade do traado Presena de rudo Presena de sub-harmnicos Definio de harmnicos
Teste Qui-quadrado de ajuste * Valores significativos (p<0,05)

Concordncia antes 0,110 0,129 0,060 0,005* 0,127 0,259

Concordncia depois 0,088 0,096 0,045* 0,085 0,048* 0,060

ca, sendo representada por um grfico tridimensional, resultado da relao entre frequncia, intensidade e tempo. Apesar da avaliao espectrogrfica da voz ser considerada um exame objetivo, existe a subjetividade da anlise visual do traado espectrogrfico pelo avaliador. Esta pesquisa analisou a concordncia das respostas inter e intra-avaliadores, antes e depois de um treinamento visual com espectrogramas. No foram encontrados na literatura, estudos que avaliassem o efeito do treinamento visual na confiabilidade da interpretao de espectrogramas de voz.

Para o presente estudo, realizou-se um clculo amostral para o teste Kappa, por meio do software Minitab for Windows, considerando-se uma populao de 125 sujeitos. Verificou-se que, para se obter um poder de 90% no teste, seria necessria uma amostra de 44 sujeitos. Dessa forma, todos os 125 estudantes de primeiro a quinto perodos do curso de Fonoaudiologia da UFMG foram convidados a fazer parte do estudo, porm apenas 20 se dispuseram a participar. Observou-se que muitos se interessaram, mas apresentaram dificuldade em disponibilizar duas horas durante dois dias de sua vida acadmica, j que o curso de Fonoaudiologia nesta universidade ocorre em perodo integral. Ao contrrio do verificado por um estudo(16), no qual 35 profissionais e graduandos de Odontologia avaliaram perda ssea em 25 radiografias periodontais antes e depois de um treinamento, no houve evaso de participantes ao longo do estudo, o que indica que aqueles que se dispuseram a participar e iniciaram o treinamento, consideraram este relevante. Na avaliao realizada antes do treinamento, no presente estudo, verificou-se concordncia intra-avaliadores (Tabela 1) quase perfeita para os parmetros de forma do traado espectrogrfico e presena de rudo e concordncia boa para o parmetro de presena de sub-harmnicos, o que indica que estes so aspectos visuais fceis de serem avaliados,
Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

340

Valentim AF, Crtes MG, Gama ACC

sendo necessria apenas uma breve explicao dos critrios de anlise de tais parmetros. Resultado semelhante foi encontrado em uma pesquisa que verificou confiabilidade tima intrassujeitos de trs avaliadores na identificao de pontos cefalomtricos em 12 tomografias computadorizadas cone beam(17). O mesmo no ocorre com a avaliao visual da presena de displasia em lminas patolgicas do esfago de Barrett, j que um estudo com dois sujeitos avaliando 229 lminas desse tecido, encontrou concordncia pobre ou fraca intra-avaliadores(18). Uma pesquisa que analisou a identificao de ndulos pulmonares em 25 tomografias computadorizadas avaliadas por quatro radiologistas torcicos, tambm no obteve boa concordncia, encontrando grande variabilidade intra-avaliador (19). Os diferentes resultados podem ser explicados, provavelmente, pela complexidade da imagem do exame, que pode tornar a avaliao mais ou menos complexa. Um estudo piloto semelhante a esta pesquisa, conduzido pelas autoras, realizou um treinamento visual de quatro horas com trs avaliadores com pouca experincia, utilizando espectrogramas de voz. Verificou-se que a concordncia intrassujeitos j era boa inicialmente e passou a quase perfeita depois do treinamento(20). Tais resultados convalidam os achados desta pesquisa, demonstrando que o nvel de complexidade da imagem do traado espectrogrfico da voz pequeno e que, portanto, sua anlise visual uma tarefa relativamente fcil. Aps o treinamento, verificou-se que os aspectos de intensidade do traado e estabilidade do traado, obtiveram melhora no nvel de concordncia intrassujeitos (Tabela 1) de moderada para boa; o aspecto presena de sub-harmnicos, de boa para quase perfeita e definio de harmnicos, de regular para moderada. Os demais aspectos mantiveram concordncia quase perfeita. Tais resultados sugerem que, apesar da anlise visual do traado espectrogrfico no ser uma tarefa de difcil execuo, o treinamento visual melhora a performance do avaliador na anlise de tais parmetros. A concordncia intersujeitos (Tabela 2) nesta pesquisa, antes do treinamento, obteve valor estatisticamente significante apenas para o aspecto presena de rudo, o que indica uma confiabilidade ruim para a maioria dos parmetros. Tais achados foram semelhantes ao obtido no estudo de lminas patolgicas do esfago de Barrett(18) e diferente do encontrado na identificao de pontos cefalomtricos em tomografias computadorizadas cone beam(17). Tais discordncias podem ser justificadas pela diferena metodolgica e de complexidade da imagem dos trs estudos. Alm disso, sugerem que a concordncia interavaliador menor que a concordncia intra-avaliador na avaliao perceptivo-visual quando os mesmos no possuem treinamento. Esta diferena demonstra a importncia de uma explicao mais detalhada dos critrios de avaliao, possibilitando estabelecer-se um consenso sobre os conceitos e graus de variao dos parmetros visuais analisados. Quanto concordncia interavaliadores (Tabela 2) aps o treinamento, foi observado que todos os aspectos, exceto presena de rudo, apresentaram diminuio nos valores de p, indicando melhora na concordncia. O estudo piloto, semelhante a esta pesquisa, tambm encontrou melhora na
Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

confiabilidade em geral, aps o treinamento(20). No presente estudo, os parmetros de estabilidade do traado e presena de sub-harmnicos, passaram a apresentar concordncia tima. Os parmetros de forma do traado, intensidade do traado e definio de harmnicos, tambm apresentaram melhora na concordncia, porm, tais parmetros no foram considerados significantes, possivelmente devido ao tamanho da amostra. Tais resultados indicam a importncia do treinamento na confiabilidade da anlise perceptivo-visual do traado espectrogrfico da voz, principalmente no que tange concordncia interavaliador. Assim como outros tipos de treinamento visual descritos com oito examinadores avaliando espectrogramas de fala(8); com mdicos avaliando imunocintilografia(9); com cinco docentes de Odontologia utilizando exame visual e radiogrfico de amlgamas dentrias(10); com trs profissionais e graduandos de Odontologia utilizando radiografias dentrias para se analisar cries(11) e com radiografias periodontais para se verificar perda ssea(16), o treinamento visual realizado neste estudo melhorou a concordncia da avaliao e deve ser considerado, portanto, um aspecto importante destas anlises perceptivo-visuais. O conhecimento adquirido em um treinamento pode ser comparado ao adquirido com a experincia profissional. Dessa forma, os resultados obtidos tambm foram semelhantes aos do estudo que analisou imagens mamogrficas com 22 avaliadores experientes e inexperientes(21), e a pesquisa que estudou a interpretao de tomografia computadorizada craniofacial por trs estudantes de Odontologia de diferentes perodos(22). Ambos os estudos observaram que sujeitos com mais experincia apresentam avaliaes mais concordantes e confiveis. Verificou-se que a avaliao do parmetro presena de rudo aps o treinamento (Tabela 2) obteve aumento no valor de p (passando de 0,005 para 0,085), o que indica que a concordncia desse aspecto piorou com o treinamento. Uma possvel explicao seria a de que vozes normais podem apresentar certa quantidade de rudo e os avaliadores classificaram-nas como rudo ausente. Porm, a fronteira entre o normal e o alterado muito tnue. Dessa forma, a concordncia quanto anlise de presena de rudo pode ter piorado devido ao fato de os avaliadores estarem mais atentos e terem apresentado mais dvidas em relao quantidade de rudo que pode ser considerada normal ou alterada. Durante a realizao das avaliaes desta pesquisa, o tempo para analisar cada espectrograma foi livre, sendo que as autoras esperaram que todos os avaliadores terminassem a anlise de cada um, para ento passar ao prximo. Observou-se que, antes do treinamento, a mdia de tempo utilizado para avaliar cada espectrograma foi de um minuto e meio e, aps, passou a um minuto. Isso indica que, provavelmente, o treinamento contribuiu para que a anlise ficasse mais fcil e, dessa forma, mais rpida. Neste trabalho, as avaliaes foram puramente visuais. Outro estudo(23), realizado com seis examinadores experientes avaliando 70 vozes disfnicas, verificou que a concordncia interavaliadores aumentou com a adio dos espectrogramas informao auditiva, o que mostra a importncia da utilizao de ambas as formas de avaliao de voz, que trazem informaes complementares. Dessa forma, sugere-se que

Efeito do treinamento com espectrogramas

341

pesquisas futuras investiguem a influncia da apresentao da voz na avaliao espectrogrfica, para verificar se o inverso tambm ocorre. Este estudo pesquisou a influncia do treinamento visual apenas na avaliao de examinadores inexperientes. So necessrios outros trabalhos para verificar se o mesmo ocorre com examinadores experientes. Como no foram encontradas outras pesquisas semelhantes, que pudessem nortear o tempo de treinamento, optou-se por realizar um de quatro horas. Assim, seria interessante realizar o mesmo tipo de estudo com diferentes tempos de treinamento, avaliando se um maior ou menor tempo de treinamento poderia influenciar os resultados encontrados.

CONCLUSO O treinamento visual melhorou a concordncia intraavaliadores para os parmetros de escurecimento do traado, estabilidade do traado, presena de sub-harmnicos, definio de harmnicos e manteve uma concordncia quase perfeita nos aspectos de forma do traado e presena de rudo. Na anlise interavaliadores, o treinamento visual melhorou a concordncia para os parmetros de estabilidade do traado e presena de sub-harmnicos e piorou a concordncia para o parmetro de presena de rudo. O treinamento visual melhorou a confiabilidade inter e intra-avaliadores na interpretao de espectrogramas.

ABSTRACT
Purpose: To verify whether visual training improves the reliability inter and intra-observer of spectrograms interpretation. Methods: This was a longitudinal experimental study that used spectrograms collected in a database of a private office, regarding the voices of men and women analyzed by the program Gram 5.0 in 60 dB scale, display scroll, palette BW, with frequency analysis performed in linear scale, narrow band, FFT size 1024, and frequency resolution 5.4 Hz. Twenty subjects, Speech-Language Pathology students, evaluated 25 spectrograms, of which five were repeated to evaluate intra-observer reliability, before and after a visual training of spectrograms analysis. The analyzed parameters were: spectrogram regularity, harmonic darkening, spectrogram stability, presence of noise components, harmonics definition and presence of sub-harmonics. The training session lasted four hours. Kappa statistic was used to evaluate intra-observer reliability, and the adjusted Chi-square test, to evaluate inter-observer reliability. Results: Intraobserver reliability of harmonic darkening, spectrogram stability, harmonic definition and presence of sub-harmonics improved, and the other aspects kept almost perfect agreement after the training. Inter-observer reliability of spectrogram stability and presence of sub-harmonics improved, and presence of noise components got worse after training. Conclusion: Visual training improved inter and intra-observers reliability in spectrograms interpretation. Keywords: Voice; Speech acoustics; Sound spectrography; Observer variation; Training

REFERNCIAS
1. Behlau M, organizadora. Voz: o livro do especialista. Rio de Janeiro: Revinter; c2001. 2. Eadie TL, Doyle PC. Classification of dysphonic voice: acoustic and auditory-perceptual measures. J Voice. 2005;19(1):1-14. 3. Pontes PAL, Vieira VP, Gonalves MIR, Pontes AAL. Caractersticas das vozes roucas, speras e normais: anlise acstica espectrogrfica comparativa. Rev Bras Otorrinolaringol. 2002;68(2):182-8. 4. Drumond LB, Gama ACC. Correlao entre dados espectrogrficos e perceptivo-auditivos de vozes disfnicas. Fono Atual. 2006;8(35):49-58. 5. Ortiz KZ, Carrillo L. Comparao entre as anlises auditiva e acstica nas disartrias. Rev Soc Bras Fonoaudiol. 2008;13(4):325-31. 6. Patel RR. Visual perceptions in laryngeal imaging. Perspect Voice Voice Disord. 2007;17:7-10. 7. Pisoni DB, Greene BG, Carrell TD. Identification of visual displays of speech: comparisons of naive and trained observers. J Acoust Soc Am. 1983;73(Suppl 1):S102. 8. Greene BG, Pisoni DB, Carrell TD. Recognition of speech spectrograms. J Acoust Soc Am. 1984;76(1):32-43. 9. Rubinstein M, VanDaele P, Wegener W, Guardia M. Adherence to imaging protocol and impact of training on the interpretation of CEA-Scan (arcitumomab) imaging for colorectal cancer. Rev Med Nucl Alasbimn J. 2004;6(25): Article N AJ25-5. [cited 2010 July 28]. Available from: http://www2.alasbimnjournal.cl/alasbimn/CDA/ imprime/0,1208,PRT%253D11064,00.html. 10. Fernandes ET, Ferreira e Ferreira E. Substitution of amalgam restorations: participative training to standardize criteria. Braz Oral Res. 2004;18(3):247-52. 11. Carmona GP, Devito KL, Pontual MLA, Haiter Neto F. Influncia da experincia profissional no diagnstico radiogrfico de cries. Cienc Odontol Bras. 2006;9(1):87-92. 12. Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics. 1977;33:159-74. 13. Bele IV. Reliability in perceptual analysis of voice quality. J Voice. 2005;19(4):555-73. 14. Deliyski DD, Shaw HS, Evans MK, Vesselinov R. Regression tree approach to studying factors influencing acoustic voice analysis. Folia Phoniatr Logop. 2006;58(4):274-88. 15. Deliyski DD, Evans MK, Shaw HS. Influence of data acquisition environment on accuracy of acoustic voice quality measurements. J Voice. 2005;19(2):176-86. 16. Lanning SK, Best AM, Temple HJ, Richards PS, Carey A, McCauley LK. Accuracy and consistency of radiographic interpretation among clinical instructors in conjunction with a training program. J Dent Educ. 2006;70(5):545-57. 17. de Oliveira AE, Cevidanes LH, Phillips C, Motta A, Burke B, Tyndall D. Observer reliability of three-dimensional cephalometric landmark identification on cone-beam computerized tomography. Oral Surg Oral Med Oral Pathol Oral Radiol Endod. 2009;107(2):256-65.

Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

342 18. Lopes CV, Pereira-Lima JC, Hartmann AA, Tonelotto E, Salgado K. Displasia no esfago de Barrett - concordncia intra e interobservador no diagnstico histopatolgico. Arq Gastroenterol. 2004;41(2):79-83. 19. Armato SG 3rd, Roberts RY, Kocherginsky M, Aberle DR, Kazerooni EA, Macmahon H, et al. Assessment of radiologist performance in the detection of lung nodules: dependence on the definition of truth. Acad Radiol. 2009;16(1):2838. 20. Crtes MG, Gama ACC.Anlise visual de parmetros espectrogrficos pr e ps-fonoterapia para disfonias. Rev Soc Bras Fonoaudiol. 2010;15(2):243-9.

Valentim AF, Crtes MG, Gama ACC 21. ngelo MF, Schiabel H. Uma ferramenta para treinamento na avaliao de imagens mamogrficas via internet. Radiol Bras. 2002;35(5):259-65. 22. Gaia BF, Perella A, de Cara AC, Antunes JL, Cavalcanti MG. CT interpretation of craniofacial anomalies: a comparative analysis by undergraduate dental students. Braz Oral Res. 2005;19(1):58-62. 23. Martens JW, Versnel H, Dejonckere PH. The effect of visible speech in the perceptual rating of pathological voices. Arch Otolaryngol Head Neck Surg. 2007;133(2):178-85.

Rev Soc Bras Fonoaudiol. 2010;15(3):335-42

S-ar putea să vă placă și