Sunteți pe pagina 1din 1

Interesul actual generat de retelele neuronale fuzzy este determinat in mare parte de speranta

ca aceste tehnologii, bazate pe modelul creierului uman, vor fi capabile sa rezolve categorii de
probleme aflate acum mult dincolo de capacitatile de rezolvare ale calculatoarelor din ziua de
azi [1] (functii extrem de complexe, din punct de vedere al posibilitatilor de calcul, pentru
calculatoarele numerice conventionale, cum sunt intelegerea vorbirii sau a stimulilor vizuali, sunt
mult mai eficient realizate de sistemele neurologice ale organismelor biologice).

Studiul retelelor neuronale a determinat aparitia unor categorii de arhitecturi de retele care sa
modeleze capabilitatile creierului uman.
Recunoasterea automata a vorbirii reprezinta un element important in sistemele de intelegere a
vorbirii, care tinde sa imbunatateasca usurinta cu care oamenii interactioneaza cu
calculatorul.Astfel, comunicatia cu calculatorul prin vorbire permite utilizatorilor accesarea de la
distanta a serviciilor furnizate de calculator chiar si prin linii telefonice standard.

Cerintele pentru aceste tehnologii sunt determinate in principal de ratiuni economice, dar si de
dezvoltarea de noi tehnologii in domeniul telefoniei.Astfel recunoasterea automata a vorbirii se
refera la utilizarea unor instrumente pentru a realiza identificarea unor elemente lingvistice
prezente in exprimarea limbajului uman.
Sistemele de recunoastere automata a vorbirii reprezinta primul pas in dezvoltarea unui sistem
care recunoaste cuvintele unei persoane, interpreteaza sensul si furnizeaza un raspuns
adecvat.

Actualmente atat din ratiuni economice, cat si financiare se doreste realizarea unor sisteme de
recunoastere automata a vorbirii capabile sa invete rapid noi seturi de esantioane vocale,
independent de vorbitor sau de limbaj. Ideal, esantioanele vocale trebuie memorate intr-o
maniera modulara astfel incat aceste submultimi de informatii sa poata fi combinate in pachete
adaptate fiecarei noi aplicatii, fara necesitatea unei reinstruiri pentru extinderea sistemului.

Procesul de recunoastere automata a vorbirii poate fi descris ca un proces in patru etape si
anume: inregistrarea esantioanelor vocale, prelucrarea semnalelor, extragerea caracteristicilor
si clasificarea exprimarilor.Prima etapa este cea a inregistrarii esantioanelor vocale, in care este
extreme de importanta receptia eficienta si conversia semnalului acustic provenit de la vorbitor
intr-un echivalent electronic care poate fi memorat pentru prelucrari ulterioare.

A doua etapa este etapa de prelucrare a semnalelor si consta in principal in analiza spectrala a
semnalului electronic pentru a obtine o reprezentare parametrizata care codifica informatia
spectrala.
Etapa a treia este etapa de extragere a caracteristicilor si se refera in principal la eliminarea
informatiilor nerelevante sau redundante din prezentarea parametrizata obtinuta in etapa a
doua.Se obtine astfel o compresie a datelor si o reducere a incarcarii pentru prelucrarile
ulterioare.

S-ar putea să vă placă și