Documente Academic
Documente Profesional
Documente Cultură
Sunetul s-a integrat in viata noastra cotidiana incat rareori suntem constienti de toate
functiile sale.El ne ofera momente de distractie cand a ascultam o simfonie sau cantecul
pasarilor;ne permite sa comunicam cu familia si prietenii nostrii prin intermediul
vorbirii.Tot sunetul ne avertizeaza de apropierea unui automobil,ne atrge atentia atunci
cand suna telefonul sau bate cineva la usa sau cand suna sirena unui vapor.
I.Sunetele.
Din mediul ambiant omul vede doar 7 culori dar spectrul luminii este mult mai
complex.Urechea umana percepe sunetele cu frecventa situata intre 16-20000 vibratii/s
sau hertzi,in timp ce gama acoperita de un pian de la tonul cel mai grav pana la tonul cel
mai ridicat este de la 27,5Hz-4186Hz.Sunetul se propaga sub forma de unde elastice
numai in substante(gaze lichide si solide) dar nu se propaga in vid.El se propaga cu
331m/s in aer.Caracteristicile lui sunt:
II.Infrasunetele.
Infrasunetele sunt oscilatii sonore de frecvente foarte joase,situate sub 16Hz,deci urechea
umana nu le aude.Fiintele marine,cum ar fi pestii,meduzele aud infrasunetele si simt
aparitia furtunilor si uraganelor care coboara si sub frecventa de 16Hz.Oamenii nu
sesizeaza in mod direct prezenta infrasunetelor dar unele modificari ale starilor fizico-
pshice confirma ca si organismele umane sunt totusi influentate.O recenta ipoteza lansata
de savanti incearca sa dea o explicatie absolut stiintifica unor "misterioase" accidente si
catastrofe.De-a lungul timpului au fost gasite pe diferite mari nave abandonate sau avand
la bordul lor cadavre ale caror fete purtau expresia durerii si a groazei.Conform ipotezei
amintite in timpul furtunilor sunt emise infrasunete care se propaga cu viteza
sunetului,ajungand la mari departari cu mult inaintea furtunii propriu-zise,astfel incat in
ciuda vremii bune se pot resimtii efectele lor.Masuratorile efectuate arata ca infrasunetele
provocate de furtuni pe mari si oceane au o frecventa medie de 6Hz.S-a constatat ca
infrasunetele de intensitati mari,la frecventa de 7Hz pot traumatiza grav sistemul
nervos,sistemul circulator,provocand chiar moartea.Astfel s-ar putea gasi o explicatie
pentru catastrofele misterioase care au avut loc pe diferite mari si oceane.
III.Ultrasunetele.
Ultrasunetele sunt utilizate la distrugerea unor bacterii sau virusuri ale unor boli
contagioase cum sunt bacilul tuberculozei,virusul gripei,insa ultrasunetele au si multe
efecte nocive asupra omului atunci cand acesta se afla in imediata apropiere a
sursei.Dr.Williams,cercetator la Departamentul de Biofizica al Universitatii
Manchester(M.B.)facand experiente pe animale apoi pe oameni,considera ca terapia cu
ultrasunete poate dezintegra globulele rosii din sange si afecteaza chiar globulele albe.In
cazul folosirii ultrasunetelor pentru stabilirea unui diagnostic intensitatea lor este mult
mai redusa dar totusi reclama prudenta.
Zgomotul poate fi definit ca vibratii sonore fara caracter periodic care se propaga prin
diverse medii(aer,apa,etc.) si care impresioneaza negativ urechea omeneasca.
Dupa -Larousse - zgomotul constitue un asmblu de sunete fara armonie.Fizicienii
definesc zgomotul ca o suprapunere dezordonata cu frecvente si intensitati diferite, iar
fiziologii considera zgomotul ,orice sunet suparator care produce o senzatie dezagreabila.
Caracteristicile fizice sau obiective ale zgomotului privesc taria sau intensitatea,durata si
frecventa.
Intensitatea este caracterul cel mai important care depinde de trasaturile sursei,de
distanta si posibilitatile de transmitere sau multiplicare.Ea se masoara in decibeli sau
foni.Decibelul(d.B.)este o marime fizica si reprezinta unitatea logaritmica calculata
pornind de la pragul absolut de audibilitate 0 d.B. pentru un sunet de 1000Hz.Fonul este
unitatea de masura fiziologica de perceptie de catre urechea umana a celei mai slabe
excitatii sonore.S-a admis ca cifra 80 pe scara de decibeli sau pe scara de foni reprezinta
pragul la care intensitatea sunetului devine nociva.
2)Traumatismul sonor produs brusc de zgomotul puternic chiar pentru un timp foarte
scurt poate cauza ruptura timpanului.Astfel de situatii se intampla in cazul unor
explozii,impuscaturi,eruptii intense de gaze din recimpiente sub presiune.Dupa
vindecarea leziunii poate persista surditatea pentru sunete cu frecvente de peste 9000Hz.
3)Surditatea profesionala se datoreaza efectuarii anumitor activitati expuse in mod
deosebit la zgomot.Surditatea datorata zgomotelor se caracterizeaza printr-o pierdere
definitiva si ireversibila a auditiei.
b)industria
c)constructiile si montajele
d)comertul
Bibliografie
Din punct de vedere fiziologic, sunetul constituie senzația produsă asupra organului
auditiv de către vibrațiile materiale ale corpurilor și transmise pe calea undelor acustice.
Urechea umană este sensibilă la vibrații ale aerului cu frecvențe între 20 Hz și 20 kHz, cu
un maxim de sensibilitate auditivă în jur de 3500 Hz. Acest interval depinde mult de
amplitudinea vibrației și de vârsta și starea de sănătate a individului. Sub amplitudinea de
20 μPa vibrațiile nu mai pot fi percepute. Odată cu vârsta intervalul de sensibilitate se
micșorează, în special frecvențele înalte devin inaudibile.
Din punct de vedere fizic, sunetul are o definiție mai largă, el nefiind legat de senzația
auditivă: orice perturbație (energie mecanică) propagată printr-un mediu material sub
forma unei unde se numește sunet. În această definiție se includ și vibrații la frecvențe
din afara domeniului de sensibilitate al urechii: infrasunete (sub 20 Hz) și ultrasunete
(peste 20 kHz).
Un caz particular de sunet este zgomotul, care se remarcă prin lipsa obiectivă sau
subiectivă a unei încărcături informaționale. Zgomotul deranjează fie prin senzația
neplăcută pe care o produce, fie prin efectul negativ asupra transmiterii de informație.
Orice zgomot poate fi perceput ca sunet util dacă i se atribuie o valoare informațională.
Din punct de vedere muzical (sau estetic), sunetul este o entitate caracterizată de patru
atribute: înălțime, durată, intensitate și timbru. Înălțimii îi corespunde frecvența
(măsurată în Hz). Intensității îi corespunde nivelul de intensitate sonoră (măsurat în dB).
Exemple:
Viteza sunetului
De la Wikipedia, enciclopedia liberă
Salt la: Navigare, căutare
Viteza sunetului este unul dintre parametrii care descriu propagarea sunetului printr-un
mediu. Această viteză depinde de proprietățile mediului de propagare, în particular de
elasticitatea și densitatea acestuia.
4 Note
[modifică] În gaze
În aer și alte gaze viteza sunetului depinde în primul rînd de temperatură. De exemplu la
0°C viteza sunetului este de 331,5 m/s, iar la 20°C aproximativ 343,4 m/s. Presiunea are
un efect mic, iar umiditatea nu are aproape nici un efect asupra vitezei. Pentru aer,
formula aproximativă de mai jos permite calculul vitezei de propagare a sunetelor în
funcție de temperatură, pentru un domeniu de temperaturi în jur de 0°C:
unde t este temperatura aerului exprimată în grade Celsius. Această formulă este
aproximația liniară (primii doi termeni din seria Taylor) a funcției:
Mach (pronunție /mah/, după numele fizicianului austriac Ernst Mach) este o unitate de
măsură folosită în aerodinamică pentru a exprima viteza unui corp care se deplasează
într-un fluid: proiectil, avion, rachetă etc. Viteza Mach 1 este egală cu viteza sunetului în
fluidul respectiv; în condiții standard Mach 1 este egal cu 1224 km/h (sau 340 m/s).
Numărul lui Mach este o mărime adimensională care arată de cîte ori este mai mare
viteza unui mobil decît viteza sunetului în acel mediu. Valorile subunitare ale numărului
lui Mach înseamnă viteze subsonice (mai mici decît viteza sunetului), iar valorile
supraunitare înseamnă viteze supersonice. O clasificare mai detaliată definește în plus
vitezele transsonice (între Mach 0,8 și Mach 1,2) și vitezele hipersonice (mai mari de
Mach 5).
[modifică] În lichide
Viteza sunetului în lichide este mai mare decît în gaze, pentru că deși densitatea este mai
mare (ceea ce ar însemna o inerție mai mare deci o viteză inferioară), compresibilitatea
lichidelor este mult mai mică decît a gazelor, ceea ce face ca o perturbație a presiunii
într-un punct să se propage rapid la punctele vecine. Astfel, în aer viteza sunetului este de
330-350 m/s, iar în apă este de aproximativ 1500 m/s.
Cunoașterea precisă a vitezei sunetului în apă este importantă într-o serie de domenii
precum cartografierea acustică a fundului oceanic, aplicații ale sonarului subacvatic,
comunicații etc. Viteza sunetului în apă depinde de o serie de parametri:
c(t,s,z) = a1 + a2t + a3t2 + a4t3 + a5(s - 35) + a6z + a7z2 + a8t(s - 35) + a9tz3,
unde t este temperatura în grade Celsius, s este salinitatea în părți la mie, iar z este
adîncimea în metri. Cei nouă coeficienți a1, a2, ..., a9 sînt:
[modifică] În solide
Într-o bară a cărei secțiune este mult mai mică decît lungimea de undă a sunetului viteza
de propagare depinde de modulul lui Young și de densitatea solidului:
De exemplu, într-o bară de oțel viteza sunetului este de aproximativ 5100 m/s.
Viteza de propagare a sunetului calculată astfel este mai mare. De exemplu oțelul are un
coeficient Poisson de aproximativ 0,3, ceea ce face ca viteza sunetului într-un bloc de
oțel să fie de aproximativ 5900 m/s.
Recunoaştere vocală în sisteme distribuite
De la Vasile Alaiba - MediaWiki
Salt la: navigare, căutare
Cuprins
[ascunde]
1 Introducere
2 Tipuri de recunoaştere vocală
3 Arhitectura
o 3.1 Arhitectura unui sistem de recunoaştere vocală
o 3.2 Arhitectura unui sistem distribuit de recunoaştere vocală
4 Algoritmi
o 4.1 Dynamic Time Warping
o 4.2 HMM (Hidden Markov Models/Modele Markov Ascunse)
4.2.1 Generalităţi
4.2.2 Algoritmi bazaţi pe HMM
5 Aplicaţii care folosesc recunoaşterea vocală
6 Bibliografie
Introducere
Recunoaşterea vocală în informatică poate fi descrisă ca o modalitate de introducere a
datelor în calculator prin identificarea cuvintelor vorbite.
De-a lungul timpului au fost folosite diverse dispozitive de introducere a datelor, precum
tastatura, mouse-ul, joystick-ul, tabletele digitale. Recunoaşterea vocală este un alt
asemenea dispozitiv. Acest mod de introducere a datelor nu va putea probabil să
înlocuiască în totalitate mouse-ul sau tastatura, pentru că unii utilizatori vor alege pe
acestea din urmă pentru anumite activităţi, iar pentru realizarea altor activităţi va fi mai
eficient să se foloseasca recunoaşterea vocală.
În mod obişnuit, recunoaşterea vocală este folosită pentru a eficientiza utilizarea unor
aplicaţii, sau pentru a accesa anumite functionalităţi mai rapid decât cu ajutorul celorlalte
dispozitive de intrare.
Aplicaţiile care pot beneficia de pe urma folosirii recunoaşterii vocale sunt cele în care
utilizatorul este nevoit să foloseasca cât mai putin mâinile: dispozitivele fără-mâini, în
care ecranul nu este vizibil. Condusul unei maşini este un exemplu tipic: şoferul poate fi
atent la drum şi în acelasi timp să schimbe postul de radio, să iniţieze o convorbire
telefonică sau să regleze aerul condiţionat.
cuvinte conectate – sistemele de acest fel sunt asemanatoare celor care folosesc
cuvinte izolate, cu diferenţa că pot procesa mai multe fraze, cu o pauză minimă
între ele.
Arhitectura
Arhitectura unui sistem de recunoaştere vocală
Algoritmi
Dynamic Time Warping
Algoritmul DTW este unul din cei mai vechi si cei mai importanţi algoritmi folosiţi în
recunoaşterea vocală.
Cea mai simplă metodă de a recunoaşte un cuvânt izolat este să fie comparat cu un număr
de şabloane predefinite şi de a determina şablonul cu care se potriveşte mai bine. Această
metodă este complicată de un număr de factori:
în primul rând, diferite versiuni ale aceluiaşi cuvânt pot avea dimensiuni diferite,
din punctul de vedere al semnalului audio. Această problemă poate fi rezolvată
normalizând şabloanele şi datele audio ale cuvântului care trebuie procesat, astfel
încât ambele să aibă aceeaşi durată.
o altă problemă poate fi faptul că rata vorbirii poate să nu fie constantă pe toată
lungimea semnalului audio (alinierea dintre şablon şi informaţia vocală poate sa
fie neliniară).
DTW face parte din clasa algoritmilor care aparţin programării dinamice. Complexitatea
timp şi spaţiu a algoritmului este liniară, fiind influenţată de durata semnalului audio şi de
mărimea vocabularului. Algoritmul realizează o singură trecere printr-o matrice de
scoruri asociate frame-urilor (pe linii conţine frame-urile din şabloanele predefinite, iar
pe coloane conţine frame-urile semnalului audio) calculând segmentele locale optimizate
ale alinierii.
Descriere:
O aliniere optimă este calculată pentru fiecare şablon, şi cea cu scorul cumulat minim
este considerată cea mai bună alegere pentru semnalul audio respectiv.
Există multe variante ale algoritmului DTW, cea mai importantă fiind algoritmul One
Stage DTW, care este folosit pentru recunoaşterea vorbirii continue. Acest algoritm
găseşte alinerea optimă dintre semnalul audio şi cea mai bună secvenţă de şabloane.
Complexitatea pentru acest algoritm rămâne liniară depinzând de lungimea semnalului
audio şi în mărimea vocabularului.
Generalităţi
Un model Markov ascuns este reprezentat de o colecţie de stări conectate prin tranziţii
(Figura 5). Începe într-o stare iniţială precizată in prealabil, apoi la fiecare pas temporal
se activează o tranziţie care duce într-o stare nouă , unde se va genera un simbol de ieşire.
Alegerea tranziţiilor şi a simbolurilor de ieşire sunt aleatoare, fiind controlate de
distribuţia unor probabilităţi care depind de modelul acustic. Modelele Markov ascunse
pot fi comparate cu o cutie neagră, unde este vizibilă doar secvenţa de simboluri de ieşire
generate pe o anumită durată de timp, dar secvenţa stărilor prin care se trece în acea
perioada de timp este ascunsă (de unde şi denumirea de modele Markov ascunse).
Toţi aceşti algoritmi sunt derivaţi din DTW şi calculează secvenţa de stări cu
probabilitatea cea mai mare, având ca date de intrare un set de probabilităţi.
Aplicaţii care folosesc recunoaşterea vocală
În principiu, orice aplicaţie care necesită interacţiune cu utilizatorul uman poate beneficia
de o interfaţă de control vocală. Totuşi, aplicaţiile de recunoaştere vocală au o
aplicabilitate marită în următoarele domenii:
Aplicaţii:
Xvoice este o aplicaţie de recunoaştere pentru dictare (vorbire continuă) care poate fi
folosită cu diverse aplicaţii Xwindow. Pentru a fi folosită necesită instalarea în prealabil a
motorului de recunoaştere ViaVoice, creat de IBM, si configurarea acestuia din urmă.
CMU Sphinx este dezvoltat de CMU (Carnegie Mellon University), iniţial a fost closed
source, dar a devenit open source. Acesta este un program destul de avansat, conţinând
multe unelte (modele acustice, modele de limbaj, compilatoare de gramatici) şi opţiuni de
configurare, fiind destinat în principal utilizatorilor avansaţi si programatorilor.
Microfonul este un aparat care transformă sunetul în semnale electrice. Acesta are multe
aplicații, fiind folosit îndeosebi în radioteleviziune și în telecomunicații.