Hybrid of neural networks and hidden Markov models as a modern approach to speech recognition systems
Abstract
Celem artykułu jest przedstawienie algorytmów hybrydowych łączących zalety sztucznych sieci neuronowych i ukrytych modeli Markowa w zastosowaniach rozpoznawania mowy dla potrzeb sterowania. W zakres opracowania wchodzi przegląd stosowanych obecnie rozwiązań, opis i analiza implementacji wybranych struktur sieci neuronowych (NN) oraz ukrytych modeli Markowa (HMM). Główną część artykułu stanowi opis opracowywania hybrydowego algorytmu rozpoznawania mowy wykorzystującego NN i HMM oraz prezentacja wyników weryfikacji poprawności działania.
Keywords
artificial neural network, control, hidden Markov models, MFCC, speech recognition
Hybrid of neural networks and hidden Markov models as a modern approach to speech recognition systems
Streszczenie
The aim of this paper is to present a hybrid algorithm that combines the advantages of artificial neural networks and hidden Markov models in speech recognition for control purposes. The scope of the paper includes review of currently used solutions, description and analysis of implementation of selected artificial neural network (NN) structures and hidden Markov models (HMM). The main part of the paper consists of a description of development and implementation of a hybrid algorithm of speech recognition using NN and HMM and presentation of verification of correctness results.
Słowa kluczowe
MFCC, sterowanie, sztuczne sieci neuronowe, ukryte modele Markowa
Bibliografia
- Tadeusiewicz R., Sygnał mowy, WKŁ, Warszawa 1988.
- Sokólski P., Sieci neuronowe i modele Markowa jako elementy hybrydowego algorytmu rozpoznawania mowy dla potrzeb zadań sterowania głosem, Politechnika Gdańska (Gdańsk University of Technology), Gdańsk 2012.
- Kohonen T., Learning vector quantization Neural Networks, Vol. 1, suppl. 1, 1988.
- Hagan, M.T., H.B. Demuth, and M.H. Beale, Neural Network Design, Boston, MA: PWS Publishing, 1996.
- Kwiatkowski W., Metody automatycznego rozpoznawania wzorców, WAT, Warszawa 2001.
- Tebelskis J., Speech Recognition using Neural Networks, Carnegie Mellon Univiersity, Pittsburg 1995.