Hybrid of neural networks and hidden Markov models as a modern approach to speech recognition systems

eng Artykuł w języku angielskim DOI:

Paweł Sokólski , wyślij Tomasz Rutkowski Department of Control Systems Engineering, Faculty of Electrical and Control Engineering, Gdańsk University of Technology, Poland

Pobierz Artykuł

Abstract

Celem artykułu jest przedstawienie algorytmów hybrydowych łączących zalety sztucznych sieci neuronowych i ukrytych modeli Markowa w zastosowaniach rozpoznawania mowy dla potrzeb sterowania. W zakres opracowania wchodzi przegląd stosowanych obecnie rozwiązań, opis i analiza implementacji wybranych struktur sieci neuronowych (NN) oraz ukrytych modeli Markowa (HMM). Główną część artykułu stanowi opis opracowywania hybrydowego algorytmu rozpoznawania mowy wykorzystującego NN i HMM oraz prezentacja wyników weryfikacji poprawności działania.

Keywords

artificial neural network, control, hidden Markov models, MFCC, speech recognition

Hybrid of neural networks and hidden Markov models as a modern approach to speech recognition systems

Streszczenie

The aim of this paper is to present a hybrid algorithm that combines the advantages of artificial neural networks and hidden Markov models in speech recognition for control purposes. The scope of the paper includes review of currently used solutions, description and analysis of implementation of selected artificial neural network (NN) structures and hidden Markov models (HMM). The main part of the paper consists of a description of development and implementation of a hybrid algorithm of speech recognition using NN and HMM and presentation of verification of correctness results.

Słowa kluczowe

MFCC, sterowanie, sztuczne sieci neuronowe, ukryte modele Markowa

Bibliografia

  1. Tadeusiewicz R., Sygnał mowy, WKŁ, Warszawa 1988.
  2. Sokólski P., Sieci neuronowe i modele Markowa jako elementy hybrydowego algorytmu rozpoznawania mowy dla potrzeb zadań sterowania głosem, Politechnika Gdańska (Gdańsk University of Technology), Gdańsk 2012.
  3. Kohonen T., Learning vector quantization Neural Networks, Vol. 1, suppl. 1, 1988.
  4. Hagan, M.T., H.B. Demuth, and M.H. Beale, Neural Network Design, Boston, MA: PWS Publishing, 1996.
  5. Kwiatkowski W., Metody automatycznego rozpoznawania wzorców, WAT, Warszawa 2001.
  6. Tebelskis J., Speech Recognition using Neural Networks, Carnegie Mellon Univiersity, Pittsburg 1995.