Bit Rate Reduction of FS-۱۰۱۵ Speech Coder Using Fuzzy ARTMAP and KSOFM Neural Networks

  • سال انتشار: 1388
  • محل انتشار: مجله مهندسی برق مجلسی، دوره: 3، شماره: 1
  • کد COI اختصاصی: JR_MJEE-3-1_003
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 114
دانلود فایل این مقاله

نویسندگان

Mansour Sheikhan

Davood Gharavian

Ali Eslamzadeh

چکیده

The speech spectrum is very sensitive to linear predictive coding (LPC) parameters, so small quantization errors may cause unstable synthesis filter. Line spectral pairs (LSPs) are more efficient representations than LPC parameters. On the other hand, artificial neural networks (ANNs) have been used successfully to improving the quality and also reduction the computational complexity of speech coders. This work proposes an efficient technique to reduce the bit rate of FS-۱۰۱۵ speech coder, while improving the performance. In this way, LSP parameters are used instead of the LPC parameters. In addition, neural vector quantizers based on Kohonen self-organizing feature map (KSOFM), with a modified-supervised training algorithm, and fuzzy ARTMAP are also employed to reduce the bit rate. By using the mentioned neural vector quantizer models, the quality of synthesized speech, in terms of mean opinion score (MOS), is improved ۰.۱۳ and ۰.۲۶, respectively. The execution time of proposed models, as compared to FS-۱۰۱۵ standard, is also reduced ۲۷% and ۴۳%, respectively.

کلیدواژه ها

Speech coder, en, Neural Networks, Vector quantization, Fuzzy ARTMAP

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.