Comparison of Linear based Feature transformations to Improve Speech Recognition Performance

  • سال انتشار: 1390
  • محل انتشار: نوزدهمین کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE19_376
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 1229
دانلود فایل این مقاله

نویسندگان

Yasser Shekofteh

Biomedical Engineering Faculty, Amirkabir University of Technology

Farshad Almasganj

Biomedical Engineering Faculty, Amirkabir University of Technology

Mohammad Mohsen Goodarzi

چکیده

In automatic speech recognition system a diagonal GMM based CDHMM modeling is commonly used. So there is a need to use reasonable feature transformation to decorrelate input feature vectors to satisfy diagonal GMM assumption. In this paper, we introduce the utilization of the several supervised linear feature transformation in speech recognition tasks. Specially each of these methods has particular projection properties. We show that the proposed OLPP based feature transformation method with preserving local properties of feature vectors in the projected space has the best performance based on our experiment on Persian speech database FARSDAT. Also we has introduced a novel class labeling method to use the supervised feature transformation. Overall system, compared to the baseline features, achieved an error rate reduction of 22.2% on clean condition

کلیدواژه ها

linear transformation, feature extraction, speech recognition, LDA, HLDA, LPP, OLPP

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.