روشی جدید برای استخراج ویژگی صحبت مبتنی بر استفاده از ویژگی طیفی دلتا و Invariant-integration

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس ملی فناوری های نوین در علوم مهندسی
  • کد COI اختصاصی: FANAVARI01_004
  • زبان مقاله: فارسی
  • تعداد مشاهده: 362
دانلود فایل این مقاله

نویسندگان

حسن فرسی

دانشکده مهندسی، دانشگاه آزاد واحد بیرجند

چکیده

در این مقاله یک الگوریتم استخراج ویژگی جدید مقاوم به نویز را پیشنهاد می دهیم. در این الگوریتم استخراج ویژگی از یک فیلتر غیرخطی و پوشش موقتی استفاده می کنیم و با بهره گیری از ویژگی دلتا- طیفی بجای ویژگی دلتا- کپسترال دقت بازشناسی صحبت را بطور مطلوبی افزایش می دهیم. تقریبا همه ی سیستم های ASR کنونی از ویژگی های کپسترال دلتا و دلتا-دلتا برای استخراج ویژگی صحبت استفاده می کنند. از جمله عواملی غیرمحیطی که باعث کاهش دقت بازشناسی می شود می توان به vocal-tract length اشاره کرد که منجر به عدم تطبیق میان داده ی training و testing می شود. برای کاهش تاثیرات VTL می توان از ایده ی IIF استفاده نمود. در این مقاله هدف، رسیدن به ویژگی های مقاومی است که علاوه بر اینکه در شرایط مختلف نویزی بهبودهایی را فراهم کند در مقابل تغییرات تاثیرات VTL نیز مقاوم باشد. نتایج نشان می دهد که دقت بازشناسی در مقایسه با MFCC و PLP در حضور انواع مختلفی از نویز و همچنین در دو سناریوی مختلف VTL بهبود یافته است.

کلیدواژه ها

بازشناسی صحبت، vocal-tract length، پوشش موقتی، فیلتر غیرخطی نامتقارن، ویژگی های کپسترال دلتا، Invariant-integration

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.