تطبیق به گوینده سیستم بازشناسی گفتارفارسی با استفاده ازتجزیه چندبعدی مدلهای گوینده آموزشی

  • سال انتشار: 1392
  • محل انتشار: بیست و یکمین کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE21_004
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1346
دانلود فایل این مقاله

نویسندگان

حسن قلی پور

دانشجوی کارشناسی ارشد

فرشاد الماس گنج

دانشیاردانشگاه صنعتی امیرکبیر

چکیده

هدف ازتطبیق به گوینده درسیستمهای مستقل ازگوینده شیفت دادن و نزدیک کردن مدل صوتی مستقل ازگوینده به مدل وابسته به گوینده جدید جهت افزایش کارایی سیستم بازشناخت گفتاراتوماتیک می باشددراین گزارش یک روش جدید تطبیق به گوینده براساس تجزیه و تحلیل چندبعدی گوینده اموزشی با استفاده ازتجزیه تاکر ارایه میشود تجزیه تاکر مدلهای اموزشی میتواند مجموعه داده ها را بهزیرفضای حالت بعدبردار میانگین و گوینده تجزیه کند با استفاده ازپایه های حاصله اززیرفضای حالت یک فرمول تطبیق به گوینده استخراج میشود که درآن ماتریس بردارهای پایه درفضای سطروستون وزن دهی میشوند روش ارایه شده میتواند تکنیک صدای ویژه را به عنوان زیرمجموعه شامل شود روش پیشنهادی برای داده تطبیقی بیشتر ازحدود 16ثانیه عملکرد بهتری نسبت به روش صدایویژه دارد و تا حدود داده تطبیقی 22 ثانیه عملکرد بهترین سبت به MLLR دارد همچنین درصد بازشناسی واج مدل مستقل ازگوینده را حدود 6درصدافزایش داده است

کلیدواژه ها

تانسور،تطبیق به گوینده، تجزیه تاکر، تشخیص گفتار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.