ارایه روشی جهت بهبود کارایی سیستم های بازشناسی گویندگان بر اساس هم افزایی الگوریتم ژنتیک با دسته بند مدل مخلوط گوسی به منظور انتخاب ویژگی های موثر گفتار

  • سال انتشار: 1396
  • محل انتشار: پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی
  • کد COI اختصاصی: COMCONF05_568
  • زبان مقاله: فارسی
  • تعداد مشاهده: 408
دانلود فایل این مقاله

نویسندگان

هستی بهاری پور

دانشگاه آزاد اسلامی، واحد دزفول، گروه مهندسی کامپیوتر، دزفول، ایران

چکیده

یکی از روش های شناسایی گویندگان بر اساس ویژگی های گفتار است. معمولا0 تمام ویژگیهای گفتار انسان مفید و موثرنیستند. وجود ویژگیهای زیاد، تکراری و نامناسب باعث بالا رفتن هزینه مدلسازی و کاهش دقت در شناسایی گوینده میشود. هدف از انتخاب ویژگی، کاهش هزینههای محاسباتی و اقتصادی، حداقل کردن ابعاد فضای ویژگی و افزایش دقت دستهبند است. در این مقاله، ابتدا یک روش مبتنی بر همافزایی الگوریتم تکاملی ژنتیک با مدل مخلوط گوسی (GMM-GA) به منظور شناسایی هویت گویندگان مستقل از متن، بر اساس انتخاب ویژگی های مناسب گفتار ارایه شده است؛ سپس روش پیشنهادی بر روی دو گروه 40 و 60 نفری از گویندگان پایگاه داده فارسدات مورد آزمایش قرار گرفت؛ و روش پیشنهادی GMM-GA با روش شناسایی گویندگان مبتنی بر دستهبند مدل مخلوط گوسی مقایسه شد. نتایج آزمایشات دو گروه نشان دادند که در روش پیشنهادی، الگوریتم ژنتیک با انتخاب مناسب ویژگیهای گفتار گوینده، متوسط دقت شناسایی گویندگان مستقل از متن را نسبت به مدل مخلوط گوسی پایه به ترتیب 11/37% و%8/33 افزایش داد. همچنین تعداد ویژگیهای انتخابی در این روش به ترتیب 53/84% و 48/7% نسبت به مدل مخلوط گوسی پایه کاهش یافت.

کلیدواژه ها

شناسایی گوینده، مستقل از متن، مدل مخلوط گوسی، انتخاب ویژگی، الگوریتم ژنتیک

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.