دسته بندی گویندگان بر مبنای قطعات یک ثانیه گفتارض

  • سال انتشار: 1391
  • محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران
  • کد COI اختصاصی: ICEEE04_037
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1031
دانلود فایل این مقاله

نویسندگان

هادی سمائی رهنی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق

جلیل شیرازی

استادیار دانشگاه آزاد اسلامی واحد گناباد، گروه برق

هادی جوان

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد- گروه برق

چکیده

در این مقاله یک روش برای شناسایی گوینده ناوابسته به متن ارائه شده است. تعداد 22 گوینده ) 12 گوینده مرد و 12 گوینده زن( از بانک اطلاعاتی TIMIT انتخاب شده و برای هر گوینده 12 جمله استفاده شده است. گفتار گویندگان به قابهای 22 میلی ثانیه تقسیم شده و برای هر قاب 13 ضریب MFCC به عنوان بردار ویژگی آن قاب محاسبه شده واز ماشین بردار پشتیبان SVM SVM برای دسته بندی گویندگان استفاده شده است. دسته بندی کننده های SVM را با بردارهای ویژگی قابها آموزش داده و برای دسته بندی گویندگان قابهای گفتار گوینده مجهول به SVM هااعمال می شوند. دسته بندی را از روی 122 قاب متوالی، معادل یک ثانیه، انجام شده است و خطای 1.8 درصد بدست آمده است.

کلیدواژه ها

شناسایی گوینده،قاب، TIMIT,MFCC,SVM

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.