دسته بندی گویندگان بر مبنای قطعات یک ثانیه گفتارض

هادی, سمائی رهنی; جلیل, شیرازی; هادی, جوان

دسته بندی گویندگان بر مبنای قطعات یک ثانیه گفتارض

عنوان مقاله: دسته بندی گویندگان بر مبنای قطعات یک ثانیه گفتارض
شناسه ملی مقاله: ICEEE04_037
منتشر شده در چهارمین کنفرانس مهندسی برق و الکترونیک ایران در سال 1391

مشخصات نویسندگان مقاله:

هادی سمائی رهنی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق
جلیل شیرازی - استادیار دانشگاه آزاد اسلامی واحد گناباد، گروه برق
هادی جوان - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد- گروه برق

خلاصه مقاله:

در این مقاله یک روش برای شناسایی گوینده ناوابسته به متن ارائه شده است. تعداد 22 گوینده ) 12 گوینده مرد و 12 گوینده زن( از بانک اطلاعاتی TIMIT انتخاب شده و برای هر گوینده 12 جمله استفاده شده است. گفتار گویندگان به قابهای 22 میلی ثانیه تقسیم شده و برای هر قاب 13 ضریب MFCC به عنوان بردار ویژگی آن قاب محاسبه شده واز ماشین بردار پشتیبان SVM SVM برای دسته بندی گویندگان استفاده شده است. دسته بندی کننده های SVM را با بردارهای ویژگی قابها آموزش داده و برای دسته بندی گویندگان قابهای گفتار گوینده مجهول به SVM هااعمال می شوند. دسته بندی را از روی 122 قاب متوالی، معادل یک ثانیه، انجام شده است و خطای 1.8 درصد بدست آمده است.

کلمات کلیدی:

شناسایی گوینده،قاب، TIMIT,MFCC,SVM

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/164119/