تشخیص جنسیت صدا با استفاده از آموزش فراگیر

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 995

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ARGCONF03_014

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

در این مقاله، روشی برای استخراج ویژگی از سیگنال گفتار، ارایه شده است. ایده کلیی روش آن است کی ساختار و چینش فیلترها در بانک فیلتر استخراج کننده ویژگی، متغیر و انعطاف پذیر باشد؛ درحالی که الگوریتم های معمول استخراج ویژگی مانند ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) ، ساختاری ثابت دارند. در روش پیشنهادی، ابتدا، پهنای باند فرکانسی به قسمتهای مساوی تقسیم میشود. سپس با تشکیل یک معادله دیوفانیتن و درنظر گرفتن شرایط محدودکننده مناسب و در نهایت با حل این معادله، چین بهینه بانک فیلتر برمبنای داده های آموزشی دردسترس، به دست می آید . این امر موجب میشود که با تغییر داده های آموزشی، ساختار بانک فیلتر نیز تغییر کند و متناسب با کاربرد موردنظر، تنظیم گردد. نتایج پیاده سازی روی پایگاه داده TIMIT ، بییانگر بهبود کارایی الگوریتم پیشنهادی نسبت به روش ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) میباشد.در این جا جداسازی به صورت باناظر است به این صورت که شامل دو مرحله آموزش و تست است. ابتدا در مرحله آموزش ویژگی ضرایب کپسترال مبتنی بر فرکانس مل از گفتار استخراج میشود و لیبلش نیز (جنس گوینده ) در دسترس است و دسته بندی کننده پرسپترون با آن آموزش می بیند و در مرحله تست از گفتار جدید ویژگی ضرایب کپسترال مبتنی بر فرکانس مل را استخراج میکنیم و این ویژگی ها را به دسته بندی کننده آموزش داده شده می دهیم و دسته بندی کننده لیبل ها رو یعنی جنس گوینده را به ما میدهد.

کلیدواژه ها:

تعیین زن یا مرد بودن ، شبکه های عصبی ، ضرایب کپسترال

نویسندگان

محمد نعمتی

دانشجو، دانشکده مهندسی برق، دانشگاه پیام نور مرکز مشهد

حامد امین زاده

عضو هییت علمی، دانشکده مهندسی برق، دانشگاه پیام نور، تهران، ایران