طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 410

فایل این مقاله در 17 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CMECE03_045

تاریخ نمایه سازی: 16 اسفند 1399

چکیده مقاله:

تکنولوژی پردازش سیگنالهای گفتاری، شیوهای جدید برای تشخیص پیامها و دستورهای صوتی و حاصل پژوهش جمعی از محققان در زمینه سیگنالهای صحبت است. جدا کردن دستورات گفتاری از سیگنال صحبت به هوشمندی نیازمند بوده و بسیار از تولید آن مشکل تر میباشد. از آنجایی که سیگنالهای صحبت به صورت عمومی آن بسیار پیچیده است، ساده سازی آن مفید به نظر میرسد. یادگیری عمیق شاخه ای از بحث یادگیری ماشینی و مجموعه ای از الگوریتم هایی است که تلاش میکند مفاهیم انتزاعی سطح بالا را با استفاده یادگیری در سطوح و لایه های مختلف مدل کنند. هدفش درک ماشینی است که دارای توانایی های شناختی مشابه به ذهینیت انسان است. هدف اصلی تحقیق حاضر طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی است. جهت رسیدن به هدف مذکور این پژوهش با طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی به کمک پایگاه داده ۳۰ speech_commands_v۰.۰۱.tar کلمه با محتوای صوتی با مضمون دستور گفتاری و غیر دستور گفتاری انجام شد. مدل شبکه عصبی پیچشی در ۵۵۰ تکرار در ۱۰ دوره به صورت آموزش یافته با دقت ۹۳,۲۴ درصد تشکیل شد. با برآورد مدل ماتریس در هم تنیدگی دقت و صحت هر کلمه محاسبه شد که نتایج نشان می دهد که مدل از دقت بالایی برخوردار است.

نویسندگان

علی درجانی مروی

کارشناسی ارشد برق گرایش مکاترونیک، دانشگاه بین المللی امام رضا

مجتبی بهنام تقدسی

دکتری برق مکاترونیک، دانشگاه پلی تکنیک ایتالیا