طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 410
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CMECE03_045
تاریخ نمایه سازی: 16 اسفند 1399
چکیده مقاله:
تکنولوژی پردازش سیگنالهای گفتاری، شیوهای جدید برای تشخیص پیامها و دستورهای صوتی و حاصل پژوهش جمعی از محققان در زمینه سیگنالهای صحبت است. جدا کردن دستورات گفتاری از سیگنال صحبت به هوشمندی نیازمند بوده و بسیار از تولید آن مشکل تر میباشد. از آنجایی که سیگنالهای صحبت به صورت عمومی آن بسیار پیچیده است، ساده سازی آن مفید به نظر میرسد. یادگیری عمیق شاخه ای از بحث یادگیری ماشینی و مجموعه ای از الگوریتم هایی است که تلاش میکند مفاهیم انتزاعی سطح بالا را با استفاده یادگیری در سطوح و لایه های مختلف مدل کنند. هدفش درک ماشینی است که دارای توانایی های شناختی مشابه به ذهینیت انسان است. هدف اصلی تحقیق حاضر طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی است. جهت رسیدن به هدف مذکور این پژوهش با طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی به کمک پایگاه داده ۳۰ speech_commands_v۰.۰۱.tar کلمه با محتوای صوتی با مضمون دستور گفتاری و غیر دستور گفتاری انجام شد. مدل شبکه عصبی پیچشی در ۵۵۰ تکرار در ۱۰ دوره به صورت آموزش یافته با دقت ۹۳,۲۴ درصد تشکیل شد. با برآورد مدل ماتریس در هم تنیدگی دقت و صحت هر کلمه محاسبه شد که نتایج نشان می دهد که مدل از دقت بالایی برخوردار است.
کلیدواژه ها:
نویسندگان
علی درجانی مروی
کارشناسی ارشد برق گرایش مکاترونیک، دانشگاه بین المللی امام رضا
مجتبی بهنام تقدسی
دکتری برق مکاترونیک، دانشگاه پلی تکنیک ایتالیا