بازشناسی احساسات از روی گفتار با استفاده از ترکیب شبکه های عصبی ترنسفورمر و کانولوشنی
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 409
فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JIPET-13-52_006
تاریخ نمایه سازی: 4 دی 1400
چکیده مقاله:
بازشناسی احساسات از روی گفتار با توجه به کاربردهای متنوع آن امروزه مورد توجه بسیاری از محققان قرار گرفته است. با پیشرفت روش های آموزش شبکه های عصبی عمیق وگسترش استفاده از آن در کاربردهای مختلف، در این مقاله کاربرد شبکه های کانولوشنی و ترنسفورمر در یک ترکیب جدید در بازشناسی احساسات گفتاری مورد بررسی قرار گرفته که از لحاظ پیاده سازی نسبت به روش های موجود ساده تر بوده و عملکرد مطلوبی نیز دارد. برای این منظور شبکه های عصبی کانولوشنی و ترنسفورمر پایه معرفی شده و سپس مبتنی بر آنها یک مدل جدید حاصل از ترکیب شبکه های کانولوشنی و ترنسفورمر ارایه شده که در آن خروجی مدل کانولوشنی پایه ورودی مدل ترنسفورمر پایه است. نتایج حاصل نشان می دهد که استفاده از شبکه های عصبی ترنسفورمر در بازشناسی بعضی از حالت های احساسی عملکرد بهتری نسبت به روش کانولوشنی دارد. همچنین در این مقاله نشان داده شده که استفاده از شبکه های عصبی ساده بهصورت ترکیبی عملکرد بهتری در بازشناسی احساسات از روی گفتار می تواند داشته باشد. در این رابطه بازشناسی احساسات گفتاری با استفاده از ترکیب شبکه های عصبی کانولوشنی و ترنسفورمر با نام کانولوشنال-ترنسفورمر (CTF) برای دادگان راودس دقتی برابر ۹۴/۸۰ درصد بهدست آورد؛ در حالیکه یک شبکه عصبی کانولوشنی ساده دقتی در حدود ۷/۷۲ درصد بهدست آورد. همچنین ترکیب شبکه های عصبی ساده علاوه بر اینکه می تواند دقت بازشناسی را افزایش دهد، می تواند زمان آموزش و نیاز به نمونه های آموزشی برچسب دار را نیز کاهش دهد.
کلیدواژه ها:
نویسندگان
یوسف پورابراهیم
دانشکده مهندسی برق و کامپیوتر- واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
فربد رزازی
دانشکده مهندسی برق و کامپیوتر- واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
حسین صامتی
دانشکده مهندسی کامپیوتر- دانشگاه صنعتی شریف، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :