CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازشناسی احساسات از روی گفتار با استفاده از ترکیب شبکه های عصبی ترنسفورمر و کانولوشنی

عنوان مقاله: بازشناسی احساسات از روی گفتار با استفاده از ترکیب شبکه های عصبی ترنسفورمر و کانولوشنی
شناسه ملی مقاله: JR_JIPET-13-52_006
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

یوسف پورابراهیم - دانشکده مهندسی برق و کامپیوتر- واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
فربد رزازی - دانشکده مهندسی برق و کامپیوتر- واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
حسین صامتی - دانشکده مهندسی کامپیوتر- دانشگاه صنعتی شریف، تهران، ایران

خلاصه مقاله:
بازشناسی احساسات از روی گفتار با توجه به کاربردهای متنوع آن امروزه مورد توجه بسیاری از محققان قرار گرفته است. با پیشرفت روش های آموزش شبکه های عصبی عمیق وگسترش استفاده از آن در کاربردهای مختلف، در این مقاله کاربرد شبکه های کانولوشنی و ترنسفورمر در یک ترکیب جدید در بازشناسی احساسات گفتاری مورد بررسی قرار گرفته که از لحاظ پیاده سازی نسبت به روش های موجود ساده تر بوده و عملکرد مطلوبی نیز دارد. برای این منظور شبکه های عصبی کانولوشنی و ترنسفورمر پایه معرفی شده و سپس مبتنی بر آنها یک مدل جدید حاصل از ترکیب شبکه های کانولوشنی و ترنسفورمر ارایه شده که در آن خروجی مدل کانولوشنی پایه ورودی مدل ترنسفورمر پایه است. نتایج حاصل نشان می دهد که استفاده از شبکه های عصبی ترنسفورمر در بازشناسی بعضی از حالت های احساسی عملکرد بهتری نسبت به روش کانولوشنی دارد. همچنین در این مقاله نشان داده شده که استفاده از شبکه های عصبی ساده به­صورت ترکیبی عملکرد بهتری در بازشناسی احساسات از روی گفتار می تواند داشته باشد. در این رابطه بازشناسی احساسات گفتاری با استفاده از ترکیب شبکه های عصبی کانولوشنی و ترنسفورمر با نام کانولوشنال-ترنسفورمر (CTF) برای دادگان راودس دقتی برابر ۹۴/۸۰ درصد به­دست آورد؛ در حالی­که یک شبکه عصبی کانولوشنی ساده دقتی در حدود ۷/۷۲ درصد به­دست آورد. همچنین ترکیب شبکه های عصبی ساده علاوه بر اینکه می تواند دقت بازشناسی را افزایش دهد، می تواند زمان آموزش و نیاز به نمونه های آموزشی برچسب دار را نیز کاهش دهد.

کلمات کلیدی:
بازشناسی احساسات, پردازش سیگنال گفتار, شبکه های عصبی عمیق, طبقه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1358728/