شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN

طاهره, بهرامی; مهدی, کدیور

شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN

عنوان مقاله: شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN
شناسه ملی مقاله: CONFSKU02_020
منتشر شده در دومین کنفرانس ملی آخرین دستاوردهای مهندسی داده و دانش و محاسبات نرم در سال 1401

مشخصات نویسندگان مقاله:

طاهره بهرامی - دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد
مهدی کدیور - دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد

خلاصه مقاله:

یکی از مسایلی که در سالهای اخیر مورد توجه محققان قرار گرفته است، شناسایی گفتار هوشمند است. در این مساله سعی می شود تا کامپیوترها نیز همانند انسان ها، بتوانند گفتارهایی را که دریافت می کنند تشخیص داده و عکس العمل نشان دهند. شبکه های عصبی از اواسط دهه ۸۰ وارد قلمرو شناسایی گفتار شدند و امروزه نیز طراحی سیستم های شناسایی گفتار مبتنی بر شبکه های عصبی یکی از اهداف محققین در مراکز پژوهشی است. از میان ساختارهای عصبی که در زمینه های مختلف شناسایی گفتار استفاده شده اند، شبکه های عصبی کانولوشنال، کارایی بهتری نسبت به سایر ساختارهای عصبی از خود نشان داده اند. در این مقاله، سیستم شناسایی شبیه سازی شده مبتنی بر شبکه عصبی کانولوشنال دو بعدی جهت تشخیص واژه های فارسی ارائه می شود. نتایج شبیه سازی نشان می دهد که این سیستم روی گویش ۳۰ گوینده (نیمی مرد و نیمی زن) می تواند کلمات موجود در مجموعه اعتبارسنجی را با دقت ۷۰% به طور مستقل از گوینده تشخیص دهد.

کلمات کلیدی:

شناسایی گفتار، شبکه عصبی کانولوشنال، یادگیری عمیق

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1548370/