شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN

طاهره بهرامی; مهدی کدیور

شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN

محل انتشار: دومین کنفرانس ملی آخرین دستاوردهای مهندسی داده و دانش و محاسبات نرم

سال انتشار: 1401

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 415

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1548370

شناسه ملی سند علمی:

CONFSKU02_020

تاریخ نمایه سازی: 11 آبان 1401

چکیده مقاله:

یکی از مسایلی که در سالهای اخیر مورد توجه محققان قرار گرفته است، شناسایی گفتار هوشمند است. در این مساله سعی می شود تا کامپیوترها نیز همانند انسان ها، بتوانند گفتارهایی را که دریافت می کنند تشخیص داده و عکس العمل نشان دهند. شبکه های عصبی از اواسط دهه ۸۰ وارد قلمرو شناسایی گفتار شدند و امروزه نیز طراحی سیستم های شناسایی گفتار مبتنی بر شبکه های عصبی یکی از اهداف محققین در مراکز پژوهشی است. از میان ساختارهای عصبی که در زمینه های مختلف شناسایی گفتار استفاده شده اند، شبکه های عصبی کانولوشنال، کارایی بهتری نسبت به سایر ساختارهای عصبی از خود نشان داده اند. در این مقاله، سیستم شناسایی شبیه سازی شده مبتنی بر شبکه عصبی کانولوشنال دو بعدی جهت تشخیص واژه های فارسی ارائه می شود. نتایج شبیه سازی نشان می دهد که این سیستم روی گویش ۳۰ گوینده (نیمی مرد و نیمی زن) می تواند کلمات موجود در مجموعه اعتبارسنجی را با دقت ۷۰% به طور مستقل از گوینده تشخیص دهد.

کلیدواژه ها:

شناسایی گفتار ، شبکه عصبی کانولوشنال ، یادگیری عمیق

نویسندگان

طاهره بهرامی

دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد

مهدی کدیور

دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد