شناسایی گفتار واژه های فارسی، مستقل از گوینده با استفاده از شبکه عصبی CNN

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 219

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFSKU02_020

تاریخ نمایه سازی: 11 آبان 1401

چکیده مقاله:

یکی از مسایلی که در سالهای اخیر مورد توجه محققان قرار گرفته است، شناسایی گفتار هوشمند است. در این مساله سعی می شود تا کامپیوترها نیز همانند انسان ها، بتوانند گفتارهایی را که دریافت می کنند تشخیص داده و عکس العمل نشان دهند. شبکه های عصبی از اواسط دهه ۸۰ وارد قلمرو شناسایی گفتار شدند و امروزه نیز طراحی سیستم های شناسایی گفتار مبتنی بر شبکه های عصبی یکی از اهداف محققین در مراکز پژوهشی است. از میان ساختارهای عصبی که در زمینه های مختلف شناسایی گفتار استفاده شده اند، شبکه های عصبی کانولوشنال، کارایی بهتری نسبت به سایر ساختارهای عصبی از خود نشان داده اند. در این مقاله، سیستم شناسایی شبیه سازی شده مبتنی بر شبکه عصبی کانولوشنال دو بعدی جهت تشخیص واژه های فارسی ارائه می شود. نتایج شبیه سازی نشان می دهد که این سیستم روی گویش ۳۰ گوینده (نیمی مرد و نیمی زن) می تواند کلمات موجود در مجموعه اعتبارسنجی را با دقت ۷۰% به طور مستقل از گوینده تشخیص دهد.

نویسندگان

طاهره بهرامی

دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد

مهدی کدیور

دانشگاه شهرکرد، گروه علوم کامپیوتر، شهرکرد