واژه یابی گفتاری در زبان فارسی با استفاده از LSTM با منبع آموزشی کم

آزاده کرمی; فرید رزازی

واژه یابی گفتاری در زبان فارسی با استفاده از LSTM با منبع آموزشی کم

محل انتشار: سومین کنفرانس بین المللی بازشناسی الگو و تحلیل تصویر ایران

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,314

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/638504

شناسه ملی سند علمی:

IPRIA03_053

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

در این مقاله از شبکه ی عصبی LSTM به عنوان استخراجگر ویژگی برای واژه یابی گفتاری مستقل از گوینده در زمان فارسی با استفاده از رویکرد جستجو بر مبنای نمونه استفاده می کنیم. مدل ما از واحدهای مخفی 13 انکدر LSTM برای استخراج بردار ویژگی با طول ثابت از ضرایب MFCC گفتار با طول متغیر استفاده می کند. آموزش LSTM با استفاده از الگوریتم پس انتشار خطا با استفاده از حدود 20 دقیقه گفتار پیوسته ی فارسی انجام می گیرد. آموزش انجام شده بدون نظارت و بدون توجه به برچسب محتوای گفتار انجام شده است. نتایج آزمایش های انجام شده نشان می دهد که مدل معرفی شده با استفاده از داده ی آموزشی بسیار اندک به عملکرد بسیار خوبی برای یافتن کلمات کلیدی دلخواه دست می یابد.

کلیدواژه ها:

شبکه ی عصبی LSTM ، کلمه ی کلیدی ، واژه یابی گفتاری

نویسندگان

آزاده کرمی

دانشگاه آزاد اسلامی، واحد یادگار امام (ره)، تهران، ایران

فرید رزازی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران