ارائه الگوریتمی تعمیم یافته برای بازشناسایی گفتار توسط شبکه عصبی
محل انتشار: یازدهمین کنفرانس دانشجویی مهندسی برق ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,772
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCEE11_180
تاریخ نمایه سازی: 15 اسفند 1386
چکیده مقاله:
در این مقاله با توجه به معایب هر یک از تکنیک های موجود برای بازشناسایی صوت، روشی ترکیبی ارائه خواهد شد که می تواند با صحت بالا (98%) به طبقه بندی صوت های دریافتی در زمان حداقل دست یابد. در این روش بعد از جمع اوری پایگاه داده database) ابتدا سیگنال صوت پیش پردازش شده که این بخش شامل حذف نویز توسط آنالیز Mels Frequency Capestral بدست اوردن ویژگی های لازم با استفاده از ضرایب تبدیل موجک گسسته wavelet) می باشد. سپس این ویژگی ها به یک شبکه چند لایه پرسپترون برای طبقه بندی اعمال می شود. در نهایت پس از آموزش شبکه با استفاده از الگوریتم UTA ویژگی های موثر در طبقه بندی استخراج می شوند، کلیه مراحل توسط Labview کد شده که بعلت دارا بودن قابلیت پردازش موازی، تاثیر چشمگیری در سرعت یادگیری و تشخیص سیستم داشته است.
کلیدواژه ها:
نویسندگان
میثم محمدپور
واحد تحقیقات صدا و سیما
فرداد فرخی
هیات علمی دانشگاه آزاد اسلامی واحد تهران مرکزی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :