جبران تنوعات گوینده در شبکه های عصبی بازشناخت گفتار به روش تنظیم ورودی
محل انتشار: یازدهمین کنفرانس مهندسی پزشکی ایران
سال انتشار: 1382
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,159
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICBME11_021
تاریخ نمایه سازی: 27 تیر 1387
چکیده مقاله:
مسئله تنوعات گوینده، یکی از مهمترین عواملی است که بر کارآیی سیستم های بازشناخت گفتار اثر می گذارد. در این مقاله روشی پیشنهاد می شود که در آن با کمک تنظیم ورودی قسمتی از این تأثیر در شبکه های عصبی بازشناخت گفتار جبران می وشد. ابتدا در میان 71 گوینده آموزش، گوینده با بالاترین درصد صحت تشخیص آوا را به عنوان گوینده مرجع انتخاب می کنیم. سپس با استافده از الگوریتم پس انتشار خطا همه سیگنال گفتار مربوط به گویندگان آموزش و آزمون را طوری تنظیم می کنیم که بر گوینده مرجع منطبق شوند. مدل بازشناخت گفتار با دادگان آموزش تنظیم شده، تعلیم و با دادگان آزمون تنظیم شده، آزموده می شود. با اعمال این روش و تلفیق نتایج این شبکه با شبکه بدون تنظیم ورودی بر اساس بیشترین سطح اطمینان، 2/6% افزایش در صحت تشخیص آوا به دست می آید.
کلیدواژه ها:
بازشناخت گفتار - شبکه های عصبی - تنظیم ورودی - تنوعات گوینده
نویسندگان
ایثار نژادقلی
دانشجوی کارشناسی ارشد بیوالکتریک
سیدعلی سید صالحی
استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :