بکارگیری شبکه های عصبی به منظور بازتشخیص گفتار چند مجرا با استفاده از ترکیب داده های صوتی و موقعیت اعضاء تولید گفتار
محل انتشار: چهارمین کنفرانس مهندسی رسانه
سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,136
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IBBEC04_005
تاریخ نمایه سازی: 11 شهریور 1391
چکیده مقاله:
در این مقاله یک روش برای بهبود بازتشخیص گفتار در انسان با استفاده از داده های صوتی و موقعیت اعضاء تولید گفتار به صورت همزمان مورد مطالعه و بررسی قرار گرفته است . در این شیوه ابتدا هر دو دسته اطلاعات صوتی و موقعیت اعضاء تولید گفتار به یک مدل شبکه عصبی جلو سو زمانی جهت بازتشخیص داده می شود و نتایج حاصله رشد کیفیت بازتشخیص 13 % را نشان می دهد . در مدل دوم اطلاعات موقعیتی برای داده های آزمون از اطلاعات صوتی ، توسط یک مدل شبکه عصبی نگاشت معکوس تخمین زده می شود. نتیجه حاصل از این مدل %9 بهتر شدن کیفیت را در حالت جدید نشان می دهد و نتایج حاصل از این مدل با روش های دیگر به طور کلی مقایسه شده است.
کلیدواژه ها:
نویسندگان
محسن سبزی نژاد
کارشناسی ارشد الکترونیک، دانشگاه آزاد اسلامی واحد علوم و تحقیقات ،ت
حسین بهبود
کارشناسی ارشد مهندسی پزشکی - بیوالکتریک ، دانشگاه امیرکبیر ،تهران،ای
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :