جبران تنوعات گوینده در شبکه های عصبی بازشناخت گفتار به روش تنظیم ورودی
- سال انتشار: 1382
- محل انتشار: یازدهمین کنفرانس مهندسی پزشکی ایران
- کد COI اختصاصی: ICBME11_021
- زبان مقاله: فارسی
- تعداد مشاهده: 1182
نویسندگان
دانشجوی کارشناسی ارشد بیوالکتریک
استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر
چکیده
مسئله تنوعات گوینده، یکی از مهمترین عواملی است که بر کارآیی سیستم های بازشناخت گفتار اثر می گذارد. در این مقاله روشی پیشنهاد می شود که در آن با کمک تنظیم ورودی قسمتی از این تأثیر در شبکه های عصبی بازشناخت گفتار جبران می وشد. ابتدا در میان 71 گوینده آموزش، گوینده با بالاترین درصد صحت تشخیص آوا را به عنوان گوینده مرجع انتخاب می کنیم. سپس با استافده از الگوریتم پس انتشار خطا همه سیگنال گفتار مربوط به گویندگان آموزش و آزمون را طوری تنظیم می کنیم که بر گوینده مرجع منطبق شوند. مدل بازشناخت گفتار با دادگان آموزش تنظیم شده، تعلیم و با دادگان آزمون تنظیم شده، آزموده می شود. با اعمال این روش و تلفیق نتایج این شبکه با شبکه بدون تنظیم ورودی بر اساس بیشترین سطح اطمینان، 2/6% افزایش در صحت تشخیص آوا به دست می آید.کلیدواژه ها
بازشناخت گفتار - شبکه های عصبی - تنظیم ورودی - تنوعات گویندهمقالات مرتبط جدید
- تاثیر نوروفیدبک بر آموزش کودکان مبتلا به ADHD و اختلالات خواندن: یک بررسی سیستماتیک
- بررسی نقش سیستم های پیشرانش جت و بهبود کارایی انتقال حرارت در انجین های فضاپیما
- مروری بر کاربرد داده کاوی در کشف دانش پنهان
- تجزیه و تحلیل ترمودینامیکی استفاده از یک چرخه دی اکسید کربن فوق بحرانی با اینترکولر، گرم کردن مجدد و احیاکننده برای بازیابی گرمای اتلافی یک توربین گازی
- کاربرد IOT در مهندس پزشکی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.