استفاده از شبکه های عصبی بازگشتی به منظور مقاوم سازی بازشناسی گفتار آغشته به نویز

  • سال انتشار: 1384
  • محل انتشار: دوازدهمین کنفرانس مهندسی پزشکی ایران
  • کد COI اختصاصی: ICBME12_030
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1732
دانلود فایل این مقاله

نویسندگان

لوئیزا دهیادگاری

دانشجوی کارشناسی ارشد- دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی-

سیدعلی سیدصالحی

استادیار- دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی - تهران

چکیده

در این مقاله یک شبکه عصبی بازگشتی به منظور بازشناسی گفتار در سطح بازشناسی آوا طراحی و پیاده سازی شده است، که در شرایط مختلف نویز به دقت بازشناسی بالاتری نسبت به یک شبکه ساده که اتصالات بازگشتی در آن ملحوظ نشده است، دست پیدا می کند. در این مدل هدف مقاوم کردن سیستم بازشناس آوا نسبت به نویزهای ایستان و غیر ایستان می باشد. به این منظور سیگنال گفتار تمیز به شبکه تعلیم داده می شود و اتصالات بازگشتی به کاهش نویز در سیگنال گفتار نویزی و بازشناسی مقاوم تر کمک می کند. و به این ترتیب دقت بازشناسی افزایش پیدا می کند. استفاده از اتصالات بازگشتی در مدل در بهترین حالت و در نسبت سیگنال به نویز صفر دسی بل توانسته است دقت بازشناسی را برای نویز ایستان 20% و برای نویز غیر ایستان 10% بهبود دهد.

کلیدواژه ها

بازشناخت گفتار- شبکه های عصبی بازگشتی- مفاوم سازی- نویز ایستان- نویز غیر ایستان

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.