پردازش گفتار برای بازشناسایی چهار جهت فارسی بالا،پایین،چپ،راست با استفاده از روش ضرایب کپسترال درمقیاس مل MFCC و شبکه عصبی مصنوعی

  • سال انتشار: 1391
  • محل انتشار: اولین کنفرانس بازشناسی الگو و پردازش تصویر ایران
  • کد COI اختصاصی: IPRIA01_129
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1206
دانلود فایل این مقاله

نویسندگان

حسن فرسی

دانشگاه بیرجند، دانشکده مهندسی برق و کامپیوتر، بیرجند

پوریا اعتضادی فر

دانشگاه بیرجند، دانشکده مهندسی برق و کامپیوتر، بیرجند

چکیده

در این مقاله ابتدا پایگاه دادهای با استفاده از صدای 150 نفرتشکیل گردیده است. در مرحله بعد ابتدا عملیات پیش پردازش بر روی دادههای خام ورودی انجام میگیرد وپساز آن فرآینداستخراج ویژگی MFCCبر روی داده ها انجام میپذیرد. در مرحله بعد ویژگی های بدست آمده به شبکه عصبی مصنوعی آموزش داده میشوند و در قسمت پایانی میزان درستی بازشناسی نشان دادهمیشود و در انتها با روش ضرایب کپسترال آنالیز پیشبینی خطیLPCC)برای بازشناسی گفتار [ 2] مقایسه میگردد.

کلیدواژه ها

بازشناسی گفتار، ضرایب کپسترال در مقیاس ملMFCC) ، ضرایب کپسترال آنالیز پیشبینی خطیLPCC) ، شبکه عصبی مصنوعی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.