افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه
محل انتشار: پنجمین کنفرانس ملی مهندسی برق و الکترونیک ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 639
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEEE05_419
تاریخ نمایه سازی: 3 آذر 1392
چکیده مقاله:
دراین مقاله سعی شده است باافزودن اطلاعات فرکانس پایه ،کارایی سیستم تشخیص گوینده مستقل ازمتن مبتنی برشبکه عصبی پرسپترون چندلایه بهبود داده شود برای تشخیص دقیق نواحی واکدار/بی واک و استخراج فرکانس پایه روش جدیدی معرفی شده است که ازمایشات کارایی آن را درمقایسه با سایرروشهای متداول درنسبت های سینگال به نویز زیاد و متوسط نشان میدهند سیستم تشخیص گوینده اصلی مبتنی برویژگیهای mfcc است و اطلاعات فرکانس پایه ازجمله مقدارفرکانس درهرفریم میانگین مدین، حداقل وحداکثر فرکانس درهرجمله به بردارویژگی اضافه شده است نتایج نشان میدهند افزودن میانگین فرکانس پایه درهرجمله نرخ تشخیص گوینده را به طور میانگین 3درصد وافزودن مقدارفرکانس پایه به همراه میانگین آن نرخ بازشناسی فریم و نرخ تشخیص گوینده را بطور میانگین به ترتیب به میزان 13و4 درصد بهبودمیدهند
کلیدواژه ها:
نویسندگان
نونا حیدری اصفهانی
دانشگاه آزاد اسلامی واحد نجف آباد
حمید محمودیان
دانشگاه آزاد اسلامی واحد نجف آباد
غزال شیخی
دانشگاه صنعتی امیرکبیر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :