شناسایی گوینده در شرایط نوفه ای با استفاده از ویژگی های فیلتربانک گاماتون و تبدیل کسینوسی گسسته و قطبی
محل انتشار: مجله علوم رایانشی، دوره: 5، شماره: 2
سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 118
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_CSJI-5-2_005
تاریخ نمایه سازی: 14 بهمن 1402
چکیده مقاله:
احراز هویت افراد بر مبنای صوت یکی از موارد مهم پژوهشی در دهه اخیر بوده است. این موضوع در حوزه هایی مانند ردیابی گویندگان، ورود امن گویندگان به دستگاه های مختلف و سایر سامانه های مربوط به پردازش گفتار، کاربرد فراوانی دارد. هدف از یک سیستم احراز هویت گوینده، تشخیص هویت افراد با استفاده از سیگنال صدای انسان می باشد. یکی از چالش های مهم موجود در حوزه احراز هویت گوینده، افزایش کارایی این سیستم در شرایط نوفه ای شدید می باشد. در این پژوهش با استفاده از فیلتربانک گاماتون و ارائه ویژگی جدیدی از تبدیل های کسینوسی گسسته و قطبی، روشی برای افزایش کارایی سیستم احراز هویت گوینده در شرایط نوفه ای شدید طراحی شده است. مقایسه نتایج روش پیشنهادی با روش های موجود نشان می دهد، روش پیشنهادی توانسته است با دقت بیشتری، هویت افراد را در شرایط نوفه ای مختلف شناسایی کند. روش پیشنهادی به صورت کمی در محیط نوفه سفید با نسبت سیگنال به نوفه ۲۰، ۱۰ و ۵ به ترتیب ۸۹، ۷۷ و ۶۱ درصد دقت و در محیط نوفه توامان خیابانی و سفید با نسبت سیگنال به اختلال ۲۰، ۱۰ و ۵ به ترتیب ۸۷، ۷۱ و ۵۱ درصد دقت داشته است. همچنین، دقت روش پیشنهادی در مقایسه با روش جدید ضرایب کپسترال فرکانس گاماتون بهبود یافته، به طور متوسط ۴درصد، افزایش یافته است.
کلیدواژه ها:
نویسندگان
فرنوش عارفی
کارشناس ارشد فناوری اطلاعات، پژوهشکدە فضای مجازی - دانشگاه شهید بهشتی - تهران - ایران
بهزاد سعیدی
کارشناس ارشد مهندسی برق، دانشکده مهندسی برق - دانشگاه شهید بهشتی - تهران - ایران