شناسایی گوینده در شرایط نوفه ای با استفاده از ویژگی های فیلتربانک گاماتون و تبدیل کسینوسی گسسته و قطبی
- سال انتشار: 1399
- محل انتشار: مجله علوم رایانشی، دوره: 5، شماره: 2
- کد COI اختصاصی: JR_CSJI-5-2_005
- زبان مقاله: فارسی
- تعداد مشاهده: 119
نویسندگان
کارشناس ارشد فناوری اطلاعات، پژوهشکدە فضای مجازی - دانشگاه شهید بهشتی - تهران - ایران
کارشناس ارشد مهندسی برق، دانشکده مهندسی برق - دانشگاه شهید بهشتی - تهران - ایران
چکیده
احراز هویت افراد بر مبنای صوت یکی از موارد مهم پژوهشی در دهه اخیر بوده است. این موضوع در حوزه هایی مانند ردیابی گویندگان، ورود امن گویندگان به دستگاه های مختلف و سایر سامانه های مربوط به پردازش گفتار، کاربرد فراوانی دارد. هدف از یک سیستم احراز هویت گوینده، تشخیص هویت افراد با استفاده از سیگنال صدای انسان می باشد. یکی از چالش های مهم موجود در حوزه احراز هویت گوینده، افزایش کارایی این سیستم در شرایط نوفه ای شدید می باشد. در این پژوهش با استفاده از فیلتربانک گاماتون و ارائه ویژگی جدیدی از تبدیل های کسینوسی گسسته و قطبی، روشی برای افزایش کارایی سیستم احراز هویت گوینده در شرایط نوفه ای شدید طراحی شده است. مقایسه نتایج روش پیشنهادی با روش های موجود نشان می دهد، روش پیشنهادی توانسته است با دقت بیشتری، هویت افراد را در شرایط نوفه ای مختلف شناسایی کند. روش پیشنهادی به صورت کمی در محیط نوفه سفید با نسبت سیگنال به نوفه ۲۰، ۱۰ و ۵ به ترتیب ۸۹، ۷۷ و ۶۱ درصد دقت و در محیط نوفه توامان خیابانی و سفید با نسبت سیگنال به اختلال ۲۰، ۱۰ و ۵ به ترتیب ۸۷، ۷۱ و ۵۱ درصد دقت داشته است. همچنین، دقت روش پیشنهادی در مقایسه با روش جدید ضرایب کپسترال فرکانس گاماتون بهبود یافته، به طور متوسط ۴درصد، افزایش یافته است.کلیدواژه ها
احراز هویت گوینده, شرایط نوفهای, فیلتربانک گاماتون, تبدیل کسینوسی گسسته و قطبیاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.