ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگی های ضرایب کپسترال نرمالیزه شده توان بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 418

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_ADST-9-4_006

تاریخ نمایه سازی: 8 مهر 1398

چکیده مقاله:

در این مقاله، یک الگوریتم استخراج ویژگی مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی- فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان(PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می­گردد. به طور معمول عملکرد مدل­های صوتی که توسط داده­های بدون نویز(تمیز) آموزش داده می­شوند، وقتی در شرایط نویزی مورد آزمایش قرار می­گیرند به طور فزاینده­ای کاهش می­یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توان مبتنی بر فیلتر کاکلی (CFPNCC) نامیده ­می­شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می­دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت های فیلتر بانک کاکلی با مزایای ویژگی PNCC  است که مقاومت توام در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به­گونه ای که آزمایش های انجام شده بر روی پایگاه دادگان استاندارد SSC نشان می­دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل می­کند و به­طور کلی نسبت به سایر ویژگی­های متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP < /span> در شرایط نویزی نرخ خطای پایین­تری را داراست.

نویسندگان

جعفر خلیل پور

دانشگاه پدافند هوایی خاتم الانبیباء(ص)

اسماعیل زارع زاده

دانشگاه صنعتی امیرکبیر