تشخیص هویت گوینده مستقل از متن مقاوم به نویز در زبان فارسی مبتنی بر تخمین وفقی فرمنت ها و ضرایب کپسترال فرکانس مل

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 457

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH04_084

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

بازشناسی گوینده مستقل از متن در محیط های واقعی نویزی همچنان یک چالش پیش روی سیستم های تشخیص هویت می باشد. در این مقاله، روشی برای بهبود دقت تشخیص هویت گوینده مستقل از متن ارائه می شود که از ترکیب ویژگی ضرایب کپسترال و داده های اخذ شده از تخمین وفقی چهار فرمنت اول گفتار در محیط های نویزی استفاده می کند. به منظور تخمین مقاوم به نویز فرمنت ها از فیلتر تک قطب پیشگوی خطی (LPC) در چهار باند فرکانسی مجزا به همراه فلیتر میانگین لغزشی (MA) استفاده می شود. به منظور استخراج ویژگی ها از سیگنال گفتار، بدلیل عملکرد موثر ضرایب کپسترال بدلیل وجود بانک فیلترهای مل، در محیط های نویزی از این ضرایب استفاده می شود. برای مدل سازی گوینده با رویکرد مستقل از متن و برای حصول دقت بالا روش مدل خطوط گاوسی (GMM) را برای ضرایب کپسترال انتخاب می کنیم. طبقه بندی داده های فرمنت در فضای برداری (VQ) انجام می شود. نهایتا نتایج تصمیم با مدل های GMM و VQ با هم ادغام می شود. گوینده موردنظر تعیین هویت می شود. شبیه سازی های انجام شده با سیگنال های گفتار از پایگاه داده زبان فارسی فارس دات نشان دهنده دقت بالاتر روش پیشنهدی نسبت به روش متعارف متنی بر ضرایب کپسترال می باشد.

نویسندگان

جواد زندی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

مریم حاتمی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

مهدی بکرانی

دانشکده برق و کامپیوتر، دانشگاه صنعتی قم، قم، ایران