یک روش سه مرحله ای جدید برای بهسازی گفتار مبتنی بر بهسازی ادراکی،تبدیل موجک و آشکارسازی نویز ناایستان و بهینه سازی ابرپارامترهای آن با الگوریتم فراابتکاری QPSO

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 415

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG02_133

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

موضوع بهبود کیفیت صدا امروزه به یکی از موضوعات مهم و اساسی روز تبدیلشده است. ازاینرو بهبود گفتارهای آغشته به نویز یکی از موضوعات مهم در حوزه پردازش سیگنال است . بهسازی گفتار در موارد بسیاری مثل تشخیص صدا، تشخیص گوینده در محیطهای نویزی و بازیابی صداهای تخریب شده با نویز کاربرد دارد. تضعیف نویز بهنحویکه اختلالی در سیگنال اصلی به وجود نیاورد، یک چالش مهم برای بهبود صدا محسوب میشود. در این مقاله، یک روش ترکیبی سه مرحله ای برای بهسازی گفتار پیشنهاد میگردد. در مرحله اول، کیفیت گفتار توسط روش Perceptual Bayesian Estimator بهبود داده میشود. گفتار بهبود داده شده، در مرحله بعد، توسط بسته موجک (Wavelet Packet) به زیرباندهای مختلف (Sub-Bands) تجزیه میگردد. سپس در مرحله سوم، هر یک از زیرباندهای ویولت با روش بهسازی تازه-ارایهشدهی NNESE بهبود داده میشود. در نهایت، زیرباندهای بهبود داده شده با هم ترکیب شده و سیگنال بهسازی شده نهایی را میسازند. از آنجا که مشخصات طیفی گفتار در هر زیرباند ویولت متفاوت است، لذا در این روش تلفیقی، از الگوریتم بهینهسازی QPSO برای بهینه سازی ابرپارامترهای سیستم تلفیقی فوق در تمامی زیرباندها استفاده میگردد. در آزمایشهای انجام شده، روش پیشنهادی نسبت به روشهای موردتحقیق در این مقاله بهتر عمل میکند و منجر به بهبود معیارهای Segmental SNR و PESQ میگردد.

کلیدواژه ها:

بهسازی گفتار ، تبدیل موجک ، بهینه سازی سراسری ، الگوریتم های فراابتکاری ، الگوریتم بهینه سازی دسته ذرات کوانتومی (QPSO)

نویسندگان

الهه صاحبی همراه

دانشجوی کارشناسی ارشد فناوری اطلاعات گرایش سیستمهای چندرسانه ای، دانشگاه رازی، کرمانشاه

سیدجهانشاه کبودیان

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی، کرمانشاه