بهسازی گفتار تک‌کاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 317

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_ISEE-11-1_005

تاریخ نمایه سازی: 19 بهمن 1399

چکیده مقاله:

بیشتر روش‌های بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه می‌دهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد می‌شود که در آن از یک توزیع دنباله - سنگین به نام(tls)  t location-scale برای مدل‌کردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی به‌عنوان مدل قطعی استفاده شده است. در مدل نمایی به‌کاررفته، تخمین فرکانس و ضریب میرایی به روش ماتریس پِنسِل انجام می‌شود. همچنین، در پژوهش‌های قبلی تعداد مؤلفه‌های نمایی در ساخت مدل قطعی برای بهسازی گفتار، یک در نظر گرفته شده است که در این مقاله، مدل نمایی به تعداد دلخواه مؤلفه‌های نمایی بسط داده می‌شود‌. پیاده‌سازی‌ها در سه حالت ترکیبی نمایی - گاوسی (روش پیشنهادی نخست)، نمایی - tls (روش پیشنهادی دوم)‌ و سینوسی - گاوسی انجام شده‌اند و با روش موجود نمایی – گاوسی (تنها با یک مؤلفة نمایی) و تخمینگرهای تصادفی وینر و مبتنی بر tls مقایسه می‌شوند. نتایج پیاده‌سازی در حضور شش نویز از مجموعه دادة نویز noisex-92 نشان می‌دهند که دو روش پیشنهادی در قیاس با روش‌های مبتنی بر مدل تصادفی صرف، به بهبود معیار نسبت سیگنال به نویز قطعه‌ای منجر شده‌اند و در ارزیابی ادراکی کیفیت گفتار عملکرد نسبتاً برابری دارند.

کلیدواژه ها:

بهسازی گفتار ، تابع چگالی احتمال t Location-Scale ، فیلتر وینر ، کمترین میانگین مربعات خطا ، مدل قطعی نمایی ، مدل سینوسی

نویسندگان

زهرا امینی

دانشجوی کارشناسی ارشد، گروه مهندسی برق - دانشگاه بین المللی امام خمینی (ره) - قزوین - ایران

ندا فرجی

استادیار، گروه مهندسی برق - دانشگاه بین المللی امام خمینی (ره) - قزوین - ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • [1] Y. Ephraim, D. Malah, “Speech enhancement using a minimum ...
  • [2] S. Boll, “Suppression of acoustic noise in speech using ...
  • [3] K. Funaki, “Speech enhancement based on iterative Wiener filter ...
  • [4] Y. Ephraim, D. Malah, “Speech enhancement using a minimum ...
  • [5] R.J. Macaulay, M.L. Malpass, “Speech enhancement using a soft ...
  • [6] T. Lotter, P. Vary, “Speech enhancement by MAP spectral ...
  • [7] B. Chen, P.C. Loizou, “A Laplacian-based MMSE estimator for ...
  • [8] R. Martin, “Speech enhancement based on minimum mean-square error ...
  • [9] J.S. Erkelens, R.C. Hendriks, R. Heusdens, et al. , ...
  • [10] N. Faraji, A. Kohansal, “MMSE and maximum a posteriori ...
  • [11] R. McAulay and M. Malpass, “Speech enhancement using a ...
  • [12] J. Hardwick, C. Yoo, and J. Lim, “Speech enhancement ...
  • [13] R. Hendriks, R. Heusdens, J. Jensen, “An MMSE estimator ...
  • [14] J. Laroche, Y. Stylianou, and E. Moulines, “HNS: Speech ...
  • [15] M. C. McCallum and B. J. Guillemin, “Accounting for ...
  • pp. 174–179, 2-5 Oct 2012. ...
  • [16] M. McCallum, B. Guillemin, “Stochastic-deterministic MMSE STFT speech enhancement ...
  • pp. 1445–1457, July 2013. ...
  • [17] Y. Du, J. Du, L.R. Dai, et al., “‘A ...
  • [18] J.G. Proakis, D.G. Manolakis, Digital Signal Processing: Principles, Algorithms ...
  • [19] K. Duda, T. P. Zielinski, “Efficiency of the frequency ...
  • [20] T.K. Sarkar, O. Pereira, “Using the Matrix Pencil Method ...
  • [21] T.K. Moon, W.C. Stirling, Mathematical Methods and Algorithms for ...
  • [22]  W.M. Fisher, G.R. Doddington, K.M. Goudie-Marshall, “The DARPA speech ...
  • pp. 93–99, 1986. ...
  • [23] A. Varga, and H.J.M. Steeneken, “Assessment for automatic speech ...
  • نمایش کامل مراجع