Single Microphone Speech Separation using MixMax and Binary Masking Approach
محل انتشار: سیزدهمین کنفرانس مهندسی برق ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,877
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE13_195
تاریخ نمایه سازی: 27 آبان 1386
چکیده مقاله:
This paper presents an efficient approach to the single microphone speech separation problem based upon the idea of the Mix Max function. We show that the log amplitude of the short term Fourier transform of the mixed signal is almost exactly the maximum element wise of the log magnitude of STFT of individual signals by which the need for phase information whose characteristic are difficult to be parameterized or modeled is eliminated. Following that, we apply this function to construct a binary mask to separate each speech signal. The accuracy of the model is clarified through the use of the subjective and objective tests for different parts of overlapping speech segments.
نویسندگان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :