Single Microphone Speech Separation using MixMax and Binary Masking Approach
- سال انتشار: 1384
- محل انتشار: سیزدهمین کنفرانس مهندسی برق ایران
- کد COI اختصاصی: ICEE13_195
- زبان مقاله: انگلیسی
- تعداد مشاهده: 1880
نویسندگان
Sharif University of Technology
Amirkabir University of Technology
Amirkabir University of Technology
چکیده
This paper presents an efficient approach to the single microphone speech separation problem based upon the idea of the Mix Max function. We show that the log amplitude of the short term Fourier transform of the mixed signal is almost exactly the maximum element wise of the log magnitude of STFT of individual signals by which the need for phase information whose characteristic are difficult to be parameterized or modeled is eliminated. Following that, we apply this function to construct a binary mask to separate each speech signal. The accuracy of the model is clarified through the use of the subjective and objective tests for different parts of overlapping speech segments.کلیدواژه ها
مقالات مرتبط جدید
- کاشت یون در نیمه رساناها: تاریخچه، فرایند، اثرات، کاربردها، چالش ها
- تخمین نفوذ مس در نوارهای لبه ای با استفاده از شبکه های عصبی عمیق
- آینده ی تولید غذا با اینترنت اشیاء
- پیشرفتهای نوین در یکپارچه سازی فرآیند دوقطبی در فناوری های میکروالکترونیک
- آخرین پیشرفتها در فناوری کاشت یون در سیلیکون کاربید و گالیوم نیترید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.