Image to Image Translation based on Convolutional Neural Network Approach for Speech Declipping

  • سال انتشار: 1398
  • محل انتشار: چهارمین کنفرانس ملی تکنولوژی در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: ETECH04_066
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 659
دانلود فایل این مقاله

نویسندگان

Hamidreza Baradaran Kashani

Electrical Engineering Faculty Amirkabir University of Technology Tehran, Iran

Ata Jodeiri

School of Electrical & Computer Engineering University of Tehran Tehran, Iran

Mohammad Mohsen Goodarzi

Department of Biomedical Engineering, Buein Zahra Technical University, Buein Zahra, Qazvin, Iran

Shabnam Gholamdokht Firooz

School of Electrical & Computer Engineering University of Tehran Tehran, Iran

چکیده

Clipping, as a current nonlinear distortion, often occurs due to the limited dynamic range of audio recorders. It degrades the speech quality and intelligibility and adverselyaffects the performances of speech and speaker recognitions. In this paper, we focus on enhancement of clipped speech by using a fully convolutional neural network as U-Net. Motivated by the idea of image-to-image translation, we propose a declipping approach, namely U-Net declipper in which the magnitude spectrum images of clipped signals are translated to the corresponding images of clean ones. The experimental results show that the proposed approach outperforms other declipping methods in terms of both quality and intelligibility measures, especially in severe clipping cases. Moreover, the superior performance of the U-Net declipper over the well-known declipping methods is verified in additive Gaussian noise conditions.

کلیدواژه ها

speech clipping, image-to-image translation, U-Net declipper, spectrum image.

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.