SEMI-SYLLABLE UNITS FOR ROBUST TEXT INDEPENDENT SPEAKER IDENFICATION

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس بین المللی چشم انداز های نو در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: NPECE01_043
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 483
دانلود فایل این مقاله

نویسندگان

Behnam Eskandariun

Department of Electrical and Electronics Engineering

Ghazaal Sheikhi

Department of Computer Engineering

چکیده

Abstract In this study, Robust text-independent speaker identification is investigated. Syllable and semisyllableboundaries are automatically detected in Farsi continuous speech utterances using short-term energy contour and discrete wavelet transform (DWT). While the entire syllable is considered as the unit for prosody, wavelet entropy coefficients are emerged from two overlapping semi-syllables reflecting consonant/vowel (CV) and (or) vowel/consonant (VC) transitions distinctly. Long-term prosodic features i.e. rational syllable nuclei duration, mean energy; pitch frequency and, four formants in addition to concatenated coefficients of wavelet entropy in depth four are extracted as the feature vector. Classification is performed by the feed-forward perceptron neural network (FFPNN) with two hidden layers. The experiments conducted on Farsi speech dataset (FarsDat) using proposed method confirm improvement in speaker identification accuracy in different signal to noise atios compared with conventional methods

کلیدواژه ها

Text-Independent Speaker Identification, Discrete Wavelet Transform, Semi-Syllables,Prosody, Wavelet Entropy

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.