High Performance Speaker Verification Using Wideband, rich Database
- سال انتشار: 1395
- محل انتشار: اولین کنفرانس بین المللی دستاوردهای نوین پژوهشی در مهندسی برق و کامپیوتر
- کد COI اختصاصی: CBCONF01_0234
- زبان مقاله: انگلیسی
- تعداد مشاهده: 704
نویسندگان
Master Student Amirkabir University of Technology Tehran, Iran
Associated Professor Amirkabir University of Technology Tehran, Iran
PHD Candidate Amirkabir University of Technology Tehran, Iran
چکیده
Speaker verification has been studied for years. Many databases such as NIST has been used widely ;however , most of these databases are narrow band, not rich in context information and have high channel effect. In this paper, a wide band low noise and rich database of Farsi language has been used which does not have mentioned problems and it is suitable for many applications. Feature extraction is a key part in speaker verification. STFT-MFCC which uses FFT and filter bank is state of the art feature in speaker verification. The main problem of STFT-MFCC is that cannot model envelope accurately. We use STRAIGHT-MFCC, which is well-known for synthesis. STFT-MFCC and STRAIGHT-MFCC performance was compared for 2 minutes and full training data using GMM-UBM model. Results show that STRAIGHT-MFCC outperforms STFT-MFCC especially for short duration training dataکلیدواژه ها
speaker verification, wideband, MFCC, STREIGHTمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.