A x-vector based Speaker Recognition in Persian
محل انتشار: مجله مهندسی و تحقیقات کاربردی، دوره: 1، شماره: 2
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 101
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_EAR-1-2_007
تاریخ نمایه سازی: 20 آذر 1403
چکیده مقاله:
In this paper, a text-independent speaker recognition system in Persian is implemented by deep neural networks. The x-vector technique based on Time Delay Neural Network (TDNN) is used to extract the embeddings from speech signals. This method attracts researcher’s attention due to noise robustness and high performance. Data augmentation and noise addition are used to improve system performance. The PLDA classifier is used to recognize the speaker. Previous research in the field of “speaker recognition in Persian” is limited. In this work, the network is trained on the Persian part of the CommonVoice dataset. According to the error analysis, non-speech parts of an utterance decrease the accuracy of speaker recognition. So, the non-speech parts are removed by a Convolutional Recurrent Deep Neural Networks (CRDNN). The accuracy of speaker recognition and verification in CommonVoice is ۹۵.۲۴% and ۹۵.۵۶%, respectively. The Equal Error Rate (EER) evaluation metric of the speaker verification system is ۴.۷۲%. The attendance monitoring system was developed as one of the applications of the speaker recognition system. System accuracy for ۱۲ and ۱۵ seconds of collected data(includes ۱۶ women and ۱۲ men) is ۹۸.۹۲% and ۱۰۰%, respectivly.
کلیدواژه ها:
نویسندگان
fatemeh shahbakhti
Department of Electrical and Computer Engineering, Faculty of Shariaty, Skill National University (nus), Tehran, Iran
maryam Moradi-Shabestari
Electrical and Computer Engineering Department, Tehran University, Tehran, Iran
Zeinab Ghasemi-Naraghi
Computer Engineering Department, AmirKabir University of Technology, Tehran, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :