ArmanTTS single-speaker Persian dataset
- سال انتشار: 1401
- محل انتشار: اولین کنفرانس بین المللی و ششمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی
- کد COI اختصاصی: CEITCONF06_046
- زبان مقاله: انگلیسی
- تعداد مشاهده: 376
نویسندگان
MSc StudentSchool of Computer EngineeringIran University of Science andTechnologyTehran, Iran
MSc GraduateSchool of Computer EngineeringIran University of Science andTechnologyTehran, Iran
PhD CandidateSchool of Computer EngineeringIran University of Science andTechnologyTehran, Iran
BSc StudentSchool of Computer EngineeringAmirkabir University of TechnologyTehran, Iran
Assistant ProfessorSchool of Computer EngineeringAmirkabir University of TechnologyTehran, Iran
چکیده
TTS, or text-to-speech, is a complicated process thatcan be accomplished through appropriate modeling using deeplearning methods. In order to implement deep learning models, asuitable dataset is required. Since there is a scarce amount ofwork done in this field for the Persian language, this paper willintroduce the single speaker dataset: ArmanTTS. We comparedthe characteristics of this dataset with those of various prevalentdatasets to prove that ArmanTTS meets the necessary standardsfor teaching a Persian text-to-speech conversion model. We alsocombined the Tacotron ۲ and HiFi GAN to design a model thatcan receive phonemes as input, with the output being thecorresponding speech. ۴.۰ value of MOS was obtained from realspeech, ۳.۸۷ value was obtained by the vocoder prediction and۲.۹۸ value was reached with the synthetic speech generated bythe TTS model.کلیدواژه ها
dataset; Vocoders; Acoustic modelsمقالات مرتبط جدید
- ارتقای امنیت و حریم خصوصی اینترنت اشیا: نقش انقلابی فناوری های بلاک چین
- طراحی متدولوژی های ترکیبی (Hybrid) در هوش مصنوعی برای حل مسائل پیچیده
- بهینه سازی سلسله مراتبی جریان ترافیک در محیط های شهری با استفاده از یک چارچوب ترکیبی مبتنی بر سیستم های چندعامله، یادگیری عمیق و یادگیری تقویتی
- بهینه سازی یادگیری فدرال در سیستم های رایانش لبه موبایل: مروری جامع بر چالش ها، راه حل ها و کاربردهای نوظهور
- فناوری اطلاعات و ارتباطات سبز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.