تشخیص جنسیت صدا با استفاده از شبکه های عصبی عمیق
محل انتشار: دومین کنفرانس بین المللی مهندسی و علوم کامپیوتر
سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 245
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICCSE02_009
تاریخ نمایه سازی: 14 اسفند 1401
چکیده مقاله:
تشخیص جنسیت صدا نقش مهمی در سیستم های پردازش گفتار و سیستم تشخیص هویت مبتنی بر صدا دارد. با توجه به رشد فوقالعاده فناوری های هوش مصنوعی و سیستم های کامپیوتری می توان با استفاده از شبکه های عصبی عمیق داده های صوت را برای تشخیص جنسیت گوینده طبقه بندی کرد. سیستم تشخیص جنسیت صدا با لهجه و زبان انگلیسی پیش ازاین ، موردبررسی و پیاده سازی قرارگرفته است اما باوجود تفاوت بسیار زیاد بین زبان، گویش و لهجه انگلیسی و فارسی این کار بر روی مجموعه داده فارسی برای اولین بار انجام گرفت . در این پژوهش از شبکه های عصبی عمیق ۱D-CNN, ۲D-CNN, LSTM, GRU, SimpleRNN برای دسته بندی مجموعه داده صوت به منظور تشخیص و بازشناسانی استفاده شده که درنهایت شبکه عصبی ۲D-CNN با درصد صحت ۹۹% بهترین شبکه عصبی برای تشخیص جنسیت صدا شناخته شد.
کلیدواژه ها:
نویسندگان
سیدامیررضا کبودیان
دانشجوی کارشناسی مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران
نیما رجائیان
دانشکده مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران،عضو مرکز تحقیقات پردازش دیجیتال و بینایی ماشین، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران