تشخیص جنسیت صدا با استفاده از شبکه های عصبی عمیق

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 208

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCSE02_009

تاریخ نمایه سازی: 14 اسفند 1401

چکیده مقاله:

تشخیص جنسیت صدا نقش مهمی در سیستم های پردازش گفتار و سیستم تشخیص هویت مبتنی بر صدا دارد. با توجه به رشد فوقالعاده فناوری های هوش مصنوعی و سیستم های کامپیوتری می توان با استفاده از شبکه های عصبی عمیق داده های صوت را برای تشخیص جنسیت گوینده طبقه بندی کرد. سیستم تشخیص جنسیت صدا با لهجه و زبان انگلیسی پیش ازاین ، موردبررسی و پیاده سازی قرارگرفته است اما باوجود تفاوت بسیار زیاد بین زبان، گویش و لهجه انگلیسی و فارسی این کار بر روی مجموعه داده فارسی برای اولین بار انجام گرفت . در این پژوهش از شبکه های عصبی عمیق ۱D-CNN, ۲D-CNN, LSTM, GRU, SimpleRNN برای دسته بندی مجموعه داده صوت به منظور تشخیص و بازشناسانی استفاده شده که درنهایت شبکه عصبی ۲D-CNN با درصد صحت ۹۹% بهترین شبکه عصبی برای تشخیص جنسیت صدا شناخته شد.

نویسندگان

سیدامیررضا کبودیان

دانشجوی کارشناسی مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران

نیما رجائیان

دانشکده مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران،عضو مرکز تحقیقات پردازش دیجیتال و بینایی ماشین، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران