تشخیص جنسیت صدا با استفاده از شبکه های عصبی عمیق
عنوان مقاله: تشخیص جنسیت صدا با استفاده از شبکه های عصبی عمیق
شناسه ملی مقاله: ICCSE02_009
منتشر شده در دومین کنفرانس بین المللی مهندسی و علوم کامپیوتر در سال 1401
شناسه ملی مقاله: ICCSE02_009
منتشر شده در دومین کنفرانس بین المللی مهندسی و علوم کامپیوتر در سال 1401
مشخصات نویسندگان مقاله:
سیدامیررضا کبودیان - دانشجوی کارشناسی مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران
نیما رجائیان - دانشکده مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران،عضو مرکز تحقیقات پردازش دیجیتال و بینایی ماشین، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران
خلاصه مقاله:
سیدامیررضا کبودیان - دانشجوی کارشناسی مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران
نیما رجائیان - دانشکده مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران،عضو مرکز تحقیقات پردازش دیجیتال و بینایی ماشین، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران
تشخیص جنسیت صدا نقش مهمی در سیستم های پردازش گفتار و سیستم تشخیص هویت مبتنی بر صدا دارد. با توجه به رشد فوقالعاده فناوری های هوش مصنوعی و سیستم های کامپیوتری می توان با استفاده از شبکه های عصبی عمیق داده های صوت را برای تشخیص جنسیت گوینده طبقه بندی کرد. سیستم تشخیص جنسیت صدا با لهجه و زبان انگلیسی پیش ازاین ، موردبررسی و پیاده سازی قرارگرفته است اما باوجود تفاوت بسیار زیاد بین زبان، گویش و لهجه انگلیسی و فارسی این کار بر روی مجموعه داده فارسی برای اولین بار انجام گرفت . در این پژوهش از شبکه های عصبی عمیق ۱D-CNN, ۲D-CNN, LSTM, GRU, SimpleRNN برای دسته بندی مجموعه داده صوت به منظور تشخیص و بازشناسانی استفاده شده که درنهایت شبکه عصبی ۲D-CNN با درصد صحت ۹۹% بهترین شبکه عصبی برای تشخیص جنسیت صدا شناخته شد.
کلمات کلیدی: پردازش سیگنال صوتی ، تشخیص جنسیت صدا، شبکه های عصبی عمیق ، یادگیری عمیق ، پردازش گفتار
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1615221/