شناسایی جنسیت گوینده در گفتار فارسی با استفاده از شبکه های عصبی کانولوشنی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 302

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

UTCONF09_130

تاریخ نمایه سازی: 20 تیر 1404

چکیده مقاله:

شناسایی جنسیت گوینده در گفتار فارسی یکی از موضوعات مهم در حوزه پردازش گفتار و هوش مصنوعی است که کاربردهای گسترده ای در سیستم های پاسخگویی صوتی، تحلیل احساسات و امنیت اطلاعات دارد. هدف این پژوهش توسعه مدلی مبتنی بر شبکه های عصبی کانولوشنی برای شناسایی دقیق جنسیت گوینده در گفتار فارسی است. در این مطالعه، با بهره گیری از داده های گفتاری متنوع فارسی و استخراج ویژگی های صوتی مرتبط، مدلی طراحی و آموزش داده شده که قادر است الگوهای پیچیده صوتی را شناسایی و طبقه بندی کند. نتایج به دست آمده نشان می دهد که روش پیشنهادی در مقایسه با رویکردهای مرسوم یادگیری ماشین، دقت بالاتری در شناسایی جنسیت دارد و توانایی مقابله با نویزهای محیطی را بهبود بخشیده است. این تحقیق گام موثری در بهبود سامانه های تشخیص جنسیت گوینده در زبان فارسی برداشته و زمینه ساز توسعه کاربردهای پیشرفته تر در حوزه پردازش گفتار می باشد.

کلیدواژه ها:

شناسایی جنسیت گوینده ، پردازش گفتار ، هوش مصنوعی ، سیستم های پاسخگویی صوتی ، تحلیل احساسات ، شبکه های عصبی کانولوشنی ، ویژگی های صوتی ، الگوهای پیچیده صوتی ، یادگیری ماشین ، سامانه های تشخیص جنسیت گوینده

نویسندگان

مینا زمین کار

گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید اشرفی اصفهانی، اصفهان، ایران

رضا زمانی هالغره

دانشجوی کارشناسی مهندسی نرم افزار، دانشکده فنی و مهندسی، دانشگاه شهید اشرفی اصفهانی، اصفهان، ایران