تشخیص گوینده با شبکه های عصبی کانولوشنال و تئوری نتروسافیک
محل انتشار: فصلنامه مدل سازی در مهندسی، دوره: 21، شماره: 75
سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 127
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JME-21-75_001
تاریخ نمایه سازی: 30 بهمن 1402
چکیده مقاله:
تشخیص گوینده، فرآیند تشخیص افراد بر اساس صوت آنها است که در کاربردهای زیادی مورد استفاده قرار می گیرد. اگرچه تاکنون تحقیقات زیادی در زمینه ی تشخیص گوینده صورت گرفته است، اما چالش هایی وجود دارد که هنوز حل نشده اند. در این مقاله به منظور بهبود دقت سیستم های تشخیص گوینده از نتروسافیک و شبکه های عصبی کانولوشنال بهره گرفته شده است. در روش پیشنهادی، ابتدا اسپکتروگرام سیگنال صوتی تشکیل می گردد سپس اسپکتروگرام به فضای نتروسافیک منتقل می شود. در مرحله ی بعد عملگرهای بهبود بتا به مجموعه های نتروسافیک اعمال می شود و این عملیات تا ثابت شدن آنتروپی مجموعه های نتروسافیک تکرار می گردد. در نهایت یک مدل شبکه ی عصبی کانولوشنال برای طبقه بندی هیستوگرام پیشنهاد می شود. برای ارزیابی و تحلیل روش پیشنهادی از دو پایگاه داده ی Aurora۲ و TIMIT استفاده شده است. روش پیشنهادی روی پایگاه داده ی Aurora۲ به دقت ۷۹/۹۳ درصد و روی پایگاه داده ی TIMIT به دقت ۲۴/۹۵ درصد دست یافته است که در مقایسه با روش های رقیب عملکرد بهتری داشته است.
کلیدواژه ها:
نویسندگان
صادق فدایی
استادیار، دانشکده مهندسی، دانشگاه یاسوج.
عبدالرضا رشنو
استادیار، دانشکده مهندسی، دانشگاه لرستان.
عبدالصمد حمیدی
استادیار، دانشکده مهندسی، دانشگاه لرستان.
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :