و SBU-KWS دادگان گفتار فارسی در ارزیابی سامانه های تشخیص کلیدواژه
محل انتشار: پنجمین کنفرانس مهندسی مخابرات ایران
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 482
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICCEN05_014
تاریخ نمایه سازی: 14 آذر 1400
چکیده مقاله:
هدف سامانه های تشخیص کلیدواژه صوتی KWS، یافتن کلیدواژه مورد نظر در فایل صوتی است. به عبارتی این سامانه ها موقعیت زمانی کلیدواژه موردنظر را در صورت وجود، مشخص می کنند. از آنجایی که ارزیابی یک سامانه KWS، از اهمیت بالایی برخوردار است، بنابراین به یک دادگان مناسب نیازمندیم. در این مقاله ابتدا به معرفی دادگان SBU-KWS که حاوی گفتار مکالمه و محاوره فارسی است، پرداخته شده است و در ادامه ارزیابی اولیه این دادگان بر اساس سامانه مبتنی بر مدل مخفی مارکوف و سامانه مبتنی بر شبکه عصبی عمیق انجام شده است. دقت FOM سامانه مبتنی بر مدل مخفی مارکوف بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۷۲.۵۷ و ۶۶.۳۱ شد. همچنین برای سامانه مبتنی بر شبکه عصبی عمیق دقت FOM بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۵۵.۵۶ و ۶۰.۲۲ حاصل شد
کلیدواژه ها:
نویسندگان
سعید زارعی
دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران
یاسر شکفته
دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران