و SBU-KWS دادگان گفتار فارسی در ارزیابی سامانه های تشخیص کلیدواژه

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 392

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCEN05_014

تاریخ نمایه سازی: 14 آذر 1400

چکیده مقاله:

هدف سامانه های تشخیص کلیدواژه صوتی KWS، یافتن کلیدواژه مورد نظر در فایل صوتی است. به عبارتی این سامانه ها موقعیت زمانی کلیدواژه موردنظر را در صورت وجود، مشخص می کنند. از آنجایی که ارزیابی یک سامانه KWS، از اهمیت بالایی برخوردار است، بنابراین به یک دادگان مناسب نیازمندیم. در این مقاله ابتدا به معرفی دادگان SBU-KWS که حاوی گفتار مکالمه و محاوره فارسی است، پرداخته شده است و در ادامه ارزیابی اولیه این دادگان بر اساس سامانه مبتنی بر مدل مخفی مارکوف و سامانه مبتنی بر شبکه عصبی عمیق انجام شده است. دقت FOM سامانه مبتنی بر مدل مخفی مارکوف بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۷۲.۵۷ و ۶۶.۳۱ شد. همچنین برای سامانه مبتنی بر شبکه عصبی عمیق دقت FOM بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۵۵.۵۶ و ۶۰.۲۲ حاصل شد

نویسندگان

سعید زارعی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

یاسر شکفته

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران