و SBU-KWS دادگان گفتار فارسی در ارزیابی سامانه های تشخیص کلیدواژه

سعید زارعی; یاسر شکفته

و SBU-KWS دادگان گفتار فارسی در ارزیابی سامانه های تشخیص کلیدواژه

محل انتشار: پنجمین کنفرانس مهندسی مخابرات ایران

سال انتشار: 1400

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 652

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1328596

شناسه ملی سند علمی:

ICCEN05_014

تاریخ نمایه سازی: 14 آذر 1400

چکیده مقاله:

هدف سامانه های تشخیص کلیدواژه صوتی KWS، یافتن کلیدواژه مورد نظر در فایل صوتی است. به عبارتی این سامانه ها موقعیت زمانی کلیدواژه موردنظر را در صورت وجود، مشخص می کنند. از آنجایی که ارزیابی یک سامانه KWS، از اهمیت بالایی برخوردار است، بنابراین به یک دادگان مناسب نیازمندیم. در این مقاله ابتدا به معرفی دادگان SBU-KWS که حاوی گفتار مکالمه و محاوره فارسی است، پرداخته شده است و در ادامه ارزیابی اولیه این دادگان بر اساس سامانه مبتنی بر مدل مخفی مارکوف و سامانه مبتنی بر شبکه عصبی عمیق انجام شده است. دقت FOM سامانه مبتنی بر مدل مخفی مارکوف بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۷۲.۵۷ و ۶۶.۳۱ شد. همچنین برای سامانه مبتنی بر شبکه عصبی عمیق دقت FOM بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۵۵.۵۶ و ۶۰.۲۲ حاصل شد

کلیدواژه ها:

ارزیابی ، تشخیص کلیدواژه ، دادگان گفتار فارسی ، شبکه عصبی عمیق ، مدل مخفی مارکوف.

نویسندگان

سعید زارعی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

یاسر شکفته

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران