یک رویکرد ترکیبی مبتنی بر واژه نامه و یادگیری ماشین برای شناسایی هیجان در نظرهای کاربران فارسی زبان
محل انتشار: نهمین کنگره مشترک سیستم های فازی و هوشمند ایران
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 267
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FJCFIS09_030
تاریخ نمایه سازی: 7 اردیبهشت 1401
چکیده مقاله:
شناسایی هیجان در نظرها و متون کاربران فارسی زبان یک مسئله مهم در پردازش متن است که می تواند برای تحلیل بازخورد و رضایت مشتریان از محصولات مورد استفاده قرار گیرد.در این مقاله ما رویکردهای مبتنی بر واژه نامه و مبتنی بر یادگیری ماشین را برای شناسایی قطبیت وهیجان در نظرهای فارسی کاربران با هم ترکیب می کنید. در روش پیشنهادی، بردار ویژگی نرخ هیجان که به کمک واژه نامه هیجانی محاسبه شده است، با بردار ویژگی رخداد کلمات ترکیب شده و یک بردار و یژگی ترکیبی با ۲۴۳۰۹ عنصر را تشکیل می دهند. سپس مهم ترین ویژگی ها در این بردار ویژگی ترکیبی بم عنوان ورودی به یک طبقه بند ماشن یا بردار پشتیبان داده شده اند. همچنین، از آنجایی کم در طبقات مختلف هیجانی تعداد نمونه های مثبت و منفی یکسان نیست ، برای متوازن سازی نمونه ها حین اموزش از روش SMOTE استفاده شده است. استفاده از نرخ هیجانات مبتنی بر واژه نامه در کنار و یژگی های رخداد کلمات در هر نظر، و متوازن سازی نمونه های طبقات مختلف با کمک روش SMOTE باعث شده است تا روش ترکیبی پیشنهادی نسبت به رویکردهای ساده تر نرخ دقت طبقه بندی بالاتری را فراهد آورد. روش پیشنهادی به طور میانگین به نرخ دقت ۶۶% برای معیار F۱ در شناسایی کلاس های قطبیت و هیجان دست یافته است.
کلیدواژه ها:
نویسندگان
وحید کیانی
استادیار، گروه مهندسی کامپیوتر ، دانشگاه بجنورد ، بجنورد
مهدی رسولی
دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر ، دانشگاه بجنورد، بجنورد