یک رویکرد ترکیبی مبتنی بر واژه نامه و یادگیری ماشین برای شناسایی هیجان در نظرهای کاربران فارسی زبان

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 267

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

FJCFIS09_030

تاریخ نمایه سازی: 7 اردیبهشت 1401

چکیده مقاله:

شناسایی هیجان در نظرها و متون کاربران فارسی زبان یک مسئله مهم در پردازش متن است که می تواند برای تحلیل بازخورد و رضایت مشتریان از محصولات مورد استفاده قرار گیرد.در این مقاله ما رویکردهای مبتنی بر واژه نامه و مبتنی بر یادگیری ماشین را برای شناسایی قطبیت وهیجان در نظرهای فارسی کاربران با هم ترکیب می کنید. در روش پیشنهادی، بردار ویژگی نرخ هیجان که به کمک واژه نامه هیجانی محاسبه شده است، با بردار ویژگی رخداد کلمات ترکیب شده و یک بردار و یژگی ترکیبی با ۲۴۳۰۹ عنصر را تشکیل می دهند. سپس مهم ترین ویژگی ها در این بردار ویژگی ترکیبی بم عنوان ورودی به یک طبقه بند ماشن یا بردار پشتیبان داده شده اند. همچنین، از آنجایی کم در طبقات مختلف هیجانی تعداد نمونه های مثبت و منفی یکسان نیست ، برای متوازن سازی نمونه ها حین اموزش از روش SMOTE استفاده شده است. استفاده از نرخ هیجانات مبتنی بر واژه نامه در کنار و یژگی های رخداد کلمات در هر نظر، و متوازن سازی نمونه های طبقات مختلف با کمک روش SMOTE باعث شده است تا روش ترکیبی پیشنهادی نسبت به رویکردهای ساده تر نرخ دقت طبقه بندی بالاتری را فراهد آورد. روش پیشنهادی به طور میانگین به نرخ دقت ۶۶% برای معیار F۱ در شناسایی کلاس های قطبیت و هیجان دست یافته است.

نویسندگان

وحید کیانی

استادیار، گروه مهندسی کامپیوتر ، دانشگاه بجنورد ، بجنورد

مهدی رسولی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر ، دانشگاه بجنورد، بجنورد