ایجاد مجموعه دادگان فارسی تحلیل احساس در متون منتشرشده در شبکه های اجتماعی
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
 - من نویسنده این مقاله هستم
 
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
تاریخ نمایه سازی: 29 مهر 1404
چکیده مقاله:
تجزیه و تحلیل احساسات، فرآیند تشخیص خودکار احساسات نهفته در یک رسانه ارتباطی مثل متن، صوت، تصویر یا فیلم است که در سال های اخیر به دلیل حجم بالای محتوای تولید شده توسط کاربران در اینترنت و نیاز کسب وکارها و سازمان ها به درک افکار عمومی در مورد محصولات یا خدمات خود، اهمیت فزاینده ای پیدا کرده است. دقت و قابلیت اطمینان الگوریتم های تحلیل احساسات به کیفیت مجموعه داده مورد استفاده برای آموزش و آزمایش بستگی دارد. بنابراین، تهیه یک مجموعه داده مناسب برای موفقیت مدل های تحلیل احساس بسیار مهم است. با این هدف، مقاله حاضر مجموعه داده ای متنی را برای تحلیل احساسات نویسنده با استفاده از متون توییتر ارائه می کند. توییتر به دلیل محبوبیت و گستره متنوع کاربرانش به عنوان منبع استخراج دادگان انتخاب شده است. زبان غیر رسمی و محاوره ای متون توییتر همراه با وجود ابهام، استعاره و کنایه، همچنین محدودیت طول متن مجاز آن از دیگر دلایل انتخاب این منبع بوده است. در این کار از بستر جمع سپاری بومی سازی شده پارسی آزما برای برچسب زنی توییت ها استفاده شد. هر توییت توسط سه نفر برچسب زده شد و معیار برچسب نهایی رای اکثریت بود. این مجموعه داده که محدودیت موضوعی ندارد و کل فرآیند برچسب زنی در آن به صورت انسانی انجام شده است، حاوی بیش از ۵۰۰۰ توییت، شامل ۱۹۴۸ توییت مثبت، ۳۰۲۱ توییت منفی و ۲۸۴ توییت خنثی است. تحلیل احساسات در این دادگان، در سطح سند و بر اساس احساس کلی نویسنده متن انجام شده است.
کلیدواژه ها:
نویسندگان