تشخیص هرزنظرهای کاربران در زبان فارسی با کاربست الگوریتم های یادگیری با نظارت: مطالعه موردی درحوزه هتلداری داخلی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 500

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICFUZZYS19_011

تاریخ نمایه سازی: 11 اردیبهشت 1400

چکیده مقاله:

همگام با توسعه شبکه های اجتماعی، استفاده روزافزون کاربران از نظرات درج شده برای تصمیم گیری در حوزه هایی چون خرید، رای دادن در انتخابات و... به پدیده ای با کاربرد چشمگیر بدل شده است. چالش این حوزه، وجود هرزنظر با تکیه بر این واقعیت است که یک فرد بدون ترس از افشای هویت واقعی از هر نقطه جهان می تواند به راحتی به بیان نظرات خود با اهداف مخرب در رسانه های اجتماعی اقدام کند. از این رو نظرات جعلی و هرز را برای ترویج یا بی اعتبار کردن محصولات، خدمات، سازمان ها یا افراد، منتشر سازد. تشخیص صحیح هرزنظر یک مساله مهم در حوزه نظرکاوی است زیرا علاوه بر وابستگی بسیار زیاد الگوریتم به ساختارهای زبانی، اعمال الگوریتم های هرزنظر از یک زبان به زبان دیگر سخت و یا غیرممکن است بنابراین یافتن نظرات جعلی و ساخت الگوریتمی قدرتمند تنها با تکیه بر اطلاعات موجود در متن نظر، ممکن نیست. مقاله حاضر با نوآوری در سه بخش در این حوزه به ترتیب با کار در زبان فارسی، استخراج نظر در سطح جمله و سند و ارائه مجموعه ای از ویژگی های بدیع ترکیب شده از اطلاعات متن، فراداده های آن، خصوصیات موجودیت و ویژگی های احساسی، به نظرکاوی نظرات فارسی درج شده کاربران هتل های ایران می پردازد و مساله تشخیص هرزنظر را به عنوان یک مساله دسته بندی دو دسته ای نگریسته و با هشت روش یادگیری با نظارت، مدلسازی می نماید. برای ارزیابی نتایج با استفاده از پارامترهای صحت، فراخوانی و دقت، درخت تصمیم به همراه دو دسته بند ترکیبی AdaBoost , Bagging به عنوان بهترین دسته بندها در تشخیص هرزنظر با مجموعه ویژگی های طراحی شده در این پژوهش شناسایی شدند. همچنین تشخیص هرزنظر مبتنی بر مجموعه ویژگی های این مقاله، با دو مجموعه جامع دیگر از ویژگی ها در سایر پژوهش ها، مقایسه شد. نتایج حاکی از برتری هفت مدل مقاله با مجموعه ویژگی های ارائه شده نسبت به دو مجموعه مقالات دیگر است.

نویسندگان

سپیده جمشیدی نژاد

دانشجوی دکتری، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی واحد رشت

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه پیام نور رشت

پیمان بیات

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی واحد رشت