ارایه یک روش در طبقه بندی نظرات کاربران با استفاده از یادگیری ماشین و الگوریتم رای گیری

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 841

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CMTS01_263

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

با پیشرفت تکنولوژی و گسترش شبکه جهانی وب، وب بستر مناسبی برای آگاهی از یک محصول یا خدمات یا خرید محصول یا خدمات شده است. در بسیاری از شبکه های اجتماعی مثل اینستاگرام یا بلاگ های شخصی یا وبسایت کمپانی ها کاربران نظرات خود را راجع به یک محصول یا خدمات درج نموده اند. این نظرات از آن جهت با ارزش است که باعث جذب یا دفع مشتری بالقوه می شود یا می تواند کمپانی را در گرفتن بازخورد از یک محصول و ارایه یک محصول بهتر یا استراتژی تولید محصول جدید یاری دهد. در نتیجه حجم زیادی اطلاعات به صورت غیر ساخت یافته وجود دارد که استخراج اطلاعات دلخواه از آنها کار دشواری است. عقیده کاوی فرآیند تحلیل نظرات، عقاید و احساسات کاربران است که از نقد ها و نظراتی که در مورد یک موضوع خاص نوشته اند استخراج می شود. بیشترین و موفق ترین روش هایی که انجام شده با استفاده از روش های یادگیری ماشین است. در این مقاله، در بین انواع روش های مختلف یادگیری ماشین، از الگوریتمی ابداعی به نام رای دهی استفاده شده است. این الگوریتم از تلفیق الگوریتم های موجود و رای گرفتن از تمام آنها اقدام به جمع آوری رای ها کرده و رای خود را مطابق رای اکثریت تعیین می کند. در این الگوریتم یک سری مجموعه استاندارد نظرات کاربران در مورد فیلم ها، برای آموزش و ارزیابی الگوریتم به کار گرفته شده و این نمونه ها پیش پردازش و کلمات زاید آن ها حذف شده است. ویژگی های اساسی این نظرات به کمک روش های انتخاب واژگان انتخاب می شود و با توجه به داده های آموزشی که برچسب مثبت یا منفی دارند مشخص می گردد که کدام کلمات بار مثبت و منفی دارند سپس با استفاده از الگوریتم های پردازش زبان طبیعی همچون بیز مدل آموزشی ساخته می شود. الگوریتم هایی که با این داده های آموزشی مدل می سازند 7 مورد هستند که عبارتند از 1- بیز ساده شامل گاوسین ، مالتی نو مینال و برنولی 2- ماشین بردار پشتیبان شامل svc و svc خطی 3- مدل های خطی شامل رگرسیون منطقی و کلاسیفایر گرادیان نزولی تصادفی . حالا الگوریتم ارایه شده با نام الگوریتم رای دهی برای هر قلم داده بررسی می کند که رای اکثریت با چیست و رای خود را رای اکثریت قرار می دهد. هدف از روش پیشنهادی ارایه یک الگوریتم جدید برای شناسایی نظرات مثبت و منفی با بهترین مقادیر ارزیابی نسبت به سایر روش ها می-باشد.

نویسندگان

الهام مجیدی

گروه کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران

ایوب باقری

استادیار گروه مهندسی کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران