ارایه یک روش در طبقه بندی نظرات کاربران با استفاده از یادگیری ماشین و الگوریتم رای گیری

  • سال انتشار: 1396
  • محل انتشار: اولین کنفرانس بین المللی فناوری های نوین در علوم
  • کد COI اختصاصی: CMTS01_263
  • زبان مقاله: فارسی
  • تعداد مشاهده: 849
دانلود فایل این مقاله

نویسندگان

الهام مجیدی

گروه کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران

ایوب باقری

استادیار گروه مهندسی کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران

چکیده

با پیشرفت تکنولوژی و گسترش شبکه جهانی وب، وب بستر مناسبی برای آگاهی از یک محصول یا خدمات یا خرید محصول یا خدمات شده است. در بسیاری از شبکه های اجتماعی مثل اینستاگرام یا بلاگ های شخصی یا وبسایت کمپانی ها کاربران نظرات خود را راجع به یک محصول یا خدمات درج نموده اند. این نظرات از آن جهت با ارزش است که باعث جذب یا دفع مشتری بالقوه می شود یا می تواند کمپانی را در گرفتن بازخورد از یک محصول و ارایه یک محصول بهتر یا استراتژی تولید محصول جدید یاری دهد. در نتیجه حجم زیادی اطلاعات به صورت غیر ساخت یافته وجود دارد که استخراج اطلاعات دلخواه از آنها کار دشواری است. عقیده کاوی فرآیند تحلیل نظرات، عقاید و احساسات کاربران است که از نقد ها و نظراتی که در مورد یک موضوع خاص نوشته اند استخراج می شود. بیشترین و موفق ترین روش هایی که انجام شده با استفاده از روش های یادگیری ماشین است. در این مقاله، در بین انواع روش های مختلف یادگیری ماشین، از الگوریتمی ابداعی به نام رای دهی استفاده شده است. این الگوریتم از تلفیق الگوریتم های موجود و رای گرفتن از تمام آنها اقدام به جمع آوری رای ها کرده و رای خود را مطابق رای اکثریت تعیین می کند. در این الگوریتم یک سری مجموعه استاندارد نظرات کاربران در مورد فیلم ها، برای آموزش و ارزیابی الگوریتم به کار گرفته شده و این نمونه ها پیش پردازش و کلمات زاید آن ها حذف شده است. ویژگی های اساسی این نظرات به کمک روش های انتخاب واژگان انتخاب می شود و با توجه به داده های آموزشی که برچسب مثبت یا منفی دارند مشخص می گردد که کدام کلمات بار مثبت و منفی دارند سپس با استفاده از الگوریتم های پردازش زبان طبیعی همچون بیز مدل آموزشی ساخته می شود. الگوریتم هایی که با این داده های آموزشی مدل می سازند 7 مورد هستند که عبارتند از 1- بیز ساده شامل گاوسین ، مالتی نو مینال و برنولی 2- ماشین بردار پشتیبان شامل svc و svc خطی 3- مدل های خطی شامل رگرسیون منطقی و کلاسیفایر گرادیان نزولی تصادفی . حالا الگوریتم ارایه شده با نام الگوریتم رای دهی برای هر قلم داده بررسی می کند که رای اکثریت با چیست و رای خود را رای اکثریت قرار می دهد. هدف از روش پیشنهادی ارایه یک الگوریتم جدید برای شناسایی نظرات مثبت و منفی با بهترین مقادیر ارزیابی نسبت به سایر روش ها می-باشد.

کلیدواژه ها

داده کاوی، متن کاوی، کلاس بندی متن، عقیده کاوی، نظرات آنلاین، کلاسیفایر

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.