عقیده کاوی مبتنی بر کمیته ای از قوانین در داده های گروه های تلگرام فارسی

  • سال انتشار: 1397
  • محل انتشار: چهارمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
  • کد COI اختصاصی: DCBDP04_022
  • زبان مقاله: فارسی
  • تعداد مشاهده: 908
دانلود فایل این مقاله

نویسندگان

مینا کشاورزی فراشاه

دانشجوی ارشد گرایش نرم افزار، دانشکده مهندسی کامپیوتر، دانشگاه یزد

محمدعلی زارع چاهوکی

استادیار و عضو هیات علمی، دانشکده مهندسی کامپیوتر، دانشگاه یزد

چکیده

با رشد روز افزون و محبوبیت شبکه های اجتماعی، حجم زیادی از اطلاعات حاوی نظرات و احساسات افراد در هر لحظه ایجاد می شود. در هنگام تصمیم گیری در مورد موضوعی خاص، نظرات و احساسات دیگران بسیار مهم می باشد. به دلیل حجم زیاد این نظرات، تحلیل و پردازش انسانی، عملی غیر ممکن می باشد. به همین دلیل عقیده کاوی یا تجزیه و تحلیل احساسات راه حلی مناسب برای تحلیل نظرات به صورت خودکار می باشد. اغلب داده های رسانه های اجتماعی بدون ساختار هستند بنابراین عقیده کاوی برای تحلیل داده های بدون ساختار بسیار مفید می باشد. در این پژوهش سعی شده به ارایه روشی برای تحلیل نظرات افراد در مورد موضوعات مختلف در گروه های تلگرامی پرداخته شود. در این راستا سعی شده با استفاده از روش های مبتنی بر قانون و با بهره گیری از کیسه کلمات تکی، دوتایی و سه تایی به تحلیل عقاید و نظرات کاربران بپردازیم. در ادامه به ارزیابی روش، با پیاده سازی آن روی مجموعه داده جمع آوری شده از نظرات به زبان فارسی پرداخته شده است. نتایج آزمایش های تجربی نشان می دهد که رویکرد استخراج قوانین با بهره گیری از کیسه کلمات کارایی مناسبی در عقیده کاوی زبان فارسی دارد و همچنین تلفیق قوانین در سه سطح سبب بهبود دقت می شود.

کلیدواژه ها

عقیده کاوی، تجزیه و تحلیل احساسات، روش های مبتنی بر قانون، کیسه کلمات، گروه های تلگرامی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.