نظر کاو، کاوش نظرات و تحلیل احساسات در زبان فارسی

  • سال انتشار: 1397
  • محل انتشار: چهارمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
  • کد COI اختصاصی: DCBDP04_094
  • زبان مقاله: فارسی
  • تعداد مشاهده: 946
دانلود فایل این مقاله

نویسندگان

سعید حمدالهی اسکویی

دانشجوی کارشناسی ارشد، دانشکده فناوری اطلاعات و مهندسی کامپیوتر دانشگاه شهید مدنی آذربایجان، تبریز، ایران

عسگرعلی بویر

استادیار، دانشکده فناوری اطلاعات و مهندسی کامپیوتر دانشگاه شهید مدنی آذربایجان، تبریز، ایران

چکیده

با گسترش تجارت الکترونیکی، افراد زیادی کالاهای مورد نیاز خود را از اینترنت می خرند. همچنین افراد می توانند برای کالاها نظر ارسال کنند که این نظرها به عاملی تاثیرگذار در انتخاب کاربران برای خرید یک کالا یا خدمات تبدیل شده اند. همچنین تولیدکنندگان کالا و ارایه دهندگان خدمات نیز می توانند با بررسی و پیگیری این نظرات دریابند که کدام ویژگی های کالاهای تولید شده و خدمات ارایه شده توسط آنها مورد پسند کاربران واقع شده است و یا کاربران از کدام ویژگی ها راضی نیستند. با این حال، تعداد این نظرها بصورت روزافزون در حال افزایش است. برخی کالاهای محبوب ممکن است صدها نظر دریافت کنند که موجب می شود خواندن وپیگیری آنها برای یک مشتری بالقوه و یا تولیدکننده کالا بسیار دشوار و حتی ناممکن باشد. از این رو، نیاز به سیستمی است که بتواند نظرها را جمع آوری، تحلیل، ویژگی های محصول را استخراج و جهت گیری معنایی نظرها را تعیین کند. در این مقاله، روشی برای بررسی نظرات فارسی و استخراج ویژگی های محصول از داخل آنها با استفاده از برچسب گذاری POS برای جملات زبان فارسی و سپس دادن امتیاز به هر ویژگی و تعیین مثبت، منفی و یا خنثی بودن ویژگی و در نهایت تعیین جهت گیری معنایی کل نظر با استفاده از امتیاز تمام ویژگی ها ارایه می دهیم. در نهایت نیز خروجی به صورت تحت وب و در قالب موتور جستجوی نظرات، نمایش داده می شود.

کلیدواژه ها

تحلیل احساسات، نظر کاوی، پردازش زبان طبیعی، متن کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.