ارائه روشی جدید مبتنی بر قطبیت برای بهبود نظرکاوی فارسی

  • سال انتشار: 1397
  • محل انتشار: دومین کنفرانس ملی هوش تجاری و راهبردها
  • کد COI اختصاصی: BICO02_012
  • زبان مقاله: فارسی
  • تعداد مشاهده: 807
دانلود فایل این مقاله

نویسندگان

محبوبه شمسی

گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم

عبدالرضا رسولی کناری

گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم

مهدیه واحدی پور

گروه مهندسی کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم

چکیده

در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربر مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی (NLP )، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این مقاله روشی جدید مبتنی بر قطبیت نظرات فارسی تلفن همراه سایت دیجی کالا برای تعیین گروه های قطبی مختلف مانند مثبت و منفی ارائه می کنیم و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، تبادلات گرادیان تصادفی، برگشت منطقی، جنگل تصادفی و یادگیری عمیق مانند شبکه عصبی کانولوشن و حافظه طولانی کوتاه مدت به منظور دستیابی به عملکرد آن ها براساس پارامترهایی مانند صحت، فراخوان، اندازه F و دقت این روش مورد توجه قرار داده ایم. روش پیشنهادی با الگوریتم های ماشین بردار پشتیبان بین 5 تا 24 درصد و تبادلات گرادیان تصادفی بین 7 تا 38 درصد و برگشت منطقی بین 5 تا 38 درصد در تمام روش های n-gram و شبکه عصبی کانولوشن به میزان 4 درصد دقت نسبت به روش قبلی به دست آورده است.

کلیدواژه ها

تحلیل احساسات؛ نظرکاوی؛ پیش پردازش متن؛ یادگیری ماشین؛ یادگیری عمیق

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.