بررسی روش های انتخاب ویژگی در تحلیل احساسی زبان فارسی

  • سال انتشار: 1395
  • محل انتشار: دومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق
  • کد COI اختصاصی: BPJ02_177
  • زبان مقاله: فارسی
  • تعداد مشاهده: 803
دانلود فایل این مقاله

نویسندگان

علیرضا برزگر

دانشجو ارشد، دانشگاه آزاد اسلامی واحد صفادشت

مریم عادل خواه

عضو هیأت علمی دانشگاه خوارزمی

چکیده

امروزه با رشد چشمگیر بازدیدهای online دراینترنت، تحلیلات احساسی توجه زیادی را در انجمن پردازش اطلاعات زبان اصلاح شده و طبیعی به خود جلب کرده است. تاکنون تحقیقات بسیار کمی بر روی تحلیلات احساسی برای زبان فارسی انجام شده است. این مقاله به بررسی مسئله ی طبقه بندی احساسی برای بازدید مشتریان (online) به زبان فارسی می پردازد. سه چالش متن فارسی، استفاده از تنوع وسیعی از پسوندهای صرفی، فاصله دادن مختلف کلمه و تعداد کلمات غیر رسمی یا محاوره ای می باشد. در این مقاله ما به مطالعه ی این چالش ها از طریق بررسی یک طرح برای طبقه بندی احساسی زبان فارسی می پردازیم. این طرح براساس ریشه یابی و انتخاب ویژگی است و برایط طبقه بندی از الگوریتم Navie Bayes استفاده می کند. به علاوه، ما به ارائه ی یک روش انتخاب ویژگی جدید می پردازیم که براساس روش اطلاعات متقابل است تا از میان ویژگی های استخراج شده اولیه، مجموعه ای از بهترین ویژگی ها را استخراج کند. و در نهایت عملکرد طرح را روی یک مجموعه ی گردآوری شده ای از بازدیدهای تلفن همراه ارزیابی می کند، که نتایج حاصل، مؤثر بودن طرح مورد بررسی را نشان می دهد.

کلیدواژه ها

انتخاب ویژگی، تحلیلات احساسی، زبان فارسی، طبقه بندی احساسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.