انتخاب نمونه های آموزشی بهینه براساس معیارهای فاصله برای آموزش رده بندی احساسات

  • سال انتشار: 1399
  • محل انتشار: مجله علوم رایانشی، دوره: 5، شماره: 3
  • کد COI اختصاصی: JR_CSJI-5-3_003
  • زبان مقاله: فارسی
  • تعداد مشاهده: 102
دانلود فایل این مقاله

نویسندگان

شیوا نوری سرای

دانشجوی کارشناسی ارشد، دانشکده مهندسی فناوری اطالعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران

جعفر طهمورث نژاد

استادیار دانشکده مهندسی فناوری اطلاعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران

چکیده

افزایش چشمگیر دسترس پذیری به نظرها و توصیه های برخط باعث می شود رده بندی احساسات در متون کوتاه یکی از موضوع های جالب توجه در تحقیقات علمی و صنعتی باشد. در زمینه رده بندی احساسات، اصطلاحات به کار برده شده در دامنه های مختلف ممکن است متفاوت باشند. درنتیجه مدلی که با داده های برچسب دار آموزشی (دامنه منبع) یادگیری می شود ممکن است عملکرد خوبی در برچسب گذاری داده های آزمایشی (دامنه هدف) نداشته باشد. یادگیری انتقالی و انطباق دامنه دو راه حل مفید برای مواجهه با این مشکل هستند. یادگیری انتقالی و انطباق دامنه، توزیع های دامنه منبع و هدف را به هم نزدیک می کنند تا عملکرد رده بند در دامنه هدف بهبود یابد اما نکته حائز اهمیت این است که کدام دامنه از مجموعه دامنه های نامزد به عنوان دامنه منبع انتخاب شود. روش پیشنهادی در این مقاله یک ترکیب خطی از معیارهای فاصله بین توزیع دامنه های منبع و هدف است که بهترین دامنه منبع را برای یادگیری رده بند انتخاب می کند. روش پیشنهادی بر روی مجموعه داده های همگن و ناهمگن ارزیابی شده است. همان طورکه نتایج نشان می دهد، مدل پیشنهادی، در مجموعه داده همگن با احتمال ۴۷.۱ درصد (۵.۹ درصد در مدل تصادفی) و در مجموعه داده ناهمگن با احتمال ۲۳.۱ درصد (۸.۳ درصد در مدل تصادفی) می تواند دامنه منبع صحیح را انتخاب کند که حاکی از بهبود چشمگیر عملکرد مدل پیشنهادی نسبت به مدل تصادفی در انتخاب دامنه منبع صحیح است.

کلیدواژه ها

رده بندی احساسات, معیار فاصله, یادگیری انتقالی, انتقال دانش

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.