A Novel Unsupervised Learning Method for Word Sense Disambiguation using Word Vector

  • سال انتشار: 1398
  • محل انتشار: پنجمین کنفرانس ملی مهندسی برق و مکاترونیک ایران
  • کد COI اختصاصی: ICELE05_173
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 397
دانلود فایل این مقاله

نویسندگان

Ali Naserasadi

Computer Group, Zarand Higher Education Complex, Zarand, Iran,

Majid Estilayee

Technical and Engineering, Payam-e Nour, Tehran, Iran,

چکیده

Word sense disambiguation has many applications in different fields. However, existing word sense disambiguation algorithms are mostly based on context and semantic term coverage, and usually do not consider the distance influence of words and ambiguous words in context. To this end, in this paper, a novel unsupervised learning method based on word vector is proposed. The vector is used to represent the context and the meaning, and the semantic similarity and the distribution frequency of the semantics of the fusion context and the meaning of the semantics are considered. The method is tested on SemEval-2010 Dataset and the results show that the method outperforms the state-of-the-art algorithms.

کلیدواژه ها

Word Sense Disambiguation, Word Vector, Natural Language Processing, Machine Translation

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.