Word sense disambiguation based on lexical weighting in conceptual density

  • سال انتشار: 1394
  • محل انتشار: دومین کنفرانس بین المللی ابزار و تکنیکهای مدیریت
  • کد COI اختصاصی: MANAGTOOLS02_268
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 864
دانلود فایل این مقاله

نویسندگان

Ali Golkar

Department of Computer Science & IT, School of Electrical and Computer Engineering Shiraz University, Iran

Seyed Shahabeddin Tabatabaei

Young Researchers and Elite Cub, Abadeh Branch, Islamic Azad University, Abadeh, Iran

Azita Yazdani

Teacher at the University of Applied sciences, Abadeh, Iran

Neda Khaledian

Industrial Engineering Department Azad University, Lenjan Branch, Lenjan,Iran

چکیده

In this paper, examining the key role of the noun in the lexical disambiguaty of English text, a new method of combining conceptual density method with giving weights to some unambiguous nouns in COCA Corpus and Brown Corpus for word sense disambiguation is presented. In this method, as well as conceptual density, the focus is on the most covered nouns in the hierarchical structure of WordNet, with the difference expressing the weight is given based on three parameters to unambiguous nouns while the process of disambiguation is done based upon them. So nouns with more semantic closeness to the ambiguous noun, have more impact on the disambiguation process. The results of conducted studies using these three weighting parameter, either separately or in combination indicating an acceptable level of accuracy in disambiguation.

کلیدواژه ها

Lexical disambiguaty, Conceptual Density, weighting, WordNet, word sense disambiguation (WSD)

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.