Use of Generalized Language Model for Question Matching

  • سال انتشار: 1391
  • محل انتشار: ماهنامه بین المللی مهندسی، دوره: 26، شماره: 3
  • کد COI اختصاصی: JR_IJE-26-3_006
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 786
دانلود فایل این مقاله

نویسندگان

s Izadi

Electrical and Computer Engineering Department, Yazd University, Yazd, Iran

m Ghasemzadeh

Electrical and Computer Engineering Department, Yazd University, Yazd, Iran

چکیده

Question and answering service is one of the popular services in the World Wide Web. The main goal of these services is to find the best answer for user's input question as quick as possible. In order to achievethis aim, most of these use new techniques foe question matching. We have a lot of question andanswering services in Persian web, so it seems that developing a question matching model might be useful. This paper introduces a new question matching model for Persian. This model is based on statistical language model and employs generalized bigram and trigram model. We also describe someresults regarding the employment of natural language processing in question matching model. Most of the Q&A services have large number of questions and answers; hence we considered an optimized implementation for the model. We evaluated our model with Rasekhoon question and answering archivewhich contains about 18000 pairs of questions and answers. The results showed the improvement of precision and recall measures through using this model

کلیدواژه ها

Question Matching,Natural Language Processing,Statistical Language Model,Q&A Services

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.