An Ensemble Click Model for Web Document Ranking

  • سال انتشار: 1399
  • محل انتشار: ماهنامه بین المللی مهندسی، دوره: 33، شماره: 7
  • کد COI اختصاصی: JR_IJE-33-7_006
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 336
دانلود فایل این مقاله

نویسندگان

D. Bidekani Bakhtiarvand

Department of Artificial Intelligence, Faculty of Computer Engineering, K. N. Toosi University of Technology, Tehran, Iran

S. Farzi

Department of Artificial Intelligence, Faculty of Computer Engineering, K. N. Toosi University of Technology, Tehran, Iran

چکیده

Annually, web search engine providers spend a lot of money on re-ranking documents in search engine result pages (SERP). Click models provide advantageous information for re-ranking documents in SERPs through modeling interactions among users and search engines. Here, three modules are employed to predict users clicks on SERPs simultaneously, the first module tries to predict users click behaviors using Probabilistic Graphical Models, the second module is a Time-series Deep Neural Click Model which predicts users clicks on documents and finally, the third module is a similarity-based measure which creates a graph of document-query relations and uses SimRank Algorithm to predict the similarity. After running these three simultaneous processes, three click probability values are fed to an MLP classifier as inputs. The MLP classifier learns to decide on top of the three preceding modules, then it predicts a probability value which shows how probable a document is to be clicked by a user. The proposed system is evaluated on the Yandex dataset as a standard click log dataset. The results demonstrate the superiority of our model over the well-known click models in terms of perplexity.

کلیدواژه ها

Click Modeling Document Re, ranking Modeling Users Behavior Search Engine Result Page Enhancement

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.