ارائه یک الگوریتم یادگیر مبتنی بر خصیصه های ذاتی جهت رتبه بندی صفحات وب

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 519

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TEDECE02_035

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

قبل از پیدایش وب، سامانه های بازیابی اطلاعات برای اسناد استاندارد با ساختار منظم که عموماً بر مبنای کلمه بودند، مورد استفاده قرارمی گرفت. اما با بوجود آمدن وب و ایجاد حجم وسیعی از اطلاعات، بازیابی اطلاعات با چالش های جدیدی مواجه شد. در حال حاضر موتورهایجستجو سامانه های بازیابی اطلاعات در وب به حساب می آیند. با توجه به رشد روز افزون اطلاعات و محتوای ب و همچنین تغییرات پویایی اطلاعات، استفاده از الگوریتم های رتبه بندی برای تعیین ترتیب و نتایج مرتبط و دقت نمایش اطلاعات یافت شده به کاربر، اهمیت بسیار یافته است. در این مقاله جهت پیدا کردن سریع صفحات مهم و با کیفیت، الگوریتم یادگیری مبتنی بر خصیصه های صفحات وب ارائه شده است. الگوریتم ارائهشده با اعمال وزن روی خصیصه های صفحات و مقایسه وزن اعمال شده با ارزش خصیصه صفحات، سعی در یافتن رتبه مناسب به منظور دسترسیراحت تر کاربران به صفحات با کیفیت از لحاظ محتویات داخلی شده است. جهت ارزیابی مجموعه داده ایی LETOR بکار برده شده است. نتایجآزمایشات حاکی از آن است که الگوریتم ارائه شده در مقایسه با الگوریتم های یادگیری که تاکنون ارائه شده است نتایج قابل توجهی را ارائه می دهد. همچنین الگوریتم ارائه شده با الگوریتم BM25 که مبتنی بر محتوا است مقایسه می شود و میزان اختلاف بین این دو الگوریتم در رتبه بندی بدست می آید، که بسیار مورد توجه است

نویسندگان

نگین قامشلو

دانشجوی کارشناسی ارشد، گروه کامپیوتر، دانشگاه آزاد اسلامی واحد کرمانشاه، کرمانشاه، ایران

فرهاد مردوخی

استادیار، استادیار گروه کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه رازی کرمانشاه،کرمانشاه، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • C. Castillo, ،Effective Web Crawling", Ph.D. Thesis, University of Chile, ...
  • R. Baeza-Yates, "Challenges in the interaction of information retrieval and ...
  • G. Salton, _ SMART retrieval system _ experiments in automatic ...
  • _ Robertson, ،Overview of the okapi projects", Journal of Docu ...
  • M. Henzinger, "Hyperlink analysis for the web? IEEE Internet ...
  • J. _ Kleinberg, _ _ _ ...
  • G. R. Xue, Q. Yang, H. J. Zeng, Y. Yu, ...
  • S.E. Robertson, van C..J. Rijsbergen, and M.F. Porter, ، Probabilistic ...
  • _ Xing, and A. Ghorbani. "Weighted pagerank algorithm." Commu nication ...
  • Z. Gyongyi, H. Ga rcia-Molina, and J. Pedersen, "Combating web ...
  • Neural Information Processing Systems", Vol. 14, _ 641-647, 2002. ...
  • R. Herbrich, T. Graepel, and K. Obermayer, "Large margin rank ...
  • Y. Freund, R. Iyer, R.E. Schapire, and Y. Singer, "An ...
  • Yager, R. Ronald, _ ordered weighted averaging aggregation operators in ...
  • Yager, R. Ronald, and K. Janusz, eds. _ ordered weighted ...
  • Y. Freund, R. Iyer, R. Schapire, and Y. Singer, "An ...
  • R. Herbrich, T. Graepel, and K. Obermayer, "Large margin rank ...
  • language models applied to Ad Hoc information retrieval. Proceedings of ...
  • L. Nie, B.D. Davison, X. Qi, "Topical link analysis for ...
  • T. Qin, T.Y. Liu, XD. Zhang, Z. Chen, and W.Y. ...
  • C onferenc e-TED 2016 1-2 June, Kermanshah, Iran ...
  • C Om fere nce-TED 2016 1-2 June, Kermanshah, Iran ...
  • نمایش کامل مراجع