تشخیص ربات های ناهنجار در پرس وجوهای موتور جستجو

سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 360

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_PADSA-5-4_007

تاریخ نمایه سازی: 7 اردیبهشت 1400

چکیده مقاله:

موتورهای جستجو را میتوان بهترین ابزار کارآمد برای مدیریت، بازیابی و استخراج اطلاعات مهم از مجموعه عظیم دادههای وب معرفی کرد. این موتورها پهنه وسیع وب را بهطور زمانبندیشده پیمایش میکنند و به جمعآوری صفحات بیشمار ذخیرهشده در گوشه کنار وب میپردازند. ارائهدهندگان موتورهای جستجو همواره به دنبال بهبود ارتباط نتایج و کاهش زمان پاسخ به کاربران هستند، اما هر دو این موارد میتواند تحت تاثیر ترافیک خودکار ارسالشده از سوی رباتها قرار گیرد. در این مقاله ابتدا به تعریف رباتها و چالش تشخیص آنها پرداخته شده است. سپس، روشی با نام بوف برای تشخیص رباتهای جستجو ارائه شده است. در روش بوف برای دستیابی به دقتی بالا در تشخیص رباتهای ناهنجار، از پارامترهای مختلف و نسبتا زیادی برای مدلکردن رفتار کاربران استفاده شده است. پس از تعیین اولویت پارامترها در تشخیص ماهیت کاربران، درخت تصمیمی ساخته شده و اقدام به دستهبندی کاربران در گروه-های انسان، ربات مخرب، ربات مجاز و نامشخص میکند. رباتهای تشخیص دادهشده در درخت تصمیم، بخش دیگری از سامانه تشخیص ربات را فعال میکند که قادر است با توجه به الگوی رفتاری شبکههای رباتی، حتی رباتهایی با نرخ درخواست پایین را نیز شناسایی کند. ارزیابی روش پیشنهادی بر روی دادهای آزمون، صحت ۹۷/۷درصدی را در تشخیص ماهیت کاربران نشان میدهد که حداقل بهبود دقت ۹/۹ درصدی را نسبت به روشهای بررسیشده در این حوزه نشان میدهد. رقم قابل توجهی که در هر روز تصمیمگیری در مورد ۲۲۳۰ کاربر را تحت تاثیر قرار میدهد.

نویسندگان

محمدجواد سروقدمقدم

دانشگاه جامع امام حسین (ع)

مهدی نقوی

دانشگاه جامع امام حسین (ع)

مجید غیوری ثالث

دانشگاه جامع امام حسین (ع)

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A. ZareBidaki and F. KaveYazdi, “Big data management in search ...
  • C. L. P. Chen and C.-Y. Zhang, “Data-intensive applications, challenges, ...
  • F. Yu, Y. Xie, and Q. Ke, “Sbotminer: large scale ...
  • B. Kitts, J. Y. Zhang, G. Wu, W. Brandi, J. ...
  • N. Sadagopan and J. Li, “Characterizing typical and atypical user ...
  • H. Kang, K. Wang, D. Soukal, F. Behr, and Z. ...
  • B. Kitts, J. Y. Zhang, A. Roux, and R. Mills, ...
  • J. Zhang, Y. Xie, F. Yu, D. Soukal, and W. ...
  • J. P. John, F. Yu, Y. Xie, A. Krishnamurthy, and ...
  • S. Khattak, N. R. Ramay, K. R. Khan, A. Syed, ...
  • N. Buzikashvili, “Sliding window technique for the web log analysis,” ...
  • Y. Zhang and A. Moffat, “Separating Human and Non-Human Web ...
  • B. J. Jansen, A. Spink, and C. Blakely, “Defining a ...
  • N. Daswani and M. Stoppelman, “The Google click quality and ...
  • J. W. Stokes, G. Buehrer, K. Chellapilla, and J. C. ...
  • O. Duskin and D. G. Feitelson, “Distinguishing humans from robots ...
  • A. Yasmin, M. C. Weigle, and M. L. Nelson, “Access ...
  • M. Srivastava, A. K. Srivastava, R. Garg, and P. K. ...
  • W. Dong, X. Lei, Z. Hui, L. Hebing, Z. Hao, ...
  • G. Buehrer, J. W. Stokes, and K. Chellapilla, “A large-scale ...
  • “https://browscap.org/ua-lookup,” 2016. [Online]. ...
  • G. Chandrashekar and F. Sahin, “A survey on feature selection ...
  • M. SanieiAbade, S. Mahmoodi, and M. Taherparvar, “practical data mining,” ...
  • J. Han, M. Kamber, and J. Pei, “Data mining: comcepts ...
  • “Blacklist Check.” [Online]. Available: http://whatismyipaddress.com/blacklist-check. ...
  • نمایش کامل مراجع