الگوریتم جدید خزنده های وب برای بهبود نتایج جستجو

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,131

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_290

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

خزش فرآیندی ست که اطلاعات را از وب جمع آوری و اندیس گذاری می کند تا بعدا توسط موتورهای جست و جو به عنوان منبعداده استفاده شوند. هدف فرآیند خزش این است که تا حد امکان، مفیدترین و مرتبطترین صفحات را با سرعت بالا و به صورتبهینه جمع آوری کند. با افزایش حجم اطلاعات در وب، اهمیت دسترسی به این اطلاعات هم بسیار افزایش پیدا کرده است. داشتنیک خزنده ی قوی، یعنی داشتن یک موتور جست و جوی قوی. سرعت بالای به روز رسانی اطلاعات و محدودیت منابعی نظیرزمان و حافظه باعث شده است تا تنها 8 تا 12 درصد از حجم عظیم صفحات وب توسط خزنده ها در مخزن محلی ذخیره شوند.عملیات خزش همیشه در عمق محدودی متوقف می شود، دلیل آن هم بسیار واضح است: محدودیت منابع. پس یک الگوریتمخوب باید پیش از اینکه به محدودیت منابع برخورد کند، بیشترین و مرتبط ترین صفحات را پیدا کند. در نتیجه پس از توقففرآیند خزش می توان مطمئن بود که بهترین مخزن محلی را در اختیار داریم. در این متن الگوریتمی بهینه با اهداف مذکورطراحی شده است که در ادامه به آن می پردازیم.

کلیدواژه ها:

نویسندگان

اسماء قیصری گودرزی

دانشجوی کارشناسی ارشد دانشگاه پیام نور

مهدی جوانمرد

استادیار دانشگاه پیام نور

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Heydon, Allan and Najork , Mark(2010); »Scalable and Extensive Web ...
  • Saname, Agrai And, Siman, Raye(2010); »Intelligent with arbitrary predicates«, In: ...
  • Sanim, Ejey, I., G.(2010); »Focused Crawling algorithm and new approaches ...
  • Sharma, S.(2011); »Web-Crawling Approaches in Search Engines«, 34" IT National ...
  • Pant, G., Saray, P., Sahara(2011); »F., Web Dynamics, edited by ...
  • Maarek, Y., S., Pelleg, D. Shtalhaim, M., Ur, S.(2012); »The ...
  • Hermes, FH, (2012); »Finding related pages in the world wide ...
  • McCallum, A.(20 _ 3); »Intelligence Ceawling«, In: Proceedings of the ...
  • Radhakishan, S.(20 13); »CRAYSE: design and imp lementation of a ...
  • GoogleGuide(2 _ 14); www. go ogleguide , c om/go ogle_works ...
  • نمایش کامل مراجع