بررسی خزنده های وب و انواع مختلف آن

  • سال انتشار: 1393
  • محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCONF02_492
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2766
دانلود فایل این مقاله

نویسندگان

محدثه حسین پور

دانشجوی کارشناسی ارشد دانشگاه غیرانتفاعی علم و فرهنگ

ندا جهانگیری

دانشجوی کارشناسی ارشد دانشگاه غیرانتفاعی علم و فرهنگ

هاجر یاری نسب

دانشجوی کارشناسی ارشد دانشگاه غیرانتفاعی علم و فرهنگ

چکیده

وب مجموعه ی عظیمی از داده های امروزی است که روز به روز در حال افزایش است.با توجه به اندازه فعلی وب و ماهیت پویای آن، ایجاد یک مکانیسم جستجوی کارآمد بسیار مهم است. تعداد گسترده ای از صفحات وب هر روز در حال اضافه شدن هستند و اطلاعات نیز به طور مداوم در حال تغییر هستند. موتورهای جستجو برای استخراج اطلاعات ارزشمند از اینترنت استفاده می شود خزنده وب که بخش اصلی موتور جست و جو می باشد، یک برنامه نرم افزاری کامپیوتر است که شبکه جهانی وب را با یک روش علمی، به شیوه خود کار و در مد منظمی مرور می کند. خزنده وب باعث ایجاد ترافیک زیادی در وب می شود، برای کم کردن اثرات منفی این ترافیک بر روی وب سایت ها، رفتارهای خزنده وب ما که مثل یک وب سرور شخصی به وسیله پیاده سازی پروتکل استثنای روبات در یک فایل robot.txt تنظیم شوند. این مقاله به طور خلاصه مفاهیم خزنده وب ، معماری و انواع مختلف آن مورد بررسی قرار می دهد.

کلیدواژه ها

خزنده ی وب، موتور جستجو، خزیدن، الگوریتم های خزیدن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.