الگوریتم جدید خزنده های وب برای بهبود نتایج جستجو
محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,131
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM01_290
تاریخ نمایه سازی: 10 شهریور 1393
چکیده مقاله:
خزش فرآیندی ست که اطلاعات را از وب جمع آوری و اندیس گذاری می کند تا بعدا توسط موتورهای جست و جو به عنوان منبعداده استفاده شوند. هدف فرآیند خزش این است که تا حد امکان، مفیدترین و مرتبطترین صفحات را با سرعت بالا و به صورتبهینه جمع آوری کند. با افزایش حجم اطلاعات در وب، اهمیت دسترسی به این اطلاعات هم بسیار افزایش پیدا کرده است. داشتنیک خزنده ی قوی، یعنی داشتن یک موتور جست و جوی قوی. سرعت بالای به روز رسانی اطلاعات و محدودیت منابعی نظیرزمان و حافظه باعث شده است تا تنها 8 تا 12 درصد از حجم عظیم صفحات وب توسط خزنده ها در مخزن محلی ذخیره شوند.عملیات خزش همیشه در عمق محدودی متوقف می شود، دلیل آن هم بسیار واضح است: محدودیت منابع. پس یک الگوریتمخوب باید پیش از اینکه به محدودیت منابع برخورد کند، بیشترین و مرتبط ترین صفحات را پیدا کند. در نتیجه پس از توقففرآیند خزش می توان مطمئن بود که بهترین مخزن محلی را در اختیار داریم. در این متن الگوریتمی بهینه با اهداف مذکورطراحی شده است که در ادامه به آن می پردازیم.
کلیدواژه ها:
نویسندگان
اسماء قیصری گودرزی
دانشجوی کارشناسی ارشد دانشگاه پیام نور
مهدی جوانمرد
استادیار دانشگاه پیام نور
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :