الگوریتم جدید خزنده های وب برای بهبود نتایج جستجو
- سال انتشار: 1393
- محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات
- کد COI اختصاصی: CSITM01_290
- زبان مقاله: فارسی
- تعداد مشاهده: 1313
نویسندگان
دانشجوی کارشناسی ارشد دانشگاه پیام نور
استادیار دانشگاه پیام نور
چکیده
خزش فرآیندی ست که اطلاعات را از وب جمع آوری و اندیس گذاری می کند تا بعدا توسط موتورهای جست و جو به عنوان منبعداده استفاده شوند. هدف فرآیند خزش این است که تا حد امکان، مفیدترین و مرتبطترین صفحات را با سرعت بالا و به صورتبهینه جمع آوری کند. با افزایش حجم اطلاعات در وب، اهمیت دسترسی به این اطلاعات هم بسیار افزایش پیدا کرده است. داشتنیک خزنده ی قوی، یعنی داشتن یک موتور جست و جوی قوی. سرعت بالای به روز رسانی اطلاعات و محدودیت منابعی نظیرزمان و حافظه باعث شده است تا تنها 8 تا 12 درصد از حجم عظیم صفحات وب توسط خزنده ها در مخزن محلی ذخیره شوند.عملیات خزش همیشه در عمق محدودی متوقف می شود، دلیل آن هم بسیار واضح است: محدودیت منابع. پس یک الگوریتمخوب باید پیش از اینکه به محدودیت منابع برخورد کند، بیشترین و مرتبط ترین صفحات را پیدا کند. در نتیجه پس از توقففرآیند خزش می توان مطمئن بود که بهترین مخزن محلی را در اختیار داریم. در این متن الگوریتمی بهینه با اهداف مذکورطراحی شده است که در ادامه به آن می پردازیم.کلیدواژه ها
خزش ، الگوریتم ، موتور جست و جو ، خزنده ، بهینه سازیمقالات مرتبط جدید
- کارآفرینی در کتابخانه های عمومی با راه اندازی خدمات مشاوره اطلاعاتی و مشاوره خوانندگان
- متاورس: مباحثی از فرصت های حرفه ای و مشاغل در گستره فناوری نوین
- بررسی معماری و بلوغ کسب و کار رایانش ابری بر مبنای مدیریت امنیت اطلاعات در علم اطلاع شناسی (مطالعه موردی شرکت های دانش بنیان پارک فناوری ارتباطات و اطلاعات)(چارچوب همکاری های بین رشته ای و فرا رشته ای برای کارآفرینی دانش بنیان)
- ایجاد سازمان نظام مدیریت اطلاعات و دانش (نماد)
- لزوم توجه به فرصت های جدید بازارکار در محتوای درسی رشته علم اطلاعات و دانش شناسی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.