بررسی روشهای پیش بینی موضوع صفحات وب در خزشگرهای کانونی

  • سال انتشار: 1393
  • محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات
  • کد COI اختصاصی: CSITM01_449
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1012
دانلود فایل این مقاله

نویسندگان

رامین دلیر

دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)

محمدرضا حسنی آهنگر

استادیار گروه کامپیوتر دانشگاه جامع امام حسین (ع)

چکیده

در چند سال گذشته، حجم و مقیاس اینترنت به صورت نمایی رشد کرده است و این رشد، دستیابی به اطلاعات مرتبط را روز بهروز مشکل تر نموده است. موتور جستجوها برای ارائه اطلاعات مرتبط با موضوع از خزشگرهای کانونی بهره میبرند. مسئله اصلیدر طراحی خزشگرهای کانونی چگونگی پیش بینی موضوع صفحات وب قبل از واکشی و جلوگیری از مشاهده صفحات غیر مرتبطاست. در این مقاله روشهای خزشگرهای کانونی در پیش بینی موضوع صفحات وب، بطور کامل مورد بررسی قرار می گیرد. سپسبراساس پارامتر ها و تحلیل متن، طبقه بندی خزشگرهای کانونی ارائه میشود. بر اساس این تحقیق، پیشنهادی برای چگونگیتوسعه های آینده در تحقیقات خزشگرهای کانونی ارائه می گردد.

کلیدواژه ها

طبقه بندی متن، خزشگر، خزشگر کانونی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.