تشخیص و حذف بهینه ی صفحات شبه تکراری

  • سال انتشار: 1394
  • محل انتشار: کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر
  • کد COI اختصاصی: COMCONF01_215
  • زبان مقاله: فارسی
  • تعداد مشاهده: 554
دانلود فایل این مقاله

نویسندگان

محمود محمدی

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

محمد طهماسبی

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

صبا حاتمی علم

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

محمد ابراهیم شیری

استادیار نام دانشگاه صنعتی امیرکبیر

چکیده

موتور جستجو یک ابزار مهم برای کاربران برای دسترسی به منابع اطلاعاتی شبکه است .ب ههرحال، تعداد زیادی از صفحات تکراری و شبه تکراری به بار مسئولیت کاربر افزوده شده اند .در حال حاضر،موتورهای جستجو فقط صفحات تکراری را حذف میکنند ولی هنوز استراتژیهای مؤثری در تشخیص و حذف صفحات شبه تکراری ندارند .این مقاله روشهای موجود برای انتخاب روش مناسب برای تشخیص صفحات شبه تکراری را بررسی کرده است و استراتژی حذف را بهینهسازی کرده است تا تضمین کند که صفحات شبه تکراری فضای زیادی را در نتایج جستجو اشغال نمیکنند وقتی که ب هطور مؤثر استفاده میشوند .اینها به کاربران اجازه خواهند داد که اطلاعات موردنیاز را سادهتر بازیابی کنند

کلیدواژه ها

موتورجستجو ، بازیابی اطلاعات ، شبه تکراری ، تشخیص تکراری ، روشهای رتبه بندی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.