تشخیص و حذف بهینه ی صفحات شبه تکراری

محمود محمدی; محمد طهماسبی; صبا حاتمی علم; محمد ابراهیم شیری

تشخیص و حذف بهینه ی صفحات شبه تکراری

محل انتشار: کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 628

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/404319

شناسه ملی سند علمی:

COMCONF01_215

تاریخ نمایه سازی: 8 آذر 1394

چکیده مقاله:

موتور جستجو یک ابزار مهم برای کاربران برای دسترسی به منابع اطلاعاتی شبکه است .ب ههرحال، تعداد زیادی از صفحات تکراری و شبه تکراری به بار مسئولیت کاربر افزوده شده اند .در حال حاضر،موتورهای جستجو فقط صفحات تکراری را حذف میکنند ولی هنوز استراتژیهای مؤثری در تشخیص و حذف صفحات شبه تکراری ندارند .این مقاله روشهای موجود برای انتخاب روش مناسب برای تشخیص صفحات شبه تکراری را بررسی کرده است و استراتژی حذف را بهینهسازی کرده است تا تضمین کند که صفحات شبه تکراری فضای زیادی را در نتایج جستجو اشغال نمیکنند وقتی که ب هطور مؤثر استفاده میشوند .اینها به کاربران اجازه خواهند داد که اطلاعات موردنیاز را سادهتر بازیابی کنند

کلیدواژه ها:

موتورجستجو ، بازیابی اطلاعات ، شبه تکراری ، تشخیص تکراری ، روشهای رتبه بندی

نویسندگان

محمود محمدی

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

محمد طهماسبی

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

صبا حاتمی علم

دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد

محمد ابراهیم شیری

استادیار نام دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

iResearch, _ Trend of Personal Portals Research Report", 2006. ...
Z. LiW. K. Ng, A. Sun, _ data extraction based ...
J. Dean, M. R. Henzinger, "Finding related pages in the ...
J.W. Kirriemuir & P. Willett, "Identification of duplicate and nearduplicate ...
analysis", Program- automated library and information, vol.29, pp. 241-256, 1995. ...
P.B. Wu, Q.X. Chen, L. Ma, "The Study on Large ...
Gurmeet Singh Manku. "Detecting Near Duplicates for Web Crawling". International ...
J.W. Cooper, A. Coden, E.W. Brown, "Detecting similar documents using ...
Y.J. Cao, Z.D. Niu, X.P. Peng, P. Jiang, _ near-duplicate ...
A. Chowdhury, O. Frieder, D. Grossman, M.C. McCABE, "Collection statistics ...
Transactions On Information System, pp. 171-191, 2002. ...

نمایش کامل مراجع