ارایه ی الگوریتمی به منظور خوشه بندی صفحات وب براساس محتوا و لینک
سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 469
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_SJIE-33-1_016
تاریخ نمایه سازی: 1 مرداد 1397
چکیده مقاله:
وجود یک موتور جست و جوی کارا می تواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جست وجو، انتخاب مناسب ترین صفحات در مواجهه با پرسش های چند وجهی کاربران است. خوشه بندی صفحات براساس محتوا و لینک رویکردی است که برای حل چنین مسایلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتم های موجود، به نام CohsMix، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخ ها و افزایش سرعت حل بهبود داده شده است. تعیین نقطه ی شروع مناسب، استفاده از خواص شبکه های پیچیده به منظور ساده سازی محاسبات، و محاسبه ی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان می دهد که الگوریتم بهبود یافته، کیفیت جواب ها را ارتقا داده و باعث افزایش سرعت حل می شود. همچنین، به عنوان مطالعه ی موردی، داده های مربوط به وبلاگ های فارسی استخراج و الگوریتم بهبود یافته روی این داده ها اجرا خواهد شد.
کلیدواژه ها:
نویسندگان
محمد فتحیان
استاد، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران
امیرمحسن کریمی مجد
دانشجوی دکتری، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران