ارایه ی الگوریتمی به منظور خوشه بندی صفحات وب براساس محتوا و لینک

سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 469

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SJIE-33-1_016

تاریخ نمایه سازی: 1 مرداد 1397

چکیده مقاله:

وجود یک موتور جست و جوی کارا می تواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جست وجو، انتخاب مناسب ترین صفحات در مواجهه با پرسش های چند وجهی کاربران است. خوشه بندی صفحات براساس محتوا و لینک رویکردی است که برای حل چنین مسایلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتم های موجود، به نام CohsMix، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخ ها و افزایش سرعت حل بهبود داده شده است. تعیین نقطه ی شروع مناسب، استفاده از خواص شبکه های پیچیده به منظور ساده سازی محاسبات، و محاسبه ی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان می دهد که الگوریتم بهبود یافته، کیفیت جواب ها را ارتقا داده و باعث افزایش سرعت حل می شود. همچنین، به عنوان مطالعه ی موردی، داده های مربوط به وبلاگ های فارسی استخراج و الگوریتم بهبود یافته روی این داده ها اجرا خواهد شد.

نویسندگان

محمد فتحیان

استاد، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران

امیرمحسن کریمی مجد

دانشجوی دکتری، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران