دسته بندی مفهومی صفحات وب با استفاده از اطلاعات متن و پیوندهای بین صفحات وب
محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,007
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI11_109
تاریخ نمایه سازی: 5 آذر 1390
چکیده مقاله:
در این مقاله یکروش جدید خوشه بندی مفهومی صفحات وب مبتنی بر متن اتصالات بین صفحات وب و اصطلاحنامه معرفی می شود کلمات موجود در بین دو تگ < TITLE> برای هر صفحه وب به عنوان اطلاعات متنی و همچنین تعداد لینکهای بین صفحات به عنوان دو ویژگی برای سنجش شباهت بین صفحات در نظر گرفته شده است علاوه بر این پردازش مفهومی به منظور سنجش شباهت مفهومی بین کلمات با استفاده از یک اصطلاحنامه در حوزه مورد نظر انجام می شود با استفاده ازاین ویژگیها یک معیار شباهت تعریف شده است فرایند خوشه بندی نیز بصورت سلسله مراتبی انجام میشود. برای ارزیابی روش پیشنهادی آنرا برروی داده های مختلفی مورد آزمایش قرار دادیم که نتایج خوبی حاصل شد و همچنین الگوریتم پیشنهادی از سرعت خوبی برخوردار است.
نویسندگان
احمد عبداله زاده
دانشگاه صنعتی امیرکبیر
قربان خردمندیان
دانشگاه صنعتی امیرکبیر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :