روشی جدید برای خوشه بندی مستندات متنی براساس آنتولوژی
محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,578
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIKT03_064
تاریخ نمایه سازی: 22 فروردین 1387
چکیده مقاله:
امروزه خوشه بندی نقش حیاتی در روشهای بازیابی اطلاعات برای سازمانبندی مجموعه های بزرگ مستندات متنی مانند وب، درون تعداد کمی خوشه معنادار دارد . معمولا در خوشه بندی مستندات متنی با خوشه بندی ابعاد بسیار بالای فضای داده مواجه هستیم که بندی به این شکل، مشکل بنظر می رسد . علاوه بر این، معمولا با استفاده از الگوریتم های خوشه بندی متفاوت، نتایج متفاوتی بدست می آید و مستندات درون خوشه های بدست آمده نیز ارتباط معنایی لازم را با هم ندارند . برای حل این مشکلات ما هسته انجام خوشه آنتولوژی مانند وردنت را به عنوان دانش پس زمینه، درون فرایند خوشه بندی مستندات متنی جایگذاری نمودیم . سپس به صورت تجربی روش جدید را با تکنیکهای خوشه بندی ساده برای مجموعه داده خبرگزاری رویتر مقایسه نمودیم . نتایج بدست آمده از خوشه بندی متن همراه با استفاده از دانش پس زمینه در مقایسه با خوشه بندی متن بدون دانش پس زمینه، بهبود داشته است .
کلیدواژه ها:
نویسندگان
احسان عسگریان
دانشگاه صنعتی شریف
جعفر حبیبی
دانشگاه صنعتی شریف
شهروز معاون
دانشگاه صنعتی شریف
حسین معین زاده
دانشگاه علم و صنعت
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :