الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,367

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCEE16_233

تاریخ نمایه سازی: 21 تیر 1393

چکیده مقاله:

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

کلیدواژه ها:

الگوریتم K-Means ، الگوریتم K-Means بهبود یافته ، پردازش متن ، خوشه بندی اسناد

نویسندگان

محمدرضا بهشتی پور

دانشگاه صنعتی مالک اشتر

بهروز مینایی بیدگلی

دانشگاه علم و صنعت ایران

محمدحسین الهی منش

دانشگاه آزاد اسلامی واحد قزوین، قزوین

عباس غلامزاده مراغه

دانشگاه صنعتی مالک اشتر