خوشه بندی اسناد متنی با استفاده از روش ترکیبی الگوریتم جستجوی گرانشی و C- میانگین فازی

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 999

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CCITC01_037

تاریخ نمایه سازی: 27 آبان 1393

چکیده مقاله:

خوشه بندی اسناد متنی به طور گسترده ای در زمینه های مختلف علوم، بخصوص در داده کاوی و بازیابی اطلاعات کاربرد داشته است. خوشه بندی به مفهوم تقسیم مجموعه ای از اشیا در تعدادی خوشه است، بطوریکه اشیا موجود در یک خوشه بیشترین میزان شباهت را به یکدیگر د اشته باشند. روش های متعددی در زمینه خوشه بندی، به خصوص خوشه بندی اسناد متنی پیشنهاد و به کاربرده شده است. در این مقاله با ترکیب الگوریتم جستجوی گرانشی و الگوریتم C- میانگین فازی روشی به نام FCM-GSA پیشنهاد شده است. این روش، با الکوریتم FCPSO که ترکیبی از الگوریتم های پرندگان و C- میانگین فازی است مورد مقایسه قرار گرفته است. در آزمایشات انجام شده، ابتدا پیش پردازش هایی برای استخراج ویژگی های متون صورت می گیرد. پس از آن الگوریتم پیشنهادی روی اسناد منتخب از مجموعه داده های Reuters-21587 و 20Newsgroup اعمال می شود. نتایج آزمایشات نشان داده که روش پیشنهادی در این مقاله، در مقایسه با روش FCPSO عملکرد و کارآیی بهتری را در خ وشه بندی اسناد متنی داشته است.

کلیدواژه ها:

خوشه بندی ، خوشه بندی اسناد متنی ، الگوریتم جستجوی گرانشی ، الگوریتم C- میانگین فازی ، الگوریتم پرندگان

نویسندگان

مینا میرحسینی

عضو هیئت علمی مجتمع آموزش عالی بم، بم، ایران