چارچوب جدید برای بهبود کارایی خوشه بندی ترکیبی مبتنی بر استفاده از زیرمجموعه ای از خوشه های اولیه

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 284

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_138

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

ما در جهانی پر از داده زندگی میکنیم. هر روزه انسانها با حجم وسیعی از اطلاعات روبه رو هستند که باید آنها را ذخیره سازی یا نمایش دهند. یکی از روشهای حیاتی کنترل و مدیریت این داده ها، گروه بندی و دسته بندی آنها در خوشه ها میباشد. امروزه خوشه بندی نقش حیاتی در روشهای بازیابی اطلاعات برای سازماندهی مجموعه های بزرگ درون تعداد کمی خوشه معنادار دارد. یکی از مهمترین انگیزه های استفاده از خوشهبندی، تعیین و آشکار کردن ساختار ذاتی و پنهان یک مجموعه داده است . کاربران انسانی به علت تفاوت در سلیقه و طرز تفکرات مختلف از کشف ساختار ذاتی و درونی مجموعه داده ای بزرگ متون ناتوان هستند. الگوریتم های خوشه بندی ترکیبی چند الگوریتم خوشه بندی را باهم ترکیب میکنند تا در نهایت به یک سیستم کلی خوشهبندی برسد. روشهای خوشهبندی ترکیبی برای یافتن راه های بهتری با استفاده از بیرون کشیدن اطلاعات از چندین افراز اولیه داده ها میباشد. از آنجا که الگوریتم های خوشه بندی مختلف به نقاط مختلف داده نگاه میکنند، آنها میتوانند افرازهای مختلفی را از این چنین داده هایی تولید کنند. با ترکیب افرازهای بدست آمده از الگوریتمهای مختلف، ایجاد یک افراز با کارایی بالا ممکن است، حتی اگر خوشه ها از هم بسیار متراکم باشند. اکثر مطالعات در این حوزه تمامی خوشه های اولیه را بررسی میکنند. در این پایان نامه به روش جدیدی می پردازیم که به جای استفاده از تمامی خوشه های اولیه تولید شده، از پایدارترین آنها استفاده کنیم. برای انتخاب خوشه های پایدارتر از تابع توافقی مبتنی بر ماتریس همبستگی استفاده می کنیم. روش انتخاب پایدارترین خوشه ها بر اساس معیار پایداری خوشه مبتنی بر معیار فیشر صورت میگیرد و سپس خوشه های بدست آمده را توسط الگوریتم ژنتیک مورد ارزیابی قرار میدهیم و طیق این الگوریتم پایدارترین خوشه ها انتخاب میشود. نتایج تجربی روی چندین مجموعه داده نشان می هد که خروجی روش پیشنهادی خوشه های متنوع و با پایداری بالا میباشد.

نویسندگان

مائده همتیان

گروه کامپیوتر ، مرکز آغاجاری ، پیام نور ، خوزستان ، ایران