خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک

سال انتشار: 1391
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 680

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IJIE-23-2_005

تاریخ نمایه سازی: 6 شهریور 1393

چکیده مقاله:

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف ، یک مساله غیرخطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است . در مسائل خوشه بندی در دنیای واقعی ، اغلب با مجموعه داده هایی مواجهیم که از ترکیبی از مقادیر عددی و دسته ای تشکیل شده اند . در حالیکه اغلب روشهای خوشه بندی موجود تنها بر روی داده های عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی داده های مختلط را ندارند. از سوی دیگر ، بیشتر روشهای سنتی ، تعداد خوشه ها را به عنوان ورودی از کاربر طلب می کنند. در حالی که در بیشتر موارد تعداد خوشه ها برای کاربر مقداری نامعلوم است و حدس زدن مقدار آن نیز به خصوص در مورد مجموعه داده های بزرگ کاری مشکل و حتی غیرممکن است . در این مقاله قصد داریم تا با بهره گیری از روشی دقیق تر جهت اندازه گیری فاصله میان مقادیر دسته ای ، روش جدیدی را برای خوشه بندی داده های مختلط ارائه نماییم که نیازی به تعیین تعداد خوشه ها به عنوان ورودی الگوریتم نداشته و قادر است همزمان با خوشه بندی داده ها ، مقدار بهینه برای تعداد خوشه ها را محاسبه نماید. در روش پیشنهادی معکوس شاخص Davies-Bouldin به عنوان تابع برازش در نظر گرفته شده و به منظور جستجوی فضای جواب از الگوریتم ژنتیک استفاده می شود. برای ارزیابی عملکرد الگوریتم از دو گروه از داده های استاندارد و شبیه سازی شده استفاده شده است. نتایج به دست آمده ، عملکرد بسیار بالای الگوریتم پیشنهادی را نشان می دهد.

نویسندگان

مسعود یقینی

استادیار ، دانشکده مهندسی راه آهن ، دانشگاه علم و صنعت ایران

مهدی ورد

کارشناسی ارشد ، دانشکده مهندسی راه آهن ، دانشگاه علم و صنعت ایران