به کارگیری الگوریتم بهینه سازی سنجاقک جهت خوشه بندی داده ها با استفاده از الگوریتم K-means

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 694

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMM02_131

تاریخ نمایه سازی: 7 آبان 1398

چکیده مقاله:

پردازش داده، یکی از شاخص های بسیار مهم در دنیای اطلاعات است و خوشه بندی یکی از بهترین روش هایی است که برای کار با داده ها ارائه شده است. خوشه بندی قابلیت ورود به فضای داده و تشخیص ساختارش را امکان پذیر می نماید. لذا به عنوان یکی از ایده آل ترین مکانیزم ها، بای کار با دنیای عظیم داده ها محسوب می شود. به بیان ساده می توان گفت که خوشه بندی قرار دادن داده ها در گروه هایی است که اعضای هر گروه از زاویه خاصی شبیه یکدیگرند و در نتیجه شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل می باشد. معیار شباهت در اینجا، فاصله است یعنی نمونه هایی که به یکدیگر نزدیکترند در یک خوشه قرار می گیرند. به عنوان نمونه در خوشه بندی اسناد دوری و یا نزدیکی داده های متناسب با تعداد کلمه های مشترکی است که در دو سند وجود دارد و یا در خوشه بندی سبد خرید مشتریان، فاصله براساس شباهت خرید تعیین می شود. یکی از روش های معروف در این زمینه k-means می باشد که علی رغم وابستگی به شرایط اولیه و همگرائی به نقاظ بهینه محلی، تعداد N داده را به k خوشه با سرعت بالا، دسته بندی می نماید. در این پژوهش نامه جهت رفع مشکلات موجود از روش خوشه بندی ترکیبی مبتنی بر الگوریتم سنجاقک و الگوریتم k-means بهره گرفته خواهد شد؛ الگوریتم سنجاقک یک تکنیک جدید در بهینه سازی هوشمند برای حل مسائل گوناگون است.

کلیدواژه ها:

الگوریتم خوشه بندی k-means ، الگوریتم های فرا ابتکاری ، بهینه سازی هوشمندسازی هوشمند ، الگوریتم بهینه سازی سنجاقک ، خوشه بندی

نویسندگان

ناهید ابراهیمی

دانشجو، گروه کامپیوتر، واحد کرمان، دانشگاه آزاد اسلامی، کرمان، ایران

وحید خطیبی

استادیار، گروه کامپیوتر، واحد بردسیر، دانشگاه آزاد اسلامی، بردسیر، ایران