بهینه سازی الگوریتم k-میانگین در خوشه بندی داده ها با استفاده از الگوریتم هوش جمعی بهینه سازی گرگ خاکستری و الگوریتم تشخیص داده پرت جنگل جداسازی

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 46

فایل این مقاله در 22 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-9-3_001

تاریخ نمایه سازی: 12 آذر 1403

چکیده مقاله:

امروزه علم داده و خوشه بندی داده ها به عنوان ابزارهای حیاتی برای تحلیل و پردازش داده های خام و استخراج دانش به منظور تصمیم سازی و تصمیم گیری های کلان شناخته می شوند. یکی از روش های اصلی طبقه بندی داده ها، خوشه بندی است که در آن عناصر درون هر خوشه باید با یکدیگر مشابه و با عناصر خوشه های دیگر متفاوت باشند. الگوریتم k- میانگین به عنوان یکی از روش های پرکاربرد در خوشه بندی داده ها به شمار می آید و در بسیاری از کاربردهای عملی مورد استفاده قرار می گیرد. با این حال، این الگوریتم دارای دو نقص اساسی است: اول، وابستگی شدید کیفیت خوشه ها به انتخاب مراکز اولیه، و دوم، تاثیر نقاط پرت بر عملکرد خوشه بندی. در این مقاله، یک روش پیشرفته برای بهینه سازی الگوریتم  k- میانگین با استفاده از الگوریتم بهینه سازی گرگ خاکستری (GWO) برای انتخاب اولیه مراکز خوشه و همچنین الگوریتم جنگل جداسازی (IF) برای حذف نقاط پرت معرفی شده است. در این مقاله آزمایش های مختلف بر روی مجموعه داده های سنتزی و داده های واقعی انجام شد و هر کدام از آزمایش ها با دو سنجه شاخص رند اصلاح شده و خطای تعداد خوشه ها (میانگین اختلاف بین تعداد خوشه های واقعی و تعداد براورد شده توسط الگوریتم) مورد ارزیابی قرار گرفتند. آزمایش های انجام شده نشان داد که الگوریتم پیشنهادی هم از نظر شاخص رند اصلاح شده و هم از نظر خطای تعداد خوشه ها پیشرفت قابل ملاحظه ای را در مقایسه با k-میانگین پایه نشان می دهد. به گونه ای که در شاخص رند اصلاح شده، امتیاز آن از ۷۴/۰ به ۹۳/۰ ارتقا یافت. همچنین از نظرمیانگین تعداد خطای خوشه ها، میانگین خطای آن از عدد ۴۷/۰ به ۱۶/۰ کاهش یافت این آزمایش های گسترده و متعدد بر روی داده های متنوع نشان داد که این الگوریتم ترکیبی توانسته است به شکل قابل ملاحظه ای الگوریتم  k- میانگین اولیه را از جهات گوناگون بهبود ببخشد و بتواند راه حلی نویدبخش برای کاربردهای آتی خوشه بندی داده ها باشد.

کلیدواژه ها:

خوشه بندی داده ها ، الگوریتم k-میانگین ، الگوریتم بهینه سازی گرگ خاکستری ، الگوریتم جنگل جداسازی

نویسندگان

فائزه مرتضائی آغوزبنی

دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، دانشگاه بین المللی امام خمینی (ره)، قزوین، ایران

مرتضی محمدی زنجیره

استادیار گروه مهندسی کامپیوتر، دانشگاه بین المللی امام خمینی (ره)، قزوین، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Gan, G., & Ng, M. K. P. (۲۰۱۷). K-means clustering ...
  • Khan, F. (۲۰۱۲). An initial seed selection algorithm for k-means ...
  • Nazeer, K. A., & Sebastian, M. P. (۲۰۰۹, July). Improving ...
  • Yedla, M., Pathakota, S. R., & Srinivasa, T. M. (۲۰۱۰). ...
  • Singh, H., & Kaur, K. (۲۰۱۳). Review of existing methods ...
  • Velmurugan, T., & Santhanam, T. (۲۰۱۱). A survey of partition-based ...
  • Younus, Z. S., Mohamad, D., Saba, T., Alkawaz, M. H., ...
  • Pandey, A., & Shukla, M. (۲۰۱۴). Survey performance approach k-Mean ...
  • Patel, A., & Singh, P. (۲۰۱۳). New Approach for K-mean ...
  • Hariri, S., Kind, M. C., & Brunner, R. J. (۲۰۱۹). ...
  • Wu, M., Li, X., Liu, C., Liu, M., Zhao, N., ...
  • Sinaga, K. P., & Yang, M. S. (۲۰۲۰). Unsupervised K-means ...
  • Sharma, I., Kumar, V., & Sharma, S. (۲۰۲۲). A comprehensive ...
  • Selvaraj, S., & Choi, E. (۲۰۲۰, January). Survey of swarm ...
  • Purushothaman, R., Rajagopalan, S. P., & Dhandapani, G. (۲۰۲۰). Hybridizing ...
  • Tekerek, A. D. E. M., & Dörterler, M. U. R. ...
  • Ahmadi, R., Ekbatanifard, G., & Bayat, P. (۲۰۲۱). A modified ...
  • Mosavi, S. K., Jalalian, E., Soleimenian, F., & Branch, U. ...
  • Mirjalili, S., Mirjalili, S. M., & Lewis, A. (۲۰۱۴). Grey ...
  • Gao, Z. M., & Zhao, J. (۲۰۱۹). An improved grey ...
  • Liu, F. T., Ting, K. M., & Zhou, Z. H. ...
  • Karczmarek, P., Kiersztyn, A., Pedrycz, W., & Al, E. (۲۰۲۰). ...
  • Guo, T., Yan, J., Chen, J., & Yu, Y. (۲۰۲۳). ...
  • Xiao, B., Wang, Z., Liu, Q., & Liu, X. (۲۰۱۸). ...
  • Geng, Zhang, Chengchang Zhang, Huayu Zhang. (۲۰۱۸). Improved K-means Algorithm ...
  • Sukumar, J. A., Pranav, I., Neetish, M. M., & Narayanan, ...
  • Yu, S. S., Chu, S. W., Wang, C. M., Chan, ...
  • Xu, H., Yao, S., Li, Q., & Ye, Z. (۲۰۲۰, ...
  • Kodinariya, T. (۲۰۱۴). Survey on existing methods for selecting initial ...
  • Ay, M., Özbakır, L., Kulluk, S., Gülmez, B., Öztürk, G., ...
  • Ye, T., Ye, J., & Wang, L. (۲۰۲۳). Improved rough ...
  • Vu, V. V., & Labroche, N. (۲۰۱۷). Active seed selection ...
  • Chithra, P. L. (۲۰۱۷). Premeditated initial points for K-Means Clustering. ...
  • Hu, H., Liu, J., Zhang, X., & Fang, M. (۲۰۲۳). ...
  • Cheng, D., Huang, J., Zhang, S., Xia, S., Wang, G., ...
  • Kathiresan, V., & Sumathi, P. (۲۰۱۲, January). An efficient clustering ...
  • M. Sakthi and A. S. Thanamani. (۲۰۱۱). An effective determination ...
  • Khorasani, F., Zanjireh, M. M., Bahaghighat, M., & Xin, Q. ...
  • نمایش کامل مراجع