خوشه بندی خودکار داده ها توسط الگوریتم ژنتیک دو مرحله ای

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,558

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_430

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

سازماندهی داده ها به گروه های با معنی، یکی از پایه های اساسی در درک داده ها است. تحلیل خوشه، مطالعه روش ها و الگوریتم هایی به منظور خوشه بندی و گروه بندی داده ها با توجه به میزان شباهت یا درجه نزدیکی آنها می باشد. یکی از چالش های تحلیل خوشه، تشخیص درست تعداد خوشه ها است، گرچه در چند دهه اخیر پژوهش های متعددی جهت رفع این مشکل صورت گرفته است. لذا، در این مقاله، یک الگوریتم خوشه بندی ژنتیک دو مرحله ای (TGCA) بررسی می شود. این الگوریتم به صورت خودکار، تعداد بهینه خوشه ها و افراز مناسبی از داده ها را تعیین می کند. عملیات دو مرحله ای انتخاب و جهش به منظور استفاده از قابلیت جستجوی الگوریتم ژنتیک اجرا می شود که از طریق تغییر احتمالات انتخاب و جهش که براساس پایداری تعداد خوشه ها در جمعیت است، حاصل می شود. ابتدا، الگوریتم خوشه بندی ژنتیک دو مرحله ای، تمرکز بر یافتن بهترین تعداد خوشه ها دارد، و سپس بتدریج به سمت یافتن مراکز خوشه بهینه سراسری، سوق می یابد. علاوه بر این، روش افراز بندی با حداکثر بازه ویژگی ها، جهت مقداردهی اولیه جمعیت استفاده می شود. نهایتا، کارآیی و اثربخشی TGCA با الگوریتم بهینه سازی ازدحام ذرات مقایسه می گردد که نتایج بدست آمده، نشان می دهد که این الگوریتم از نظر مدت زمان اجرا و هزینه خوشه بندی از الگوریتم بهینه سازی ازدحام ذرات، عملکرد بهتری دارد.

کلیدواژه ها:

خوشه بندی ، الگوریتم ژنتیک ، انتخاب دو مرحله ای ، جهش دو مرحله ای ، پایداری تعداد خوشه ها

نویسندگان

ساناز کاشانی

دانشجوی کارشناسی ارشد علوم کامپیوتر.دانشگاه سیستان و بلوچستان

حسن رضایی

عضو هیات علمی دانشگاه سیستان و بلوچستان

مهدی زراعتگری

دانشجوی کارشناسی ارشد علوم کامپیوتر. دانشگاه سیستان و بلوچستان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A.K. Jain, Data clustering: 50yearsbeyond k-means, "Pattern Recognition Letters", vol. ...
  • R. M. Cole" , Clustering with Genetic Algorithms ", pottern ...
  • Y.M.Liu, R.Alhajj, etal. Integrating multi -objective genetic algorithm and validity ...
  • P. F. A.K. JAIN, "Data Clustering: A Review, " Computing ...
  • A. Zhang" , Cluster Analysis for Gene Expression Data: A ...
  • R.M. Othman, S. Deris, R.M. Illias, et al, Automatic clustering ...
  • Wenhua Dai, Cuizhen Jiao, Research of k-means clustering method based ...
  • Sriparna Saha, Sanghamitra Bandy opadhyay, A new point symmetry based ...
  • Hong He, Yonghong Tan. A two satage genetic algorithm for ...
  • نمایش کامل مراجع