A memetic algorithm based on interval estimation for fuzzy c-means clustering of incomplete data

  • سال انتشار: 1393
  • محل انتشار: اولین کنفرانس ملی الگوریتم های فراابتکاری و کاربردهای آن در علوم و مهندسی
  • کد COI اختصاصی: MHAA01_055
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 1390
دانلود فایل این مقاله

نویسندگان

Mansoureh Aghabeig

Department of Mathematics and Computer Science, Amirkabir University of Technology (Polytechnic Tehran), Tehran, Iran,

چکیده

Clustering as one of the most widely used techniques in data mining is only valid for complete data, while in real applications, many datasets suffer from incompleteness. In this paper a memetic algorithm for incomplete data fuzzy clustering based on the missing values interval estimation is presented. The proposed algorithm combines the genetic algorithm and an adaptive version of hill climbing method for imputing the missing attributes then performs fuzzy c-means approach on the refined data sets. Also, for enhancing the robustness of missing attributes representation, a dynamic approach is applied for determining the best number of data vectors for constructing missing values’ representing intervals. The experimental results for several UCI data sets and their comparison with other methods demonstrate the more efficiency of the proposed method in clustering incomplete data.

کلیدواژه ها

Fuzzy Clustering, Genetic Algorithm, Hill Climbing Algorithm, Nearest-Neighbors Interval

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.