بررسی چالش ها و بهبود های الگوریتم خوشه بندی کا-میانگین

  • سال انتشار: 1400
  • محل انتشار: چهارمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران
  • کد COI اختصاصی: STCONF04_075
  • زبان مقاله: فارسی
  • تعداد مشاهده: 715
دانلود فایل این مقاله

نویسندگان

اکرم سادات مصطفوی

دانشجوی ارشد کامپیوتر دانشگاه بین المللی امام خمینی(ره) قزوین

محمد مهدی گل ریز

دانشجوی ارشد کامپیوتر دانشگاه بین المللی امام خمینی(ره) قزوین

مرتضی محمدی زنجیره

استاد گروه مهندسی کامپیوتردانشگاه بین المللی امام خمینی(ره) قزوین

چکیده

در میان الگوریتم های خوشه بندی موجود، الگوریتم کا -میانگین به دلیل سادگی و موثر بودن به یکی از گسترده ترین تکنیک های مورد استفاده برای خو شه بندی داده ها تبدیل شده است. این الگوریتم با وجود سادگی و گستردگی استفاده از آن، دارای مشکلاتی چون حساب بودن به نویز، مقدار دهی تصادفی مراکز اولیه خوشه بندی، وجود داده های پرت و اثرات آن بر خوشه بندی، دقت و پایداریالگوریتم، تعیین مناسب تعداد خوشه ها قبل از انجام خوشه بندی، ناتوانی الگوریتم در مدیریت داده هائی با مدیرت کاملا متفاوت، می باشد. باتوجه به مشکلات این الگوریتم، در سال های اخیر بهبود هایی بر روی آن انجام شده است تا مشکلات مربوط به این الگوریتم را به حداقل برساند. ما در این مقاله سعی می کنیم بهبود های اخیرا صورت گرفته بر روی این الگوریتم را به طور مختصر و مفید شرح دهیم.

کلیدواژه ها

الگوریتم خوشه بندی، بهبود کا میانگین، داده های پرت داده های نویزی، مراکز اولیه تصادفی، تعداد خوشه ها.

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.