مروری بر الگوریتم خوشه بندی DENC

  • سال انتشار: 1401
  • محل انتشار: نخستین کنفرانس ملی مدل سازی و شبیه سازی سیستم های پویا
  • کد COI اختصاصی: MSCS01_034
  • زبان مقاله: فارسی
  • تعداد مشاهده: 153
دانلود فایل این مقاله

نویسندگان

ابوذر منفرد

دانشجوی کارشناسی ارشد دانشگاه آپادانا شیراز

هاله همایونی

استادیار بخش کامپیوتر,موسسه آموزش عالی آپادانا ,شیراز

معصومه دهقانیان

کارشناسی ارشد ،دبستان دخترانه فروغ ،اداره آموزش و پرورش نوراباد ممسنی،ایران

چکیده

در این مقاله، مروری بر الگوریتمی برای خوشه بندی در پایگاه های داده چند رسانه ای بزرگ به نام Density (DENCLUE (Clustering based معرفی می کنیم. ایده اصلی ما این است که چگالی نقطه کلی را به صورت تحلیلی به عنوان مجموع توابع بر حسب نقاط داده مدل کنیم. پس از آن خوشه ها می توانند با تعیین جاذبه های چگالی و خوشه هایی با شکل دلخواه را میتوان به راحتی با یک معادله ساده بر اساس تابع چگالی کلی توصیف کرد. مزایای این روش عبارتند از: ۱ )دارای یک مبنای ریاضی ، ۲(دارای ویژگی های خوشه بندی خوب در مجموعه داده ها با مقادیر زیاد نویز، ۳ )اجازه می دهد تا توصیف ریاضی فشرده ای از خوشه های دلخواه با شکل مختلف را ارائه دهد. ۴ )به طور قابل توجهی سریعتر از الگوریتم های موجوداست. الگوریتم Denclue از یک مدل خوشه ای بر اساس تخمین چگالی هسته استفاده می کند. یک خوشه با حداکثر محلی تابع چگالی تخمین زده شده تعریف می شود. نقاط داده با تپه نوردی به خوشه ها اختصاص داده میشوند، یعنی نقاطی که به همان حداکثر محلی میروند در همان خوشه قرار میگیرند. نقطه ضعف ۱/۰ Denclue این است که تپه نوردی مورد استفاده ممکن است در ابتدا گامهای کوچک غیرضروری بردارد و هرگز دقیقا به حداکثر همگرا نشود، فقط نزدیک میشود.در Denclue۰.۲ روش جدید تپه نوردی را برای هسته های گاوسی معرفی می شود که اندازه گام را به طور خودکار و بدون هزینه اضافی تنظیم می شود. این روش دقیقا به سمت حداکثر محلی همگرا میشود

کلیدواژه ها

، DENCLUE.خوشه بندی مبتنی بر چگالی ، تخمین چگالی هسته،خوشه بندی در حضور نویز

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.