مروری بر الگوریتم خوشه بندی DENC

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 109

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MSCS01_034

تاریخ نمایه سازی: 6 شهریور 1401

چکیده مقاله:

در این مقاله، مروری بر الگوریتمی برای خوشه بندی در پایگاه های داده چند رسانه ای بزرگ به نام Density (DENCLUE (Clustering based معرفی می کنیم. ایده اصلی ما این است که چگالی نقطه کلی را به صورت تحلیلی به عنوان مجموع توابع بر حسب نقاط داده مدل کنیم. پس از آن خوشه ها می توانند با تعیین جاذبه های چگالی و خوشه هایی با شکل دلخواه را میتوان به راحتی با یک معادله ساده بر اساس تابع چگالی کلی توصیف کرد. مزایای این روش عبارتند از: ۱ )دارای یک مبنای ریاضی ، ۲(دارای ویژگی های خوشه بندی خوب در مجموعه داده ها با مقادیر زیاد نویز، ۳ )اجازه می دهد تا توصیف ریاضی فشرده ای از خوشه های دلخواه با شکل مختلف را ارائه دهد. ۴ )به طور قابل توجهی سریعتر از الگوریتم های موجوداست. الگوریتم Denclue از یک مدل خوشه ای بر اساس تخمین چگالی هسته استفاده می کند. یک خوشه با حداکثر محلی تابع چگالی تخمین زده شده تعریف می شود. نقاط داده با تپه نوردی به خوشه ها اختصاص داده میشوند، یعنی نقاطی که به همان حداکثر محلی میروند در همان خوشه قرار میگیرند. نقطه ضعف ۱/۰ Denclue این است که تپه نوردی مورد استفاده ممکن است در ابتدا گامهای کوچک غیرضروری بردارد و هرگز دقیقا به حداکثر همگرا نشود، فقط نزدیک میشود.در Denclue۰.۲ روش جدید تپه نوردی را برای هسته های گاوسی معرفی می شود که اندازه گام را به طور خودکار و بدون هزینه اضافی تنظیم می شود. این روش دقیقا به سمت حداکثر محلی همگرا میشود

کلیدواژه ها:

، DENCLUE.خوشه بندی مبتنی بر چگالی ، تخمین چگالی هسته ، خوشه بندی در حضور نویز

نویسندگان

ابوذر منفرد

دانشجوی کارشناسی ارشد دانشگاه آپادانا شیراز

هاله همایونی

استادیار بخش کامپیوتر,موسسه آموزش عالی آپادانا ,شیراز

معصومه دهقانیان

کارشناسی ارشد ،دبستان دخترانه فروغ ،اداره آموزش و پرورش نوراباد ممسنی،ایران