خوشه بندی داده ها با استفاده از یک رویکرد نیمه پارامتری مبتنی بر چگالی

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 140

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DSAS03_027

تاریخ نمایه سازی: 20 دی 1403

چکیده مقاله:

خوشه بندی چگالی-محور برخی مزایا نسبت به روش های خوشه بندی مبتنی بر فاصله و مدل دارد. در سال های اخیر، برخی محققان این رویکرد را با پیشنهاد یک روش مبتنی بر نظریه ی گراف برای شناسایی مدهای موضعی تابع چگالی داده ها توسعه داده اند. آن ها از روش ناپارامتری برآورد چگالی هسته (KDE) با هسته های نرمال و t برای این منظور استفاده کردند. در پژوهش حاضر قصد داریم الگوریتم ناپارامتری خوشه بندی چگالی-محور بالا را به یک الگوریتم نیمه پارامتری گسترش دهیم. به طور دقیق تر، ما در این مقاله برآورد گرهای نیمه پارامتری KDE با خانواده ای از هسته های انعطاف پذیرتر از نرمال از جمله چوله-نرمال و چوله-t پیشنهاد می کنیم. شواهد نشان می دهند که برآوردگرهای پیشنهادی نسبت به برآوردگرهای معمولی، که از هسته های نرمال و t استفاده می کنند، نه تنها میزان اریبی کمتری در نقاط مرزی تکیه گاه چگالی داده ها دارند بلکه به چگالی واقعی جامعه نیز نزدیک تر هستند. پیدا کردن پهنای باند بهینه تحت حالت های یک بعدی و چندبعدی نتیجه اصلی دیگری از این مقاله است. در نهایت، از طریق یک مطالعه عددی جامع، عملکرد الگوریتم خوشه بندی چگالی-محور نیمه پارامتری پیشنهاد شده را با استفاده از برخی مجموعه داده های شبیه سازی شده و واقعی ارزیابی خواهیم داد.

کلیدواژه ها: