MDBSCAN+: Enhancing MDBSCAN for Outlier Detection

  • سال انتشار: 1403
  • محل انتشار: پنجمین همایش بین المللی دستاوردهای نوین در فناوری اطلاعات، علوم کامپیوتر، امنیت، شبکه و هوش مصنوعی
  • کد COI اختصاصی: INDEXCONF05_014
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 174
دانلود فایل این مقاله

نویسندگان

Hossein Eyvazi

Tarbiat Modares University of Tehran

Ali Rajaei

Tarbiat Modares University of Tehran

چکیده

Clustering is a vital technique in data analysis, but standard methods like DBSCAN may struggle with datasets that contain clusters of varying densities. MDBSCAN addresses these limitations by classifying data into low- and high-density regions before refining and merging clusters. However, MDBSCAN’s reliance on multiple hyperparameters complicates its outlier detection. Meanwhile, MS۲OD detects outliers in multi-density datasets through a scaled Minimum Spanning Tree (MST) approach but can misclassify smaller or sparsely located clusters as outliers. To overcome both MDBSCAN’s and MS۲OD’s shortcomings, the proposed MDBSCAN+ integrates the two approaches. It first detects potential outliers with MS۲OD, then applies MDBSCAN for clustering and evaluates outlier candidates via k-nearest neighbor distances. MDBSCAN+ effectively handles multi-density datasets and accurately identifies outliers with only one additional parameter (k), making it both efficient and user-friendly.

کلیدواژه ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.