VelvetFlow: An engineering pipeline for robust multi-density clustering
- سال انتشار: 1404
- محل انتشار: مجله ریاضیات گسسته و کاربردهای آن، دوره: 10، شماره: 4
- کد COI اختصاصی: JR_JDMA-10-4_003
- زبان مقاله: انگلیسی
- تعداد مشاهده: 4
نویسندگان
Department of Computer Science, University of Tarbiat Modares, Tehran, I. R. Iran
Department of Computer Science, University of Tarbiat Modares, Tehran, I. R. Iran
Department of Computer Science, University of Tarbiat Modares, Tehran, I. R. Iran
چکیده
Problem. Real-world datasets seldom respect a single density scale: tight blobs, elongated ribbons, and isolated points often coexist. Classical algorithms such as DBSCAN or \textit{k}-means require domain-specific parameter tuning and provide only ad-hoc support for anomaly detection.Solution. We introduce VelvetFlow, an engineering pipeline that turns a set of well-understood building blocks into a cohesive, end-to-end workflow for multi-density clustering \emph{and} principled outlier detection. The pipeline is composed of three reusable stages:(i) \emph{Contextual-density splitting} assigns every point to a high- or low-density partition using a single neighbourhood size k.(ii) \emph{Density-aware clustering} applies a Jaccard-guided \textit{FusedNeighbor}+DBSCAN routine to the sparse partition and HDBSCAN to the dense partition-without introducing new hyper-parameters.(iii) \emph{Scaled-MST verification} re-examines the complete k-NN graph, flags weakly connected components, and validates them with a k-NN gate; this step recovers small remote clusters while filtering genuine anomalies.کلیدواژه ها
multi-density clustering, outlier detection, HDBSCAN, DBSCAN, MST, fused neighborاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.