Density-Based clustering in mapReduce with guarantees on parallel time, space, and solution quality

سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 59

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_COMB-14-3_001

تاریخ نمایه سازی: 2 بهمن 1403

چکیده مقاله:

A well-known clustering problem called Density-Based Spatial Clustering of Applications with Noise~(DBSCAN) involves computing the solutions of at least one disk range query per input point, computing the connected components of a graph, and bichromatic fixed-radius nearest neighbor. MapReduce class is a model where a sublinear number of machines, each with sublinear memory, run for a polylogarithmic number of parallel rounds. Most of these problems either require quadratic time in the sequential model or are hard to compute in a constant number of rounds in MapReduce. In the Euclidean plane, DBSCAN algorithms with near-linear time and a randomized parallel algorithm with a polylogarithmic number of rounds exist. We solve DBSCAN in the Euclidean plane in a constant number of rounds in MapReduce, assuming the minimum number of points in range queries is constant and each connected component fits inside the memory of a single machine and has a constant diameter.

نویسندگان

Sepideh Aghamolaei

Department of Computer Engineering, Sharif University of Technology, Tehran, Iran

Mohammad Ghodsi

Department of Computer Engineering, Sharif University of Technology, Tehran, Iran. School of Computer Science, Institute for Research in Fundamental Sciences (IPM), Tehran, Iran.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • J. Gan and Y. Tao, On the hardness and approximation ...
  • Y. Wang, Y. Gu and J. Shun, Theoretically-efficient and practical ...
  • N. Bansal, A. Blum and S. Chawla, Correlation clustering, Mach. ...
  • N. Ailon, M. Charikar and A. Newman, Proofs of conjectures ...
  • S. Chawla, K. Makarychev, T. Schramm and G. Yaroslavtsev, Near ...
  • M. Ester, H.-P. Kriegel, J. Sander and X. Xu, A ...
  • J. H. Friedman, J. L. Bentley and R. A. Finkel, ...
  • J. L. Bentley, Survey of techniques for fixed radius near ...
  • J. Han, M. Kamber and J. Pei, Data mining concepts ...
  • R. C. Hoetzlein, Fast fixed-radius nearest neighbors: interactive million-particle fluids, ...
  • M. de Berg, A. Gunawan and M. Roeloffzen, Faster DBSCAN ...
  • E. Schubert, J. Sander, M. Ester, H. P. Kriegel and ...
  • P. K. Agarwal, K. Fox, K. Munagala and A. Nath, ...
  • S. Aghamolaei, F. Baharifard and M. Ghodsi, Geometric spanners in ...
  • S. Aghamolaei, V. Keikha, M. Ghodsi and A. Mohades, Windowing ...
  • S. Aghamolaei, V. Keikha, M. Ghodsi and A. Mohades, Sampling ...
  • J. H. Reif and S. Sen, Optimal randomized parallel algorithms ...
  • F. Frei and K. Wada, Efficient circuit simulation in MapReduce, ...
  • F. Frei and K. Wada, Efficient deterministic MapReduce algorithms for ...
  • M. Garofalakis, J. Gehrke and R. Rastogi, Data stream management: ...
  • L. Arge, External memory data structures, Handbook of massive data ...
  • G. Yaroslavtsev and A. Vadapalli, Massively parallel algorithms and hardness ...
  • D. Nanongkai and M. Scquizzato, Equivalence classes and conditional hardness ...
  • A. Andoni, A. Nikolov, K. Onak and G. Yaroslavtsev, Parallel ...
  • G. Narasimhan and M. Smid, Geometric spanner networks, Cambridge University ...
  • C. D. Toth, J. O’Rourke and J. E. Goodman, Handbook ...
  • M. T. Goodrich, N. Sitchinava and Q. Zhang, Sorting, searching, ...
  • L. Barba, P. Bose, M. Damian, R. Fagerberg, W. L. ...
  • D. Bakhshesh and M. Farshi, A lower bound on the ...
  • R. E. Tarjan and U. Vishkin, An efficient parallel biconnectivity ...
  • K. Bringmann, Fine-grained complexity theory: Conditional lower bounds for computational ...
  • S. Guha and S. Khuller, Approximation algorithms for connected dominating ...
  • H. Karloff, S. Suri and S. Vassilvitskii, A model of ...
  • P. Beame, P. Koutris and D. Suciu, Communication steps for ...
  • J. L. Bentley, D. F. Stanat and E. H. Williams ...
  • S. Har-Peled, Geometric approximation algorithms, Mathematical Surveys and Monographs, ۱۷۳, ...
  • S. Suri and S. Vassilvitskii, Counting triangles and the curse ...
  • نمایش کامل مراجع