بررسی تحلیلی روش های مختلف خوشه بندی داده به صورت توزیع شده

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,128

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_512

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

افزایش روزافزون حجم اطلاعات و همچنین محدودیت فضای ذخیره سازی آن، چالشی انکارناپذیر در امر پردازش اطلاعات است که این امر بهره گیری از پردازش توزیع شده در سیستم های مختلف را ایجاب می کند. بسیاری از مسائل در دنیای آمار و یادگیری ماشین با توجه به پیچیدگی و افزایش حجم مجموعه داده ها به علت تعداد بسیار زیاد نمونه ها با ویژگی ها، قابل حل توسط الگوریتم های کلاسیک یادگیری ماشین نیستند. یادگیری ماشین به صورت توزیع شده به بررسی الگوریتم های یادگیری ماشین با سه رویکرد کلی موازی سازی داده، موازی سازی الگوریتم و موازی سازی ترکیبی می پردازد. در روش های خوشه بندی توزیع شده مجموعه داده ی حجیم، با تقسیم به مجموعه داده های کوچکتر در سیستم های مختلف توزیع می شوند. تقسیم مجموعه داده به دو صورت کلی انجام می شود؛ مجموعه داده هایی که تعداد نمونه های زیادی دارند، در طول نمونه ها تقسیم می شوند و در م سائلی مانند بیوانفورماتیک، مجموعه داده هایی که تعداد ویژگی های زیادی دارند می توانند در طول ویژگی ها تقسیم شوند. در این مقاله سعی شده است، با معرفی روش های مختلف خوشه بندی توزیع شده جالش های این حوزه مورد بحث قرار گیرد. لازم به ذکر است که آنچه در پیاده سازی این روش ها مورد توجه قرار گرفته است، استفاده از MPI برای انتقال اطلاعات بین سیستم ها است.

کلیدواژه ها:

نویسندگان

طاهره اسمعیلی ابهریان

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد قزوین

محمدباقر منهاج

عضو هیئت علمی دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Agrawal, R., Gehrke, J., Gunopulos, D., & Raghavan, P. (2005). ...
  • Aya, S., Arms, W. Y., Walle, L., Kot, B., Mitchell, ...
  • Bekkerman, R., Bilenko, M., & Langford, J. (2012). Scaling up ...
  • Bezdek, J .C., Ehrlich, R., & Full, W. (1984). FCM: ...
  • Kantabutra & ( )Couch, 2000 ...
  • _ Bouchachia, .A. (2003). Distributed Data Clustering. Paper presented at ...
  • Dean, J., & Ghemawat, S. (2008). MapReduce: simplified data processing ...
  • Dhillon, I. S., & Modha, D. S. (2000). A data-clustering ...
  • Forman, G., & Zhang, B. (2000). Distributed data clustering can ...
  • Garg, A., Mangla, A., Gupta, N., & Bhatnagar, V. (2006). ...
  • Gropp, W., Lusk, E., & Skjellum, A. (1999). Using MPI: ...
  • Jang, J.-W., & Prasanna, V. K. (1992). An optimal sorting ...
  • Joshi, M. N. (2003). Parallel k-means algorithm on distributed memory ...
  • Judd, D., McKinley, P. K., & Jain, A. K. (1996). ...
  • Kantabutra, S., & Couch, A. L. (2000). Parallel K-means clustering ...
  • Kumar, J., Mills, R. T., Hoffman, F. M., & Hargrove, ...
  • Lammel, R. (2008). Google's MapReduce programming model-Revi sited. Science of ...
  • Li, X. (1990). Parallel algorithms for hierarchicl clustering and cluster ...
  • Li, X., & Fang, Z. (1989). Parallel clustering algorithms. Parallel ...
  • Othman, F., Abdullah, R., & Salam, R. A. (2005). Parallel ...
  • Prim, R. C. (1957). Shortest connection networks and some generalizations. ...
  • Rajasekaran, S. (2005). Efficient Parallel Hierarchical Clustering Algorithms. IEEE Trans. ...
  • Ranger, C., Raghuraman, R., Penmetsa, A., Bradski, G., & Kozyrakis, ...
  • Ranka, S., & Sahni, S. (1991). Clustering on a hypercube ...
  • Snir, M. (1998). MPI--the Complete Reference: The MPI core (Vol. ...
  • Song, Y., Chen, W.-Y., Bai, H., Lin, C.-J., & Chang, ...
  • Stoffel, K., & Belkoniene, _ (1999 .)Parallel k/h-means clustering for ...
  • Tsai, H.-R., Horng, S.-J., Lee, S.-S., Tsar, S.-S., & Kao, ...
  • Wu, C.-H., Horng, S.-J., & Tsai, H.-R. (2000). Efficient parallel ...
  • _ Xu, R., & Wunsch, D. (2005). Survey of clustering ...
  • Xu, Y., Olman, V., & Xu, D. (2002). Clustering gene ...
  • Zhang, B., Hsu, M., & Dayal, U. (2001). K-harmonic means-a ...
  • Zhang, B., Hsu, M., & Forman, G. (2000). Accurate recasting ...
  • Zhao, W., Ma, H., & He, Q. (2009). Parallel k-means ...
  • نمایش کامل مراجع