بررسی داده کاوی توزیع شده با الگوریتم k-means

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,018

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

AEBSCONF01_247

تاریخ نمایه سازی: 6 آبان 1393

چکیده مقاله:

اکثر الگوریتم های خوشه بندی نیاز به داده های متمرکز دارند، اما این الگوریتم ها با توسعه اینترنت و در برخورد با داده های توزیع شده، با دو چالش روبرو شدند. اول، حجم داده های تولید شده حتی برای ابر کامپیوترها هم خیلی زیاد شده است. دوم، داده ها در چندین مکان ذخیره شده اند و متمرکزکردن آنها در یک جا بسیار پرهزینه خواهد بود. هم چنین محدودیت پهنای باند و حریم شخصی نیز از نگرانی ها و موانع متمرکز سازی داده می باشد. به همین دلیل برای حل این مشکلات، داده کاوی توزیع شده یک حوزه تحقیقاتی پرطرفدار شده است. یکی از الگوریتم های خوشه بندی، الگوریتم کامینز است که به عنوان یکی از با نفوذترین الگوریتم های داده کاوی مورد استفاده قرار می گیرد و بسیار ساده و مقیاس پذیر است. در سال های اخیر نسخه هایی از این الگوریتم انتشار یافته است که می تواند در برخورد با داده های توزیع شده، به خوبی عمل کرده و نتایج خوبی را ارائه دهد. در این الگوریتم ها، نیازی به جمع آوری کردن اطلاعات و داده ها در یک مجموعه متمرکز نیست، در این مقاله قصد داریم که این الگوریتم ها را معرفی و بررسی کنیم.

کلیدواژه ها:

داده کاوی توزیع شده ، خوشه بندی ، الگوریتم کامنیز ، الگوریتم کامینز توزیع شده ، نرمال سازی

نویسندگان

نجمه تقی زاده

دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم

لاله مداح علی

دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم

محبوبه شمسی

عضو هیئت علمی گروه مهندسی برق و کامپیوتر دانشگاه صنعتی قم

علیرضا آراسته

فارغ التحصیل مهندسی نرم افزار دانشگاه پیام نور مرکز قم

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Rekha Sunny T, Survey _ Distributed Data Mining in P2P ...
  • K. A. Abdul Nazeer, Improving the Accuracy and Efficiency of ...
  • Fahim A.M, Salem A. M, Torkey A and Ramadan M. ...
  • New Algorithm to Get the Initial Centroids, ; Proc. of ...
  • Malay K. Pakhira, Clustering Large Databases in Di stribute dEnvironment, ...
  • N. KarthikeyaniVi salakshi, ENSEMBLE BASED _ STRIBUTED S OF TC ...
  • Zhou A, Cao F, Van Y, Sha C, He X, ...
  • SouptikDatta, Chris R. Approximate Distributed K-Means Clustering Over a Peer-to-Peer ...
  • M.C. Naldi, Evolutionary k-means ford i S tributeddatases , 3 ...
  • JiGenlin, Ling Xiaohan, Ensemble learning based distributed clustering, Lecture Notes ...
  • Amir Ben-Dor, Ron Shamir and Zohar Yakini, Clustering Gene Expression ...
  • Margaret H. Dunham, Data Mining- Introductory and Advanced Concepts, Pearson ...
  • نمایش کامل مراجع