بررسی داده کاوی توزیع شده با الگوریتم k-means

نجمه تقی زاده; لاله مداح علی; محبوبه شمسی; علیرضا آراسته

بررسی داده کاوی توزیع شده با الگوریتم k-means

محل انتشار: همایش ملی الکترونیکی دستاوردهای نوین در علوم مهندسی و پایه

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,293

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/303953

شناسه ملی سند علمی:

AEBSCONF01_247

تاریخ نمایه سازی: 6 آبان 1393

چکیده مقاله:

اکثر الگوریتم های خوشه بندی نیاز به داده های متمرکز دارند، اما این الگوریتم ها با توسعه اینترنت و در برخورد با داده های توزیع شده، با دو چالش روبرو شدند. اول، حجم داده های تولید شده حتی برای ابر کامپیوترها هم خیلی زیاد شده است. دوم، داده ها در چندین مکان ذخیره شده اند و متمرکزکردن آنها در یک جا بسیار پرهزینه خواهد بود. هم چنین محدودیت پهنای باند و حریم شخصی نیز از نگرانی ها و موانع متمرکز سازی داده می باشد. به همین دلیل برای حل این مشکلات، داده کاوی توزیع شده یک حوزه تحقیقاتی پرطرفدار شده است. یکی از الگوریتم های خوشه بندی، الگوریتم کامینز است که به عنوان یکی از با نفوذترین الگوریتم های داده کاوی مورد استفاده قرار می گیرد و بسیار ساده و مقیاس پذیر است. در سال های اخیر نسخه هایی از این الگوریتم انتشار یافته است که می تواند در برخورد با داده های توزیع شده، به خوبی عمل کرده و نتایج خوبی را ارائه دهد. در این الگوریتم ها، نیازی به جمع آوری کردن اطلاعات و داده ها در یک مجموعه متمرکز نیست، در این مقاله قصد داریم که این الگوریتم ها را معرفی و بررسی کنیم.

کلیدواژه ها:

داده کاوی توزیع شده ، خوشه بندی ، الگوریتم کامنیز ، الگوریتم کامینز توزیع شده ، نرمال سازی

نویسندگان

نجمه تقی زاده

دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم

لاله مداح علی

دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم

محبوبه شمسی

عضو هیئت علمی گروه مهندسی برق و کامپیوتر دانشگاه صنعتی قم

علیرضا آراسته

فارغ التحصیل مهندسی نرم افزار دانشگاه پیام نور مرکز قم

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Rekha Sunny T, Survey _ Distributed Data Mining in P2P ...
K. A. Abdul Nazeer, Improving the Accuracy and Efficiency of ...
Fahim A.M, Salem A. M, Torkey A and Ramadan M. ...
New Algorithm to Get the Initial Centroids, ; Proc. of ...
Malay K. Pakhira, Clustering Large Databases in Di stribute dEnvironment, ...
N. KarthikeyaniVi salakshi, ENSEMBLE BASED _ STRIBUTED S OF TC ...
Zhou A, Cao F, Van Y, Sha C, He X, ...
SouptikDatta, Chris R. Approximate Distributed K-Means Clustering Over a Peer-to-Peer ...
M.C. Naldi, Evolutionary k-means ford i S tributeddatases , 3 ...
JiGenlin, Ling Xiaohan, Ensemble learning based distributed clustering, Lecture Notes ...
Amir Ben-Dor, Ron Shamir and Zohar Yakini, Clustering Gene Expression ...
Margaret H. Dunham, Data Mining- Introductory and Advanced Concepts, Pearson ...

نمایش کامل مراجع