بررسی داده کاوی توزیع شده با الگوریتم k-means
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,086
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
AEBSCONF01_247
تاریخ نمایه سازی: 6 آبان 1393
چکیده مقاله:
اکثر الگوریتم های خوشه بندی نیاز به داده های متمرکز دارند، اما این الگوریتم ها با توسعه اینترنت و در برخورد با داده های توزیع شده، با دو چالش روبرو شدند. اول، حجم داده های تولید شده حتی برای ابر کامپیوترها هم خیلی زیاد شده است. دوم، داده ها در چندین مکان ذخیره شده اند و متمرکزکردن آنها در یک جا بسیار پرهزینه خواهد بود. هم چنین محدودیت پهنای باند و حریم شخصی نیز از نگرانی ها و موانع متمرکز سازی داده می باشد. به همین دلیل برای حل این مشکلات، داده کاوی توزیع شده یک حوزه تحقیقاتی پرطرفدار شده است. یکی از الگوریتم های خوشه بندی، الگوریتم کامینز است که به عنوان یکی از با نفوذترین الگوریتم های داده کاوی مورد استفاده قرار می گیرد و بسیار ساده و مقیاس پذیر است. در سال های اخیر نسخه هایی از این الگوریتم انتشار یافته است که می تواند در برخورد با داده های توزیع شده، به خوبی عمل کرده و نتایج خوبی را ارائه دهد. در این الگوریتم ها، نیازی به جمع آوری کردن اطلاعات و داده ها در یک مجموعه متمرکز نیست، در این مقاله قصد داریم که این الگوریتم ها را معرفی و بررسی کنیم.
کلیدواژه ها:
نویسندگان
نجمه تقی زاده
دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم
لاله مداح علی
دانشجوی کارشناسی ارشد فناوری اطلاعات دانشگاه قم
محبوبه شمسی
عضو هیئت علمی گروه مهندسی برق و کامپیوتر دانشگاه صنعتی قم
علیرضا آراسته
فارغ التحصیل مهندسی نرم افزار دانشگاه پیام نور مرکز قم
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :