ارائه یک روش خوشه بندی برای داده های حجیم مبتنی بر الگوریتم خوشه بندی سی-میانگین و معماری نگاشت-کاهش

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 182

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF17_005

تاریخ نمایه سازی: 19 آذر 1401

چکیده مقاله:

مانند تمامی زمینه های تحقیقاتی دیگر در علم کامپیوتر، در خوشه بندی نیز همیشه مباحث مربوط به آنالیز الگوریتمهای خوشه بندی و پیچیدگی زمانی و فضایی آن مطرح میباشد. پدیدار شدن مبحث داده های حجیم در سالیان اخیر نیز چالشهای بسیار زیادی برای پیچیدگی الگوریتمهای خوشه بندی به وجود آورده است. تکنیکهای سنتی خوشه بندی داده ها نمیتوانند برای این حجم از داده مورد استفاده قرار گیرند، دلیل این امر هم پیچیدگی بالا و زمان اجرای بالای آنها میباشد. از همینرو در این تحقیق الگوریتم خوشه بندی نوآورانهای برای کارایی بهتر بر روی داده های حجیم ارائه شده است. در این الگوریتم از قدرت الگوریتم کلونی زنبور عسل و همچنین سرعت بالای خواندن و نوشتن در پایگاه داده Apache Hbase کمک گرفته شده است تا الگوریتم خوشه بندی با کارایی مناسب و دقت بالا برای حجم بسیار زیادی از داده ارائه شود. نتایج شبیه سازی بر روی مجموعه داده NUS-WIDE که دارای ۸ گروه از تصاویر مختلف است نشان میدهد که الگوریتم ارائه شده در مقایسه با سایر روشهای خوشه بندی داده های حجیم از کارایی و دقت بالاتری برخوردار است.

کلیدواژه ها:

ارائه یک روش خوشه بندی برای داده های حجیم مبتنی بر الگوریتم خوشه بندی سی-میانگین ومعماری نگاشت-کاهش

نویسندگان

سیدمحمد رضوی

دکتری مهندسی کامپیوتر، دانشگاه فردوسی مشهد

محسن کاهانی

استاد دانشکده مهندسی کامپیوتر، دانشگاه فردوسی مشهد