خوشه بندی داده های بزرگ با استفاده ازالگوریتم های Bisecting k-means و فراابتکاری

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 825

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_044

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

خوشه بندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است قابلیت آن در ورود به فضای داده وتشخیص ساختار آنها خوشه بندی را یکی از ایده آل ترین مکانیزمها برای کار با دنیای عظیم دادهها کرده است. خوشه بندی یکی از شاخههای یادگیری بدون نظارت میباشد و فرایند خودکاری است که در طی آن نمونه ها به دسته هایی که اعضای آن مشابه یکدیگر هستند تقسیم میشوند. خوشه بندی داده ها دارای کاربردهای فراوانی در دادهکاوی، شبکه های حسگر بیسیم، تشخیص الگو، و یادگیری ماشین است خوشه بندی یک تکنیک دسته بندی بدون نظارت است که در آن مجموعه داده ها که معمولا بردارهایی در فضای چندبعدی میباشند، براساس یک معیار شباهت یا عدم شباهت، به تعداد مشخصی خوشه تقسیم میشوند. وقتیکه تعداد خوشه ها برابرKباشدوNداده m بعدی داشته باشیم، الگوریتم خوشهبندی، هر یک از این داده ها را به یکی از خوشه ها تخصیص خواهد داد، بر این اساس که داده های تخصیص داده شده به یک خوشه، نسبت به داده هایی که در خوشه های دیگر هستند، به هم شبیه تر باشند. در خوشه بندی داده هایی با حجم زیاد استفاده ازروشهای معمول برای خوشه بندی مانند K-means با معایبی از جمله وابستگی به مقادیر اولیه، همگرایی به بهینهسازی محلی و حجم بسیار بالای داده ها و در نتیجه زمانگیر بودن اجرای الگوریتم مواجه هستیم. بنابراین استفاده از روشهای ترکیبی نوین بر پایه ی روشهای Bisecting K-means و الگوریتم زنبور باعث رفع معایب روش K-means و در نتیجه افزایش سرعت اجرای الگوریتم و بهبود نتایج نهایی خواهد شد. ×

نویسندگان

سعیده خلیلی عظیمی

دانشجوی دکتری، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

نفیسه اوسطی عراقی

استادیار دانشگاه، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

حسن اصدقی تکمه داش

کارشناسی ارشد، گروه کامپیوتر، واحد میانه، دانشگاه آزاد اسلامی، میانه، ایران