خوشه بندی داده های بزرگ با استفاده ازالگوریتم های Bisecting k-means و فراابتکاری

سعیده خلیلی عظیمی; نفیسه اوسطی عراقی; حسن اصدقی تکمه داش

خوشه بندی داده های بزرگ با استفاده ازالگوریتم های Bisecting k-means و فراابتکاری

محل انتشار: چهارمین کنفرانس ملی فناوری در مهندسی برق، کامپیوتر

سال انتشار: 1397

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,023

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/928890

شناسه ملی سند علمی:

TECCONF04_044

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

خوشه بندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است قابلیت آن در ورود به فضای داده وتشخیص ساختار آنها خوشه بندی را یکی از ایده آل ترین مکانیزمها برای کار با دنیای عظیم دادهها کرده است. خوشه بندی یکی از شاخههای یادگیری بدون نظارت میباشد و فرایند خودکاری است که در طی آن نمونه ها به دسته هایی که اعضای آن مشابه یکدیگر هستند تقسیم میشوند. خوشه بندی داده ها دارای کاربردهای فراوانی در دادهکاوی، شبکه های حسگر بیسیم، تشخیص الگو، و یادگیری ماشین است خوشه بندی یک تکنیک دسته بندی بدون نظارت است که در آن مجموعه داده ها که معمولا بردارهایی در فضای چندبعدی میباشند، براساس یک معیار شباهت یا عدم شباهت، به تعداد مشخصی خوشه تقسیم میشوند. وقتیکه تعداد خوشه ها برابرKباشدوNداده m بعدی داشته باشیم، الگوریتم خوشهبندی، هر یک از این داده ها را به یکی از خوشه ها تخصیص خواهد داد، بر این اساس که داده های تخصیص داده شده به یک خوشه، نسبت به داده هایی که در خوشه های دیگر هستند، به هم شبیه تر باشند. در خوشه بندی داده هایی با حجم زیاد استفاده ازروشهای معمول برای خوشه بندی مانند K-means با معایبی از جمله وابستگی به مقادیر اولیه، همگرایی به بهینهسازی محلی و حجم بسیار بالای داده ها و در نتیجه زمانگیر بودن اجرای الگوریتم مواجه هستیم. بنابراین استفاده از روشهای ترکیبی نوین بر پایه ی روشهای Bisecting K-means و الگوریتم زنبور باعث رفع معایب روش K-means و در نتیجه افزایش سرعت اجرای الگوریتم و بهبود نتایج نهایی خواهد شد. ×

کلیدواژه ها:

خوشه بندی ، داده کاوی ، Bisecting K-means ، الگوریتم زنبور ، سرعت اجرا ، زمان اجرا.

نویسندگان

سعیده خلیلی عظیمی

دانشجوی دکتری، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

نفیسه اوسطی عراقی

استادیار دانشگاه، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران

حسن اصدقی تکمه داش

کارشناسی ارشد، گروه کامپیوتر، واحد میانه، دانشگاه آزاد اسلامی، میانه، ایران