خوشه بندی داده های بزرگ با استفاده ازالگوریتم های Bisecting k-means و فراابتکاری
- سال انتشار: 1397
- محل انتشار: چهارمین کنفرانس ملی فناوری در مهندسی برق، کامپیوتر
- کد COI اختصاصی: TECCONF04_044
- زبان مقاله: فارسی
- تعداد مشاهده: 893
نویسندگان
دانشجوی دکتری، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران
استادیار دانشگاه، گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران
کارشناسی ارشد، گروه کامپیوتر، واحد میانه، دانشگاه آزاد اسلامی، میانه، ایران
چکیده
خوشه بندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است قابلیت آن در ورود به فضای داده وتشخیص ساختار آنها خوشه بندی را یکی از ایده آل ترین مکانیزمها برای کار با دنیای عظیم دادهها کرده است. خوشه بندی یکی از شاخههای یادگیری بدون نظارت میباشد و فرایند خودکاری است که در طی آن نمونه ها به دسته هایی که اعضای آن مشابه یکدیگر هستند تقسیم میشوند. خوشه بندی داده ها دارای کاربردهای فراوانی در دادهکاوی، شبکه های حسگر بیسیم، تشخیص الگو، و یادگیری ماشین است خوشه بندی یک تکنیک دسته بندی بدون نظارت است که در آن مجموعه داده ها که معمولا بردارهایی در فضای چندبعدی میباشند، براساس یک معیار شباهت یا عدم شباهت، به تعداد مشخصی خوشه تقسیم میشوند. وقتیکه تعداد خوشه ها برابرKباشدوNداده m بعدی داشته باشیم، الگوریتم خوشهبندی، هر یک از این داده ها را به یکی از خوشه ها تخصیص خواهد داد، بر این اساس که داده های تخصیص داده شده به یک خوشه، نسبت به داده هایی که در خوشه های دیگر هستند، به هم شبیه تر باشند. در خوشه بندی داده هایی با حجم زیاد استفاده ازروشهای معمول برای خوشه بندی مانند K-means با معایبی از جمله وابستگی به مقادیر اولیه، همگرایی به بهینهسازی محلی و حجم بسیار بالای داده ها و در نتیجه زمانگیر بودن اجرای الگوریتم مواجه هستیم. بنابراین استفاده از روشهای ترکیبی نوین بر پایه ی روشهای Bisecting K-means و الگوریتم زنبور باعث رفع معایب روش K-means و در نتیجه افزایش سرعت اجرای الگوریتم و بهبود نتایج نهایی خواهد شد. ×کلیدواژه ها
خوشه بندی، داده کاوی، Bisecting K-means، الگوریتم زنبور، سرعت اجرا، زمان اجرا.مقالات مرتبط جدید
- tGraph_PheroWalk : یک الگوریتم جدید برای یادگیری بازنمایی گراف های پویا
- Efficient Triple Modular Redundancy for Reliability Enhancement of DNNs Using Explainable AI
- مقایسه فناوری CMUT با پیزوالکتریک برای کاربرد در تصویربرداری التراسونیک
- بهبود کنترل دست رباتیک به کمک کنترل کننده تطبیقی فازی-PID
- طراحی و شبیه سازی آنتن تک قطبی چند بانده فشرده با تغذیه ریز نوار برای بهبود عملکرد در باندهای فرکانسی ۲.۵، ۳.۸، ۵.۴ و ۶.۹ گیگاهرتز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.