خوشه بندی داده های جریانی با توجه به تاریچه تکامل خوشه ها

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 662

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCELEC03_087

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

جریان داده به دنباله ای نامحدود از داده های گفته می شود که به طور پیوسته در حال تولید است و از سیستم های بلادرنگ جمع آوری و مورد تجزیه و تحلیل قرار می گیرند. خوشه بندی از مهم ترین مسائل یادگیری بدون نظارتو از مرسوم ترین تکنیک های داده کاوی می باشد که هدف آن پیدا کردن خوشه های مشابه در بین نمونه های ورودی داده می باشد الگوریتم K_Means نیز یکی از معروف ترین الگوریتم خوشه بندی است که با وجود مزایای زیادی که دارد یک محدودیت عمده دارد آن هم مشخص کردن تعداد خوشه ها یعنی k می باشد . در الگوریتم های K_Means یک الگوریتم تکاملی سریع برای خوشه بندی جریان داده ها می باشد که به طور خودکار اجازه برآورد k از داده ها را به صورت آنلاین می دهد. در این پژوهش ما یک الگوریتم تکاملی سریع را با استفاده ازتاریخچه تکامل خوشه ها برای خوشه بندی جریان داده ها بهبود دادیم. در این روش ما از یک بار برای بهبود صحت استفاده کردیم. نقطه قوت الگوریتم پیشنهادی در خوشه بندی در ترکیب با الگوریتم ژنتیک و حفظ مقادیر به صورت بهترین بهترین ها در متغیری مانند بافر است و برای ارزیابی الگوریتم پیشنهادی از سه دیتاست واقعی استفاده کردیم و میزان بهبود صحت که همان معیار ss هست را بر روی آن سنجیدیم که به بهبود قابل ملاحظه ای دست یافتیم. در نیتجه، این تجزیه و تحلیل می تواند برای درک رفتار هر خوشه از آغاز داده های جریانی مفید باشد.

کلیدواژه ها:

نویسندگان

جمیله حسینی

دانشجوی مقطع کارشناسی ارشد دانشگاه امام رضا (ع)

عادل قاضی خانی

استادیار گروه کامپیوتر دانشگاه امام رضا (ع)