خوشه بندی داده های جریانی با توجه به تاریچه تکامل خوشه ها

جمیله حسینی; عادل قاضی خانی

خوشه بندی داده های جریانی با توجه به تاریچه تکامل خوشه ها

محل انتشار: سومین کنفرانس ملی مهندسی برق و کامپیوتر

سال انتشار: 1398

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 553

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1005926

شناسه ملی سند علمی:

ISCELEC03_087

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

جریان داده به دنباله ای نامحدود از داده های گفته می شود که به طور پیوسته در حال تولید است و از سیستم های بلادرنگ جمع آوری و مورد تجزیه و تحلیل قرار می گیرند. خوشه بندی از مهم ترین مسائل یادگیری بدون نظارتو از مرسوم ترین تکنیک های داده کاوی می باشد که هدف آن پیدا کردن خوشه های مشابه در بین نمونه های ورودی داده می باشد الگوریتم K_Means نیز یکی از معروف ترین الگوریتم خوشه بندی است که با وجود مزایای زیادی که دارد یک محدودیت عمده دارد آن هم مشخص کردن تعداد خوشه ها یعنی k می باشد . در الگوریتم های K_Means یک الگوریتم تکاملی سریع برای خوشه بندی جریان داده ها می باشد که به طور خودکار اجازه برآورد k از داده ها را به صورت آنلاین می دهد. در این پژوهش ما یک الگوریتم تکاملی سریع را با استفاده ازتاریخچه تکامل خوشه ها برای خوشه بندی جریان داده ها بهبود دادیم. در این روش ما از یک بار برای بهبود صحت استفاده کردیم. نقطه قوت الگوریتم پیشنهادی در خوشه بندی در ترکیب با الگوریتم ژنتیک و حفظ مقادیر به صورت بهترین بهترین ها در متغیری مانند بافر است و برای ارزیابی الگوریتم پیشنهادی از سه دیتاست واقعی استفاده کردیم و میزان بهبود صحت که همان معیار ss هست را بر روی آن سنجیدیم که به بهبود قابل ملاحظه ای دست یافتیم. در نیتجه، این تجزیه و تحلیل می تواند برای درک رفتار هر خوشه از آغاز داده های جریانی مفید باشد.

کلیدواژه ها:

خوشه بندی جریان داده ها ، الگوریتم های تکاملی ، رانش مفهوم ، جریان داده ، خوشه بندی k_means

نویسندگان

جمیله حسینی

دانشجوی مقطع کارشناسی ارشد دانشگاه امام رضا (ع)

عادل قاضی خانی

استادیار گروه کامپیوتر دانشگاه امام رضا (ع)