ارائه الگوریتم SAIC بهبود یافته برای خوشه بندی نظارت شده ی داده های جریانی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 361

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KAUCEE02_111

تاریخ نمایه سازی: 18 اردیبهشت 1400

چکیده مقاله:

هر روزه، حجم عظیمی از داده های اینترنتی، تراکنشی و سنسور بصورت پیوسته در قالب جریان داده تولید میشود که نیاز است بصورت برخط به محض اینکه دریافت میشوند مورد تحلیل و پردازش قرار گیرند. طبیعت پویای جریان داده و سرعت دریافت آن محدودیت های زمان و فضا را بر کاربردهای جریان داده اعمال می کندکه طراحی الگوریتم های جریان داده را دشوار می سازد . خوشه بندی یکی از روشهای کارآمد داده کاوی برای تحلیل و استخراج دانش از جریان داده هاست. از آنجا که ماهیت این داده ها ناپایدار و نامحدود است، الگوریتمهای متداول خوشه بندی را نمیتوان بطور مستقیم مورد استفاده قرار داد. الگوریتم SAIC یک روش خوشه بندی نظارت شده افزایشی سازگار روی جریان داده مبتنی بر بسته است. هدف ما ارائه چارچوبی مبتنی بر این الگوریتم است. ما در این چارچوب با در نظر گرفتن مفاهیمی همچون تغییر مفهوم در جریان داده ها و بروزرسانی مدل یادگیری پس از تشخیص تغییر مفهوم سعی در بهبود نتایج خوشه بندی داریم. به منظور اعتبارسنجی روش پیشنهادی از مجموعه داده های متداول موجود در فهرست UCI استفاده شده است. نتایج آزمایشات حاکی از اینست که الگوریتم پیشنهادی بطور قابل ملاحظه ای کاراتر از الگوریتم SAIC عمل مینماید.

کلیدواژه ها:

داده کاوی- جریان داده مبتنی بر بسته- تغییر مفهوم-خوشه بندی نظارت شده

نویسندگان

سمانه تیموری

دانشگاه امام رضا

عادل قاضی خانی

دانشگاه امام رضا