خوشه بندی داده های جریان داده دارای برچسب

  • سال انتشار: 1397
  • محل انتشار: مجله علوم رایانشی، دوره: 3، شماره: 3
  • کد COI اختصاصی: JR_CSJI-3-3_003
  • زبان مقاله: فارسی
  • تعداد مشاهده: 82
دانلود فایل این مقاله

نویسندگان

زهرا بیات

دانشجوی کارشناسی ارشد دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

هدیه ساجدی

استادیار دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

چکیده

امروزه مسئله پیداکردن الگوریتم های خوشه بندی نظارت شده برای داده های پویا و جریان داده اهمیت زیادی دارد. محققان سعی می کنند برای حل کردن این مسئله الگوریتم های جدید ارائه نمایند و یا الگوریتم های موجود را بهبود دهند. در میان این الگوریتم ها، روش SAIC برای خوشه بندی داده های پویا با خوشه های با اندازه و شکل دلخواه ارائه شده است. در این روش، تعداد خوشه ها به طور خودکار توسط الگوریتم مشخص می شود اما این الگوریتم قادر به تشخیص صحیح خوشه های مسائل تک دسته ای نیست. این امر موجب می شود که بعضا در خوشه بندی جریان داده اختلال ایجاد شود. در این مقاله ضمن توضیح علت ایجاد این مشکل، الگوریتمISAIC برای بهبود الگوریتم SAIC پیشنهاد می شود. همچنین عملکرد الگوریتم ISAIC با الگوریتم SAIC روی چند مجموعه داده مورد مقایسه قرار گرفته و نتایج ارایه شده است. میزان بهبود دقت دسته بندی بر روی مجموعه داده های مورد آزمایش حداقل صفر و حداکثر حدود ۶۵% است.

کلیدواژه ها

توده جریان داده, جریان داده خوشه بندی, خوشه بندی نظارت شده

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.