ارائه مدل ترکیبی طبقه بندی سریع جریان داده ها با استفاده از الگوریتم درخت هافدینگ

  • سال انتشار: 1398
  • محل انتشار: سومین کنفرانس ملی مهندسی کامپیوتر،داده کاوی و داده های حجیم
  • کد COI اختصاصی: CEDAB03_041
  • زبان مقاله: فارسی
  • تعداد مشاهده: 634
دانلود فایل این مقاله

نویسندگان

مهدی جرگه

کارشناسی ارشد، دانشگاه آزاد اسلامی واحد فردوس ، گروه کامپیوتر خراسان جنوبی، ایران،

حمید بهادر

دکتری مهندسی کامپیوتر و صنایع، دانشگاه آزاد و دانشگاه فنی و حرفه ای خوی دوم ، ایران،

چکیده

امروزه با پیشرفت فن آوری، بسیاری از برنامه های کاربردی مقادیر زیادی از داده های جریانی با سرعت بالا را تولید میکنند. ترافیک در شبکه، نظارت تصویری و شبکه های حسگر مثالهایی از این مورد میباشند. برخلاف داده کاوی سنتی که داده ها به صورت استاتیک است و میتوانند خیلی وقتها چند بار خوانده شوند. الگوریتم های کاوش داده جریانی با چالشهای زیادی از قبیل محدودیت حافظه، پاسخ در زمان واقعی و مفهوم رانش روبه رو هستند. درهرصورت داده جریانی تعدادی از ویژگی های متمایز خواهد بود که باعث میشود مقدار حافظه کش با حافظه سیستم موجود برای ذخیره سازی جریان داده های کل مناسب نباشد. مشکل اصلی داده های جریانی، سرعت است که در آن داده های جریانی در دسترس است بسیار سریع تر از اینکه داده بتواند پردازش و ذخیره شود. بهره گیری از روش هایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، امری غیرقابل اجتناب است. به دلیل حجم بسیار بالای داده ها و اهمیت بیشتر داده های جدید، ذخیره سازی این داده ها در بسیاری از کاربردها امری مقرون به صرفه نیست، لذا داده هایی که باید مورد پردازش قرار گیرند، همواره به صورت پویا در حال تغییر و تحول هستند.دراین پژوهش دستاوردهای اصلی این تحقیق عبارت اند از ارائه مدل ترکیبی طبقه بندی سریع جریان داده ها با استفاده از الگوریتم درخت هافدینگ برای طبقه بندی جریان داده ها است با استفاده از این طبقه بندی ابتدا یک مدل توسط داده جریانی که متد پیشنهادی میباشد آموزش داده میشود و سپس توسط دو معیار ارزیابی به روشهای, Holdout مدل ارزیابی میشود. نتایج ارزیابی این دو روش را میتوان با میزان دقت و زمان مدل آموزشی و حافظه صرف شده رویداده ها به دست آورد. بالاتر بودن درصد دقت طبقه بندی و کمتر بودن زمان وحافظه صرف شده بیانگر سریع بودن مدل آموزشی در داده ها خواهد بود.

کلیدواژه ها

جریان داده، طبقه بندی، داده کاوی، درخت هافدینگ

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.