رویکرد مبتنی بر القای مجدد برای کاوش کارآمد مجموعه اقلام با سودمندی بالا از مجموعه داده های افزایشی

  • سال انتشار: 1403
  • محل انتشار: نوزدهمین کنفرانس ملی پژوهش های کاربردی در علوم برق ،کامپیوتر و مهندسی پزشکی
  • کد COI اختصاصی: ECMECONF19_020
  • زبان مقاله: فارسی
  • تعداد مشاهده: 143
دانلود فایل این مقاله

نویسندگان

هادی ناصری

عضو هیئت علمی دانشگاه آزاد اسلامی واحد استهبان

فاطمه زارع

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد استهبان

چکیده

کاوش مجموعه اقلام با سودمندی بالا، یک حوزه تحقیقاتی مهم است که بر شناسایی ترکیباتی از مجموعه اقلام در پایگاه های داده تمرکز دارد که دارای مقدار سودمندی بالاتر از یک آستانه مشخص شده توسط کاربر هستند. با این حال، اغلب الگوریتم های موجود در این حوزه، فرض می کنند که پایگاه های داده ایستا و بدون تغییر هستند. این فرض در دنیای واقعی چندان واقع بینانه نیست، زیرا مجموعه داده های دنیای واقعی به طور مداوم با داده های جدید در حال رشد و تغییر هستند. علاوه بر این، الگوریتم های موجود تنها بر مقدار سودمندی برای شناسایی مجموعه اقلام مرتبط تکیه می کنند. این موضوع منجر به این می شود که حتی ترکیباتی که در مراحل اولیه رخ داده اند نیز به عنوان خروجی تولید شوند. اگرچه برخی از الگوریتم های استخراج یک رویکرد مبتنی بر پشتیبانی را برای محاسبه فراوانی مجموعه اقلام اتخاذ می کنند، اما ماهیت زمانی مجموعه های آیتم ها را در نظر نمی گیرند.برای پرداختن به این چالش ها، این مقاله الگوریتم Scented Utility Miner (SUM) را پیشنهاد می کند که از یک استراتژی القایی مجدد برای ردیابی جدید بودن وقوع مجموعه آیتم ها و کاوش مجموعه های اقلام از پایگاه های داده افزایشی استفاده می کند. این مقاله رویکردی نوین برای کاوش مجموعه اقلام با سودمندی بالا از پایگاه های داده پویا ارائه می دهد و با ارائه چندین آزمایش، کارایی روش پیشنهادی را اثبات می کند.

کلیدواژه ها

کاوش مجموعه اقلام با سودمندی بالا، داده کاوی، کاوش کارایی حافظه، مجموعه داده های افزایشی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.