و EFIM+ یک الگوریتم کارا برای کشف مجموعه اقلام باارزش با محدودیت طول

  • سال انتشار: 1396
  • محل انتشار: نهمین کنفرانس فناوری اطلاعات و دانش (IKT 2017)
  • کد COI اختصاصی: ICIKT09_017
  • زبان مقاله: فارسی
  • تعداد مشاهده: 490
دانلود فایل این مقاله

نویسندگان

محمود سلطانی

دانشگاه مهندسی فناوری های نوین قوچان، گروه مهندسی کامپیوتر

ازاده سلطانی

دانشگاه بجنورد، گروه مهندسی کامپیوتر

چکیده

استخراج مجموعه اقلام با ارزش که یکی از زیر مسایل استخراج مجموعه اقلام پرتکرار است، نقش مهمی در حوزه داده کاوی داشته و در کاربردهای فراوانی مورد استفاده قرار میگیرد. مجموعه اقلام با ارزش، مجموعه ای از اقلام است که در پایگاه داده تراکنشی منجر به ارزش و سود بالاتری شده و در نتیجه اهمیت بیشتری دارند. الگوریتم های موجود برای استخراج مجموعه اقلام با ارزش، معمولا به سمت استخراج مجموعه هایی با تعداد اقلام زیاد می روند زیرا مجموع ارزش این اقلام باعث افزایش ارزش کل مجموعه می شود. این در حالی است که مجموعه هایی با تعداد اقلام زیاد معمولا از لحاظ کاربردی کمتر مورد توجه بوده و تعداد آنها نیز کم است. بنابراین نیاز به تعریف مسیله جدیدی است که هدف آن پیدا کردن مجموعه اقلام با ارزشی است که دارای تعداد اقلامی کمتر از یک حد آستانه از پیش تعریف شده باشد. در این مقاله الگوریتمی پیشنهاد شده است که با ایجاد تغییرات لازم بر روی الگوریتم EFIM (سریعترین الگوریتم استخراج مجموعه اقلام با ارزش حال حاضر) محدودیت طول را نیز لحاظ می کند. روش پیشنهادی با بازتعریف پارامترهای لازم برای کاهش فضای جستجو، تنها مجموعه اقلام با ارزشی را پیدا میکند که تعداد اقلام آنها کمتر از حد آستانه باشد. نتایج ارزیابی برروی پایگاه داده استاندارد نشان می دهد روش پیشنهادی در مقایسه با الگوریتم مشابه، علاوه بر اینکه دارای زمان اجرای بهتری است، حافظه کمتری نیز اشغال میکند.

کلیدواژه ها

داده کاوی، مجموعه اقلام با ارزش، استخراج مجموعه اقلام با ارزش با محدودیت طول، پایگاه داده تراکنش

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.