An Efficeint Algorithm Based on EFIM for Mining High-Utility Itemsets with Negative Unit Profits

  • سال انتشار: 1397
  • محل انتشار: چهارمین کنفرانس ملی تحقیقات کاربردی در مهندسی برق،مکانیک،کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: EMCE04_335
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 545
دانلود فایل این مقاله

نویسندگان

Yousef Yousefi

Department of Computer Science, Eshragh, Institute of Higher Education, Bojnurd, Iran

Azadeh Soltani

Department of Computer Science, University of Bojnord, Bojnord, Iran

چکیده

The High Utility Itemset Mining (HUIM) problem is an extension of Frequent Itemset Mining (FIM) problem. Unlike FIM, HUIM allows non-binary appearance of items in transactions and it also takes into account weights and profits of items. Several algorithms have been proposed to efficiently mine HUIs. However, most of which can not deal with negative profits; while, in real word negative profits play an important role. Hence, providing an efficient algorithm for mining high utility itemsets considering negative profits is an essential task. FHN is the most recent algorithm for this purpose, which is based on the FHM algorithm. However, in HUIM problem considering only positive profits, EFIM is more efficient than FHM. EFIM uses merging and projection methods to decrease the dataset size. It also uses two techniques for pruning the search space. In this research, we proposed an efficient algorithm for HUIM problem which supports both negative and positive unit profits. We modified the upper bound definition of itemset utilities and the pruning strategies in order to support negative profits. According to the results, the proposed algorithm is better than the existing algorithms in terms of run time and memory consumption.

کلیدواژه ها

High Utility Itemset Mining, Negative profits, Data Mining, EFIM

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.