Sampling large database for association rules without candidate generation

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,179

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI11_251

تاریخ نمایه سازی: 5 آذر 1390

چکیده مقاله:

In this study a new and fast approach is presented for mining association rule. It is a hybrid approach based on sampling algorithm which uses FP-Growth to find frequent itemset in sample data. This method neglect candidate generation and test due to FP-Tree projection of sample data. For the main memory limitation problem i.e. loading sample data and representing FPTree structure a useful technique is proposed. Both theoretical and experimental evaluations show that the approach is faster than Apriori-based sampling by orders of magnitude. In addition experimental evaluation shows that the approach is more efficient when the minimum support threshold is reduced.

نویسندگان

Mahmood Deypir

Department of Computer Science and Engineering School of Engineering, Shiraz UniversityShiraz, Iran.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • R. Agrawal, T. Imiliniski, and A.Swam. Mining association rules between ...
  • respectively, while the number of transactions in the data set ...
  • H. Toivone. Sampling large databases for association rules. In T.M. ...
  • J.Han, J.Pie, Y.Yin, and R.Mao. Mining frequent pattern ...
  • minimum support threshold against the dataset. This figure Data Mining ...
  • E XPE RI MENTAL EVAL UATIONS ...
  • F.Bodon. Surprising results of trie-based fim algorithms. In Proceedings of ...
  • B.Goethals, J.Muhonen and H.Toivonen. Mining Non- ...
  • S.Jaroszewic and D.A.Simovic. Pruning redundant ...
  • Proceedings of the 1997 ACM SIGMOD International Derivable Association Rules. ...
  • conference, PAKDD '02, Pages 135-147, Taipei Taiwan, May ...
  • J. Han and M. Kamber. DATA MINING : Concepts and ...
  • R. Agrawal and R. Srikant. Quest Synthetic Data Generato r.IBM ...
  • A. Savasere, E. Omiecinski, and S. Navathe. An efficient ...
  • Proceedings of the IEEE ICDM Workshop on Frequent Itemset algorithm ...
  • R. Agrawal and R.Srikant, Fast Algorithms for mining Association Rules, ...
  • S. Brin, R. Motwani, J.D. Ullman, and S. Tsur. Dynamic ...
  • J.S. Park, M.-S. Chen, and P.S. Yu. An effective hash ...
  • ACM SIGMO2 International Conference on Management 2002. of Data, volume ...
  • F.Bodon. A fast apriori imp lementation. In Proceedings of the ...
  • C. Borgelt. Efficient implementation S of apriori and eclat. In ...
  • نمایش کامل مراجع