روشی سریع برای کاوش قوانین انجمنی 1 در مجموعه داده های حجیم با استفاده از عملگر های منطقی

  • سال انتشار: 1385
  • محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI12_026
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1790
دانلود فایل این مقاله

نویسندگان

فخراحمد

عضو هیات علمی دانشگاه آزاد اسلامی واحد شیراز، بخش مهندسی کامپیوتر

صدرالدینی

استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر

ذوالقدری جهرمی

استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر

چکیده

با توجه به کاربرد روزافزون بانک های اطلاعاتی حجیم و انباره های بزرگ تراکن ش 2، اخیرا توجه بسیاری از محققان به سمت تولید روش های کارآمد جهت استخراج قوانین انجمنی معطوف گشته اس ت. اغلب روشها ی موجود در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیب ی) را از بین تمام اقلام موجود در داده ها جستجو م یکنند که این امر نیازمند به خواندن مکرر کل داده ها از دیسک است . اکثر روشهایی هم که جدیدا پیشنهاد شده اند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبان ی 3 بعضی از اقلام را بتوا ن مستقیما و بدون پیمایش داده ها محاسبه کر د. اما به این مساله کمتر توجه شده که چگونه به روش بهینه ای بر ای شمارش دفعات رخداد اقلام در مواقع ی ک ه راه ی جز شمارش وجود ندارد دست یابیم . در این مقاله راه حلی کارا برای این مساله ارائه شده است . در روش پیشنهادی ما ، داده ها تنها یک بار از دیسک خوانده می شوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل می گردند، بطوریک ه اولا قابل نگهداری در حافظه می باشند و ثانیا با توجه به ساختار خاصی که دارند، عملیات شمارش به سریع ترین نحو ممکن انجام م یگردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل می شود . پس از ارائه الگوریتم، کارایی آن را با استفاده از دو مجموعه از داده های ساختگی و واقعی ارزیابی ک رده و با چند روش کارا که تاکنون ارائه شده اند، مقایسه میکنیم.

کلیدواژه ها

داده کاوی، قوانین انجمنی، اقلام پرتکرار، تراکنش، تحلیل سبد خرید

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.