روشی جهت بهبود عملکرد الگوریتم کشف قواعد انجمنی در سبد خرید با استفاده از کاهش تعداد کاندیدها

  • سال انتشار: 1394
  • محل انتشار: اولین همایش ملی علوم و فناوری های نوین ایران
  • کد COI اختصاصی: PFCONF01_132
  • زبان مقاله: فارسی
  • تعداد مشاهده: 450
دانلود فایل این مقاله

نویسندگان

فریده کشاورز

دانشگاه آزاد اسلامی اصفهان، واحد (خوراسگان)

جواد حسین خانی

دانشگاه آزاد اسلامی اصفهان، واحد (خوراسگان)

فرساد زمانی

دانشگاه آزاد اسلامی اصفهان، واحد (خوراسگان)

چکیده

کاوش مجموعه آیتم های مکرر در پایگاه داده تراکنشی، پایگاه داده های سری زمانی و بسیاری از انواع دیگر پایگاه داده به طور گسترده درتحقیقاتداده کاوی مورد مطالعه قرار گرفته است. کاوش مجموعه آیتم های مکرر مرحله اساسی در استخراج قواعد انجمنی می باشد. قواعد انجمنی تکنیکاصلی برای داده کاوی است. الگوریتم Apriori یک الگوریتم کلاسیک کاوش قواعد انجمنی است. الگوریتم های بسیاری مبنی بر الگتوریتم Aprioriبرای کاوش قواعد انجمنی و بهبود آنها پیشنهاد شدند. یکی از این الگوریتم ها، الگوریتم BitApriori است. اگرچه این الگوریتم زمان شمارش مقدارپشتیبانی را کاهش می دهد، اما زمانیکه پایگاه داده بزرگ است، BitApriori ممکن است با مشکل کمبود حافظه مواجه شود؛ اخیرا الگوریتمی بهنام Enhanced BitApriori ارائه گردیده که با جایگزین نمودن برخی تکنیک های موثرتر بر روی رشته ی باینری، تا حدی الگتوریتم BitAprioriرا بهبود بخشیده است. اما این الگوریتم نیز هنوز می تواند با حذف آیتم های غیرمکرر بهبود داده شود. بنابراین، در این مقاله روشی ارائه شد که بااستفاده از فاکتورهای Set Size و Set Size Frequency حداقل تعداد کاندیدها با کارایی بیشتر ارائه می شود. نتایج بدست آمده نشان داد کهروش ارائه شده نسبت به الگوریتم Enhanced BitApriori کارامدتر می باشد.

کلیدواژه ها

داده کاوی، الگوریتم Apriori ، کاوش قواعد انجمنی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.