رویکردی جدید جهت کاوش الگوهای مکرر فازی با آیتم های چندگانه و چندین حداقل آستانه پشتیبانی

  • سال انتشار: 1398
  • محل انتشار: سومین کنفرانس ملی مهندسی کامپیوتر،داده کاوی و داده های حجیم
  • کد COI اختصاصی: CEDAB03_008
  • زبان مقاله: فارسی
  • تعداد مشاهده: 488
دانلود فایل این مقاله

نویسندگان

منیژه نیکوفراز

گروه کامپیوتر، واحد یادگار امام خمینی ره شهرری، دانشگاه آزاد اسلامی، تهران،ایران

الهام قنبری

عضو هیات علمی گروه کامپیوتر، واحد یادگار امام خمینی ره شهرری، دانشگاه آزاد اسلامی، تهران، ایران

فاطمه نصیری

عضو هیات علمی گروه کامپیوتر، واحد یادگار امام خمینی ره شهرری، دانشگاه آزاد اسلامی، تهران، ایران

چکیده

کاوش قوانین انجمنی یکی از موضوعات مهم جهت استخراج داده ها است تا بتوان از روی داده های استخراجشده، اطلاعات و روابط بالقوه بین آنها را کشف کرد. استفاده از یک مقدار حداقل آستانه پشتیبانی واحد برای سنجش مطلوب بودن روابط بین آیتم ها، سبب میشود تا آیتم ها با تعداد تکرار کمتر ولی با درجه اهمیت بالا در قوانین انجمنی استخراج شده، یافت نشوند. لذا در این مقاله برای حل این مشکل، الگوریتمی پیشنهاد میشود که برای هر آیتم موجود در مجموعه داده، با توجه به درجه اهمیتی که دارد، یک مقدار حداقل آستانه پشتیبانی مجزا در نظر میگیرد. در ادامه در الگوریتم پیشنهادی برای حل مشکل لبه های تیز که از بخش بندی داده های کمی به منظور استخراج قوانین انجمنی به وجود می آید از منطق فازی استفاده میشود. بدین منظور روش پیشنهادی به کاوش قوانین انجمنی فازی و کشف روابط بین آیتم ها با استفاده از مجموعه های فازی و عبارات زبان شناختی میپردازد. در روش پیشنهادی جهت استخراج تمامی الگوهای مکرر موجود، تمامی آیتم های فازی که شرط مکرر بودن را دارند بهجای فقط آیتم هایی که دارای بالاترین مقدار پشتیبان هستند، در عملیات کاوش مشارکت داده میشوند و از ساختار درخت شمارشی و کوچکترین آستانه پشتیبانی برای حذف داده های غیر مکرر استفاده خواهد شد. استفاده از ساختارهای معرفی شده موجب کاهش زمان اجرای الگوریتم و مقیاس پذیری آن خواهد شد.

کلیدواژه ها

قوانین انجمنی، حداقل آستانه پشتیبانی، لیست فازی، الگوهای مکرر فازی، کوچکترین آستانه پشتیبانی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.