کاوش مجموعه آیتم های مکرر مبتنی بر منطق فازی با استفاده از چندین آستانه پشتیبانی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 496

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF07_004

تاریخ نمایه سازی: 24 مرداد 1398

چکیده مقاله:

یافتن قوانین وابستگی میان آیتم های یک مجموعه داده و کاوش مجموعه آیتم های مکرر، یکی از روش های بسیار مهم داده کاوی است که به کاوش روابط ضمنی ولی مفید بین اطلاعات می پردازد. در مجموعه داده های کمی واقعی که شامل حجم زیادی از آیتم ها هستند، لازم است تا در ابتدا داده ها به فواصل مختلفی تقسیم بندی و سپس به نوع دودویی تبدیل شوند. در این تبدیل، مجموعه داده ها که شامل مقادیر قطعی 0 و یا 1 هستند، ممکن است با مسئله ای به نام مرزها ی تی ز مواجه شوند. در الگوریتم ارائه شده سعی شده است تا با استفاده از مجموعه های فازی و مقادیر عضویت که در بازه [ 1 و 0] تعریف می شوند، بر این مشکل غلبه شود. از طرفی از آنجا که استفاده از یک معیار آستانه به عنوان تنها معیار برای شناسایی الگوهای مکرر موجب بروز مسئله ای به نام مجموعه آیتم ها ی نادر می شود؛ برای هر آیتم یک مقدار حداقل آستانه پشتیبانی واحد در نظر گرفته شده است. بدین ترتیب با نظر گرفتن درجه اهمیت هر آیتم که می تواند میزان سودمندی آن ها باشد و اختصاص یک مقدار آستانه واحد، مجموعه کاملی از الگوهای مکرر که شامل تمام مجموعه آیتم های فازی است که دارای مقدار پشتیبان بزرگ تر یا مساوی حداقل آستانه پشتیبانی تعریف شده توسط کاربراست، استخراج می شود. از ساختار درخت شمارشی (Enumeration-tree)، ویژگی بسیار بالا به پایین مرتب شده (Sorted Downward Closure Property) کوچک ترین آستانه پشتیبانی (LMS) و برای هرس مجموعه آیتم هایی که به صورت بالقوه مکرر نمی باشند استفاده شده است. بدین ترتیب فضای نمونه ای کوچک تر شده و به تبع آن مدت زمان اجرای الگوریتم و میزان مصرف حافظه بهبود یافته است.

کلیدواژه ها:

نویسندگان

منیژه نیکو فراز

دانشگاه آزاد اسلامی واحد یادگار امام خمینی (ره)

الهام قنبری

دانشگاه آزاد اسلامی واحد یادگار امام خمینی (ره)

فاطمه نصیری

دانشگاه آزاد اسلامی واحد یادگار امام خمینی (ره)