CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روش جدید برای یافتن وابستگی فازی با چندین کمینه ضریب پشتیبان در پایگاه داده رابطه ای

عنوان مقاله: ارائه روش جدید برای یافتن وابستگی فازی با چندین کمینه ضریب پشتیبان در پایگاه داده رابطه ای
شناسه ملی مقاله: AISST01_045
منتشر شده در همایش ملی کاربرد سیستم های هوشمند (محاسبات نرم) در علوم و صنایع در سال 1392
مشخصات نویسندگان مقاله:

مریم حسنعلی - دانشجوی کارشناسی ارشد دانشگاه پیام نور
بهروز مینایی - استادیار دانشگاه علم و صنعت
احمد فراهی - استادیار دانشگاه پیام نور

خلاصه مقاله:
نیاز به ذخیره داده ها در پایگاه داده رابطه ایی و مشکلات ناشی از ادغام جداول و تبدیل آنها به یک جدول واحد، ما را به سوی داده کاوی رابطه ای رهنمون می سازد. در اینجا از الگوریتم MRFP-Growth برای یافتن الگوهای پرتکرار رابطه ای استفاده می شود. در کارهای قبلی انجام شده، به بررسی تاثیر فازی سازی ویژگی های عددی در کاوش قوانین انجمنی برای حل مشکل بازه های تند و همچنین به کارگیری چندین کمینه ضریب پشتیبان برای رفع مشکل اقلام نادر در پایگاه داده شامل یک جدول پرداخته شده است. در این مقاله به بررسی تاثیر این دو عامل در پایگاه رابطه ای می پردازیم. فازی سازی ویژگی های عددی باعث رفع مشکل بازه های تند در پایگاه داده رابطه ای می شود. برای رفع مشکل اقلام نادر، از چندین کمینه ضریب پشتیبان برای اقلام مختلف استفاده می کنیم. به طوری که کمینه ضریب پشتیبان به عنوان درصدی از تعداد کل پشتیبان هر آیتم در نظر گرفته می شود. استفاده از این روش باعث بهبود نسبی مشکل اقلام نادر می شود و از تولید زیاد و انفجاری الگوهای پرتکرار در مقادیر کوچک کمینه ضریب پشتیبان جلوگیری می کند. تعداد الگوها پرتکرار بعد از فازی سازی و استفاده از چندین کمینه ضریب پشتیبان به طور مناسبی کاهش می یابد ولی زمان اجرا الگوریتم و میانگین طول الگوها افزایش می یابد. در نتیجه الگوهای رابطه ای طولانی تری که حاوی بیشتری هستند، به وجود می آید.

کلمات کلیدی:
قوانین انجمنی، داده کاوی رابطه ای، فازی سازی، چندین کمینه ضریب پشتیبان

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/206221/