ارائه ی یک روش جدید برای ارزیابی سطح کیفیت داده ها مبتنی بر روشهای دادهکاوی در پایگاه داده های رابطه ای

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,565

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC04_055

تاریخ نمایه سازی: 15 دی 1389

چکیده مقاله:

کیفیت داده در فرایند کشف دانش در پایگاه داده از اهمیت ویژه ای برخوردار است تاکنون دو رویکرد کلی با استفاده از روشهای اماری و یا تکنیکهای داده کاوی برای ارزیابی سطح کیفیت داده مطرح شده است که روشهای مبتنی بر داده کاوی با تکیه بر دانش استخراج شده بهبود مناسبتری را در ارزیابی سطح کیفیت داده حاصل کرده اند. یکی از موضوعات مورد توجه ارزیابی سطح کیفیت رکوردهای پایگاه داده های رابطه ای، تنها بر مبنای قوانین وابستگی کشف شده بین صفات طبقه ای آنهاست مشکل عمده ی این روش ها نادیده گرفتن صفات عددی داده است ولی در دنیای واقعی داده های بیشماری هستند که هم صفات عددی و هم صفات طبقه ای را تواما دارند. روش پیشنهادی دراین مقاله با تکیه بر مفهوم خوشه بندی رکوردهای پایگاه داده ی رابطه ای استخراج قواعد توصیفی هر خوشه، در نظر گرفتن میزان اهمیت هر صفت از رکورد در ارزیابی کیفیت آن و در نهایت ارزیابی میزان صحت مقدار صفات بصورت سلسله مراتبی توانسته است تا حدودی مشکلات موجود در روشهای پیشین را برطرف سازد.

کلیدواژه ها:

نویسندگان

حمیدرضا خسروانی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران

مهران محسن زاده

استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران