CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

معرفی و مقایسه روش های پی شپردازش داده برای کاربردهای مختلف داده کاوی

عنوان مقاله: معرفی و مقایسه روش های پی شپردازش داده برای کاربردهای مختلف داده کاوی
شناسه ملی مقاله: IDMC02_080
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

مریم بابایی
زهرا صفاریزدی
محمدحسین سرایی

خلاصه مقاله:
وجود مسائلی نظیر ناقص بودن داد هها، ناسازگاری آ نها و وجود ناخالصی هایی همچون خطاها، مقادیر تقریبی و مقادیر خارج از محدوده نرمال در پایگاه داده های واقعی، باعث کاهش کیفیت داده کاوی می شود. برای دستیابی به نتایج مطلوب تر، نیاز به داده های با کیفیت بالاتر وجود دارد. پیش پردازش، گامی مهم در راستای داده کاوی موفقیت آمیز است. اعمالی که در پیش پردازش انجام می شوند عبارت از حذف ناخالصی ها و اصلاح داده های نادرست، یکپارچ هسازی داده ها، تغییر داد هها و کاهش داده ها می باشد. بر اساس نوع کاربردی که عمل داده کاوی باید روی آن انجام شود، تکنیک های مختلفی برای هر یک از این اعمال مورد استفاده قرار می گیرد. این مقاله، به معرفی تکنی کهای به کار رفته برای انجام پی شپردازش در کاربردهای مختلف، ارزیابی و مقایسه نتایج حاصل از آ نها می پردازد؛ کارآمدترین تکنیک به کار رفته برای هر کاربرد را تعیین نموده و برای استفاده های آینده در کاربردهای مشابه، پیشنهاد م یکند.

کلمات کلیدی:
پیش پردازش، یکپارچه سازی، تغییر داده ها، کاهش داده ها

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70470/