درجه ی همگرایی روش های تشخیص داده های دورافتاده در داده کاوی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
RSTCONF01_540
تاریخ نمایه سازی: 30 آبان 1394
چکیده مقاله:
تشخیص داده های دور افتاده یا تشخیص ناهنجاری داده در پایگاه های داده بزرگ که به دلایل مختلف از جمله خطاهای مکانیکی،تغییر در رفتار سیستم، رفتار جعلی، خطاهای انسانی و ... بوجود می آیند به علت تاثیر مستقیم و گاه مخرب آن بر مدلسازی صورت گرفته توسط ابزارهای داده کاوی از اهمیت بسیاری برخوردار است. روش های متفاوتی برای تشخیص داده های دور افتاده و آنومالی در داده ها وجود دارد که هریک با الگوریتمی متفاوت به یافتن داده های دورافتاده در یک دیتاست می پردازند. در این مقاله، میزان همگرایی چند روش تشخیص آنومالی با ملاک قرار دادن روش خوشه بندی K-Means از نظر توانایی آن ها در یافتن تعداد بیشتری داده ی دورافتاده در بستر نرم افزار داده کاوی RapidMiner آزمایش و با یکدیگر مقایسه شده است
کلیدواژه ها:
نویسندگان
مریم رهروان
کارشناسی ارشد، مهندسی کامپیوتر، نرم افزار،گروه کامپیوتر دانشکده فنی دانشگاه آزاد رشت
فاطمه احمدی آبکناری
استادیار، دکتری فناوری اطلاعات، دانشگاه پیام نور رشت
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :