درجه ی همگرایی روش های تشخیص داده های دورافتاده در داده کاوی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

RSTCONF01_540

تاریخ نمایه سازی: 30 آبان 1394

چکیده مقاله:

تشخیص داده های دور افتاده یا تشخیص ناهنجاری داده در پایگاه های داده بزرگ که به دلایل مختلف از جمله خطاهای مکانیکی،تغییر در رفتار سیستم، رفتار جعلی، خطاهای انسانی و ... بوجود می آیند به علت تاثیر مستقیم و گاه مخرب آن بر مدلسازی صورت گرفته توسط ابزارهای داده کاوی از اهمیت بسیاری برخوردار است. روش های متفاوتی برای تشخیص داده های دور افتاده و آنومالی در داده ها وجود دارد که هریک با الگوریتمی متفاوت به یافتن داده های دورافتاده در یک دیتاست می پردازند. در این مقاله، میزان همگرایی چند روش تشخیص آنومالی با ملاک قرار دادن روش خوشه بندی K-Means از نظر توانایی آن ها در یافتن تعداد بیشتری داده ی دورافتاده در بستر نرم افزار داده کاوی RapidMiner آزمایش و با یکدیگر مقایسه شده است

کلیدواژه ها:

الگوریتم های خوشه بندی ، تشخیص آنومالی ، تشخیص داده های دورافتاده ، داده کاوی

نویسندگان

مریم رهروان

کارشناسی ارشد، مهندسی کامپیوتر، نرم افزار،گروه کامپیوتر دانشکده فنی دانشگاه آزاد رشت

فاطمه احمدی آبکناری

استادیار، دکتری فناوری اطلاعات، دانشگاه پیام نور رشت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • اسماعیلی، مهدی (1391). مفاهیم و تکنیک های داده کاوی. دانشگاه ...
  • بابایی، غلامرضا (1386). روش های تعیین داده های پرت در ...
  • توکلی زاده راوری، محمد؛ نجابتیان، مریم (1389). خوشه بندی مبتنی ...
  • حاجی حیدری، نسرین؛ خاکباز، سیدبهنام؛ (392 1)، داده کاوی جلد ...
  • دیانی، محمد حسین (1381). داده پردازی برای کتابداران و اطلاع ...
  • صنیعی آباده، محمد؛ محمودی، سینا؛ طاهرپور، محدثه (1393). داده کاوی ...
  • فرمانی اردهائی، راضیه (1390). کاربرد رگرسیون مولفه های اصلی برای ...
  • محمدزاده، محسن (1380). روشهای شناسایی داده های دور افتاده فضایی، ...
  • مزدک، زینب؛ پیوندی، پدرام؛ علمداری یزدی، علی اصغر (1391). استخراج ...
  • Aleksandar Lazarevic, Aysel Ozgur, Levent Ertoz, Jaideep Srivastava, Vipin Kumar. ...
  • C HARUC. AGGRW AL. (2012). OUTLIER ANALYSIS, IBM T . ...
  • Gao Zengan. (2009). Application of Cluster-Based Local Outlier Factor Algorithm ...
  • Gerrhard Munz, Sa Li, Georg Carle. (2007). Traffic Anomaly Detection ...
  • Pei Sun Sanjay Chawla Bavani Arunasalam. (2006). Mining for Outliers ...
  • Prasanta Gogoi1, D.K Bhattcharyya1 , B.Borah1. (2011). A Survey of ...
  • Post-Doctoral Station of Theoretical Economics. (2004). China Center for Anti-Money ...
  • Victoria J. Hodge and Jim Austin. (2004). A Survey of ...
  • نمایش کامل مراجع