مروری بر روش تشخیص داده های پرت مبتنی بر نودهای همسایه

  • سال انتشار: 1392
  • محل انتشار: اولین همایش ملی برق و کامپیوتر جنوب ایران
  • کد COI اختصاصی: KHIAU01_033
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1961
دانلود فایل این مقاله

نویسندگان

حمیده گنجی ارجنکی

دانشگاه آزاد اسلامی واحد نجف آباد، دانشجوی کارشناسی ارشد گروه علمی مهندسی ج.ا.ایران

چکیده

شناسایی داده‌های پرت در مجموعه داده با توجه به کاربرد آن در شناسایی تقلب در زمینه‌های تجاری، مالی و یا تشخیص بیماری‌ها در زمینه پزشکی، از اهمیت به سزایی برخوردار است. تعداد زیادی از روش‌های تشخیص داده‌های پرت صرفاً مبتنی بر پارامتر فاصله بین داده‌ها بوده که از دقت کافی برخوردار نیستند و محلی بودن داده‌ها و همچنین داده‌های همسایه را در شناسایی داده پرت در نظر نمی‌گیرند. در این مقاله سعی بر مرور روش‌های شناسایی داده پرت مبتنی بر داده‌های همسایه است که علاوه بر در نظر گرفتن پارامتر فاصله از نودهای همسایه نیز برای تشخیص پرت بودن داده در مجموعه داده ها استفاده شود. نتایج حاصل نشان می‌دهد که این روش نسبت به روش‌های مبتنی بر فاصله از دقت بالاتری در شناسایی داده های پرت برخوردار است.

کلیدواژه ها

داده کاوی، داده پرت، نودهای همسایهnearest neighborhood

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.