شناسایی داده های پرت در مجموعه های داده با استفاده از خوشه بندی فازی

  • سال انتشار: 1399
  • محل انتشار: هفتمین کنگره ملی تازه یافته های مهندسی برق ایران
  • کد COI اختصاصی: COMCONF07_255
  • زبان مقاله: فارسی
  • تعداد مشاهده: 881
دانلود فایل این مقاله

نویسندگان

فرشاد غیب الهی

گروه برق ، دانشکده فنی و مهندسی، واحد کازرون ، دانشگاه آزاد اسلامی ، تهران ، ایران

امید مهدیار

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران

امین پیربنیه

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران

چکیده

داده کاوی روشی معتبر، جدید و مفید جهت شناسایی الگوهای قابل درک میباشد و در حال تبدیل شدن به یک ابزار مهم جهت تبدیل داده به دانش است. اگر نمونه ها نماینده خوبی از بدنه بزرگ داده نباشند، این فرایند شکست خواهد خورد. یکی از دلایل اصلی استفاده از داده کاوی تجزیه و تحلیل موثر و کارآمد مجموعه ای از مشاهدات مختلف با توجه به رفتار آنها میباشد. تشخیص داده پرت یک مفهوم بسیار مهم از داده کاوی است که به عنوان پرت کاوی اشاره شده و به مشکل پیدا کردن الگوها در مجموعه داده های بزرگ که مطابق با رفتار مورد انتظار نمی باشند، اشاره دارد. اغلب این الگوهای غیر عادی به عنوان نقاط دورافتاده، ناهنجاری، استثنا، تعجب و گسل نامیده میشوند. مشکلات بسیاری برای تعریف رفتار طبیعی یا ناحیه طبیعی به عنوان نقاط دور افتاده برجسته تر وجود دارند. عدم تشخیص داده پرت تاثیر زیادی درخصوصیات آماری کلی خواهد داشت و حتی ممکن است به نتیجه گیری نادرست منجر شود. از این رو در این تحقیق به بررسی این موضوع خواهیم پرداخت. در این تحقیق، ما از خوشه بندی فازی برای تشخیص داده های پرت استفاده می کنیم. در خوشه بندی کلاسیک هر نمونه ورودی متعلق به یک و فقط یک خوشه میباشد و نمیتواند عضو دو خوشه و یا بیشتر باشد. تفاوت اصلی خوشه بندی کلاسیک و خوشه بندی فازی در این است که یک نمونه میتواند متعلق به بیش از یک خوشه باشد. به منظور ارزیابی روش پیشنهادی، ما عملکرد آن را بر روی دیتابیس Iris مورد ارزیابی قرار دادیم.

کلیدواژه ها

داده پرت، خوشه بندی، منطق فازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.