شناسایی داده های پرت در مجموعه های داده با استفاده از خوشه بندی فازی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 710

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF07_255

تاریخ نمایه سازی: 22 مرداد 1399

چکیده مقاله:

داده کاوی روشی معتبر، جدید و مفید جهت شناسایی الگوهای قابل درک میباشد و در حال تبدیل شدن به یک ابزار مهم جهت تبدیل داده به دانش است. اگر نمونه ها نماینده خوبی از بدنه بزرگ داده نباشند، این فرایند شکست خواهد خورد. یکی از دلایل اصلی استفاده از داده کاوی تجزیه و تحلیل موثر و کارآمد مجموعه ای از مشاهدات مختلف با توجه به رفتار آنها میباشد. تشخیص داده پرت یک مفهوم بسیار مهم از داده کاوی است که به عنوان پرت کاوی اشاره شده و به مشکل پیدا کردن الگوها در مجموعه داده های بزرگ که مطابق با رفتار مورد انتظار نمی باشند، اشاره دارد. اغلب این الگوهای غیر عادی به عنوان نقاط دورافتاده، ناهنجاری، استثنا، تعجب و گسل نامیده میشوند. مشکلات بسیاری برای تعریف رفتار طبیعی یا ناحیه طبیعی به عنوان نقاط دور افتاده برجسته تر وجود دارند. عدم تشخیص داده پرت تاثیر زیادی درخصوصیات آماری کلی خواهد داشت و حتی ممکن است به نتیجه گیری نادرست منجر شود. از این رو در این تحقیق به بررسی این موضوع خواهیم پرداخت. در این تحقیق، ما از خوشه بندی فازی برای تشخیص داده های پرت استفاده می کنیم. در خوشه بندی کلاسیک هر نمونه ورودی متعلق به یک و فقط یک خوشه میباشد و نمیتواند عضو دو خوشه و یا بیشتر باشد. تفاوت اصلی خوشه بندی کلاسیک و خوشه بندی فازی در این است که یک نمونه میتواند متعلق به بیش از یک خوشه باشد. به منظور ارزیابی روش پیشنهادی، ما عملکرد آن را بر روی دیتابیس Iris مورد ارزیابی قرار دادیم.

نویسندگان

فرشاد غیب الهی

گروه برق ، دانشکده فنی و مهندسی، واحد کازرون ، دانشگاه آزاد اسلامی ، تهران ، ایران

امید مهدیار

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران

امین پیربنیه

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران