ارائه یک تکنیک Oversampling نوین مبتنی بر چگالی در مجموعه داده های نامتعادل
- سال انتشار: 1400
- محل انتشار: سومین کنفرانس ملی پژوهش های نوین در مهندسی و علوم کاربردی
- کد COI اختصاصی: NREAS03_225
- زبان مقاله: فارسی
- تعداد مشاهده: 540
نویسندگان
دانشجوی کارشناسی ارشد، دانشگاه بیرجند.
استادیار، دانشگاه بیرجند.
چکیده
مجموعه داده ای را نامتعادل گویند که اختلاف میان تعداد نمونه های موجود در یک کلاس نسبت به دیگر کلاس ها دارای اختلافی چشمگیر باشد. این مجموعه دارای دو کلاس اکثریت و اقلیت می باشد. این اختلاف باعث اختلال در روند یادگیری داده ها شده و الگوریتمهای یادگیری را به سمت مدل سازی کلاس اکثریت سوق می دهد. این مشکل هنگامی که دادهها همپوشانی داشته باشند، پیچیده تر می شود. برای مقابل با عدم تعادل از دو رویکرد undersampling و Oversampling بهره گرفته می شود. رویکرد oversampling داده های جدید برای کلاس اقلیت ایجاد می کند تا مجموعه داده به تعادل برسد. این مقاله یک الگوریتم مبتنی بر چگالی که از تکنیک Oversampling بهره می برد را ارائه می کند. این الگوریتم علاوه بر تلاش برای رسیدن به تعادل با ایجاد داده های جدید، همپوشانی بین دو کلاس را نیز حذف می کند. برای ارزیابی الگوریتم پیشنهادی، ۱۴ مجموعه داده نامتعادل که طیف گسترده ای از سناریوهای موجود را شامل می شوند، بر روی الگوریتم پیشنهادی و الگوریتم های مشهور و پرکاربرد در این حوزه اجرا شده و با استفاده از طبقه بند svm مورد ارزیابی قرار گرفته شده است. نتایج بدست آمده از این ارزیابی، نشان می دهند که الگوریتم پیشنهادی در دو معیار sensitivity وfl_scoreنتایج بهتری نسبت به دیگر روش ها داشته است.کلیدواژه ها
مجموعه داده های نامتعادل، بیش نمونه برداری، همپوشانی، چگالی.مقالات مرتبط جدید
- آینده نظام آموزشی در عصر هوش مصنوعی
- کاربرد الگوریتمهای فراابتکاری ترکیبی در پیشبینی بار شبکه های هوشمند
- واکاوی ظرفیت سنجی مسئولیت حقوقی هوش مصنوعی در پرتو قوانین داخلی و بین المللی
- Design and Optimization of Catalysts with Multi-Objective Optimization Algorithms Based on Artificial Intelligence
- Enhancing Synchronizability in Identical Chaotic Complex Networks: Application of Genetic Algorithms for Edge Rewiring
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.