یادگیری داده های نامتوازن توسط ترکیبی از الگوریتم های طبقه بندی و خوشه بندی مبتنی بر سیستم فازی قانون محور

سال انتشار: 1396
محل انتشار: کنگره بین المللی علوم و مهندسی
کد COI اختصاصی: GERMANCONF01_179
زبان مقاله: فارسی
تعداد مشاهده: 762

دانلود فایل این مقاله

نویسندگان

مهدی امیرآبادی

دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران

کاظم نیک فرجام

دکترای کامپیوتر، گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران

مجیدرضا ناصح

دکترای برق، گروه مهندسی برق، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران

چکیده

مسیله مهمی که در استفاده از الگوریتم هاط طبقه بندی در حوزه های مختلف، صحت مدل هایی را که محققان ارایه می کنند به چالش می کشد. مسیله نامتوازن بودن مجموعه داده ها است. مسیله نامتوازن بودن داده ها زمانی رخ می دهد که تعداد نمونه های طبقات مختلف متغیر کلاس با هم برابر نبوده و اختلافشان زیاد باشد. در چنین مواقعی نتایج حاصل از الگوریتم های طبقه بندی استاندارد مورد اعتماد نمی باشد. امروزه تحقیقات فراوانی در این زمینه صورت گرفته است. در این مقاله قصد داریم رویکردی جدید جهت یادگیری داده های نامتوازن مبتنی بر سیستم فازی قانون محور ارایه نماییم. در رویکرد پیشنهادی ابتدا توسط تکنیک خوشه بندی داده های تویزی شناسایی شده تا از آنها در فرآیند یادگیری استفاده نشود. سپس مجموعه داده ها توسط تکنیک دیگری خ وشه بندی و داده های هر خوشه متوازن شده و به ازای هر خوشه، مدل یادگیر ساخته می شود. در مرحله دوم وزن هر مدل یادگیر توسط سیستم فازی قانون محور تعیین می گردد. در نهایت برای تجمع نتایج اگر وزن مدل یادگیر در محدوده قابلیت اطمینان باشد داده های آن خوشه توسط مدل یادگیر همان خوشه طبقه بندی می شوند وگرنه از سیستم رای گیری اکثریت وزن دار مبتنی بر الگوریتم Adaboost استفاده می شود. برای انجام ارزیابی، روش پیشنهادی به همراه هفت روش طبقه بندی استاندارد بر روی هشت دیتاست نامتوازن استاندارد اجرا شده است و شش معیار ارزیابی متداول شامل صحت، حساسیت، وضوح، دقت، F-measure و G-mean برای ارزیابی این روش ها مورد استفاده قرار گرفته است.

کلیدواژه ها

الگوریتم طبقه بندی، داده کاوی، داده های نامتوازن، روش های ترکیبی، سیستم فازی قانون محور، یادگیری ماشین

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.