ارائه یک روش انتخاب ویژگی برخط مبتنی بر جریان ویژگی بر اساس انتگرال فازی چوکت

  • سال انتشار: 1401
  • محل انتشار: دوفصلنامه سیستم های فازی و کاربردها، دوره: 5، شماره: 1
  • کد COI اختصاصی: JR_JFSA-5-1_007
  • زبان مقاله: فارسی
  • تعداد مشاهده: 70
دانلود فایل این مقاله

نویسندگان

محمدرضا پژوهان

دانشکده مهندسی کامپیوتر،پردیس فنی و مهندسی،دانشگاه یزد

امین هاشمی

دانشکده مهندسی کامپیوتر،پردیس فنی و مهندسی،دانشگاه یزد

محمدباقر دولتشاهی

گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه لرستان

چکیده

انتخاب ویژگی یک فرایند پیش پردازش داده ها است که برای مجموعه داده های با ابعاد بالا قبل از اجرای الگوریتم های یادگیری ماشین و داده کاوی مورداستفاده قرار می گیرد. هدف از انتخاب ویژگی، پیداکردن یک زیرمجموعه ی حداقلی و بهینه از مجموعه ویژگی ها است. این زیرمجموعه، ویژگی های برجسته را شامل می شود در حالی که ویژگی های غیر مرتبط با برچسب کلاس و تکراری در آن قرار نمی گیرند. برای انجام این کار، بسیاری از روش های انتخاب ویژگی فعلی به کل ویژگی ها در ابتدا نیاز دارند و درصورتی که ویژگی جدیدی در آینده به مجموعه ویژگی ها اضافه شود، الگوریتم باید از ابتدا اجرا شود. به دست آوردن کل ویژگی ها و یا حتی منتظر ماندن برای آن غیر ممکن در بسیاری از کاربردهای واقعی ممکن نیست؛ بنابراین برای این گونه مسائل که کل فضای ویژگی در ابتدا در اختیار ما قرار ندارد، روش های انتخاب ویژگی برخط ارائه شده اند. در این مقاله یک روش انتخاب ویژگی برخط با استفاده از مفهوم انتگرال فازی چوکت ارائه شده است. این روش در ابتدا جریان های ویژگی را بر اساس چندین معیار فیلتر ارزیابی می کند. سپس بر اساس عملگر چوکت نتایج آن ها ترکیب و برای حفظ یا نادیده گرفتن ویژگی تصمیم گیری می شود. در گام ارزیابی، عملکرد الگوریتم پیشنهادی با شش روش انتخاب ویژگی برخط و بر اساس دو دسته بند مقایسه شده است. روش پیشنهادی بر اساس نتایج به دست آمده در پنج مجموعه داده دنیای واقعی نزدیک دو درصد بهبود نسبت به روش های مشابه بر اساس معیارهای دقت دسته بندی و امتیاز داشته است. همچنین به دلیل محاسبات ساده در فرایند روش پیشنهادی، ارزیابی ویژگی ها در زمان کوتاهی انجام می گیرد.

کلیدواژه ها

انتخاب ویژگی برخط, انتگرال فازی چوکت, جریان ویژگی, داده های با ابعاد بالا

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.