مروری بر روش های انتخاب ویژگی نیمه نظارتی تنک مبتنی بر گراف

  • سال انتشار: 1401
  • محل انتشار: مجله پژوهش های نظری و کاربردی هوش ماشینی، دوره: 1، شماره: 1
  • کد COI اختصاصی: JR_ABMIR-1-1_007
  • زبان مقاله: فارسی
  • تعداد مشاهده: 254
دانلود فایل این مقاله

نویسندگان

راضیه شیخ پور

عضو هیات علمی/ دانشگاه اردکان

چکیده

در برخی از کاربردهای دنیای واقعی، داده هایی با ابعاد بالا وجود دارند که چالش های محاسباتی زیادی را ایجاد کرده اند. یکی از تکنیک های موثر برای کاهش ابعاد داده ها، انتخاب ویژگی است که با انتخاب زیرمجموعه مناسبی از ویژگی ها باعث سادگی مدل و بهبود کارایی آن می شود. در بسیاری از این کاربردها، برچسب زدن داده ها امری زمان بر و پرهزینه است که باعث می شود داده های برچسب دار کمی وجود داشته باشند و حجم عظیمی از داده های بدون برچسب در دسترس باشند. در چنین کاربردهایی، روش های انتخاب ویژگی نیمه نظارتی می توانند با استفاده از اطلاعات برچسب داده های برچسب دار و اطلاعات توزیع و ساختار هندسی داده های برچسب دار و بدون برچسب، فرایند انتخاب ویژگی را انجام دهند. در اکثر روش های انتخاب ویژگی نیمه نظارتی، با ایجاد یک گراف همسایگی، ویژگی های مناسب از طریق بررسی توانایی آن ها در حفظ ساختار هندسی گراف ارزیابی می شوند. در روش های کلاسیک انتخاب ویژگی نیمه نظارتی مبتنی بر گراف، ویژگی ها به صورت جداگانه ارزیابی می شوند و همبستگی بین ویژگی ها در هنگام انتخاب ویژگی در نظر گرفته نمی شود. روش های انتخاب ویژگی تنک با در نظر گرفتن همبستگی بین ویژگی ها، ماتریس انتقال بهینه تنک برای انتخاب ویژگی را محاسبه می نمایند. در این مقاله با بررسی روش های یادگیری نیمه نظارتی، مروری بر روش های انتخاب ویژگی نیمه نظارتی تنک مبتنی بر گراف انجام می شود که با استفاده از عبارت تنظیم مبتنی بر مدل های تنک و با ایجاد گراف همسایگی، ویژگی های مناسب را انتخاب می کنند. این روش ها ضمن برطرف کردن مشکل روش های انتخاب ویژگی کلاسیک، با ایجاد یک گراف همسایگی از داده ها ماتریس انتقال بهینه تنک برای انتخاب ویژگی را محاسبه می نمایند.

کلیدواژه ها

انتخاب ویژگی نیمه نظارتی, یادگیری نیمه نظارتی, مدل های تنک, گراف, لاپلاسین گراف

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.