انتخاب ویژگی بر روی داده های با ابعاد بالا با استفاده از روش نزدیکترین همسایه تصادفی متوالی

  • سال انتشار: 1395
  • محل انتشار: سومین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند
  • کد COI اختصاصی: ELECONFK03_120
  • زبان مقاله: فارسی
  • تعداد مشاهده: 546
دانلود فایل این مقاله

نویسندگان

محمد اسدی طاهری

دانشجوی کارشناسی ارشد مهندسی نرمافزار

مهدی اسماعیلی

استادیار دانشگاه آزاد اسلامی واحد کاشان

چکیده

انتخاب ویژگی 3بر اساس یک دستهبند گروهی به عنوان یک تکنیک حیاتی جهت مدل سازی دادههای با ابعاد بالا شناخته شده است. انتخاب ویژگی بر اساس مدل جنگل تصادفی، که از تجمیع چندین دستهبند از نوع درخت تصمیم ساخته می شود، به طور گستردهای مورد استفاده قرار گرفته است. به هر حال، کمبود ثبات و تعادل در درختهای تصمیم، از مقاومت روش جنگلهای تصادفی 4میکاهد. این محدودیت ما را بر آن داشت که روشی برای انتخاب ویژگی با استفاده از دستهبندهای جدید گروهی بر پایه نزدیکترین همسایه ارایه کنیم. روش پیشنهادی ویژگیهای بارز را با یک روال تکرارشونده پیدا میکند. ما آزمایش این روش را با 20 مجموعه داده از آرایههای ژنی انجام دادیم تا خصوصیات روش پیشنهادی را ارزیابی کرده و عملکرد آن را با روش جنگلهای تصادفی مقایسه کنیم. نتایج میزان مقاومت و تاثیر روش پیشنهادی را نشان میدهد، مخصوصا وقتی که تعداد ویژگیها از تعداد نمونهها بیشتر باشد.

کلیدواژه ها

انتخاب ویژگی، ابعاد بالا، دستهبندی، جنگلهای تصادفی، نزدیکترین همسایه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.