انتخاب ویژگی برای کلاسه بندی داده هایی با ابعاد بسیار زیاد با استفاده از الگوریتم انتخاب متوالی ویژگی شناور (SFFS)
سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 46
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ESPE01_1573
تاریخ نمایه سازی: 2 خرداد 1404
چکیده مقاله:
انتخاب ویژگی به معنی انتخاب تعدادی از مناسب ترین ویژگی های ممکن برای یک مجموعه داده می باشد. یکی از مهم ترین و مشکل ترین مسائل در حوزه بازشناسی الگو مسئله انتخاب ویژگی است که می تواند ناشی از زیادی نویز و وارد شدن ویژگی های نامربوط و اضافی در مجموعه داده باشد. این مساله در بسیاری از کاربردها مانند طبقه بندی اهمیت به سزائی دارد، زیرا در این کاربردها تعداد زیادی ویژگی وجود دارد، که بسیاری از آنها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کند ولی بار محاسباتی را برای کاربرد موردنظر بالا می برد. علاوه بر این باعث می شود که اطلاعات غیرمفید زیادی را به همراه داده های مفید ذخیره کنیم. بنابراین هدف از انتخاب ویژگی، انتخاب یک زیرمجموعه از مجموعه ویژگی ها است به طوری که تعداد ویژگی های انتخاب شده کمترین و دقت بازشناسی الگو بیشترین مقدار را داشته باشد. مسئله انتخاب ویژگی یک مسئله NP-Hard است و یکی از مناسب ترین ابزارهای حل این مسئله، الگوریتم های تکاملی هستند. کاری که ما در این پایان نامه انجام داده ایم استفاده از یک روش ترکیبی مبتنی بر یک روش فیلتر بر اساس انالیز تمایز و الگوریتم مبتنی بر یادگیری SFFS است. ما روش پیشنهادی خود را بر روی مجموعه داده سرطان تخمدان و تومور پروستات که به ترتیب دارای ۴۰۰۰ و ۵۰۰ ویژگی است اعمال کردیم و نتایج حاصل نشان داد روش پیشنهادی توانسته است دقت کلاسه بندی را بهبود بخشد.
کلیدواژه ها:
نویسندگان
رسول فرهنگ خوئی
دانش آموخته ی کارشناسی ارشد ناپیوسته علوم کامپیوتر ، دانشگاه آزاد اسلامی واحد خوی