مقایسه الگوریتم های طبقه بندی در یادگیری ماشین برای داده های حجیم
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 44
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
RSETCONF17_005
تاریخ نمایه سازی: 9 تیر 1404
چکیده مقاله:
با افزایش حجم داده ها در حوزه های مختلف، انتخاب الگوریتم مناسب برای طبقه بندی این داده ها اهمیت زیادی دارد. این پژوهش به مقایسه عملکرد الگوریتم های طبقه بندی شامل ماشین بردار پشتیبان (SVM)، درخت تصمیم (DT)، جنگل تصادفی (RF)، شبکه های عصبی مصنوعی (ANN)، K-نزدیک ترین همسایه (KNN) و بیز ساده (NB) بر روی داده های حجیم می پردازد. معیارهای ارزیابی شامل دقت، صحت، یادآوری، F۱-Score، زمان اجرا و مقیاس پذیری است. آزمایش ها بر روی مجموعه داده های واقعی و مصنوعی انجام شده و تاثیر روش های بهینه سازی مانند تنظیم فراپارامترها، کاهش ابعاد داده و افزایش داده بررسی شده است. نتایج نشان می دهد که شبکه های عصبی و جنگل تصادفی اغلب دقت بالاتری دارند، در حالی که درخت تصمیم و KNN سرعت پردازش بیشتری ارائه می دهند. همچنین، ماشین بردار پشتیبان در برخی موارد تعادلی میان دقت و سرعت نشان می دهد. یافته های این پژوهش نشان می دهد که انتخاب الگوریتم مناسب به عواملی مانند حجم داده و پیچیدگی ویژگی ها بستگی دارد و ترکیب مدل ها می تواند دقت و کارایی را بهبود بخشد.
کلیدواژه ها:
نویسندگان
امیرحسین اصفهانی ها
دانشجو گروه کامپیوتر دانشکده ملی مهارت تهران ایران
سپهر رضائی
دانشجو گروه کامپیوتر دانشکده ملی مهارت تهران ، ایران
مهرداد حمیدزاده
دکتری مدیریت فناوری اطلاعات،گروه کامپیوتر، دانشگاه ملی مهارت ، تهران ، ایران
امین کیانی
دانشجوی دکترای رایانش امن گروه کامپیوتر دانشگاه ملی مهارت تهران ، ایران