بررسی ۶ روش طبقه بندی جهت یافتن بهترین روش پیش بینی سرطان ریهمبتنی داده های نامتعادل
محل انتشار: اولین کنفرانس ملی پژوهش و نوآوری در هوش مصنوعی
سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 97
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CRIAL01_014
تاریخ نمایه سازی: 7 مرداد 1403
چکیده مقاله:
هدف ما از ارائه این مقاله یافتن بهترین الگوریتم جهت پیش بینی سرطان ریه است. این مقاله به بررسی طبقه بندی هاینظارت شده و ارزیابی عملکرد شش روش طبقه بندی می پردازد. در این مقاله، پس از حذف داده های تکراری، با بررسیمجموعه داده های اولیه، عدم تعادل مجموعه داده ها مشخص می شود که تمایل مجموعه داده ها به سمت نمونه های مثبت(مبتلا به سرطان) می باشد. یکی از چالش های مجموعه داده ها عدم تعادل است که بر کارایی مدل تاثیر می گذارد. با اینحال، مجموعه داده به دو بخش آموزش و آزمایش تقسیم می شود و مجموعه داده با تمام الگوریتم ها مدلسازی شدهاست. در مرحله بعد تکنیک وزندهی برای متعادل کردن توزیع داده ها اعمال می شود و تمام الگوریتم ها مجددا رویمجموعه داده اجرا می شود. مقایسه ای بین خروجی هر دو حالت صورت می گیرد و بهترین الگوریتم برای پیش بینی سرطانریه انتخاب می شود. الگوریتم های طبقه بندی نظارت شده روی مجموعه داده اعمال می شوند و نتایج با هم مقایسه میشوند. ارزیابی مدل ها به کمک چهار معیار دقت کلی، نرخ مثبت کاذب، دقت و یادآوری انجام می شود. جهت اجرای مدل هااز زبان برنامه نویسی پایتون استفاده میشود. مجموعه داده مورد استفاده در این بررسی شامل ۳۰۹ رکورد و ۱۶ ویژگی است که از سایت Kaggle به دست آمده است .
کلیدواژه ها:
نویسندگان
رقیه صادقی
دانشگاه آزاد اسلامی، دانشجوی دکتری مهندسی کامپیوتر ، ایران، کرج
اعظم باستان فرد
دانشگاه آزاد اسلامی، استادیار ، گروه مهندسی کامپیوتر ، ایران ، کرج