بررسی ۶ روش طبقه بندی جهت یافتن بهترین روش پیش بینی سرطان ریهمبتنی داده های نامتعادل

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 27

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CRIAL01_014

تاریخ نمایه سازی: 7 مرداد 1403

چکیده مقاله:

هدف ما از ارائه این مقاله یافتن بهترین الگوریتم جهت پیش بینی سرطان ریه است. این مقاله به بررسی طبقه بندی هاینظارت شده و ارزیابی عملکرد شش روش طبقه بندی می پردازد. در این مقاله، پس از حذف داده های تکراری، با بررسیمجموعه داده های اولیه، عدم تعادل مجموعه داده ها مشخص می شود که تمایل مجموعه داده ها به سمت نمونه های مثبت(مبتلا به سرطان) می باشد. یکی از چالش های مجموعه داده ها عدم تعادل است که بر کارایی مدل تاثیر می گذارد. با اینحال، مجموعه داده به دو بخش آموزش و آزمایش تقسیم می شود و مجموعه داده با تمام الگوریتم ها مدلسازی شدهاست. در مرحله بعد تکنیک وزندهی برای متعادل کردن توزیع داده ها اعمال می شود و تمام الگوریتم ها مجددا رویمجموعه داده اجرا می شود. مقایسه ای بین خروجی هر دو حالت صورت می گیرد و بهترین الگوریتم برای پیش بینی سرطانریه انتخاب می شود. الگوریتم های طبقه بندی نظارت شده روی مجموعه داده اعمال می شوند و نتایج با هم مقایسه میشوند. ارزیابی مدل ها به کمک چهار معیار دقت کلی، نرخ مثبت کاذب، دقت و یادآوری انجام می شود. جهت اجرای مدل هااز زبان برنامه نویسی پایتون استفاده میشود. مجموعه داده مورد استفاده در این بررسی شامل ۳۰۹ رکورد و ۱۶ ویژگی است که از سایت Kaggle به دست آمده است .

کلیدواژه ها:

سرطان ریه ، یادگیری ماشین ، پیش بینی ، طبقه بندی های نظارت شده

نویسندگان

رقیه صادقی

دانشگاه آزاد اسلامی، دانشجوی دکتری مهندسی کامپیوتر ، ایران، کرج

اعظم باستان فرد

دانشگاه آزاد اسلامی، استادیار ، گروه مهندسی کامپیوتر ، ایران ، کرج