بهبود طبقه بندی سرطان سینه با رویکرد ترکیبی شناسایی داده های پرت مبتنی بر یادگیری ماشین

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 46

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DMCE02_034

تاریخ نمایه سازی: 29 تیر 1404

چکیده مقاله:

سرطان یکی از مهم ترین عوامل مرگ و میر در جهان به شمار می رود و حدود ۱۴٪ از تمام سرطان های زنان را تشکیل می دهد و از هر ۲۸ زن، یک نفر به این بیماری مبتلا می شود. سرطان سینه نوعی رشد غیرطبیعی در بافت سینه است و یکی از شایع ترین بیماری ها در میان زنان محسوب می شود. مطالعات بسیاری در زمینه شناسایی زودهنگام این بیماری صورت گرفته اند که می توانند با فراهم آوردن امکان درمان به موقع، در کاهش میزان مرگ و میر موثر باشند. با این حال، تنها حدود ۸۶٪ از بیماران به طور دقیق تشخیص داده می شوند. تشخیص و پیش بینی وضعیت بقاء بیماران مبتلا به سرطان پستان، نیازمند بهره گیری از روش های دقیق یادگیری ماشین است که بتوانند به پزشکان در شناسایی الگوهای موثر بر بقای بیمار کمک کنند. پژوهشگران همواره در جست وجوی راهکارهایی نوین برای تحلیل و پیش بینی سیر بیماری هستند. در این مقاله، عملکرد چند الگوریتم یادگیری ماشین بر روی مجموعه داده ی Breast Cancer ریحانه نامداری موجود در پلتفرم کگل، مورد بررسی و مقایسه قرار گرفته است. هدف اصلی این تحقیق، ارزیابی دقت الگوریتم ها در طبقه بندی بیماران به دو گروه زنده و فوت شده است؛ که این ارزیابی با استفاده از شاخص هایی مانند دقت، صحت، فراخوانی، امتیاز F۱ و منحنی ROC صورت گرفته است. نتایج نشان می دهد که پس از حذف داده های پرت، مدل های مختلف یادگیری ماشین عملکرد بسیار مطلوبی از خود نشان داده اند. مدل MLP با AUC برابر ۰.۹۴۵ بیشترین توان تفکیک پذیری را دارد، در حالی که مدل هایی مانند Logistic Regression، AdaBoost و CatBoost نیز با دقت باالی ۹۲٪ و امتیاز F۱ بالا عملکرد پایداری نشان داده اند. این نتایج نشان دهنده تاثیر مثبت حذف داده های پرت در بهبود دقت و کارایی مدل های تشخیص سرطان سینه هستند.

نویسندگان

نرگس جوانمردی

گروه مهندسی پزشکی، واحد خمینی شهر، دانشگاه آزاد اسلامی، خمینی شهر، ایران

صدف محرری

گروه مهندسی پزشکی، واحد خمینیشهر، دانشگاه آزاد اسلامی، خمینی شهر، ایران