پیش بینی متاستاز سرطان پستان با استفاده از مدل های یادگیری ماشین مبتنی بر درخت: یک تحلیل گذشته نگر در میان زنان ایرانی
محل انتشار: فصلنامه بیماری های پستان، دوره: 19، شماره: 1
سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 18
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_IJBD-19-1_005
تاریخ نمایه سازی: 5 خرداد 1405
چکیده مقاله:
مقدمه: متاستاز سرطان پستان یکی از علل اصلی مرگ ومیر ناشی از سرطان است. پیش بینی دقیق پیشرفت متاستاتیک برای تصمیم گیری بالینی ضروری است. هدف این مطالعه، توسعه و اعتبارسنجی مدل های یادگیری ماشین مبتنی بر درخت برای پیش بینی متاستاز سرطان پستان در زنان ایرانی با استفاده از داده های بالینی واقعی دارای میزان بالای داده های مفقود بوده است.
روش بررسی: این مطالعه ی گذشته نگر شامل سوابق بالینی ۸٬۱۴۸ بیمار مبتلا به سرطان پستان بود که بین سال های ۱۹۹۷ تا ۲۰۲۰ در تهران تحت درمان قرار گرفتند. پس از حذف متغیرهایی که بیش از ۵۰% داده ی مفقود داشتند و رکوردهای مرتبط با آنها، ۴٬۳۱۰ نمونه ی کامل باقی ماند (برای مثال، اندازه ی تومور دارای ۴/۹۴% داده ی مفقود بود.) سه مدل درخت تصمیم، جنگل تصادفی و XGBoost (با قابلیت ذاتی در برخورد با داده های ناقص) با دو الگوریتم مرجع K-NN و Naïve Bayes، با استفاده از اعتبارسنجی متقابل ده تایی مقایسه شدند. عملکرد مدل ها با شاخص های AUC، حساسیت، ویژگی و امتیاز F۱ ارزیابی شد.
یافته ها: مدل های مبتنی بر درخت عملکرد بهتری نسبت به روش های سنتی داشتند؛ XGBoost بالاترین تمایز را نشان داد (AUC=۰.۹۶، دقت=۹۹.۴%،F۱=۰.۹۶) و درخت تصمیم بیشترین قابلیت تفسیر بالینی را ارائه داد (حساسیت =۹۴%، ویژگی=۹۶.۹%). علی رغم حذف متغیرهای کلیدی مانند اندازه ی تومور و وضعیت HER۲، متغیرهای باقی مانده مانند گیرنده های هورمونی و سن شروع قاعدگی توانستند پیش بینی های دقیقی ارائه دهند. الگوریتم K-NN از نظر بالینی عملکرد ضعیفی داشت (حساسیت=%۶) در حالی که Naïve Bayes ناپایداری نسبی نشان داد (حساسیت=۸۹.۰۱).
نتیجه گیری: مدل های درخت تصمیم و تجمیع شده ی آن ها می توانند به طور قابل اعتمادی متاستاز را در داده های واقعی ناقص پیش بینی کنند و از این رو برای محیط های با منابع محدود گزینه های مناسبی به شمار می روند. پژوهش های آینده باید بر استانداردسازی جمع آوری داده ها و توسعه ی رویکردهای ترکیبی جایگزینی داده های مفقود تمرکز داشته باشند. این مطالعه بر اهمیت استفاده از مدل های یادگیری ماشین قابل تفسیر در کاربردهای انکولوژی، به ویژه در جمعیت های کمتر مورد مطالعه، تاکید دارد.
کلیدواژه ها:
Breast Cancer ، Metastasis ، Machine Learning ، Decision Trees ، XGBoost ، Iran ، سرطان پستان ، متاستاز ، یادگیری ماشین ، درخت تصمیم ، XGBoost ، ایران
نویسندگان
مریم خادمی
Department of Applied Mathematics, Islamic Azad University South Tehran Branch, Tehran, Iran
پونه خدابخش
Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran
زیبا حیدرپور
Doctor of Medicine (MD), Islamic Azad University, Tehran Medical Branch, Tehran, Iran
صهبا پاک طینت
Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran
علیرضا آتشی
Medical Informatics Department, Breast Cancer Research Center, Iranian National Cancer Institute, ACECR, Tehran, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :