پیش بینی متاستاز سرطان پستان با استفاده از مدل های یادگیری ماشین مبتنی بر درخت: یک تحلیل گذشته نگر در میان زنان ایرانی

سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 18

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IJBD-19-1_005

تاریخ نمایه سازی: 5 خرداد 1405

چکیده مقاله:

مقدمه: متاستاز سرطان پستان یکی از علل اصلی مرگ ومیر ناشی از سرطان است. پیش بینی دقیق پیشرفت متاستاتیک برای تصمیم گیری بالینی ضروری است. هدف این مطالعه، توسعه و اعتبارسنجی مدل های یادگیری ماشین مبتنی بر درخت برای پیش بینی متاستاز سرطان پستان در زنان ایرانی با استفاده از داده های بالینی واقعی دارای میزان بالای داده های مفقود بوده است. روش بررسی: این مطالعه ی گذشته نگر شامل سوابق بالینی ۸٬۱۴۸ بیمار مبتلا به سرطان پستان بود که بین سال های ۱۹۹۷ تا ۲۰۲۰ در تهران تحت درمان قرار گرفتند. پس از حذف متغیرهایی که بیش از ۵۰% داده ی مفقود داشتند و رکوردهای مرتبط با آنها، ۴٬۳۱۰ نمونه ی کامل باقی ماند (برای مثال، اندازه ی تومور دارای ۴/۹۴% داده ی مفقود بود.) سه مدل درخت تصمیم، جنگل تصادفی و XGBoost (با قابلیت ذاتی در برخورد با داده های ناقص) با دو الگوریتم مرجع K-NN و Naïve Bayes، با استفاده از اعتبارسنجی متقابل ده تایی مقایسه شدند. عملکرد مدل ها با شاخص های AUC، حساسیت، ویژگی و امتیاز F۱ ارزیابی شد. یافته ها: مدل های مبتنی بر درخت عملکرد بهتری نسبت به روش های سنتی داشتند؛ XGBoost بالاترین تمایز را نشان داد (AUC=۰.۹۶، دقت=۹۹.۴%،F۱=۰.۹۶) و درخت تصمیم بیشترین قابلیت تفسیر بالینی را ارائه داد (حساسیت =۹۴%، ویژگی=۹۶.۹%). علی رغم حذف متغیرهای کلیدی مانند اندازه ی تومور و وضعیت HER۲، متغیرهای باقی مانده مانند گیرنده های هورمونی و سن شروع قاعدگی توانستند پیش بینی های دقیقی ارائه دهند. الگوریتم K-NN از نظر بالینی عملکرد ضعیفی داشت (حساسیت=%۶) در حالی که Naïve Bayes ناپایداری نسبی نشان داد (حساسیت=۸۹.۰۱). نتیجه گیری: مدل های درخت تصمیم و تجمیع شده ی آن ها می توانند به طور قابل اعتمادی متاستاز را در داده های واقعی ناقص پیش بینی کنند و از این رو برای محیط های با منابع محدود گزینه های مناسبی به شمار می روند. پژوهش های آینده باید بر استانداردسازی جمع آوری داده ها و توسعه ی رویکردهای ترکیبی جایگزینی داده های مفقود تمرکز داشته باشند. این مطالعه بر اهمیت استفاده از مدل های یادگیری ماشین قابل تفسیر در کاربردهای انکولوژی، به ویژه در جمعیت های کمتر مورد مطالعه، تاکید دارد.

نویسندگان

مریم خادمی

Department of Applied Mathematics, Islamic Azad University South Tehran Branch, Tehran, Iran

پونه خدابخش

Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran

زیبا حیدرپور

Doctor of Medicine (MD), Islamic Azad University, Tehran Medical Branch, Tehran, Iran

صهبا پاک طینت

Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran

علیرضا آتشی

Medical Informatics Department, Breast Cancer Research Center, Iranian National Cancer Institute, ACECR, Tehran, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Suyal M, Goyal P. A review on analysis of k-nearest ...
  • Arafat HM, Omar J, Muhamad R, Al-Astani TAD, Shafii N, ...
  • Youn HJ, Han W. A Review of the Epidemiology of ...
  • Ho PJ, Lau HSH, Ho WK, Wong FY, Yang Q, ...
  • Daly AA, Rolph R, Cutress RI, Copson ER. A Review ...
  • Dadziak M, Olko P, Zapala M A, Hunek A, Chmielarz ...
  • Vishwakarma G, Mehta A, Saifi M, Garg D, Paliwal D. ...
  • Bastos D. R. d. Risk factors related to breast cancer ...
  • Tapak L, Shirmohammadi-khoram N, Amini P, Poorolajal J. P. Prediction ...
  • Razavi M, Wang L, Karssemeijer N, Linsen L, Frese U, ...
  • Jakkanwar B. S. Review on Multiple Cancer Disease Prediction And ...
  • Suyal M, Goyal P. A review on analysis of k-nearest ...
  • Arafat HM, Omar J, Muhamad R, Al-Astani TAD, Shafii N, ...
  • Youn HJ, Han W. A Review of the Epidemiology of ...
  • Ho PJ, Lau HSH, Ho WK, Wong FY, Yang Q, ...
  • Daly AA, Rolph R, Cutress RI, Copson ER. A Review ...
  • Dadziak M, Olko P, Zapala M A, Hunek A, Chmielarz ...
  • Vishwakarma G, Mehta A, Saifi M, Garg D, Paliwal D. ...
  • Bastos D. R. d. Risk factors related to breast cancer ...
  • Tapak L, Shirmohammadi-khoram N, Amini P, Poorolajal J. P. Prediction ...
  • Razavi M, Wang L, Karssemeijer N, Linsen L, Frese U, ...
  • Jakkanwar B. S. Review on Multiple Cancer Disease Prediction And ...
  • نمایش کامل مراجع