جایگذاری مقادیر گمشده در مجموعه داده های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه
محل انتشار: مجله مدیریت اطلاعات سلامت، دوره: 18، شماره: 1
سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 336
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_HIM-18-1_002
تاریخ نمایه سازی: 24 آبان 1401
چکیده مقاله:
مقدمه: جایگذاری مقادیر گمشده در مجموعه داده های اطلاعاتی پزشکی، یکی از چالش های مهم در مسایل داده کاوی به شمار می رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی های مجموعه داده های دیابت و سرطان سینه انجام شد.روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل ۶۹۹ نمونه که ۴۵۸ نمونه خوش خیم و ۲۴۱ نمونه بدخیم و مجموعه داده دیابت شامل ۷۶۸ نمونه که ۵۰۰ نمونه فاقد بیماری دیابت و ۲۶۸ نمونه دیگر دارای بیماری دیابت بودند، استفاده گردید. برای جایگذاری مقادیر گمشده در این دو مجموعه داده، مدلی بر پایه شبکه عصبی پرسپترون دو لایه طراحی شد. به منظور ارزیابی، ماشین بردار پشتیبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. یافته ها: میزان میانگین مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبکه عصبی پرسپترون دو لایه در مجموعه داده دیابت، حدود ۰۳/۰ و در مجموعه داده سرطان سینه، حدود ۰۴/۰ کمتر از MSE های به دست آمده در روش جایگذاری با مقدار میانگین گزارش گردید. مقادیر جایگذاری شده با استفاده از مدل نسبت به مقادیر جایگذاری شده با مقدار میانگین، به مقدار واقعی نزدیک تر بود. صحت و حساسیت طبقه بندی بیماری در حالتی که مقادیر گمشده توسط شبکه عصبی پرسپترون جایگذاری شده بود، در مقایسه با دو روش مرسوم مقدار میانگین و روش حذف مقادیر گمشده در مجموعه داده دیابت به ترتیب در حدود ۲، ۴، ۲ و ۴ درصد و در مجموعه داده سرطان سینه به ترتیب در حدود ۱، ۳، ۲، ۵ درصد بیشتر شد. تفاوت معنی داری بین دو روش جایگذاری مقادیر گمشده با مقدار میانگین و جایگذاری مدل وجود داشت.نتیجه گیری: جایگذاری مقایر گمشده در مجموعه داده های پزشکی توسط شبکه عصبی پرسپترون دو لایه نسبت به دو روش جایگذاری با مقدار میانگین و روش حذف مقادیر گمشده، نتایج بهتری در طبقه بندی بیماری نشان می دهد.
کلیدواژه ها:
نویسندگان
الهام پورجانی
دانشجوی کارشناسی ارشد، هوش مصنوعی و رباتیک، گروه مهندسی کامپیوتر، دانشکده مکانیک، برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
سارا نجف زاده
استادیار، شبکه، گروه کامپیوتر، دانشکده مهندسی برق، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، شهرری، ایران
نادر جعفرنیا دابانلو
دانشیار، الکترونیک، گروه مهندسی برق، دانشکده علوم و فن آوری های پزشکی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :