استفاده از تکنیک های داده کاوی جهت بهبود دقت تشخیص بیماری دیابت

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 899

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF05_014

تاریخ نمایه سازی: 1 دی 1397

چکیده مقاله:

امروزه، داده کاوی یکی از تکنیکهای پرکاربرد میباشد که پردازش خود را روی داده های انبوه انجام میدهد. با توجه به فراوانی داده های پزشکی و بیماریها، این موضوع میتواند بستر مناسبی برای به کارگیری تکنیکهای مختلف دادهکاوی باشد. تشخیص زودرس افراد مبتلا به یک بیماری مخفی مانند دیابت از اهمیت زیادی برخوردار است. به طوری که میتوان اقدامات فوری برای جلوگیری از پیشرفت بیماری و یا آسیب رساندن به اعضای بدن را انجام داد . دیابت بیماریای است که توانایی بدن برای تولید یا پاسخ دادن به هورمون انسولین ضعیف است، که منجر به متابولیسم غیر طبیعی کربوهیدراتها و افزایش سطح گلوکز در خون و ادرار میشود .همه میتوانند از آن رنج ببرند و تاکنون درمان برای آن وجود ندارد. در این تحقیق از مجموعه داده UCI Machine Learning Repository استفاده شده است که شامل 101766 رکورد با 50 ویژگی و حاوی دادههای بیماران دیابتی از 130 بیمارستان در ایالات متحده که طی 10 سال (2008-1999) جمعآوری شده است میباشد. سپس برای کار با دادهها از متدولوژی CRISP-DM استفاده شد. در ادامه برای مدلسازی از 3 الگوریتم درخت تصمیم، بیز ساده و KNN (با K=1، K=5 و (K=10 استفاده شد. با استفاده از روش X-Validation جهت ارزیابی مدل سازی های انجام شد، روش درخت تصمیم بالاترین دقت (%100) را کسب کرده و به عنوان مدل برتر انتخاب شده است. با روش بیز ساده نیز دقت قابل قبولی (%98.58) بدست آمده است.

کلیدواژه ها:

دیابت ، داده کاوی ، الگوریتم های داده کاوی ، متدولوژی CRISP-DM و انتخاب ویژگی

نویسندگان

امین کشانی

دانشجوی کارشناسی ارشد مهندسی نرم افزار، گروه کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان

ناصر نعمت بخش

استادیار، گروه مهندسی کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان

بهزاد سلیمانی نیسیانی

مدرس مدعو، گروه مهندسی کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان