ارایه ی یک مدل پیش پردازش داده ها و تاثیر آن بر پیش بینی بیماری هپاتیت

  • سال انتشار: 1401
  • محل انتشار: پانزدهمین کنفرانس بین المللی انجمن ایرانی تحقیق در عملیات
  • کد COI اختصاصی: ICIORS15_041
  • زبان مقاله: فارسی
  • تعداد مشاهده: 354
دانلود فایل این مقاله

نویسندگان

سعیده کبیری راد

گروه علوم کامپیوتر، دانشگاه صنعتی بیرجند

چکیده

امروزه برای کاهش خطاهای پزشکی در زمینه ی تشخیص به موقع بیماری از سیستم های تشخیص بر مبنای یادگیری ماشین کمک گرفته می شود. در این مقاله برای تشخیص بیماری هپاتیت ، یک مدل مبتنی بر شبکه ی عصبی پیشنهاد شده است . در مدل پیشنهادی ، یک مرحله ی پیش پردازش کامل برای مدیریت داده های از دست رفته و تکمیل سازی داده ها استفاده شده است . برای مدیریت داده های از دست رفته ، از روشهایی برای تخمین مقادیر از دست رفته استفاده شده است . همچنین با توجه به این که داده های مربوط به یک کلاس نسبت به دیگری در اقلیت هستند، شبکه ممکن است به خوبی تعلیم نبیند. برای رفع این مساله ، تکنیک های متعادل سازی داده را اعمال کردیم . چون تخصیص داده های از دست رفته ممکن است دقت بالایی نداشته باشد، لذا در مدل پیشنهادی ابتدا یک مرحله گروه اقلیت را با استفاده از داده های دقیق گسترش دادیم ، سپس داده های از دست رفته را تخمین زده و درنهایت برای اعمال تاثیر داده های تخمین زده شده، دوباره تکنیک متعادل سازی را بکار بردیم . برای دسته بندی داده های پیش پردازش شده و بررسی کارآیی روش از شبکه های MLP ،SVM و یادگیری شبه نظارتی استفاده کردهایم و مدل پیشنهادی را بر روی مجموعه داده های به دست آمده از پایگاه های داده Kaggle و Cleveland آزمایش کرده ایم . نتایج پیادهسازی بر این تاکید دارند که کاربرد تکنیک های پیش پردازش داده ها، باعث بهبود قابل توجه معیارهای ارزیابی می شود. خصوصا دقت به دست آمده برای الگوریتم های SVM و شبه نظارتی ، بیشتر از ۹۶ درصد است .

کلیدواژه ها

تشخیص بیماری هپاتیت ، شبکه عصبی ، داده متوازن، مقادیر از دست رفته .

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.