تشخیص بیماری مزوتلیوم با استفاده از تکنیک بهینه شده یادگیری ماشین و انتخاب زیر مجموعه ویژگی های موثر

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 392

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP03_116

تاریخ نمایه سازی: 31 اردیبهشت 1398

چکیده مقاله:

سالانه هزاران نفر از انسان ها به دلیل بیماری سرطان مزوتلیوم فوت کرده و یا درگیر آن می شوند. مزوتلیومای بدخیم پلور، سرطانی ناشایع با درمان بسیار محدود در حفره پلورال هستند که از سلولهای مزوتلیال منشاء میگیرد. برخلاف سرطان ریه سیگار عامل مستعدکننده بروز این سرطان نبوده بلکه تماس طولانی مدت با آزبست عامل اصلی بروز این سرطان شناخته میشود. تا به امروز راهکارهای کمی از سوی پزشکان متخصص جهت آنالیز دقیق سرطان مزوتلیوم ارایه شده که میزان نایقینی در تفسیر خروجیها بالاست. مشکل اصلی در شناسایی بیماری مزوتلیوما در آن است که عدم تشخیص با دقت و صحت بالا موجب روی آوری به طراحی خودکار شده و برخی از محققین، الگوریتمهایی را پیشنهاد دادهاند که توانسته تا حدی مشکلات شناسایی دقیق سرطانهای مزوتلیوم و سرطانهای مشابه را مرتفع نماید. با این اوصاف، مشخص نیست در تحقیقات پیشین، اثرات داده، ویژگیهای مختلف ناشی از ضایعه مزوتلیوم و وجود داده های از دست رفته چه اثری بر تشخیص و افزایش یا کاهش دقت بازشناسی دارد و ابهامی دیگری که بر موضوع وارد است، عبارتست از نبود نتیجهای مشخص از تعداد ویژگیهای درگیر در مسیله. در مقاله حال حاضر، پیشنهاد آن بوده که در گام نخست، هنجارسازی و بازیابی مقادیر از دست رفته در میان ویژگیها و نیز خوشه بندی توسط مدل مخلوط گوسی صورت پذیرد. به علاوه برای نخستین بار از الگوریتم تکاملی ازدحام ذرات در کاستن ابعاد بردار ویژگیهای مزوتلیوم استفاده شده و از سویی برای بهبود دقت در قیاس با راهکارهای سابق، بهبود یادگیری در مرحله طبقه بندی پیاده سازی شده است؛ طبقه بند ماشین بردار پشتیبان و تکنیک بهبود دهنده، الگوریتم ژنتیک میباشد که پارامترهای سی و گاما را در کرنل پایه شعاعی دسته بند ذکر شده بهبود میدهد. داده ها مورد تحلیل در ارتباط با بیماری مزوتلیوم، متعلق به پایگاه داده UCI با تعداد 34 ویژگی از 324 نمونه است که گردآوری اطلاعات از طرق ابزار پنجگانه شامل تنظیم پرسشنامه، مصاحبه، انجام فرایند مطالعه از طریق مشاهده، ارایه جدول جهت گردآوری اطلاعات آماری و در نهایت نمونه برداری میباشد. قابلیت پیادهسازی بر روی تعداد زیادی از داده ها، دقت نسبتا0 مناسب در طبقه بندی داده ها (در حدود %93 تا (%97، استفاده از ارزیابی K-fold، وجود گام انتخاب ویژگی و زمان کم در پردازش داده ها، حل مسیله بیش برازش با بهبود پارامترهای الگوریتم طبقه بند و غیر حساس به اعمال مقادیر از دست رفته از جمله نقاط قوت راهکار پیشنهادی در مقاله کنونی است. هدف اصلی و مشخص از تحقیق حال حاضر، بهبود دقت تشخیص بیماری مزوتلیوم و از طریق ترکیب روشهای مختلف یادگیری ماشینی است.

کلیدواژه ها:

نویسندگان

زهرا شرفی

گروه هوش مصنوعی، واحد لاهیجان، دانشگاه آزاد اسلامی، لاهیجان، ایران

پیمان بیات

گروه کامپیوتر، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران