افزایش کارایی دسته بندی با استفاده از الگوریتم جهش قورباغه جهت پیش بینی سرطان در داده های ریزآرایه نامتوازن

  • سال انتشار: 1395
  • محل انتشار: کنفرانس بین المللی مهندسی و علوم کامپیوتر
  • کد COI اختصاصی: ICCSE01_272
  • زبان مقاله: فارسی
  • تعداد مشاهده: 617
دانلود فایل این مقاله

نویسندگان

حمیدرضا کاروان پور

کارشناسی ارشد هوش مصنوعی، گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز

سیدعنایت الله علوی

استادیار گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز

محمود نادران طحان

استادیار گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز

چکیده

در این پژوهش، روشی نوین و کارا جهت پیش بینی احتمال بیماری سرطان از طریق تحلیل داده های ریزآرایه ارایه شده است.یکی از چالش های موجود در این زمینه، تعداد بالای ویژگی ها (ژن ها) و از طرفی تعداد پایین نمونه ها است. لذا، در این پژوهشابتدا از روشی کارآمد در زمینه ی انتخاب ژن، از ترکیب نتایج سه فیلتر در جهت کوچک کردن ابعاد مجموعه داده ها برای شناساییو حذف ژن های نامرتبط استفاده می شود. از دیگر مسایل و چالش های مهم در زمینه ی دسته بندی مجموعه داده های ریز آرایه،نامتوازن بودن این داده ها میباشد. به طور معمول، به اشتباه دسته بندی کردن یک نمونه از کلاس اقلیت یا کلاس بیمار، بسیارخطرناکتر از دسته بندی اشتباه یک نمونه کلاس اکثریت یا کلاس افراد سالم است. از روش دسته بندی حساس به هزینه با استفادهاز معیار ارزیابی G-MEAN استفاده شده است. در این پژوهش با استفاده از الگوریتم جهش قورباغه، ماتریس هزینه به دستخواهد آمد. همچنین از الگوریتم ترکیبی بگینگ با درخت تصمیم حساس به هزینه به عنوان دسته بند پایه، اقدام به دسته بندیداده های نامتوازن ریزآرایه خواهد شد. جهت جلوگیری از افت دقت دسته بندی، به جای استفاده از یک دسته بند پایه، با استفادهاز ایجاد تنوع بین چند دسته بند پایه دقت کلی افزایش خواهد یافت.

کلیدواژه ها

بیوانفورماتیک، ریزآرایه، داده های نامتوازن، شناسایی سرطان، الگوریتم جهش قورباغه، الگوریتم بگینگ، فیلتر، درخت تصمیم، دسته بند حساس به هزینه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.