کاهش ابعاد داده های بیوانفورماتیک با استفاده از معیارهای رتبه بندی ویژگی ها

  • سال انتشار: 1394
  • محل انتشار: اولین کنفرانس بین المللی پردازش سیگنال و سیستم های هوشمند
  • کد COI اختصاصی: SPIS01_025
  • زبان مقاله: فارسی
  • تعداد مشاهده: 879
دانلود فایل این مقاله

نویسندگان

سمیرا صابریان بروجنی

دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد، یزد

محمدتقی صادقی

استادیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد، یزد

وحید ابوطالبی

استادیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد، یزد

چکیده

یکی از مشکلات آنالیز داده های بیوانفورماتیک حجم زیاد این داده ها است که منجر به تحقیقات زیادی به منظور بهینه سازی فرایند کاهش ابعاد این داده ها شده است. در این چارچوب، هدف دستیابی به زیرمجموعه کوچکتری از ویژگی ها است، که در عین حال بنا بر کاربرد موردنظر ، دقت بیشتری نیز حاصل شود. یکی از راهکارهای مهم برای این مسئله، استفاده از شیوه های انتخاب ویژگی مبتنی بر فیلتر است که در آن با رتبه بندی ویژگی ها، زیرمجموعه ای از آن ها که حائز بیشترین امتیاز می شوند، به عنوان ویژگی های نهایی مورد استفاده قرار می گیرند. تاکنون معیارهای متفاوتی برای رتبه بندی ارائه شده است. در این پژوهش، ابتدا عملکرد سه معیار متفاوت رتبه بندی شامل وابستگی آماری، نرخ بهره و امتیاز فیشر برای کاهش ابعاد داده ها مورد بررسی واقع می شوند و پس از آن ادغام این معیارها جهت بهینه سازی فرآیند انتخاب ویژگی ها مورد توجه قرار می گیرد. نتایج نشان می دهد که در اغلب موارد معیار وابستگی آماری بهترین عملکرد را داشته و در برخی از موارد با ادغام معیارها می توان به نتایج بهتری دست یافت.

کلیدواژه ها

انتخاب ویژگی؛ رتبه بندی ویژگی؛ وابستگی آماری؛ نرخ بهره؛ امتیاز فیشر

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.