شناسایی باکتری های مقاوم به گرما بر اساس انتخاب بازنمایی مناسب از توالی پروتئین با استفاده از رویکرد یادگیری عمیق

  • سال انتشار: 1399
  • محل انتشار: مجله دانشگاه علوم پزشکی قم، دوره: 14، شماره: 3
  • کد COI اختصاصی: JR_MUQ-14-3_007
  • زبان مقاله: فارسی
  • تعداد مشاهده: 550
دانلود فایل این مقاله

نویسندگان

رضا احسن

School of Engineering, University of Qom

منصور ابراهیمی

Department of Biology, School of Basic Sciences, University of Qom

چکیده

زمینه و هدف: شناسایی مکانیزم های موثر در مقاومت باکتری ها به گرما جهت ایجاد سویه های مقاوم به گرما در صنایعی از جمله صنایع غذایی، ساخت منسوجات و به خصوص در صنایع تولیدکننده مواد شوینده، بسیار حائز اهمیت می باشد. به این منظور، از ابزارهای یادگیری عمیق برای شناسایی خصوصیات باکتری های مقاوم به گرما بر اساس خصوصیات پروتئینی استفاده گردید. روش بررسی: برخی از خصوصیات پروتئین های مقاوم و غیر مقاوم به گرما از قبیل ویژگیهای ساختاری اسیدآمینه ها، تعداد و فرکانس هر اسیدآمینه و خصوصیات فیزیکوشیمیایی آنها محاسبه گردیدند. مجموعه داده ها جهت رده بندی باکتری ها، در سه مرحله انجام شد: ابتدا  از مدل های وزن دهی برای شناسایی متغیرهای مهم استفاده شده و سپس آنها انتخاب شده و نهایتا با  استفاده از شبکه یادگیری عمیق نسبت به استخراج سلسله مراتب ویژگیها اقدام گردید. یافته ها: نتایج ده روش وزن دهی نشان دادند که از بین ۷۳ خصوصیات تعداد و فرکانس اسیدهای آمینه، تنها ۴۰ ویژگی، وزن بالاتر از صفر داشتند. از این  تعداد، ۱۳ ویژگی، وزن بالاتر از  ۰.۵ را کسب کرده و تنها ۱۰ ویژگی میانگین وزن اختصاص داده به آنها بالاتر از  ۰.۰۹ بوده است. این ده ویژگی به عنوان متغیرهای مهم انتخاب شدند. ویژگیهای فرکانس گلوتامین و فرکانس اسیدگلوتامیک بیشترین وزن را اخذ کرده و به عنوان دو خصوصیت مهم در رده بندی باکتری های مقاوم و غیرمقاوم به گرما معرفی شدند. بیشترین دقت ردهبندی باکتریهای مقاوم به گرما در رویکرد سوم برابر ۹۲.۴۲% بدست آمد. نتیجه گیری: شبکه های عصبی عمیق با استخراج سلسله مراتب ویژگی ها، می تواند به خوبی باکتری های مقاوم به گرما را بر اساس خصوصیات پروتئینی آنها شناسایی کند.

کلیدواژه ها

Thermostable, Protein sequence, Classification, Deep learning networks., مقاوم به گرما, توالی پروتئین, رده بندی, یادگیری عمیق

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.