طراحی پپتیدهای ضدباکتریایی با استفاده از روشهای یادگیری ماشین جمعی

سال انتشار: 1399
محل انتشار: بیست و یکمین کنگره ملی و نهمین کنگره بین المللی زیست شناسی ایران
کد COI اختصاصی: BIOCONF21_0301
زبان مقاله: فارسی
تعداد مشاهده: 236

دانلود فایل این مقاله

نویسندگان

فاطمه ابراهیمی ترکی

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران

سمیه دباغ صادق پور

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران

محبوبه ضرابی

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران

چکیده

مقاومتهای آنتی بیوتیکی چالش بزرگی ا ست. پپتیدهای ضدمیکروبی غشای سلول را هدف قرار میدهند و غالبا، یک هدف خاص پروتئینی ندارند، احتمال ایجاد مقاومت در برابر اینها توسط باکتریها، پائین است.آنالیزهای آماری و الگوریتم های یادگیری ماشین اخیرا مورد توجه قرار گرفتهاند. تکنیکهای یادگیری تجمیعی در یادگیری ماشین از تلفیق چند مدل برای ارائه ی مدل بهینه به منظور پیشگویی و طبقه بندی دادها استفاده میکند. از الگوریتم های پرکاربرد در این زمینه میتوان به الگوریتمهای Bagging، Adaboost و RandomForest با تخمینگرهای متعدد، اشاره کرد. در این پژوهش به منظور پیشگویی پپتیدهایی با عملکرد اختصاصی ضد باکتریایی، داده ها از DRAMP ۲.۰ استخراج شد. روشهای EDA با استفاده از کتابخانه های seaborn، numpy و pandas پایتون انجام شد. ۵۵۴ توالی با عملکرد ضدباکتری و ۶۲۶ توالی فاقد این عملکرد فراهم شدند. توصیف کننده ها برمبنای ویژگیهای بیوفیزیکی پپتیدها ازجمله طول توالی، وزن مولکولی، بار، چگالی بار، pI، ضریب ناپایداری، آروماتی سیته، ضریب آلیفاتیک، ضریب Boman و میزان آبگریزی تعیین شدند. مدلسازی توسط الگوریتم SVM با توابع Kernel خطی، چند جمله ای با درجه ۵ و RBF یا میزان گامای ۳ و الگوریتم های RandomForest با تعداد درخت ۱۰۰وBagging Classifier ۱۰۰۰ و Adaboost با تعداد تخمین گرهای ۱۰۰ و ۱۰۰۰ انجام شد. صحت و دقت مدل ساخته شده با استفاده از الگوریتم RandomForest با تعداد تخمینگر ۱۰۰۰، %۸۷ و %۹۰ و بهینه ترین حالت در مقایسه با روشهای دیگر بود. میانگین صحت و دقت برای روشهای SVM با Kernelهای اشاره شده، Bagging و Adaboost به ترتیب برابر بود با %۷۸، %۸۷ و .%۸۶ برای داده ها و مشخصه های این پژوهش، رویکرد تجمیعی به دلیل نحوه ی استفاده از داده های train در حالت کلی در مقایسه با روش SVM نتیجه بهتری داشت.داده ها به صورت تصادفی تقسیم بندی شده و چندین بار برای یادگیری مدل استفاده شدند.با وجود پیشرفت روشهای محاسباتی نیاز به روشهای آزمایشگاهی به منظور ارزیابی های دقیق تر وجود دارد که این مرحله از گامهای آتی این پژوهش است.

کلیدواژه ها

مقاومت آنتی بیوتیکی، EDA، الگوریتم SVM، Random Forest، پپتید

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.