طراحی پپتیدهای ضدباکتریایی با استفاده از روشهای یادگیری ماشین جمعی
- سال انتشار: 1399
- محل انتشار: بیست و یکمین کنگره ملی و نهمین کنگره بین المللی زیست شناسی ایران
- کد COI اختصاصی: BIOCONF21_0301
- زبان مقاله: فارسی
- تعداد مشاهده: 199
نویسندگان
آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران
آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران
آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران
چکیده
مقاومتهای آنتی بیوتیکی چالش بزرگی ا ست. پپتیدهای ضدمیکروبی غشای سلول را هدف قرار میدهند و غالبا، یک هدف خاص پروتئینی ندارند، احتمال ایجاد مقاومت در برابر اینها توسط باکتریها، پائین است.آنالیزهای آماری و الگوریتم های یادگیری ماشین اخیرا مورد توجه قرار گرفتهاند. تکنیکهای یادگیری تجمیعی در یادگیری ماشین از تلفیق چند مدل برای ارائه ی مدل بهینه به منظور پیشگویی و طبقه بندی دادها استفاده میکند. از الگوریتم های پرکاربرد در این زمینه میتوان به الگوریتمهای Bagging، Adaboost و RandomForest با تخمینگرهای متعدد، اشاره کرد. در این پژوهش به منظور پیشگویی پپتیدهایی با عملکرد اختصاصی ضد باکتریایی، داده ها از DRAMP ۲.۰ استخراج شد. روشهای EDA با استفاده از کتابخانه های seaborn، numpy و pandas پایتون انجام شد. ۵۵۴ توالی با عملکرد ضدباکتری و ۶۲۶ توالی فاقد این عملکرد فراهم شدند. توصیف کننده ها برمبنای ویژگیهای بیوفیزیکی پپتیدها ازجمله طول توالی، وزن مولکولی، بار، چگالی بار، pI، ضریب ناپایداری، آروماتی سیته، ضریب آلیفاتیک، ضریب Boman و میزان آبگریزی تعیین شدند. مدلسازی توسط الگوریتم SVM با توابع Kernel خطی، چند جمله ای با درجه ۵ و RBF یا میزان گامای ۳ و الگوریتم های RandomForest با تعداد درخت ۱۰۰وBagging Classifier ۱۰۰۰ و Adaboost با تعداد تخمین گرهای ۱۰۰ و ۱۰۰۰ انجام شد. صحت و دقت مدل ساخته شده با استفاده از الگوریتم RandomForest با تعداد تخمینگر ۱۰۰۰، %۸۷ و %۹۰ و بهینه ترین حالت در مقایسه با روشهای دیگر بود. میانگین صحت و دقت برای روشهای SVM با Kernelهای اشاره شده، Bagging و Adaboost به ترتیب برابر بود با %۷۸، %۸۷ و .%۸۶ برای داده ها و مشخصه های این پژوهش، رویکرد تجمیعی به دلیل نحوه ی استفاده از داده های train در حالت کلی در مقایسه با روش SVM نتیجه بهتری داشت.داده ها به صورت تصادفی تقسیم بندی شده و چندین بار برای یادگیری مدل استفاده شدند.با وجود پیشرفت روشهای محاسباتی نیاز به روشهای آزمایشگاهی به منظور ارزیابی های دقیق تر وجود دارد که این مرحله از گامهای آتی این پژوهش است.کلیدواژه ها
مقاومت آنتی بیوتیکی، EDA، الگوریتم SVM، Random Forest، پپتیدمقالات مرتبط جدید
- Molecular Simulation of Water Transport through Polyamide Membrane in K+Cl- Salt Solution
- نانوکامپوزیت ها در دندانپزشکی
- Improving the characteristics of L-shaped graphene-based gas sensor using gold block on the surface
- Molecular Modelling of Gelatin Bundles for Atomistic Investigations Suggesting Two Stable Conformations
- بررسی تاثیر نانوذرات منیزیم بر جوانه زنی بذر و رشد گیاهچه بادرنجبویه Melissa officinalis
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.