Predicting the membrane proteins’ classification using multi-dimensional wavelet and random forest classifier
- سال انتشار: 1400
- محل انتشار: اولین همایش بین المللی و دهمین همایش ملی بیوانفورماتیک ایران
- کد COI اختصاصی: IBIS10_036
- زبان مقاله: انگلیسی
- تعداد مشاهده: 234
نویسندگان
Department of Biophysics, Faculty of Biological Sciences, Tarbiat Modares University, Jalal AleAhmad,Nasr, Tehran, Iran
Department of Biophysics, Faculty of Biological Sciences, Tarbiat Modares University, Jalal AleAhmad,Nasr, Tehran, Iran
چکیده
Concerning the difficulties and complexity of experimental methods to determine the functionality andstructure of the proteins, the computational techniques have recently found their proper place in predictingprotein function problems. While different techniques have been introduced based on the machine learningapproach, there is no combination technique of exploiting Multidimensional discrete wavelettransform(DWT) analysis and machine learning. In this study, we have devised a handy, accurate, and timeefficientpredictive model to classify the membrane proteins into five different classes, including single-passtype ۱, single-pass type ۲, Multi-Pass, Lipid-Chain, and GPI membrane proteins based on DWT analysis andmachine learning approach.We have applied our proposed method for Chou's membrane protein datasets, containing ۲۰۵۹ and ۲۶۲۵membrane protein sequences from five different classes. The majority of the former studies used thesedatasets as the complete ones. In this technique, protein sequences were initially transformed into sixdimensionalsignals, including the hydropathy scale, polarity, secondary structure, molecular volume, codondiversity, and electrostatic charge indexes. These six-dimensional signals are then used as themultidimensional discrete wavelet transform input data to analyze the entire signals. Feature vectors werethen generated regarding the proper criteria of approximate and detailed coefficients for every single protein.ventually, the feature vectors were used in a random forest classifier to avoid overfitting and take advantageof measuring variable importance.As a result, we obtained an accuracy of ۹۱.۷% and ۸۹.۶% for the independent dataset and jackknife test,respectively. These results indicated that the proposed method yielded better results.کلیدواژه ها
Membrane proteins; Predictive model; Discrete Wavelet transform; Hydropathy scaleمقالات مرتبط جدید
- استروئیدها، فواید، خطرات و واقعیت ها
- پاسخ آنزیمهای آنتی اکسیدانی (CAT و SOD) و ظرفیت اکسیداتیو کل (TOS) گوجه فرنگی (Solanum lycopersicum L) به تیمار نانوذرات اکسید روی
- ارزیابی تجمع میکروپلاستیکها در وزغ سبز (Bufotes sitibulus به عنوان شاخص زیستی در چشمه بلاغ استان مرکزی با استفاده از AFM و FTIR
- Strategies for Controlling Future Pandemics Similar to COVID-۱۹: A Systematic Review
- بررسی عملکردی کاربرد پلیمرها و نانوکامپوزیتهای پلیمری در فرآیند ازدیاد برداشت نفت: مروری بر چالشها و چشم اندازها
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.