Ensemble based variational autoencoders for detecting protein complexes in proteinprotein interaction networks
- سال انتشار: 1402
- محل انتشار: دوازدهمین همایش ملی و سومین همایش بین المللی بیوانفورماتیک
- کد COI اختصاصی: IBIS12_079
- زبان مقاله: انگلیسی
- تعداد مشاهده: 74
نویسندگان
Department of Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran
Department of Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran
چکیده
Protein-protein interaction (PPI) networks are composed of multiple protein complexeswhich play the essential roles in many biological functions and identifying different forms of a disease.Each protein complex is a group of some proteins interacting with each other. Nowadays, due to thelimitations of experimental methods, computational approaches are used to identify the complexes. Inthis regard, measurement errors lead to the noisy and uncertain interactions, which makes it difficult toobtain reliable clusters. To face the challenge, a new method based on Ensemble VariationalAutoencoders named EVA is proposed in this study, that benefits from deep embedding and consensusclustering together to deal with the uncertainty. Using variational autoencoder, it is possible to filter thenoise by creating meaningful representations of the proteins and extracting important features of cocomplexones. In addition, the ensemble learning approach integrate multiple deep models to seek betterembeddings of the proteins and lead to the more qualitative clustering of PPI networks.In this regard, a similarity matrix is generated first using second-order proximity of pairwise proteins.Then, several varioational autoencoders are trained to embed the data points into the low dimensionalfeature space. Next, the resulting representations of each network are extracted and clusteredindependently. Finally, the base clusterings are combined to obtain a robust reliable complexes of theproteins. The proposed method was evaluated by four real datasets of PPI networks in different densityand dimensions including Krogan-core, Krogan-extended, Collins and Gavin. According to the resultsof F-score and MCC (Matthews’s correlation coefficient) evaluation metrics, the proposed methodachieved significant efficiency compared to the recent clustering methods of protein interactionnetworks.کلیدواژه ها
Protein complex; variational autoencoder; ensemble learning; protein-protein interactionمقالات مرتبط جدید
- تحلیل چالشها و راهکارهای تقویت ارتباط دانشگاه و صنعت: با تمرکز بر حلقههای مفقوده
- بازخوانی نقش دانشگاه و صنعت در توسعه ملی: از موانع تا راهکارها
- نشانگر تشخیصی جدید در ژن C-myc به عنوان کیت غیر تهاجمی تشخیص سرطان دهان
- برنامه ریزی منابع تجدید پذیر با درنظر گرفتن برنامه ریزی توسعه انتقال و تولید منابع توان راکتیو
- برنامه ریزی همزمان توسعه انتقال و منابع تولید توان راکتیو با استفاده از یک الگوریتم تکاملی بهبود یافته
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.