A hybrid multi-scale CNN-LSTM deep learning model for the identification of protein-coding regions in DNA sequences
- سال انتشار: 1401
- محل انتشار: فصلنامه مهندسی برق دانشگاه تبریز، دوره: 52، شماره: 2
- کد COI اختصاصی: JR_TJEE-52-2_007
- زبان مقاله: فارسی
- تعداد مشاهده: 253
نویسندگان
گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی سهند، تبریز، ایران
گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی سهند، تبریز، ایران
چکیده
Identification of the exact location of an exon in a DNA sequence is an important research area of bioinformatics. The main issues of the previous signal processing techniques are accuracy and robustness for the exact locating of exons. To address the mentioned issues, in this study, a method has been proposed based on deep learning. The proposed method includes a new preprocessing, a new mapping method, and a multi-scale modified and hybrid deep neural network. The proposed preprocessing method enriches the network to accept and encode genes at any length in a new mapping method. The proposed multi-scale deep neural network uses a combination of an embedding layer, a modified CNN, and an LSTM network. In this study, HMR۱۹۵, BG۵۷۰, and F۵۶F۱۱.۴ datasets have been used to compare this work with previous studies. The accuracies of the proposed method have been ۰.۹۸۲, ۰.۹۶۶, and ۰.۹۶۵ on HMR۱۹۵, BG۵۷۰, and F۵۶F۱۱.۴ databases, respectively. The results reveal the superiority and effectiveness of the proposed hybrid multi-scale CNN-LSTM network.کلیدواژه ها
Deep learning, DNA sequences, CNN, LSTM, Multi-scale, Protein coding regionاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.