Enhancing Precision for Background Mutation Rate Estimation in Cancer Genomes
- سال انتشار: 1402
- محل انتشار: دوازدهمین همایش ملی و سومین همایش بین المللی بیوانفورماتیک
- کد COI اختصاصی: IBIS12_196
- زبان مقاله: انگلیسی
- تعداد مشاهده: 148
نویسندگان
Department of Nanobiotechnology, New Technologies Research Group, Pasteur Institute of Iran, Tehran, Iran
Department of Nanobiotechnology, New Technologies Research Group, Pasteur Institute of Iran, Tehran, Iran
Department of Bioinformatics, Institute of Biochemistry and Biophysics, University of Tehran, Iran
چکیده
Accurate estimation of the background mutation rate (BMR) is crucial for identifying cancerdrivers, significantly impacts the precision of prioritizing both coding and non-coding cancer drivers.This study investigates the influence of neighboring regions on BMR prediction by applying a noveltransformer-based neural network using self-attention mechanisms. Additionally, it systematicallycompares various machine learning algorithms, investigates the impact of the number of genomicelements in the training set, and explores different bin generation methods for BMR prediction.The analysis was performed on ۲۲۵۳ whole cancer genomes of ۳۳ cancer types from non-melanomalymphomadonors. Somatic mutations were used from the PCAWG project, with the TCGA portion ofdata obtained from the Genotypes and Phenotypes (dbGap) database (project #۳۲۶۰۷). A total of ۹۷۱۲۹۰variable-size intergenic genomic coordinates were derived by removing functional genomic elementsbased on PCAWG definition and retaining callable genomic regions. A set of ۱۳۷۲ genomic context andepigenomic features affecting mutation rate were extracted for each genomic region. This studycompared a transformer-based model to XGBoost, random forest, classic neural network, and binomialgeneralized linear model. Model performance was compared using Spearman correlation and meansquared error.We comprehensively analyzed the performance of various models for BMR estimation, examining theeffects of binning strategies, sample sizes, and model types on the accuracy of predictions. The resultsof our analysis indicate that the transformer model outperformed traditional deep neural networks andthe binomial generalized linear model. The performance of the transformer model was similar to theXGBoost method.کلیدواژه ها
cancer genomics; transformer neural networks; background mutation rateمقالات مرتبط جدید
- تحلیل ژنومی و تنوع ژننتیکی ژن های مسئول صفات مقاومت به تنش خشکی در گیاهان زراعی بومی ایران با استفاده از تکنیک های تکنیک های نسل جدید توالی یابی ( NGS)
- بررسی نقش miRNA های خاص در تنظیم بیان ژن های درگیر در مقاومت به دارو در سرطان های مقاوم به شیمی درمانی
- یک رویکرد سطح سختافزاری برای کاهش تداخل ردیف حافظه؛ چیدمان داده ها و شتابدهنده های CNN با تاکید بر FPGA
- اثرات زیست محیطی استفاده از پوزوالنهای صنعتی در بتن
- تاثیر دیجیتالی شدنبر عملکرد شرکت: بررسی نقش فرهنگ دیجیتال و تاثیر قابلیت زنجیره تامین (مورد مطالعه: شرکت های تولیدی شهر صنعتی رشت)
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.