شناسایی ژن های مرتبط با بیماری های ارثی با استفاده از رویکردهای بیوانفورماتیکی و داده کاوی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 36

فایل این مقاله در 16 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ESPE02_656

تاریخ نمایه سازی: 28 خرداد 1405

چکیده مقاله:

بیماری های ارثی به عنوان یکی از چالش های اساسی در حوزه سلامت عمومی، سالانه هزینه های هنگفتی را بر سیستم های بهداشتی و درمانی کشورها تحمیل می کنند و شناسایی ژن های دخیل در این بیماری ها می تواند گام مهمی در جهت تشخیص زودهنگام، پیش بینی و درمان هدفمند آن ها محسوب شود. پژوهش حاضر با هدف شناسایی ژن های مرتبط با بیماری های ارثی با استفاده از رویکردهای بیوانفورماتیکی و داده کاوی بر روی داده های بیان ژن انجام شده است و در این مسیر، از پایگاه های داده معتبر بین المللی نظیر GEO، TCGA و OMIM برای استخراج داده های خام بیان ژن مربوط به پنج بیماری ارثی شایع شامل فیبروز کیستیک، کمخونی داسی شکل، هموفیلی، تالاسمی و بیماری هانتینگتون استفاده گردیده است. روش پژوهش از نوع توصیفی-تحلیلی با رویکرد محاسباتی بوده و جامعه آماری شامل تمامی داده های بیان ژن موجود در پایگاه های مذکور تا سال ۲۰۲۵ می باشد که با استفاده از روش نمونه گیری هدفمند، تعداد ۵۰۰ نمونه ژنی از هر بیماری انتخاب و پس از اعمال فیلترهای کیفی، نهایتا ۲۴۵۰ نمونه ژنی معتبر وارد مرحله تحلیل شدند. در مرحله پیش پردازش داده ها، با بهره گیری از روش های نرمال سازی Quantile و RMA، داده های خام تبدیل به ماتریس های بیان قابل استفاده گردیدند و سپس با استفاده از الگوریتم های یادگیری ماشین از جمله جنگل تصادفی، ماشین بردار پشتیبان و شبکه های عصبی عمیق، الگوهای بیان افتراقی شناسایی شدند. همچنین برای غربالگری ژن های کلیدی، از معیارهای آماری نظیر fold change، p-value تعدیل شده و نرخ کشف کاذب استفاده گردید که منجر به شناسایی ۴۵ ژن دارای بیان افتراقی معنی دار در سطح ۰/۰۵ > p گردید. نتایج نشان داد که ژن های CFTR، HBB، F۸، HBA۱ و HTT به ترتیب بیشترین ارتباط را با بیماری های مورد مطالعه دارند و تحلیل شبکه برهمکنش پروتئینی نیز حکایت از آن داشت که این ژن ها در مسیرهای سیگنالینگ مرتبط با پاسخ به استرس اکسیداتیو، تنظیم چرخه سلولی و آپوپتوز نقش کلیدی ایفا می نمایند. اعتبارسنجی نتایج با استفاده از روش های آماری بوت استرپ و کراس-ولیدیشن نشان داد که مدل پیشنهادی از دقت ۸۷/۵ درصدی برخوردار است که نسبت به مطالعات پیشین از عملکرد بالاتری برخوردار می باشد. یافته های این پژوهش می تواند افق های جدیدی را در زمینه تشخیص مولکولی و توسعه داروهای هدفمند برای بیماری های ارثی گشوده و به عنوان یک نقشه راه برای پژوهش های آتی در این حوزه مورد استفاده قرار گیرد

نویسندگان

نیکا پیرهادی

دانش آموز پایه دهم دبیرستان رشته تجربی دخترانه فارابی بروجرد