تشخیص زودهنگام بیماری های نادر چندژنی: رویکردی یکپارچه مبتنی بر گراف های زیستی، شبکه های عصبی گرافی (GNN) و مدل های زبان بزرگ زیستی (Bio-LLMs)

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 6

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMECONF26_005

تاریخ نمایه سازی: 4 بهمن 1404

چکیده مقاله:

بیماری های نادر چندژنی (Polygenic Rare Diseases - PRDs) به دلیل پیچیدگی ساختاری و اثر هم افزایی ده ها یا صدها ژن، یک چالش عمده در تشخیص و مداخله زودهنگام محسوب می شوند. روش های سنتی ژنتیکی اغلب در شناسایی الگوهای تعاملی پیچیده و ناهمگن شکست می خورند. این مقاله یک چارچوب محاسباتی نوآورانه و یکپارچه را برای تشخیص زودهنگام PRDs معرفی می کند که سه مولفه کلیدی را ترکیب می کند: مدل سازی ساختار بیولوژیکی با استفاده از گراف های زیستی (Biological Graphs)، استخراج ویژگی های مکانی-عملکردی با شبکه های عصبی گرافی (GNNs)، و ادغام دانش بیولوژیکی متنی با مدل های زبان بزرگ زیستی (Bio-LLMs). سیستم پیشنهادی، که آن را BioGraph-Fusion (BGF) می نامیم، ابتدا روابط ژن-ژن، پروتئین-مسیر و ناهنجاری های ژن-فنوتیپ را به صورت یک گراف چندوجهی (Multi-modal Heterogeneous Graph) کدگذاری می کند. سپس، GNNها برای یادگیری بازنمایی های غنی از ویژگی های نهفته استفاده می شوند. در نهایت، خروجی GNN به عنوان ورودی کنتکستی به یک Bio-LLM (مانند BERT-based یا GPT-like) داده می شود تا تصمیم نهایی تشخیص با در نظر گرفتن تعاملات پیچیده و شواهد متنی موجود در ادبیات پزشکی صورت گیرد. ارزیابی ها بر روی مجموعه داده های شبیه سازی شده و واقعی (شامل داده های توالی یابی و فنوتیپی) نشان می دهد که BGF عملکرد تفکیک پذیری (AUC) بالاتری نسبت به روش های مبتنی بر امتیازدهی تک ژنی (Polygenic Risk Scores - PRS) و مدل های صرفا یادگیری عمیق ارائه می دهد، به ویژه در شناسایی زیرگروه هایی از بیماران با علائم اولیه مبهم.

کلیدواژه ها:

تشخیص زودهنگام بیماری های نادر چندژنی: رویکردی یکپارچه مبتنی بر گراف های زیستی ، شبکه های عصبی گرافی (GNN) و مدل های زبان بزرگ زیستی (Bio-LLMs)

نویسندگان

احسان نریمانی

۱دکترای کامپیوتر نرم افزار،دانشگاه نجف آباد،اصفهان،ایران

سیدسینا نظری سالاری

۲پزشکی،دانشگاه علوم پزشکی،لرستان،ایران

زهرا صفائی

۳کارشناسی علوم کامپیوتر،دانشگاه نجف آباد،اصفهان،ایران

فاطمه صفائی

۴کارشناسی علوم کامپیوتر،دانشگاه نجف آباد،اصفهان،ایران

حسین سلطانی

۵کارشناسی علوم کامپیوتر،دانشگاه نجف آباد،اصفهان،ایران