شناسایی بیومارکرهای جدید در سرطان پستان بر پایه متاآنالیز داده های RNA-Seq
شناسایی بیومارکرهای جدید در سرطان پستان بر پایه متاآنالیز داده های RNA-Seq
چکیده: سرطان پستان یکی از شایع ترین علل مرگ ومیر در زنان است و شناسایی بیومارکرهای جدید می تواند در تشخیص زودهنگام، پیش آگهی و طراحی درمان های هدفمند نقش مهمی ایفا کند. در این مطالعه، با استفاده از متاآنالیز داده های RNA-Seq در پایگاه های عمومی TCGA و GEO، به جستجوی ژن های دیفرانسیل یافته در بافت های سرطانی در برابر بافت های نرمال پرداختیم. نتایج نشان داد که بیان ژن های ANLN، ASPM و CENPF به طور معنی داری در تومورها افزایش یافته و ارتباط نزدیکی با مراحل پیشرفته بیماری دارند. تحلیل های بیوانفورماتیکی بیشتر، این ژن ها را به عنوان بیومارکرهای بالقوه برای پیش بینی بقا معرفی می کند. یافته های این مطالعه می تواند مبنایی برای پژوهش های آزمایشگاهی و درمان های هدفمند در آینده باشد.
مقدمه: سرطان پستان با نرخ شیوع بالا، همچنان یکی از چالش های عمده سلامت عمومی است. اگرچه پیشرفت هایی در درمان به دست آمده، اما تشخیص زودهنگام و پیش بینی دقیق پیشرفت بیماری نیازمند شناسایی بیومارکرهای دقیق و اختصاصی است. در سال های اخیر، تکنولوژی RNA-seq و دسترسی به پایگاه های عمومی همچون TCGA و GEO امکان تحلیل گسترده داده های ترانسکریپتوم را فراهم کرده اند. هدف این مطالعه، شناسایی ژن هایی است که به طور معنی داری در بافت سرطانی پستان نسبت به بافت سالم تغییر بیان داشته و می توانند به عنوان نشانگر زیستی (biomarker) برای پیش آگهی و هدف درمانی استفاده شوند.
مواد و روش ها:
- جمع آوری داده ها: داده های RNA-seq مربوط به سرطان پستان از پایگاه های TCGA (The Cancer Genome Atlas) و GEO (Gene Expression Omnibus) استخراج شدند.
معیار ورود داده ها: شامل نمونه های توموری و نرمال، با فرمت FPKM یا raw counts
- آنالیز دیفرانسیل بیان ژن ها: نرم افزار DESeq2 برای تحلیل آماری استفاده شد.
آستانه انتخاب:
|log2FoldChange| > 2
p-value < 0.01
- متاآنالیز: نتایج مطالعات مختلف با استفاده از روش random-effects ترکیب شدند.
بررسی همپوشانی ژن های متفاوت بیان شده در چند مطالعه مستقل
- تحلیل مسیرها و بقاء: ابزارهای GSEA و STRING برای بررسی مسیرهای مولکولی و شبکه های پروتئینی به کار رفتند.
بررسی ارتباط ژن های منتخب با بقاء بیماران با کمک Kaplan-Meier Plotter
نتایج: تعداد ۷۵ ژن به طور معنی دار در بیماران سرطان پستان در مقایسه با افراد سالم، تغییر بیان داشتند.
در میان آن ها، سه ژن ANLN (anillin), ASPM (abnormal spindle microtubule assembly), و CENPF (centromere protein F) بیشترین سطح بیان را داشتند.
هر سه ژن در مرحله پیشرفته تر سرطان و در بیماران با بقاء پایین، سطح بیان بالاتری نشان دادند.
تحلیل شبکه های پروتئینی نشان داد این ژن ها در چرخه سلولی و تقسیم سلولی نقش مهمی دارند.
بحث و نتیجه گیری: این مطالعه با بهره گیری از متاآنالیز داده های RNA-seq، توانست سه ژن کلیدی را به عنوان بیومارکرهای بالقوه در سرطان پستان شناسایی کند. سطح بیان بالای ANLN، ASPM، و CENPF با پیش آگهی ضعیف و مراحل پیشرفته بیماری مرتبط است. این ژن ها می توانند اهداف بالقوه ای برای توسعه درمان های هدفمند باشند. همچنین یافته ها نشان می دهد که استفاده از داده های عمومی و تحلیل های جامع، ابزار موثری برای کشف اهداف درمانی جدید است.
پیشنهادات آینده: اعتبارسنجی آزمایشگاهی (qPCR، Western blot) بیان این ژن ها در نمونه های بالینی
بررسی نقش این ژن ها در مقاومت دارویی یا متاستاز
طراحی مدل های یادگیری ماشین برای پیش بینی پیشرفت بیماری بر اساس بیان ژن ها
منابع: Cancer Genome Atlas Network. Comprehensive molecular portraits of human breast tumours. Nature. 2012.
Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 2014.
Uhlen M, et al. A pathology atlas of the human cancer transcriptome. Science. 2017.
Kaplan-Meier Plotter: http://kmplot.com
GEO database: https://www.ncbi.nlm.nih.gov/geo/