روش نوین خوشه بندی داده های بیان ژنی

سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 168

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JHBMI-3-3_005

تاریخ نمایه سازی: 9 مرداد 1403

چکیده مقاله:

مقدمه: یکی از تحولات مهم علم ژنتیک، ظهور فناوری ریزآرایه و تولید داده های بیان ژنی است که امکان مطالعه رفتار هزاران ژن را به طور همزمان فراهم می کند. خوشه بندی یکی از روش های داده کاوی است که در تحلیل داده های بیان ژنی مورد استفاده قرار می گیرد. از آنجا که عملکرد روش های خوشه بندی به شدت تحت تاثیر داده ها است، نتیجه خوشه بندی همواره با عدم قطعیت روبه رو بوده و الگوریتمی وجود ندارد که بتوان آن را برای تمام داده ها، کارا قلمداد نمود. در این تحقیق، در تحلیل داده های بیان ژنی از خوشه بندی اجماعی (ترکیب نتایج چندین الگوریتم خوشه بندی) به جای اجرای یک الگوریتم منفرد استفاده شده است. روش: این مقاله عملکرد خوشه بندی اجماعی را بر روی سه مجموعه داده بیان ژنی Nutt-v۳، Alizadeh-v۲ وSU، توسط شاخص رند تعدیل یافته مورد ارزیابی قرار می دهد. برای پیاده سازی خوشه بندی اجماعی، دوازده خوشه بندی متفاوت حاصل از ترکیب چهار الگوریتم خوشه بندی با سه معیار عدم تشابه، به طور همزمان روی داده ها اجرا شده اند. پس از ادغام نتایج، میزان تطابق خوشه های تخمینی با گروه های واقعی توسط شاخص رند تعدیل یافته سنجیده شده است. نتایج: مقدار شاخص رند تعدیل یافته برای سه مجموعه داده Nutt-v۳ ، Alizadeh-v۲ و SU، به ترتیب برابر ۱، ۰/۹ و ۰/۵۸به دست آمد که حاکی از دقت بالای روش پیشنهادی در کشف ساختارهای نهفته در داده ها است. همچنین الگوریتم طراحی شده، توانست تعداد واقعی خوشه ها را بدون خطا تشخیص دهد. نتیجه گیری: خوشه بندی اجماعی روشی توانمند برای خوشه بندی داده های بیان ژنی است. با توجه به دقت این روش در کشف ساختارهای واقعی، می توان آن را با اطمینان جایگزین الگوریتم های خوشه بندی منفرد نمود.

کلیدواژه ها:

Data mining ، Ensemble clustering ، Hierarchical clustering ، Partition around medoids ، Classic multidimensional scaling ، داده کاوی ، خوشه بندی اجماعی ، خوشه بندی سلسله مراتبی ، خوشه بندی افراز حول مدوید ، مقیاس گذاری چند بعدی کلاسیک

نویسندگان

داوود شاهسونی

دکترای تخصصی آمار کاربردی، دانشیار گروه آمار، دانشکده علوم ریاضی، دانشگاه صنعتی شاهرود، شاهرود، ایران.

زهره فرهادی

Shahrood university of technology

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Jiang DC, Tang, Zhang A. Cluster analysis for gene expression ...
  • D'haeseleer P. How does gene expression clustering work? Nat Biotechnol. ...
  • de Souto MC, Costa IG, de Araujo DS, Ludermir TB, ...
  • Jaskowiak PA, Campello RJ, Costa IG. On the selection of ...
  • Strehl A, Ghosh J. Cluster ensembles-a knowledge reuse framework for ...
  • Ghaemi R, Sulaiman N, Ibrahim H, Mustapha N. A survey: ...
  • Li T, Ogihara M, Ma S. On combining multiple clusterings: ...
  • Vega-Pons S, Ruiz-Shulcloper J. A Survey of Clustering Ensemble Algorithms. ...
  • Deodhar M, Ghosh J. Consensus Clustering for Detection of Overlapping ...
  • Hu X, Park EK, Zhang X. Microarray gene cluster identification ...
  • Yu Z, Wong HS. Class discovery from gene expression data ...
  • Souto MC, Araujo DS, Silva BL. Cluster Ensemble for Gene ...
  • Yu Z, Wong HS, Wang H. Graph-based consensus clustering for ...
  • Kim EY, Kim SY, Ashlock D, Nam D. MULTI-K: accurate ...
  • Iam-On N, Boongoen T. Comparative study of matrix refinement approaches ...
  • Gan G, Ma C, Wu J. Data Clustering: Theory, Algorithms, ...
  • Topchy A, Jain AK, Punch W. Clustering ensembles: models of ...
  • Yang C, Wan B, Gao X. Effectivity of Internal Validation ...
  • Nutt CL, Mani DR, Betensky RA, Tamayo P, Cairncross JG, ...
  • Alizadeh AA, Eisen MB, Davis RE, Ma C, Lossos IS, ...
  • Su AI, Welsh JB, Sapinoso LM, Kern SG, Dimitrov P, ...
  • Rencher AC, Christensen WF. Methods of Multivariate Analysis. ۳th ed. ...
  • Everitt B, Hothorn T. An Introduction to Applied Multivariate Analysis ...
  • Warrens MJ. On the Equivalence of Cohen’s Kappa and the ...
  • Shakeri M, Sabaghian E, Esmaeili H. CCK (Clustering-Classification-Kappa) a new ...
  • نمایش کامل مراجع