روش نوین خوشه بندی داده های بیان ژنی
سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 168
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JHBMI-3-3_005
تاریخ نمایه سازی: 9 مرداد 1403
چکیده مقاله:
مقدمه: یکی از تحولات مهم علم ژنتیک، ظهور فناوری ریزآرایه و تولید داده های بیان ژنی است که امکان مطالعه رفتار هزاران ژن را به طور همزمان فراهم می کند. خوشه بندی یکی از روش های داده کاوی است که در تحلیل داده های بیان ژنی مورد استفاده قرار می گیرد. از آنجا که عملکرد روش های خوشه بندی به شدت تحت تاثیر داده ها است، نتیجه خوشه بندی همواره با عدم قطعیت روبه رو بوده و الگوریتمی وجود ندارد که بتوان آن را برای تمام داده ها، کارا قلمداد نمود. در این تحقیق، در تحلیل داده های بیان ژنی از خوشه بندی اجماعی (ترکیب نتایج چندین الگوریتم خوشه بندی) به جای اجرای یک الگوریتم منفرد استفاده شده است.
روش: این مقاله عملکرد خوشه بندی اجماعی را بر روی سه مجموعه داده بیان ژنی Nutt-v۳، Alizadeh-v۲ وSU، توسط شاخص رند تعدیل یافته مورد ارزیابی قرار می دهد. برای پیاده سازی خوشه بندی اجماعی، دوازده خوشه بندی متفاوت حاصل از ترکیب چهار الگوریتم خوشه بندی با سه معیار عدم تشابه، به طور همزمان روی داده ها اجرا شده اند. پس از ادغام نتایج، میزان تطابق خوشه های تخمینی با گروه های واقعی توسط شاخص رند تعدیل یافته سنجیده شده است.
نتایج: مقدار شاخص رند تعدیل یافته برای سه مجموعه داده Nutt-v۳ ، Alizadeh-v۲ و SU، به ترتیب برابر ۱، ۰/۹ و ۰/۵۸به دست آمد که حاکی از دقت بالای روش پیشنهادی در کشف ساختارهای نهفته در داده ها است. همچنین الگوریتم طراحی شده، توانست تعداد واقعی خوشه ها را بدون خطا تشخیص دهد.
نتیجه گیری: خوشه بندی اجماعی روشی توانمند برای خوشه بندی داده های بیان ژنی است. با توجه به دقت این روش در کشف ساختارهای واقعی، می توان آن را با اطمینان جایگزین الگوریتم های خوشه بندی منفرد نمود.
کلیدواژه ها:
Data mining ، Ensemble clustering ، Hierarchical clustering ، Partition around medoids ، Classic multidimensional scaling ، داده کاوی ، خوشه بندی اجماعی ، خوشه بندی سلسله مراتبی ، خوشه بندی افراز حول مدوید ، مقیاس گذاری چند بعدی کلاسیک
نویسندگان
داوود شاهسونی
دکترای تخصصی آمار کاربردی، دانشیار گروه آمار، دانشکده علوم ریاضی، دانشگاه صنعتی شاهرود، شاهرود، ایران.
زهره فرهادی
Shahrood university of technology
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :