کاربرد یادگیری ماشین در تحلیل داده های متیلاسیون DNA با هدف تشخیص بیماریهای ژنتیکی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 361

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECHSD05_153

تاریخ نمایه سازی: 25 آذر 1398

چکیده مقاله:

متیلاسیون دی ان ای پدیده ای است که وابستگی قدرتمندی با ایتلای اشخاص به سرطان دارد. بروز این پدیده در بدو تولد دلیلی برای ابتلای شخص به سرطان است. سرطان سینه بر اثر متیلاسیون، یکی از نمونه های بروز متیلاسیون در دی ا5ن ا5ی اشخاص است.مهمترین دغدغه پزشکان برای تشخیص و پیش گیری از بروز سرطان، تحلیل داد هایی است که این داده ها با استفاده از نمونه برداری جمع آوری گردیده است. از آنجایی که حجم این داده ها زیاد است و دارای ابعاد و5یژگی بسیاری هستند، بنابراین پزشکان قادر به تحلیل چنین داده هایی نخواهند بود. چراکه تحلیل این نوع داده ها برای پزشکان و متخصصین، فرایندی طاقت فرسا و غیر قابل انجام است و برای تشخیص صحیح نمونه ها، دقت و سرعت لازم است.در این تحقیق سعی داریم تا با استفاده از یادگیری ماشین و داده کاوی به تحلیل داده های متیلاسیون دی ا5ن ا5ی برای تشخیص صحیح سرطان سینه و تومور های زیرمجموعه آن، پزشکان را یاری کنیم..مدل ت4ن4ک و تجزیه اندازه تکین روش هایی هستند که در این تحقیق برای کاهش بعد مورد استفاده قرار می گیرند. پس از آنکه کاهش بعد انجام شد با دو رویکرد به تحلیل داده های متیلاسیون می گردازیم. رویکرد اول مبتنی بر یادگیری بدون نظارت است و رودکرد دوم مبتنی بر یادگیری با نظارت می باشد. هدف ما در این مقاله این است که بررسی کنیم کدام روش تحلیل داده برای افزایش دقت مناسب است در رویکرد اول از خوشه بندی کننده -kمیانگین و شبکه عصبی نگاشت خود سازمان دهنده استفاده می کنیم.این رویکرد مبتنی بر یادگیری بدون نظارت است. در رویکرد دوم از ماشین بردار پشتیبان و نزدیکترین همسایه وزن دار استفاده می کنیم. رویکرد دوم مبتنی بر یادگیری با نظارت است. پس از انجام آزمایش الگوریتم مورد استفاده رویکردها روی داده های متیلاسیون سرطان سینه، این دو رویکرد و الگوریتم های آنها از لحاظ دقت، نرخ خطا، حساسیت، صحت و دیگر موارد باهم مقایسه شده و الگوریتمی که بالاترین دقت را دارد معرفی می گردد.

کلیدواژه ها:

نویسندگان

بهروز دیندار

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه اسلامی واحد قزوین، قزوین، ایران