کاربرد یادگیری ماشین در تحلیل داده های متیلاسیون DNA با هدف تشخیص بیماری های ژنتیکی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,498

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_145

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

متیلاسیون دی ان ای پدیده ای است که وابستگی قدرتمندی با ایتلای اشخاص به سرطان دارد . بروز این پدیده در بدو تولد دلیلی برای ابتلای شخص به سرطان است. سرطان سینه بر اثر متیلاسیون، یکی از نمونه های بروز متیلاسیون در دی ان ای اشخاص است. مهمترین دغدغه پزشکان برای تشخیص و پیش گیری از بروز سرطان، تحلیل داد هایی است که این داده ها با استفاده از نمونه برداری جمع آوری گردیده است. از آنجایی که حجم این داده ها زیاد است و دارای ابعاد و5یژگی بسیاری هستند، بنابراین پزشکان قادر به تحلیل چنین داده هایی نخواهند بود. چراکه تحلیل این نوع داده ها برای پزشکان و متخصصین، فرایندی طاقت فرسا و غیر قابل انجام است و برای تشخیص صحیح نمونه ها، دقت و سرعت لازم است.در این تحقیق سعی داریم تا با استفاده از یادگیری ماشین و داده کاوی به تحلیل داده های متیلاسیون دی ان ای برای تشخیص صحیح سرطان سینه و تومور های زیرمجموعه آن، پزشکان را یاری کنیم.. مدل ت4 ن4ک و تجزیه اندازه تکین روش هایی هستند که در این تحقیق برای کاهش بعد مورد استفاده قرار می گیرند. پس از آنکه کاهش بعد انجام شد با دو رویکرد به تحلیل داده های متیلاسیون می گردازیم. رویکرد اول مبتنی بر یادگیری بدون نظارت است و رودکرد دوم مبتنی بر یادگیری با نظارت می باشد. هدف ما در این مقاله این است که بررسی کنیم کدام روش تحلیل داده برای افزایش دقت مناسب است در رویکرد اول از خوشه بندی کننده -kمیانگین و شبکه عصبی نگاشت خود سازمان دهنده استفاده می کنیم.این رویکرد مبتنی بر یادگیری بدون نظارت است. در رویکرد دوم از ماشین بردار پشتیبان و نزدیکترین همسایه وزن دار استفاده می کنیم. رویکرد دوم مبتنی بر یادگیری با نظارت است. پس از انجام آزمایش الگوریتم مورد استفاده رویکردها روی داده های متیلاسیون سرطان سینه، این دو رویکرد و الگوریتم های آنها از لحاظ دقت، نرخ خطا، حساسیت، صحت و دیگر موارد باهم مقایسه شده و الگوریتمی که بالاترین دقت را دارد معرفی می گردد.

کلیدواژه ها:

نویسندگان

بهروز دیندار

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه اسلامی واحد قزوین، قزوین، ایران

محمد قابل رحمت

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه اسلامی واحد قزوین، قزوین، ایران