مهندسی ویژگی توالی DNA با استفاده از یادگیری عمیق

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 892

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF03_235

تاریخ نمایه سازی: 5 آبان 1397

چکیده مقاله:

در حوزه داده های حجیم، تبدیل داده های حجیم زیست فناوری به دانش ارزشمند یکی از چالش های مهم زیست فناوری است. یادگیری عمیق از اوایل سال 2000 به سرعت در حال پیشرفت است و هم اکنون نشان دهنده پیشرفت های اخیر در زمینه های مختلف است. بر این اساس استفاده از یادگیری عمیق در زیست فناوری برای بدست آوردن بینش از داده ها در صنعت و دانشگاه تاکید شده است.استفاده از ابزارهای کامپیوتری مکانیزه کننده , مخصوصا در یادگیری ماشین به منظور تسهیل آنالیزهای پزشکی و تشخیص, یک عرصه مهم و امید بخش می باشد .در این تحقیق نشان خواهیم داد که چگونه یادگیری مشخصه با ناظر و بدون ناظر , می تواند برای کشف نوع پروتیین و تحلیل نوع آن از داده توالی پروتیین، با استفاده از روشهای مختلف وزن دهی و کلاس بندی بخصوص یادگیری عمیق مورد استفاده قرار گیرد .مزیت اصلی روش پیشنهادی نسبت به روش های قبلی تشخیص پرروتیین , امکان به کارگیری داده از انواع مختلف پروتیین به صورت خودکار از مشخصه ای است که کمک به تسهیل کشف و تشخیص یک نوع مشخص پروتیین می کند. شناخت توالی DNAو محصولات آنها در میان افراد، می تواند منجر به یافتن راه های جدید و انقلابی برای تشخیص، درمان و حتی پیشگیری از هزاران اختلال که بر ما اثر می گذارد، شود. مجموعه داده های مورداستفاده در این مقاله برگرفته از مقالاتی که اثبات شده است که پروتیین موردنظر از نوع ترموفیل یا مزوفیل هستند جمع آوری شده اند زیرا هر باکتری چندین پروتیین مقاوم و یا حساس دارد و اگر یک باکتری حساس باشد لزوما به این معنی نیست که همه ژنهای آن حساس هستند به همین جهت میبایست داده های صحیح استخراج شود که از بانک داده پروتیین rcsb ،ncbi ،uniprot که پایگاه داده در حوزه شناسایی پروتیین و توالی آن هستند جمع آوری شده اند که با استفاده از شبکه عصبی عمیق , جهت کشف و دسته بندی انواع پروتیین بر اساس داده های توالی پروتیینی به کار برده شده است. هدف ما از این تحقیق،تشخیص و دسته بندی نوع پروتیین و انتخاب بهترین ویژگی ها با استفاده ازروشهای مختلف و یادگیری عمیق است .روش پیشنهادی ما در این تحقیق، شبکه عصبی عمیق می باشد که با استفاده از داده های توالی پروتیینی برای تشخیص ودسته بندی نوع پروتیین استفاده کردیم.در روش پیشنهادی، داده های توالی پروتیینهای مقاوم به گرما و نامقاوم به گرما را بررسی کردیم. نتایج بدست آمده از تجزیه و تحلیل بر روی داده های توالی پروتیینی ، با استفاده از شبکه عصبی عمیق، نشان می دهد که در تشخیص و دسته بندی پروتیین، درصد دقت آن بالا می باشد و می توان از این روش برای تشخیص و دسته بندی پروتیین ها استفاده کرد.بنابراین نویددهنده دستیابی کلی تر و جامع تری برای کشف و تشخیص پروتیین است.

کلیدواژه ها:

یادگیری عمیق- شبکه عصبی کانولوشن- پروتییین مزوفیل- پروتیین ترموفیل -مهندسی ویژگی

نویسندگان

رضا احسن

دانشجو دکتری فناوری اطلاعات دانشگاه قم گروه کامپیوتر ، دانشکده مهندسی کامپیوتر، دانشگاه قم، قم، ایران

منصور ابراهیمی

دانشیار دانشگاه قم گروه زیست شناسی،دانشکده علوم پایه،دانشگاه قم، قم، ایران

مریم حنیفه

کارشناسی ارشد فناوری اطلاعات، موسسه آموزش عالی تعالی قم گروه کامپیوتر ،موسسه آموزش عالی فناوری اطلاعات، موسسه آموزش عالی غیرانتفاعی تعالی قم، قم، ایران

نرگس شم آبادی

کارشناسی ارشد زیست شناسی سلولی مولکولی، دانشگاه قم