بهینه سازی پارامترهای روش های یادگیری ماشین بر ارزیابی ژنومی صفات گسسته دودویی با در نظر گرفتن ساختار جمعیت و توزیع های متفاوت فنوتیپ در جمعیت مرجع

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 135

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JASR-12-1_006

تاریخ نمایه سازی: 21 اسفند 1400

چکیده مقاله:

تنظیم اولیه و بهینه سازی پارامترهای ورودی روش های یادگیری ماشین گامی اساسی جهت دستیابی به حداکثر صحت پیش بینی ژنومی می باشد.  در این تحقیق، جمعیت های ژنومی برای سطوح مختلف وراثت پذیری (۰۵/۰ و ۲/۰)، عدم تعادل پیوستگی (پایین و بالا) و تعداد متفاوت جایگاه صفات کمی (۲۰۰ و ۶۰۰) بر روی ۲۹ کروموزوم شبیه سازی شد. جهت ایجاد نسبت های مختلف فنوتیپ آستانه ای دودویی، فنوتیپ افراد جمعیت مرجع وابسته به اینکه باقی مانده آنها کمتر از ē-۱SDe (رویکرد اول) یا ۵۰ درصد افراد جمعیت (رویکرد دوم) باشد کد یک (فنوتیپ نامطلوب) و سایر حیوانات کد صفر (فنوتیپ مطلوب) اختصاص داده شد. برای بهینه سازی پارامترهای ورودی مدل، سطوح مختلف تعداد SNP نمونه گیری شده (۱۰۰، ۱۰۰۰ و ۲۰۰۰=mtry)، تعداد بوت استراپ (۵۰۰، ۱۰۰۰ و ۲۰۰۰=ntree) و حداقل اندازه گره پایانی (۱ و ۵=node size) برای جنگل تصادفی و سطوح مختلف تعداد درخت (۱۰۰، ۱۰۰۰ و ۲۰۰۰=ntree)، عمق درخت (۱، ۵ و ۱۰=tc) و نرخ یادگیری (۱/۰ و ۰۵/۰=lc) برای Boosting در نظر گرفته شد. کمترین میزان خطای خارج از کیسه برای mtry برابر با ۲۰۰۰، ntree برابر با ۱۰۰۰ و node size برابر با ۱ و کمترین خطای اعتبارسنجی در روش Boosting برای ntree، tc و lr به ترتیب ۱۰۰۰، ۱۰ و ۰۵/۰ مشاهده شد. صحت پیش بینی ژنومی روش های جنگل تصادفی و Boosting با کاهش فنوتیپ نامطلوب (رویکرد اول) افزایش یافت. بطور کلی در تمام سناریوها روش Boosting عملکرد بهتری نسبت به روش جنگل تصادفی داشت که دلیل این امر را می توان لحاظ کردن اثرات متقابل بین نشانگرها، خود ترمیمی و قدرت بالای این روش در کاهش خطای مدل دانست.

نویسندگان

یوسف نادری

دانشگاه آزاد اسلامی واحد آستارا

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Abdollahi-Arpanahi, R., A. Pakdel, A. Nejati-Javaremi, and M. M. Shahrbabak. ...
  • Andonov, S., D. Lourenco, B. Fragomeni, Y. Masuda, I. Pocrnic, ...
  • Bo, Z., J.-J. Zhang, N. Hong, G. Long, G. Peng, ...
  • Boulesteix, A. L., S. Janitza, J. Kruppa, and I. R. ...
  • Breiman, L. ۲۰۰۱. Random forests. Machine Learning, ۴۵(۱):۵-۳۲ ...
  • Daetwyler, H., J. Hickey, J. Henshall, S. Dominik, B. Gredler, ...
  • Daetwyler, H. D., M. P. Calus, R. Pong-Wong, G. de ...
  • Egger-Danner, C., J. Cole, J. Pryce, N. Gengler, B. Heringstad, ...
  • Garrick, D. ۲۰۱۷. The role of genomics in pig improvement. ...
  • Ghafouri-Kesbi, F., G. Rahimi-Mianji, M. Honarvar, and A. Nejati-Javaremi. ۲۰۱۶. ...
  • Ghafouri-Kesbi, F., G. Rahimi-Mianji, M. Honarvar, and A. Nejati-Javaremi. ۲۰۱۷. ...
  • Goddard, M. ۲۰۰۹. Genomic selection: prediction of accuracy and maximisation ...
  • Goldstein, B.A., A. E. Hubbard, A. Cutler, and L. F. ...
  • Gonzalez-Recio, O., and S. Forni. ۲۰۱۱. Genome-wide prediction of discrete ...
  • Effect of marker density and trait heritability on the accuracy of genomic prediction over three generations [مقاله ژورنالی]
  • Habier, D., R. L. Fernando, and J. C. Dekkers. ۲۰۰۹. ...
  • Hayes, B., and M. E. Goddard.۲۰۰۱. The distribution of the ...
  • Hill, W., and A. Robertson. ۱۹۶۸. Linkage disequilibrium in finite ...
  • Jonas, D., V. Ducrocq, and P. Croiseau. ۲۰۱۷. The combined ...
  • Ke, X., S. Hunt, W. Tapper, R. Lawrence, G. Stavrides, ...
  • Mc Hugh, N., T. Meuwissen, A. Cromie, and A. Sonesson. ...
  • Meuwissen, T., B. Hayes, and M. Goddard. ۲۰۰۱. Prediction of ...
  • Muir, W. ۲۰۰۷. Comparison of genomic and traditional BLUP‐estimated breeding ...
  • Naderi, S., M. Bohlouli, T. Yin, and S. König. ۲۰۱۸. ...
  • Naderi, S., T. Yin, and S. König. ۲۰۱۶. Random forest ...
  • Naderi, Y. ۲۰۱۸. Evaluation ofgenomic prediction accuracy in different genomic ...
  • Naderi, Y. ۲۰۱۸. Impact of genotype imputation and different genomic ...
  • Naderi, Y. ۲۰۱۸. Investigation of genotype× environment interaction with considering ...
  • Neves, H. H., R. Carvalheiro, and S. A. Queiroz. ۲۰۱۲. ...
  • Pimentel, E. C., M. Wensch-Dorendorf, S. König, and H. H. ...
  • Purcell, S., B. Neale, K. Todd-Brown, L. Thomas, M. A. ...
  • Ridgeway, G. ۲۰۱۷. Package ‘gbm’, the R project for statistical ...
  • Sadeghi, S., S. A. Rafat, and S. Alijani. ۲۰۱۸. Evaluation ...
  • Sargolzaei, M., and F. S. Schenkel. ۲۰۰۹. QMSim: a large-scale ...
  • Sun, X., R. Fernando, and J. Dekkers. ۲۰۱۶. Contributions of ...
  • Wang, C., X. Ding, J. Wang, J. Liu, W. Fu, ...
  • Wang, C., X. Li, R. Qian, G. Su, Q. Zhang, ...
  • Wang, Q., Y. Yu, J. Yuan, X. Zhang, H. Huang, ...
  • Wientjes, Y. C., M. P. Calus, M. E. Goddard, and ...
  • Yañez, J. M., R. D. Houston, and S. Newman. ۲۰۱۴. ...
  • Yang, P., Y. Hwa Yang, B. B Zhou, and A. ...
  • Yin, T., E. Pimentel, U. K. v. Borstel, and S. ...
  • Zhang, Z., Q. Zhang, and X. Ding. ۲۰۱۱. Advances in ...
  • نمایش کامل مراجع