مروری بر راهکارهای بهبود الگوریتم یادگیری تقویتی

مریم شهریاری فولادی; نسیم نورافزا

مروری بر راهکارهای بهبود الگوریتم یادگیری تقویتی

محل انتشار: کنفرانس بین المللی مهندسی و علوم کامپیوتر

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 814

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/648335

شناسه ملی سند علمی:

ICCSE01_183

تاریخ نمایه سازی: 14 شهریور 1396

چکیده مقاله:

ربات ها و یا عوامل هوشمند به جهت یافتن راهکار و روشی جهت حل مسایل دشوار و کنترل کردن سیستم های پیچیده و توزیع شدهمورد استفاده قرار می گیرند. تعامل صحیح بین عوامل و یا محیط پیرامون آنها منجر می شود تا بتوان در دنیای واقعی از آنها بهرهبهتر برد. هر ربات برای بهبود رفتار خود می تواند از راهکارهای یادگیری ماشین استفاده کند که روشهای بدون مدل برای محیط هایغیرقابل پیش بینی مناسب به نظر می رسد. ای بین روشهای یادگیری بدون مدل نیز، روش یادگیری تقویتی Q، محبوبیت بسیار زیادیدر طراحی و ساخت ربات ها یافته است. به همین جهت در این مقاله سعی بر آن شده تا علاوه بر معرفی این روش، کاربردهای آن درانواع ربات های زیرآبی، انسان نما، وزنه بردار، بازیکن فوتبال و مسیریاب بررسی گردد. بسیاری از محققین راهکارهایی برای ارتقاکیفیت یادگیری نسبت به روش اولیه یادگیری تقویتی Q ارایه داده اند که به اجمال به آنها پرداخته خواهد شد.

کلیدواژه ها:

الگوریتم یادگیری تقویتی Q ، ماژولاریتی ، سیستم های فایی ، شبکه عصبی

نویسندگان

مریم شهریاری فولادی

دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران

نسیم نورافزا

دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران