ترکیب یادگیری تقویتی و الگوریتم ژنتیک برای بهبود عملکرد عامل در بازی های کلاسیک
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 21
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCNF01_022
تاریخ نمایه سازی: 21 خرداد 1405
چکیده مقاله:
یادگیری تقویتی یکی از رویکردهای پرکاربرد در حل مسائل تصمیم گیری متوالی است، اما الگوریتم های کلاسیک آن مانند Q-learning با چالش هایی از جمله سرعت همگرایی پایین، حساسیت بالا به تنظیم پارامترها و احتمال گرفتار شدن در بهینه های محلی مواجه هستند. مسئله اصلی این پژوهش، بهبود عملکرد عامل یادگیرنده در بازی های کلاسیک با کاهش این محدودیت ها است. هدف این مطالعه، ارائه یک چارچوب ترکیبی برای بهینه سازی فرآیند یادگیری تقویتی از طریق استفاده از الگوریتم های فراابتکاری می باشد. در این راستا، یک روش ترکیبی مبتنی بر Q-Learning و الگوریتم ژنتیک ارائه شده است که در آن، پارامترهای کلیدی یادگیری شامل نرخ یادگیری، ضریب تنزیل و نرخ اکتشاف به صورت خودکار بهینه سازی می شوند. ارزیابی تجربی روش پیشنهادی در دو محیط بازی CartPole و Snake انجام شده و عملکرد آن با Q-learning پایه مقایسه گردیده است. نتایج آزمایش ها نشان می دهد که روش پیشنهادی منجر به همگرایی سریع تر، پایداری بیشتر و بهبود قابل توجه کیفیت سیاست یادگیری نسبت به روش پایه می شود. این یافته ها بیانگر آن است که ترکیب یادگیری تقویتی و الگوریتم های فراابتکاری می تواند راهکاری موثر برای ارتقای عملکرد عامل های هوشمند در محیط های بازی کلاسیک باشد.
کلیدواژه ها:
نویسندگان
محمد حسینی فرد
استاد دانشکده مهندسی و مدیریت، دانشگاه پیام نور، مدیر پرداخت الکترونیک بانک پاسارگاد، بوشهر، ایران
آیناز زارع
دانشجوی کارشناسی مهندسی کامپیوتر، دانشگاه پیام نور، بوشهر، ایران
سجاد حقیقت
کارشناسی ارشد مهندسی کامپیوتر، مدیر عامل شرکت قراول دشتستان، بوشهر، ایران