ترکیب یادگیری تقویتی و الگوریتم ژنتیک برای بهبود عملکرد عامل در بازی های کلاسیک

محمد حسینی فرد; آیناز زارع; سجاد حقیقت

ترکیب یادگیری تقویتی و الگوریتم ژنتیک برای بهبود عملکرد عامل در بازی های کلاسیک

محل انتشار: اولین کنفرانس بین المللی مهندسی کامپیوتر و فناوری های هوش مصنوعی

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 21

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2628348

شناسه ملی سند علمی:

ITCNF01_022

تاریخ نمایه سازی: 21 خرداد 1405

چکیده مقاله:

یادگیری تقویتی یکی از رویکردهای پرکاربرد در حل مسائل تصمیم گیری متوالی است، اما الگوریتم های کلاسیک آن مانند Q-learning با چالش هایی از جمله سرعت همگرایی پایین، حساسیت بالا به تنظیم پارامترها و احتمال گرفتار شدن در بهینه های محلی مواجه هستند. مسئله اصلی این پژوهش، بهبود عملکرد عامل یادگیرنده در بازی های کلاسیک با کاهش این محدودیت ها است. هدف این مطالعه، ارائه یک چارچوب ترکیبی برای بهینه سازی فرآیند یادگیری تقویتی از طریق استفاده از الگوریتم های فراابتکاری می باشد. در این راستا، یک روش ترکیبی مبتنی بر Q-Learning و الگوریتم ژنتیک ارائه شده است که در آن، پارامترهای کلیدی یادگیری شامل نرخ یادگیری، ضریب تنزیل و نرخ اکتشاف به صورت خودکار بهینه سازی می شوند. ارزیابی تجربی روش پیشنهادی در دو محیط بازی CartPole و Snake انجام شده و عملکرد آن با Q-learning پایه مقایسه گردیده است. نتایج آزمایش ها نشان می دهد که روش پیشنهادی منجر به همگرایی سریع تر، پایداری بیشتر و بهبود قابل توجه کیفیت سیاست یادگیری نسبت به روش پایه می شود. این یافته ها بیانگر آن است که ترکیب یادگیری تقویتی و الگوریتم های فراابتکاری می تواند راهکاری موثر برای ارتقای عملکرد عامل های هوشمند در محیط های بازی کلاسیک باشد.

کلیدواژه ها:

الگوریتم ژنتیک ، بازی های کلاسیک ، بهینه سازی ، یادگیری تقویتی ، هوش مصنوعی

نویسندگان

محمد حسینی فرد

استاد دانشکده مهندسی و مدیریت، دانشگاه پیام نور، مدیر پرداخت الکترونیک بانک پاسارگاد، بوشهر، ایران

آیناز زارع

دانشجوی کارشناسی مهندسی کامپیوتر، دانشگاه پیام نور، بوشهر، ایران

سجاد حقیقت

کارشناسی ارشد مهندسی کامپیوتر، مدیر عامل شرکت قراول دشتستان، بوشهر، ایران