ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند

علی, امینی باغ; محمدسعدی, مسگری; پویا, محمدی کزج

ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند

عنوان مقاله: ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند
شناسه ملی مقاله: JR_JICTP-3-9_009
منتشر شده در در سال 1401

مشخصات نویسندگان مقاله:

علی امینی باغ - سیستم های اطلاعات جغرافیایی، خواجه نصیرالدین طوسی، تهران، ایران
محمدسعدی مسگری - سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران
پویا محمدی کزج - سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران

خلاصه مقاله:

توسعه و استفاده از روش های مختلف هوش مصنوعی برای حل مسائل مختلف، یک زمینه تحقیقاتی وسیع و فعال در عصر جدید فناوری می باشد. مسئله ی تعقیب و گریز به عنوان یک مسئله ی نمونه در بسیاری از تحقیقات جدید مربوط به یادگیری ماشین و هوش مصنوعی استفاده شده است. در شکل خاصی از مسئله ی تعقیب و گریز یعنی مسئله ی دزد و پلیس که موردبررسی این تحقیق است، تعدادی عامل پلیس در تعقیب عامل های دیگر هستند. هدف این تحقیق، آموزش دو عامل هوشمند پلیس با استفاده از شبکه های یادگیری عمیق Q است به نحوی که بتوانند در کمترین زمان ممکن، سارق (عامل فرارکننده) را به موقعیت مشخصی برگردانند. در این تحقیق دو مدل با استفاده از الگوریتم مذکور در دو سناریوی مختلف برای یادگیری از تجربه های عامل های پلیس، ارائه شده و درنهایت عملکرد مدل های پیشنهادی از طریق مقایسه با الگوریتم دقیق جستجوی فراگیر مورد تست و ارزیابی قرار گرفتند. پس از آموزش عامل ها، مشاهده شد که در هر دو سناریو به تدریج میزان هزینه شبکه ها کاهش و میزان پاداش های دریافتی توسط پلیس ها در انتهای آموزش افزایش می یابند و به مقادیر مشخصی همگرا می شوند. در سناریوی اول عامل های پلیس در برگرداندن سارق به موقعیت مشخص، کاملا موفق عمل می کنند و در سناریوی دوم نیز در بیش از ۹۰ درصد محیط های تصادفی، این عمل را با موفقیت انجام می دهند.

کلمات کلیدی:

هوش مصنوعی, مسئله ی تعقیب و گریز, پلیس هوشمند, یادگیری عمیق Q, یادگیری ماشین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1487800/