ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 126

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JICTP-3-9_009

تاریخ نمایه سازی: 1 مرداد 1401

چکیده مقاله:

توسعه و استفاده از روش های مختلف هوش مصنوعی برای حل مسائل مختلف، یک زمینه تحقیقاتی وسیع و فعال در عصر جدید فناوری می باشد. مسئله ی تعقیب و گریز به عنوان یک مسئله ی نمونه در بسیاری از تحقیقات جدید مربوط به یادگیری ماشین و هوش مصنوعی استفاده شده است. در شکل خاصی از مسئله ی تعقیب و گریز یعنی مسئله ی دزد و پلیس که موردبررسی این تحقیق است، تعدادی عامل پلیس در تعقیب عامل های دیگر هستند. هدف این تحقیق، آموزش دو عامل هوشمند پلیس با استفاده از شبکه های یادگیری عمیق Q است به نحوی که بتوانند در کمترین زمان ممکن، سارق (عامل فرارکننده) را به موقعیت مشخصی برگردانند. در این تحقیق دو مدل با استفاده از الگوریتم مذکور در دو سناریوی مختلف برای یادگیری از تجربه های عامل های پلیس، ارائه شده و درنهایت عملکرد مدل های پیشنهادی از طریق مقایسه با الگوریتم دقیق جستجوی فراگیر مورد تست و ارزیابی قرار گرفتند. پس از آموزش عامل ها، مشاهده شد که در هر دو سناریو به تدریج میزان هزینه شبکه ها کاهش و میزان پاداش های دریافتی توسط پلیس ها در انتهای آموزش افزایش می یابند و به مقادیر مشخصی همگرا می شوند. در سناریوی اول عامل های پلیس در برگرداندن سارق به موقعیت مشخص، کاملا موفق عمل می کنند و در سناریوی دوم نیز در بیش از ۹۰ درصد محیط های تصادفی، این عمل را با موفقیت انجام می دهند.

کلیدواژه ها:

نویسندگان

علی امینی باغ

سیستم های اطلاعات جغرافیایی، خواجه نصیرالدین طوسی، تهران، ایران

محمدسعدی مسگری

سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران

پویا محمدی کزج

سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران