مسیریابی حمل بار با استفاده از یادگیری تقویتی
محل انتشار: هفتمین همایش بین المللی مدیریت و ایمنی ترافیک
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 57
فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICOTSM07_112
تاریخ نمایه سازی: 25 خرداد 1405
چکیده مقاله:
پژوهش حاضر به بررسی مسیریابی وسیله حمل بار با استفاده از الگوریتم Q-learning در شبکه های فرضی و واقعی می پردازد. در این مطالعه، مسیریابی از یک مبدا به مقاصد متعدد و بازگشت به مبدا اولیه به طور بهینه مدل سازی می شود. در این راستا، تاثیر پارامترهای نرخ اکتشاف و تعداد تکرار مورد نیاز برای آموزش عامل در الگوریتم Q-learning بر عملکرد مسیریابی، بررسی می شود. شبکه های مختلف فرضی با گریدهای ۳ در ۳، ۴ در ۴ و ۵ در ۵ با تعداد مقاصد متغیر (۱ تا ۵ مقصد) برای شبیه سازی در نظر گرفته می شوند. نتایج نشان می دهد که با افزایش نرخ اکتشاف از ۰/۱ به ۰/۳، کارایی مدل بهبود یافته و تعداد تکرارهای مورد نیاز برای آموزش عامل کاهش می یابد، به طوری که در شبکه های فرضی ۴ در ۴ و ۵ در ۵ تعداد تکرارهای لازم برای آموزش به میزان چشمگیری کاهش می یابد. در حالی که افزایش نرخ اکتشاف بیش از ۰/۳ به تعداد تکرار بیشتر برای آموزش عامل منجر می شود. از سوی دیگر، در شبکه های واقعی همچون شبکه شهر سوفالز با ۲۴ گره، این نتایج کمی متفاوت است و افزایش پیچیدگی مساله، به طور کلی نیازمند تعداد تکرار بیشتر برای آموزش عامل می شود. در این شبکه، به ازای هر ۱۰۰ واحد افزایش پیچیدگی مساله، تعداد حداقل تکرار مورد نیاز برای آموزش عامل، ۲۰ واحد افزایش می یابد (۲۵ درصد بیشتر از شبکه های فرضی). همچنین، نرخ بهینه اکتشاف برای شبکه سوفالز برابر با ۰/۳ تعیین می گردد که بهترین عملکرد را در آموزش عامل در بین سایر نرخ های اکتشاف را نشان می دهد. این پژوهش می تواند راهگشای استفاده از الگوریتم های یادگیری تقویتی در مسیریابی وسایل حمل بار در شرایط واقعی به منظور کاهش زمان سفر و هزینه های حمل باشد.
کلیدواژه ها:
نویسندگان
امیررضا مهدوی
دانشجوی دکتری برنامه ریزی حمل و نقل، دانشکده مهندسی عمران و محیط زیست، دانشگاه تربیت مدرس، تهران، ایران
سیداحسان سیدابریشمی
دانشیار، گروه راه و ترابری، دانشکده مهندسی عمران و محیط زیست، دانشگاه تربیت مدرس، تهران، ایران
محمود صفارزاده
استاد، گروه برنامه ریزی حمل و نقل، دانشکده مهندسی عمران و محیط زیست، دانشگاه تربیت مدرس، تهران، ایران