طراحی سازوکار تدارکات براساس یادگیری Q و با سیاست انتخاب عمل مبتنی بر الگوریتم ازدحام ذرات

زهره کاهه; رضا برادران کاظم زاده

طراحی سازوکار تدارکات براساس یادگیری Q و با سیاست انتخاب عمل مبتنی بر الگوریتم ازدحام ذرات

محل انتشار: فصلنامه مدیریت زنجیره تامین، دوره: 18، شماره: 51

سال انتشار: 1395

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 546

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/980955

شناسه ملی سند علمی:

JR_SCMJ-18-51_004

تاریخ نمایه سازی: 2 بهمن 1398

چکیده مقاله:

در این مقاله، مسئله مناقصه در یک شرکت خودروسازی برای تدارک قطعات مورد نیاز از تامین کنندگان بالقوه از طریق الگوریتم یادگیری Q حل شده است. در این مسئله، خریدار با توجه به پیشنهادات دریافتی از تامین کنندگان بالقوه که شامل قیمت و زمان تحویل پیشنهادی است، سفارش قطعات مورد نیاز خود را به تامین کنندگان تخصیص می دهد. هدف خریدار کمینه سازی هزینه های تدارکات از طریق یادگیری از مناقصات پیشین است. این مسئله به صورت یک مسئله تصمیم گیری مارکوفی تعریف شده است که در آن هر عمل وابسته به عمل و وضعیت قبلی است. برای حل این مسئله یک الگوریتم یادگیری تقویتی به نام الگوریتم یادگیری Q توسعه داده شده است که در آن از الگوریتم بهینهسازی ازدحام ذرات به عنوان راهکاری برای یافتن و انتخاب سیاست بهینه برای انتخاب عمل در الگوریتم یادگیری Q استفاده شده است. در مقایسه این الگوریتم با حالتی که در آن سیاست انتخاب عمل مطابق با یک الگوریتم حریصانه است، این الگوریتم بسیار کارآمدتر است.

کلیدواژه ها:

تدارکات ، یادگیری تقویتی ، الگوریتم یادگیری Q ، سیاست انتخاب عمل

نویسندگان

زهره کاهه

دانشگاه تربیت مدرس

رضا برادران کاظم زاده

دانشگاه تربیت مدرس

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Chopra, Sunil, and Peter Meindl. , Supply chain management . ...
Bichler,M. and Kalagnanam,J., A nonoparametric estimator for setting: reserve prices ...
Chen, S.L. and M.M. Tseng., A Negotiation-Credit-Auction Mechanism for Procuring ...
Padgham, Lin, and Michael Winikoff., Developing intelligent agent systems: A ...
Beam, C., and Segev, A., Automated negotiations: A survey of ...
Sutton, R.S., editor., Reinforcement Learnng . Kluwer Academic Press, Boston, ...
Chaharsooghi, S. K., J. Heydari, et al., A reinforcement learning ...
Li, X., Wang, J., & Sawhney, R., Reinforcement learning for ...
Iima, H., Kuroe, Y., Swarm Reinforcement Learning Algorithm Based on ...
Giannoccaro, I. and P. Pontrandolfo., Inventory management in supply chains: ...
Tang, H., Xu, L., Sun, J., Chen, Y., & Zhou, ...
Fu, J., & Fu, Y., An adaptive multi-agent system for ...
Mortazavi, A., Khamseh, A. A., & Azimi, P., Designing of ...
Russell,S and Peter Norvig., Artficial Intelligence: A Modern Approach . ...
Sutton, R.S., Barto, A.G., Reinforcement Learning . MIT Press, Cambridge,1998. ...
Watkins, C. J. C. H., Learning from delayed rewards (Doctoral ...
Tsitsiklis, J. N., Asynchronous stochastic approximation and Q-learning . Machine ...
Kennedy, J., Eberhart, R.C., Swarm Intelligence . Morgan Kaufmann Publishers, ...
Talbi,E., Metaheuristics: From Design to Implementation . ISBN: 978-0-470-27858-1, 2009. ...
Abdulhai, B., Pringle, R. and Karakoulas, G.J., Reinforcement learning for ...

نمایش کامل مراجع