ارائه الگوریتمی جهت تسریع روش تکرار سیاست در راستی آزمایی فرآیندهای تصمیم مارکوف با استفاده از یادگیری ماشین

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 150

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SCJKA-11-2_010

تاریخ نمایه سازی: 29 آبان 1403

چکیده مقاله:

فرآیندهای تصمیم مارکوف در هوش مصنوعی و راستی آزمایی رسمی برای مدل سازی سیستم های کامپیوتری که دارای رفتارهای تصادفی و غیرقطعی هستند، استفاده می شوند. دو دسته مهم از ویژگی هایی که در وارسی مدل احتمالاتی استفاده می شوند شامل احتمال بهینه رسیدن به حالت هدف و پاداش انباشته شده مورد انتظار هستند. تکرار مقدار و تکرار سیاست دو روش عددی تکراری شناخته شده برای تقریب مقادیر بهینه هستند. چالش اصلی این روش ها زمان اجرایی بالای آنها است. در این مقاله روشی جدید برای تسریع همگرایی به سیاست بهینه ارائه می شود که زمان اجرایی روش تکرار سیاست را کاهش می دهد. این روش بر پایه استفاده از یادگیری ماشین برای تخمین یک سیاست نزدیک به بهینه است. برای هر کلاس از مدل های فرآیند تصمیم مارکوف، تعدادی مدل کوچک را برای مرحله آموزش و ساخت دسته بند در نظر می گیریم. دسته بند ساخته شده در فرآیند یادگیری، برای پیش بینی کنش بهینه هر حالت فرآیند تصمیم مارکوف داده شده به کار می رود. این دسته بند همچنین برای پیشنهاد یک سیاست نزدیک به بهینه برای فرآیندهای تصمیم مارکوف بزرگ از همان دسته مدل ها، استفاده می شود تا زمان مصرفی کل را کاهش دهد. پیاده سازی روش ارائه شده در وارسی گر مدل PRISM نشان می دهد زمان اجرا به طور میانگین ۵۰ درصد کاهش می یابد.

نویسندگان

محمدصادق محققی

گروه علوم کامپیوتر، دانشکده علوم ریاضی، دانشگاه ولیعصر رفسنجان، رفسنجان، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • C. Baier, J.P. Katoen, Principles of model checking, MIT Press, ...
  • V. Forejt, M. Kwiatkowska, G. Norman, and D. Parker, “Automated ...
  • J.-P. Katoen, “The Probabilistic Model Checking Landscape,” in ۳۱st Ann. ...
  • C. Hensel, S. Junges, J.P. Katoen, T. Quatmann, and M. ...
  • M. Kwiatkowska, G. Norman, and D. Parker, “PRISM ۴.۰: Verification ...
  • T.P. Gros, H. Hermanns, J. Hoffmann, M. Klauck, and M. ...
  • C. Baier, J. Klein, L. Leuschner, D. Parker, and S. ...
  • C. Baier, P.R. D’Argenio, and H. Hermanns, “On the probabilistic ...
  • T. Brazdil, C. Krishnendu, C. Martin, F. Vojtech, J. Kret?nsky, ...
  • L. Gui, J. Sun, S. Song, Y. Liu, and J.S. ...
  • S. Najafi and S. Noferesti, “Determining dynamic time quantum in ...
  • H. Veisi, H.R. Ghaedsharaf, and M. Ebrahimi, “Improving the Performance ...
  • R. Bouchekir and M.C. Boukala, “Toward Implicit Learning for the ...
  • S. Oleksandr and C.-G. Lee, “Accelerated modified policy iteration algorithms ...
  • A. Rataj and B. Wona-Szczeniak, “Extrapolation of an Optimal Policy ...
  • M. Mohagheghi and K. Salehi, “Machine Learning and Disk-based Methods ...
  • M. Mohagheghi, J. Karimpour, and A. Isazadeh, “Improving Modified Policy ...
  • M. Mohagheghi, J. Karimpour, and A. Isazadeh, “Prioritizing methods to ...
  • J. Karimpour, A. Isazadeh, M. Mohagheghi, and K. Salehi, “Improved ...
  • M. Kwiatkowska, D. Parker, and H. Qu, “Incremental quantitative verification ...
  • A. Hartmanns, M. Klauck, D. Parker, T. Quatmann, and E. ...
  • F. Ciesinski, C. Baier, M. Grober, and J. Klein, “Reduction ...
  • T. Salehi, M. Maadani, and M, Mahdavi, “Delay reduction based ...
  • R. Sadeghian, “Determining the equilibrium solution in two-player dynamic discrete ...
  • نمایش کامل مراجع