کاربرد یادگیری تقویتی برخط بمنظور توسعه خودکار منطق خودتطبیقی در سیستم های اطلاعاتی خود تطبیق

کاظم نیک فرجام

کاربرد یادگیری تقویتی برخط بمنظور توسعه خودکار منطق خودتطبیقی در سیستم های اطلاعاتی خود تطبیق

محل انتشار: پنجمین همایش ملی مهندسی کامپیوتر و نرم افزار

سال انتشار: 1402

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 192

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2107002

شناسه ملی سند علمی:

ICRCC05_005

تاریخ نمایه سازی: 10 آبان 1403

چکیده مقاله:

سیستم های خودتطبیق، قادرند با وجود تغییرات در محیط های پویا نیازمندی های کیفیشان را حفظ کنند. برای توسعه این سیستم ها،مهندسان باید بتوانند منطق خودتطبیقی که زمان و نحوه تطبیق سیست را به شکل مناستبی بیان نماید، ایجاد کنند. توسعه منطقخودتطبیق سیست ، به دلیل عدم قطعیت ها در زمان طراحی، دشوار است زیرا نمی توانی تمام تغییرات محیطی بالقوه را پیش بینیکنیم. یادگیری تقویتی برخط با یاد گرفتن اثربخشی عملیات تطبیق از طریق تعامل سیست با محیط در زمان اجرا، مشکل عدم قطعیتزمان طراحی را برطرف می کند، و می تواند توسعه منطق خودتطبیقی را بطور خودکار درآورد. روشهای یادگیری تقویتی برخط موجود برایتوسعه سیستم های خودتطبیق، دو نقص دارند که درجه خودکارسازی را محدود می کند:۱ - نیازمند تنظی دقیق نرخ اکتشاف بصورت دستی هستند و ۲ - ممکن است برای تقویت مقیاس پذیری نیاز به کمی سازی حالت هایمحیطی به صورت دستی داشته باشد. در این مقاله رویکردی را برای خودکارسازی فعالیت های دستی فوق الذکر با استفاده از یادگیریتقویتی مبتنی بر سیاست، به عنوان نوع متفاوتی از یادگیری تقویتی معرفی می کنیم. امکان سنجی و کاربرد رویکرد را در توسعه منطقیک سیستم اطلاعاتی خودتطبیق نشان می دهیم.

کلیدواژه ها:

منطق خود تطبیق ، یادگیری تقویتی برخط ، عدم قطعیت ، سیستم خودتطبیق

نویسندگان

کاظم نیک فرجام

دانشگاه آزاد اسلامی- واحد بیرجند