بکارگیری آموزش تقویتی گسسته در فضای پیوسته با استفاده از ایده گسسته سازی تطبیقی

فاطمه آخوندی; الهه خانی; ولی درهمی

بکارگیری آموزش تقویتی گسسته در فضای پیوسته با استفاده از ایده گسسته سازی تطبیقی

محل انتشار: پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران

سال انتشار: 1388

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,620

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/79086

شناسه ملی سند علمی:

CSICC15_153

تاریخ نمایه سازی: 26 مهر 1388

چکیده مقاله:

از آنجا که فضای حالت و عمل در آموزش تقویتی استانداردگسسته است، در بکارگیری آموزش تقویتی در مسائل با فضای حالت وعمل پیوسته لازم است که فضای حالت و عمل گسسته سازی شو ند.گسسته سازی نرم منجر به افزایش ابعاد فضای حالت و مشکلات منتجه از آن همچون کندی سرعت آموزش و تنگنای ابعاد می شود . در این مقاله یک راهکار جدید به نام گسسته سازی تطبیقی بر روی فضای عمل در آموزش تقویتی ارائه می شود. ایده مطرح شده از گسسته سازی با فواصل کوچک در کل فضا که منجر به افزایش سایز مجموعه عملها می گردد جلوگیری کرده و با کاوش های متوالی، دامنه مناسب برای گسسته سازی را می یابد. گسسته ساز یهای هوشمند و پی در پی ضمن جلوگیری از افزایش تعداد مجموعه عملها، منجر به یافتن مقدار بهینه عمل در هر حالت می شو د. لذا ضمن ثابت ماندن تعداد عملها درهرحالت، یک مقدار نزدیک به بهینه برای هرحالت پیدا می شود . ایده ارائه شده در الگوریتم آموزش کیو (Q_learning) در دو محیط قطعی و تصادفی بکار رفته و مورد تحلیل قرار می گیرد.

کلیدواژه ها:

آموزش تقویتی ، گسسته سازی تطبیقی ، آموزش کیو

نویسندگان

فاطمه آخوندی

دانشکده مهندسی برق و کامپیوتر دانشگاه یزد

الهه خانی

دانشکده مهندسی برق و کامپیوتر دانشگاه یزد

ولی درهمی

دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

ادرهمی ولی، جوهری مجد وحید، نیلی احمدآبادی مجید، بهبود آموزش ...
Sutton, R. S., Barto, A. G., _ Reinforcement Learning: An ...
Ten Hagen S., Krose B ., Q-Learning for systems with ...
Gaskett C., Wettergreen D., Zelinsky A., ; Advanced Topics in ...
Millan Jose Del R., Posenato D., Dedieu E., " Continuou ...
L. Jouffe, "Fuzzy inference system learning by reinforcemen methods", IEEE ...

نمایش کامل مراجع