تحلیل یادگیری تقویتی در فرایندهای مارکوف به صورت سیستمهای دیجیتال
- سال انتشار: 1387
- محل انتشار: دومین کنگره مشترک سیستمهای فازی و هوشمند ایران
- کد COI اختصاصی: FJCFIS02_318
- زبان مقاله: فارسی
- تعداد مشاهده: 1982
نویسندگان
دانشجوی کارشناسی ارشد مهندسی کنترل
استادیاردانشگاه فردوسی مشهد
استادیار دانشگاه فردوسی مشهد
چکیده
فرایند تصمیمگیری مارکوف یاMDPیکی از مسائلی است که دارای کاربردهای وسیعی در زمینههای مختلف علمی، مهندسی،اقتصادی و مدیریت است. بسیاری از فرایندهای تصمیمگیری دارای خاصیت مارکوف میباشند و به صورت یک مسألهی تصمیمگیری مارکوف قابل بیان هستند. یادگیری تقویتی یکی از مسائلی است که برای حلMDPبه کار میرود، که به نوبهی خود از برنامهریزی پویا یاDPاستفاده میکند. در این مقاله معادلهی بازگشتی مورد استفاده در بحث یادگیری تقویتی وDPبرای حلMDP به صورت یک معادلهی دینامیکی یک سیستم دیجیتال یا گسسته-زمان بازنویسی شده است. به این ترتیب این امکان به وجود آمده است که بتوان با بهرهگیری از روشهای موجود در کنترل دیجیتال، به بررسی خواص معادلات به دست آمده پرداخت و تحلیل مناسبی از رفتار عاملیادگیرنده، تحت سیاستهای مختلف، به عمل آورد. به عنوان مثال، روش مذکور برای تحلیل یک مسألهی جدولی استفاده شده است. نتایج به دست آمده، نشان میدهند که یک سیاست بهینه در پارچوب کنترل دیجیتال، به صورت سیستم مرده نَوِشقابل توصیف استکلیدواژه ها
برنامهریزی پویا، سیستمهای کنترل دیجیتال، فرایندهای تصمیمگیری مارکوف، کنترل تصادفی، یادگیری تقویتیمقالات مرتبط جدید
- ترکیب شبکه های کانولوشنی و ترنسفورمرها برای طبقه بندی مقاوم بیماری های قلبی: یک مرور جامع
- نقش میانجی قابلیت های مهندسی مجدد زنجیره تامین بر رابطه مدیریت ریسک و چابکی زنجیره تامین
- چهارچوبی مبتنی بر الگوریتم ژنتیک به منظور بهینه سازی شبکه های LSTM در یادگیری عمیق برای پیش بینی سری های زمانی پیچیده
- A Probabilistic Solution Discovery Algorithm for detour-to-recharge behavior in the green vehicle routing problem under pollution control policies
- Predicting Heart Health with Advanced Neural Networks
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.