ارایه یک روش یادگیری جدید مبتنی بر یادگیری- Q برای فضاهای پیوسته
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 779
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
UTCONF01_138
تاریخ نمایه سازی: 19 خرداد 1396
چکیده مقاله:
در این مقاله یک روش یادگیری مبتنی بر یادگیری- Q برای استفاده در فضاهای حالت و عمل پیوسته ارایه شدهاست. به جای ماتریس Q در روش یادگیری Q که فضای حالت (سطرهای ماتریس) را به فضای عمل (ستون هایماتریس) نگاشت می کند و فقط می تواند در یک فضای پیوسته این کار را انجام دهد، از یک شبکه ی عصبیاستفاده شده است و به جای الگوریتم یادگیری که مقادیر ماتریس Q را مشخص می کند، از الگوریتم بهینه سازیژنتیک استفاده شده است تا بتوان در فضاهای حالت و عمل پیوسته کار کرد. الگوریتم ژنتیک وظیفه ی محاسبه یوزن های شبکه عصبی را با توجه به پاداش دریافتی از محیط برعهده دارد. الگوریتم ارایه شده در مدل چندعاملیبرای یک شبکه ی مخابراتی به کار گرفته شده است. نتایج بدست آمده از شبیه سازی مساله در متلب، کاهش تعدادپکت های گمشده و درنتیجه افزایش بازدهی شبکه را نشان می دهد.
کلیدواژه ها:
نویسندگان
الهه مرجانی
دانشجوی کارشناسی ارشد، موسسه آموزش عالی غیرانتفاعی پیام گلپایگان
ابوالقاسم دایی چیان
استادیار، دانشکده برق، موسسه آموزش عالی غیرانتفاعی پیام گلپایگان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :