ناشر تخصصی کنفرانس های ایران

لطفا کمی صبر نمایید

Publisher of Iranian Journals and Conference Proceedings

Please waite ..
ناشر تخصصی کنفرانسهای ایران
ورود |عضویت رایگان |راهنمای سایت |عضویت کتابخانه ها
عنوان
مقاله

بهبود روش یادگیری تقویتی Q-Learning برای محیط های غیرقطعی با به کارگیری اتاماتای یادگیر

سال انتشار: 1399
کد COI مقاله: ITCT09_045
زبان مقاله: فارسیمشاهده این مقاله: 254
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

خرید و دانلود فایل مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای 11 صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله بهبود روش یادگیری تقویتی Q-Learning برای محیط های غیرقطعی با به کارگیری اتاماتای یادگیر

اسماعیل رضایی - استادیار، دانشگاه صنعتی بیرجند

چکیده مقاله:

روش یادگیری Q ، یک روش یادگیری تقویتی در محیط های قطعی است. قطعیت در پاداش و تابع انتقال حالات از فرضیات الگوریتم یادگیری Q است. در یک محیط غیرقطعی نتیجه ی عمل یک عامل مشخص نیست. بنابراین، مقادیر Q معیار مناسبی برای انتخاب عمل بهینه نمی باشد. استفاده از این روش درمحیط های غیر قطعی نیازمند دانشی پیرامون عدم قطعیت محیط است. آتاماتای یادگیر یک مدل یادگیری تقویتی است، که ویژگی تصمیم گیری در محیط های نویزی و ناشناخته را دارد. در این مقاله یک مدل ترکیبی با استفاده از آتاماتای یادگیر، برای یادگیری در محیط های غیر قطعی، ارائه شده است. در این مدل، با استفاده از آتاماتای یادگیر میزان عدم قطعیت در تعامل با محیط ارزیابی شده و در روش یادگیری Q برای انجام تصمیم گیری درخصوص انتخاب عمل بهینه از آن استفاده شده است. نتایج آزمایشات، بهبود کارایی الگوریتم یادگیری Q با استفاده از دانش ارائه شده توسط آتاماتای یادگیر را نشان داده است.

کلیدواژه ها:

یادگیری تقویتی، روش یادگیری Q ، عدم قطعیت، آتاماتای یادگیر، انتخاب عمل.

کد مقاله/لینک ثابت به این مقاله

کد یکتای اختصاصی (COI) این مقاله در پایگاه سیویلیکا ITCT09_045 میباشد و برای لینک دهی به این مقاله می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:

https://civilica.com/doc/1121591/

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
رضایی، اسماعیل،1399،بهبود روش یادگیری تقویتی Q-Learning برای محیط های غیرقطعی با به کارگیری اتاماتای یادگیر،نهمین کنفرانس بین المللی فناوری اطلاعات،کامپیوتر و مخابرات،https://civilica.com/doc/1121591

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1399، رضایی، اسماعیل؛ )
برای بار دوم به بعد: (1399، رضایی؛ )
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مدیریت اطلاعات پژوهشی

صدور گواهی نمایه سازی | گزارش اشکال مقاله | من نویسنده این مقاله هستم

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
نوع مرکز: دانشگاه دولتی
تعداد مقالات: 632
در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.

پشتیبانی