مقایسه الگوریتم های یادگیری تقویتی در برنامه ریزی تولید مبتنی بر عامل

سال انتشار: 1389
محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
کد COI اختصاصی: NCSCIT01_012
زبان مقاله: فارسی
تعداد مشاهده: 3365

دانلود فایل این مقاله

نویسندگان

مهدی صادق زاده

گروه کامپیوتر - دانشگاه آزاد اسلامی واحد ماهشهر

محمد گلشاهی

گروه کامپیوتر - دانشگاه آزاد اسلامی واحد دزفولی

حسین فرضعلی وند

گروه کامپیوتر - دانشگاه آزاد اسلامی واحد ایذه

چکیده

در سال های اخیر , یادگیری تقویتی برای محققان مبتنی بر عامل , مورد توجه قرار گرفته است , زیرا این موضوع با این مطلب در ارتباط است که چگونه یک عامل خود مختار می تواند برای انتخاب عملیات درست جهت بدست آوردن اهدافش از طریق اثر بر روی محیطش یاد بگیرد .اگر چه مثالهایی وجود دارد که سودمندی یادگیری تقویتی را توضیح می دهندع امام کاربردش در سیستمهای تولیدی هنوز کاملاً کشف نشده است.در این مقاله ما بیشتر بر روی طرز کار الگوریتم های یادگیری تقویتی متمرکز شده ایم و دو نوع ار الگوریتم یادگیری تقویتی را در این مقاله به کاربرده ایم. در این مقاله , Q-Learning و SARSA دو الگوریتم معروف یادگیری تقویتی هستند که در یک ماشین منفرد انتخاب قانون اعزام مسئله بکار رفته اند تا توانایی های این دو الگوریتم را در مسائل برنامه ریزی تولید میتنی بر عامل مورد بررسی قرار دهیم و نشان دهیم که کدامیک با اموزش سریع اما راه حل نامطمئن و کدامیک با آموزش دراز مدت اما راه حل مطمئن جواب مسئله را کشف می کنند. این مقاله ، نتایج خوبی را فراهم می کند که نشان دهنده قدرت الگوریتم های یادگیری تقویتی برای حل مسائل مختلف است.

کلیدواژه ها

یادگیری تویتی ع الگوریتم Q-Learning , الگوریتم SARSA

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.