بهبود الگوریتم های پیگیری با معرفی دو الگوریتم جدید

سال انتشار: 1391
محل انتشار: دومین کنفرانس ملی مهندسی نرم افزار دانشگاه آزاد لاهیجان
کد COI اختصاصی: LNCSE02_217
زبان مقاله: فارسی
تعداد مشاهده: 980

دانلود فایل این مقاله

نویسندگان

فرهاد عابدینی

دانشگاه آزاد اسلامی واحد رودسرواملش رودسر

فریبرز محمودی

دانشگاه آزاد قزوین

سعید یوسفخواه کلدره

دانشگاه آزاد رودسرواملش رودسر

چکیده

الگوریتم های پیگیری زیرمجموعه الگوریتم های تخمین زننده ای هستند که خود ازجمله سریعترین الگوریتم های اتوماتای یادگیرند الگوریتم های پیگیری اولیه (DP_RI DP_RP CP_RI CP_RP) از دودیدگاه پیوسته وگسسته برای انتخاب اقدام بهینه جاری استفاده می کنند که الگوی یادگیری آنها الگوی پاداش - جریمه و یا پاداش - سکون است الگوریتم هایی که بعدا معرفی شدند دو الگوریتم پیوسته و گسسته تعمیم یافته اند DGPA GPA) که بجای پیگیری فقط اقدام انتخاب شده بهینه جاری تمام اقدامهایی را که تخمین پاداششان بیشتر ازاقدام انتخاب شده بهینه جاری است را پیگیری می نمایند اما این الگوریتم ها تاکنون فقط براساس الگوی یادگیری پاداش - جریمه بررسی شده اند.

کلیدواژه ها

اتوماتای یادگیر، الگوریتم های پیگیری، الگوی یادگیری

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.