دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده
- سال انتشار: 1399
- محل انتشار: دوفصلنامه محاسبات و سامانه های توزیع شده، دوره: 3، شماره: 2
- کد COI اختصاصی: JR_IJDCS-3-2_002
- زبان مقاله: فارسی
- تعداد مشاهده: 124
نویسندگان
چکیده
امروزه معمای زندانی یکی از مسائل اولیه و مهم در نظریه بازی ها است. در این معما نقطه تعادل نشی وجود دارد و چنانچه عامل ها منطقی رفتار کنند در آن نقطه بازی می کنند؛ بدین منظور عامل ها برای دستیابی به سود بیشتر از بین دو عمل همکاری و عدم همکاری، عدم همکاری را انتخاب می کنند. در حالیکه برای عامل ها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. بنابراین، در جهت افزایش میزان همکاری عامل ها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفته شده است. نتایج مقاله نشان دهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عامل ها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب می کند و بالعکس.کلیدواژه ها
عدم همکاری متقابل, معمای زندانی تکرارشونده, یادگیری تقویتی, همکاری متقابل, LSTMاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.