بهبود PSO با رویکرد یادگیری تقویتی آشوبی

  • سال انتشار: 1393
  • محل انتشار: همایش ملی علوم و مهندسی کامپیوتر با محوریت امنیت ملی و توسعه پایدار
  • کد COI اختصاصی: COMPUTER01_082
  • زبان مقاله: فارسی
  • تعداد مشاهده: 876
دانلود فایل این مقاله

نویسندگان

مرضیه یوسفی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران

سیدمحمدحسین معطر

استادیار دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر- نرم افزار، مشهد، ایران

چکیده

الگوریتم های تکاملی برای حل مسائل بهینه سازی پویا، استفاده می شود. یکی از الگوریتم های تکاملی PSO می باشد که عیب آن این است که برای حل مسائل پیچیده چند وجهی به راحتی در بهینه محلی می افتد. برای حل مسئله سراغ یادگیری تقویتی رفتیم. یکی از ویژگیهای مهم روش های یادگیری تقویتی این است که برخلاف بیشتر روش های یادگیری در این روش به عامل یادگیرنده گفته نمی شود که در هر موقعیتی کنش بهینه کدام کنش بوده است. در عوض این وظیفه عامل است که با تجربه کردن کنش های مختلف تشخیص دهد که کدامیک منجر به پاداش بیشتری می شوند و کنش بهتری هستند. در روش پیشنهادی جهت بهبود PSO ابتدا آنرا آشوبی کرده و سپس از الگوریتم Q-learning استفاده شده است. از آشوب جهت بهبود در سرعت همگرایی الگوریتم استفاده شده است. نتایج با الگوریتم PSO معمولی و الگوریتم PSO آشوبی (CPSO) مقایسه شده است که نشان دهنده برتری الگوریتم پیشنهادی می باشد. جهت ارزیابی از تعدادی تابع محک استفاده شده است.

کلیدواژه ها

آشوب، الگوریتم Q-learning، الگوریتم ازدحام ذرات (PSO)، بهینه سازی سراسری، تفاضل زمانی، یادگیری تقویتی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.