بهینه سازی تخصیص بار آلودگی با استفاده از روشهای یادگیری تقویتی

بهزاد, شریف; سیدجمشید, موسوی

بهینه سازی تخصیص بار آلودگی با استفاده از روشهای یادگیری تقویتی

عنوان مقاله: بهینه سازی تخصیص بار آلودگی با استفاده از روشهای یادگیری تقویتی
شناسه ملی مقاله: WRM02_073
منتشر شده در دومین کنفرانس مدیریت منابع آب در سال 1385

مشخصات نویسندگان مقاله:

بهزاد شریف - دانشجوی کارشناسی ارشد عمران - محیط زیست دانشگاه علم و صنعت ایران
سیدجمشید موسوی - دانشیار دانشکده مهندسی عمران دانشگاه صنعتی امیرکبیر

خلاصه مقاله:

استفاده از برنامه ریزی پویای استوکستیک (SDP) در مدلهای بهینه سازی بزرگ مقیاس منابع آب به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم و در نتیجه بروز مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یکی از تکنیکهای پیشرفته مبتنی بر شبیه سازی در حل مسائل تصمیم گیری متوالی در محیط استوکستیک است. در این مقاله، مساله بهینه سازی تخصیص بار آلاینده در رودخانه با استفاده از RL حل شده و کارایی روش با مدل SPD مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL درنیل به جواب بهینه مساله تحت بررسی و سرعت بالاتر آن در مقایسه با روش SDP است.

کلمات کلیدی:

یادگیری تقویتی ، برنامه ریزی پویای استوکستیک ، تخصیص بار آلودگی در رودخانه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/13337/