بررسی روش های یادگیری ماشین جهت پیش بینی غلظت آلاینده ۱۰PM در شهر قم

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 150

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CANPM11_021

تاریخ نمایه سازی: 23 مهر 1404

چکیده مقاله:

در طول چند دهه گذشته، آلودگی هوا در مناطق مختلف جهان، به یک نگرانی جدی جهانی تبدیل شده است. به طوری که پایش و ارزیابی مداوم سطح آلاینده های هوا، ازجمله ذرات معلق موجود در جو (PM)، همراه با اجرای استانداردها و استراتژی های عملی برای کاهش آلودگی هوا ضروری می باشد. ذرات ریز معلق موجود جو اثرات نامطلوبی بر سلامت انسان دارند که می توان از طریق شبیه سازی و پیش بینی غلظت آن ها و همچنین افزایش آگاهی در مورد شرایط کیفیت هوا در مناطق شهری اثرات آ ن ها را کاهش داد. در همین راستا هدف از این مطالعه بررسی کارایی روش های مختلف یادگیری ماشین برای پیش بینی غلظت ذرات معلق ۱۰PM در شهر قم می باشد. بدین منظور از ۴ گروه داده در شهر قم طی دوره آماری ۲۰۲۴-۲۰۱۷ در مقیاس روزانه شامل: ۱-داده های ایستگاه های همدیدی هواشناسی شامل ایستگاه های شکوهیه، مرکز تحقیقات و نیروگاه حرارتی، ۲- داده های سنجش ازدور شامل دمای سطح زمین و شاخص NDVI، عمق نوری ذرات (AOD) در محدوده طول موج ۵۵۰ نانومتر حاصل از تولیدات سنجنده مادیس، ۳- داده های باز تحلیل پایگاه داده ERA۵ شامل رطوبت خاک (بیشینه، کمینه و متوسط) و ارتفاع لایه مرزی (بیشینه، کمینه و متوسط)، ۴- نقشه های بافت خاک، ساختمان خاک و مدل رقومی ارتفاع (DEM) به عنوان متغیرهای پیش بینی دهنده استفاده شد. و داده های مربوط به غلظت آلاینده ۱۰PM در چهار ایستگاه پایش آلودگی شهر قم شامل ایستگاه مدیریت بحران، خیابان امام، پل حجتیه و پردیسان در دوره آماری ذکرشده به عنوان متغیر پیش بینی شونده به کاربرده شد. روش های یادگیری ماشین مورداستفاده در این مطالعه شامل روش های رگرسیونی (liner، Lasso و Ridge)، جنگل تصادفی (RF)، روش کوبیست (Cubist) ماشین تقویت گرادیان (GBM) و روش بردار پشتیبان (SVM) می باشد. قبل از اجرای مدل های یادگیری ماشین، ابتدا بررسی ارتباط هم خطی چندگانه بین متغیرهای پیش بینی دهنده با استفاده از شاخص عامل تورم واریانس انجام و متغیرهایی که ارتباط هم خطی شدید داشتند حذف شدند. پس از انتخاب متغیرهای پیش بینی دهنده مناسب، از ۸۰ درصد داده ها به عنوان داده های آموزش و از ۲۰ درصد باقی مانده به عنوان داده های آزمون در مدل های یادگیری ماشین استفاده شد. سنجه های آماری مورداستفاده برای بررسی عملکرد مدل ها شامل ضریب تبیین(R۲)، میانگین مطلق خطا (MAE) و جذر میانگین مربعات خطا (RMSE) می باشد. نتایج نشان داد، بر اساس معیار MAE،RMSE ، مدل RF با (۵۹/۴)MAE ،(۹۲/۶)RMSE بهترین عملکرد را دارد، درحالیکه مدل های رگرسیونی و خطی با (۹۶/۱۲)MAE و (۲۰/۱۷)RMSE (خطی، لاسو . ریدج) با (۷۹/۲۰-۲۰۰/۱۷) RMSE و (۱۶/۱۴-۹۶/۱۲)MAE ضعیف ترین عملکرد را در پیش بینی داشته اند. بر اساس ضریب ۲R مدل RF ، Cubist و GBM بهترین عملکرد را داشته اند. با توجه به اینکه مقدار ۲ Rاین سه مدل در مرحله آزمون برابر ۸۲/۰ می باشد می توان گفت ۸۲% از تغییرات ۱۰PM می تواند توسط متغیر های مورداستفاده تعیین شود. سهم هر یک از متغیرهای پیش بینی دهنده درنتیجه دقت پیش بینی به تفکیک هر فصل نشان داد از بین متغیرهای مورداستفاده در فصل بهار، دمای سطح زمین (LST)، شاخص NDVI و حداکثر سرعت باد بیشترین تاثیر را در نتیجه پیش بینی داشته اند. در فصل تابستان شاخص AOD و حداکثر دمای سطح زمین، در فصل پائیز تابش خورشید، شاخص NDVI وDEM و در فصل زمستان کمینه فشار، تابش خورشید و DEM بیشترین تاثیر را در نتیجه پیش بینی داشته اند.

کلیدواژه ها:

نویسندگان

سعیده کمالی

پژوهشگر، مرکز مطالعات مخاطرات هوا و اقلیم، پژوهشگاه هواشناسی و علوم جو، قم، ایران

ساویز صحت کاشانی

دانشیار، مرکز بین المللی مطالعات گردوخاک، پژوهشگاه هواشناسی و علوم جو، تهران، ایران

طاهره سبزه

پژوهشگر، مرکز مطالعات مخاطرات هوا و اقلیم، پژوهشگاه هواشناسی و علوم جو، قم، ایران

محمد امینی

پژوهشگر، مرکز مطالعات مخاطرات هوا و اقلیم، پژوهشگاه هواشناسی و علوم جو، قم، ایران

مهدی رهنما

دانشیار، مرکز بین المللی مطالعات گردوخاک، پژوهشگاه هواشناسی و علوم جو، تهران، ایران