بازسازی داده های گمشده جریان روزانه رودخانه با استفاده از الگوریتم جنگل گمشده در حوزه بلوچستان جنوبی، ایران
محل انتشار: پژوهشنامه مدیریت حوزه آبخیز، دوره: 15، شماره: 2
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 36
فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JWMR-15-2_004
تاریخ نمایه سازی: 6 آذر 1403
چکیده مقاله:
چکیده مبسوط
مقدمه و هدف: سری های زمانی کامل هیدرولوژیکی برای مدیریت و مدل سازی منابع آب و انرژی در یک اقلیم در حال تغییر حیاتی هستند. با اینحال، چنین متغیرهایی اغلب با داده های گمشده همراه هستند، که فرایند تجزیه و تحلیل را دشوار و یا گاهی غیرممکن میکند. شکافهای داده باعث مشکلاتی در تفسیر، واسنجی ناکارآمد مدل و آمارههای اریبدار میشوند. در این بررسی، اعتبار یک الگوریتم ماشین یادگیری تصادفی غیرپارامتری که جنگل گمشده (MissForest) نام دارد برای پرکردن شکاف سریهای زمانی جریان روزانه در منطقهای با داده کمیاب و تغییرپذیری اقلیمی قوی، ارزیابی گردیده است.
مواد و روش ها: دادههای جریان روزانه در ایستگاههای جریانسنجی حوزه آبریز بلوچستان جنوبی در یک دوره طولانیمدت هیدرولوژیکی (۱۹۷۲/۰۹/۲۳ تا ۲۰۱۸/۰۹/۲۲) مورد بررسی قرار گرفته است. منطقه مورد مطالعه این پژوهش (حوزه آبریز بلوچستان جنوبی) از مجموعه حوزه آبریز خلیج فارس و دریای عمان بوده و با حدود بین سدیج و مرکز پاکستان شناخته میشود. درصد گمشدگی بر اساس یک معیار قراردادی (کمتر از ۵۰ درصد) بهعنوان نسبت قابلقبول از نرخ گمشدگی در دادههای جریان انتخاب و سپس مکانیسمها و الگوهای گمشدگی دادهها تعیین گردیده است. بر این اساس، تعداد ایستگاه های جریان سنجی از ۱۱ به ۷ نمونه کاهش یافته است. سپس توزیع زمانی جریان های روزانه گمشده در طول ماه های سال و فراوانی نسبی طول گمشدگی در کل دوره مورد بررسی قرار گرفته است. در ادامه، عملکرد الگوریتم بازسازی دادههای گمشده با دو سناریوی متفاوت داده گمشده مصنوعی به چالش کشیده شده است. برای اینمنظور، دو نوع شکاف مصنوعی در قسمت داده های کامل ایجاد شده است. الف) در هر ایستگاه جریان سنجی یک بخش از داده ها (با طول ۷، ۱۴، ۲۱، ۳۰، ۶۰، ۱۸۰ و ۳۶۵ روز) بهطور تصادفی از کل دوره حذف شده است. ب) نقاط داده منفرد شامل مقادیر مشاهده شده روزهای (۳۰، ۶۰، ۹۰، ۱۲۰، ۱۸۰ و ۳۶۵) بهطور تصادفی از کل دوره (۲۰۱۸-۱۹۷۲) حذف شده اند. الگوریتم جنگل گمشده برای پرکردن شکاف های مصنوعی اجرا و سپس اعتبارسنجی الگوریتم در پرکردن دادههای گمشده جریان روزانه با مقایسه سریهای پرشده با دادههای مشاهده شده، از طریق آزمونهای سهگانه نیکویی برازش (GoF) شامل ضریب تعیین (R۲)، درصد بایاس یا اریب (PBIAS) و معیار کلینگ- کوپتا (KGE) تست شده است. علاوه بر آن، برخی کنترل ها در عملکرد الگوریتم جنگل گمشده جهت حساسیتسنجی انجام شده است. به این مفهوم که الگوریتم جنگل گمشده با درصدهای مختلف از گمشدگی داده در ایستگاه هدف (%۵، %۱۰، %۱۵، %۲۰، %۲۵ و %۳۰) و همچنین تعداد رکوردهای پیش بینی کننده جریان ایستگاه هدف، آزمایش شده است.
یافته ها: نتایج نشان داد که بهطور کلی الگوریتم جنگل گمشده عملکرد رضایتبخش و خوبی داشته و امکان شبیهسازی دقیق و مطمئن دادههای از دست رفته را بهسرعت و بهصورت خودکار فراهم میآورد. عملکرد الگوریتم جنگل گمشده بهشدت تابعی از تعداد رکوردهای پیشبینی کننده، طول رکورد و نوع جریان رودخانه میباشد. عملکرد الگوریتم جنگل گمشده به درصد گمشدگی داده های ایستگاه هدف حساس و به تعداد رکوردهای پیش بینی کننده بیتفاوت بوده است. با افزایش درصد گمشدگی دادهها، عملکرد الگوریتم جنگل گمشده بهطور قابل ملاحظه کاهش یافته است. علاوه بر آن، این الگوریتم گمشدگیهای کوتاهمدت را نسبت به گمشدگیهای طولانیمدت، دقیقتر برآورد میکند. عملکرد الگوریتم جنگل گمشده به تعداد رکوردهای پیشبینی کننده حساس نمیباشد. این وضعیت، به ماهیت هیدروفیزیوگرافی زیرحوضههای آبریز و موقعیت ایستگاههای آبسنجی مربوط میشود. تنها در صورتی عملکرد الگوریتم جنگل گمشده برای یک ایستگاه خاص با افزایش رکوردهای پیشبینی کننده بهبود مییابد که ایستگاههای اهداءگر در حوضه آبریز مشترک با ایستگاه هدف قرار داشته باشند در نهایت، بازسازی شکافهای واقعی در دادههای جریان از طریق اعمال این الگوریتم هوشمند ممکن گردید. سریهای زمانی جریان رودخانهها با رژیم جریان طبیعی با عملکرد خوب شبیهسازی شد؛ درحالیکه این عملکرد برای تغییرات دبی در نتیجه ذخیرهسازی و انحراف آب برای آبیاری بهویژه در پایین دست سدها اندکی افت داشت. عملکرد این الگورتیم در پرکردن سری زمانی روزانه جریان با تغییرات شدید رژیم جریان مانند دبی اوج، مطلوب ارزیابی نشد. این افت عملکرد بیشتر متوجه شرایط هیدرواقلیمی حوزه آبریز مورد مطالعه است تا ساختار الگوریتم. هیدروگرافهای بازسازی شده امکان تجزیه و تحلیل تغییر و تنوع جریان و برهمکنش آنها با متغیرهای آب و هوایی کلیدی را فراهم میکنند.
نتیجه گیری: الگوریتم جنگل گمشده بهعنوان یکی از روشهای بازسازی مبتنی بر یادگیری ماشین دارای اعتبار و عملکرد بالا در بازسازی دادههای گمشده جریان روزانه رودخانه معرفی شده و میتوان از آن بهصورت خودکار و هوشمند در بازسازی نواقص آماری جریان رودخانه در مقیاس روزانه استفاده نمود. پیشنهاد می گردد اثرات حوضه های مختلف با ویژگی های هیدروفیزیکی و اقلیمی خاص در مطالعات آتی بر روی عملکرد الگوریتم جنگل گمشده مورد تجزیه و تحلیل قرار گیرد. بررسی روش پیشنهادی این مطالعه در سایر مناطق هیدرواقلیمی و جغرافیایی، سنجش حساسیت به رژیم بارندگی و جریان رودخانه و در نهایت بررسی عملکرد آن در مقایسه با سایر روش های رایج از جمله موارد دیگری است که در مطالعات آتی میتوان به آن پرداخت.
کلیدواژه ها:
نویسندگان
جواد آریان منش
Department of physical Geography, University of Sistan and Baluchestan, Zahedan, Iran
حمید نظری پور
Department of physical Geography, University of Sistan and Baluchestan, Zahedan, Iran
پیمان محمودی
Department of physical Geography, University of Sistan and Baluchestan, Zahedan, Iran
پرویز خسروی
Iran Meteorological Organization
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :