کارایی رویکردهای متعادل سازی داده در نقشه برداری رقومی خاک (مطالعه موردی: بخشی از اراضی استان زنجان)
محل انتشار: فصلنامه علوم محیطی، دوره: 23، شماره: 3
سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 76
فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_SCJS-23-3_007
تاریخ نمایه سازی: 22 آذر 1404
چکیده مقاله:
سابقه و هدف: نقشه برداری رقومی خاک با استفاده از روش های نوین یادگیری ماشین به طور گسترده ای برای پیش بینی پراکندگی مکانی و ویژگی های مختلف خاک به کار گرفته می شود، بااین وجود یکی از محدودیت های استفاده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، عدم تعادل کلاس های خاک است که تاثیر منفی بر عملکرد الگوریتم های یادگیری ماشین دارد؛ بنابراین این پژوهش برای رفع این چالش و بهبود طبقه بندی کلاس های نامتعادل خاک با دو رویکرد نمونه گیری مجدد و یادگیری حساس به هزینه و استفاده از مدل پیش بینی جنگل تصادفی در استان زنجان انجام گرفته است.مواد و روش ها: تعداد ۱۴۸ خاک رخ مشاهداتی بر اساس الگوی طبقه بندی تصادفی با فاصله ۵۰۰ متر حفر و پس از انتقال به آزمایشگاه تجزیه های مختلف فیزیکی و شیمیایی مطابق با روش های استاندارد بر روی آن ها انجام گرفت. متغیرهای محیطی شامل اطلاعات نقشه-های ژئومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهواره ای لندست ۸ بودند که بر اساس نظر کارشناسی و رویکرد تحلیل مولفه اصلی تعدادی از متغیرهای محیطی شامل اطلاعات نقشه های ژئومورفولوژی، اطلاعات زمین شناسی و ویژگی های مستخرج از مدل رقومی ارتفاع به عنوان موثرترین متغیرهای محیطی برای پیش بینی کلاس های خاک و به عنوان ورودی مدل انتخاب شدند. سایه اندازی تپه ها (AHS)، طلوع خورشید، عمق دره، شاخص طول در جهت شیب، فاصله تا شبکه آبراهه (CND)، شاخص رطوبتی توپوگرافی (TWI) و شاخص همواری بالای پشته با درجه تفکیک بالا (MRRTF) به عنوان موثرترین متغیرهای محیطی انتخاب شدند و بیشترین میزان تغییرپذیری مکانی خاک ها در منطقه را مدل سازی کردند. مدل سازی رابطه خاک - زمین نما با استفاده از الگوریتم جنگل تصادفی و اصلاح داده های نامتعادل توسط رویکرد نمونه گیری مجدد با استفاده از توابع ubOver و ubUnder و همچنین رویکرد یادگیری حساس به هزینه با استفاده از تابع rf در بسته Random Forest در محیط برنامه نویسی Rstudio انجام شد.نتایج و بحث: نتایج این پژوهش حاکی از این بود که خاک های منطقه در سطح زیرگروه در پنج کلاس با توزیع نامتعادل شامل تیپیک کلسی زرپتز، تیپیک هاپلوزرپتز، جیپسیک هاپلوزرپتز، تیپیک زراورتنتز و لیتیک زراورتنتز طبقه بندی شدند. بر این اساس مقادیر آماره های صحت کلی و ضریب کاپا برای ارزیابی نقشه خاک با داده های نامتعادل به ترتیب برابر ۶۵ درصد و ۳۲/۰ بوده و پس از متعادل سازی داده ها در رویکرد نمونه گیری مجدد به ترتیب برابر ۷۱ درصد و ۵۴/۰ و در رویکرد یادگیری حساس به هزینه به ترتیب برابر ۸۶ درصد و ۷۷/۰ به دست آمد. زیرگروه های جیپسیک هاپلوزرپتز و لیتیک زراورتنز که جزء کلاس های اقلیت محسوب می شدند، هنگام استفاده از کلاس های نامتعادل پیش بینی نشده و حذف شده بودند اما پس از بهبود داده ها و بیش افزایی با دو رویکرد نمونه گیری مجدد و یادگیری حساس به هزینه به تعداد این دو کلاس اقلیت، پیش بینی این زیرگروه ها با صحت قابل قبولی افزایش نشان داد.نتیجه گیری: نتایج ارزیابی مدل ها نشان داد که در مدل سازی با استفاده از توزیع نامتعادل کلاس های خاک، به دلیل از دست رفتن کلاس های با تعداد مشاهده کم، نقشه های نامطمئن با دقت نسبتا ضعیفی ایجاد می شود که پس از اعمال متعادل سازی داده ها، دقت مدل های مبتنی بر روابط خاک - زمین نما در مطالعات نقشه برداری رقومی خاک ارتقا می یابد. نتایج نشان داد که رویکرد یادگیری حساس به هزینه با تمرکز بر روی کلاس های با تکرار کم، می تواند به عنوان یک مدل برتر در مناطق دیگر نیز مورداستفاده قرار گیرد. با توجه به اینکه تحقیقات درزمینه داده های نامتعادل در خاک محدود است، این مطالعه می تواند یک راه حل موثر برای مقابله با داده های نامتعادل در کلاس های خاک و تولید نقشه های رقومی خاک با دقت بالا باشد.
کلیدواژه ها:
نویسندگان
مستانه رحیمی مشکله
گروه علوم خاک، دانشکده کشاورزی، دانشگاه زنجان، زنجان، ایران
محمدامیر دلاور
گروه علوم خاک، دانشکده کشاورزی، دانشگاه زنجان، زنجان، ایران
محمد جمشیدی
موسسه تحقیقات خاک و آب، سازمان تحقیقات، آموزش و ترویج کشاورزی، کرج، ایران