یک روش هیبریدی مبتنی بر آنالیز مولفه ی مستقل و تکنیک DBSCAN برای شناسایی چندمتغیره ی مقادیر خارج از ردیف در ژئوشیمی اکتشافی
- سال انتشار: 1399
- محل انتشار: اولین کنفرانس ملی داده کاوی در علوم زمین
- کد COI اختصاصی: EARTHSCI01_047
- زبان مقاله: فارسی
- تعداد مشاهده: 291
نویسندگان
دانشجوی دکتری، دانشکده مهندسی معدن، دانشگاه صنعتی اصفهان، اصفهان، ایران،
دانشیار دانشکده مهندسی معدن، دانشگاه صنعتی اصفهان، اصفهان، ایران،
چکیده
شناسایی مقادیر خارج از ردیف، یکی از اهداف مهم پردازش مجموعه داده های ژئوشیمیایی است که به منظور آشکارسازی آنومالی های ناحیه ای مرتبط با فرآیندهای متالوژنیک، کاهش چولگی کاذب توزیع داده ها و شناسایی منابع آلودگیهای زیست محیطی استفاده میشود. تا کنون رویکردهای متنوعی برای انجام این تحلیل در مطالعات داده کاوی علوم زمین پیشنهاد شده است، که در این بین روشهای چندمتغیره از ارزش تئوری و عملی بالاتری برخوردارند. در این مقاله، یک روش چندمتغیرهی نوین تحت عنوان ICA-DBSCAN برای شناسایی مقادیر خارج از ردیف در ژئوشیمی کاربردی پیشنهاد شده است. رویکرد مورد بحث، یک روش هیبریدی سلسله مراتبی است که بر آنالیز مولفه ی مستقل (ICA) و خوشهبندی فضایی مبتنی بر چگالی با کاربردهای نویزی (DBSCAN) استوار است. فرض اساسی ICA-DBSCAN این است که مقادیر خارج از ردیف داده هایی هستند که توسط هیچ یک از فرآیندهای زمین شناسی فعال در ژئوسیستم تحت بررسی توجیه نمی شوند. بنابراین، ICA-DBSCAN مولفه های زمینشناسی نهان در مجموعه داده را توسط ICA استخراج نموده و سپس از طریق DBSCAN، نویزهای موجود در فضای مولفه های مستقل را به عنوان دادهی پرت معرفی میکند. این رویکرد بر روی مجموعه داده ی چندعنصری خاک برداشت شده در محدوده ی ایالت کلرادو اجرا گردیده است. در مقایسه با مقادیر خارج از ردیف شناسایی شده با روش متداول مبتنی بر اندازه گیری فاصله ی ماهالانوبیس در فضای ویژگی حاصل از آنالیز مولفه ی اصلی (PCA)، نتایج حاصل از به کارگیری ICA-DBSCAN نشان میدهند که روش پیشنهادی توانسته است به شکل معنیداری مقادیر خارج از ردیف حقیقی را از مقادیر کران فوقانی توزیع داده ها تمییز دهد.کلیدواژه ها
داده کاوی، مقادیر خارج از ردیف، داده های ژئوشیمیایی، DBSCAN، آنالیز مولفه ی مستقل .(ICA)مقالات مرتبط جدید
- الگوی مدیریت بحران در گفتمان های امنیت ملی جمهوری اسلامی ایران؛ مطالعه موردی حوادث سیاسی ۱۳۸۸
- بررسی ارتقای کیفیت زندگی از طریق باززنده سازی بافت فرسوده ساکنین محله ی آب انبارنو ساری
- بررسی ویژگی های روان سنجی پرسشنامه سه وجهی حسادت (MJS) در دانشجویان
- شناسایی و سنجش اهمیت عامل های سیاست گذاری فضایی مدیریت ریسک سیلاب روستایی منطقه مورد مطالعه : نواحی روستایی شهرستان خمین
- کاربرد سوسوزنها در پیش بینی وقوع زلزله
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.