عملکرد الگوریتم های ماتریس کواریانس با کمترین دترمینان در تحلیل داده های اکتشافی به روش تحلیل تمایز

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 177

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EARTHSCI04_023

تاریخ نمایه سازی: 23 تیر 1403

چکیده مقاله:

داده های خارج از ردیف باعث اریب دار شدن بردار میانگین و تورم ماتریس کواریانس برای یک مجموعه داده ی چندمتغیره می شوند. استفاده از چنین بردار و ماتریسی نیز نتایج اشتباهی را در تحلیل های آماری چندمتغیره و داده کاوی به همراه خواهد داشت. برای رفع این مشکل برآوردگرهای مقاوم پیشنهاد شده اند که نسبت به داده های خارج از ردیف پایا هستند. در این مقاله چهار برآوردگر مقاوم Fast-MCD ، Det-MCD ، MRCD و Kernel-MRCD بر اساس کمینه کردن دترمینان ماتریس کواریانس معرفی شده اند که به ترتیب برای حالت های رسیدن سریع به جواب، جواب قطعی، داده ها با بعد زیاد و داده ها با ساختارهای پیچیده کاربرد دارند. کلاسه بندی یک مجموعه داده ی ژئوشیمیایی متعلق به نمونه های رسوبات آبراه های در برگه ۰۰۰ / ۱۰۰:۱ خور در استان اصفهان با بعد ۱۳ × ۱۴۸ و با بردار میانگین و ماتریس کواریانس مرسوم توسط روش تحلیل تمایزنشان داد که صحت کلاسه بندی برای داده های آموزشی و آزمایشی حدود ۷۱ درصد است. در حالی که این صحت کلاسه بندی با برآوردگرهای مقاوم به حدود ۸۵ درصد توسط الگوریتم Fast-MCD ، حدود ۹۳ درصد توسط الگوریتم Det-MCD ، حدود ۹۶ درصد توسط الگوریتم MRCD و حدود ۹۸ درصد توسط الگوریتم Kernel-MRCD می رسد. بنابراین استفاده از برآوردگرهای مقاوم در هنگام تحلیل داده های اکتشافی خصوصا داده های ژئوشیمیایی که احتمال وجود داده ی خارج از ردیف در آنها بالا می باشد، لازم به نظر می رسد.

نویسندگان

حمید گرانیان

دانشیاری گروه مهندسی معدن، دانشگاه صنعتی بیرجند، بیرجند، ایران