عملکرد الگوریتم های ماتریس کواریانس با کمترین دترمینان در تحلیل داده های اکتشافی به روش تحلیل تمایز
- سال انتشار: 1402
- محل انتشار: چهارمین کنفرانس ملی داده کاوی در علوم زمین
- کد COI اختصاصی: EARTHSCI04_023
- زبان مقاله: فارسی
- تعداد مشاهده: 178
نویسندگان
دانشیاری گروه مهندسی معدن، دانشگاه صنعتی بیرجند، بیرجند، ایران
چکیده
داده های خارج از ردیف باعث اریب دار شدن بردار میانگین و تورم ماتریس کواریانس برای یک مجموعه داده ی چندمتغیره می شوند. استفاده از چنین بردار و ماتریسی نیز نتایج اشتباهی را در تحلیل های آماری چندمتغیره و داده کاوی به همراه خواهد داشت. برای رفع این مشکل برآوردگرهای مقاوم پیشنهاد شده اند که نسبت به داده های خارج از ردیف پایا هستند. در این مقاله چهار برآوردگر مقاوم Fast-MCD ، Det-MCD ، MRCD و Kernel-MRCD بر اساس کمینه کردن دترمینان ماتریس کواریانس معرفی شده اند که به ترتیب برای حالت های رسیدن سریع به جواب، جواب قطعی، داده ها با بعد زیاد و داده ها با ساختارهای پیچیده کاربرد دارند. کلاسه بندی یک مجموعه داده ی ژئوشیمیایی متعلق به نمونه های رسوبات آبراه های در برگه ۰۰۰ / ۱۰۰:۱ خور در استان اصفهان با بعد ۱۳ × ۱۴۸ و با بردار میانگین و ماتریس کواریانس مرسوم توسط روش تحلیل تمایزنشان داد که صحت کلاسه بندی برای داده های آموزشی و آزمایشی حدود ۷۱ درصد است. در حالی که این صحت کلاسه بندی با برآوردگرهای مقاوم به حدود ۸۵ درصد توسط الگوریتم Fast-MCD ، حدود ۹۳ درصد توسط الگوریتم Det-MCD ، حدود ۹۶ درصد توسط الگوریتم MRCD و حدود ۹۸ درصد توسط الگوریتم Kernel-MRCD می رسد. بنابراین استفاده از برآوردگرهای مقاوم در هنگام تحلیل داده های اکتشافی خصوصا داده های ژئوشیمیایی که احتمال وجود داده ی خارج از ردیف در آنها بالا می باشد، لازم به نظر می رسد.کلیدواژه ها
الگوریتم Fast-MCD ، الگوریتم Det-MCD ، الگوریتم MRCD ، الگوریتم Kernel-MRCD ، تحلیل تمایزمقالات مرتبط جدید
- حکمرانی دریایی ایران به عنوان یک سیستم پیچیده: تحلیل جغرافیای سیاسی با رویکرد هوش مصنوعی و هوش مکانی
- تبیین سناریوهای آینده تقسیمات استان تهران
- آسیبشناسی حمل و نقل و مدیریت ترافیک در شهرداری های نوظهور ایران
- معایب و مشکلات برنامهریزی و سیاست گذاری حوزه فرهنگ شهری در ایران
- سیاست گذاری بهینه در حوزه ترافیک شهری با استفاده از تکنولوژی های هوش مصنوعی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.