خوشه بندی استوار مبتنی بر مدل با استفاده از توزیع ‎-‎αپایدار متقارن برای خطای اندازه گیری

  • سال انتشار: 1403
  • محل انتشار: مجله علوم آماری، دوره: 18، شماره: 1
  • کد COI اختصاصی: JR_STAT-18-1_001
  • زبان مقاله: فارسی
  • تعداد مشاهده: 185
دانلود فایل این مقاله

نویسندگان

مژگان مرادی

University of Kurdistan

شاهو زارعی

University of Kurdistan

چکیده

خوشه بندی مبتنی بر مدل   پرکاربردترین روش خوشه بندی آماری  است، که در آن داده های ناهمگن با استفاده از استنباط بر اساس مدل های آمیخته به گروه هایی همگن تقسیم می شوند. وجود خطای اندازه گیری در داده ها می تواند کیفیت خوشه بندی را کاهش  و به عنوان مثال، موجب بیش برازشی و تولید خوشه های جعلی شود. برای رفع این مشکل،  خوشه بندی مبتنی بر مدل با فرض توزیع نرمال برای خطای اندازه گیری معرفی شده است. با وجود این، مقدارهای خیلی بزرگ یا خیلی کوچک (دورافتاده) از خطاهای اندازه گیری  باعث  عملکرد ضعیف  روش های خوشه بندی  موجود می شوند. برای رفع این مشکل و ساختن یک مدل استوار نسبت به حضور خطاهای اندازه گیری دورافتاده در داده ها، در این مقاله برای خطای اندازه گیری  توزیع آلفا-پایدار  متقارن جایگزین توزیع نرمال می شود و با استفاده از الگوریتم EM و  روش های عددی، پارامترهای   مدل  برآورد می شوند. با استفاده از شبیه سازی و تحلیل داده واقعی  به مقایسه مدل جدید ارائه شده با  روش خوشه بندی مبتنی بر مدل با روش MCLUST، در حالت های با و بدون خطای اندازه گیری پرداخته و کارایی مدل پیشنهادی برای خوشه بندی داده ها در حضور انواع خطاهای اندازه گیری دورافتاده،  نشان داده می شود.

کلیدواژه ها

Model-based clustering‎, ‎alpha-stable distribution‎, Measurement error‎, ‎EM‎‎ algorithm, خوشه بندی مبتنی بر مدل, خطای اندازه گیری, توزیع ‎-alpha‎پایدار, الگوریتم ‎EM.

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.