خوشهبندی بر اساس مدل آمیخته چوله تی و مدل آمیخته چوله نرمال

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 172

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COSDA01_139

تاریخ نمایه سازی: 1 مهر 1402

چکیده مقاله:

پیشرفت تکنولوژی باعث به وجود آمدن حجم زیادی از داده ها شده است که اطلاعاتی از آنها نداریم. خوشه بندی براساس مدل، روشی برای استخراجاطلاعات و تجزیه و تحلیل داده ها است که داده ها با برازش یک مدل آماری آمیخته، به گروهی از اشیاء دسته بندی می شوند؛ به طوری که اشیاء در یک دسته بسیار شبیه به هم هستند. در این پژوهش، توزیع آمیخته چوله تی و چوله نرمال را به عنوان یک مدل برای خوشه بندی در نظر داریم. با برآورد پارامترهای مدل با استفاده از الگوریتم ECM ، به خوشه بندی داده ها توسط نرم افزار آماری R پرداخته می شود. تعیین تعداد خوشه توسط شاخص DBI و ارزیابی خوشه توسط شاخص خلوص صورت می گیرد. به دلیل وجود داده های چوله با دمهای سنگین، به دنبال یک مدل مناسب برای خوشه بندی داده ها هستیم. خوشه بندی داده های شبیه سازی و آنزیم خون نشان میدهد که توزیع آمیخته چوله تی، مدل بهتری برای خوشه بندی این داده ها در مقایسه با توزیع آمیخته چوله نرمال است.

کلیدواژه ها:

یادگیری ماشین ، خوشه بندی بر اساس مدل ، توزیع آمیخته چوله نرمال ، توزیع آمیخته چوله تی ، الگوریتم

نویسندگان

رحمان فرنوش

استاد دانشگاه علم و صنعت ایران، دانشکده ریاضی، گروه آمار، تهران، ایران

زهرا چرک چی

کارشناسی ارشد دانشگاه علم و صنعت ایران، دانشکده ریاضی، گروه آمار، تهران، ایران