CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خوشهبندی بر اساس مدل آمیخته چوله تی و مدل آمیخته چوله نرمال

عنوان مقاله: خوشهبندی بر اساس مدل آمیخته چوله تی و مدل آمیخته چوله نرمال
شناسه ملی مقاله: COSDA01_139
منتشر شده در اولین کنفرانس بین المللی تجزیه و تحلیل داده های آماری در سال 1402
مشخصات نویسندگان مقاله:

رحمان فرنوش - استاد دانشگاه علم و صنعت ایران، دانشکده ریاضی، گروه آمار، تهران، ایران
زهرا چرک چی - کارشناسی ارشد دانشگاه علم و صنعت ایران، دانشکده ریاضی، گروه آمار، تهران، ایران

خلاصه مقاله:
پیشرفت تکنولوژی باعث به وجود آمدن حجم زیادی از داده ها شده است که اطلاعاتی از آنها نداریم. خوشه بندی براساس مدل، روشی برای استخراجاطلاعات و تجزیه و تحلیل داده ها است که داده ها با برازش یک مدل آماری آمیخته، به گروهی از اشیاء دسته بندی می شوند؛ به طوری که اشیاء در یک دسته بسیار شبیه به هم هستند. در این پژوهش، توزیع آمیخته چوله تی و چوله نرمال را به عنوان یک مدل برای خوشه بندی در نظر داریم. با برآورد پارامترهای مدل با استفاده از الگوریتم ECM ، به خوشه بندی داده ها توسط نرم افزار آماری R پرداخته می شود. تعیین تعداد خوشه توسط شاخص DBI و ارزیابی خوشه توسط شاخص خلوص صورت می گیرد. به دلیل وجود داده های چوله با دمهای سنگین، به دنبال یک مدل مناسب برای خوشه بندی داده ها هستیم. خوشه بندی داده های شبیه سازی و آنزیم خون نشان میدهد که توزیع آمیخته چوله تی، مدل بهتری برای خوشه بندی این داده ها در مقایسه با توزیع آمیخته چوله نرمال است.

کلمات کلیدی:
یادگیری ماشین، خوشه بندی بر اساس مدل، توزیع آمیخته چوله نرمال، توزیع آمیخته چوله تی، الگوریتم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1764922/