CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش تلفیقی خوشه بندی مبتنی بر چگالی و مدل مخلوط گوسین به منظور بهبودطبقه بندی دادههای نامتوازن و نویزی

عنوان مقاله: روش تلفیقی خوشه بندی مبتنی بر چگالی و مدل مخلوط گوسین به منظور بهبودطبقه بندی دادههای نامتوازن و نویزی
شناسه ملی مقاله: CONFSKU01_008
منتشر شده در کنفرانس ملی آخرین دستاوردهای مهندسی داده و دانش و محاسبات نرم در سال 1400
مشخصات نویسندگان مقاله:

الهام هاشمی بنی - گروه کامپیوتر ، دانشکده فنی و مهندسی ، واحد شهرکرد ، دانشگاه آزاد اسلامی ، شهرکرد ، ایران
بهزاد زمانی دهکردی - گروه کامپیوتر ، دانشکده فنی و مهندسی ، واحد شهرکرد ، دانشگاه آزاد اسلامی ، شهرکرد ، ایران
پویا خسرویان دهکردی - گروه کامپیوتر ، دانشکده فنی و مهندسی ، واحد شهرکرد ، دانشگاه آزاد اسلامی ، شهرکرد ، ایران

خلاصه مقاله:
با رشد روز افزون سیستمهای اطلاعاتی و افزایش سریع حجم داده های داده کاوی و ابزارهای آن نقش مهمی در مدیریت و تصمیم گیری بر اساس دانش نهفته در داده ها دارند. طبقه بندی یکی از مهمترین ابزارهای داده کاوی می باشد. دو مشکل اصلی در داده ها وجود دارد. اول مشکل عدم توازن نمونه های آموزشی در کلاس های مختلف، دوم مشکل وجود نویز در داده ها. در این پژوهش یک روش تلفیقی برای حل این دو مشکل در طبقه بندی داده ها ارائه شده است. برای حل مشکل وجود نویز در داده ها از ترکیب دو الگوریتم مقاوم در برابر نویز DBSCAN و مدل ترکیبی گوسین به عنوان طبقه بند استفاده شده است. همچنین برای مشکل عدم توازن نمونه های آموزش، هر کلاس را به زیرمجموعه هایی تقسیم می کنیم سپس با توجه به این زیرمجموعه ها یک طبقه بند را برای آن کلاس آموزش می دهیم. الگوریتم پیشنهادی روی دیتایتهای مجموعه UCI تست شده است و در مقایسه با سایر الگوریتم های طبقه بندی دیگر با توجه به نتایج آزمایشات، الگوریتم پیشنهادی دقت بهتری داشته است.

کلمات کلیدی:
داده کاوی، عدم توازن داده، نویزی بودن داده، الگوریتم DBSCAN ، مدل ترکیبی گوسین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1307664/