بهبود دقت الگوریتم k_means تحت اسپارک با ترکیب الگوریتم PSO بر روی دادههای حجیم

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 126

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFIT01_0250

تاریخ نمایه سازی: 4 مهر 1403

چکیده مقاله:

خوشه بندی از تکنیک های معروف در دادهکاوی است که به منظور شناسایی الگوهای موجود در دادهها مورد استفاده قرار می گیرد . استخراج و تجزیه تحلیل این الگوها در دادهها می تواند منجر به کشف دانش جدیدی پیرامون دادهها گردد. به همین دلیل امروزه خوشه بندی در کاربردهای مختلفی استفاده می شود. یکی از الگوریتم های معروف خوشه بندی الگوریتم k-means می باشد. این الگوریتم علاوه بر مزایای بسیار، از جمله سرعت بالا و سهولت پیادهسازی ، چنانچه پارامترهای اولیه آن به درستی تعیین نگردد، نتایج الگوریتم به دلیل وابسته بودن به پارامترهای اولیه در دام بهینه محلی قرارگرفته و خوشه های مناسبی تولید نخواهد کرد. در این پژوهش ، برای بهبود فرآیند خوشه بندی روش k-means از روش تکاملی بهینه سازی ازدحام ذرات استفاده شده است . بهینه سازی ازحام ذرات، روش مبتنی بر هوش جمعی است که می تواند به شناسایی پارامترهای مطلوب برای روش k-means و همینطور شناسایی زیرمجموعه مناسب از مجموعه دادهی مورد بررسی ، کمک نماید. در ادامه ، با بهرهگیری از روشهای یادگیری ماشین مبتنی بر اسپارک، ایدهی مورد نظر بر روی عظیم داده ها مورد بررسی قرار گرفته است . سپس به منظور اعتبار سنجی راهکار پیشنهادی ، رویکرد فوق بر روی چندین مجموعه داده استاندارد از سایت UCI و چندین مجموعه داده مصنوعی مورد ارزیابی قرار می گیرد و نتایج با سایر روشها مقایسه می گردد. بررسی نتایج نشان می دهد راهکار جدید، نتایج بهتری درمقایسه با سایر روشهای مورد بررسی تولید می نماید

نویسندگان

فرید رحمتی

کارشناس ارشد ، دانشکده فنی مهندسی ، گروه کامپیوتر ، دانشگاه آزاد ، شهر سنندج