پارامترهای الگوریتم خوشه بندی Dbscan و Birch

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,152

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CETE01_015

تاریخ نمایه سازی: 26 بهمن 1398

چکیده مقاله:

با توجه به رشد روزافزون داده ها نیاز به ابزاری که بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرارداد، ضروری به نظر می رسد. دسته بندی یا خوشه بندی داده های بزرگ یکی از پرکاربردترین مسائل در این حوزه است. هدف خوشه بندی قراردادن داده ها در گروههایی است که شباهت بین دادههای یک گروه بیش از شباهت بین دادههای گروه های دیگر باشد. دو مورد از مهم ترین الگوریتم ها برای خوشه بندی داده های بزرگ، خوشه بندی Birch و خوشه بندی Dbscan است. الگوریتم Birch با کنار هم قراردادن خوشه بندی سلسله مراتبی و روش های دیگر خوشه بندی نظیر افراز تکرارشونده باهدف خوشه بندی مقدار حجیمی از داده های عددی طراحی شده است. الگوریتم Dbscan یک روش بسیار متداول از خانواده الگوریتم های خوشه بندی مبتنی برچگالی برای داده های خاص می باشد و مهم ترین ویژگی های این الگوریتم شامل توانایی تشخیص خوشه هایی با اشکال دلخواه، توانایی خوشه بندی داده های همراه با نویز و پیچیدگی زمانی پایین می باشد. هر دو روش خوشه بندی Dbscan و Birch دارای پارامترهایی هستند که عملکرد این دو روش خوشه بندی بشدت تحت تاثیر مقادیر تعیین شده برای این دو پارامتر قرار دارد. این روش ها حساس به حدس های اولیه برای تعیین مقادیر پارامترها بوده و ممکن در مینیمم های محلی متوقف شوند.

نویسندگان

مصطفی قاضی زاده

استادیار، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید باهنر کرمان

نفیسه عیش آبادی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر (نرمافزار)، موسسه آموزش عالی غیرانتفاعی بعثت، کرمان