پارامترهای الگوریتم خوشه بندی Dbscan و Birch

مصطفی, قاضی زاده; نفیسه, عیش آبادی

پارامترهای الگوریتم خوشه بندی Dbscan و Birch

عنوان مقاله: پارامترهای الگوریتم خوشه بندی Dbscan و Birch
شناسه ملی مقاله: CETE01_015
منتشر شده در کنفرانس علوم کامپیوتر، مهندسی برق و مخابرات در سال 1398

مشخصات نویسندگان مقاله:

مصطفی قاضی زاده - استادیار، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید باهنر کرمان
نفیسه عیش آبادی - دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر (نرمافزار)، موسسه آموزش عالی غیرانتفاعی بعثت، کرمان

خلاصه مقاله:

با توجه به رشد روزافزون داده ها نیاز به ابزاری که بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرارداد، ضروری به نظر می رسد. دسته بندی یا خوشه بندی داده های بزرگ یکی از پرکاربردترین مسائل در این حوزه است. هدف خوشه بندی قراردادن داده ها در گروههایی است که شباهت بین دادههای یک گروه بیش از شباهت بین دادههای گروه های دیگر باشد. دو مورد از مهم ترین الگوریتم ها برای خوشه بندی داده های بزرگ، خوشه بندی Birch و خوشه بندی Dbscan است. الگوریتم Birch با کنار هم قراردادن خوشه بندی سلسله مراتبی و روش های دیگر خوشه بندی نظیر افراز تکرارشونده باهدف خوشه بندی مقدار حجیمی از داده های عددی طراحی شده است. الگوریتم Dbscan یک روش بسیار متداول از خانواده الگوریتم های خوشه بندی مبتنی برچگالی برای داده های خاص می باشد و مهم ترین ویژگی های این الگوریتم شامل توانایی تشخیص خوشه هایی با اشکال دلخواه، توانایی خوشه بندی داده های همراه با نویز و پیچیدگی زمانی پایین می باشد. هر دو روش خوشه بندی Dbscan و Birch دارای پارامترهایی هستند که عملکرد این دو روش خوشه بندی بشدت تحت تاثیر مقادیر تعیین شده برای این دو پارامتر قرار دارد. این روش ها حساس به حدس های اولیه برای تعیین مقادیر پارامترها بوده و ممکن در مینیمم های محلی متوقف شوند.

کلمات کلیدی:

داده بزرگ، خوشه بندی، خوشه بندی Birch ، خوشه بندی DBSCAN

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/988328/