CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی شاخص های اعتبارسنجی خوشه بندی

عنوان مقاله: بررسی شاخص های اعتبارسنجی خوشه بندی
شناسه ملی مقاله: AEBSCONF01_064
منتشر شده در همایش ملی الکترونیکی دستاوردهای نوین در علوم مهندسی و پایه در سال 1393
مشخصات نویسندگان مقاله:

امین رستمی - کارشناسی ارشد نرم افزار کامپیوتر- دانشگاه آزاد فردوس
مریم لشکری - کارشناسی ارشد نرم افزار کامپیوتر- دانشگاه آزاد فردوس

خلاصه مقاله:
خوشه بندی یکی از رایج ترین تکنیک های داده کاوی و فرآیند بدون ناظر در دسته بندی داده ها است.هدف خوشه بندی قرار دادن داده های مشابه به هم در یک گروه است، بطوری که نمونه ها در یک خوشه بیشترین شباهت را با یکدیگر و بیشترین تفاوت را با نمونه ها درخوشه های دیگر داشته باشند، الگوریتم های خوشه بندی متعددی وجود دارد که نتایج بسیاری از الگوریتم های خوشه بندی وابسته به پارامترهای اولیه الگوریتم می باشد ، بنابراین ارزیابی نتایج خوشه بندی الگوریتم ها بسیار با اهمیت است ،در این راستا شاخص های اعتبارسنجی متعددی مطرح شده اما تاکنون هیج شاخص رسمی برای ارزیابی نتایج خوشه بندی بیان نشده است. در این مقاله ما مروری بر تعدادی از شاخص های مطرح شده خواهیم داشت و مزایا ومعایب آنها را بیان و سپس شاخص اعتبارسنجی جدیدی را مطرح خواهیم کرد که قادر است تعداد تخمینی دقیق تری از تعداد خوشه های بهینه برای مساله ما را مشخص نماید جهت اثبات این موضوع ما از 3 مجموعه داده واقعی سایت یادگیری ماشین UCI استفاده نموده ایم.

کلمات کلیدی:
خوشه بندی-داده کاوی – فرآیند بدون ناظر- شاخص های اعتبارسنجی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/303770/