ارائه روشی برای اعتبار سنجی خوشه ها با استفاده از تلاقی دو شاخص ضریب تقسیم بندی و آنتروپی تقسیم بندی در خوشه بندی فازی c-means

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس بین المللی چشم انداز های نو در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: NPECE01_284
  • زبان مقاله: فارسی
  • تعداد مشاهده: 853
دانلود فایل این مقاله

نویسندگان

امیر هادی جهانبخش پور جباری

گروه کامپیوتر واحد بوئین زهرا دانشگاه آزاد اسلامی بوئین زهرا ایران

مجتبی سید زادگان

استادیار مرکز آموزش عالی فنی و مهندسی بوئین زهرا گروه کامپیوتر برق و فناوری اطلاعات بوئین زهرا قزوین ایران

چکیده

خوشه بندی یکی ار رایج ترین تکنیک های داده کاوی و فرآیند بدون ناظر در دسته بندی داده ها است خوشه بندی با یافتن یک ساختار درون یک مجموعه از داده های بدون برچسب درگیر است در خوشه بندی سعی می شود تا داده ها به خوشه هایی تقسیم شوند که شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل شود الگوریتم های خوشه بندی وابسته به پارامترهای اولیه الگوریتم می باشد بنابراین ارزیابی نتایج خوشه بندی الگوریتم ها بسیار با اهمیت است تخمین تعداد بهینه خوشه ها در دسته بندی بدون نظارت داده ها از زمینه های چالش برانگیز برای محققان در سالهای اخیر بوده که در این راستا شاخص های اعتبارسنجی متعددی مطرح شده اما تاکنون هیچ شاخص رسمی برای ارزیابی نتایج خوشه بندی بیان نشده است در این مقاله ما یک شاخص اعتبارسنجی جدیدی را مطرح خواهیم کرد که قادر است تعداد دقیق تری از تعداد بهینه خوشه ها را مشخص نماید جهت اثبات این موضوع ما از 3 مجموعه داده واقعی سایت یادگیری ماشین UCI استفاده نموده ایم

کلیدواژه ها

داده کاوی،الگوریتم،خوشه بندی،اعتبار خوشه،شاخص های اعتبارسنجی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.