بررسی ساختارهای داده متفاوت جهت انتخاب روش خوشه بندی مناسب با مطالعه موردی بر روی پایگاه داده سرطان سینه Wisconsin

  • سال انتشار: 1395
  • محل انتشار: چهارمین همایش ملی کاربرد فناوری های نوین در علوم مهندسی
  • کد COI اختصاصی: ITCC04_130
  • زبان مقاله: فارسی
  • تعداد مشاهده: 532
دانلود فایل این مقاله

نویسندگان

محمود شاکری

مرکز آموزش عالی علمی کاربردی جهاد دانشگاهی مشهد

محمد عبدالهی

مرکز آموزش عالی علمی کاربردی جهاد دانشگاهی مشهد

چکیده

الگوریتم های خوشه بندی داده ها را به گروه هایی تقسیم می کنند؛ به صورتی که داده های درون هر خوشه بیش ترین شباهت و داده هایخوشه های متفاوت کمترین شباهت را به یکدیگر داشته باشند. انتخاب روش خوشه بندی مناسب و معیار فاصله یا شباهت مورد استفاده برایهر پایگاه داده، از اهمیت ویژه ای برخوردار است. به منظور تعیین روش مناسب، اولین قدم شناخت کافی از ساختار داده های موجود درپایگاه داده است. به عنوان مثال، توزیع داده های هر خوشه، تعداد خوشه ها و ارتباطات درون خوشه ای و بین خوشه ای از جمله مواردی بودهکه بر انتخاب معیار فاصله یا شباهت و روش خوشه بندی تاثیر زیادی داشته و در بهینه سازی عمل خوشه بندی اثر مستقیم دارند. پس ازتحلیل ساختار داده ها، می توان با توجه به ویژگی های معیارهای فاصله یا شباهت و روش های خوشه بندی، تصمیم گیری نموده و بهترین ومناسب ترین الگوریتم خوشه بندی را برگزید. در این مقاله پس از تحلیل ساختار داده های پایگاه داده سرطان سینه Wisconsin، روش هایمختلف خوشه بندی و معیارهای شباهت مناسب مورد بررسی قرار گرفته است. نتایج آزمایشات با تحلیل های صورت گرفته تطابق کاملدارند.

کلیدواژه ها

خوشه بندی، یادگیری بدون نظارت، شبکه های عصبی، سرطان سینه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.