روشی برای خوشه بندی داده های ترکیبی عددی و رسته ای

سال انتشار: 1391
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
کد COI اختصاصی: ICS11_131
زبان مقاله: فارسی
تعداد مشاهده: 1243

دانلود فایل این مقاله

نویسندگان

فائزه حسینی نژاد

دانشجوی کارشناسی ارشد مهندسی نرمافزار دانشگاه آزاد اسلامی واحد تهران جنوب

مریم خادمی

استادیار گروه ریاضی کاربردی دانشگاه آزاد اسلامی واحد تهران جنوب

میرمحسن پدرام

استادیار گروه مهندسی کامپیوتر دانشگاه خوارزمی

چکیده

خوشه بندی یکی از اعمال اصلی در داده کاوی است و به معنای گروه بندی نمونههای مشابه در خوشه ها است. این تکنیک به دنبال کشف ساختار در دادهها از طریق بررسی شباهت ها یا تفاوت های میان آنها است. بسیاری از الگوریتم های خوشه بندی بر روی مجموعه داده های عددی یا رست های به خوبی عمل می کنند اما بیشتر آنها بر روی داده های ترکیبی عملکرد ضعیفی دارند و این در حالی است که داده ها در دنیای واقعی ترکیبی از داده های رست های و عددی هستند. به همین دلیل توسعه الگوریتم هایی با قابلیت عملکرد بر روی این داده ها از اهمیت به سزایی برخوردار است. در این مقاله روش جدیدی برای خوشه بندی داده های ترکیبی ارائه می دهیم. در روش پیشنهادی ابتدا داده های رست های را به عددی تبدیل کرده سپس با استفاده از الگوریتم بهینه سازی cross entropy ، خوشه بندی را بر روی مجموعه داده نهایی که کاملاً عددی است، انجام خواهیم داد. در پایان این روش بر روی دو مجموعه داده استاندارد اعمال شده و کارایی آن با روش k-prototype که یکی از مهمترین الگوریتم ها در زمینه داده های ترکیبی است، مقایسه خواهد شد

کلیدواژه ها

داده های ترکیبی، ویژگی های رست های، الگوریتم بهینه سازی cross entropy

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.