ارائه ی یک الگوریتم ترکیبی بهینه برای خوشه بندی در داده کاوی با استفاده از رویکرد فرا ابتکاری
- سال انتشار: 1394
- محل انتشار: اولین کنفرانس بین المللی یافته های نوین علوم و تکنولوژی
- کد COI اختصاصی: DSCONF01_070
- زبان مقاله: فارسی
- تعداد مشاهده: 1039
نویسندگان
دانشجوی کارشناسی ارشد گروه کامپیوتر، پردیس علوم و تحقیقات، دانشگاه آزاد اسلامی بروجرد، ایران
چکیده
خوشه بندی به معنای یادگیری بدون نظارت است که با استفاده از آن داده ها به دسته هایی که از نظر پارامترهای مورد علاقه شباهتبیشتری به یکدیگر دارند تقسیم می گردند. در نتیجه شباهت بین داده های درون هرخوشه حداکثر و شباهت بین داده های درونخوشه های متفاوت حداقل است. خوشه بندی یکی از بهترین روش های کار با داده هاست و قابلیت ورود به فضای داده و تشخیصساختارش را امکان پذیر می نماید لذا به عنوان یکی از ایده آل ترین مکانیزم ها برای کار با دنیای عظیم داده ها محسوب می شود. درواقع خوشه بندی از جمله تکنیک های توصیفی داده کاوی می باشد که بدون هدف از قبل مشخص شده ای الگوها را ازداده هااستخراج می نماید. تاکنون الگوریتم های زیادی برای خوشه بندی داده ها ارائه شدهاست، که هر کدام از این الگوریتم ها با مشکلاتیهمچون بهینه محلی، وابسته بودن به شرایط مساله روبرو هستند. برای مقابله با این مشکلات از ترکیب الگوریتم های فرامکاشفه ایاستفاده می شود. در این پژوهش الگوریتم جدیدی از ترکیب الگوریتم بهینه سازی ژنتیک و الگوریتم K-means برای خوشه بندی داده ها ارائه شده است که ضمن داشتن مزایای هر دو روش، سعی شده نقاط ضعف هر کدام پوشش داده شود. به منظور اعتبارسنجیروش پیشنهادی از چند مجموعه داده مشهور و پر کاربرد استفاده شده است. نتایج حاصل با الگوریتم ها و روش های ترکیبی استخراجشده از مقالات مقایسه شده است.کلیدواژه ها
خوشه بندی، الگوریتم های فرامکاشفه ای، الگوریتم ژنتیک، الگوریتم K-meansاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.