خوشه بندی خودکار داده ها توسط الگوریتم ژنتیک دو مرحله ای
محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,558
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM01_430
تاریخ نمایه سازی: 10 شهریور 1393
چکیده مقاله:
سازماندهی داده ها به گروه های با معنی، یکی از پایه های اساسی در درک داده ها است. تحلیل خوشه، مطالعه روش ها و الگوریتم هایی به منظور خوشه بندی و گروه بندی داده ها با توجه به میزان شباهت یا درجه نزدیکی آنها می باشد. یکی از چالش های تحلیل خوشه، تشخیص درست تعداد خوشه ها است، گرچه در چند دهه اخیر پژوهش های متعددی جهت رفع این مشکل صورت گرفته است. لذا، در این مقاله، یک الگوریتم خوشه بندی ژنتیک دو مرحله ای (TGCA) بررسی می شود. این الگوریتم به صورت خودکار، تعداد بهینه خوشه ها و افراز مناسبی از داده ها را تعیین می کند. عملیات دو مرحله ای انتخاب و جهش به منظور استفاده از قابلیت جستجوی الگوریتم ژنتیک اجرا می شود که از طریق تغییر احتمالات انتخاب و جهش که براساس پایداری تعداد خوشه ها در جمعیت است، حاصل می شود. ابتدا، الگوریتم خوشه بندی ژنتیک دو مرحله ای، تمرکز بر یافتن بهترین تعداد خوشه ها دارد، و سپس بتدریج به سمت یافتن مراکز خوشه بهینه سراسری، سوق می یابد. علاوه بر این، روش افراز بندی با حداکثر بازه ویژگی ها، جهت مقداردهی اولیه جمعیت استفاده می شود. نهایتا، کارآیی و اثربخشی TGCA با الگوریتم بهینه سازی ازدحام ذرات مقایسه می گردد که نتایج بدست آمده، نشان می دهد که این الگوریتم از نظر مدت زمان اجرا و هزینه خوشه بندی از الگوریتم بهینه سازی ازدحام ذرات، عملکرد بهتری دارد.
کلیدواژه ها:
نویسندگان
ساناز کاشانی
دانشجوی کارشناسی ارشد علوم کامپیوتر.دانشگاه سیستان و بلوچستان
حسن رضایی
عضو هیات علمی دانشگاه سیستان و بلوچستان
مهدی زراعتگری
دانشجوی کارشناسی ارشد علوم کامپیوتر. دانشگاه سیستان و بلوچستان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :