بهبود الگوریتم k-means با استفاده از الگوریتم PSO و شاخص دیویس-بولدین DB

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 481

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF04_062

تاریخ نمایه سازی: 20 خرداد 1398

چکیده مقاله:

یکی از مباحث مهم و مطرح در دنیای امروز ذخیره سازی وپردازش ابر داده ها Big Data می باشد. ابر داده ها به داده هایی از یک نوع گفته می شود دارای اندازه های چند ده گیگات بایت به بالا TB،EB می باشند. چنین داده هایی معمولا در صنایع بزرگ، شبکه های اجتماعی، جستوجو گر ها، مراکز بزرگ هواشناسی، آزمایشگاه های بسیار عظیم (مانند سرن) تولید می شود و پردازش مطمئن و ذخیره سازی امن آنها بسیار مهم است.پردازش و ذخیره سازی ابر داده ها کاری بسیار مشکل و زمان گیر است از این رو دانشمندان همواره به دنبال روشی مناسب و سریع برای انجام این کار هستند و تاکنون ابزار های متفاوتی برای این کار تولید شده است در این مقاله سعی شده است با استفاده از الگوریتم خوشه بندی k-means، بهترین اطلاعات را در کمترین زمان ممکن بدست آوریم اما در این الگوریتم اگر تعدادخوشه ها را بدرستی تعیین نشود سبب قرار گرفتن نتایج در دام بهینه محلی می شود. به همین دلیل در این مقاله سعی نموده ایم با استفاده از الگوریتم تکاملی PSO تعدادخوشه مناسبی را انتخاب نموده تا بتوانیم نتایج خوشه بندی K-means را از دام بهینه محلی خارج نماییم و همچنین با استفاده از شاخص دویس-بولدین DB کیفیت خوشه ها را بالا برده و به نتیجه بهتری از خوشه بندی دست یابیم. در پایان راهکار پیشنهادی بر روی دو مجموعه داده استاندارد از سایت UCI و یک مجموعه داده مصنوعی مورد ارزیابی قرار می گیرد

نویسندگان

سمیه موگویی

دانشجوی کارشناسی ارشد ،موسسه غیردولتی ارشاد دماوند

فرزاد عابدینی فارس

دانشجوی دکترا ریاضی محض،دانشگاه علوم و تحقیقات واحد کرمان