بررسی کاربرد الگوریتم K-means در فرآیند خوشه بندی داده های بزرگ

سال انتشار: 1395
محل انتشار: اولین کنفرانس ملی مهندسی کامپیوتر و فناوری اطلاعات
کد COI اختصاصی: CIICE01_100
زبان مقاله: فارسی
تعداد مشاهده: 2960

نویسندگان

دانشجوی کارشناسی ارشد امنیت اطلاعات، دانشگاه مهر آستان

چکیده

عصر داده های بزرگ آغازشده است. داده ها با سرعت فراوانی ازنظر اندازه و تنوع در حال افزایش هستند. با رشد داده ها، چالش ها و تفاوت هایی برای این میزان داده به بار آمده است. داده های بزرگ نشان از ویژگی های متفاوت همچون حجم، تنوع، تغییرپذیری، ارزش، سرعت و پیچیدگی دارند که بر آن اساس آنالیز داده ها و کسب اطلاعاتی با فنون داده کاوی بسیار دشوار است. استخراج داده روشی است برای خارج کردن داده های مفید، اما رویکردهای کلاسیک استخراج داده ها به علت پیچیدگی زیاد نمی توانند به طور مستقیم برای داده های بزرگ مورداستفاده قرار گیرند. خوشه بندی از روش های مهم درداده کاوی است که به دلیل نزدیک بودن با مسایل طبیعی در بسیاری از زمینه ها موردتوجه قرارگرفته است. یکی از مهم ترین الگوریتم های خوشه بندی که به طور گسترده به کار می رود الگوریتم k-means است. الگوریتم فوق کاربردهای بسیاری در زمینه های مختلف علمی و صنعتی دارد. الگوریتم خوشه بندی K-means علی رغم سادگی یک روش پایه برای بسیاری از روش های خوشه بندی دیگر (مانند خوشه بندی فازی) محسوب می شود. این روش روشی انحصاری و مسطح محسوب می شود برای این الگوریتم شکل های مختلفی بیان شده است. ولی همه آن ها دارای روالی تکراری هستند.

کلیدواژه ها

داده های بزرگ، خوشه بندی، الگوریتم k-means، داده کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.