سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 463

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELEMECHCONF06_345

تاریخ نمایه سازی: 12 اسفند 1399

چکیده مقاله ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی

امروزه با توجه به افزایش روزافزون داده های جریانی، خوشه بندی این نوع از داده ها جهت استخراج دانش و تصمیم گیری به موقع تبدیل به یکی از مباحث داغ تحقیقاتی شده است. در این راستا خوشه بندی به عنوان یک رویکرد یادگیری بدون ناظر، میتواند در شناسایی الگو و استخراج دانش از چنین داده هایی موثر واقع شود. خوشه بندی به خودی به خود یک وظیفه چالش برانگیز است، حال با توجه به ماهیت در حال گذر بودن دادههای جریانی و محدودیت دسترسی به آنها و همچنین لزوم واکنش سریع و به موقع، این وظیفه با چالشهای جدیدی روبروست. از یک سو با توجه به این حقیقت که این نوع از داده ها نامتناهی بوده و به سرعت در حال تغییرند، می بایست خوشه بندی آنها نیز در گذر زمان و به صورت تکاملی انجام شود. از سوی دیگر وجود داده های پرتی که میتوانند دقت یادگیری را تحت تاثیر خود قرار دهند و منجر به تصمیم گیریهای نادرست شوند، تشخیص خوشه های درست را قدری دشوار می سازد. در این راستا، الگوریتم های متنوعی در حوزه ی خوشه بندی و همچنین تشخیص داده های پرت در داده های جریانی مطرح شده است. اغلب این الگوریتم ها به صورت آنلاین )برخط(و با رویکردهای مبتنی بر فاصله به تشخیص داده های پرت می پردازند. با توجه به اهمیت موضوع در مقاله جاری سعی شدهاست تا با رویکردی ترکیبی ضمن خوشه بندی داده ها توسط الگوریتمk-meansو تشخیص داده های پرت کاندید به صورت برخط، بار دیگر داده های پرت به صورت غیربرخط )آفلاین( غربالگری شده و در نهایت داده های پرت باقیمانده به عنوان دادههای پرت واقعی گزارش شوند. الگوریتم پیشنهادی بر روی مجموعه داده های استاندارد ۹۹KDD-CUP که دربردارنده ی اطلاعات برچسب خوردهای در ارتباط با وضعیت عادی و وضعیت حمله در شبکه هستند( اعمال شده است. نتایج تحقیقات حاکی از این است که رویکرد پیشنهادی نسبت به رویکردهایی که اخیرا در این حوزه مطرح شده است دارای دقت تشخیص بالاتر بوده و خوشه های بدست آمده دارای خلوص بالاتری هستند. علاوه براین، تحلیلها نشان میدهند روش پیشنهادی از سرعت بالاتری نیز نسبت به رویکردهای مشابه برخوردار است.

کلیدواژه های ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی:

نویسندگان مقاله ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی

میثم خادم

دانشجوی Ph.D.مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد بیرجند، بیرجند، ایران

حمید سعادتفر

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه بیرجند، بیرجند، ایران

مقاله فارسی "ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی" توسط میثم خادم، دانشجوی Ph.D.مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد بیرجند، بیرجند، ایران؛ حمید سعادتفر، استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه بیرجند، بیرجند، ایران نوشته شده و در سال 1399 پس از تایید کمیته علمی ششمین کنفرانس ملی پژوهش های کاربردی در مهندسی برق، مکانیک و مکاترونیک پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله داده های جریانی، خوشه بندی،k-means،داده های پرت. هستند. این مقاله در تاریخ 12 اسفند 1399 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 463 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که امروزه با توجه به افزایش روزافزون داده های جریانی، خوشه بندی این نوع از داده ها جهت استخراج دانش و تصمیم گیری به موقع تبدیل به یکی از مباحث داغ تحقیقاتی شده است. در این راستا خوشه بندی به عنوان یک رویکرد یادگیری بدون ناظر، میتواند در شناسایی الگو و استخراج دانش از چنین داده هایی موثر واقع شود. خوشه ... . برای دانلود فایل کامل مقاله ارائه مدلی ترکیبی جهت خوشه بندی و تشخیص داده های پرت درداده های جریانی با 14 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.