بررسی مقیاس پذیری داده های پرت در مجموعه داده های توزیع شده قدرتمند با اعمال داده های غیرمرتبط

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 528

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF06_024

تاریخ نمایه سازی: 7 خرداد 1398

چکیده مقاله:

در این پایان نامه ما روشی ابتکاری ارائه می کنیم که بتواند بصورت موثری بر روی مجموعه داده های توزیع شده بزرگی که حاوی داده هایی با انواع مختلف هستند کار کند. به طور دقیق تر، ما در ابتدا ما روشی سریع و مقیاس پذیر برای داده های دسته بندی شده 1 ارائه می کنیم و نسخه موازی شده آن را که مبتنی بر نگاشت کاهش 2 می باشد معرفی می کنیم. در ادامه روش خود را گسترش داده و یک روش تشخیص داده های پرت سریع برای مجموعه داده های توزیع شده 3 بزرگ با انواع داده های متفاوت پیشنهاد می کنیم. در نهایت روش خود را به گونه ای تغییر می دهیم که بتواند به جواب قابل قبولی بر روی داده های دسته بندی شده با ابعاد دسته بندی بسیار بالا نیز دست یابد. ما روش پیشنهادی خود را با مجموعه های داده واقعی و ساختگی بسیار بزرگ امتحان کرده و انتظار این را داریم که روش پیشنهادی ما ضمن بهبود دقت تشخیص داده های پرت نسبت به روش های قبلی، به کارآیی بسیار بالاتر و همچنین مقیاس پذیری بسیار بزرگتری نیز دست یابد.

کلیدواژه ها:

داده کاوی ، تشخیص داده های پرت ، تشخیص آنومالی ، مجموعه داده های توزیع شده ، مجموعه داده های طبقه بندی شده ، مجموعه داده های با خصوصیات ترکیبی

نویسندگان

فاطمه جوکار

گروه مهندسی کامپیوتر، واحد مرودشت، دانشگاه آزاد اسلامی، مرودشت، ایران

امین کشاورزی

گروه مهندسی کامپیوتر، واحد مرودشت، دانشگاه آزاد اسلامی، مرودشت، ایران