حذف داده های زایددرانباره داده بااستفاده ازالگوریتم خوشه بندی داده کاوی
- سال انتشار: 1395
- محل انتشار: اولین همایش ملی علوم کاربردی و مهندسی
- کد COI اختصاصی: ASEA01_050
- زبان مقاله: فارسی
- تعداد مشاهده: 492
نویسندگان
گروه ریاضی واحدملایر دانشگاه آزاد اسلامی ملایر ایران مربی ریاضی کاربردی دانشگاه آزاد اسلامی ملایر ایران
چکیده
غالبا داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاریها، اطلاعات ناقص، داده های غیر استاندارد، اطلاعات تکراری و... نمونه هایی از علل کاهش کیفیت داده ها می باشند. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی دادهها وجود ندارد و نیاز به تکنیکهای خودکار برای این کار هست. در این مقاله یک روش داده کاوی تشخیص الگوهای پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از دو فاز عمده تشکیل شده است، ابتدا کل داده ها توسط تکنیک داده کاوی means-k خوشه بندی می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت درون هر خوشه را آشکارسازی خواهد کرد.کلیدواژه ها
دادهکاوی، پاکسازی داده، پایگاه دادهمقالات مرتبط جدید
- بررسی به کارگیری سیستم ذخیره سازی انرژی با استفاده از منابع انرژی تجدیدپذیر
- اقدامات لازم برای حفاظت از محیط زیست دریایی
- ارائه طرح مبتنی بر رایانش ابری جهت ارتقاء بهره وری صنایع خودروسازی (مطالعه موردی: مدیران خودرو)
- مروری بر تکنولوژی ماکرویو برای خردایش سنگ های کمیاب
- کاربرد و بکارگیری تکنولوژی های اینترنت اشیا ، یادگیری ماشین و پردازش تصویر در امنیت و کنترل خودرو
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.