الگوریتم خوشه بندی داده کاوی در حذف داده های زائد از انباره داده
- سال انتشار: 1400
- محل انتشار: چهاردهمین کنفرانس بین المللی فناوری اطلاعات،کامپیوتر و مخابرات
- کد COI اختصاصی: ITCT14_036
- زبان مقاله: فارسی
- تعداد مشاهده: 388
نویسندگان
گروه ریاضی، دانشگاه آزاد اسلامی، واحد ملایر
چکیده
غالبا داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاری ها، اطلاعات ناقص، داده های غیر استاندارد، اطلاعات تکراری و... نمونه هایی از علل کاهش کیفیت داده ها می باشند. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی داده ها وجود ندارد و نیاز به تکنیک های خودکار برای این کار هست. در این مقاله یک روش داده کاوی تشخیص الگوهای پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از دو فاز عمده تشکیل شده است، ابتدا کل داده ها توسط تکنیک داده کاوی k-means خوشه بندی می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت درون هر خوشه را آشکارسازی خواهد کردکلیدواژه ها
داده کاوی، پاکسازی داده ، پایگاه داده .مقالات مرتبط جدید
- مدلسازی و شبیه سازی جبران ساز سری سنکرون استاتیکی توزیع برای حل چالش های شبکه توزیع بر پایه الگوریتم بهینه سازی گرگ خاکستری
- Adaptive Control Strategies for Fast Charging of EVs with Battery Degradation Mitigation
- شناسایی مانع با استفاده از دید استریو برای خودروهای بدون سرنشین
- Multi-Gbest Decomposition for Many-Objective Optimization
- ترکیب منابع انرژی پیزوالکتریک و ترموالکتریک به منظور افزایش کارایی سیستم های برداشت انرژی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.