الگوریتم خوشه بندی داده کاوی در حذف داده های زائد از انباره داده

فتاح بیات

الگوریتم خوشه بندی داده کاوی در حذف داده های زائد از انباره داده

محل انتشار: چهاردهمین کنفرانس بین المللی فناوری اطلاعات،کامپیوتر و مخابرات

سال انتشار: 1400

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 228

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1444903

شناسه ملی سند علمی:

ITCT14_036

تاریخ نمایه سازی: 21 اردیبهشت 1401

چکیده مقاله:

غالبا داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاری ها، اطلاعات ناقص، داده های غیر استاندارد، اطلاعات تکراری و... نمونه هایی از علل کاهش کیفیت داده ها می باشند. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی داده ها وجود ندارد و نیاز به تکنیک های خودکار برای این کار هست. در این مقاله یک روش داده کاوی تشخیص الگوهای پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از دو فاز عمده تشکیل شده است، ابتدا کل داده ها توسط تکنیک داده کاوی k-means خوشه بندی می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت درون هر خوشه را آشکارسازی خواهد کرد

کلیدواژه ها:

داده کاوی ، پاکسازی داده ، پایگاه داده .

نویسندگان

فتاح بیات

گروه ریاضی، دانشگاه آزاد اسلامی، واحد ملایر