حذف داده های زایددرانباره داده بااستفاده ازالگوریتم خوشه بندی داده کاوی

فتاح بیات

حذف داده های زایددرانباره داده بااستفاده ازالگوریتم خوشه بندی داده کاوی

محل انتشار: اولین همایش ملی علوم کاربردی و مهندسی

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 547

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/616630

شناسه ملی سند علمی:

ASEA01_050

تاریخ نمایه سازی: 18 تیر 1396

چکیده مقاله:

غالبا داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاریها، اطلاعات ناقص، داده های غیر استاندارد، اطلاعات تکراری و... نمونه هایی از علل کاهش کیفیت داده ها می باشند. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی دادهها وجود ندارد و نیاز به تکنیکهای خودکار برای این کار هست. در این مقاله یک روش داده کاوی تشخیص الگوهای پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از دو فاز عمده تشکیل شده است، ابتدا کل داده ها توسط تکنیک داده کاوی means-k خوشه بندی می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت درون هر خوشه را آشکارسازی خواهد کرد.

کلیدواژه ها:

دادهکاوی ، پاکسازی داده ، پایگاه داده

نویسندگان

فتاح بیات

گروه ریاضی واحدملایر دانشگاه آزاد اسلامی ملایر ایران مربی ریاضی کاربردی دانشگاه آزاد اسلامی ملایر ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

[] A.Faritha Banu, C , Chandrasekar, _ Survey _ Deduplication ...
[] K. Deepa, R. Rangarajan, "Record Deduplication using Particle Swarm ...
[] Moises G. de Carvalho, Alberto H.F. Laender, Marcos Andre ...
[] Peter Christen, _ Survey of Indexing Techniques for Scalable ...
[] S. Sarawagi and A. Bhamidipaty, "Interactive Deduplication Using Active ...
Databases", IEEE Trans. Knowledge and Data Eng., vol. , no. ...

نمایش کامل مراجع