بررسی فرایند تطبیق داده و تشخیصرکوردهای تکراری

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 672

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTI01_069

تاریخ نمایه سازی: 11 مرداد 1396

چکیده مقاله:

پیوند رکورد، فرایند تطبیق رکوردهای چند پایگاه داده می باشد که به یک موجودیت اشاره دارند. در صورت استفاده از یک پایگاه داده، این فرایند را حذف تکرار گوییم. اهمیت داده های تطبیق داده شده، بطور فزاینده ای در بسیاری از حوزه های کاربردی، در حال افزایش می باشد، زیرا می توانند حاوی اطلاعاتی باشند که بدست آوردن آنها از راه های دیگر، بسیار هزینه بر است. حذف رکوردهای تکراری در یک پایگاه داده، گامی مهم در فرایند پاکیزه سازی داده ها بشمار می رود، زیرا تکرار می تواند اثر جدی بر نتایج هر گونه پردازش بعدی یا داده کاوی، داشته باشد. با افزایش اندازه پایگاه های داده امروزی، پیچیدگی فرایند تطبیق ،به یکی از چالشهای مهم برای پیوند رکورد و حذف تکرار، تبدیل شده است،به طوری که شناسایی و از بین بردن آن ها تاثیر بسزایی در سرعت پردازش و تحلیل اطلاعات داردکه روز به روز با افزایش حجم داده های موجود در جهان بر اهمیت آن افزوده می شود.

نویسندگان

صدیقه احمدی

دانشگاه آزاد اسلامی خرم آباد،ایران

حسن نادری

استادیار پایه ۴،دانشگاه علم و صنعت ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • W. E.Winkler, "Methods for evaluating and creating data quality, *Elsevier ...
  • I. P. Fellegi and A. B. Sunter, _ theory for ...
  • E. Rahm and H. H. Do, 4Data cleaning: Problems and ...
  • M. A. Hernandez and S. J. Stolfo, _ merge/purge problem ...
  • T. Churches, P. Christen, K. Lim, and J. X. Zhu, ...
  • R. Baxter, P. Christen, and T. Churches, _ cOmparison of ...
  • P. Christen, _ Survey of Indexing Techniques for Scalable Record ...
  • P. Christen, Data Matching, Springer Berlin Heidelberg, 2012. ...
  • Jokinen, P., Tarhio, J., Ukkonen, E.: A cOmparison of approximate ...
  • Fellegi, I.P., Sunter, A.B.: A theory for record linkage. Journal ...
  • نمایش کامل مراجع