بررسی فرایند تطبیق داده و تشخیصرکوردهای تکراری

  • سال انتشار: 1395
  • محل انتشار: اولین کنفرانس ملی فناوری های نوین در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: ICTI01_069
  • زبان مقاله: فارسی
  • تعداد مشاهده: 732
دانلود فایل این مقاله

نویسندگان

صدیقه احمدی

دانشگاه آزاد اسلامی خرم آباد،ایران

حسن نادری

استادیار پایه ۴،دانشگاه علم و صنعت ایران

چکیده

پیوند رکورد، فرایند تطبیق رکوردهای چند پایگاه داده می باشد که به یک موجودیت اشاره دارند. در صورت استفاده از یک پایگاه داده، این فرایند را حذف تکرار گوییم. اهمیت داده های تطبیق داده شده، بطور فزاینده ای در بسیاری از حوزه های کاربردی، در حال افزایش می باشد، زیرا می توانند حاوی اطلاعاتی باشند که بدست آوردن آنها از راه های دیگر، بسیار هزینه بر است. حذف رکوردهای تکراری در یک پایگاه داده، گامی مهم در فرایند پاکیزه سازی داده ها بشمار می رود، زیرا تکرار می تواند اثر جدی بر نتایج هر گونه پردازش بعدی یا داده کاوی، داشته باشد. با افزایش اندازه پایگاه های داده امروزی، پیچیدگی فرایند تطبیق ،به یکی از چالشهای مهم برای پیوند رکورد و حذف تکرار، تبدیل شده است،به طوری که شناسایی و از بین بردن آن ها تاثیر بسزایی در سرعت پردازش و تحلیل اطلاعات داردکه روز به روز با افزایش حجم داده های موجود در جهان بر اهمیت آن افزوده می شود.

کلیدواژه ها

تطبیق داده، پیوند داده، شاخصگذاری، کلید بلاک بندی، بردار مقایسه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.